El test de Turing y los modelos generativos.

20/4/2023
AUTOR
Colegio de matemáticas Bourbaki

Los modelos matemáticos que generan tanto texto como imágenes están retando absolutamente a todos los aspectos de nuestra sociedad, de la industria e inclusive los científicos. Por poner algunos nombres citemos a ChatGPT, DALL-E-2, GPT-4 pero muy pronto escucharemos muchos más.

Quizás han escuchado hablar sobre la carta abierta publicada por algunos científicos y empresarios en la que se sugiere que el desarrollo de sistemas AI tipo ChatGPT debería de detenerse momentáneamente.

No alt text provided for this image
Yoshua Bengio

Una de las firmas más notorias fue la del científico Yoshua Bengio quien en una de las entradas de su blog mencionó que los sistemas más avanzados que GPT-4 son capaces de vencer el test de Turing. Pueden revisar la entrada completa aquí.

¿Qué es el test de Turing?

En 1950 el matemático inglés Alan Turing publicó el artículo Computing Machinery and Intelligence en el que propuso un test para averiguar si una computadora podía hacerse pasar por un humano. Para Turing la pregunta si una computadora era capaz de pensar le parecía demasiada amplia y no bien planteada, así que sugirió un problema más acotado que para efectos prácticos podría ser más útil que la profunda pregunta filosófica de qué significa pensar.

No alt text provided for this image
Alan Turing

Originalmente lo llamó el Imitation game basado en un juego victoriano en el que una persona se aísla de un hombre y una mujer, tiene la opción de hacerles preguntas de las que solo recibirá una respuesta escrita y debe distinguir quién es la mujer y quién es el hombre.

En lugar de un hombre el test de Turing propone lo que hoy en día diríamos que es una computadora, es decir que la persona que hace preguntas se aislará de una computadora y una mujer. Turing no mencionó explícitamente a una computadora pues en esa época aún no quedaba claro lo que significaba, sin embargo es suficiente con pensar en algún modelo matemático.

Es importante mencionar que en algunas tareas como por ejemplo jugar Go, las computadoras son claramente superiores a los seres humanos, esto no es exactamente lo que pregunta el Test de Turing.

No alt text provided for this image

Desde la popularización de las computadoras el test de Turing inspiró al premio Loebner en conjunto con la Universidad de Cambridge que busca premiar al modelo matemático que logre vencer al test de Turing.

Les recomiendo mucho revisar el artículo original de Turing en el siguiente link.

CAPTCHA

Otro aspecto interesante es que los CAPTCHA a los que estamos acostumbrados cuando navegamos por internet están basados en esta idea, de hecho sus siglas significan “Completely Automated Public Turing test to tell Computers and Humans Apart”. Es muy interesante que los modelos tipo GPT-4 al ser multi-modales tienen la posibilidad de trabajar con estos CAPTCHA.

Capacidades de GPT-4

Hace algunos días un equipo de Microsoft publicó un artículo muy interesante en el que se estudia con detalle las capacidades de una versión primitiva de GPT-4 considerando las siguientes tareas:

  1. Tareas multi-modales (por ejemplo la generación de imágenes)
  2. Habilidades de programación.
  3. Problemas matemáticos
  4. Interacción con humanos
  5. Etc.

Dentro de la sección de interacción con humanos no se incluyen ejemplos que puedan ser similares a la definición del test de Turing (quizás adrede) pero les recomiendo mucho revisar algunos casos particulares.

No alt text provided for this image

Problemas matemáticos

En lo personal yo pensé que los problemas tipo Olimpiada Matemática serían un reto inclusive para este tipo de modelos sin embargo en ese texto se encuentran muy buenos resultados lo cual es fascinante. Aspectos más complicados sobre si estos modelos están comprendiendo fielmente la teoría detrás de estos problemas aún no quedan claros.

Oferta académica