El test de Turing y los modelos generativos.

20/4/2023

AUTOR

Colegio de matemáticas Bourbaki

Los modelos matemáticos que generan tanto texto como imágenes están retando absolutamente a todos los aspectos de nuestra sociedad, de la industria e inclusive los científicos. Por poner algunos nombres citemos a ChatGPT, DALL-E-2, GPT-4 pero muy pronto escucharemos muchos más.

Quizás han escuchado hablar sobre la carta abierta publicada por algunos científicos y empresarios en la que se sugiere que el desarrollo de sistemas AI tipo ChatGPT debería de detenerse momentáneamente.

No alt text provided for this image — Yoshua Bengio

Una de las firmas más notorias fue la del científico Yoshua Bengio quien en una de las entradas de su blog mencionó que los sistemas más avanzados que GPT-4 son capaces de vencer el test de Turing. Pueden revisar la entrada completa aquí.

¿Qué es el test de Turing?

En 1950 el matemático inglés Alan Turing publicó el artículo Computing Machinery and Intelligence en el que propuso un test para averiguar si una computadora podía hacerse pasar por un humano. Para Turing la pregunta si una computadora era capaz de pensar le parecía demasiada amplia y no bien planteada, así que sugirió un problema más acotado que para efectos prácticos podría ser más útil que la profunda pregunta filosófica de qué significa pensar.

Originalmente lo llamó el Imitation game basado en un juego victoriano en el que una persona se aísla de un hombre y una mujer, tiene la opción de hacerles preguntas de las que solo recibirá una respuesta escrita y debe distinguir quién es la mujer y quién es el hombre.

En lugar de un hombre el test de Turing propone lo que hoy en día diríamos que es una computadora, es decir que la persona que hace preguntas se aislará de una computadora y una mujer. Turing no mencionó explícitamente a una computadora pues en esa época aún no quedaba claro lo que significaba, sin embargo es suficiente con pensar en algún modelo matemático.

Es importante mencionar que en algunas tareas como por ejemplo jugar Go, las computadoras son claramente superiores a los seres humanos, esto no es exactamente lo que pregunta el Test de Turing.

Desde la popularización de las computadoras el test de Turing inspiró al premio Loebner en conjunto con la Universidad de Cambridge que busca premiar al modelo matemático que logre vencer al test de Turing.

Les recomiendo mucho revisar el artículo original de Turing en el siguiente link.

CAPTCHA

Otro aspecto interesante es que los CAPTCHA a los que estamos acostumbrados cuando navegamos por internet están basados en esta idea, de hecho sus siglas significan “Completely Automated Public Turing test to tell Computers and Humans Apart”. Es muy interesante que los modelos tipo GPT-4 al ser multi-modales tienen la posibilidad de trabajar con estos CAPTCHA.

Capacidades de GPT-4

Hace algunos días un equipo de Microsoft publicó un artículo muy interesante en el que se estudia con detalle las capacidades de una versión primitiva de GPT-4 considerando las siguientes tareas:

Tareas multi-modales (por ejemplo la generación de imágenes)
Habilidades de programación.
Problemas matemáticos
Interacción con humanos
Etc.

Dentro de la sección de interacción con humanos no se incluyen ejemplos que puedan ser similares a la definición del test de Turing (quizás adrede) pero les recomiendo mucho revisar algunos casos particulares.

Problemas matemáticos

En lo personal yo pensé que los problemas tipo Olimpiada Matemática serían un reto inclusive para este tipo de modelos sin embargo en ese texto se encuentran muy buenos resultados lo cual es fascinante. Aspectos más complicados sobre si estos modelos están comprendiendo fielmente la teoría detrás de estos problemas aún no quedan claros.

Oferta académica

Track de Ciencia de Datos. (49 semanas).
Machine Learning & AI for the Working Analyst ( 12 semanas).
Matemáticas para Ciencia de Datos ( 24 semanas).
Especialización en Deep Learning. (12 semanas).
Track de Finanzas Cuantitativas (49 semanas)
Aplicaciones Financieras De Machine Learning E IA ( 12 semanas).
Las matemáticas de los mercados financieros (24 semanas).
Deep Learning for Finance (12 semanas).

El test de Turing y los modelos generativos.

¿Qué es el test de Turing?

CAPTCHA

Capacidades de GPT-4

Problemas matemáticos

Oferta académica

Articulos que te pueden interesar

Three-body problem: caos, indecidibilidad y aleatoriedad

La desigualdad del triángulo en redes neuronales para proteínas

The unreasonable effectiveness of data science

La paradoja de Moravec en cualquier industria

Tres aplicaciones de Fourier a problemas financieros

Compañías calificadoras de bonos