Isabelle Guyon y el truco del kernel (la ciencia de datos en sus personajes)

19/1/2023
AUTOR
Colegio de matemáticas Bourbaki

En esta edición de nuestro Bourbakisme continuaremos con la serie de artículos titulados La Ciencia de Datos en sus personajes en la que repasamos el vertiginoso desarrollo de una de las áreas más importantes para la industria en la actualidad. Nuestra presentación está enfocada en reseñar el trabajo de los Científicos de Datos que han aportado a esta hermosa y al mismo tiempo poderosa herramienta. Las ediciones pasadas fueron dedicadas a Donoho y Pearl.

En esta ocasión hablaremos sobre Isabelle Guyon quien es una científica nacida en Francia que ha desarrollado investigación asombrosa en machine learning, ha resuelto problemas tanto industriales como académicos y además ha contribuido enormemente en la formación de científicos de datos en todo el mundo.

Isabelle Guyon

Nació en París y estudió en la célebre École supérieure de physique et de chimie industrielles de la ville de Paris donde han trabajado numerosos premios Nobel. Terminó su doctorado en 1988 en uno de los momentos más importantes en la historia de las redes neuronales profundas cuando se comenzaron a implementar exitosamente tanto los perceptrones multi-capa como las redes convolucionales.

No alt text provided for this image
El Perceptrón

Durante esos años Isabelle trabajó en la comparación de las redes neuronales y los hoy conocidos como Métodos del Kernel, los cuales recientemente se han probado fundamentales para la comprensión de Deep Learning.

Actualmente es Directora en investigación dentro de Google Brain, además ha sido profesora en la Universidad de París-Saclay, investigadora en Bell Labs y notablemente ganó el premio Fundación BBVA Fronteras del Conocimiento.

Máquinas de soporte vectorial

Quizás uno de sus trabajos más notables fue el desarrollo teórico e implementación junto a sus colegas Schölkopf y Vapnik de lo que hoy conocemos como las Máquinas de Soporte Vectorial (A training algorithm for optimal margin classifiers) el cual es uno de los algoritmos más utilizados por los científicos de datos gracias sus enormes ventajas respecto a otros métodos.

No alt text provided for this image
Máquinas de Soporte Vectorial

El algoritmo SVM está basado en las ideas de Vapnik sobre el aprendizaje estadístico donde se concluye que además de buscar modelos matemáticos y algoritmos que minimicen el error de aproximación, debe considerarse la complejidad de estos modelos. Una de las posibles maneras para cuidar esta complejidad es maximizando las distancias que existen entre las clases, a estas distancias se les conoce como márgenes.

La experiencia de Isabelle Guyon sobre los métodos de kernel les permitió formular un algoritmo que utilizara la maximización de los márgenes y al mismo tiempo funcionara correctamente no solo en el caso lineal la cual es una de las grandes diferencias de SVM sobre otros métodos.

Selección de variables

El trabajo científico de Isabelle Guyon está profundamente motivado por las aplicaciones de machine learning a problemas concretos, particularmente durante sus primeros trabajos estuvo concentrada en el reconocimiento de caracteres escritos a mano.

Más tarde en su carrera y motivada por las aplicaciones de machine learning en problemas médicos como el diagnóstico y la causalidad del cáncer, propuso técnicas para realizar Feature Selection, un excelente ejemplo de estos trabajos es su artículo Gene Selection for Cancer Classification using Support Vector Machines.

Isabelle es además fundadora de CLOPINET una consultora especializada en ayudar a las compañías a resolver problemas en ciencia de datos.

Enseñanza y divulgación

El trabajo de Isabelle Guyon no solo incluye el desarrollo de algoritmos matemáticos o la solución de problemas concretos sino a lo largo de su carrera ha estado fuertemente involucrada en la divulgación de la ciencia de datos a un amplio público así como la formación de científicos de datos

No alt text provided for this image

Notablemente es la fundadora del proyecto CHALEARN el cual propone retos a la comunidad de machine learning mediante bases de datos. Este tipo de iniciativas son fantásticas para ayudar a los estudiantes de ciencia de datos y en el Colegio Bourbaki utilizamos algunos de estos retos dentro de nuestros cursos.

Oferta académica

La matemática en sus personajes

Nuestra serie está inspirada en una hermosa colección de libros en la que se revisa el quehacer matemático por medio de la vida y obra de los matemáticos más importantes de la historia. Esta serie se llama La matemática en sus personajes y está publicada por la Editorial Nivola, se las recomendamos ampliamente.