Procesamiento del lenguaje natural... or perish

25/7/2023
AUTOR
Colegio de matemáticas Bourbaki

Desde mi punto de vista la herramienta que más ha modificado a la industria en los últimos años es el procesamiento del lenguaje natural (NLP), posiblemente esto se relaciona con lo intratables que eran las bases de datos de texto hasta hace algunas décadas.

Hoy en día desde las pequeñas hasta las compañías multinacionales deben saber que la información en forma de texto que generan o a la que tienen acceso puede representar una ventaja competitiva. Por poner un ejemplo podemos enlistar algunos ejemplos:

  1. Interacciones con nuestros clientes.
  2. Opiniones sobre algún servicio.
  3. Descripciones de productos.
  4. Comunicación interna.

En esta edición de nuestro boletín vamos a hablarles sobre 4 técnicas de NLP que pueden implementarse en los ejemplos de las bases de datos que acabamos de proponer. En cada sección haremos una comparación entre el estado del arte de cada técnica y su prehistoria.

User Experience (UX) & Chatbots

No alt text provided for this image

La manera como interactuamos con nuestros clientes es determinante para la escalabilidad de cualquier negocio, los chatbots han sido desde hace muchos años una poderosa herramienta para lograr una mejor experiencia de los usuarios.

Prehistoria: ELIZA o Siri

Una de las primeras herramientas que se utilizó para construir chatbots es lo que se conoce como Natural Language User Interface, todos estamos familiarizados por ejemplo con la asistente de Apple llamada Siri. Una de las primeras implementaciones de estas técnicas llevó el nombre de ELIZA y estaba pensada en ser un chatbot que tratara a pacientes como si fuera una psicóloga. La gran desventaja de estas herramientas es que no permiten interacciones demasiado largas y consistentes con los usuarios, es decir que después de una cadena de numerosas preguntas, sus respuestas no serán consistentes.

Estado del arte: ChatGPT

El desarrollo de ChatGPT ha sido un puñetazo en la mesa para los encargados de UX, pues ahora pueden idear mejores productos de acuerdo a las reglas de negocio. Recordemos que aún existen múltiples tareas que no pueden realizar con éxito estos LLM y por ello el uso de estas herramientas debe estar acompañadas de candados inteligentes.

No alt text provided for this image

Market Research & Análisis de sentimientos

Los análisis del mercado deben estar acompañados no solo de información interna de la compañía, sino que idealmente debemos de incluir datos duros, el análisis de sentimientos puede ayudarnos mucho.

Prehistoria: Google Cloud Natural Language

Las búsquedas en Google o las noticias más recientes son una poderosa fuente de información que podemos utilizar para mejorar un análisis de mercado, la nube de Google para el LN es una herramienta muy poderosa. Desafortunadamente la mayor parte de sus estadísticas privan al analista del contexto lo cual es fundamental para una información con menos sesgo.

Estado del arte: ¿Bloomberg GPT?

Hace algunos meses Bloomberg propuso un Gran Modelo del Lenguaje que sea ad hoc a sus necesidades, el contexto en el mercado financiero lo puede ser todo y por ello es indispensable incluirlo.

Vale la pena mencionar que a pesar de que los modelos tipo Transformer son verdaderamente poderosos, aún existen casos en los que un acercamiento más ingenuo podría funcionar mejor. Muchas gracias a nuestro estudiante Luis Gabriel De Alba Rivera por compartirnos este maravilloso ejemplo en el que un LLM es vencido por un acercamiento al alcance de cualquier compañía.

E-commerce & sistemas de recomendación

Si pensamos en una industria en la que las cantidades de información procesada son monumentales, no podemos pensar en otra que no sea el E-commerce. Los sistemas de recomendación han escalado este sector como ningún otro y en la actualidad prácticamente todos utilizan ideas del NLP.

No alt text provided for this image

Prehistoria: Netflix's Prize

Es posible que toda esta historia haya comenzado con Netflix y el millón de dólares que otorgaron como premio a quien lograra vencer a su sistema de recomendación. En ese entonces no se utilizaba NLP pues la base de datos de las interacciones entre usuarios/películas ya es monumental sin embargo no es difícil pensar que todas estas plataformas ya utilicen el texto como fuente de información.

No alt text provided for this image

Estado del arte: LinkedIn

Uno de los compromisos y grandes ventajas de LinkedIn es la calidad de sus motores de búsqueda y recomendaciones para contactar con profesionales con intereses semejantes. Es bien conocido que para este fin, se utilizan búsquedas semánticas que relacionen profesiones aunque tengan distintos nombres.

Executive Summary & modelos generativos

La responsabilidad de un ejecutivo C-Level no es únicamente durante la toma de decisiones sino la manera como se comunica con sus colegas, sus reportes son en muchas ocasiones uno de sus entregables.

Prehistoria: traducción de textos

Desde hace algunos años que la traducción utilizando modelos de IA se convirtió en una herramienta confiable pues los modelos que lo hacen son extremadamente buenos prácticamente sin importar el lenguaje.

Estado del arte: presentaciones ejecutivas vía GPT-4

Con la llegada de los modelos multi-modales que permiten a los ejecutivos trabajar tanto con imágenes como con texto, es posible generar reportes que incluyan información visual de manera mucho más ágil.

¿Dónde aprender NLP?