Robots y lenguaje: inteligencia artificial que escucha y distingue sonidos

“En resumidas cuentas el mundo no es más que el producto de una acalorada discusión acerca de los límites de la lingüística.” ―  Salvador Elizondo

En París, ese destino turístico lleno de luces, glamour, moda y vivencias idílicas se encuentra, sin que muchos den cuentas de ello, uno de los centros de investigación sobre inteligencia artificial y robots. Nos referimos al Sony CSL París (fundado en 1996), este centro es considerado por sus regentes como una célula de investigación pequeña, pero “en auge”, centro que utiliza herramientas de ciencia compleja, ciencia de datos e inteligencia artificial para investigar cuestiones fundamentales en áreas tan diversas como: comprender y crear música, lenguaje y sistemas de comunicación, sostenibilidad y la dinámica de innovación y creatividad.  En este artículo le echaremos un vistazo a lo que hacen y cómo lo están llevando a cabo.

La investigación en el procesamiento del lenguaje

Su interés principal es investigar cómo las gramáticas de la construcción pueden romper el techo de cristal de las tecnologías lingüísticas actuales y lograr una comprensión semántica profunda y la generación apropiada del lenguaje.  ¿Cómo lo logran? Sus esfuerzos se basan en experimentos innovadores en sistemas de comunicación autoorganizados que investigan cómo un grupo de agentes autónomos puede inventar y negociar sus propios sistemas de comunicación.

Esta línea de investigación es interesantísima porque busca comprender la futura, posible, aparición de “lenguajes de comunicación máquina- máquina”, bajo la premisa de la autonomía de los agentes artificiales en sus procesos de aprendizaje automáticos. Sus resultados podrían dar luz, para hacer frente a situaciones en las que, sin las debidas consideraciones y conocimientos, los humanos demorarían mucho más tiempo que una máquina en comprender que está sucediendo, como fue el caso de Facebook cuando apagó la IA. Según explica Mike Lewis, investigador del FAIR (Facebook AI Research), explicó a los medios que solo habían decidido que “el interés de la empresa era diseñar dos ‘bots’ que pudiesen hablar con la gente”, no que lo hiciesen eficientemente entre ellos, y fue por este motivo que decidieron exigirles que se escriban entre ellos de forma legible para los humanos, dado este fallo, tomaron la decisión de apagarlos.

Robots, hardware y software

En el centro de investigación de Sony en París se dedican a explorar la evolución del lenguaje humano a través de las interacciones de comunidades de robots autónomos a lo largo de muchos ciclos de interacción. Los robots tienen capacidades perceptivas (incluidas tanto hardware como en software) entre ellas son capaces de escuchar y distinguir sonidos, detectar gestos, moverse e interactuar. Buscando medir las reacciones de los robots a los elementos que no reconocen, cómo responden a la desviación de patrones y otras acciones, eligen conjuntos de parámetros y establecen comunidades que se ejecutan en ciclos de miles de interacciones. De estas interacciones simples y de las respuestas individuales de los agentes, surgen sistemas complejos que en realidad tienen las características de la comunicación en lenguajes naturales.

Una de las interrogantes que está presente en sus estudios es
¿Cómo evolucionó el lenguaje?

¿Cómo evolucionó el lenguaje?

En CSL responden que es una pregunta se encuentra entre los grandes misterios sin resolver y es un desafío científico fundamental. En 1996, el laboratorio se embarcó en darle respuesta, a través de la investigación y con un enfoque radicalmente nuevo. Lo hicieron hace más de 20 años investigando cómo una población de usuarios de lenguaje artificial podría ser capaz de crear su propio lenguaje desde cero, incluyendo palabras, gramática e incluso conceptos.

Dr. Remi van Trijp explica el enfoque que fue pionero hace más de 20 años por el Prof. Dr. Luc Steels.

Desafío científico fundamental

La pregunta ¿Cómo evolucionó el lenguaje? se encuentra entre los grandes misterios sin resolver y en CSL parten de la hipótesis de que el lenguaje es un sistema adaptativo complejo que surge a través de interacciones adaptativas entre agentes y continúa evolucionando para permanecer adaptado a las necesidades y capacidades de los agentes. Exploran esta hipótesis implementando el ciclo completo hablante-oyente, mientras juegan juegos de idiomas situados entre ellos, son observadas las características de los idiomas que emergen.

Tienen en proceso un proyecto que durante la última década aborda esta pregunta directamente y ofrece la posibilidad de una respuesta. El proyecto implica alcanzar vastos objetivos, incluido el objetivo central de formalizar el lenguaje natural, para poder modelarlo.  Lo desafiante es la gran complejidad de todo lo que compone el lenguaje, desde los actos de escuchar, producir sonido, articulación e interpretación, análisis, incompletitud, error, la velocidad a la que tiene lugar todo el proceso.

La complejidad de una investigación se deja ver al poner de ejemplo a un hablante adulto normal probablemente, quien conoce 100 000 unidades de construcción del lenguaje, las que manipula en diferentes condiciones de audibilidad, éxito y fracaso, con hablantes del idioma de un grupo de dialecto similar o muy diferente, muy rápidamente. Y con esas herramientas es capaz de comunicarse e innovar en la forma en que se comunica.

Según el blog del CSL: «La complejidad y los múltiples parámetros que influyen en la transmisión de significado no son la única barrera para crear un modelo exitoso, está el idioma que cambia, cambia, modifica, es dinámico. Surgen nuevos significados, se comparten, se dan cuenta, se extienden, se extinguen, a veces muy rápidamente, o a veces, como en profundos cambios en la estructura del lenguaje, a lo largo de miles de años. El dinamismo, la fluidez del lenguaje, debe ser capturado en un modelo artificial exitoso.»

 ¿Cómo es posible que los agentes puedan innovar, introducir nuevos significados, y estos significados pueden llegar a ser compartidos? ¿Cómo es posible la innovación?

La respuesta a esas preguntas es el objeto de la investigación que realizan. Por lo pronto, sabemos que el simple hecho de concederle a agentes artificiales, la capacidad de comunicarse emulando a humanos con un lenguaje es un paso gigantesco que pocos le prestan atención cuando utilizan los servicios de un “chatbot” o un agente conversacional artificial.

Imagen: Pixabay

Referencias Consultadas:

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *