De la traducción automática a la decodificación del lenguaje animal
Si usted tiene -o las distintas combinaciones de este verbo- una mascota, o sencillamente goza de los animales; seguramente ha querido (o espero no ser el rarito de este texto) poder comunicarse con ellos; por favor ¡Todos lo hemos querido! y eso, está cada vez mas cerca gracias a la inteligencia artificial.
Comunicación
La comunicación, en una manera simple, es el intercambio de informacion (datos estructurados que constituyen un mensaje) entre individuos para dar o recibir informacion.
Los pasos o el proceso para que la comunicación sea efectiva, mejor dicho, que se pueda dar, son los siguientes: composición, codificación, transmisión, recepción, decodificación y finalmente la interpretación. Un proceso que tal como la respiración (en español hay 2681 palabras con la terminación ion) lo damos por sentado y no vemos el complejo sistema que hay detrás ya que se hace “automático”, pero de eso hablaremos en otra ocasión; estos componentes hacen parte de la teoría de la comunicación, cosa que veremos más adelante, mientras tanto sigamos dando contexto.
Hay tres categorías de sujetos: el lenguaje, la biosemiotica y la cibernética, de igual manera, distintas formas de comunicarse: verbal, no verbal y escrita
La biosemiotica estudia la creación de significado prelingüística, o la producción e interpretación de signos y códigos, La cibernética estudia los flujos de información que rodean un sistema, y la forma en que esta información es usada por el sistema, profundizaremos el lenguaje.
El lenguaje es un sistema estructurado de informacion basado en el habla, los gestos, los signos, o la escritura.
Los humanos compartimos con otros animales la capacidad de poder relacionar palabras con contenido y combinar estas para dar un mensaje, pero nosotros podemos crear conceptos y relacionarlos a sonidos, por lo que podemos crear infinitos mensajes con poca informacion;
Solo nosotros hablamos. Solo nosotros creamos mundos nuevos a través de la combinación jerárquica de símbolos que transcienden el contexto inmediato
nosotros usamos una lengua para poder comunicarnos, elaborando un mensaje según las reglas y convenciones gramaticales que comparte con una comunidad lingüística.
Los animales hacen uso de señales visuales, táctiles, auditivas, químicas o eléctricas; lo que llamamos zoosemiótica. nos diferencia de ellos, la doble articulación, nosotros asociamos y creamos, ellos reaccionan a los estímulos externos guiándose a través de su manual llamado ADN, su sistema de comunicación habitualmente es innato e instintivo
Warren Weaver y la traducción de los lenguajes
Warren Weaver tuvo una vida intelectual para envidiar. En los años cincuenta, don Warren vaticinó que las maquinas serian capaces de traducir idiomas automáticamente EN CINCO AÑOS tal vez se apresuró un poco, pero atrajo inversores para que le financiaran la investigación que hoy en día sigue perfeccionándose; la traducción automática; lo cual, el llevaría a sentar las bases de la teoría matemática de la comunicación, para los mortales, la teoría de la información
Esta teoría relaciona las leyes matemáticas del procesamiento y transmisión de la informacion, ocupándose de la medición y representación de la misma, así como la capacidad de los sistemas para transmitir y procesarla .
Como comuniqué previamente, nosotros hablamos a partir de una lengua que tiene reglas y convenciones gramaticales para poder entendernos entre nosotros, usando el proceso anteriormente mencionado (composición, codificación, transmisión, recepción, decodificación y finalmente la interpretación)
Cuando se empezó la investigación de la traducción de lenguas a partir de la computadora, los programadores empezaron diciéndole las complejas reglas que envuelven al lenguaje, sin embargo, el lenguaje es tan fluido y extenso, que los programadores no pudieron con las millones de palabras y las billones de combinaciones que se pueden dar entre ellas, y sobre cómo cambian con el tiempo, porque recuerden, como humanos, construimos nuestro lenguaje. Tenían dos problemas, por un lado las reglas del idioma eran absolutas, pero el lenguaje está muy lejos de ser absoluto y está lleno de excepciones; el segundo problema fue que el lenguaje además de complejo y lleno de excepciones, también es cambiante, con nuevas palabras que se agregan todo el tiempo, y reglas que cambian para dar paso al lenguaje del día a día.
Así que se basaron en datos, en millones de ejemplos que abarcan las combinaciones de las reglas, palabras de todos los idiomas, usando textos de traducciones reales, hechas por humanos, para que analizara todos esos datos para encontrar patrones acerca del modo en que frases completas son traducidas a otras frases. como dato complementario: el traductor de Google no hace directamente la traslación del idioma A al idioma B, sino que del idioma A lo pasa al ingles, y del ingles al idioma B, pues no hay las suficientes traducciones del telugu al español, como del telugu al ingles
Podríamos profundizar un montón sobre las nuevas técnicas que se están usando en la traducción automática, sobre como el Deep learning está ayudando a darle un sentido “nativo” a las frases para que en un futuro podamos tener conversaciones a tiempo real en distintos idiomas usando un traductor, ¡y lo haremos! pero será en otro texto, ahora si ¿Qué diablos tiene que ver e la comunicación, la traducción del lenguaje con inteligencia artificial y la investigación en la traducción del lenguaje animal?
Earth Species Project
Como hablamos anteriormente, la traducción automática usa modelos estadísticos para encontrar los patrones del idioma, así como las probabilidades de que una palabra se encuentre antes, después o cerca de otra, para crear un espacio de parámetros multidimensionales. La misma lógica se está aplicando al análisis y las repeticiones de ladridos, aullidos, graznidos o cantos.
Earth Species Project es un proyecto de código abierto que tiene como objetivo la decodificación del lenguaje animal.
En 2013, el equipo de Tomas Mikolov logró la capacidad de representar palabras en un espacio físico, que hace un mapeo de las palabras en un idioma a una estructura geométrica llamada Word Embeding permitiendo la comparación y mapeo de las relaciones entre conceptos, dando lugar a una estructura tanto local como global. lo cual fue un avance gigante para el campo del procesamiento de lenguaje natural, pudiendo ahora que redes neuronales no supervisadas creen incrustaciones que incorporan los matices más profundos de las palabras, como su polisemia.
Imagina que te dan dos idiomas completamente desconocidos y que con solo analizar cada uno durante el tiempo suficiente podrías descubrir cómo traducir entre ellos.
Para los lenguajes no humanos, el objetivo no es la traducción perfecta de oraciones, sino comprender su significado de manera abstracta.
¿Todo será tan fácil?
Si usted ha decodificado e interpretado correctamente, tendrá una pregunta, o muchas, pero yo quiero, que usted se pregunte ¿Hay relacion entre las formas de comunicación? ¿Hasta qué punto es traducible la experiencia del mundo para diferentes especies? ¿Puede una experiencia en el umwelt de una especie traducirse por analogía en términos comprensibles para la otra? ¿es el tono, el pitch, el tempo, el ritmo, la repetición, la estructura armónica o algún otro atributo que nos dará lo que importa? estos dos problemas tienen nombre, El problema de la señal del operador y el cóctel y El problema de Umwelt
Trabajaremos abiertamente en la solución de estos problemas, El machine learning, los modelos de lenguaje no supervisados y las integraciones enriquecidas nos brindan nuevas herramientas de computación masivas para abordar estos problemas.
podemos usar la misma técnica para traducir entre individuos de la misma especie. Esto nos permite descubrir todas las diferentes formas de decir lo mismo. Esto, a su vez, nos permite ver qué parte del sonido es importante: es decir, descubrir qué parte del sonido es la señal verdadera y qué parte es la portadora de fondo
Sin duda un proyecto genial de ultima tecnologia enfrentándose a investigaciones y tecnologías en creación, el futuro de la inteligencia artificial y las aplicaciones de esta son bellísimas. En esta historia abarcamos desde lo básico de la comunicación, la forma de transmitir mensajes, el como funcionan la traducción automática y los problemas a los que se enfrenta y por ultimo, este proyecto. Recuerda dar una palmadita y compartir esto con las personas que crees que pueda interesarles