Lenguas minoritarias: el gran desafío

Lenguas minoritarias: el gran desafío

El sistema de IA neuronal, la nueva herramienta de traducción automática, es el futuro de las lenguas con poca difusión.

Vivimos en un planeta que se acerca con rapidez a los 8.000 millones de habitantes. De estos, unos cuantos miles de millones hablan algunas de las lenguas más usadas y reconocidas en todo el mundo. Se trata, en concreto, del inglés (1.130 millones de hablantes), el chino mandarín (1.100 millones), el hindi (615 millones) y el español (535 millones). A estos idiomas, les siguen otros como el francés, el árabe, el bengalí, el ruso o el portugués. De los 7.000 idiomas que existen en el mundo, aproximadamente (4.000 de ellos son escritos) 23 abarcan a más de la mitad de la población.

Con el objetivo de facilitar la comunicación en diversas lenguas, la evolución de la tecnología ha permitido desarrollar sistemas automáticos de traducción instantánea que, poco a poco, van afinando sus resultados. Aún queda un largo trecho por recorrer, pero, a nivel de usuario, ahora resulta sencillo acceder a traducciones básicas que nos permiten entender el significado esencial de términos y oraciones en otros idiomas. No obstante, dichas traducciones están, en su mayoría, exentas de matices.

Es difícil acceder a traducciones automáticas de lenguas minoritarias. Para obtenerlas, es necesario recurrir al trabajo de profesionales humanos.

Si las lenguas dominantes todavía tienen un amplio margen de mejora en el ámbito de las traducciones automáticas, es fácil imaginar la problemática que supone acceder a traducciones de lenguas minoritarias. Actualmente, Google Translate maneja unos 108 idiomas y esa cifra va creciendo, pero queda por delante toda una miríada de lenguas de uso minoritario que no son accesibles a través de la tecnología y cuya difusión y traducción solo es posible gracias al componente humano.

Los sistemas de IA neuronal son capaces de aprender, interpretar y traducir significados de lenguas minoritarias. Los resultados obtenidos a través de esta tecnología son muy prometedores.

Sin embargo, ya se han puesto las primeras piedras para la construcción de sistemas capaces de aprender, interpretar y traducir significados de lenguas con poca difusión. La tecnología con la que se llevará a cabo esta tarea se basa en la inteligencia artificial y en sistemas de tipo neural networking. La idea de base es que, mientras que una persona necesita años para adentrarse en el conocimiento de un idioma nuevo, con todos sus entresijos, un sistema de IA neuronal “aprende”, en base a millones de parámetros, las estructuras que emplea cada lengua. Usando procesos previos de entrenamiento, el sistema “captura” palabras subidas a la red en esos idiomas y comienza a ensayar modelos de combinaciones y estructuras, atribuyendo significados en función de otros datos contextuales. Los modelos neuronales pueden aprender a traducir entre lenguajes individuales sin recurrir a traducciones bilingües, sino a otro idioma mayoritario de referencia. Los resultados son muy prometedores y han puesto de relieve la importancia que tiene el hecho de subir a internet contenidos en lenguas minoritarias. Dichos contenidos son la materia prima, el “alimento” para estas nuevas herramientas experimentales que más pronto que tarde revolucionarán el mundo de las lenguas minoritarias.


Tags:
, , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , ,
Surumbam
info+surumbam@sanscrit.net

Somos la empresa creativa concebida para ser parte de la solución.