Publicidad

Actualizado hace 7 minutos

Publicidad
Publicidad
Publicidad
Ciencia y Tecnología
08:17 PM / 01/11/2018
Científicos desarrollan un sistema de traducción multilingüe sin supervisión
Xinhua
Agencias

Investigadores estadounidenses han desarrollado un modelo novedoso de traducción de idiomas que podría funcionar sin la necesidad de anotaciones y orientación humanas, y conducir a traducciones rápidas y eficientes por computadora de muchos más idiomas.

Los sistemas de traducción actuales de Google y Facebook tienen que buscar patrones en millones de documentos que han sido traducidos a varios idiomas por humanos. Esos datos son difíciles de recopilar y simplemente pueden no existir para muchos de los 7,000 idiomas que se hablan en todo el mundo.

En un documento que se presentó esta semana en la Conferencia sobre Métodos Empíricos en el Procesamiento del Lenguaje Natural, investigadores del Instituto de Tecnología de Massachusetts (MIT) describieron un modelo que funcionó con la misma precisión que los modelos monolingües de vanguardia, pero mucho más rápido y usando Sólo una fracción de la potencia de cálculo.

De acuerdo con el estudio, el modelo aprovecha una métrica en estadísticas que esencialmente mide distancias entre puntos en un espacio de cómputo y los compara con puntos con distancia similar en otro espacio.

Los investigadores aplicaron esa técnica a "incrustaciones de palabras" de dos idiomas, que son palabras representadas como matrices de números o vectores, con palabras de significados similares agrupadas más juntas.

Al hacerlo, el modelo alinea rápidamente la palabra en ambas incrustaciones que están más estrechamente correlacionadas por distancias relativas, lo que significa que es probable que sean traducciones directas.

"Si no tiene ningún dato que coincida con dos idiomas", dijo el primer autor del artículo, David Alvarez-Melis con MIT, "puede mapear dos idiomas y, utilizando estas medidas de distancia, alinearlos".

Por ejemplo, el vector para "padre" puede caer en áreas completamente diferentes en dos matrices. Pero los vectores para "padre" y "madre" probablemente siempre estarán juntos.

"Al observar la distancia, y no las posiciones absolutas de los vectores, puede omitir la alineación e ir directamente a la correspondencia de las correspondencias entre los vectores", dijo Alvarez-Melis.

Alvarez-Melis lo llamó una "traducción suave", porque en lugar de solo devolver una traducción de una sola palabra, le dice "este vector, o palabra, tiene una fuerte correspondencia con esta palabra, o palabras, en el otro idioma".

Según los investigadores, representó un paso hacia uno de los principales objetivos de la traducción automática, que es la alineación de palabras sin supervisión.

¿Te gustó la nota?
Publicidad
TOP 5 DE NOTICIAS
Publicidad
AVANCES
Publicidad
Publicidad
Publicidad
Publicidad
TOP 5 DE NOTICIAS