Connect with us

Lifestyle

¿Por qué el traductor de Meta puede ser revolucionario?

Meta recopiló millones de horas de archivos de audio de discursos, particularmente de Naciones Unidas, junto a traducciones de esos discursos generadas por humanos, de Internet y otras fuentes. Imagen: Arda Kucukkaya/Anadolu/picture alliance

Meta recopiló millones de horas de archivos de audio de discursos, particularmente de Naciones Unidas, junto a traducciones de esos discursos generadas por humanos, de Internet y otras fuentes. Imagen: Arda Kucukkaya/Anadolu/picture alliance

La compañía liderada por Mark Zuckerberg ha creado un modelo de inteligencia artificial que puede traducir directamente el habla de un idioma a otro. Los expertos ya lo comparan con ciencia ficción.

La compañía de Mark Zuckerberg, Meta, la multinacional que aglutina Facebook, Instagram y WhatsApp, ha presentado un modelo de inteligencia artificial (IA) capaz de traducir voz y texto en 101 idiomas, y de hacer traducciones directas en 36 lenguas, empleando únicamente la voz.

Meta ya presentó una primera versión en agosto de 2023. Pero el modelo de IA recién anunciado incorpora varias innovaciones que se aproximan a la ciencia ficción.

Meta emula al Pez de Babel

Cada año aparecen traductores más precisos en el mercado, capaces de aglutinar más lenguas y complejos modos de habla. Hasta ahora, no obstante, la idea de un traductor universal capaz de producir en tiempo real cualquier idioma solo se encontraba en la ciencia ficción.

Muchos recuerdan el Pez de Babel, el dispositivo biológico en forma de pez que aparecía en la novela ‘Guía del autoestopista galáctico’, de Douglas Adams, como aquel instrumento en forma de pez que, puesto en la oreja, era capaz de hacer semejante operación.

A través de un artículo publicado en la prestigiosa revista científica Nature, Meta, la compañía de Zuckerberg, presenta un sistema de IA denominado SEAMLESSM4T y capaz de emular al Pez de Babel, realizando traducciones en múltiples lenguas, tanto desde y hacia texto como desde y hacia audio, así como todas sus combinaciones. Es decir, puede traducir de voz a voz, o de texto a voz y viceversa.

Marta Ruiz Costa-Jussà, informática de Meta y coautora del artículo, afirma que el rendimiento se ha mejorado no solo aumentando el número de idiomas, sino también integrando distintas combinaciones de texto y voz. “Estas son las claves de la mejora”, dice la autora en el artículo publicado en Nature y añade que el desfase suele ser de unos segundos, comparable al rendimiento de los traductores humanos profesionales.

El modelo se pondrá a disposición del público siempre que no se utilice con fines comerciales.

No más desigualdad en la traducción

La traducción automática ha avanzado mucho en las últimas décadas, principalmente “gracias a la introducción de redes neuronales que se entrenan con grandes conjuntos de datos”, explica el matemático y periodista científico Davide Castelvecchi en un artículo en Nature

. “Los datos de entrenamiento abundan para los principales idiomas, especialmente el inglés, pero son muy escasos para muchos otros idiomas”, dice Castelvecchi.

Esta desigualdad ha limitado la variedad de idiomas en los que las máquinas pueden ser entrenadas para traducir y “afecta a todos los idiomas que aparecen con poca frecuencia en Internet”, comenta Allison Koenecke, científica informática de la Universidad de Cornell en Ithaca, Nueva York, en un artículo de News & Viewsde Nature.

Aunque todavía falta investigación al respecto, puesto que no está claro por qué ocurre, los investigadores de Meta y otros autores descubrieron que hacer que los sistemas de traducción sean multilingües puede mejorar su rendimiento incluso en la traducción de idiomas con datos de entrenamiento limitados, indican desde Nature.

Así, el equipo de Meta recopiló millones de horas de archivos de audio de discursos, particularmente de Naciones Unidas, junto con traducciones de esos discursos generadas por humanos, de Internet y otras fuentes, además de las transcripciones de algunos de esos discursos. Los investigadores también emparejaron alrededor de medio millón de horas de audio con texto y cada uno de estos fragmentos con su homólogo en otro idioma.

Con todo, este sistema de IA puede traducir el habla de 101 idiomas, aunque los resultados solo están disponibles en 36 idiomas de momento. El sistema también puede realizar otras tareas de traducción, como la conversión de texto a voz, con distintos rangos de idiomas.

Facilitar la comunicación global

Hoy por hoy la mayoría de los sistemas de traducción por aprendizaje automático están orientados al texto o requieren varios pasos: reconocer la voz, traducir el texto y convertirlo de texto a voz en otro idioma, por lo que tener algo así sería muy útil para facilitar la comunicación en un panorama global interconectado.

En un News & Views, Tanel Alumäe, del Laboratorio de Lenguaje Tecnológico en la Universidad de Tecnología (TalTech) de Tallin, Estonia, destaca como “impresionante” que el modelo sea capaz de traducir directamente en 36 idiomas, porque puede -por ejemplo- traducir del inglés hablado al alemán hablado, sin tener que transcribirlo primero en inglés para traducirlo después.

Las lenguas habladas en el mundo son unas 7.000, por lo que el modelo SEAMLESS se queda todavía muy corto en relación con las necesidades mundiales, apunta Alumäe, aunque es un primer paso, por no hablar de situaciones complejas o conversaciones con ruido de fondo o acentos muy marcados que puedan dificultar estos proceso a esta herramienta.

No obstante, Alumäe considera que “Meta se ha convertido en uno de los mayores promotores de la tecnología de lenguaje de código abierto”.

Desde News & Views, Allison Koenecke también destaca el esfuerzo de los investigadores por buscar sesgos de género en las traducciones producidas con su modelo. Así lo reconoce, por ejemplo, en la presgunta sobre si “I am a teacher” en inglés se traduce al masculino “Soy profesor” o al femenino “Soy profesora” en español. Para Koenecke, “es imperativo comprender las formas en que estas tecnologías fallan de forma desproporcionada para algunos grupos demográficos”, y “las futuras auditorías deberían ampliar el alcance de los sesgos lingüísticos estudiados”.

Fuente: DW.

Click para comentar

Dejá tu comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

PUBLICIDAD
PUBLICIDAD

Los más leídos

error: Content is protected !!