Meta desarrolla sistema de IA para traducir de voz a voz en 36 idiomas de forma instantánea

 

Meta ha desarrollado un modelo de inteligencia artificial (IA) llamado SEAMLESSM4T, capaz de traducir voz y texto en 101 idiomas y realizar traducciones directas de voz a voz en 36 lenguas. Este avance podría facilitar traducciones universales rápidas, superando los sistemas actuales en precisión y versatilidad.

Innovaciones y Capacidades del Modelo

La primera versión de SEAMLESSM4T se presentó en agosto de 2023, pero ahora incluye nuevas características que Meta detalla en un artículo publicado en Nature. Este modelo avanzado permite:

  • Traducción de voz a voz: reconoce 101 idiomas y traduce a 36.
  • Traducción de voz a texto: de 101 a 96 idiomas.
  • Traducción de texto a voz: de 96 a 36 idiomas.
  • Traducción de texto a texto: en 96 idiomas.
  • Reconocimiento automático de voz: en 96 idiomas.

En la traducción de voz a voz, SEAMLESSM4T alcanza un 23 % más de precisión en comparación con otros sistemas existentes. Además, filtra ruidos de fondo y se adapta a las variaciones de los hablantes.

Un Paso hacia la Traducción Universal

Inspirado en conceptos de ciencia ficción como el Pez de Babel de Guía del autoestopista galáctico, el modelo busca hacer realidad la traducción instantánea universal. Sin embargo, los sistemas actuales suelen requerir varios pasos (reconocer, traducir y convertir voz a texto) y están limitados a ciertas combinaciones de idiomas, a menudo priorizando traducciones al inglés.

Con SEAMLESSM4T, Meta amplía la cobertura lingüística y simplifica el proceso al integrar múltiples modos en un solo modelo. Según los investigadores, esto representa un avance significativo hacia una comunicación global más inclusiva y eficiente.

Disponibilidad

Meta planea hacer que los recursos del modelo estén disponibles para el público con fines no comerciales, fomentando la investigación y el desarrollo de tecnologías de traducción inclusivas.

Futuro de la Comunicación Global

Aunque SEAMLESSM4T aún necesita mejoras, los autores del artículo consideran que este desarrollo supone un paso importante para superar las barreras lingüísticas, abriendo nuevas posibilidades en un mundo interconectado.

What do you think?

Leonardo DiCaprio dona un millón de dólares para ayudar a las víctimas de los incendios de Los Ángeles

YouTube y Google donan 15 millones a organizaciones de ayuda por los fuegos en Los Ángeles