Meta ha desarrollado un modelo de inteligencia artificial (IA) llamado SEAMLESSM4T, capaz de traducir voz y texto en 101 idiomas y realizar traducciones directas de voz a voz en 36 lenguas. Este avance podría facilitar traducciones universales rápidas, superando los sistemas actuales en precisión y versatilidad.
Innovaciones y Capacidades del Modelo
La primera versión de SEAMLESSM4T se presentó en agosto de 2023, pero ahora incluye nuevas características que Meta detalla en un artículo publicado en Nature. Este modelo avanzado permite:
- Traducción de voz a voz: reconoce 101 idiomas y traduce a 36.
- Traducción de voz a texto: de 101 a 96 idiomas.
- Traducción de texto a voz: de 96 a 36 idiomas.
- Traducción de texto a texto: en 96 idiomas.
- Reconocimiento automático de voz: en 96 idiomas.
En la traducción de voz a voz, SEAMLESSM4T alcanza un 23 % más de precisión en comparación con otros sistemas existentes. Además, filtra ruidos de fondo y se adapta a las variaciones de los hablantes.
Un Paso hacia la Traducción Universal
Inspirado en conceptos de ciencia ficción como el Pez de Babel de Guía del autoestopista galáctico, el modelo busca hacer realidad la traducción instantánea universal. Sin embargo, los sistemas actuales suelen requerir varios pasos (reconocer, traducir y convertir voz a texto) y están limitados a ciertas combinaciones de idiomas, a menudo priorizando traducciones al inglés.
Con SEAMLESSM4T, Meta amplía la cobertura lingüística y simplifica el proceso al integrar múltiples modos en un solo modelo. Según los investigadores, esto representa un avance significativo hacia una comunicación global más inclusiva y eficiente.
Disponibilidad
Meta planea hacer que los recursos del modelo estén disponibles para el público con fines no comerciales, fomentando la investigación y el desarrollo de tecnologías de traducción inclusivas.
Futuro de la Comunicación Global
Aunque SEAMLESSM4T aún necesita mejoras, los autores del artículo consideran que este desarrollo supone un paso importante para superar las barreras lingüísticas, abriendo nuevas posibilidades en un mundo interconectado.