META
Meta lanza un traductor de voz simultáneo con Inteligencia Artificial: puede traducir un centenar de idiomas
La compañía de Mark Zuckerberg vuelve a ser noticia por este traductor de voz simultáneo.
Publicidad
La compañía de Mark Zuckerberg es noticia por haber lanzado un traductor de voz simultáneo. Funciona con Inteligencia Artificial y es capaz de traducir un centenar de idiomas. La revista 'Nature' ha publicado este avance tecnológico.
El modelo de inteligencia artificial generativa liderado por la compañía Meta, SeamlessM4T, es capaz de traducir y transcribir voz y texto de forma automática en 101 idiomas de origen y hasta 36 idiomas de destino: genera texto traducido a 96 idiomas, pero solo puede producir una traducción hablada en 35, explica 'Expansión'.
En agosto de 2023, la compañía ya publicó una demo junto con una primera versión del estudio. Esto supone un avance relevante en sistemas de traducción más rápidos, fiables y transfronterizos.
SeamlessM4T
SeamlessM4T es un modelo único que admite la traducción de voz a voz (de 101 a 36 idiomas), la traducción de voz a texto (de 101 a 96 idiomas), la traducción de texto a voz (de 96 a 36 idiomas), la traducción de texto a texto (96 idiomas) y el reconocimiento automático de voz (96 idiomas).
Se ha desarrollado utilizando un nuevo corpus multimodal de traducciones de voz alineadas automáticamente y otros datos disponibles públicamente. SeamlessM4T es uno de los primeros sistemas multilingües que es capaz de traducir desde y hacia el inglés tanto para voz como para texto. Además, supera a los sistemas en cascada de última generación existentes, consiguiendo puntuaciones BLEU (Bilingual Evaluation Understudy) hasta un 8% y un 23% más altas en tareas de conversión de voz a texto y de voz a voz, respectivamente.
Además de la calidad, cuando se prueba la solidez, el sistema es aproximadamente un 50% más resistente al ruido de fondo y las variaciones del hablante en tareas de conversión de voz a texto que los sistemas de última generación anteriores. Se ha evaluado SEAMLESSM4T en cuanto a toxicidad agregada y sesgo de género para evaluar la seguridad de la traducción. Para el primero, con dos estrategias para la mitigación de la toxicidad agregada que funcionan en el momento del entrenamiento o de la inferencia.
Los recursos utilizados para desarrollar este avance se pondrán a disposición del público para uso no comercial. Este modelo está considerado como un posible primer paso para que las aplicaciones de traducción simultánea automática lleguen a convertirse en algo habitual.
Más Noticias
Síguenos en nuestro canal de WhatsApp y no te pierdas la última hora y toda la actualidad de antena3noticias.com
Publicidad