Noticias

Vall-E de Microsoft podría ayudarlo a crear falsificaciones profundas basadas en audio

Vall-E de Microsoft podría ayudarlo a crear falsificaciones profundas basadas en audio

No hay duda de que todos nos estamos moviendo hacia un mundo impulsado por la IA a un ritmo alarmante. ChatGPT ya nos ha abierto los ojos a lo que puede hacer el aprendizaje automático (el creador describió sus capacidades como un vistazo temprano de la IA), mientras que Dall-E nos ha demostrado que en realidad ya no necesitamos humanos para hacer arte. Ahora Microsoft ha presentado su propia herramienta de inteligencia artificial, Vall-E, que puede imitar el sonido de su voz después de escuchar solo un clip de 3 segundos de su conversación.

¿Qué es Microsoft Vall-E?

Vall-E es básicamente un sistema de texto a velocidad (TTS) que le permite escribir un guión de texto que luego se convierte en audio. En el pasado, dicho software siempre ha generado un sonido que suena increíblemente robótico o cuesta un ojo de la cara para las "voces humanas". Vall-E, un modelo de lenguaje de códec neuronal, se entrenó con 60 000 horas de Speed ​​English y produce resultados lo más parecidos posible a una conversación humana. Microsoft afirmó que su herramienta de inteligencia artificial puede "superar significativamente" a otras herramientas TTS en el mercado.

Lo que realmente lo distingue no es su capacidad para parecerse a ti. Es la capacidad de capturar la emoción en el habla, haciendo que suene como si alguien realmente estuviera hablando.

Microsoft

Usando Vall-E de Microsoft

En este punto, Microsoft no ha creado una versión gratuita como lo hizo OpenAI con ChatGPT. Sin embargo, han publicado un montón de muestras en su sitio web, que muestran el rango de resultados que puede lograr con su herramienta.

Por supuesto, si bien la herramienta se puede usar para ayudar al mudo a hablar, también se puede usar para crear algunas falsificaciones profundas realmente geniales y audios de personalidades conocidas. Entre este, Chat GPT y Dall-E, pronto viviremos en un mundo en el que ya no podremos distinguir entre contenido creado por humanos y máquinas.

Para obtener más información sobre tecnología, reseñas de productos, funciones y actualizaciones científicas, siga leyendo Fun Academy o visite nuestra página de noticias de Google.

Califica este artículo

Artículos relacionados