- La nueva IA generativa de Open AI, Voice Engine, puede crear una voz sintética, a partir de cualquier voz.
- Es tan peligrosa, que por el momento no la va a hacer pública.
Tras dos años de desarrollo, OpenAI ha anunciado hoy Voice Engine, su nueva inteligencia artificial generativa capaz de clonar cualquier voz, con solo escucharla 15 segundos.
Open AI ya ha usado algunas API de texto-a-voz, por ejemplo con ChatGPT. En realidad eran versiones preliminares de Voice Engine, con las que han ido perfeccionándolo.
Según OpenAI, Voice Engine ha sido entrenada con grabaciones de voz licenciadas, y bases de datos públicas. Así que no tiene problemas de copyright.
¿Para qué sirve Voice Engine?
Con solo escuchar una voz 15 segundos, ya sea a la propia persona hablando, o una grabación, Voice Engine es capaz de crear una copia sintética de dicha voz, imitando su tono. Con esta voz sintética se puede “hablar” cualquier frase, imitando la voz original.
Hace falta ver si la imitación de esta inteligencia artificial generativa es perfecta, o se nota que es una voz falsa. Pero teniendo en cuenta que OpenAI ha decidido no ofrecerla al público hasta que “hablemos con las autoridades y expertos competentes”, indica que esa voz sintética, es muy similar a la original.
¿Y para qué necesitamos voces clonadas de otras reales? OpenAI ha puesto algunos ejemplos en su blog, en donde también puedes escuchar fragmentos de voces sintetizadas.
Por ejemplo, se puede usar para leer textos a niños o personas mayores con una voz familiar, doblar en tiempo real vídeos y películas con el mismo tono de voz que el actor original, conversar con personas que solo hablan lenguas indígenas, o que no pueden hablar.
Sin duda son aplicaciones útiles de Voice Engine, pero también muy concretas y poco amplias. ¿Compensa este tipo de beneficios, frente a los peligros que conlleva sintetizar la voz de las personas?
Ya hay otras IAs que lo hacen, y ya conocemos muchos casos de extorsiones, estafas, falsos secuestros, deepfakes, suplantaciones de famosos y políticos, y otros actos criminales que se han llevado a cabo suplantando la voz. Imagina lo que pasaría si Voice Engine se puede usar libremente, como ChatGPT.
Recurriendo al famoso lema de los superhéroes, un gran poder conlleva una gran responsabilidad. Antes de que Voice Engine esté disponible para el público, OpenAI, y las autoridades, deberán encontrar la forma de limitar los usos criminales y fraudulentos de esta inteligencia artificial generativa que clona una voz, con solo escucharla 15 segundos.
Fuente: Computer Hoy