A finales de marzo del año pasado, OpenAI presentó un servicio de inteligencia artificial llamado Voice Engine, que prometía clonar la voz de una persona con solo 15 segundos de habla. Un año después, esta herramienta sigue en fase de prueba y OpenAI no ha indicado cuándo podría lanzarse oficialmente, ni si lo hará en absoluto. La cautela de OpenAI podría deberse a preocupaciones sobre el uso indebido de la tecnología, así como a la intención de evitar la atención de los reguladores.
Un portavoz de OpenAI comentó que la empresa sigue probando Voice Engine con un grupo limitado de “socios de confianza”. Están aprendiendo de cómo estos socios utilizan la tecnología para mejorar su utilidad y seguridad. Voice Engine genera un habla natural que se asemeja mucho a la voz original y se utiliza en diversas aplicaciones, desde terapia del habla hasta personajes de videojuegos.
La herramienta ha enfrentado retrasos desde su anuncio inicial. OpenAI planeaba lanzar Voice Engine, originalmente llamado Custom Voices, el 7 de marzo de 2024, dando acceso a un grupo de hasta 100 desarrolladores de confianza. Sin embargo, el anuncio fue pospuesto y el acceso se limitó a un grupo más pequeño de alrededor de 10 desarrolladores.
OpenAI ha estado trabajando en Voice Engine desde 2022 y ha mostrado la herramienta a responsables políticos para destacar su potencial y riesgos. Entre los socios que tienen acceso a Voice Engine se encuentra Livox, una startup que ayuda a personas con discapacidades a comunicarse. Su CEO, Carlos Pereira, destacó la calidad de la voz y la posibilidad de hablar en diferentes idiomas, aunque mencionó que no han podido integrar Voice Engine en un producto debido a su requisito de conexión a internet.
OpenAI ha indicado que uno de los motivos para retrasar el lanzamiento de Voice Engine fue el riesgo de abuso durante el ciclo electoral de EE. UU. del año pasado. La herramienta cuenta con medidas de seguridad, como la necesidad de obtener el consentimiento explícito del hablante original antes de usarla y la obligación de informar al público que las voces son generadas por IA.
Sin embargo, OpenAI no ha aclarado cómo hará cumplir estas políticas, lo que podría ser un desafío. También ha mencionado la posibilidad de desarrollar una experiencia de autenticación de voz y una lista de “no permitir” para evitar la creación de voces que se asemejen demasiado a figuras prominentes.
La clonación de voces con IA ha sido utilizada en estafas y fraudes, lo que ha llevado a la necesidad de medidas de filtrado y verificación de identidad más estrictas. OpenAI podría lanzar Voice Engine en cualquier momento, pero por ahora, su fase de prueba sigue siendo una de las más largas en la historia de la compañía.


