ElevenLabs, la startup especializada en voces de inteligencia artificial hiperrealistas, se ha convertido en un peso pesado del sector: ya es rentable y alcanza una valoración de 6.600 millones de dólares tras una oferta secundaria de 100 millones liderada por Sequoia e ICONIQ, con participación de a16z y otros fondos. Su tecnología da voz tanto a personajes de videojuegos como Fortnite como a bots de atención al cliente, y compite directamente por ser la “voz por defecto” de la IA frente a actores como OpenAI.
En una conversación en el podcast Equity de TechCrunch, el CEO Mati Staniszewski sorprendió al afirmar que los modelos de voz serán un producto casi comoditizado en pocos años. Por eso, ElevenLabs está virando de ser solo un proveedor de modelos de voz a construir una plataforma completa de agentes conversacionales, capaz de gestionar diálogos complejos y experiencias interactivas.
La compañía también intenta adelantarse a los riesgos de los deepfakes mediante marcas de agua en el audio, herramientas de detección basadas en IA y métodos de autenticación en los dispositivos que generan las voces. Staniszewski sostiene que pronto habrá más contenido generado por IA que por humanos y, ante ese escenario, ElevenLabs está apostando por expandirse más allá de la voz hablada: entra en la generación de música y cierra alianzas para integrar sus modelos de audio con modelos de vídeo, con el objetivo de ofrecer experiencias multimedia completas basadas en IA.


