La compañía de inteligencia artificial de voz ElevenLabs ha cerrado una nueva ronda de financiación de 500 millones de dólares liderada por Sequoia Capital, que eleva su valoración hasta los 11.000 millones de dólares, más del triple que en su última ronda de enero de 2025. El socio de Sequoia Andrew Reed se incorpora además al consejo de administración.
En esta ronda han participado inversores ya existentes como a16z, que cuadruplicó su apuesta, e ICONIQ, que la triplicó, además de BroadLight, NFDG, Valor Capital, AMP Coalition y Smash Capital. También se sumaron nuevos fondos como Lightspeed Venture Partners, Evantic Capital y BOND. La empresa adelantó que revelará algunos inversores adicionales en febrero, posiblemente socios estratégicos. Con este nuevo tramo, ElevenLabs acumula más de 781 millones de dólares levantados.
La compañía planea destinar el capital a investigación, desarrollo de producto y expansión internacional en mercados como India, Japón, Singapur, Brasil y México. Según su cofundador Mati Staniszewski, ElevenLabs quiere ir más allá de la voz y trabajar en agentes que integren también vídeo, combinando audio, imagen y capacidades de acción. En esta línea, ya anunció en enero una alianza con LTX para generar contenido de audio a vídeo.
Staniszewski sostiene que la clave está en unir modelos avanzados con productos útiles, y asegura que la firma ampliará su oferta para creadores y para empresas, facilitando agentes capaces de hablar, escribir y ejecutar tareas. El fuerte respaldo inversor llega en un contexto de gran apetito por las startups de IA de voz: ElevenLabs cerró el año con 330 millones de dólares de ingresos recurrentes anuales (ARR), tras pasar de 200 a 300 millones en apenas cinco meses.
El sector vive una fuerte competencia: su rival Deepgram recaudó 130 millones de dólares a una valoración de 1.300 millones, y Google ha fichado talento clave de la startup Hume AI, incluido su consejero delegado. La nueva ronda consolida a ElevenLabs como uno de los actores líderes en la carrera por definir cómo hablaremos e interactuaremos con la tecnología en los próximos años.


