La amplia disponibilidad de herramientas para crear inteligencia artificial generativa ha provocado un aumento explosivo de nuevas empresas en este campo. Además, la abundancia de capital y la disminución de los costos de la infraestructura técnica han contribuido a este crecimiento. Sin embargo, una de las aplicaciones más llamativas de la inteligencia artificial generativa, el video generativo, corre el riesgo de saturarse. Empresas como Genmo, Haiper y Rhymes AI están lanzando modelos a un ritmo acelerado, y en algunos casos, poco los distingue de los modelos anteriores.
Naeem Talukdar cree que la confianza, más que las capacidades de un modelo, será lo que diferencie a algunas empresas de video generativo de las demás. Por eso, está fundando Moonvalley, una startup con sede en Los Ángeles que desarrolla herramientas de video generativo más “transparentes”. Talukdar lideró el crecimiento de productos en Zapier antes de fundar Draft, una empresa respaldada por Y Combinator que ofrecía un mercado para contenido de inteligencia artificial empresarial. Reclutó a Mateusz Malinowski y Mik Binkowski, ambos ex científicos de DeepMind, para lanzar Moonvalley, donde estudiaron técnicas de generación de video.
“Compartíamos la creencia de que la generación de video transformaría los medios y el entretenimiento, pero las startups que veíamos en el espacio no tenían las características necesarias para tener éxito”, dijo Talukdar. La mayoría de las empresas de inteligencia artificial generativa entrenan sus modelos con datos públicos, algunos de los cuales están protegidos por derechos de autor. Estas empresas argumentan que la doctrina de uso justo protege esta práctica. Por ejemplo, OpenAI ha insistido en que no puede entrenar adecuadamente sus modelos sin material protegido, y Suno ha argumentado que entrenar indiscriminadamente no es diferente de un “niño escribiendo sus propias canciones de rock después de escuchar el género”.
Sin embargo, esto no ha detenido a los propietarios de derechos de autor de presentar quejas o demandas. Las empresas se han vuelto bastante audaces a pesar de que las demandas en su contra aumentan. A principios de este año, la ex CTO de OpenAI, Mira Murati, no negó que el modelo de video de OpenAI, Sora, se entrenara con clips de YouTube, lo que podría violar la política de uso de YouTube. Además, un informe de 404 Media sugiere que Runway, una startup de video generativo, utilizó material de YouTube de canales de Disney y creadores como MKBHD sin permiso. La startup canadiense Viggle admite que utiliza videos de YouTube para alimentar sus modelos de video y, como la mayoría de sus competidores, no ofrece recursos para los creadores cuyos trabajos podrían haber sido utilizados en su entrenamiento.
“Los modelos generativos deben respetar los derechos de autor, marcas registradas y derechos de imagen”, dijo Talukdar. “Por eso estamos colaborando estrechamente con los creadores en nuestros modelos”. Moonvalley, que aún no tiene un modelo de video completamente entrenado, afirma ser una de las pocas empresas que utiliza datos licenciados exclusivamente de propietarios de contenido que han “optado por participar”. Para protegerse, Moonvalley permitirá a los creadores solicitar la eliminación de su contenido de sus modelos, permitirá a los clientes eliminar sus datos en cualquier momento y ofrecerá una política de indemnización para proteger a los usuarios de desafíos de derechos de autor.
La estrategia de Moonvalley se asemeja a la de Adobe, que está entrenando sus modelos de video Firefly con contenido licenciado de su plataforma Adobe Stock. Talukdar no reveló cuánto está pagando Moonvalley a los colaboradores por los clips, pero podría ser bastante. Bloomberg informó que Adobe ofrecía alrededor de $120 por cada 40-45 minutos de video. Para ser claros, Moonvalley no está adquiriendo contenido por sí mismo. Está trabajando con socios no revelados que manejan los acuerdos de licencia y empaquetan videos en conjuntos de datos que Moonvalley compra. Estos socios, conocidos como “correos de datos”, son muy demandados en estos días, gracias al auge de la inteligencia artificial generativa. Se espera que el mercado de datos de entrenamiento de IA crezca de aproximadamente $2.5 mil millones ahora a casi $30 mil millones en una década.
“Estamos licenciando datos de alta calidad de múltiples fuentes que trabajan directamente con los creadores y los compensan bien por el uso de su contenido”, agregó Talukdar. “Nos aseguramos de utilizar un conjunto de datos diverso y de alta calidad”. A diferencia de algunos modelos de video “sin filtrar” que insertan fácilmente la imagen de una persona en clips, Moonvalley también se compromete a construir salvaguardias en sus herramientas creativas. Al igual que Sora de OpenAI, los modelos de Moonvalley bloquearán cierto contenido, como frases NSFW, y no permitirán que las personas los inciten a generar videos de personas específicas o celebridades. Por supuesto, ningún filtro es perfecto, pero Talukdar dice que este “red-teaming” será una parte fundamental de la estrategia de lanzamiento de Moonvalley.
“A medida que la relación entre los medios y la IA continúa evolucionando rápidamente, y no sin escepticismo, Moonvalley busca establecerse como el socio más confiable para las organizaciones de medios”, dijo. Pero, ¿puede Moonvalley realmente competir? Como se mencionó anteriormente, Google, Meta y muchas otras empresas están persiguiendo el video generativo, con diferentes grados de consideración ética. Los gigantes tecnológicos están cambiando sus términos de uso para obtener una ventaja en los datos: Google está entrenando su modelo de video Veo con videos de YouTube, mientras que Meta está entrenando sus modelos con contenido de Instagram y Facebook.
Moonvalley espera atraer a marcas y casas creativas, pero algunos proveedores ya han avanzado significativamente en ese mercado. Runway firmó recientemente un acuerdo con Lionsgate para entrenar un modelo personalizado con el catálogo de películas del estudio; Stability AI reclutó al director de “Avatar”, James Cameron, para su junta directiva; y OpenAI se unió a marcas y directores independientes para mostrar el potencial de Sora. Luego está Adobe, que está apuntando al mercado objetivo de Moonvalley: artistas y creadores de contenido que desean herramientas de video generativo “más seguras” (al menos desde una perspectiva legal).
El desafío de Moonvalley es triple. Tendrá que convencer a los clientes de que sus herramientas son competitivas con lo que ya existe. Necesitará acumular suficiente tiempo para poder entrenar y servir modelos de seguimiento. Y deberá asegurar una base leal de clientes que no cambien a otro proveedor de inmediato. Muchos artistas y creadores son comprensiblemente cautelosos con la inteligencia artificial generativa, ya que amenaza con alterar la industria del cine y la televisión. Un estudio de 2024 encargado por el Animation Guild, un sindicato que representa a animadores y caricaturistas de Hollywood, estima que más de 100,000 empleos en cine, televisión y animación en EE. UU. se verán afectados por la IA para 2026.
“Nuestra prioridad es construir herramientas que ayuden a los creadores a crear contenido cada vez más grandioso e inmersivo”, dijo Talukdar cuando le pregunté sobre el riesgo de que los creativos pierdan sus trabajos debido a la inteligencia artificial generativa. En cuanto a su avance, Moonvalley ha logrado algunos progresos: la empresa recaudó recientemente $70 millones en una ronda de financiamiento inicial co-liderada por General Catalyst y Khosla Ventures, con la participación de Bessemer Ventures. Esto financiará la investigación y el desarrollo de Moonvalley y su contratación. Actualmente, la empresa cuenta con aproximadamente 30 empleados que anteriormente trabajaron en DeepMind, Meta, Microsoft y TikTok, según Talukdar.
“Lo que nos diferencia de otras empresas es nuestro enfoque en el producto”, agregó. “Mientras que el núcleo de nuestra empresa está en entrenar modelos generativos de última generación, nuestro enfoque es construir herramientas creativas profundamente capaces para convertir estos modelos en equipos poderosos para creadores profesionales, estudios y marcas”. Talukdar dice que el plan es lanzar el primer modelo de Moonvalley a finales de este año. La empresa tendrá que apresurarse si espera superar los próximos lanzamientos de Black Forest Labs, Luma Labs, Midjourney y otros competidores importantes.


