Adobe enfrenta una nueva demanda colectiva en Estados Unidos por el supuesto uso de libros pirateados para entrenar uno de sus modelos de inteligencia artificial. La escritora Elizabeth Lyon, autora de manuales sobre escritura de no ficción, acusa a la compañía de haber utilizado copias no autorizadas de sus obras en el entrenamiento de SlimLM, un pequeño modelo de lenguaje diseñado para asistir en tareas documentales en dispositivos móviles.
Según la demanda, SlimLM se entrenó con SlimPajama-627B, un conjunto de datos “abierto” creado por la empresa Cerebras a partir del dataset RedPajama, que incluye la polémica colección Books3, con unas 191.000 obras presuntamente obtenidas de forma irregular. Los abogados de Lyon sostienen que, al derivar directamente de RedPajama y Books3, SlimPajama contiene obras protegidas por derechos de autor sin permiso, crédito ni compensación para los autores.
El caso se suma a una oleada de litigios similares contra grandes tecnológicas. Apple y Salesforce ya han sido demandadas por el supuesto uso de los mismos datasets para entrenar sus propios sistemas de IA, mientras que Anthropic acordó pagar 1.500 millones de dólares a un grupo de autores por un conflicto parecido relacionado con su chatbot Claude. Estas batallas legales están definiendo hasta qué punto las empresas pueden usar obras protegidas para entrenar modelos de IA, y podrían marcar el futuro equilibrio entre innovación tecnológica y protección de los creadores.


