Reddit ha demandado a Anthropic por supuestamente utilizar los datos del sitio para entrenar modelos de inteligencia artificial sin un acuerdo de licencia adecuado. Esto se dio a conocer en una queja presentada en un tribunal del norte de California. Reddit sostiene que el uso no autorizado de sus datos con fines comerciales por parte de Anthropic es ilegal y que la startup de inteligencia artificial violó el acuerdo de usuario de Reddit. Esta demanda convierte a Reddit en la primera gran empresa tecnológica en desafiar legalmente a un proveedor de modelos de IA por sus prácticas de datos de entrenamiento, uniéndose a otros editores que han demandado a empresas tecnológicas por razones similares.
Por ejemplo, The New York Times ha demandado a OpenAI y Microsoft por usar sus artículos de noticias sin pagar ni obtener permiso. Además, la comediante Sarah Silverman y otros autores de libros han demandado a Meta por entrenar modelos de IA con sus libros sin aprobación. También, editores de música y artistas han presentado reclamaciones similares contra startups de generación de audio, video e imágenes de IA, alegando un uso indebido de su contenido.
Ben Lee, el director legal de Reddit, afirmó: “No toleraremos que entidades con fines de lucro como Anthropic exploten comercialmente el contenido de Reddit por miles de millones de dólares sin ofrecer nada a los usuarios de Reddit ni respetar su privacidad”. Es importante destacar que Reddit ha firmado acuerdos con otros proveedores de modelos de IA, como OpenAI y Google, que les permiten entrenar modelos de IA con datos de Reddit y que las publicaciones del sitio aparezcan en las respuestas de sus chatbots. Sin embargo, Reddit indica que impone ciertas condiciones a OpenAI y Google para proteger los intereses y la privacidad de sus usuarios.
Sam Altman, el CEO de OpenAI, posee un 8.7% de acciones en Reddit, lo que lo convierte en el tercer mayor accionista, y fue miembro de la junta directiva de la empresa. En la demanda, Reddit afirma que se acercó a Anthropic y dejó claro que la startup de IA no tenía autorización para extraer o utilizar el contenido de Reddit, pero que Anthropic “se negó a participar”.
Además, Reddit sostiene que los bots de extracción de Anthropic ignoraron los archivos robots.txt del sitio, que indican a los sistemas automatizados que no deben rastrear los sitios web. Como prueba adicional de que Anthropic utilizó datos de Reddit, Reddit alega que el chatbot de IA de Anthropic, Claude, hace referencia con frecuencia a comunidades y temas de Reddit. Reddit está pidiendo a Anthropic que pague daños compensatorios y una restitución por la cantidad que Anthropic ha ganado al extraer contenido de Reddit. También solicita una orden judicial que prohíba a Anthropic continuar utilizando el contenido de Reddit.


