Creative Commons, una organización sin fines de lucro que promueve el uso de licencias para que los creadores compartan sus obras mientras mantienen los derechos de autor, se está preparando para la era de la inteligencia artificial (IA). Recientemente, anunciaron el lanzamiento de un nuevo proyecto llamado CC signals, que permitirá a los propietarios de conjuntos de datos especificar cómo su contenido puede o no ser reutilizado por máquinas, especialmente en el entrenamiento de modelos de IA.
La idea detrás de CC signals es encontrar un equilibrio entre la naturaleza abierta de internet y la creciente demanda de datos para alimentar la IA. Según Creative Commons, la extracción continua de datos podría amenazar la apertura en internet, llevando a las entidades a restringir el acceso a sus sitios o a protegerlos con muros de pago, en lugar de compartir sus datos. El proyecto CC signals busca ofrecer una solución legal y técnica que establezca un marco para el intercambio de conjuntos de datos, facilitando la colaboración entre quienes controlan los datos y quienes los utilizan para entrenar IA.
La necesidad de herramientas como esta está en aumento, ya que las empresas están cambiando sus políticas y términos de servicio para limitar el uso de sus datos en el entrenamiento de IA o para aclarar cómo utilizarán los datos de los usuarios en relación con la IA. Por ejemplo, X (anteriormente Twitter) hizo un cambio que permitía a terceros entrenar sus modelos con datos públicos, pero luego dio marcha atrás. Reddit está utilizando su archivo robots.txt para restringir que los bots accedan a su información para entrenar IA. Cloudflare busca soluciones que cobren a los bots de IA por acceder a sus datos y herramientas para confundirlos. Además, desarrolladores de código abierto han creado herramientas para ralentizar y desperdiciar recursos de los rastreadores de IA que no respetan sus directrices de “no rastrear”.
El proyecto CC signals propone una solución diferente: un conjunto de herramientas que ofrece un rango de aplicabilidad legal, todas con un peso ético, similar a las licencias de Creative Commons que actualmente cubren miles de millones de obras creativas con licencia abierta en línea.
“CC signals están diseñados para mantener el acceso común en la era de la IA”, dijo Anna Tumadóttir, CEO de Creative Commons. “Así como las licencias CC ayudaron a construir la web abierta, creemos que CC signals contribuirá a dar forma a un ecosistema de IA abierto basado en la reciprocidad”. El proyecto está en sus primeras etapas, con diseños iniciales publicados en el sitio web y en la página de GitHub de CC. La organización está buscando activamente comentarios del público antes de su lanzamiento alfa (prueba temprana) previsto para noviembre de 2025, y también organizará una serie de reuniones para recibir preguntas y sugerencias.


