La organización sin ánimo de lucro Creative Commons, que lideró el movimiento de licencias que permite a los creadores compartir sus obras conservando los derechos de autor, se está preparando ahora para la era de la IA. El miércoles, la organización anunció el lanzamiento de un nuevo proyecto, CC Signals, que permitirá a los titulares de datos detallar cómo su contenido puede o no ser reutilizado por máquinas, por ejemplo, para entrenar modelos de inteligencia artificial.
La idea busca crear un equilibrio entre la naturaleza abierta de internet y la creciente demanda de datos para alimentar la IA, ante el riesgo de que la extracción continua de datos erosione la web abierta y lleve a los creadores a cerrar o proteger sus sitios.
Una solución al caos del ‘scraping’ de datos
La demanda de una herramienta como esta es cada vez mayor, a medida que las empresas modifican sus políticas para limitar el entrenamiento de IA con sus datos. Plataformas como X (antes Twitter) y Reddit han ajustado sus archivos `robots.txt` para intentar restringir el raspado de datos, mientras que compañías como Cloudflare exploran soluciones para cobrar a los bots de IA por el acceso.
En lugar de medidas de bloqueo, el proyecto CC Signals propone una solución diferente: un conjunto de herramientas que ofrece un marco legal y técnico con un fuerte peso ético, similar a las exitosas licencias de Creative Commons que hoy cubren miles de millones de obras en línea.
Un desafío para todo el ecosistema digital
El esfuerzo de Creative Commons no es aislado. Se enmarca en un debate más amplio sobre la procedencia y el uso ético de los datos en la era de la IA. Otras iniciativas, como la Coalition for Content Provenance and Authenticity (C2PA), buscan crear estándares técnicos para certificar el origen y el historial de los contenidos multimedia. Ambos proyectos abordan desde ángulos diferentes el mismo problema fundamental: cómo mantener un ecosistema digital abierto y fiable cuando la IA puede consumir y generar contenido a una escala sin precedentes.
«CC Signals está diseñado para sostener los bienes comunes en la era de la IA. Al igual que las licencias CC ayudaron a construir la web abierta, creemos que CC Signals ayudará a dar forma a un ecosistema de IA abierto basado en la reciprocidad.»
– Anna Tumadóttir, CEO de Creative Commons
Hoja de ruta y próximos pasos
El proyecto apenas comienza a tomar forma, pero ya tiene un plan de desarrollo claro y abierto a la comunidad. Creative Commons ha publicado un documento técnico detallando la propuesta y busca activamente la opinión de la comunidad.
Línea de Tiempo del Proyecto CC Signals
Junio 2025 |
Anuncio y Publicación de Diseños
Se publican los diseños iniciales en el sitio web de CC y en GitHub para recibir comentarios. |
Verano 2025 |
Ayuntamientos Virtuales
Se organizará una serie de reuniones públicas para recibir feedback y responder preguntas de la comunidad. |
Noviembre 2025 |
Lanzamiento Alfa
Se planea el lanzamiento de la primera versión de prueba (alfa) del proyecto. |
Para el fundador de LAION, Christoph Schumann, que apoya el proyecto, la democratización es clave. «Esta tecnología ya existe para los grandes laboratorios», comentó. «Lo que queremos es democratizarla».