La reciente demanda presentada en Estados Unidos por el periodista de investigación John Carreyrou, autor de Bad Blood, junto a otros cinco autores, contra las principales compañías de inteligencia artificial marca un punto de inflexión jurídico que va mucho más allá del debate sobre derechos de autor. Lo que está en juego no es solo la legalidad del entrenamiento de modelos de lenguaje con libros protegidos, sino la arquitectura misma del poder normativo en la era digital.
Los autores han demandado a un consorcio de titanes tecnológicos que incluye a xAI, Anthropic, Google, OpenAI, Meta Platforms y Perplexity. La acusación es clara: utilizar libros protegidos por copyright sin autorización para entrenar sus modelos de lenguaje masivos (LLM). La demanda, presentada en un tribunal federal de California, evita deliberadamente la vía de la acción colectiva o class action.
Concepto Clave
Acción Colectiva (Class Action): Es un tipo de demanda en la que un grupo de personas con quejas similares contra el mismo demandado se unen para litigar como un solo ente. Los demandantes en este caso argumentan que este mecanismo favorece a las grandes plataformas, permitiéndoles cerrar acuerdos globales que extinguen miles de reclamaciones de alto valor a cambio de compensaciones mínimas por obra infringida.
Este detalle procesal es clave. Los demandantes sostienen que las empresas de IA no deberían poder “apagar miles de derechos individuales a precio de saldo”. La estrategia busca forzar una negociación individual o en pequeños grupos, donde el valor de cada obra infringida pueda ser reclamado en su totalidad.
El precedente de Anthropic y los límites del modelo actual
El contexto inmediato es el acuerdo alcanzado en agosto por Anthropic, que aceptó pagar una suma considerable para cerrar una class action de autores que denunciaban el uso masivo de libros pirateados. Sin embargo, según los nuevos demandantes, ese tipo de acuerdo deja a cada autor con una fracción ínfima del máximo legal previsto por la Copyright Act estadounidense.
Carreyrou llegó a calificar ese uso inicial de libros como el “pecado original” de la IA generativa. La expresión no es retórica: apunta a una fase fundacional del sector en la que la expansión tecnológica se apoyó en una suerte de tierra de nadie jurídica, donde el acceso técnico sustituyó al consentimiento legal.
Perfil: OpenAI
OpenAI es un laboratorio de investigación y despliegue de inteligencia artificial con la misión declarada de garantizar que la inteligencia artificial general (AGI) beneficie a toda la humanidad. Fundada en 2015 por figuras como Sam Altman, Elon Musk y Greg Brockman, la compañía ha pasado de ser una organización sin fines de lucro a un modelo de «beneficio limitado», con una filial con fines de lucro. Es la creadora de modelos de lenguaje líderes como la serie GPT y el popular chatbot ChatGPT, que catalizó la adopción masiva de la IA generativa.
- Sede: San Francisco, California, EE.UU.
- Fundación: 2015 por Sam Altman, Elon Musk, Greg Brockman, Ilya Sutskever, Wojciech Zaremba y John Schulman.
- Valoración: Aproximadamente $86 mil millones (2024).
- Inversores Clave: Microsoft, Khosla Ventures, Sequoia Capital, Andreessen Horowitz.
- Social: X (Twitter) | LinkedIn
¿Entrenar es usar? El núcleo del conflicto
Desde un punto de vista estrictamente jurídico, el conflicto gira en torno a una pregunta esencial: ¿constituye el entrenamiento de un modelo de IA un acto de explotación relevante a efectos de copyright? Las empresas sostienen que el entrenamiento es un proceso transformativo, no sustitutivo, y por tanto amparado por la doctrina del fair use. Los autores replican que se trata de una copia sistemática, a gran escala, con una finalidad comercial directa.
El debate real es más profundo. No se discute solo la infracción de un derecho patrimonial, sino quién fija las reglas del nuevo espacio económico digital.
Durante años, las grandes plataformas han operado bajo un principio implícito: si algo es técnicamente accesible, es jurídicamente utilizable. Esta lógica, propia del paradigma code is law, choca frontalmente con los sistemas jurídicos tradicionales, que se basan en el consentimiento, la licencia y la autoría.
Cronología del Conflicto IA vs. Copyright
| Nov 2022 | Lanzamiento de ChatGPT por OpenAI, popularizando la IA generativa a nivel global y abriendo el debate público sobre sus fuentes de datos. |
| Ene 2023 | Getty Images demanda a Stability AI por el uso de millones de imágenes protegidas para entrenar el modelo de difusión Stable Diffusion. |
| Ago 2024 | Anthropic alcanza un acuerdo de $1.500 millones para cerrar una demanda colectiva de autores por el uso de libros en sus entrenamientos. |
| Oct 2024 | John Carreyrou y otros autores presentan una demanda individualizada contra los principales actores de la IA, buscando sentar un precedente diferente. |
Riesgos sistémicos y el futuro del entrenamiento de modelos
Si la estrategia de demandas individuales prospera, el impacto para el sector puede ser significativo. El coste legal por modelo entrenado podría multiplicarse, forzando a las empresas a un cambio de paradigma que implicaría:
- Crear sistemas formales y transparentes de licencias de datasets.
- Revisar retroactivamente sus procesos de entrenamiento para purgar datos no autorizados.
- Asumir que el entrenamiento es un acto jurídicamente relevante que requiere consentimiento previo.
- Integrar el cumplimiento legal en el diseño del propio modelo (compliance by design).
Este escenario conecta directamente con los debates regulatorios en Europa, donde el AI Act y otras normativas avanzan hacia una mayor exigencia de trazabilidad y legitimidad de los datos de entrenamiento.
Conclusión: El fin de la era ‘salvaje’ de la IA
El caso Carreyrou no es solo una demanda por copyright. Es un síntoma de algo mayor: el final de la fase “salvaje” de la inteligencia artificial y el inicio de una etapa en la que la tecnología ya no puede crecer al margen del derecho. La pregunta ya no es si la IA debe cumplir normas, sino qué normas, quién las define y en qué jurisdicción. Y, como tantas veces en la historia del derecho, la respuesta no vendrá solo de los legisladores, sino también de los tribunales y de quienes se atrevan a impugnar los fundamentos mismos del nuevo orden digital.
