La Enciclopedia Británica y su filial, el diccionario Merriam-Webster, han iniciado una batalla legal contra OpenAI, presentando una demanda que acusa al gigante de la inteligencia artificial de cometer una «infracción masiva de derechos de autor». La queja formal sostiene que la tecnología detrás de ChatGPT se ha nutrido ilegalmente de su vasto repositorio de conocimiento curado.
Las Acusaciones Clave: Más Allá del Entrenamiento
Britannica, propietaria de Merriam-Webster, alega que OpenAI extrajo y utilizó sin permiso casi 100.000 de sus artículos en línea, protegidos por derechos de autor, para entrenar sus Grandes Modelos de Lenguaje (LLM). Sin embargo, la demanda va más allá del simple entrenamiento.
La editorial acusa a OpenAI de violar las leyes de copyright de múltiples maneras:
- Reproducción de Contenido: Cuando ChatGPT genera resultados que contienen «reproducciones textuales totales o parciales» del contenido de Britannica.
- Uso en Flujos de Trabajo RAG: Al utilizar sus artículos en el sistema RAG (Retrieval-Augmented Generation) de ChatGPT para obtener información actualizada.
- Violación de la Ley Lanham: Cuando el modelo genera «alucinaciones» o información inventada y las atribuye falsamente a la Enciclopedia Británica, dañando su reputación como fuente fiable.
¿Qué es RAG (Retrieval-Augmented Generation)?
Es una técnica que permite a los modelos de IA como ChatGPT complementar su conocimiento interno (obtenido durante el entrenamiento) con información externa y actualizada. El modelo busca en bases de datos externas o en la web en tiempo real para encontrar datos relevantes y los utiliza para formular una respuesta más precisa y contextualizada, citando a menudo la fuente de la que extrajo la información.
«ChatGPT mata de hambre a editores web como [Britannica] de ingresos generando respuestas a las consultas de los usuarios que sustituyen y compiten directamente con el contenido de editores como [Britannica]».
La demanda subraya que estas prácticas no solo privan a la editorial de ingresos, sino que también ponen en peligro «el acceso continuo del público a información en línea confiable y de alta calidad» debido a la proliferación de alucinaciones atribuidas incorrectamente.
Perfil: OpenAI
Fundada en 2015 por figuras como Sam Altman, Elon Musk, Greg Brockman e Ilya Sutskever, OpenAI comenzó como una organización sin fines de lucro con la misión de garantizar que la inteligencia artificial general beneficie a toda la humanidad. Con sede en San Francisco, California, la compañía transitó a un modelo de «beneficio limitado» en 2019, lo que le permitió recaudar capital masivo, destacando una inversión multimillonaria de Microsoft. Otros inversores clave incluyen a Khosla Ventures, Andreessen Horowitz (a16z) y Sequoia Capital. Con una valoración que supera los 80.000 millones de dólares, OpenAI se ha posicionado como el líder indiscutible en el desarrollo de modelos de IA generativa, con productos como ChatGPT y DALL-E que han redefinido el panorama tecnológico. Puedes encontrar más en su sitio web oficial, LinkedIn y X (Twitter).
Una Ola Creciente de Litigios
Britannica no está sola en esta lucha. La editorial se suma a una lista cada vez mayor de medios y creadores de contenido que han emprendido acciones legales contra OpenAI. Entre los demandantes se encuentran gigantes como The New York Times, el conglomerado de medios Ziff Davis (propietario de Mashable, CNET, IGN y PC Mag), y más de una docena de periódicos de Estados Unidos y Canadá, incluyendo el Chicago Tribune, el Denver Post y la Canadian Broadcasting Corporation. Además, Britannica mantiene una demanda similar pendiente contra la startup de búsqueda con IA, Perplexity.
Cronología de Demandas Clave contra la IA
| Dic 2023 | The New York Times demanda a OpenAI y Microsoft por infracción de derechos de autor. |
| Abr 2024 | Un grupo de ocho periódicos propiedad de Alden Global Capital demanda a OpenAI. |
| May 2024 | Ziff Davis presenta una demanda contra OpenAI por el uso de su contenido. |
| Jun 2024 | Enciclopedia Británica y Merriam-Webster presentan su demanda contra OpenAI. |
El Precedente Legal Aún por Definir
Actualmente, no existe un precedente legal sólido que determine si el uso de contenido protegido por derechos de autor para entrenar un LLM constituye una infracción. El argumento de la «transformación» o «uso justo» es central en la defensa de las empresas de IA.
En un caso relevante, la compañía de IA Anthropic logró convencer a un juez federal de que el uso de contenido para entrenamiento es suficientemente transformador para ser considerado legal. Sin embargo, el mismo juez dictaminó que Anthropic había violado la ley al descargar ilegalmente millones de libros en lugar de adquirirlos por vías legítimas, lo que resultó en un acuerdo de demanda colectiva de 1.500 millones de dólares para los escritores afectados. Este matiz podría ser clave en el futuro de estos litigios.
Hasta el momento de la publicación, OpenAI no ha emitido comentarios sobre la demanda.
