Los autores Grady Hendrix y Jennifer Roberson interpusieron en Estados Unidos una demanda colectiva contra Apple, en la que aseguran que la compañía empleó obras con derechos de autor sin consentimiento en el entrenamiento de sus sistemas de inteligencia artificial.
La acción legal sostiene que Apple utilizó el conjunto de datos denominado Books3, que contendría miles de libros pirateados, en el desarrollo de los modelos de lenguaje OpenELM. De acuerdo con los demandantes, este mismo repositorio habría servido también para entrenar otros modelos de la iniciativa Apple Intelligence.
En el escrito judicial se argumenta que los autores registrados en Estados Unidos no otorgaron permiso alguno para la inclusión de sus obras en dichos sistemas. Asimismo, se plantea que la empresa no ofreció compensación económica a los creadores y que mantuvo en reserva el origen de los datos empleados en el entrenamiento de sus algoritmos.
Hendrix y Roberson afirman que Apple conserva actualmente una biblioteca privada con materiales de este tipo para futuros desarrollos en inteligencia artificial. La acusación subraya que dichas prácticas afectarían el mercado de las obras publicadas y otorgarían a Apple ventajas comerciales derivadas de contenidos protegidos por derechos de autor.
La demanda solicita la realización de un juicio con jurado, junto con medidas cautelares y declaratorias. También se pide una indemnización que abarque daños legales, compensatorios, restituciones y el pago de honorarios de abogados tanto para los dos escritores como para los miembros de la eventual clase representada.
El grupo propuesto estaría compuesto por autores y titulares de derechos de autor registrados en Estados Unidos, cuyas obras pudieran haber sido utilizadas por Apple en el marco de sus proyectos de inteligencia artificial durante el período establecido en la demanda.
Este caso se suma a otros procesos recientes enfrentados por la compañía. Entre ellos, una demanda colectiva en la que se acusó a Apple de permitir la presencia de aplicaciones de criptomonedas fraudulentas en la App Store, las cuales derivaron en pérdidas económicas para usuarios afectados.
“Apple está construyendo parte de esta nueva iniciativa utilizando Books3, un conjunto de datos de libros pirateados con derechos de autor que incluye las obras publicadas de los Demandantes y la Demanda Colectiva. Apple utiliza Books3 para entrenar sus modelos de lenguaje OpenELM. Es probable que Apple también haya entrenado sus Modelos de Lenguaje Foundation utilizando este mismo conjunto de datos pirateados”, señala demanda.
“Apple está construyendo otra parte de su imperio de Inteligencia de Apple mediante Applebot, un programa de software que copia cantidades masivas de páginas web (también conocido como «scraping»). Apple extrajo datos con Applebot durante casi nueve años antes de revelar su intención de entrenar sus sistemas de IA con estos datos. Los programas de extracción de datos como Applebot también pueden acceder a «bibliotecas fantasma» que albergan millones de otros libros con derechos de autor sin licencia, incluyendo, según mi leal saber y entender, las obras con derechos de autor de los Demandantes y los Miembros de la Demanda Colectiva”, agrega el libelo.