Libros Piratas, IA y la Batalla Legal de Meta

La batalla legal entre Meta y un grupo de autores, incluyendo a los ganadores del Premio Pulitzer Andrew Sean Greer y Junot Díaz, se centra en el uso por parte de Meta de millones de libros pirateados para entrenar su modelo de IA, Llama. El caso, Richard Kadrey et al. v. Meta Platforms, ofrece una mirada reveladora a las decisiones internas de la compañía y plantea preguntas fundamentales sobre los derechos de autor, el uso justo y la mercantilización del arte y la literatura en la era de la IA generativa.

Inicialmente, el artículo presenta un marcado contraste en las respuestas de Meta AI a la pregunta sobre el uso de libros pirateados para el entrenamiento de la IA. La respuesta inicial condenó inequívocamente la práctica, citando violaciones de derechos de autor y posibles consecuencias. Sin embargo, una respuesta posterior adoptó una postura más ambigua, enmarcando el problema como complejo y sugiriendo que Meta podría estar invocando la defensa de “uso justo”. Este cambio de perspectiva resalta las complejidades legales y éticas que rodean el uso de material con derechos de autor en el desarrollo de la IA.

El núcleo del artículo gira en torno a la demanda *Richard Kadrey et al. v. Meta Platforms*, proporcionando una mirada sin precedentes a las decisiones internas de Meta. La demanda se centra en el entrenamiento por parte de Meta de su modelo de lenguaje grande (LLM) en una base de datos que contiene millones de libros pirateados. Los demandantes, incluidos autores prominentes como Andrew Sean Greer y Junot Díaz, alegan infracción de derechos de autor, afirmando que Meta usó su trabajo sin permiso. Afirman que Meta “descargó por torrents decenas de millones de libros pirateados y otras obras con derechos de autor” de forma gratuita, sin consentimiento.

Meta, por otro lado, defiende sus acciones invocando la doctrina del “uso justo”. Argumentan que su proyecto Llama es “altamente transformador” y, por lo tanto, permisible. Esta defensa ha sido consistente desde su moción inicial para desestimar el caso. El artículo destaca los diferentes puntos de vista, con los demandantes argumentando en contra de la naturaleza transformadora de simplemente copiar y codificar obras textuales en un LLM. La Asociación de Editores Americanos, en un escrito de amicus curiae, apoya esta postura.

El artículo luego amplía el alcance para discutir el contexto más amplio de los casos de derechos de autor que involucran herramientas de IA generativa. Menciona más de 16 casos similares actualmente en el sistema judicial de EE. UU., que involucran a entidades como Anthropic, Stability AI, Microsoft y OpenAI. Estos casos plantean preguntas fundamentales sobre el valor del arte y la literatura y las implicaciones de su mercantilización. El artículo señala la atención particular que ha recibido *Kadrey et al.*, incluida la salida de un destacado abogado de Meta, Mark Lemley, y los intentos de Meta de bloquear unas memorias reveladoras de un ex empleado.

Un aspecto crucial de la defensa de Meta, como se revela en las presentaciones judiciales, es el argumento de que los libros y autores individuales tenían una importancia mínima en la creación de Llama. Los investigadores de Meta vieron la literatura como un activo en bruto, reduciéndola a su valor de datos. Las comunicaciones internas muestran a los investigadores discutiendo la base de datos de ficción como “principalmente novelas, fáciles de analizar, lo que usamos”. El artículo cita ejemplos de cómo se manejaron los datos pirateados, incluidos problemas con el formato y la eliminación de las páginas de derechos de autor.

El artículo detalla la extensión de los datos utilizados, enfatizando que Meta “descargó por torrents al menos 81,7 terabytes de datos a través de múltiples bibliotecas en la sombra a través del sitio Anna’s Archive, incluidos al menos 35,7 terabytes de datos de Z-Library y LibGen”. Esto destaca la escala de la adquisición de datos y el potencial de infracción de derechos de autor. El artículo también incluye citas de autores como Carmen Maria Machado, cuyo trabajo se encontró en la base de datos de LibGen, expresando sentimientos de violación y preocupación por el uso no autorizado de su trabajo creativo.

El artículo luego presenta las perspectivas de expertos legales, incluido Lemley, el ex abogado de Meta. Lemley argumenta que el uso de libros pirateados no es un problema legal significativo, citando la doctrina del “uso justo” y el precedente de los motores de búsqueda que rastrean toda la Internet, incluido el contenido pirateado. Cree que la atención debe centrarse en la salida de la IA en lugar de en los datos de entrenamiento. Sin embargo, el artículo también señala las preocupaciones de los autores, que están preocupados por la posibilidad de que la IA genere resultados infractores y copie su estilo.

Las discusiones internas de Meta revelan un complejo debate interno sobre la ética y la legalidad del uso de material pirateado. El artículo cita comunicaciones internas de investigadores que expresan preocupaciones sobre los riesgos de política y la posibilidad de una cobertura mediática negativa. A pesar de estas preocupaciones, los investigadores parecieron adoptar un enfoque de “no preguntar, no decir”, y algunos reconocieron que sus acciones reflejaban las de otras empresas de IA. El artículo incluye ejemplos de ingenieros que expresan incomodidad con la práctica e intentan eliminar la información de derechos de autor de los libros descargados.

El artículo también aborda los intentos de Meta de justificar sus acciones destacando los posibles beneficios de Llama, como su uso en programas de seguridad nacional e investigación médica. Sin embargo, también reconoce que Meta es una empresa comercial y espera obtener ganancias de su inversión en IA. El artículo luego presenta los resultados de una encuesta de Authors Guild, que muestra que la gran mayoría de los escritores creen que se debe requerir su consentimiento para el entrenamiento de la IA y que deben ser compensados por su trabajo.

El artículo concluye estableciendo paralelismos entre la reducción de la literatura a datos y la experiencia de leer una obra literaria. El autor utiliza una cita de Nabokov para ilustrar el sentimiento de violación y la sensación de pérdida que puede surgir de la mercantilización de las obras creativas. El artículo termina con una reflexión sobre las posibles implicaciones de la IA para el futuro del arte y la literatura.

El juicio en curso, Kadrey et al. contra Meta Platforms, revela el uso por parte de Meta de millones de libros pirateados para entrenar su modelo de IA, Llama, lo que desata batallas legales y debates éticos sobre derechos de autor, uso legítimo y la mercantilización del arte. A medida que la IA avanza, el valor fundamental del trabajo creativo y los derechos de los autores están cada vez más en juego, exigiendo una reevaluación de cómo equilibramos la innovación tecnológica con la integridad artística.

Comments

Leave a Reply

Your email address will not be published. Required fields are marked *