Direitos Autorais e Inteligência Artificial: Caso Anthropic

Caso Anthropic: Violação de Direitos Autorais no uso de bibliotecas para treinar aplicativos de IA.

No âmago da presente demanda judicial está a alegação de que a empresa Anthropic PBC infringiu direitos autorais ao utilizar cópias piratas de livros para treinar seus modelos de linguagem (Large Language Models – LLMs).

O caso envolve o descarregamento em larga escala de milhões de obras protegidas por copyright, obtidas ilegalmente de bibliotecas piratas digitais, como Books3, Library Genesis (LibGen) e PiLiMi (Pirate Library Mirror).

Contexto dos Fatos

Em início de 2021, um dos cofundadores da Anthropic baixou aproximadamente 196.640 cópias não autorizadas de obras protegidas de uma biblioteca digital pirata conhecida como Books.

Essas obras eram disponibilizadas em formatos que permitiam reconstruir os arquivos originais — com texto e metadados — como eBooks. Posteriormente, com o fechamento das bibliotecas digitais centralizadas por ações governamentais, Anthropic recorreu a sistemas descentralizados de BitTorrent para acessar e baixar volumes ainda maiores, na ordem de milhões de obras, de repositórios como LibGen.

A Anthropic admitiu que esses downloads foram feitos para evitar o pagamento pelo uso das obras, com a intenção de utilizar esses conteúdos para o treinamento de seus modelos de inteligência artificial.

Essa prática caracteriza, segundo os autores da ação, uma violação direta e massiva dos direitos exclusivos de reprodução previstos na legislação de direitos autorais.

Direitos reivindicados e titularidade

A ação coletiva foi movida em nome de autores, editoras e demais titulares dos direitos autorais sobre as obras utilizadas.

A questão da titularidade dos direitos, vale dizer, quem possui a legitimidade para demandar foi detalhadamente analisada.

O juízo reconheceu que a titularidade legal do direito exclusivo de reprodução pode pertencer à editora (ou titular oficial), mas que o autor, como beneficiário dos royalties provenientes da exploração da obra, detém a legitimidade material para figurar como beneficiário do direito de reprodução. Ambos são considerados integrantes da classe.

Classificação de violações envolvidas no caso

Os autores propuseram a certificação de duas classes principais: uma denominada “Pirated Books Class“, que abarca todos os beneficiários legais e materiais dos direitos de reprodução das obras obtidas em versões piratas que estão sendo utilizados segundo a mídia especializada por algumas Big Techs; e outra denominada “Scanned Books Class“, que relaciona obras escaneadas sem autorização e utilizadas indevidamente prática utilizada que  segundo a mídia vem ganhando espaço no mercado.

O tribunal considerou que a identificação das obras baixadas e de seus respectivos titulares, apesar de desafiadora, é possível e necessária para assegurar o direito coletivo dos envolvidos.

A decisão aponta que, mesmo diante da possibilidade teórica de disputas internas entre autores e editoras sobre a divisão dos valores recuperados na ação, tal conflito é incerto e raro, e mecanismos estarão previstos para evitar múltiplas ações sobre a mesma obra.

Impacto para a Indústria de desenvolvimento de IA

A demanda evidencia um conflito emergente entre o avanço tecnológico, em especial a inteligência artificial e a proteção dos direitos autorais.

Empresas de IA buscam utilizar grandes massas de dados para treinamento, mas não podem se eximir do cumprimento das normas que regulam o uso de conteúdos protegidos.

A decisão demonstra o reconhecimento judicial da legitimidade dos titulares de direitos em buscar reparação contra práticas de reprodução não autorizada em larga escala.

Análise da decisão sobre Antropic e violação de Copyright

Aqui vamos destacar apenas 5 pontos que entendemos ser os mais relevantes e fundamentais da decisão prolatada nos Estados Unidos, a aaber:

  1. Fundamentação Jurídica

A decisão judicial que envolve Anthropic baseia-se primordialmente no reconhecimento da violação do direito exclusivo de reprodução, previsto na Lei de Direitos Autorais dos Estados Unidos (U.S. Copyright Act), que concede aos titulares do direito autoral a exclusividade para “reproduzir e distribuir cópias” de suas obras.

A corte entendeu que a conduta da Anthropic, que consistiu em baixar milhões de cópias não licenciadas de obras protegidas, configurou uma reprodução não autorizada, mesmo que para fins de treinamento de modelos de Inteligência Artificial (IA).

Isso é crucial porque demonstra que o uso para treinamento de IA não constitui uma exceção automática ao direito exclusivo do autor.

A legislação norte-americana, embora estabeleça o instrumento de fair use, não acolheu neste caso a alegação de que a mera reprodução para treinamento constituiria tal exceção, dada a natureza comercial do uso e o impacto potencial no mercado das obras originais.

  1. Titularidade dos Direitos e Benefícios

Um aspecto relevante destacado na decisão é a distinção entre titular legal do copyright e titular beneficiário do direito de reprodução.

O tribunal verificou que, enquanto editoras podem deter o título formal do direito autoral para aspectos da exploração econômica, os autores mantêm o papel de beneficiários, especialmente quando recebem royalties pela exploração das obras.

Isso legitima tanto autores quanto editoras a demandar conjuntamente por violação, permitindo a formação das classes representativas.

Essa abordagem é alinhada a jurisprudências anteriores que reconhecem o direito dos autores de perseguir a proteção de seus direitos mesmo em regimes de cessão parcial aos editores, garantindo acesso coletivo para a reparação de danos.

  1. Métodos Técnicos para Identificação das Obras e Classes

Outro ponto importante na fundamentação foi o uso de métodos técnicos para identificar as obras piratas e seus respectivos titulares a partir de metadados como ISBN, ASIN, e certificados de registros na Copyright Office.

Isso garante a viabilização do processo coletivo, viabilizando tanto a atribuição de direitos autorais quanto a eventual quantificação de danos de forma objetiva e técnica.

Este mecanismo de identificação e rastreamento pode ser entendido como inovação processual no contexto de litígios massivos de direitos autorais, especialmente para afrontar casos envolvendo grandes volumes de dados digitais.

  1. Reflexos e Impactos para a Propriedade Intelectual no Contexto da IA

Com a crescente utilização de bases enormes de dados para treinar Inteligências Artificiaisi – IAs, inclusive de forma automatizada e descentralizada, surge o desafio regulatório e judicial sobre o equilíbrio entre inovação tecnológica e proteção dos direitos autorais.

Esta decisão marca um precedente importante ao reafirmar que o direito autoral deve ser respeitado mesmo em ambientes digitais e para usos novos como treinamento de IA.

O reconhecimento judicial da necessidade de licença ou autorização expressa reforça a segurança jurídica para autores e titulares, e coíbe o uso indiscriminado e potencialmente prejudicial ao mercado editorial.

Assim, mecanismos específicos para licenciamento de obras para uso em IA deverão ser desenvolvidos e amadurecidos no mercado, estimulando políticas públicas e privadas de remuneração justa, incentivando inovação responsável.

  1. Recomendações Práticas à Luz da Decisão

A Decisão irá gerar efeitos de ordem práticas que deverão ser observadas pelas partes e, também pelas demais indústrias que desenvolvem aplicativos de IA com a mineração de dados realizadas em bibliotecas digitais.

Assim basicamente a empresa desenvolvedora de IA e as eventuais legislações sobre a matéria, devem se pautar na observância dos seguintes aspectos:

  • Titulares de Direitos: Devem manter registros atualizados e buscar certificações claras de seus direitos, incluindo através de contratos e registros formais, para facilitar ações coletivas e individuais.
  • Empresas de IA: Necessitam implementar políticas de conformidade que envolvam a obtenção de licenças para uso de obras protegidas ou investir em bases de dados próprias, evitando riscos judiciais e danos reputacionais.
  • Legisladores: Devem considerar regulamentações específicas que equilibrem o desenvolvimento da IA com os direitos autorais, prevendo exceções limitadas e critérios objetivos para uso justo.

 

Decisão evidência tendencia de rejeitar o FAIR USE para treinamento de IA.

A decisão judicial contra Anthropic aprofunda o entendimento sobre a aplicabilidade dos direitos autorais em contextos digitais e tecnológicos emergentes, rejeitando o uso indiscriminado de obras protegidas para treinamento de IAs sem autorização prévia.

O reconhecimento da legitimidade dos titulares, a identificação técnica das obras e a certificação das classes representam avanços processuais e substantivos que servirão de referência para futuras disputas na interseção entre propriedade intelectual e tecnologia.

Para ter acesso integral a decisão CLIQUE AQUI

 

A ação contra a Anthropic PBC acusa a empresa de baixar milhões de livros piratas para treinar modelos de IA, violando direitos autorais. O caso discute a viabilidade de uma ação coletiva para representar todos os autores afetados e como identificar os livros copiados e seus legítimos titulares. Trata-se de um exemplo típico de litígio sobre tecnologia e direito autoral na era digital.

Marcos Wachowicz Autor
Publicado em 19/07/2025
WhatsApp