Fair use ou violação de Copyright no treinamento de IA nos Estados Unidos

Análise Jurídica da Decisão estadunidense sobre fair use ou violação de copyright no contexto de treinamento de Modelos de Linguagem de Inteligência Artificial.

Em uma decisão judicial que repecutiu na midia especializada e certamente estabelecerá um importante precedente, o juiz William Alsup, do Distrito Norte da Califórnia, decidiu que a utilização de livros digitalizados, desde que obtidos legalmente, para o treinamento de modelos de linguagem por inteligência artificial é uma prática permitida sob a figura do “uso justo” (fair use) prevista na legislação americana de propriedade intelectual.

O caso em questão envolveu um conflito entre autores e desenvolvedores de inteligência artificial. Um grupo de escritores ajuizou uma ação contra uma empresa de IA alegando que suas obras haviam sido utilizadas no processo de treinamento do modelo de linguagem sem autorização prévia violaria o copyright dos titulares. Em resposta, a defesa da empresa sustentou que os livros foram adquiridos legalmente e que o uso deles tinha finalidade estritamente técnica, ou seja, servir para ensinar o modelo a gerar textos novos e originais, e não para reproduzir ou copiar as obras protegidas.

O juiz Alsup, no julgamento do caso Barbartz et al v. Anthropic PBCTZ, decidiu em favor da empresa por um ponto essencial: o treinamento de sistemas de IA com textos legalmente adquiridos configura um uso transformativo. Isso significa que o uso não se limita a replicar a obra original, mas utiliza os conteúdos como fonte para que o sistema aprenda e produza um novo material independente.

A decisão destacou que tal prática é análoga àquela de uma pessoa que lê um livro e, a partir da compreensão do conteúdo, escreve um texto novo numa linguagem própria.

Importante ressaltar que o tribunal não validou a utilização de livros pirateados ou obtidos de forma ilícita. O uso dessas obras fora do escopo do fair use ficou sujeito a um procedimento judicial separado, destinado a apurar as responsabilidades civis e eventuais indenizações cabíveis.

Essa decisão representa um avanço significativo na interpretação do direito autoral em face das novas tecnologias, especialmente no que tange à proteção da propriedade intelectual diante do desenvolvimento da inteligência artificial. Ela esclarece que o fair use pode abranger a utilização de obras para fins de aprendizado computacional, desde que respeitados os aspectos de aquisição legal e que o uso seja transformativo, agregando um valor novo ao conteúdo original, sem violar os direitos autorais.

DETALHAMENTO DOS PONTOS FUNDAMENTAIS DA DECISÃO

A decisão aborda de modo detalhado a controvérsia acerca do uso de obras protegidas por direitos de copyright para o treinamento de modelos de linguagem (LLMs), nesse aspecto enfatiza com detalhes como se operacionaliza à utilização de cópias licenciadas versus cópias piratas que seriam utilizadas em violação de direitos, bem como, exemplifica a aplicação do instituto do “fair use” (uso justo) ao caso concreto.

Diferenciação entre Cópias Licenciadas e Piratas

A Corte reconheceu, primeiramente a relevância da origem das cópias utilizadas para o treinamento do LLM. Foi admitido no julgado que a conversão de cópias adquiridas legalmente, originalmente em formato impresso, para o formato digital, acompanhada da destruição da cópia física, poderia se enquadrar no conceito de “uso justo”, desde que um reposicionamento digital não afetasse os direitos autorais das obras originais.

Contudo, por outro lado, o uso de cópias obtidas de forma ilícita, especificamente cópias pirateadas,  para a constituição de uma denominada “biblioteca central” para diversos fins, inclusive além do treinamento imediato, foi categoricamente rejeitado como justificável sob o critério do “uso justo”.

A manutenção indefinida dessas cópias, inclusive após a declaração de que não seriam utilizadas para o treinamento, reforça a sua ilegalidade, uma vez que não há qualquer autorização contratual ou legal para tal retenção e uso.

Análise dos Fatores do Uso Justo

A Corte examinou os quatro fatores clássicos do uso justo previstos no Direito de Propriedade Intelectual dos Estados Unidos, que foram detalhados no julgado, a saber:

Finalidade e caráter do uso: A retenção e uso das cópias para um propósito genérico de biblioteca central, sem uma função clara, específica e autorizada, não constitui uso transformativo que justifique o uso justo. A decisão ressalta que cada uso deve ser justificado individualmente e não pode ser validado pela mera conveniência econômica do réu.

Natureza da obra protegida: A proteção aos autores é fundamental para o estímulo à criação de obras originais, mas a simples previsão de que obras treinadas em IA possam gerar trabalhos concorrentes, como resumos ou exemplos alternativos, não configura violação dos direitos autorais, dado que o direito autoral não protege contra a competição lícita.

Quantidade e substancialidade do material utilizado: O uso irrestrito e permanente de inúmeros exemplares, inclusive a manutenção de cópias não utilizadas, dificulta o enquadramento em uso justo, principalmente quando se trata de cópias pirateadas.

Impacto no mercado ou valor da obra original: Embora um mercado ainda emergente para licenciamento do uso de obras para treinamento de LLMs tenha sido considerado, a Corte concluiu que tal mercado, mesmo que venha a se consolidar, não garante ao autor o direito de impedir usos justos, especialmente quando o uso em questão é considerada transformação.

Intermediação da Cópia e Controle

Ao contrário de situações análogas envolvendo bibliotecas acadêmicas ou serviços autorizados, a ausência de medidas técnicas e contratuais para limitar o acesso e uso das cópias piratas pela Anthropic indica a violação direta e irreparável dos direitos autorais, afastando a proteção do uso justo.

Substituição e Derivação

No tocante ao direito exclusivo de reprodução e criação de obras derivadas, o tribunal destacou que a simples mudança de formato (de impresso para digital) não configura obra derivada, pois não há adição ou subtração criativa original ao conteúdo das obras.

REPERCUSSÃO GERAL DA DECISÃO

A decisão reafirma os limites do uso justo no contexto da inteligência artificial e do treinamento de modelos de linguagem, destacando a ilegalidade na reprodução e retenção de obras protegidas em cópias pirateadas, sobretudo quando estas se incorporam a uma biblioteca permanente sem autorização.

Por outro lado, reconhece a possibilidade de certos usos justos em cópias adquiridas legalmente e para finalidades específicas e justificadas, sempre observando os critérios legalmente previstos para a análise do instituto do fair use.

Essa jurisprudência representa importante precedente para o campo do direito autoral e da tecnologia, indicando que as inovações tecnológicas não podem prescindir do respeito aos direitos dos titulares das obras, e que a proteção da criatividade autoral permanece fundamental, ainda que em cenários de transformações digitais aceleradas.

A relevância desse precedente reside no reconhecimento judicial de que o treinamento de modelos de linguagem baseados em fontes adquiridas legalmente e com finalidade transformativa não viola os direitos autorais. Ao contrário, essa atividade configura uma forma inédita de processamento intelectual, que possibilita avanços tecnológicos e inovação no campo da inteligência artificial.

Texto Integral da decisão CLIQUE AQUI

A decisão norte-americana é emblemática por estabelecer parâmetros para a proteção dos direitos autorais diante do desenvolvimento da IA, protegendo o mercado editorial e a criatividade autoral, ao mesmo tempo em que reconhece usos transformativos legítimos nas fases de treinamento dos modelos.

Marcos Wachowicz Autor
Publicado em 08/07/2025
Atualizado em 13/07/2025
WhatsApp