Inteligência Artificial e Direito Autoral: uma visão das produções científicas
A Dra. Denise Fukumi Tsunoda, em sua pesquisa inovadora, aborda a relação entre Inteligência Artificial (IA) e Direito Autoral, destacando os desafios trazidos pelo desenvolvimento tecnológico. O estudo apresenta um percurso metodológico detalhado para mapear a produção acadêmica sobre o tema, analisando bases de dados científicas como Scopus, Web of Science, e Periódicos Capes.
Introdução
Segundo Mueller e Massaron (2019), a inteligência envolve certas “ações mentais” que reúnem: aprendizado, raciocínio, compreensão, aprender verdades, ver relações, considerar significados e separar fatos de crenças. Os autores mencionam que a lista poderia ainda ter vários outros aspectos contemplados, mas afirmam que “nenhum computador consegue implementar integralmente qualquer atividade mental que descreve a inteligência” e alertam para o que chamam de “sensacionalismo da IA”, explicado por eles como “acreditar que a IA está, de fato, muito mais avançada do que na realidade”.
Na mesma linha, Felipe Medon na obra “Inteligência Artificial e Responsabilidade Civil: Autonomia, Riscos e Solidariedade” (2022), menciona
David C. Vladeck, em contributo seminal sobre o assunto, traz à baila um aspecto determinante: por mais inovadoras e disruptivas que sejam as máquinas de hoje, grande parte delas ainda funciona e toma decisões de maneiras que podem ser diretamente reconduzidas ao conhecimento que os humanos embutiram nelas, por meio da programação ou do design. A mão humana ainda é responsável por definir, guiar e controlar todo o processo, diretamente ou por conta da capacidade que possui de, a qualquer momento, assumir o controle da máquina. Assim, não importa o quão sofisticadas essas máquinas sejam: a maior parte delas possuiria neste momento, no máximo, uma autonomia parcial, o que as torna ferramentas a serviço dos seres humanos, embora consideravelmente sofisticadas. [grifo meu] (MEDON, 2022, p. 158)
Conforme mencionado por Medon (2022), neste momento os algoritmos / máquinas possuem autonomia parcial. Entende-se que a discussão de autoria e demais conceitos e responsabilidades relacionados passe a ter maior relevância com o advento da Inteligência Artificial Forte (relacionada à criação de máquinas com autoconsciência e capacidade de raciocínio) e não à Inteligência Artificial Fraca (incapaz de raciocinar e está limitada a “simulação da inteligência” não sendo, de fato inteligente e não apresentando autoconsciência e autossuficiência.
O objetivo deste documento é apresentar, principalmente de forma quantitativa, as produções que relacionam a “inteligência artificial” e o “direito autoral” encontradas nas bases de periódicos científicos.
Percurso metodológico
Para levantamento das produções foram utilizadas as bases Scopus (Elsevier), Web of Science (WOS), EBSCOHost e EmeraldInsight, com a seguinte estratégia de pesquisa: string de busca: “inteligência artificial” AND “direito autoral”, inicialmente sem filtros e, sempre que possível, no documento completo. No entanto, não houve retorno. Partiu-se então para pesquisa no Periódicos Capes com a mesma string de busca e foram retornados 64 documentos no C1 (Corpus 1).
Uma pesquisa complementar foi realizada na Scopus (Elsevier) com a string de busca: ( ( “authors right’s” OR “copyright law” OR “authorial right” OR “copyright” ) AND “artificial intelligence” ) e houve retorno de 14.069 documentos, de 1961 até 2022. Foram aplicados filtros de período (2011-2021), acesso (Open Access), tipo de documento (Conference Paper ou Article) e idioma (English). Após a filtragem, restaram 442 documentos no corpus chamado de C2 (Corpus 2).
Dos 14.069 documentos, 164 estavam listados com o país Brasil. Estes documentos foram separados e analisados no C3 (Corpus 3). Todos os resultados das pesquisas foram submetidos à avaliação da ferramenta Biblioshiny® e complementado com análises no Microsoft Excel® para análise de algumas métricas, conforme relatado na seção de resultados.
Resultados
O corpus C1 de 64 documentos compreende publicações de 2004 até 2021, foi publicado em 18 fontes (journals, livros etc), apresenta média de publicação de 3,14 ao ano, 138 autores que produziram 16 documentos individuais e todos os demais em coautoria. Os documentos apresentaram 52 palavras-chaves distintas.
Detalhando a publicação anual, percebe-se que a 45 (dos 64) trabalhos foram publicados em 2018 e os anos de 2005 até 2009 não apresentaram publicações, conforme ilustra o GRÁFICO 1 .
GRÁFICO 1 – Produção anual
Fonte: A autora (2021)
As 18 fontes utilizadas para publicação dos trabalhos aparecem no GRÁFICO 2. Importante observar que dos 64 trabalhos, 42 (65,63%) estão publicados na Revista Brasileira de Políticas Públicas.
GRÁFICO 2 – Revistas que publicaram os trabalhos
Fonte: A autora (2021)
Apenas uma autora, a saber Clarice G. Oliveira apresenta dois trabalhos publicados. Todos os demais autores apenas um trabalho.
Por meio das palavras-chaves foi possível observar a nuvem de palavras, conforme FIGURA 1. Os termos Covid-19, culture e education apareceram duas vezes cada e os demais apenas uma vez.
FIGURA 1 – Nuvem de palavras-chaves dos autores
Fonte: A autora (2021)
Em uma análise por trigramas (três termos) dos títulos, destaque para o termo “liberdade de expressão” com três ocorrências. Esta análise permite observar os interesses dos pesquisadores, por exemplo: marco civil da internet, análise de dados, bens imateriais, provedores de aplicação e outros.
FIGURA 2 – Análise por trigramas dos títulos dos 64 documentos
Fonte: A autora (2021)
Os resumos também foram analisados por trigramas e, mais uma vez é possível avaliar os focos das pesquisas: liberdade de expressão, processo de industrialização, direito e propriedade, marco civil e outros.
FIGURA 3 – Análise dos resumos por trigramas dos 64 documentos
Fonte: A autora (2021)
A análise por rede de colaboração e co-citação não retornaram resultados, ou seja, não foram identificadas redes de colaboradores e co-citações nos documentos recuperados em C1.
Assim, passou a análise dos 14.069 documentos, distribuídos no período de 1961 até 2022, conforme apresentado no GRÁFICO 3, com o pico de produção em 2012 com 1.788 produções.
GRÁFICO 3 – Produções distribuídas no período 1961-2022
Fonte: A autora (2021)
Pesquisando a instituição com maior produção, aparece a Carnegie Mellon University (438), seguida da University of Southern California (271), University of Alberta (210), The University of Texas at Austin (162), Stanford University (155) e University of Maryland, College Park (145). Nesta listagem a universidade brasileira com a maior produção é a Universidade de São Paulo com 30 trabalhos.
O pesquisador mais produtivo é o professor Milind Tambe da Harvard University e diretor da “AI for Social Good” da Google Research India com 52 publicações nesta pesquisa, mas 484 publicações, 11.678 citações em 6.527 documentos e um h-index 53.
O país com a maior produção são os Estados Unidos da América com 6.366 produções, seguido da Inglaterra (1.022), Canadá (963), Alemanha (795) e China (750).
Na análise de produção anual do C2 (após a aplicação dos filtros) com 442 documentos o ano com maior produção também foi 2012 (110 dos 442 documentos, ou seja 24,89%) e o autor com a maior produção foi o professor Milind Tambe com quatro produções. O país com a maior produção foram os EUA com 155 produções, seguidos pela China (60), Inglaterra (53), Espanha (28) e Alemanha (27). Neste recorte o Brasil possui apenas 6 documentos.
No C2 foram identificadas 977 palavras-chaves de autores e 3.950 palavraschaves estendidas. Quanto aos autores, foram identificados 1.633 autores e destes, 53 publicaram trabalhos individuais e os demais em coautoria (3,98 coautores por documento, em média). O periódico com o maior número de publicações é a AI Magazine com 106 trabalhos.
GRÁFICO 4 – Fontes de publicação mais utilizadas pelos autores
Fonte: A autora (2021)
As instituições com maior número de publicações são: Carnegie Mellon University (21), University of Southern California (10), Delft University of Technology (8), Massachusetts Institute of Technology (8) e Stanford University (8).
Por meio da análise da rede das palavras-chaves dos autores, fica em evidência os termos com maior correspondência nos documentos do C2, conforme FIGURA 4. Nesta figura é interessante observar a presença do termo “creativity” relacionado ao termo “artificial intelligence”.
FIGURA 4 – Rede de co-ocorrência de palavras-chaves dos autores
Fonte: A autora (2021)
A rede de colaboração apresenta os autores que publicaram de forma cooperativa trabalhos do C2 (FIGURA 5).
FIGURA 5 – Rede de colaboração dos documentos recuperados no C2
Fonte: A autora (2021)
Finalmente, procedeu-se a análise do C3, com as publicações envolvendo o país Brasil resultando em 164 documentos. O ano com a maior produção foi 2013 (24 produções) seguido de 2012 com 17 produções. O GRÁFICO 5 apresenta a linha com tendência de crescimento das produções nacionais.
GRÁFICO 5 – Produções anuais envolvendo o Brasil
Fonte: A autora (2021)
A instituição com a maior produção é a Universidade de São Paulo (30), seguida pela Universidade Federal do Rio Grande do Sul (17), Universidade Estadual de Campinas (12), Universidade Federal de Santa Catarina (8) e pela Petrobras também com 8 produções.
Segundo retorno da Scopus, o professor maior produção é Bazzan, A.L.C. (7) da UFRGS, seguido de Furtado, V. (6) da UFC, Garcia, A.C.B. (5) da UFRJ, Lamb, L.C. (5) da UFRGS e Cozman, F.G. (4) da USP. Interessante observar que os dois professores da UFRGS quando analisada a rede de colaboração nacional, aparecem relacionados, conforme representação na FIGURA 6.
FIGURA 6 – Redes de colaboração nacionais
Fonte: A autora (2021)
Ainda nesta FIGURA 6 aparece a rede dos professores Tiago Stegun Vaquero, José Reinaldo Silva e Flavio Tonidandel, sendo os dois primeiros da USP e o professor Flavio da FEI, aqui apresentando uma rede entre instituições distintas.
A próxima seção apresenta considerações finais desta pesquisa.
Considerações finais
O tema Direito Autoral e Inteligência Artificial é interessante e alvo de discussões em diversas partes do mundo. Pela pesquisa realizada identificou-se que o Brasil ainda tem espaço para pesquisa e publicações, inclusive internacionais sobre a temática. No entanto, foi identificada a inexistência de rede de colaboração e co-citação nacionais nos documentos recuperados.
Os resultados na base mundial apontaram os EUA como o país com a maior produção, apresentando 6.366 (45,25% dos 14.069 documentos), seguido da Inglaterra (1.022), Canadá (963), Alemanha (795) e China (750). Das cinco instituições com maior número de publicações, quatro estão nos EUA: Carnegie Mellon University, University of Southern California, Massachusetts Institute of Technology e Stanford University. Apenas a Delft University of Technology não está nos EUA.
Por meio da análise da rede das palavras-chaves dos autores, ficaram evidenciadas algumas relações entre os termos com maior correspondência e o destaque fica para a relação entre os termos “creativity” e “artificial intelligence” uma vez que, o termo criatividade, muitas vezes está relacionado à originalidade.
Como continuidade desta pesquisa, sugere-se a leitura dos artigos mais citados por meio de condução de revisão sistemática por pares.
Referências
MENON, Felipe. Inteligência artificial e responsabilidade civil: autonomia, riscos e solidariedade. 2ª ed. Salvador: Editora JusPodivm, 2022.
MUELLER, John Paul; MASSARON, Luca. Inteligência artificial para leigos. Rio de Janeiro: Alta Books, 2019.