ChatGPT e a disputa pelo controle do conhecimento

É quase impossível identificar retroativamente as fontes e autorias retiradas de bases de dados pelos bots, sem autorização. Apropriação do saber pelo Comum pode estar mais ameaçada. Em disputa: a quem devem pertencer os direitos de autor?

.

Por Leonardo Foletto, na Jacobin Brasil

O ano de 2023 tem sido permeado pelo tema de Inteligência Artificial (IA) quando se fala sobre tecnologias digitais e internet. Isso se deve em grande parte ao sucesso estrondoso do ChatGPT, uma IA generativa desenvolvida pela OpenAI, uma empresa dos Estados Unidos fundada em 2015 com um investimento inicial de U$ 1 bilhão, cerca de R$ 4,9 bilhões na cotação atual.

Seus sócios incluem personalidades notáveis como Sam Altman, CEO da empresa. Elon Musk, o bilionário excêntrico e segundo homem mais rico do mundo de acordo com a Bloomberg, foi um dos co-fundadores da empresa em 2015, mas abandonou o projeto após discordâncias com princípios éticos e modelos de financiamento da empresa.

O ChatGPT foi disponibilizado publicamente gratuitamente em 30 de novembro de 2022 e, em janeiro de 2023, já havia alcançado 100 milhões de usuários. Isso o torna a tecnologia de crescimento mais rápido da história até o momento. É importante ressaltar que essa IA generativa consegue gerar textos e imagens de forma automatizada, baseada no aprendizado de máquina.

Direito autoral e propriedade intelectual

Há inúmeras formas de abordar a discussão acerca dos impactos da Inteligência Artificial (IA) no cotidiano global. Podemos falar sobre as questões éticas que envolvem a adoção desses sistemas em salas de aula, por exemplo, assim como sobre mecanismos possíveis para regulamentá-los e assegurar que evitem a disseminação de racismo algorítmico, discursos de ódio e desinformação.

Podemos, ainda, discutir como as IAs são utilizadas em trabalhos criativos de texto e imagem, ou refletir sobre as questões filosóficas que envolvem a simbiose entre a realidade humana e a realidade das máquinas — incluindo a possibilidade de uma superação da inteligência humana pela maquínica.

Contudo, eu opto por abordar a questão sob uma perspectiva diferente: a discussão sobre criação, cópia e propriedade intelectual na internet.

O fato é que nem todo mundo está satisfeito com que as IAs generativas, como o ChatGPT e o Midjourney (usado para geração de imagens), consigam escrever livros infantis, ganhar competições de arte ou produzir artigos acadêmicos. Isso levanta uma série de questões sobre a autoria, a originalidade e a propriedade intelectual, que ainda carecem de respostas claras.

Além disso, é preciso considerar as implicações políticas e sociais do extrativismo desigual de dados norte-sul global, acentuando o colonialismo de dados, que pode levar a um modo de produção ainda mais opressivo que o capitalismo, agora baseado no controle do “vetor da informação”.

Em suma, a discussão sobre as IAs generativas e seus impactos é complexa e multifacetada, e requer uma análise cuidadosa de seus aspectos éticos, políticos e sociais.

Cópia da cópia da cópia

A importância da cultura livre e dos movimentos que a promovem se torna ainda mais relevante em tempos de avanço das IAs generativas. Como mencionado anteriormente, essas tecnologias são capazes de criar obras artísticas, textos e outros tipos de conteúdo de forma automatizada, o que levanta questionamentos sobre a autoria e a propriedade dessas obras.

O copyleft e as licenças Creative Commons se mostram, nesse contexto, ferramentas poderosas para garantir que as obras geradas pelas IAs generativas possam ser utilizadas e compartilhadas livremente, sem restrições ou limitações impostas pelos detentores de direitos autorais.

No entanto, é importante lembrar que a cultura livre não é apenas uma questão de licenciamento. Ela envolve uma transformação mais ampla na forma como a sociedade entende a cultura, o conhecimento e a criatividade, e busca colocá-los ao alcance de todos, promovendo a participação e a colaboração em vez da exclusão e da monopolização.

Nesse sentido, a cultura livre se apresenta como uma alternativa à lógica mercantilista que rege a indústria cultural e as políticas de propriedade intelectual, permitindo o florescimento de novas formas de criação, expressão e compartilhamento que fogem do controle das grandes corporações e das elites intelectuais.

Do copyleft emergiram, no início dos anos 2000, os Creative Commons: um conjunto de licenças e, posteriormente, uma ONG presente em mais de cinquenta países. A partir daí, expandiu-se a ideia de cultura e conhecimento livre, e potencializados movimentos como a Educação Aberta (Recursos Educacionais Abertos no Brasil), Ciência Aberta e OpenGlam (galerias, bibliotecas, arquivos e museus abertos), ainda em plena atividade globalmente.

Esses movimentos promovem o acesso a conhecimentos de interesse público, tais como produções científicas, livros didáticos e obras presentes em museus e bibliotecas públicas, frente às restrições impostas pelas empresas detentoras de direitos autorais em obras culturais e educacionais.

Assim, a defesa da cultura livre e dos movimentos que a promovem se torna ainda mais urgente em um mundo cada vez mais dominado pelas IAs generativas e pela lógica da propriedade intelectual restritiva, garantindo que a criatividade e o conhecimento possam ser compartilhados e apropriados por todos, e não apenas por uma elite privilegiada.

O livre direito a cultura para IAs?

A partir desse panorama sobre a cultura livre, discutido em “A Cultura é Livre: uma história da resistência antipropriedade”, é possível estabelecer uma conexão com a Inteligência Artificial (IA). A popularização de sistemas como o ChatGPT coloca a propriedade intelectual em um momento histórico importante, já que vivemos em um mundo cada vez mais dominado por múltiplas cópias reproduzidas por sistemas algorítmicos “inteligentes”.

Nesse contexto, torna-se difícil reconhecer as fontes e identificar a autoria. É praticamente impossível fazer isso retroativamente, pois muitos sistemas de IA já extraíram informações de bases de dados da internet sem autorização e seguem produzindo novas ideias a partir do que aprenderam.

No âmbito jurídico, já há denúncias que questionam essa apropriação; três artistas iniciaram uma ação coletiva contra Stability.ai e Midjourney alegando violação direta e indireta de direitos autorais, uma vez que “estes sistemas pegaram bilhões de imagens de treinamento extraídas de sites públicos” e as usaram “para produzir imagens aparentemente novas por meio de um processo de software matemático”.

Entre especialistas em direito autoral, muitos se perguntam se a extração de conteúdo de terceiros por estas IAs generativas pode ser considerado “fair use” (uso justo), mecanismo da Lei dos Estados Unidos que estabelece como uso justo a reprodução de trechos para fins como crítica, comentário, notícias, ensino ou pesquisa.

Esse tipo de mecanismo de exceção, que sempre foi uma defesa do movimento da cultura livre para que grandes empresas da cultura não impedissem práticas como as pequenas citações musicais e de vídeo para fins de estudo ou paródia, por exemplo, agora tem sido estabelecido como a interpretação usada pelos tribunais dos Estados Unidos para permitir alguns usos de mineração de dados necessários para estes sistemas de IA funcionarem.

Pesquisadores da área indicam que, em breve, a quantidade de texto e imagem gerada por IAs tende a superar toda produção humana. Esse fato levanta a discussão sobre a apropriação do espaço comum (domínio público) das ideias.

Apropriação do espaço comum de ideias

Um número muito grande de obras produzidas pode exaurir a quantidade de expressões possíveis de uma ideia em um certo meio — música, por exemplo, onde já há casos de IAs, como a do Google Assistente, que reconhece amostras de uma música, trechos de até menos de um segundo.

Identificar pode significar também controlar e restringir; empresas de tecnologia já identificam e barram rapidamente a circulação de informações para defender a propriedade.

O rapper brasileiro Don L reconheceu o perigo e expressou sua opinião no Twitter: “O capitalismo vai acabar com a arte do sample. Sou totalmente contra ter que pagar por samples irreconhecíveis por um humano. Se for por essa lógica, deveria ter direito autoral pros instrumentos. Pagar pra Yamaha, Korg etc em toda música”.

Se todos os samples usados no hip hop fossem identificados, controlados e restritos, teria sido possível o nascimento do gênero musical? Quantos novos estilos literários, expressões artísticas e gêneros musicais deixariam de surgir se houvesse barreiras econômicas como essa?

Diante dessas questões, que surgem diante das dúvidas sobre como regular processos tecnológicos ainda em pleno desenvolvimento, parece ser importante discutir o uso justo.

Manter a exceção de uso justo no direito autoral pode permitir que criadores e inventores continuem a combinar conhecimentos existentes para criar novas possibilidades, como faziam antes com a câmera e o sampler. Porém, é importante considerar as consequências do colonialismo de dados caso a mineração de milhares de textos e dados necessários para o funcionamento de sistemas de Inteligência Artificial privados e fechados seja considerada uso justo.

Seria possível invocar o copyleft novamente para equilibrar a discussão, garantindo que obras geradas por Inteligência Artificial (a partir de comandos humanos) sejam licenciadas abertamente apenas para determinados usos? Seria tecnicamente possível licenciar e controlar o copyleft, dada a dificuldade de distinguir cópia e original nesse contexto e o número crescente de obras geradas?

Seria possível questionar se a obra de arte é realmente fruto apenas do espírito humano, como proposto no final de “A Cultura é Livre”. Se não for, seria hora de, assim como os povos indígenas já fazem há muito tempo, rever o antropocentrismo e dar a classificação de criadores a seres não-humanos, “artificiais” ou “naturais”?

As muitas perguntas sem resposta apenas reforçam o desafio que a popularização das IAs generativas nos apresenta ao pensar sobre o futuro da criação e da cultura livre.

Leonardo Foletto é jornalista, doutor em comunicação pela UFRGS e pesquisador na Escola de Comunicação, Mídia e Informação (ECMI) da FGV. Editor do BaixaCultura e autor do livro “A Cultura é Livre: uma história da resistência antipropriedade”, publicado pela Autonomia Literária e Fundação Rosa Luxemburgo em 2021, com prefácio de Gilberto Gil, que discute a ideia da cultura livre da Antiguidade até a internet, passando pela percepção dos ameríndios e chineses sobre a ideia de propriedade intelectual, a vasta discussão em torno da pirataria na internet, do Copyleft, Creative Commons e outros hacks no sistema do direito autoral.

Leia Também: