As Big Techs pagarão pelo roubo de conhecimentos?

É preciso rever a remuneração de conteúdos jornalísticos e científicos na web, apropriados pelos chatbots. Caminho: inibir o financiamento das fake news e dar impulso ao jornalismo sério e de profundidade — ou seja, financiar o Comum digital

Imagem: Ashley Cai / Los Angeles Times
.

Antes de entrar no assunto específico das LLMs [Modelo de linguagem grande, ou Large Language Models, na sigla em inglês, usado, entre outros, pelo ChatGPT], queria comentar sobre o que penso que é um dos principais fatores que tem levado à publicação de conteúdo de baixa qualidade na web. Nós precisamos falar sobre os incentivos financeiros que tem sido dados à publicação na web. E isso tem a ver com o mercado de publicidade digital, que se baseia na publicação de anúncios direcionados e que remunera os publicadores de conteúdos a partir do número de visualizações. Muito frequentemente a maneira encontrada para capturar a atenção, para ganhar visualizações, passa pela publicação de conteúdos sensacionalistas ou simplesmente desinformativos. No Brasil, os estímulos à produção desse tipo de conteúdo tem sido nocivo a ponto de criar ameaças à nossa democracia. Nas eleições de 2018, por exemplo, grupos de extrema direita foram hábeis em criar milhares de grupos de mensageria instantânea especializados em espalhar links para vídeos e textos publicados na web ou em plataformas que atuam sobre a web, os quais por sua vez são remunerados ou pelas plataformas ou por sistemas de publicidade digital.

Do ponto de vista do Norte Global, esse tipo de arranjo e estímulos podem parecer difícil, pouco verossímeis ou marginais. Porém, a realidade do Sul Global é de uma grande desigualdade, incluindo diferenças significativas entre o valor das moedas. Isso significa que muitos jovens, até mesmo profissionais iniciantes educados formalmente, escolhem produzir desinformação e conteúdos de má qualidade como alternativa para ganharem a vida escrevendo ou produzindo informação. Mesmo publicações alternativas, independentes, acabam seduzidas pela produção informação distorcida ou de má qualidade, pois isso significa um aumento no número de clicks e da remuneração necessária para a sobrevivência.

Com os LLMs, a perspectiva e a realidade presente é de que a facilidade para a produção desse tipo de informação de má qualidade seja aumentada. O caminho para enfrentar esse problema passa necessariamente por uma revisão da estrutura de remuneração da produção da web, já que os modelos de negócios das plataformas tem também impactado negativamente a produção cultural humana.

No âmbito do CGI.br [Comitê Gestor da Internet no Brasil], entidade da qual sou conselheiro, temos discutido alternativas legislativas para fazer com que os recursos acumulados pelas Big Tech possam ser usados de maneira a estimular a produção jornalística de qualidade, minorando os efeitos negativos do próprio modelo de negócios das plataformas. Arranjos de produção alternativos que nos permitam superar a armadilha dos estímulos nocivos que hoje são ofertados. Temos olhado com atenção as diversas propostas globais de remuneração da atividade jornalística. Essa propostas em geral se baseiam em demandas por copyright, em alegações de que as plataformas extraem lucros a partir de uso indevido de conteúdo jornalístico publicado na web. Nesse sentido, são queixas muito semelhantes a aquelas que tem sido apresentadas sobre o treinamento de sistemas de inteligência artificial.

No campo do jornalismo, a demanda por copyright nos coloca muitas dificuldades, em especial relacionadas à delimitação correta sobre o que é e o que não é conteúdo jornalístico, e por consequência o que deve ser remunerado. A não ser que se use uma medida que só beneficia as grandes empresas jornalísticas, não é possível delimitar claramente essa linha. Os produtores de conteúdos para redes sociais, quando não estão se comunicando num âmbito estritamente pessoal, frequentemente estão realizando atividades de curadoria, comentário ou apuração de informações, muito parecidas com o trabalho jornalístico.

Por isso penso que o caminho não deve passar pelo reforço de mecanismos de copyright, mas na produção de estímulos benéficos à produção de um comum que possa ser apropriado coletivamente e que seja de alta qualidade. No caso do jornalismo, isso possivelmente passa pelo estabelecimento de fundos públicos, alimentados financeiramente pelos recursos das empresas Big Tech, mas que sejam socialmente governados de forma a estimularem a produção de informações jornalísticas de qualidade. É claro que a constituição de um mecanismo desse tipo vai significar um grande conjunto de desafios, como a determinação de quais são as iniciativas jornalísticas de qualidade que merecem ser estimuladas e como protegê-las de influências políticas indevidas.

Penso que o mesmo vale com os desafios apresentados pelos LLMs. Dou um exemplo. Não sei quantos de vocês conhecem o Scielo. O Scielo é uma biblioteca digital voltada à publicação de periódicos científicos de acesso aberto. O sistema foi originalmente constituído pelo Brasil, mas hoje 16 países constituem a rede, quase todos falantes de português e espanhol. São mais de 1200 periódicos científicos totalmente abertos e acessíveis. Acessíveis inclusive aos LLMs, que se utilizam dessas informações para treinamento. Ou seja, trata-se de investimento público, do Sul Global, que é usado para o treinamento de tecnologias controladas por um conjunto pequeno de corporações.

Não me parece que o caminho seja bloquear o acesso a essas revistas científicas por parte dos sistemas de IA. Também não me parece que o caminho adequado seja a remuneração direta de cada um dos autores desses artigos científicos. Muitos deles já são remunerados por suas universidades para produzirem conhecimento de acesso público. O que me parece é que é preciso reconhecer que, por mais que esses LLMs tenham sido financiados por grandes corporações que os desenvolveram, grande parte do conhecimento que permitiu a criação desses LLMs deriva de um bem comum.

Nesse sentido, a solução de governança para esse problema não deve se ater a mecanismos de remuneração individual. Devemos buscar formas que reconheçam a natureza coletiva da produção de conhecimento e que levem ao financiamento de estruturas públicas digitais. E junto com essas infraestruturas digitais públicas, precisamos estabelecer mecanismos de governança e financiamento que garantam o cumprimento dos interesses públicos e democráticos.

Parece claro que o abismo tecnológico e financeiro entre as empresas do Norte Global e do Sul Global cria uma situação em que apenas os Estados têm uma capacidade realista de competir. A web, com sua natureza aberta e colaborativa, foi uma infraestrutura que entusiasmou a todos no início do século XXI devido às possibilidades de produzir bens culturais livres e acessíveis. No entanto, as plataformas de mídia social logo surgiram com seus jardins murados, bloqueando a interoperabilidade de conteúdo e se apropriando privadamente da produção coletiva. Os LLMs representam um novo capítulo neste desafio. Eles se apropriam não apenas do conteúdo expresso, mas também das maneiras como nos expressamos, das nossas estruturas de comunicação. Embora os LLMs indubitavelmente tragam benefícios e tenham muitos usos, levando à sua rápida adoção, quando usados no contexto de um mercado de publicidade e vigilância (capitalismo de vigilância) fracamente regulamentado formado por incentivos econômicos distorcidos, eles se tornam ferramentas para a produção adicional de conteúdo de baixa qualidade.

Leia Também:

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *