O que a história da fotografia diz sobre o ChatGPT?
Há duas similaridades entre supostos “automatismos”. Após temores iniciais, aceita-se a ideia de domínio mental sobre a tecnologia. E, na esfera produtiva, a exploração do Sul: da prata para revelar filmes às terras raras e ao trabalho insano dos rotuladores de hoje
Publicado 22/10/2024 às 15:52
A popularização dos aplicativos que têm sido descritos como “IA generativa”, ocorrida há cerca de dois anos, deu origem a colocações tanto otimistas quanto catastróficas. No primeiro caso, houve quem dissesse que a automação do trabalho possibilitada por essas ferramentas teria o potencial de nos conferir mais tempo para nos dedicarmos a atividades de lazer, ao convívio com pessoas queridas, entre outras benesses que pintam um idílio improvável para dizer o mínimo. No segundo, notamos as preocupações de profissionais que viram seus trabalhos ameaçados,1 assim como os receios de que as criações produzidas por meio dessas tecnologias causassem um impacto negativo nas funções que as imagens desempenham na sociedade.2
O ponto que une essas duas perspectivas reside na ideia de automação, algo que, no caso da IA generativa, se apresenta sob uma forma especialmente convincente: o que seriam as imagens que aparecem após submetermos poucas linhas de texto — o prompt — senão uma construção tecnológica autônoma? Essa sensação se aprofunda na medida em que o volume de dados e a velocidade de seu processamento ultrapassam os limites de nossa cognição,3 fazendo com que o funcionamento dessas tecnologias não possa ser compreendido plenamente. Frente a esse enigma, só podemos concluir que as imagens foram elaboradas de forma automática, constituindo um novo paradigma tecnológico. Mas tudo o que é novo é apenas esquecimento.4 A divulgação da IA generativa e seus dilemas ecoa os tempos em que uma outra tecnologia se estabelecia, reorganizando as atividades atreladas à cultura visual no capitalismo: a fotografia.
Em seus primórdios, era comum pensar que a foto dispensasse a agência humana. Essa ideia está plenamente formulada no título do primeiro livro ilustrado fotograficamente, publicado e comercializado na Inglaterra entre 1844 e 1846: o Lápis da Natureza, de William Fox Talbot. Se, de acordo com o título do livro, quem utiliza o lápis é a natureza, devemos concluir que restaria à pessoa que fotografa tão somente a escolha por direcionar a câmera ao assunto que gostaria de capturar. Segundo essa premissa, bastante recorrente nos primeiros anos do advento da fotografia, o ato de criação da imagem ocorreria automaticamente, constituindo-se como um espelho do real (ou um “espelho com memória” como disse Oliver Wendell Holmes no texto clássico The Stereoscope and the Stereograph, de 1859)5.
Em outro enunciado dessa mesma época, o ilustrador francês Henri-Gérard Fontallard propõe o título sugestivo “Os daguerreoflautistas6, ou o talento vem do sono” para uma gravura que publicou em 1840.7 A imagem, criada no ano seguinte à divulgação do daguerreótipo — primeira técnica fotográfica comercialmente disponível —, mostra um fotógrafo cochilando enquanto sua câmera captura uma paisagem parisiense.
Segundo a gravura de Fontallard, ao contrário do artista, que laboriosamente imprime seu gênio na imagem por meio de seus traços e pinceladas, o fotógrafo carece desse gesto ativo. Sublinhando essa suposta limitação em um tom moralista, Fontallard desenha uma garrafa de vinho dentro do chapéu do fotógrafo sugerindo que, ao contrário do gravurista que honesta e esforçadamente desenha suas figuras — ele próprio, no caso —, o fotógrafo se abandona, embriagado, à preguiça.
Como Fontallard provavelmente temia, diversas atividades relacionadas às artes daqueles tempos, como a pintura de retratos em miniatura, tornaram-se obsoletas por conta do advento da fotografia, conforme mencionou Walter Benjamin em seu famoso ensaio Pequena história da fotografia.8 Mas talvez a transformação social mais contundente que a divulgação da fotografia ocasionou não foi a conversão de pintores em fotógrafos, mas a modificação de agricultores, ou mesmo de pessoas que viviam em comunidades tradicionais, por exemplo, em mão de obra de mineradoras. As demandas cada vez mais volumosas por materiais vinculados a essas novas tecnologias de imagem, como a prata, exerceram impactos profundos nos territórios e populações que estiveram envolvidos na obtenção dessas matérias primas.
Segundo a pesquisadora Siobhan Angus, na década de 1930, 42% de toda a prata extraída mundialmente vinha do México.9 A autora comenta que, com o crescimento da escala da produção de materiais fotográficos baseados em prata, realidades materiais como a dimensão laboral relacionada a essa produção tornam-se menos visíveis, uma vez que adquirem características abstratas, vinculadas a seu status como commoditie.10 Essa característica se aprofunda em decorrência do histórico da prata que, até a década de 1870, estava relacionada ao sistema monetário bimetálico, o que corrobora a abstração desse material, sua leitura como valor de troca e a correspondente invisibilização do trabalho necessário para sua extração.
Ao mesmo tempo, a partir do fim do século XIX, e com maior intensidade ao longo do século XX, as artes trataram de incluir a fotografia em seu campo discursivo, transpondo, não sem alguma dificuldade, as premissas do regime estético a essa mídia, o que demandou rever o argumento do automatismo fotográfico. Isso foi possível a partir da ideia de que a pessoa artista exerceria um domínio mental sobre a câmera, esse instrumento que seria capaz de conciliar a criatividade subjetiva a um processo cientificamente guiado, conforme propõe Allan Sekula.11
Em paralelo ao contexto das belas artes, a popularização da fotografia ocorreu sob o signo da automação. Em 1888, a Kodak lança o slogan “você aperta o botão, nós fazemos o resto”, oferecendo um serviço que desobriga quem fotografa de se envolver com as operações de laboratório inerentes a essa mídia no período. O modelo de negócios da Kodak modificou a cultura visual em termos globais: a clientela comprava os negativos, batia suas fotos e em seguida enviava o rolo à empresa. No complexo fabril da Kodak, laboratoristas revelavam o negativo, faziam ampliações de todas as imagens e depois as remetiam a quem tivesse batido as fotografias.
Voltando ao slogan da Kodak, é curioso notar que a automação das etapas vinculadas à criação da imagem no laboratório apareça por meio de um pronome, esse “nós” que, silenciosamente, faz “o resto”, ou seja, produz a imagem “automaticamente”. Não é difícil conceber esse “nós”. Basta imaginarmos o cotidiano de laboratoristas que revelavam os filmes e em seguida faziam ampliações de rostos anônimos que, debaixo da luz vermelha, apareciam sob a superfície do papel fotográfico. Além dessas pessoas, considerando as cadeias de abastecimento cada vez mais complexas que a indústria fotográfica previu ao longo de sua história, esse “nós” inclui milhares de trabalhadores responsáveis por extrair os metais das profundezas da terra: se ontem era a prata, hoje, são as terras raras que permitem o funcionamento de sensores digitais, ou o lítio, que viabiliza as baterias necessárias para qualquer aparelho eletrônico.
Transpondo esse raciocínio para a IA generativa, torna-se mais difícil conceber as formas de trabalho das quais a operação “automática” de softwares como o Dall-E, ou o Midjourney, dependem. Um exemplo oportuno vem da OpenAI, big tech que desenvolveu o ChatGPT e o Dall-E. Segundo uma reportagem da Time,12 em 2021, a empresa contratou uma companhia especializada em tratamento de dados para algoritmos de inteligência artificial denominada Sama. O contrato entre as duas empresas tinha como objetivo o desenvolvimento de um sistema de segurança capaz de identificar discursos de ódio, termos ofensivos, entre outras manifestações que fariam com que os softwares de inteligência artificial generativa da OpenAI produzissem conteúdos indesejados.
Para tanto, foi necessário o trabalho de diversas pessoas que rotularam grandes volumes de textos e imagens, treinando os algoritmos e conferindo-lhes a capacidade de identificar construções semânticas tóxicas e evitá-las em suas produções. Essa mão de obra foi terceirizada: embora a Sama tenha sede em São Francisco, EUA, para realizar a catalogação e análise de textos e imagens, a empresa recorreu a trabalhadoras e trabalhadores quenianos, pagando-lhes menos de dois dólares por hora.
Para além da exploração inerente a essa relação trabalhista, a colaboração entre a Sama e a OpenAI ocorreu sob condições desumanas para quem trabalhou no projeto. Uma dessas pessoas foi entrevistada pela Time e relatou que seu trabalho exigia a exposição a conteúdos perturbadores, como abusos sexuais, violência, entre outros enunciados que causaram um impacto severo em sua saúde mental. Esses casos foram tão numerosos que em fevereiro de 2022, oito meses antes do planejado, a Sama resolveu cancelar seu contrato com a OpenAI.
Esse caso revela a distribuição racializada do trabalho árduo de moderação. Segundo o pesquisador Tarcízio Silva:
“Enquanto profissionais nos centros de poder da tecnologia, como o Vale do Silício, definem as regras de moderação objetivando a lucratividade e a fuga de implicações legais, são profissionais precarizados de países do Sul global que efetivamente veem os conteúdos violentos e perturbadores […] Plataformas do Vale do Silício terceirizam o trabalho de moderação para empresas localizadas em países […] onde a regulação trabalhista é mínima e mesmo a população poliglota com literacia digital para executar o trabalho recebe valores pífios se comparados ao que recebem profissionais de nível similar nos Estados Unidos ou na Europa. Há relatos de acordos que assinalam o pagamento de 0,0025 de dólar por imagem analisada, o que significa um centavo de dólar a cada quatro imagens, frequentemente perturbadoras. O número total de moderadores terceirizados não é plenamente conhecido, mas chega a dezenas de milhares em plataformas como o Facebook.”13
Somam-se a essas atividades outras formas laborais implícitas às tecnologias digitais que sequer são vistas como trabalho. Interações como likes, comentários, avaliações, entre outras práticas inerentes ao uso das redes sociais compõem um sistema de trabalho que, sob os termos da economia da atenção, extrai valor e se infiltra em esferas sociais até então livres da lógica comercial. Segundo a pesquisadora Nahema Nascimento Falleiros14, essas interações entre computadores e humanos são vistas cada vez mais como singularizadas e socialmente invisibilizadas, sendo percebidas somente como a provisão de um serviço, em oposição às relações clássicas entre empregadora e empregada.
Considerando as aproximações entre fotografia e IA generativa que procurei traçar, levando em conta o modo como a própria fotografia se converte em matéria prima informacional que viabiliza os processos de aprendizado de máquina, podemos perceber dois processos de invisibilização complementares. No caso da fotografia, as diversas técnicas que compõem sua história sempre dependeram da transformação da matéria mineral em imagem. Seja os grãos de prata, seja os lantanídeos que estão nas telas de celulares e computadores, a cultura visual fotográfica depende da metamorfose da matéria-prima em imagem.
Ao operar essa conversão, a imagem fotográfica esconde a matéria-prima e as diversas formas de trabalho necessárias para sua extração sob as formas que produz em papel, em película ou em bits digitais. A IA generativa leva essa transformação mais além. Converte milhões de imagens em pontos capazes de formarem outras imagens a partir do trabalho efetuado por milhares de trabalhadores e trabalhadoras ao redor do mundo, cujas fisionomias são tão difíceis de divisar quanto as próprias imagens que tiveram que ver e rotular, as quais permitem a elaboração de outras imagens, que aparecem, como num passe de mágica, nas telas que nos enquadram. Com a sobreposição entre essas operações, testemunhamos a aceleração inerente à lógica capitalista, cujos fluxos cada vez mais intensos e volumosos de informação não são outra coisa senão as cifras de um desastre que assistimos acontecer a cada segundo, em cada imagem do mundo que vemos e tocamos com as pontas dos dedos.
Notas:
1 https://hyperallergic.com/806026/digital-artists-are-pushing-back-against-ai/#:~:text=Using%20the%20hashtag%20%E2%80%9CNo%20to,work%20without%20permission%20or%20compensation. (acesso em 01/10/2024)
2 https://www.nbcnews.com/tech/tech-news/ai-image-misinformation-surged-google-research-finds-rcna154333
3 https://www.wired.com/story/our-machines-now-have-knowledge-well-never-understand/ (acesso em 03/10/2024).
4 A afirmação é de Francis Bacon e abre o conto El inmortal, de Jorge Luiz Borges: https://www.ingenieria.unam.mx/dcsyhfi/material_didactico/Literatura_Hispanoamericana_Contemporanea/Autores_B/BORGES/inmortal.pdf (acesso em 14/10/2024).
5 https://www.theatlantic.com/magazine/archive/1859/06/the-stereoscope-and-the-stereograph/303361/ (acesso em 07/10/2024)
6 O título propõe um trocadilho, transformando o termo “daguerréotypistes”, “daguerreotipistas” em “daguerreopipeurs”, adicionando o termo “pipeurs”, “flautistas”. A tradução que proponho visa preservar o sentido do título original.
7 https://www.si.edu/object/les-daguerreopipeurs-ou-le-talent-vient-en-dormant:nmah_1822209 (acesso em 01/10/2024).
8 “No momento em que Daguerre conseguiu fixar as imagens da câmera obscura, os técnicos substituíram, nesse ponto, os pintores. Mas a verdadeira vítima da fotografia não foi a pintura de paisagem, e sim o retrato em miniatura. A evolução foi tão rápida que por volta de 1840 a maioria dos pintores de miniaturas se transformaram em fotógrafos, a princípio de forma esporádica e pouco depois exclusivamente.” (BENJAMIN, Walter. Magia e Técnica, arte e política. Trad. Sergio Paulo Rouanet. São Paulo: Brasiliense, 1994, p. 97)
9 ANGUS, Siobhan. Camera Geologica: an Elemental History of Photography. Durham, London: Duke University Press, 2024. p. 92.
10 Ibid., p. 69.
11 SEKULA, Allan. O tráfego nas fotografias. Trad. André Leite Coelho. ARS (São Paulo), v. 22, n. 50, 2024. p. 8-9. Disponível em: https://revistas.usp.br/ars/article/view/207005/208470 (acesso em 14/10/2024).
12 https://time.com/6247678/openai-chatgpt-kenya-workers/ (acesso em 03/10/2024).
13 SILVA, Tacízio. Racismo algorítmico: inteligência artificial e discriminação nas redes digitais. São Paulo: Edições Sesc São Paulo, 2022, p. 51.
14 NASCIMENTO FALLEIROS, Nahema. Quando o home office é privilégio da servitude: por uma morfologia do trabalho digital na nova indústria da inteligência artificial. Revista Eletrônica Internacional de Economia Política da Informação da Comunicação e da Cultura, São Cristovão, v. 26, n. 2, p. 140–156, 2024, p. 144. Disponível em: https://periodicos.ufs.br/eptic/article/view/20832/16161 (acesso em 17/10/2024).