Seja bem-vindo, DeepSeek

Com inteligência, criadores da IA chinesa driblaram a força bruta dos EUA. E compartilharam o que produziram! Falta o mais difícil: criar relações sociais que tornem a tecnologia companheira, e não algoz. Mas vale aplaudir o passo dado…

.

Por Michael Roberts, no The Next Recession Blog | Tradução: Antonio Martins

Título Original:
IA rumo ao DeepSeek

Agora, todos já sabem. A DeepSeek, uma empresa chinesa de inteligência artificial (IA), lançou um modelo chamado R11, que é comparável em capacidade aos melhores modelos de empresas como OpenAI, Anthropic e Meta, mas foi treinado a um custo radicalmente mais baixo e usando chips de GPU inferiores ao estado da arte. A DeepSeek também tornou públicos detalhes suficientes do modelo para que outros possam executá-lo em seus próprios computadores sem custos.

A DeepSeek é um torpedo que atingiu abaixo da linha d’água as chamadas “Sete Magníficas” empresas de tecnologia dos EUA. A DeepSeek não usou os chips e softwares mais recentes e avançados da Nvidia; e não precisou de gastos astronômicos para treinar seu modelo de IA, ao contrário de suas concorrentes americanas; e ainda assim oferece um número semelhante de aplicações úteis.

A DeepSeek construiu seu modelo R1 com chips mais antigos e mais lentos da Nvidia, aqueles cuja exportação para a China foi permitida pelas sanções dos EUA. O governo dos EUA e os gigantes da tecnologia acreditavam ter um monopólio no desenvolvimento de IA devido aos enormes custos envolvidos na fabricação de chips melhores e modelos de IA mais avançados. Mas agora o R1 da DeepSeek sugere que empresas com menos recursos financeiros poderão, em breve, operar modelos de IA competitivos. O R1 pode ser usado com um orçamento reduzido e muito menos poder computacional. Além disso, o R1 é tão eficiente quanto seus concorrentes na “inferência”, o jargão da IA para descrever o processo em que os usuários fazem perguntas ao modelo e obtêm respostas. E ele pode rodar em servidores de diversas empresas, eliminando a necessidade de pagar preços exorbitantes para alugar infraestrutura de empresas como a OpenAI.

O mais importante é que o R1 da DeepSeek é “código aberto”, ou seja, seus métodos de codificação e treinamento estão disponíveis para que qualquer um possa copiar e desenvolver. Isso representa um golpe significativo nos segredos “proprietários” que OpenAI e o Gemini do Google mantêm em uma “caixa preta” para maximizar seus lucros. A analogia aqui é com a indústria farmacêutica, quando se compara medicamentos de marca e genéricos.

A grande questão para as empresas de IA dos EUA e seus investidores é que pode não ser necessário construir imensos centros de dados repletos de chips caríssimos para alcançar resultados suficientemente bem-sucedidos. Até agora, as empresas americanas vinham aumentando massivamente seus planos de gastos e tentando captar bilhões para esse fim. De fato, na mesma segunda-feira em que o R1 da DeepSeek foi anunciado, a Meta revelou um novo investimento de US$ 65 bilhões, e poucos dias antes, o presidente Trump anunciou subsídios governamentais de US$ 500 bilhões para os gigantes da tecnologia como parte do chamado projeto Stargate. Ironicamente, o CEO da Meta, Mark Zuckerberg, disse que estava investindo porque “Queremos que os EUA definam o padrão global de IA, e não a China.” Oh, querido...

Agora, os investidores estão preocupados de que esses gastos sejam desnecessários e, mais do que isso, que afetem a lucratividade das empresas americanas, caso a DeepSeek consiga oferecer aplicações de IA a um décimo do custo. Cinco das maiores ações de tecnologia focadas em IA — a fabricante de chips Nvidia e os chamados “hiperescalares” Alphabet, Amazon, Microsoft e Meta Platforms — perderam coletivamente quase US$ 750 bilhões em valor de mercado em um único dia. Além disso, a DeepSeek ameaça os lucros das empresas de data centers e das operadoras de água e energia que esperavam se beneficiar da grande ‘expansão’ promovida pelas Sete Magníficas. O boom do mercado de ações dos EUA está fortemente concentrado nessas empresas.

Então, a DeepSeek estourou a bolha gigantesca do mercado de ações das empresas de tecnologia nos EUA? O investidor bilionário Ray Dalio acredita que sim. Ele disse ao Financial Times que “os preços atingiram níveis muito altos ao mesmo tempo em que há um risco de taxa de juros, e essa combinação pode estourar a bolha… O ponto em que estamos no ciclo agora é muito semelhante ao que vimos entre 1998 e 1999”, afirmou Dalio. “Em outras palavras, há uma nova tecnologia importante que certamente mudará o mundo e será bem-sucedida. Mas algumas pessoas estão confundindo isso com o sucesso dos investimentos.”

Mas isso pode não ser o caso, pelo menos ainda. O preço das ações da Nvidia, empresa de chips para IA, pode ter despencado esta semana, mas sua linguagem de codificação “proprietária”, Cuda, ainda é o padrão da indústria nos EUA. Embora suas ações tenham caído quase 17%, isso apenas as trouxe de volta ao (muito, muito alto) nível de setembro.

Muito dependerá de outros fatores, como o Federal Reserve dos EUA manter as taxas de juros elevadas devido a uma reversão na queda da inflação e se Trump realmente levará adiante suas ameaças de tarifas e restrições à imigração, o que apenas alimentaria ainda mais a inflação.

O que deve enfurecer os oligarcas da tecnologia que bajulam Trump é o fato de que as sanções dos EUA contra empresas chinesas e as proibições de exportação de chips não impediram a China de continuar avançando na guerra tecnológica e de semicondutores contra os EUA. A China está conseguindo dar saltos tecnológicos na IA, apesar dos controles de exportação introduzidos pelo governo Biden para privá-la tanto dos chips mais poderosos quanto das ferramentas avançadas necessárias para fabricá-los.

A gigante chinesa da tecnologia Huawei emergiu como a principal concorrente da Nvidia na China para chips de ‘inferência’. E ela tem trabalhado com empresas de IA, incluindo a DeepSeek, para adaptar modelos treinados em GPUs da Nvidia para rodar inferência em seus chips Ascend. “A Huawei está melhorando. Eles têm uma vantagem porque o governo está instruindo as grandes empresas de tecnologia a comprarem seus chips e usá-los para inferência”, disse um investidor do setor de semicondutores em Pequim.

Isso demonstra ainda mais que o investimento planejado e liderado pelo Estado na tecnologia e no desenvolvimento de habilidades técnicas pela China funciona muito melhor do que depender de gigantes privadas da tecnologia comandadas por magnatas. Como disse Ray Dalio: “No nosso sistema, de modo geral, estamos caminhando para uma política mais voltada para o complexo industrial, na qual haverá atividade influenciada e comandada pelo Estado, porque isso é tão importante… O capitalismo por si só — o simples motivo do lucro — não pode vencer essa batalha.”

No entanto, os gigantes da IA ainda não estão afundando como o Titanic. Eles continuam expandindo suas operações, despejando cada vez mais bilhões em data centers e chips mais avançados. Isso consome poder computacional de forma exponencial.

E, claro, não há consideração sobre o que os economistas tradicionais gostam de chamar educadamente de ‘externalidades’. De acordo com um relatório do Goldman Sachs, uma consulta ao ChatGPT consome quase 10 vezes mais eletricidade do que uma pesquisa no Google. O pesquisador Jesse Dodge fez alguns cálculos rápidos sobre o consumo de energia dos chatbots de IA. “Uma consulta ao ChatGPT usa aproximadamente tanta eletricidade quanto a necessária para acender uma lâmpada por cerca de 20 minutos”, diz ele. “Então, imagine milhões de pessoas usando algo assim todos os dias – isso se traduz em uma quantidade realmente enorme de eletricidade.” Mais consumo de eletricidade significa mais produção de energia e, em particular, mais emissões de gases de efeito estufa derivados de combustíveis fósseis.

O Google tem como meta atingir emissões líquidas zero até 2030. Desde 2007, a empresa afirma que suas operações são neutras em carbono devido à compra de créditos de carbono para compensar suas emissões. No entanto, a partir de 2023, o Google reconheceu em seus relatórios de sustentabilidade que não estava mais “mantendo a neutralidade operacional de carbono”. A empresa ainda afirma que está se esforçando para alcançar sua meta de emissões zero até 2030. “A verdadeira motivação do Google aqui é construir os melhores sistemas de IA que puderem”, diz Dodge. “E eles estão dispostos a despejar uma enorme quantidade de recursos nisso, incluindo o treinamento de sistemas de IA em data centers cada vez maiores, chegando até supercomputadores, o que gera um consumo tremendo de eletricidade e, consequentemente, emissões de CO₂.”

E há também a questão da água. Enquanto os EUA enfrentam secas e incêndios florestais, as empresas de IA estão consumindo grandes quantidades de água para ‘resfriar’ seus mega data centers e proteger os chips. Mais do que isso, as empresas do Vale do Silício estão cada vez mais assumindo o controle da infraestrutura de abastecimento de água para atender às suas necessidades. Pesquisas sugerem, por exemplo, que cerca de 700.000 litros de água podem ter sido usados para resfriar as máquinas que treinaram o ChatGPT-3 nas instalações da Microsoft.

O treinamento de modelos de IA consome 6.000 vezes mais energia do que uma cidade europeia. Além disso, embora minerais como lítio e cobalto sejam mais comumente associados às baterias do setor automotivo, eles também são cruciais para as baterias usadas em data centers. O processo de extração desses minerais frequentemente envolve um uso significativo de água e pode levar à poluição, comprometendo a segurança hídrica.

Sam Altman, que antes era visto como o herói desinteressado de lucros da OpenAI, mas que agora busca maximizar os ganhos da Microsoft, argumenta que, sim, infelizmente existem “trocas” no curto prazo, mas que são necessárias para alcançar a chamada AGI; e que a AGI então nos ajudará a resolver todos esses problemas, tornando as ‘externalidades’ um sacrifício válido.

AGI? O que é isso? Inteligência Artificial Geral (AGI) é o santo graal dos desenvolvedores de IA. Significa que os modelos de IA se tornariam ‘superinteligentes’, muito além da inteligência humana. Quando isso for alcançado, Altman promete que sua IA não apenas será capaz de realizar o trabalho de um único trabalhador, mas de todos eles: “A IA pode fazer o trabalho de uma organização inteira.” Isso seria o auge da maximização do lucro, eliminando a necessidade de trabalhadores nas empresas (inclusive nas empresas de IA?), à medida que as máquinas de IA assumiriam a operação, o desenvolvimento e o marketing de tudo. Esse é o sonho apocalíptico do capital (mas um pesadelo para o trabalho: sem empregos, sem renda).

É por isso que Altman e os outros magnatas da IA não vão parar de expandir seus data centers e desenvolver chips ainda mais avançados só porque a DeepSeek conseguiu reduzir os custos de seus modelos atuais. A empresa de pesquisa Rosenblatt previu a resposta dos gigantes da tecnologia: “No geral, esperamos que a tendência seja voltada para a melhoria das capacidades, acelerando em direção à inteligência artificial geral, mais do que para a redução de gastos.” Nada pode impedir o objetivo de alcançar uma IA superinteligente.

Alguns veem a corrida para alcançar a AGI como uma ameaça à própria humanidade. Stuart Russell, professor de ciência da computação na Universidade da Califórnia, em Berkeley, afirmou: “Mesmo os CEOs que estão participando dessa corrida já declararam que quem vencer tem uma probabilidade significativa de causar a extinção da humanidade no processo, porque não temos ideia de como controlar sistemas mais inteligentes do que nós mesmos.” Em outras palavras, a corrida pela AGI é uma corrida rumo ao precipício.

Talvez, mas continuo duvidando que a ‘inteligência’ humana possa ser substituída pela inteligência das máquinas, principalmente porque elas são diferentes. As máquinas não podem conceber mudanças potenciais e qualitativas. O novo conhecimento surge dessas transformações (humanas), e não da simples ampliação do conhecimento existente (máquinas). Apenas a inteligência humana é social e pode perceber o potencial para mudanças, especialmente mudanças sociais, que levam a uma vida melhor para a humanidade e para a natureza.

O que o surgimento da DeepSeek demonstrou é que a IA pode ser desenvolvida em um nível que realmente ajude a humanidade e suas necessidades sociais. Ela é gratuita, aberta e acessível até para os menores usuários e desenvolvedores. Não foi desenvolvida para obter lucro ou gerar lucro. Como disse um comentarista: “Quero que a IA lave minha roupa e meus pratos para que eu possa fazer arte e escrever, e não que a IA faça minha arte e minha escrita para que eu possa lavar minha roupa e meus pratos…”

Os gestores estão introduzindo a IA para “facilitar os problemas de gerenciamento às custas de áreas onde muitas pessoas acham que a IA não deveria ser usada, como o trabalho criativo… Se a IA vai funcionar, ela precisa surgir de baixo para cima, ou será inútil para a grande maioria das pessoas no local de trabalho.”

Em vez de desenvolver a IA para gerar lucros, reduzir empregos e prejudicar os meios de subsistência das pessoas, uma IA sob propriedade comum e planejamento poderia reduzir as horas de trabalho humano para todos e libertar os seres humanos do trabalho exaustivo, permitindo que se concentrem em atividades criativas que apenas a inteligência humana pode oferecer. Lembre-se de que o Santo Graal foi uma ficção vitoriana – e, mais tarde, uma ficção de Dan Brown também.

1Na verdade, foram três, os lançamentos da DeepSeek: o V3, já disponível para o público mais amplo; o Coder, para programadores; e o R1, um tipo mais avançado de IA “raciocinante” (reasoning), capaz de receber pedidos complexos, dividi-lo autonomamente em subtarefas menores e executá-las. Este está em desenvolvimento final (Nota do tradutor)

Leia Também:

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *