Gigantes da tecnologia recuam em gastos com IA devido à explosão de custos

US$ 1,3 milhão. Esse foi o gasto de apenas três pessoas em um único mês rodando ferramentas de inteligência artificial agêntica.

O dado assustador faz parte de um movimento que está tirando o sono de diretores financeiros no Vale do Silício.

As gigantes da tecnologia começaram a puxar o freio de mão nos investimentos em IA devido à explosão incontrolável de custos.

O pesadelo financeiro da Uber

> "A companhia esgotou todo o orçamento anual de 2026 destinado ao Claude Code ainda em abril."

O caso da Uber se tornou o maior símbolo desse descontrole orçamentário recente no setor de tecnologia.

Praveen Neppalli Naga, CTO da empresa, revelou que o orçamento planejado para durar anos evaporou em apenas quatro meses.

A ferramenta em questão é o Claude Code, um assistente de programação de elite desenvolvido pela Anthropic.

Onde o dinheiro sumiu

Os números internos da empresa mostram uma adoção massiva, mas com um custo colateral imenso:

Adoção: Mais de 80% dos engenheiros da Uber já utilizavam IA agêntica.

Volume: Cerca de 60% de todo o código da empresa era gerado por máquinas.

Retorno: A produtividade em volume subiu, mas a qualidade e novas funções não acompanharam.

Andrew Macdonald, COO da Uber, admitiu em entrevista que é difícil ligar esse volume de código a melhorias reais para o usuário final.

CEO da Uber, Dara Khosrowshahi (Fonte: Reprodução/Uber)

Por que a IA agêntica é um "buraco negro" de dinheiro

Para entender o prejuízo, precisamos diferenciar a IA comum da IA agêntica, que é o foco atual das empresas.

Um chatbot comum funciona de forma linear: você faz uma pergunta e ele entrega uma resposta direta.

Já os agentes autônomos funcionam em loops de raciocínio, executando sequências complexas de tarefas sem supervisão humana constante.

Segundo relatório do Goldman Sachs, essa autonomia tem um preço técnico extremamente elevado para as empresas.

A matemática dos tokens

Confira por que a conta não fecha no modelo atual:

Consumo: Agentes podem gastar 1.000 vezes mais tokens que uma interação padrão.

Projeção: O uso agêntico deve elevar o consumo global de tokens em 24 vezes nos próximos anos.

Custo fixo: Cada loop de "pensamento" da IA gera novas requisições pagas às fornecedoras de modelos.

De acordo com a fonte original, esse cenário está forçando uma revisão estratégica imediata.

Microsoft recua e restringe acessos

A Microsoft não ficou imune ao susto financeiro e já começou a mudar suas regras internas de uso.

A empresa começou a revogar o acesso de seus próprios desenvolvedores ao Claude Code no início de maio.

A meta é migrar todos os times para o Copilot CLI, uma ferramenta interna, até o fim de junho.

Manobra fiscal ou técnica?

Analistas do mercado apontam que a mudança coincide com o fechamento do ano fiscal da gigante de Redmond.

Além de restringir o acesso, a Microsoft alterou a forma de cobrança do GitHub Copilot para um modelo baseado em tokens.

Isso aconteceu após os custos operacionais da ferramenta dispararem de forma insustentável no primeiro trimestre deste ano.

O paradoxo do hardware e a Nvidia

> "Eu ficaria preocupado se um engenheiro de US$ 500 mil não gastasse US$ 250 mil em tokens por ano."

A frase acima é de Jensen Huang, CEO da Nvidia, que defende o gasto agressivo como sinal de eficiência.

Empresas como Airbnb e Chime seguem essa cartilha, com mais de 60% de seus códigos gerados por inteligência artificial.

No entanto, o ganho de eficiência do hardware ainda não consegue alcançar a velocidade da explosão de gastos.

A IA agêntica exige um processamento muito superior aos modelos tradicionais (Fonte: Gerada por IA)

A promessa da plataforma Vera Rubin

A Nvidia planeja lançar uma nova arquitetura em 2025 para tentar resolver o gargalo:

Desempenho: Promete ser até 10 vezes superior por watt consumido.
Eficiência: Foco total em reduzir o custo de inferência para modelos agênticos.
Disponibilidade: O hardware deve chegar ao mercado apenas no final do próximo ano.

O problema é que Google, Oracle e Microsoft decidiram manter seus servidores atuais por pelo menos seis anos.

Isso significa que a eficiência prometida pela Nvidia vai demorar para aliviar o caixa dessas companhias.

O impacto real na produtividade e no emprego

O descompasso entre o que se gasta e o que se lucra com IA está gerando consequências severas no mercado de trabalho.

Embora a IA produza mais código, ela não necessariamente resolve problemas de negócio de forma mais rápida.

Como resultado, as empresas estão buscando a "eficiência operacional" através de cortes profundos em suas estruturas.

A Meta, por exemplo, iniciou a demissão de 8 mil funcionários mesmo após registrar lucros recordes recentemente.

Essa reorganização é uma resposta direta à necessidade de equilibrar as contas após investimentos massivos em processamento.

De acordo com pesquisas de mercado citadas pelo Canaltech, quase todos os líderes esperam mudanças estruturais nas equipes.

O veredito: Vale a pena continuar?

A fase da "IA por empolgação" parece ter chegado ao fim para as grandes corporações de tecnologia.

Agora, o foco mudou para a sustentabilidade financeira e o retorno real sobre cada token processado.

O mercado percebeu que produzir 60% mais código não significa entregar um produto 60% melhor para o cliente.

A conta chegou, e ela é muito mais cara do que os diretores de tecnologia previram no ano passado.

Qual será a próxima gigante a admitir que o orçamento da década acabou em poucos meses?