Claude escreve 80% do código da Anthropic e empresa alerta para riscos de autoevolução da IA
Relatório aponta aumento de 8x na produtividade e sugere pausa global coordenada para evitar perda de controle sobre sistemas recursivos.

# Claude escreve 80% do código da Anthropic e empresa alerta para riscos de autoevolução da IA
Relatório aponta aumento de 8x na produtividade e sugere pausa global coordenada para evitar perda de controle sobre sistemas recursivos.
80%. Esse é o percentual do código de produção da Anthropic escrito pelo próprio Claude em maio de 2026. O número saiu de dígitos simples para domínio quase total em pouco mais de um ano — e a autoevolução da IA, tema central do novo relatório da empresa, é o que mais preocupa seus próprios criadores.
O que aconteceu, afinal?
Um relatório publicado pelo Anthropic Institute na última quarta-feira (4) revelou dados impressionantes sobre o papel do Claude dentro da empresa.
> "Mais de 80% do código integrado à base de produção da Anthropic foi escrito pelo Claude em maio de 2026."
O documento se chama "When AI builds itself" — ou "Quando a IA se constrói", em tradução livre. Foi produzido por Marina Favaro e Jack Clark, pesquisadores do Anthropic Institute.
Segundo a fonte original do Canaltech, o crescimento aconteceu desde o lançamento do Claude Code, em fevereiro de 2025. Em cerca de 15 meses, a IA saiu de contribuições marginais para escrever a esmagadora maioria do código da empresa — um ritmo de adoção sem precedentes documentados na indústria de software.
Os números que chamam atenção
Produtividade multiplicada por 8
No segundo trimestre de 2026, os engenheiros da Anthropic entregaram oito vezes mais código por trimestre do que no período entre 2021 e 2025. Uma pesquisa interna com 130 pesquisadores mostrou que a mediana apontou produção quatro vezes maior ao usar o modelo mais recente da empresa, o Mythos Preview, comparado ao trabalho sem assistência de IA.
Esse salto de produtividade coloca a Anthropic em um patamar distinto: enquanto estudos anteriores de ferramentas como GitHub Copilot apontavam ganhos de 30% a 55% em tarefas específicas, o fator 8x reportado aqui sugere uma mudança qualitativa na forma como o software é desenvolvido.
Taxa de sucesso em tarefas complexas
Nas tarefas de engenharia mais difíceis e menos especificadas, o Claude alcançou 76% de taxa de sucesso em maio de 2026. Isso representa um aumento de 50 pontos percentuais em apenas seis meses. Para dimensionar o salto: no final de 2025, o código gerado pelo Claude era considerado "um pouco pior" que o humano. Hoje, segundo a Anthropic, já está em paridade — e deve superar o código humano ao longo de 2026.
O caso prático que impressiona
O relatório traz um exemplo concreto que ilustra bem o cenário atual de automação de engenharia de software. Uma atualização comum travou milhares de tarefas que a IA estava executando. Um engenheiro pediu ajuda ao Claude, explicou o problema em poucas palavras e deu acesso aos computadores da empresa. Em apenas duas horas, a IA encontrou uma configuração oculta que causava o erro, testou a falha e resolveu o problema. O mesmo trabalho exigiria de dois a três dias de um profissional humano. O papel do engenheiro mudou: ele se tornou supervisor, enquanto a IA executou o trabalho pesado.
De codificador a pesquisador: a fronteira que está sendo cruzada
O Claude não está apenas escrevendo código. Ele já começa a fazer trabalho de pesquisa — e é nesse ponto que o debate sobre autoevolução da IA ganha contornos mais concretos.
O experimento com agentes autônomos
Em abril de 2026, nove agentes paralelos foram colocados para trabalhar em um projeto de segurança de IA, de ponta a ponta, sem supervisão contínua. Ao longo de cerca de 800 horas acumuladas e aproximadamente US$ 18 mil em computação, os agentes recuperaram 97% da lacuna de desempenho na tarefa. Para comparação direta: dois pesquisadores humanos, trabalhando por uma semana, recuperaram apenas 23% da mesma lacuna.
Julgamento cada vez mais preciso
Outro teste mediu se o Claude seria capaz de escolher o "próximo passo" mais adequado em sessões reais de pesquisa. Em novembro de 2025, o modelo acertou o julgamento do pesquisador humano em 51% das situações — praticamente um cara ou coroa. Em abril de 2026, esse número chegou a 64%. A tendência é clara: a IA está aprendendo a replicar o raciocínio estratégico de um pesquisador, não apenas a executar tarefas isoladas.
Por que a autoevolução da IA preocupa a própria Anthropic
O ponto mais importante do relatório não é a produtividade. É o alerta sobre para onde esse caminho pode levar. O documento descreve três cenários possíveis para o futuro próximo:
- Cenário 1: A tendência desacelera, mas as capacidades atuais já reformulam a economia.
- Cenário 2: O desenvolvimento de IA se torna substancialmente automatizado enquanto humanos ainda definem a direção — empresas de 100 pessoas fariam o trabalho de organizações com 100 mil.
- Cenário 3: Os modelos atingem o autoaperfeiçoamento recursivo pleno e passam a projetar seus próprios sucessores sem intervenção humana significativa.
O que é autoaperfeiçoamento recursivo
O conceito é direto: a IA cria uma versão melhor de si mesma. Essa versão melhorada cria outra versão ainda melhor. E assim por diante, em ciclos cada vez mais rápidos. Segundo os autores do relatório, esse fenômeno ainda não foi atingido. Mas a trajetória dos últimos 15 meses — de contribuições marginais para 80% do código — mostra que a distância pode ser menor do que as instituições supõem.
O problema do desalinhamento acumulativo
Sobre o terceiro cenário, a Anthropic admite não ter "boas intuições" sobre o que aconteceria. A preocupação central é com o desalinhamento entre os objetivos humanos e os da IA. Falhas raras e controláveis hoje poderiam se acumular de geração em geração de modelos, até que o controle se torne inviável. O relatório alerta, em termos explícitos, que esse desalinhamento pode ficar "cada vez mais frequente, mas cada vez menos compreendido, até perdermos o controle".
A proposta de pausa global coordenada
Para lidar com esse risco, o relatório propõe algo sem precedentes na indústria de tecnologia: um mecanismo de pausa verificável e coordenado entre laboratórios de fronteira em diferentes países. A analogia usada pelos autores é deliberada: controle de armas nucleares.
Como funcionaria
A ideia é que múltiplos laboratórios concordariam em interromper o desenvolvimento sob as mesmas condições pré-definidas e verificariam o cumprimento uns dos outros por meio de mecanismos de inspeção mútua. A Anthropic é clara sobre um ponto: uma pausa unilateral apenas mudaria quem lidera a corrida. Só faz sentido se for coordenada globalmente.
Os obstáculos práticos
O treinamento de um modelo de IA é muito mais difícil de detectar do que testar um míssil balístico. E o incentivo para descumprir o acordo silenciosamente é enorme, especialmente em um mercado de IA para código que já movimenta dezenas de bilhões de dólares. De acordo com o relatório citado pelo Canaltech, a própria Anthropic reconhece: "Se fosse possível desacelerar o desenvolvimento dessa tecnologia para nos dar mais tempo para lidar com suas imensas implicações, acreditamos que isso provavelmente seria uma coisa boa."
O contexto que ninguém está ignorando
IPO no horizonte
Os dados apresentados são auto-reportados pela Anthropic e não foram auditados de forma independente. E o relatório foi publicado dias depois de a empresa protocolar pedido de abertura de capital, segundo o Canaltech. Isso não invalida os números, mas é um contexto que merece atenção. Empresas prestes a abrir capital têm incentivo para demonstrar capacidade técnica impressionante. Ao mesmo tempo, alertar sobre riscos existenciais pode ser uma estratégia de posicionamento como ator responsável perante reguladores e investidores institucionais.
O que isso significa para o mercado de trabalho
Se os números da Anthropic forem confirmados por auditorias independentes, as implicações são estruturais. Uma empresa onde a IA escreve 80% do código é fundamentalmente diferente de uma empresa tradicional de tecnologia. O modelo de negócios muda. A estrutura de custos muda. A necessidade de pessoal muda. E se uma empresa de 100 pessoas pode fazer o trabalho de 100 mil — como sugere o cenário 2 do relatório — o impacto no mercado de trabalho de tecnologia seria sem precedentes na história do setor.
A corrida que ninguém quer perder
O dilema da Anthropic é o dilema de toda a indústria de inteligência artificial. De um lado, a pressão competitiva é imensa. Parar significa ficar para trás. Do outro, continuar sem freios pode levar a cenários que nem os próprios criadores conseguem prever ou modelar.
O relatório "When AI builds itself" é, ao mesmo tempo, um cartão de visita e um pedido de socorro. Diz: "Olha o que conseguimos fazer." E logo em seguida: "Alguém nos ajude a controlar isso."
Segundo os dados reportados pelo Canaltech, o fenômeno do autoaperfeiçoamento recursivo ainda não foi atingido. Mas a janela para estabelecer mecanismos de governança está se fechando.
O veredito
Os números são impressionantes: 80% do código, produtividade 8x maior, 97% de recuperação em tarefas de pesquisa autônoma. Mas o dado mais importante do relatório não é um número. É uma confissão.
A Anthropic admite que não sabe o que acontece se a autoevolução da IA atingir o estágio recursivo pleno — quando modelos passam a projetar seus próprios sucessores. E propõe algo que nenhuma empresa de tecnologia costuma propor: que todo mundo pare ao mesmo tempo.
Se esse ritmo continuar, a pergunta não é se vamos precisar de uma pausa global coordenada — é se ainda vai dar tempo de apertar o botão.
Ver no Ranking SWEN.AI →
Claude, Copilot — por ELO, preço e velocidade
Fonte: Google News
Benchmark de IA
Compare GPT, Claude, Gemini e mais: preços, velocidade e benchmarks.
Aprenda na Prática
Guias de uso do Claude, API com Python, Projects e agentes autônomos.
