O leaderboard de frontend da Code Arena para modelos que utilizam entradas visuais em codificação agentic mudou rapidamente. Metade dos 10 melhores é nova este mês, com Claude liderando e as entradas mais antigas da OpenAI e Gemini não figurando mais entre os 10 melhores.
- Claude da @AnthropicAI agora ocupa todas as cinco primeiras posições. Opus 4.7 Thinking entra em #1, cerca de 30 pontos à frente de Sonnet 4.6, enquanto Opus 4.7 também ocupa a #3.
- Os modelos Claude 4.6 melhoraram em pontuação, mas perderam posições devido aos novos modelos 4.7 que elevaram o teto.
- Entradas mais antigas GPT-5.4 e GPT-5.3 Codex da @OpenAI não estão mais no topo, enquanto GPT-5.5 entra em #6 e #8.
- Gemini da @GoogleDeepMind permanece no top 10, mas foi rebaixado: Gemini-3.1 Pro caiu para #7, Gemini-3 Pro para #10, e Gemini-3 Flash saiu do ranking.
- Qwen-3.6 Plus da @Alibaba_Qwen entra em #9, adicionando outro novo provedor ao top 10 atualizado.