Ranking de IA 2026 — análise independente de 500+ modelos com 13 benchmarks

Análise independente de IA

Ranking de IA 2026

O ranking das melhores IAs de 2026 e o mais completo em português, com 582 LLMs ativos comparados em 13 benchmarks oficiais (GPQA, MMLU-Pro, AIME, HLE, LiveCodeBench, SciCode, IFBench, AA-LCR, Terminal-Bench e Tau²) — ou seja, raciocínio, matemática, programação, velocidade e custo — além de métricas de latência e preço por token. Use este ranking para encontrar as melhores IAs de 2026 por categoria.

Luis Fernando RoquetteLuis Fernando Roquette · SWEN.AI · metodologia descrita ao fim da página · última atualização: 30 de jun. de 2026

Fonte: Artificial AnalysisVer como tabela →

Qual usar agora

Mais inteligentes

Top 10 · AA Intelligence Index

Mais rápidos

Top 10 · Output tokens/segundo

Mais baratos

Top 10 · USD / 1M tokens input

Intelligence Index

Ranking pelo score composto da Artificial Analysis (0–100). Top 30 modelos do benchmark.

Intelligence Index

Evolução da inteligência

Progressão diária do Intelligence Index para os top 8 modelos.

31 pontos · 30d janela
26374858692026-05-312026-06-30Claude Fable 5 (Adaptive Reasoning, Max Effort, Opus 4.8 Fallback) · 2026-06-10 · 64.9Claude Fable 5 (Adaptive Reasoning, Max Effort, Opus 4.8 Fallback) · 2026-06-11 · 64.9Claude Fable 5 (Adaptive Reasoning, Max Effort, Opus 4.8 Fallback) · 2026-06-12 · 64.9Claude Fable 5 (Adaptive Reasoning, Max Effort, Opus 4.8 Fallback) · 2026-06-13 · 64.9Claude Fable 5 (Adaptive Reasoning, Max Effort, Opus 4.8 Fallback) · 2026-06-14 · 64.9Claude Fable 5 (Adaptive Reasoning, Max Effort, Opus 4.8 Fallback) · 2026-06-15 · 64.9Claude Fable 5 (Adaptive Reasoning, Max Effort, Opus 4.8 Fallback) · 2026-06-16 · 59.9Claude Fable 5 (Adaptive Reasoning, Max Effort, Opus 4.8 Fallback) · 2026-06-17 · 59.9Claude Fable 5 (Adaptive Reasoning, Max Effort, Opus 4.8 Fallback) · 2026-06-18 · 59.9Claude Fable 5 (Adaptive Reasoning, Max Effort, Opus 4.8 Fallback) · 2026-06-19 · 59.9Claude Fable 5 (Adaptive Reasoning, Max Effort, Opus 4.8 Fallback) · 2026-06-20 · 59.9Claude Fable 5 (Adaptive Reasoning, Max Effort, Opus 4.8 Fallback) · 2026-06-21 · 59.9Claude Fable 5 (Adaptive Reasoning, Max Effort, Opus 4.8 Fallback) · 2026-06-22 · 59.9Claude Fable 5 (Adaptive Reasoning, Max Effort, Opus 4.8 Fallback) · 2026-06-23 · 59.9Claude Fable 5 (Adaptive Reasoning, Max Effort, Opus 4.8 Fallback) · 2026-06-24 · 59.9Claude Fable 5 (Adaptive Reasoning, Max Effort, Opus 4.8 Fallback) · 2026-06-25 · 59.9Claude Fable 5 (Adaptive Reasoning, Max Effort, Opus 4.8 Fallback) · 2026-06-26 · 59.9Claude Fable 5 (Adaptive Reasoning, Max Effort, Opus 4.8 Fallback) · 2026-06-27 · 59.9Claude Fable 5 (Adaptive Reasoning, Max Effort, Opus 4.8 Fallback) · 2026-06-28 · 59.9Claude Fable 5 (Adaptive Reasoning, Max Effort, Opus 4.8 Fallback) · 2026-06-29 · 59.9Claude Fable 5 (Adaptive Reasoning, Max Effort, Opus 4.8 Fallback) · 2026-06-30 · 59.9Claude Opus 4.8 (Adaptive Reasoning, Max Effort) · 2026-05-31 · 61.4Claude Opus 4.8 (Adaptive Reasoning, Max Effort) · 2026-06-01 · 61.4Claude Opus 4.8 (Adaptive Reasoning, Max Effort) · 2026-06-02 · 61.4Claude Opus 4.8 (Adaptive Reasoning, Max Effort) · 2026-06-03 · 61.4Claude Opus 4.8 (Adaptive Reasoning, Max Effort) · 2026-06-04 · 61.4Claude Opus 4.8 (Adaptive Reasoning, Max Effort) · 2026-06-05 · 61.4Claude Opus 4.8 (Adaptive Reasoning, Max Effort) · 2026-06-06 · 61.4Claude Opus 4.8 (Adaptive Reasoning, Max Effort) · 2026-06-07 · 61.4Claude Opus 4.8 (Adaptive Reasoning, Max Effort) · 2026-06-08 · 61.4Claude Opus 4.8 (Adaptive Reasoning, Max Effort) · 2026-06-09 · 61.4Claude Opus 4.8 (Adaptive Reasoning, Max Effort) · 2026-06-10 · 61.4Claude Opus 4.8 (Adaptive Reasoning, Max Effort) · 2026-06-11 · 61.4Claude Opus 4.8 (Adaptive Reasoning, Max Effort) · 2026-06-12 · 61.4Claude Opus 4.8 (Adaptive Reasoning, Max Effort) · 2026-06-13 · 61.4Claude Opus 4.8 (Adaptive Reasoning, Max Effort) · 2026-06-14 · 61.4Claude Opus 4.8 (Adaptive Reasoning, Max Effort) · 2026-06-15 · 61.4Claude Opus 4.8 (Adaptive Reasoning, Max Effort) · 2026-06-16 · 55.7Claude Opus 4.8 (Adaptive Reasoning, Max Effort) · 2026-06-17 · 55.7Claude Opus 4.8 (Adaptive Reasoning, Max Effort) · 2026-06-18 · 55.7Claude Opus 4.8 (Adaptive Reasoning, Max Effort) · 2026-06-19 · 55.7Claude Opus 4.8 (Adaptive Reasoning, Max Effort) · 2026-06-20 · 55.7Claude Opus 4.8 (Adaptive Reasoning, Max Effort) · 2026-06-21 · 55.7Claude Opus 4.8 (Adaptive Reasoning, Max Effort) · 2026-06-22 · 55.7Claude Opus 4.8 (Adaptive Reasoning, Max Effort) · 2026-06-23 · 55.7Claude Opus 4.8 (Adaptive Reasoning, Max Effort) · 2026-06-24 · 55.7Claude Opus 4.8 (Adaptive Reasoning, Max Effort) · 2026-06-25 · 55.7Claude Opus 4.8 (Adaptive Reasoning, Max Effort) · 2026-06-26 · 55.7Claude Opus 4.8 (Adaptive Reasoning, Max Effort) · 2026-06-27 · 55.7Claude Opus 4.8 (Adaptive Reasoning, Max Effort) · 2026-06-28 · 55.7Claude Opus 4.8 (Adaptive Reasoning, Max Effort) · 2026-06-29 · 55.7Claude Opus 4.8 (Adaptive Reasoning, Max Effort) · 2026-06-30 · 55.7GPT-5.5 · 2026-05-31 · 60.2GPT-5.5 · 2026-06-01 · 60.2GPT-5.5 · 2026-06-02 · 60.2GPT-5.5 · 2026-06-03 · 60.2GPT-5.5 · 2026-06-04 · 60.2GPT-5.5 · 2026-06-05 · 60.2GPT-5.5 · 2026-06-06 · 60.2GPT-5.5 · 2026-06-07 · 60.2GPT-5.5 · 2026-06-08 · 60.2GPT-5.5 · 2026-06-09 · 60.2GPT-5.5 · 2026-06-10 · 60.2GPT-5.5 · 2026-06-11 · 60.2GPT-5.5 · 2026-06-12 · 60.2GPT-5.5 · 2026-06-13 · 60.2GPT-5.5 · 2026-06-14 · 60.2GPT-5.5 · 2026-06-15 · 60.2GPT-5.5 · 2026-06-16 · 54.8GPT-5.5 · 2026-06-17 · 54.8GPT-5.5 · 2026-06-18 · 54.8GPT-5.5 · 2026-06-19 · 54.8GPT-5.5 · 2026-06-20 · 54.8GPT-5.5 · 2026-06-21 · 54.8GPT-5.5 · 2026-06-22 · 54.8GPT-5.5 · 2026-06-23 · 54.8GPT-5.5 · 2026-06-24 · 54.8GPT-5.5 · 2026-06-25 · 54.8GPT-5.5 · 2026-06-26 · 54.8GPT-5.5 · 2026-06-27 · 54.8GPT-5.5 · 2026-06-28 · 54.8GPT-5.5 · 2026-06-29 · 54.8GPT-5.5 · 2026-06-30 · 54.8GPT-5.5 Pro · 2026-06-19 · 47.1GPT-5.5 Pro · 2026-06-20 · 54.8GPT-5.5 Pro · 2026-06-21 · 54.8GPT-5.5 Pro · 2026-06-22 · 35.4GPT-5.5 Pro · 2026-06-23 · 43.5GPT-5.5 Pro · 2026-06-24 · 43.5GPT-5.5 Pro · 2026-06-25 · 54.8GPT-5.5 Pro · 2026-06-26 · 43.5GPT-5.5 Pro · 2026-06-27 · 54.8GPT-5.5 Pro · 2026-06-28 · 43.5GPT-5.5 Pro · 2026-06-29 · 43.5GPT-5.5 Pro · 2026-06-30 · 54.8Claude Opus 4.7 (Fast) · 2026-05-31 · 51.8Claude Opus 4.7 (Fast) · 2026-06-01 · 51.8Claude Opus 4.7 (Fast) · 2026-06-02 · 51.8Claude Opus 4.7 (Fast) · 2026-06-03 · 51.8Claude Opus 4.7 (Fast) · 2026-06-04 · 57.3Claude Opus 4.7 (Fast) · 2026-06-05 · 51.8Claude Opus 4.7 (Fast) · 2026-06-06 · 51.8Claude Opus 4.7 (Fast) · 2026-06-07 · 51.8Claude Opus 4.7 (Fast) · 2026-06-08 · 51.8Claude Opus 4.7 (Fast) · 2026-06-09 · 51.8Claude Opus 4.7 (Fast) · 2026-06-10 · 51.8Claude Opus 4.7 (Fast) · 2026-06-11 · 57.3Claude Opus 4.7 (Fast) · 2026-06-12 · 51.8Claude Opus 4.7 (Fast) · 2026-06-13 · 51.8Claude Opus 4.7 (Fast) · 2026-06-14 · 57.3Claude Opus 4.7 (Fast) · 2026-06-15 · 57.3Claude Opus 4.7 (Fast) · 2026-06-16 · 51.8Claude Opus 4.7 (Fast) · 2026-06-17 · 42.7Claude Opus 4.7 (Fast) · 2026-06-18 · 42.7Claude Opus 4.7 (Fast) · 2026-06-19 · 53.5Claude Opus 4.7 (Fast) · 2026-06-20 · 42.7Claude Opus 4.7 (Fast) · 2026-06-21 · 42.7Claude Opus 4.7 (Fast) · 2026-06-22 · 42.7Claude Opus 4.7 (Fast) · 2026-06-23 · 42.7Claude Opus 4.7 (Fast) · 2026-06-24 · 42.7Claude Opus 4.7 (Fast) · 2026-06-25 · 42.7Claude Opus 4.7 (Fast) · 2026-06-26 · 42.7Claude Opus 4.7 (Fast) · 2026-06-27 · 42.7Claude Opus 4.7 (Fast) · 2026-06-28 · 53.5Claude Opus 4.7 (Fast) · 2026-06-29 · 42.7Claude Opus 4.7 (Fast) · 2026-06-30 · 53.5Claude Opus 4.7 · 2026-05-31 · 57.3Claude Opus 4.7 · 2026-06-01 · 57.3Claude Opus 4.7 · 2026-06-02 · 57.3Claude Opus 4.7 · 2026-06-03 · 57.3Claude Opus 4.7 · 2026-06-04 · 57.3Claude Opus 4.7 · 2026-06-05 · 57.3Claude Opus 4.7 · 2026-06-06 · 57.3Claude Opus 4.7 · 2026-06-07 · 57.3Claude Opus 4.7 · 2026-06-08 · 57.3Claude Opus 4.7 · 2026-06-09 · 57.3Claude Opus 4.7 · 2026-06-10 · 57.3Claude Opus 4.7 · 2026-06-11 · 57.3Claude Opus 4.7 · 2026-06-12 · 57.3Claude Opus 4.7 · 2026-06-13 · 57.3Claude Opus 4.7 · 2026-06-14 · 57.3Claude Opus 4.7 · 2026-06-15 · 57.3Claude Opus 4.7 · 2026-06-16 · 53.5Claude Opus 4.7 · 2026-06-17 · 53.5Claude Opus 4.7 · 2026-06-18 · 53.5Claude Opus 4.7 · 2026-06-19 · 53.5Claude Opus 4.7 · 2026-06-20 · 53.5Claude Opus 4.7 · 2026-06-21 · 53.5Claude Opus 4.7 · 2026-06-22 · 53.5Claude Opus 4.7 · 2026-06-23 · 53.5Claude Opus 4.7 · 2026-06-24 · 53.5Claude Opus 4.7 · 2026-06-25 · 53.5Claude Opus 4.7 · 2026-06-26 · 53.5Claude Opus 4.7 · 2026-06-27 · 53.5Claude Opus 4.7 · 2026-06-28 · 53.5Claude Opus 4.7 · 2026-06-29 · 53.5Claude Opus 4.7 · 2026-06-30 · 53.5Qwen3.6 Max Preview · 2026-05-31 · 51.8Qwen3.6 Max Preview · 2026-06-01 · 51.8Qwen3.6 Max Preview · 2026-06-02 · 51.8Qwen3.6 Max Preview · 2026-06-03 · 51.8Qwen3.6 Max Preview · 2026-06-04 · 51.8Qwen3.6 Max Preview · 2026-06-05 · 51.8Qwen3.6 Max Preview · 2026-06-06 · 51.8Qwen3.6 Max Preview · 2026-06-07 · 51.8Qwen3.6 Max Preview · 2026-06-08 · 51.8Qwen3.6 Max Preview · 2026-06-09 · 51.8Qwen3.6 Max Preview · 2026-06-10 · 51.8Qwen3.6 Max Preview · 2026-06-11 · 51.8Qwen3.6 Max Preview · 2026-06-12 · 51.8Qwen3.6 Max Preview · 2026-06-13 · 51.8Qwen3.6 Max Preview · 2026-06-14 · 51.8Qwen3.6 Max Preview · 2026-06-15 · 51.8Qwen3.6 Max Preview · 2026-06-16 · 51.8Qwen3.6 Max Preview · 2026-06-17 · 51.8Qwen3.6 Max Preview · 2026-06-18 · 51.8Qwen3.6 Max Preview · 2026-06-19 · 51.8Qwen3.6 Max Preview · 2026-06-20 · 51.8Qwen3.6 Max Preview · 2026-06-21 · 51.8Qwen3.6 Max Preview · 2026-06-22 · 51.8Qwen3.6 Max Preview · 2026-06-23 · 51.8Qwen3.6 Max Preview · 2026-06-24 · 51.8Qwen3.6 Max Preview · 2026-06-25 · 51.8Qwen3.6 Max Preview · 2026-06-26 · 51.8Qwen3.6 Max Preview · 2026-06-27 · 51.8Qwen3.6 Max Preview · 2026-06-28 · 51.8Qwen3.6 Max Preview · 2026-06-29 · 51.8Qwen3.6 Max Preview · 2026-06-30 · 51.8GPT-5.4 Pro · 2026-05-31 · 47.9GPT-5.4 Pro · 2026-06-01 · 56.8GPT-5.4 Pro · 2026-06-02 · 35.4GPT-5.4 Pro · 2026-06-03 · 35.4GPT-5.4 Pro · 2026-06-04 · 35.4GPT-5.4 Pro · 2026-06-05 · 56.8GPT-5.4 Pro · 2026-06-06 · 56.8GPT-5.4 Pro · 2026-06-07 · 56.8GPT-5.4 Pro · 2026-06-08 · 56.8GPT-5.4 Pro · 2026-06-09 · 56.8GPT-5.4 Pro · 2026-06-10 · 56.8GPT-5.4 Pro · 2026-06-11 · 56.8GPT-5.4 Pro · 2026-06-12 · 56.8GPT-5.4 Pro · 2026-06-13 · 47.9GPT-5.4 Pro · 2026-06-14 · 47.9GPT-5.4 Pro · 2026-06-15 · 47.9GPT-5.4 Pro · 2026-06-16 · 56.8GPT-5.4 Pro · 2026-06-17 · 51.4GPT-5.4 Pro · 2026-06-18 · 39.1GPT-5.4 Pro · 2026-06-19 · 27.7GPT-5.4 Pro · 2026-06-20 · 51.4GPT-5.4 Pro · 2026-06-21 · 51.4GPT-5.4 Pro · 2026-06-22 · 27.7GPT-5.4 Pro · 2026-06-23 · 51.4GPT-5.4 Pro · 2026-06-24 · 51.4GPT-5.4 Pro · 2026-06-25 · 51.4GPT-5.4 Pro · 2026-06-26 · 51.4GPT-5.4 Pro · 2026-06-27 · 39.1GPT-5.4 Pro · 2026-06-28 · 51.4GPT-5.4 Pro · 2026-06-29 · 39.1GPT-5.4 Pro · 2026-06-30 · 51.4
Claude Fable 5 (Adaptive Reasoning, Max Effort, Opus 4.8 Fallback)· AnthropicClaude Opus 4.8 (Adaptive Reasoning, Max Effort)· AnthropicGPT-5.5· OpenAIGPT-5.5 Pro· OpenAIClaude Opus 4.7 (Fast)· AnthropicClaude Opus 4.7· AnthropicQwen3.6 Max Preview· AlibabaGPT-5.4 Pro· OpenAI

Explorar mais

Perguntas frequentes sobre o ranking de IA

Qual é a IA mais inteligente do mundo em 2026?

De acordo com o AA Intelligence Index — índice composto que agrega GPQA Diamond, MMLU-Pro, AIME, HLE e LiveCodeBench — Claude Fable 5 (Adaptive Reasoning, Max Effort, Opus 4.8 Fallback) (Anthropic) lidera o ranking em 2026 com score 59.9/100, seguido por Claude Opus 4.8 (Adaptive Reasoning, Max Effort) (55.7) e GPT-5.5 Pro (54.8). O Intelligence Index é calculado pela Artificial Analysis com base em avaliações independentes e reflete capacidade técnica real em raciocínio, matemática, ciências e programação. É diferente do ELO do LMArena, que mede preferência humana em conversas abertas. Para tarefas que exigem raciocínio profundo, código ou análise científica, os modelos no topo do Intelligence Index costumam ter melhor desempenho. Para conversas cotidianas e criatividade, o ELO é um guia mais representativo. Consulte o ranking atualizado para posições em tempo real.

Qual a diferença entre ELO e Intelligence Index?

O ELO vem do LMArena (Chatbot Arena), onde usuários reais comparam respostas de dois modelos anonimizados e escolhem o melhor. É uma medida de preferência humana subjetiva — reflete naturalidade, utilidade e qualidade percebida em conversas do dia a dia. Um modelo com ELO alto pode não ser o mais preciso em tarefas técnicas, mas é o que as pessoas preferem usar. O AA Intelligence Index, calculado pela Artificial Analysis, é objetivo: agrega resultados de benchmarks padronizados como GPQA Diamond (perguntas de nível doutorado), MMLU-Pro (conhecimento acadêmico amplo), AIME (matemática olímpica), HLE (fronteira do conhecimento científico) e LiveCodeBench (programação). Quanto maior o score, mais o modelo demonstrou capacidade técnica em avaliações controladas. Use o ELO para escolher um assistente conversacional geral; use o Intelligence Index para selecionar modelos em pipelines técnicos ou científicos.

Qual IA é melhor para programar em 2026?

Para programação, os benchmarks mais relevantes são o LiveCodeBench — desafios de código avaliados com execução real — e o AA Coding Index. Em 2026, Claude Fable 5 (Adaptive Reasoning, Max Effort, Opus 4.8 Fallback) lidera o ranking de código (76.5/100), com GPT-5.5 em segundo e GPT-5.5 Pro em terceiro. A escolha ideal depende do contexto: para geração de código via API, custo por token e janela de contexto importam tanto quanto a precisão. Para desenvolvimento interativo no IDE (Cursor, VS Code), a latência pesa muito. Para projetos com múltiplos arquivos, janelas acima de 100K tokens são necessárias. Consulte a tabela completa para comparar modelos de código por score, preço e velocidade.

Com que frequência o ranking é atualizado?

O ranking SWEN.AI é atualizado de forma automática e contínua a partir de três fontes principais. Os dados de benchmark da Artificial Analysis (Intelligence Index, Coding Index, Math Index, velocidade de inferência) são sincronizados a cada 6 horas via integração automatizada. Os preços de API — input e output por 1M tokens — são atualizados diariamente via OpenRouter, refletindo variações de providers em tempo quase real. O ELO do LMArena (Chatbot Arena) é sincronizado semanalmente. A página revalida o cache a cada 5 minutos via ISR (Incremental Static Regeneration): quando um novo modelo entra ou um score muda, o ranking atualiza em até 5 minutos sem rebuild manual. A última sincronização ocorreu em 30 de jun. de 2026.

Qual é a diferença entre Gemini 3, 3.1 e 3.5?

A família Gemini 3 do Google não segue numeração sequencial linear. O Google lançou versões Gemini 3 Flash, Gemini 3.1 Pro/Flash Lite e Gemini 3.5 Flash — sem publicar um “Gemini 3.2” oficial. Cada número indica uma geração técnica distinta: 3.1 trouxe melhorias de raciocínio; 3.5 ampliou capacidade com custo intermediário. O Gemini 3.1 Pro custa US$ 2,00/1M tokens (~R$ 11,92/1M) e tem janela de contexto de 1 milhão de tokens, posicionando-se como alternativa ao GPT-4o e Claude 3.7. Veja o comparativo completo da família Gemini 3 com preços em BRL →

O que é o Gemini Spark do Google?

“Gemini Spark” é um nome que circula online mas que o Google nunca lançou oficialmente como produto. O termo apareceu em APK teardowns associado a uma possível versão ultra-leve do Gemini para dispositivos de borda. Os modelos leves confirmados do Google são: Gemini Nano (on-device, Pixel 8 Pro/Pixel 9) e Gemini Flash(via API, US$ 0,075/1M tokens). Qualquer previsão sobre “Gemini Spark” é especulação até confirmação oficial. Entenda o que se sabe sobre o Gemini Spark →

Metodologia & fontes

Artificial Analysis fornece Intelligence Index, Coding Index, Math Index e benchmarks individuais (GPQA Diamond, MMLU-Pro, HLE, AIME, MATH-500, LiveCodeBench). Sincronizado a cada 6h via cron automatizado.

LMArena Elo de preferência humana em comparações blind side-by-side. Atualizado semanalmente.

OpenRouter preços de provider em USD por 1M tokens. Atualizado diariamente.

Snapshots históricos captura diária dos scores às 06:30 UTC para alimentar gráficos de evolução temporal. Iniciada em 30 de jun. de 2026.

Benchmarks são indicativos — sempre teste no seu caso de uso específico antes de decidir. Performance varia por provedor de inferência (mesmo modelo, latência diferente).