Ranking de Modelos de IA
Compare benchmarks, preços e capacidades dos principais modelos de inteligência artificial. O guia mais completo em português brasileiro.
Como Funciona Este Ranking?
Transparência sobre nossa metodologia e fontes de dados
Análise independente em português de 200+ modelos de IA das principais empresas. ELO do Chatbot Arena, Intelligence Index, preços em reais e especificações. Atualizado diariamente.
Por Luis Fernando Roquette • Última atualização: 19 de maio de 2026
200 modelos • 143 com benchmarks • 0 com ELO
Mais Inteligente
Chatbot Arena ELO
Melhor Custo-Benefício
ELO por US$/1M tokens • R$ câmbio 5.70
Mais Barato (ELO > 1300)
Preço input por 1M tokens
Receba o ranking toda semana
Atualizações de ELO, novos modelos e análises exclusivas. Mais de 5.000 profissionais assinaram.
ELO Chatbot Arena — top 20
ELO baseado em votação humana no LMArena (Chatbot Arena). Clique em qualquer modelo para ver benchmarks detalhados.
Receba atualizações do ranking por e-mail. Zero spam, só o que importa.
200
Modelos
41
Empresas
0
Com ELO
54
Reasoning
91
Open Source
70
Multimodal
Classificação baseada no Chatbot Arena (LMArena) — votação humana lado a lado.
| # | Modelo | ELO | Input $/1M |
|---|---|---|---|
| · | Jamba Large 1.7 AI21 Labs | — | $2.00 |
| · | Qwen3 235B A22B Instruct 2507 Alibaba | — | $0.07 |
| · | Qwen3 235B A22B Thinking 2507 Alibaba | — | $0.15 |
| · | Qwen3 30B A3B Thinking 2507 Alibaba | — | $0.08 |
| · | Qwen3 Coder 30B A3B Instruct Alibaba | — | $0.07 |
| · | Qwen3 Next 80B A3B Instruct Alibaba | — | $0.09 |
| · | Qwen3 VL 235B A22B Instruct Alibaba | — | $0.20 |
| · | Qwen3 VL 30B A3B Instruct Alibaba | — | $0.13 |
| · | Qwen3 VL 32B Instruct Alibaba | — | $0.10 |
| · | Qwen3 VL 8B Instruct Alibaba | — | $0.08 |
| · | Qwen2.5 72B Instruct Alibaba | — | $0.12 |
| · | Qwen3 Max Thinking (Preview) Alibaba | — | $1.20 |
| · | Qwen3 VL 235B A22B (Reasoning) Alibaba | — | $0.84 |
| · | Qwen3.5 Omni Plus Alibaba | — | $0.40 |
| · | Qwen3.6 Max Preview Alibaba | — | $1.30 |
| · | Olmo 3 32B Think AllenAI | — | — |
| · | Olmo 3.1 32B Instruct AllenAI | — | — |
| · | Nova Lite 1.0 Amazon | — | $0.06 |
| · | Nova Micro 1.0 Amazon | — | $0.04 |
| · | Nova Premier 1.0 Amazon | — | $2.50 |
Preços em USD por 1M tokens de input. Estimativa em BRL: câmbio de mercado + IOF de 6,38%. Consulte metodologia para detalhes.
OS = Open Source • MM = Multimodal • R = Reasoning • ELO: LMArena • Intel.: Artificial Analysis • Preços: OpenRouter •Ver metodologia completa
Tokens por segundo — top 15
Velocidade em tokens/segundo medida via API. TTFT = Time to First Token (latência até a primeira resposta).
O mercado de modelos de linguagem (LLMs) em 2026 é dominado por uma corrida entre OpenAI, Anthropic, Google DeepMind, Meta AI e labs como DeepSeek, Alibaba (Qwen) e xAI (Grok). Com mais de 200 modelos disponíveis via API, escolher o modelo certo para cada caso de uso tornou-se uma decisão complexa que envolve qualidade (medida por benchmarks como ELO, MMLU e SWE-bench), preço por token, velocidade de inferência, contexto e capacidades multimodais.
Receba o resumo semanal direto no e-mail — qual modelo subiu, qual caiu, e por quê.
Depende do caso de uso. Para raciocínio complexo, Claude Opus 4.7 e GPT-5 lideram. Para custo-benefício, Claude Haiku 4.5 e DeepSeek V3 são excelentes.
O ELO é um score baseado em votação humana no LMArena (antigo LMSYS Chatbot Arena). Usuários comparam respostas de dois modelos anônimos e escolhem o melhor. O sistema ELO (como no xadrez) calcula a classificação relativa. Scores acima de 1400 indicam modelos frontier.
Modelos como Claude Haiku 4.5, DeepSeek V3 e Gemini Flash oferecem excelente qualidade a preços baixos.
Benchmarks são indicativos, não definitivos. O ELO do Chatbot Arena é considerado o mais confiável por usar preferência humana real. Benchmarks sintéticos (MMLU, GPQA) podem sofrer contaminação. Recomendamos testar no seu caso de uso específico.
Claude (Anthropic) e Gemini (Google) tendem a ter melhor performance em português brasileiro. O SWEN.AI mantém um benchmark proprietário em PT-BR com 10 modelos testados em ENEM, OAB e SAC — veja os resultados em /benchmark/ptbr.
Compare benchmarks, preços e capacidades dos principais modelos de inteligência artificial. O guia mais completo em português brasileiro.
Transparência sobre nossa metodologia e fontes de dados