xAI • LLM
Grok 4 is xAI's latest reasoning model with a 256k context window. It supports parallel tool calling, structured outputs, and both image and text inputs. Note that reasoning is not...
Context Window
256K tokens
Preço Input/1M
$3.00
Preço Output/1M
$15.00
Parâmetros
—
Resultados do xAI: Grok 4 nos principais benchmarks de avaliação de modelos de IA. Scores mais altos indicam melhor performance.
| Benchmark | Score | Máximo | Metodologia |
|---|---|---|---|
| LiveCodeBench | 81.9 | 100.0 | Artificial Analysis official API — Intelligence/Coding/Math indices |
| LiveBench Coding | 73.1 | 100.0 | Contamination-free benchmark with objective ground-truth answers |
| AA Coding Index | 40.5 | 100.0 | Artificial Analysis official API — Intelligence/Coding/Math indices |
| Benchmark | Score | Máximo | Metodologia |
|---|---|---|---|
| LiveBench Data Analysis | 63.4 | 100.0 | Contamination-free benchmark with objective ground-truth answers |
| Benchmark | Score | Máximo | Metodologia |
|---|---|---|---|
| LiveBench Language | 76.4 | 100.0 | Contamination-free benchmark with objective ground-truth answers |
| Benchmark | Score | Máximo | Metodologia |
|---|---|---|---|
| MATH-500 | 99.0 | 100.0 | Artificial Analysis official API — Intelligence/Coding/Math indices |
| AA Math Index | 92.7 | 100.0 | Artificial Analysis official API — Intelligence/Coding/Math indices |
| AIME 2025 | 92.7 | 100.0 | Artificial Analysis official API — Intelligence/Coding/Math indices |
| LiveBench Math | 83.0 | 100.0 | Contamination-free benchmark with objective ground-truth answers |
| Benchmark | Score | Máximo | Metodologia |
|---|---|---|---|
| LMArena Elo | 1410.0 | 2000.0 | Crowdsourced blind pairwise comparisons |
| LiveBench Global | 62.0 | 100.0 | Contamination-free benchmark with objective ground-truth answers |
| AA Intelligence Index | 41.5 | 100.0 | Artificial Analysis official API — Intelligence/Coding/Math indices |
| Benchmark | Score | Máximo | Metodologia |
|---|---|---|---|
| GPQA Diamond | 87.7 | 100.0 | Artificial Analysis official API — Intelligence/Coding/Math indices |
| MMLU Pro | 86.6 | 100.0 | Artificial Analysis official API — Intelligence/Coding/Math indices |
| LiveBench Reasoning | 79.1 | 100.0 | Contamination-free benchmark with objective ground-truth answers |
O xAI: Grok 4 é um modelo de inteligência artificial desenvolvido pela xAI, classificado como modelo de linguagem (LLM). É um modelo multimodal, capaz de processar texto, imagens e potencialmente outros tipos de mídia. Como modelo proprietário, está disponível via API cloud da xAI. Com uma janela de contexto de 256K tokens, é adequado para processamento de documentos longos como contratos, livros e bases de código completas.
O xAI: Grok 4 é cobrado por uso, com preço de US$ 3/1M tokens de input e US$ 15/1M tokens de output. Para contextualizar: 1 milhão de tokens equivale a aproximadamente 750 mil palavras, ou cerca de 10 livros de tamanho médio. O posicionamento de preço é intermediário, equilibrando qualidade e custo para a maioria das aplicações profissionais.
Para o mercado brasileiro, é importante considerar o IOF de 6,38% sobre transações internacionais e a variação cambial do dólar. Com o câmbio atual, o custo do xAI: Grok 4 em reais fica em torno de R$ 18.51/1M tokens de input (estimativa com IOF incluso).
O xAI: Grok 4 foi avaliado em 15 benchmarks diferentes, cobrindo categorias como Coding, Data Analysis, Language, Math, overall, Reasoning. Os resultados mostram performance excepcional nas avaliações disponíveis.
É importante notar que benchmarks medem aspectos específicos e não capturam toda a experiência de uso. Fatores como qualidade da resposta em português, aderência a instruções complexas e comportamento em conversas longas variam significativamente entre modelos e nem sempre são refletidos nos scores padrão.
O xAI: Grok 4 é adequado para diversas aplicações de inteligência artificial: análise de documentos longos (contratos, processos jurídicos, bases de código), automação com tool calling (integração com APIs, banco de dados, sistemas externos), análise de imagens e documentos visuais (OCR, diagramas, screenshots), processamento multimodal combinando texto e imagens, raciocínio complexo, resolução de problemas matemáticos e análise lógica, geração de texto, resumo, tradução e assistência geral.
No ecossistema de modelos de IA em 2026, o xAI: Grok 4 compete diretamente com modelos de nível similar. A xAI compete neste segmento contra OpenAI, Anthropic, Google e Meta. A escolha entre modelos depende do caso de uso específico, orçamento, requisitos de latência e necessidade de funcionalidades como multimodalidade e tool calling.
Para uma comparação detalhada lado a lado, utilize nossa ferramenta de comparação ou consulte o ranking geral de modelos.
Para usuários brasileiros, a performance em português é um critério fundamental na escolha de um modelo de IA. A maioria dos benchmarks internacionais testa apenas em inglês, o que pode mascarar diferenças significativas na qualidade de resposta em outros idiomas. O xAI: Grok 4 oferece suporte multimodal que funciona em múltiplos idiomas, mas a qualidade em português brasileiro pode variar dependendo da tarefa específica.
Recomendamos testar o modelo com prompts representativos do seu caso de uso em português antes de tomar uma decisão. O SWEN.AI está desenvolvendo um benchmark proprietário em PT-BR com tarefas aderentes ao mercado brasileiro para fornecer comparações mais precisas.
Grok 4 is xAI's latest reasoning model with a 256k context window. It supports parallel tool calling, structured outputs, and both image and text inputs. Note that reasoning is not...
O xAI: Grok 4 custa US$ 3/1M tokens de input e US$ 15/1M tokens de output. Para uso intensivo (ex.: chatbot de WhatsApp com 100k mensagens/mês), o custo pode variar de R$ 50 a R$ 5.000 dependendo do volume.
A maioria dos modelos de IA modernos, incluindo o xAI: Grok 4, suporta português brasileiro. No entanto, a qualidade pode variar — modelos como Claude e Gemini tendem a ter melhor performance em PT-BR. Recomendamos testar com prompts específicos do seu caso de uso.
Nos benchmarks disponíveis, o xAI: Grok 4 obteve scores como: LiveCodeBench: 81.9/100, LiveBench Coding: 73.13/100, AA Coding Index: 40.5/100. Consulte a tabela completa acima para comparação detalhada.
Não, o xAI: Grok 4 é um modelo proprietário da xAI. Ele está disponível via API cloud. Para alternativas open source, confira nosso ranking de modelos open source.
Última atualização: 26 de abril de 2026 • Ver metodologia →