Custo de API de IAPreços em Reais 2026

Quanto custa usar a API do ChatGPT, Claude, Gemini e outros LLMs para empresas e desenvolvedores brasileiros? Compare o preço por milhão de tokens convertido para BRL — sem surpresas na fatura.

Câmbio de referência: US$ 1 = R$ 5.70 • IOF zerado para PF desde jan/2024 • Última atualização: 16 de maio de 2026212 APIs listadas

212

APIs listadas

14

Com plano grátis

Grátis

Mais barata (input/1M)

$30.00

Mais cara (input/1M)

Como ler a tabela: preços são por milhão de tokens (input = o que você envia; output = a resposta do modelo). Em português, 1.000 tokens ≈ 750 palavras ≈ 1 página A4. O valor em BRL usa câmbio R$ 5.70/USD — substitua pelo câmbio do seu banco para estimativas precisas. Preços verificados nas páginas oficiais de precificação de cada empresa.

Preços por Milhão de Tokens — APIs com Custo

#ModeloInput USD/1MInput R$/1M
1Qwen2.5 Coder 32B InstructGrátis
2Olmo 3 32B ThinkGrátis
3Olmo 3.1 32B InstructGrátis
4Claude 3.7 Sonnet (thinking)Grátis
5ERNIE 5.0 Thinking PreviewGrátis
6Doubao Seed CodeGrátis
7JT-35B-FlashGrátis
8JT-MINIGrátis
9Gemini 2.5 Flash Preview (Sep '25) (Reasoning)Grátis
10Granite 4.0 MicroGrátis
11EXAONE 4.5 33BGrátis
12K-EXAONE (Reasoning)Grátis
13Muse SparkGrátis
14Nemotron Cascade 2 30B A3BGrátis
15Mistral: Mistral Nemo$0.020R$ 0.114
16LFM2-24B-A2B$0.030R$ 0.171
17Amazon: Nova Micro 1.0$0.035R$ 0.200
18Cohere: Command R7B (12-2024)$0.037R$ 0.214
19Qwen: Qwen2.5 7B Instruct$0.040R$ 0.228
20Gemma 3 12B$0.040R$ 0.228
21Gemma 3 4B$0.040R$ 0.228
22Arcee AI: Trinity Mini$0.045R$ 0.257
23Llama 3 8B Instruct$0.045R$ 0.257
24Llama 3.2 1B Instruct$0.050R$ 0.285
25Amazon: Nova Lite 1.0$0.060R$ 0.342
26Gemma 3n 4B$0.060R$ 0.342
27Gemma 4 26B A4B $0.060R$ 0.342
28MythoMax 13B$0.060R$ 0.342
29Qwen: Qwen3 Coder 30B A3B Instruct$0.070R$ 0.399
30Baidu: ERNIE 4.5 21B A3B Thinking$0.070R$ 0.399
31Qwen: Qwen3 235B A22B Instruct 2507$0.071R$ 0.405
32ByteDance Seed: Seed 1.6 Flash$0.075R$ 0.427
33Gemini 2.0 Flash Lite$0.075R$ 0.427
34Mistral: Mistral Small 3.2 24B$0.075R$ 0.427
35Qwen: Qwen3 30B A3B Thinking 2507$0.080R$ 0.456
36Qwen: Qwen3 VL 8B Instruct$0.080R$ 0.456
37Gemma 3 27B$0.080R$ 0.456
38Llama 4 Scout$0.080R$ 0.456
39Qwen: Qwen3 30B A3B Instruct 2507$0.090R$ 0.513
40Qwen: Qwen3 Next 80B A3B Instruct$0.090R$ 0.513
41ByteDance: UI-TARS 7B $0.100R$ 0.570
42Gemini 2.0 Flash$0.100R$ 0.570
43Gemini 2.5 Flash Lite$0.100R$ 0.570
44Ling 2.6 Flash$0.100R$ 0.570
45Llama 3.1 8B Instruct$0.100R$ 0.570
46Mistral: Devstral Small 1.1$0.100R$ 0.570
47Mistral: Ministral 3 3B 2512$0.100R$ 0.570
48Mistral: Mistral Small Creative$0.100R$ 0.570
49Mistral: Voxtral Small 24B 2507$0.100R$ 0.570
50Qwen: Qwen3 VL 32B Instruct$0.104R$ 0.593
51Mistral: Mistral 7B Instruct v0.1$0.110R$ 0.627
52Qwen2.5 72B Instruct$0.120R$ 0.684
53Gemma 4 31B$0.120R$ 0.684
54Microsoft: Phi 4$0.125R$ 0.713
55DeepSeek V4 Flash$0.126R$ 0.718
56Qwen: Qwen3 VL 30B A3B Instruct$0.130R$ 0.741
57Nous: Hermes 4 70B$0.130R$ 0.741
58Nex AGI: DeepSeek V3.1 Nex N1$0.135R$ 0.770
59Baidu: ERNIE 4.5 VL 28B A3B$0.140R$ 0.798
60NousResearch: Hermes 2 Pro - Llama-3 8B$0.140R$ 0.798
61Qwen: Qwen3 235B A22B Thinking 2507$0.149R$ 0.852
62EssentialAI: Rnj 1 Instruct$0.150R$ 0.855
63Llama 3.2 3B Instruct$0.150R$ 0.855
64Llama 4 Maverick$0.150R$ 0.855
65MiniMax: MiniMax M2.5$0.150R$ 0.855
66Mistral: Ministral 3 8B 2512$0.150R$ 0.855
67Mistral: Mistral Small 4$0.150R$ 0.855
68Arcee AI: Spotlight$0.180R$ 1.03
69Llama Guard 4 12B$0.180R$ 1.03
70Qwen: Qwen3 VL 235B A22B Instruct$0.200R$ 1.14
71MiniMax: MiniMax-01$0.200R$ 1.14
72Mistral: Ministral 3 14B 2512$0.200R$ 1.14
73Mistral: Saba$0.200R$ 1.14
74DeepSeek V3.1$0.210R$ 1.20
75Arcee AI: Trinity Large Thinking$0.220R$ 1.25
76Trinity Large Thinking$0.235R$ 1.34
77Llama 3.2 11B Vision Instruct$0.245R$ 1.40
78Qwen: Qwen2.5 VL 72B Instruct$0.250R$ 1.43
79Anthropic: Claude 3 Haiku$0.250R$ 1.43
80ByteDance Seed: Seed-2.0-Lite$0.250R$ 1.43
81Gemini 3.1 Flash Lite$0.250R$ 1.43
82Gemini 3.1 Flash Lite Preview$0.250R$ 1.43
83Inception: Mercury 2$0.250R$ 1.43
84DeepSeek V3.2$0.252R$ 1.44
85DeepSeek V3.1 Terminus$0.270R$ 1.54
86DeepSeek V3.2 Exp$0.270R$ 1.54
87DeepSeek V3.2 Exp (Non-reasoning)$0.275R$ 1.57
88DeepSeek V3.2 Exp (Reasoning)$0.275R$ 1.57
89Baidu: ERNIE 4.5 300B A47B $0.280R$ 1.60
90DeepSeek V3.2 Speciale$0.287R$ 1.64
91DeepSeek: R1 Distill Qwen 32B$0.290R$ 1.65
92MiniMax: MiniMax M2.1$0.290R$ 1.65
93Amazon: Nova 2 Lite$0.300R$ 1.71
94Nova 2.0 Lite (high)$0.300R$ 1.71
95Gemini 2.5 Flash$0.300R$ 1.71
96Nano Banana (Gemini 2.5 Flash Image)$0.300R$ 1.71
97Ling-2.6-1T$0.300R$ 1.71
98KAT-Coder-Pro V1$0.300R$ 1.71
99Kwaipilot: KAT-Coder-Pro V2$0.300R$ 1.71
100MiniMax-M2$0.300R$ 1.71
101MiniMax: MiniMax M2-her$0.300R$ 1.71
102MiniMax: MiniMax M2.7$0.300R$ 1.71
103Mistral: Codestral 2508$0.300R$ 1.71
104Nous: Hermes 3 70B Instruct$0.300R$ 1.71
105NVIDIA Nemotron 3 Super 120B A12B (Reasoning)$0.300R$ 1.71
106DeepSeek V3$0.320R$ 1.82
107Mistral: Mistral Small 3.1 24B$0.350R$ 1.99
108Qwen3.5 Omni Plus$0.400R$ 2.28
109MiniMax: MiniMax M1$0.400R$ 2.28
110Mistral: Devstral 2 2512$0.400R$ 2.28
111Mistral: Devstral Medium$0.400R$ 2.28
112Mistral: Mistral Medium 3$0.400R$ 2.28
113Mistral: Mistral Medium 3.1$0.400R$ 2.28
114MoonshotAI: Kimi K2 0905$0.400R$ 2.28
115Baidu: ERNIE 4.5 VL 424B A47B $0.420R$ 2.39
116DeepSeek V4 Pro$0.435R$ 2.48
117MoonshotAI: Kimi K2.5$0.440R$ 2.51
118Mistral: Mixtral 8x7B Instruct$0.450R$ 2.56
119Llama Guard 3 8B$0.480R$ 2.74
120Arcee AI: Coder Large$0.500R$ 2.85
121Gemini 3 Flash Preview$0.500R$ 2.85
122Gemini 3 Flash Preview (Non-reasoning)$0.500R$ 2.85
123Gemini 3 Flash Preview (Reasoning)$0.500R$ 2.85
124Nano Banana 2 (Gemini 3.1 Flash Image Preview)$0.500R$ 2.85
125MiniMax M1 80k$0.550R$ 3.14
126Llama 3.1 70B Instruct$0.560R$ 3.19
127MoonshotAI: Kimi K2 0711$0.570R$ 3.25
128Llama 3.3 70B Instruct$0.585R$ 3.33
129Kimi K2$0.585R$ 3.33
130Kimi K2 Thinking$0.600R$ 3.42
131WizardLM-2 8x22B$0.620R$ 3.53
132Gemma 2 27B$0.650R$ 3.71
133Llama 3 70B Instruct$0.650R$ 3.71
134DeepSeek: R1$0.700R$ 3.99
135R1 Distill Llama 70B$0.700R$ 3.99
136Arcee AI: Virtuoso Large$0.750R$ 4.28
137Mancer: Weaver (alpha)$0.750R$ 4.28
138MoonshotAI: Kimi K2.6$0.750R$ 4.28
139AionLabs: Aion-2.0$0.800R$ 4.56
140AionLabs: Aion-RP 1.0 (8B)$0.800R$ 4.56
141AlfredPros: CodeLLaMa 7B Instruct Solidity$0.800R$ 4.56
142Amazon: Nova Pro 1.0$0.800R$ 4.56
143Claude 3.5 Haiku$0.800R$ 4.56
144Morph: Morph V3 Fast$0.800R$ 4.56
145Qwen3 VL 235B A22B (Reasoning)$0.840R$ 4.79
146Arcee AI: Maestro Reasoning$0.900R$ 5.13
147Morph: Morph V3 Large$0.900R$ 5.13
148Claude Haiku 4.5$1.00R$ 5.70
149Nous: Hermes 3 405B Instruct$1.00R$ 5.70
150Nous: Hermes 4 405B$1.00R$ 5.70
151Qwen3 Max Thinking (Preview)$1.20R$ 6.84
152Llama 3.1 Nemotron 70B Instruct$1.20R$ 6.84
153Nova 2.0 Pro Preview (medium)$1.25R$ 7.13
154Claude 4.5 Haiku (Reasoning)$1.25R$ 7.13
155Deep Cogito: Cogito v2.1 671B$1.25R$ 7.13
156Gemini 2.5 Pro$1.25R$ 7.13
157Gemini 2.5 Pro Preview 05-06$1.25R$ 7.13
158Gemini 2.5 Pro Preview 06-05$1.25R$ 7.13
159Qwen3.6 Max Preview$1.30R$ 7.41
160Mistral: Mistral Medium 3.5$1.50R$ 8.55
161AI21: Jamba Large 1.7$2.00R$ 11.40
162Gemini 3 Pro Preview (high)$2.00R$ 11.40
163Gemini 3 Pro Preview (low)$2.00R$ 11.40
164Gemini 3.1 Pro Preview$2.00R$ 11.40
165Gemini 3.1 Pro Preview Custom Tools$2.00R$ 11.40
166Nano Banana Pro (Gemini 3 Pro Image Preview)$2.00R$ 11.40
167Magistral Medium 1.2$2.00R$ 11.40
168Mistral Large$2.00R$ 11.40
169Mistral: Mixtral 8x22B Instruct$2.00R$ 11.40
170Mistral: Pixtral Large 2411$2.00R$ 11.40
171Amazon: Nova Premier 1.0$2.50R$ 14.25
172Cohere: Command R+ (08-2024)$2.50R$ 14.25
173Inflection: Inflection 3 Pi$2.50R$ 14.25
174Inflection: Inflection 3 Productivity$2.50R$ 14.25
175Claude Sonnet 4$3.00R$ 17.10
176Claude Sonnet 4.5$3.00R$ 17.10
177Claude Sonnet 4.6$3.00R$ 17.10
178Magnum v4 72B$3.00R$ 17.10
179Claude 3.7 Sonnet$3.75R$ 21.38
180Claude 4 Sonnet (Reasoning)$3.75R$ 21.38
181Claude 4.5 Sonnet (Non-reasoning)$3.75R$ 21.38
182Claude 4.5 Sonnet (Reasoning)$3.75R$ 21.38
183Claude Sonnet 4.6 (Adaptive Reasoning, Max Effort)$3.75R$ 21.38
184Claude Sonnet 4.6 (Non-reasoning, Low Effort)$3.75R$ 21.38
185Goliath 120B$3.75R$ 21.38
186AionLabs: Aion-1.0$4.00R$ 22.80
187Claude Opus 4.5$5.00R$ 28.50
188Claude Opus 4.6$5.00R$ 28.50
189Claude Opus 4.7$5.00R$ 28.50
190Claude Opus 4.5 (Reasoning)$6.25R$ 35.63
191Claude Opus 4.6 (Adaptive Reasoning, Max Effort)$6.25R$ 35.63
192Claude Opus 4$15.00R$ 85.50
193Claude Opus 4.1$15.00R$ 85.50
194Claude 4 Opus (Reasoning)$18.75R$ 106.88
195Claude 4.1 Opus (Non-reasoning)$18.75R$ 106.88
196Claude 4.1 Opus (Reasoning)$18.75R$ 106.88
197Claude Opus 4.6 (Fast)$30.00R$ 171.00
198Claude Opus 4.7 (Fast)$30.00R$ 171.00

APIs com Plano Gratuito

Estes modelos oferecem acesso via API sem custo (com limites de rate). Ideais para protótipos e projetos de baixo volume.

Guia de Custo de APIs de IA para o Brasil

Como Funciona a Precificação por Token

A grande maioria das APIs de LLMs cobra por tokens processados, divididos em duas categorias: tokens de input(o texto que você envia ao modelo — seu prompt, contexto e histórico) e tokens de output (a resposta gerada pelo modelo). Em geral, o custo de output é 2–4× maior que o de input, pois requer mais computação para gerar.

Para o português brasileiro, 1.000 tokens equivalem a aproximadamente 750 palavras — ligeiramente menos eficiente que o inglês por causa de palavras mais longas e acentuação. Na prática, uma página A4 de texto corrido tem entre 600 e 900 tokens.

Exemplo Real de Custo Mensal

Imagine uma empresa que usa a API do GPT-4o para processar 100 e-mails por dia, com um prompt médio de 800 tokens e resposta de 300 tokens. Isso representa 110.000 tokens/dia × 30 dias = 3,3 milhões de tokens/mês. Com o preço de $2,50/M tokens de input e $10/M de output:

  • Input: 2,4M tokens × $2,50/M = $6,00/mêsR$ 34.20/mês
  • Output: 0,9M tokens × $10/M = $9,00/mêsR$ 51.30/mês
  • Total: $15,00/mêsR$ 85.50/mês

O mesmo volume com Claude Haiku (a ~$0,25/M input) custaria apenas R$ 9.83/mês — uma economia significativa para casos onde a qualidade máxima não é crítica.

Estratégias para Reduzir Custos de API no Brasil

1. Escolha o modelo certo para cada tarefa: classificação simples de texto pode usar Gemini Flash ou Claude Haiku; reserve GPT-4o ou Claude Opus para tarefas que realmente exigem raciocínio avançado.

2. Comprima os prompts: evite repetir contexto desnecessário. Sistemas de RAG bem implementados enviam apenas os trechos relevantes, não o documento inteiro.

3. Cache de respostas: se o mesmo prompt é enviado repetidamente (ex: categorização de produtos), armazene as respostas e reutilize. Providers como Anthropic oferecem prompt caching com desconto.

4. Use modelos open source via APIs de terceiros: Groq, Together AI e Fireworks oferecem modelos como Llama e Qwen por $0,01–$0,20/M tokens — 10–100× mais barato que os proprietários frontier.

IOF e Câmbio para Empresas Brasileiras

O pagamento das APIs de IA (OpenAI, Anthropic, Google) é feito em dólares americanos por cartão de crédito ou débito internacional. Para pessoas físicas, o IOF sobre compras internacionais foi zerado pelo governo Lula em janeiro de 2024 — você paga apenas o câmbio do cartão. Para pessoas jurídicas (CNPJ), as remessas internacionais ainda incidem IOF de 0,38%. Além do IOF, considere o spread do cartão (tipicamente 3–5% sobre o câmbio PTAX). Plataformas de pagamento como Wise podem oferecer câmbio mais próximo ao comercial.

Perguntas Frequentes sobre Custo de API

Quanto custa usar a API do ChatGPT (GPT-4o) em reais?

A API do GPT-4o custa $2,50 por milhão de tokens de input e $10,00 por milhão de tokens de output (preços de 2026). Com o câmbio em torno de R$ 5.70, isso equivale a aproximadamente R$ 14.25/M tokens de input. Para uma empresa brasileira que envia 1 milhão de tokens por dia, o custo mensal seria de aproximadamente R$ 428.

Qual é a API de IA mais barata disponível para empresas brasileiras?

Modelos open source como Qwen, Llama e Gemma podem ser rodados via APIs de terceiros (Groq, Together AI, Fireworks) por frações de centavo por milhão de tokens — chegando a $0,01–$0,10/M tokens. Entre as APIs proprietárias, Gemini Flash e Claude Haiku são as mais acessíveis, com preços a partir de $0,08–$0,25/M tokens de input.

Preciso pagar IOF ao usar APIs de IA no Brasil?

O IOF sobre compras internacionais no cartão de crédito foi zerado desde janeiro de 2024 para pessoas físicas. Empresas (CNPJ) ainda pagam IOF sobre remessas internacionais — consulte sua contabilidade. Os preços nesta tabela mostram o valor base em USD sem IOF adicional; inclua seu câmbio bancário real na estimativa final.

O que são tokens e como calcular o custo real do meu projeto?

Tokens são unidades de texto que os LLMs processam — em inglês, 1 token ≈ 4 caracteres; em português, pode ser um pouco menos por causa de acentuação. Uma página A4 tem ~600–800 tokens. Para estimar o custo: (tokens de input + tokens de output) × preço/1M tokens. Exemplo: prompt de 500 tokens + resposta de 300 tokens = 800 tokens × preço do modelo.

Vale mais a pena usar API ou assinar o plano premium do ChatGPT/Claude?

Para uso pessoal moderado, a assinatura (US$ 20/mês ≈ R$ 114/mês) costuma ser mais econômica. Para uso intensivo ou integração em produtos, a API é mais flexível e escalável. O ponto de virada geralmente acontece quando o consumo de tokens via API supera o custo da assinatura mensal.

Como os preços de API de IA variam ao longo do tempo?

Os preços caíram drasticamente: GPT-4 custava $30/M tokens em 2023; hoje modelos equivalentes custam $2–5/M. A tendência é de queda contínua conforme a competição aumenta. Atualizamos esta tabela semanalmente — verifique sempre os preços oficiais antes de comprometer seu budget.

Explorar no Benchmark