Custo de API de IAPreços em Reais 2026

Quanto custa usar a API do ChatGPT, Claude, Gemini e outros LLMs para empresas e desenvolvedores brasileiros? Compare o preço por milhão de tokens convertido para BRL — sem surpresas na fatura.

US$ 1 = R$ 5.70 • IOF zerado para PF desde jan/2024 • Última atualização: 03 de julho de 2026 612 APIs listadas

612

APIs listadas

145

Com plano grátis

Grátis

Mais barata (input/1M)

$30.00

Mais cara (input/1M)

Como ler a tabela: preços são por milhão de tokens (input = o que você envia; output = a resposta do modelo). Em português, 1.000 tokens ≈ 750 palavras ≈ 1 página A4. O valor em BRL usa câmbio R$ 5.70/USD — substitua pelo câmbio do seu banco para estimativas precisas. Preços verificados nas páginas oficiais de precificação de cada empresa.

Preços por Milhão de Tokens — APIs com Custo

#ModeloInput USD/1MInput R$/1M
1Jamba 1.7 MiniGrátis
2Jamba Reasoning 3BGrátis
3Qwen Chat 14BGrátis
4Qwen Chat 72BGrátis
5Qwen1.5 Chat 110BGrátis
6Qwen2 Instruct 72BGrátis
7Qwen2.5 72B InstructGrátis
8Qwen2.5 Coder 32B InstructGrátis
9Qwen2.5 Coder Instruct 7B Grátis
10Qwen2.5 Instruct 32BGrátis
11Qwen3 4B 2507 (Reasoning)Grátis
12Qwen3 4B 2507 InstructGrátis
13Qwen3 VL 4B (Reasoning)Grátis
14Qwen3 VL 4B InstructGrátis
15Qwen3.5 0.8B (Non-reasoning)Grátis
16Qwen3.5 0.8B (Reasoning)Grátis
17Qwen3.5 2B (Reasoning)Grátis
18QwQ 32B-PreviewGrátis
19Llama 3.1 Tulu3 405BGrátis
20Molmo 7B-DGrátis
21Molmo2-8BGrátis
22OLMo 2 32BGrátis
23OLMo 2 7BGrátis
24Olmo 3 7B ThinkGrátis
25Olmo 3.1 32B ThinkGrátis
26Olmo 3 32B ThinkGrátis
27Olmo 3.1 32B InstructGrátis
28Claude 2.0Grátis
29Claude 2.1Grátis
30Claude 3.7 Sonnet (thinking)Grátis
31Claude InstantGrátis
32ERNIE 5.0 Thinking PreviewGrátis
33Doubao Seed CodeGrátis
34JT-35B-FlashGrátis
35JT-35B-FlashGrátis
36JT-MINIGrátis
37Command A+Grátis
38North Mini CodeGrátis
39Tiny Aya GlobalGrátis
40DBRX InstructGrátis
41DeepSeek Coder V2 Lite InstructGrátis
42DeepSeek LLM 67B Chat (V1)Grátis
43DeepSeek R1 0528 Qwen3 8BGrátis
44DeepSeek R1 Distill Llama 8BGrátis
45DeepSeek R1 Distill Qwen 1.5BGrátis
46DeepSeek R1 Distill Qwen 14BGrátis
47DeepSeek V3.2 SpecialeGrátis
48DeepSeek-Coder-V2Grátis
49DeepSeek-V2-ChatGrátis
50DeepSeek-V2.5Grátis
51DeepSeek-V2.5 (Dec '24)Grátis
52DeepSeek: R1 Distill Qwen 32BGrátis
53DiffusionGemma 26B A4BGrátis
54Gemini 1.0 ProGrátis
55Gemini 1.0 UltraGrátis
56Gemini 1.5 Flash (May '24)Grátis
57Gemini 1.5 Flash (Sep '24)Grátis
58Gemini 1.5 Flash-8BGrátis
59Gemini 1.5 Pro (May '24)Grátis
60Gemini 1.5 Pro (Sep '24)Grátis
61Gemini 2.0 Flash (experimental)Grátis
62Gemini 2.0 Flash Thinking Experimental (Dec '24)Grátis
63Gemini 2.0 Flash Thinking Experimental (Jan '25)Grátis
64Gemini 2.0 Flash-Lite (Feb '25)Grátis
65Gemini 2.0 Flash-Lite (Preview)Grátis
66Gemini 2.0 Pro Experimental (Feb '25)Grátis
67Gemini 2.5 Flash Preview (Non-reasoning)Grátis
68Gemini 2.5 Flash Preview (Sep '25) (Reasoning)Grátis
69Gemini 2.5 Pro Preview (Mar' 25)Grátis
70Gemini 3 Deep ThinkGrátis
71Gemma 3 12BGrátis
72Gemma 3 1B InstructGrátis
73Gemma 3 270MGrátis
74Gemma 3 27BGrátis
75Gemma 3 4BGrátis
76Gemma 3n E2B InstructGrátis
77Gemma 3n E4B Instruct Preview (May '25)Grátis
78Gemma 4 31BGrátis
79Gemma 4 E2B (Non-reasoning)Grátis
80Gemma 4 E2B (Reasoning)Grátis
81Gemma 4 E4B (Non-reasoning)Grátis
82Gemma 4 E4B (Reasoning)Grátis
83PALM-2Grátis
84Granite 4.0 1BGrátis
85Granite 4.0 350MGrátis
86Granite 4.0 H 1BGrátis
87Granite 4.0 H 350MGrátis
88Granite 4.0 MicroGrátis
89Granite 4.1 30BGrátis
90Granite 4.1 3BGrátis
91Ling-1TGrátis
92Ling-mini-2.0Grátis
93Ring-1TGrátis
94Kimi Linear 48B A3B InstructGrátis
95Mi:dm K 2.5 ProGrátis
96Mi:dm K 2.5 Pro PreviewGrátis
97EXAONE 4.5 33BGrátis
98K-EXAONE (Reasoning)Grátis
99Exaone 4.0 1.2B (Non-reasoning)Grátis
100EXAONE 4.0 32B (Non-reasoning)Grátis
101EXAONE 4.0 32B (Reasoning)Grátis
102LFM 40BGrátis
103LFM2 1.2BGrátis
104LFM2 2.6BGrátis
105LFM2 8B A1BGrátis
106LFM2.5-1.2B-InstructGrátis
107LFM2.5-1.2B-ThinkingGrátis
108LFM2.5-8B-A1BGrátis
109LFM2.5-VL-1.6BGrátis
110LongCat Flash LiteGrátis
111K2 Think V2Grátis
112K2-V2 (high)Grátis
113K2-V2 (medium)Grátis
114Llama 2 Chat 13BGrátis
115Llama 2 Chat 70BGrátis
116Llama 65BGrátis
117Muse SparkGrátis
118Phi-3 Mini Instruct 3.8BGrátis
119Phi-4 Mini InstructGrátis
120Phi-4 Multimodal InstructGrátis
121MiniMax M1 40kGrátis
122Devstral 2Grátis
123Devstral Small (May '25)Grátis
124Magistral Medium 1Grátis
125Magistral Small 1Grátis
126Magistral Small 1.2Grátis
127Mixtral 8x22B InstructGrátis
128Magistral Medium 1.2Grátis
129Mistral: SabaGrátis
130Motif-2-12.7B-ReasoningGrátis
131Nanbeige4.1-3BGrátis
132HyperCLOVA X SEED Think (32B)Grátis
133DeepHermes 3 - Llama-3.1 8B Preview (Non-reasoning)Grátis
134DeepHermes 3 - Mistral 24B Preview (Non-reasoning)Grátis
135Llama 3.1 Nemotron Nano 4B v1.1 (Reasoning)Grátis
136Llama 3.3 Nemotron Super 49B v1 (Non-reasoning)Grátis
137Llama 3.3 Nemotron Super 49B v1 (Reasoning)Grátis
138Nemotron Cascade 2 30B A3BGrátis
139NVIDIA Nemotron 3 Nano 4BGrátis
140GPT-3.5 Turbo (0613)Grátis
141GPT-4.5 (Preview)Grátis
142GPT-4o (ChatGPT)Grátis
143GPT-4o (March 2025, chatgpt-4o-latest)Grátis
144GPT-4o mini Realtime (Dec '24)Grátis
145GPT-4o Realtime (Dec '24)Grátis
146Gemma 3n E4B Instruct$0.020R$ 0.114
147Mistral: Mistral Nemo$0.020R$ 0.114
148Qwen3.5 4B (Non-reasoning)$0.030R$ 0.171
149Qwen3.5 4B (Reasoning)$0.030R$ 0.171
150Granite 3.3 8B (Non-reasoning)$0.030R$ 0.171
151LFM2-24B-A2B$0.030R$ 0.171
152Amazon: Nova Micro 1.0$0.035R$ 0.200
153Nova Micro$0.035R$ 0.200
154Cohere: Command R7B (12-2024)$0.037R$ 0.214
155Qwen: Qwen2.5 7B Instruct$0.040R$ 0.228
156HyperNova 60B 2605$0.040R$ 0.228
157NVIDIA Nemotron Nano 9B V2 (Reasoning)$0.040R$ 0.228
158Arcee AI: Trinity Mini$0.045R$ 0.257
159Llama 3 8B Instruct$0.045R$ 0.257
160Granite 4.1 8B$0.050R$ 0.285
161Llama 2 Chat 7B$0.050R$ 0.285
162Llama 3.2 1B Instruct$0.050R$ 0.285
163NVIDIA Nemotron 3 Nano 30B A3B (Non-reasoning)$0.050R$ 0.285
164NVIDIA Nemotron Nano 9B V2 (Non-reasoning)$0.050R$ 0.285
165GPT-5 Nano$0.050R$ 0.285
166GPT-5 nano (minimal)$0.050R$ 0.285
167NVIDIA Nemotron 3 Nano 30B A3B (Reasoning)$0.055R$ 0.314
168Amazon: Nova Lite 1.0$0.060R$ 0.342
169Nova Lite$0.060R$ 0.342
170Gemma 3n 4B$0.060R$ 0.342
171Granite 4.0 H Small$0.060R$ 0.342
172MythoMax 13B$0.060R$ 0.342
173Baidu: ERNIE 4.5 21B A3B Thinking$0.070R$ 0.399
174ByteDance Seed: Seed 1.6 Flash$0.075R$ 0.427
175Gemini 2.0 Flash Lite$0.075R$ 0.427
176Llama 3.1 8B Instruct$0.075R$ 0.427
177Mistral: Mistral Small 3.2 24B$0.075R$ 0.427
178Nemotron 3 Nano Omni 30B A3B Reasoning$0.075R$ 0.427
179Qwen: Qwen3 30B A3B Thinking 2507$0.080R$ 0.456
180Qwen3.5 9B (Reasoning)$0.100R$ 0.570
181Qwen3.5 Omni Flash$0.100R$ 0.570
182Olmo 3 7B Instruct$0.100R$ 0.570
183ByteDance: UI-TARS 7B $0.100R$ 0.570
184Gemini 2.5 Flash Lite$0.100R$ 0.570
185Gemini 2.5 Flash-Lite Preview (Sep '25) (Non-reasoning)$0.100R$ 0.570
186Gemini 2.5 Flash-Lite Preview (Sep '25) (Reasoning)$0.100R$ 0.570
187Gemma 4 12B (Reasoning)$0.100R$ 0.570
188Ling 2.6 Flash$0.100R$ 0.570
189Devstral Small (Jul '25)$0.100R$ 0.570
190Devstral Small 2$0.100R$ 0.570
191Ministral 3 3B$0.100R$ 0.570
192Mistral Small 3$0.100R$ 0.570
193Mistral Small 3.1$0.100R$ 0.570
194Mistral Small 3.2$0.100R$ 0.570
195Mistral: Ministral 3 3B 2512$0.100R$ 0.570
196Mistral: Mistral Small Creative$0.100R$ 0.570
197Mistral: Voxtral Small 24B 2507$0.100R$ 0.570
198Llama Nemotron Super 49B v1.5 (Non-reasoning)$0.100R$ 0.570
199Llama Nemotron Super 49B v1.5 (Reasoning)$0.100R$ 0.570
200GPT-4.1 Nano$0.100R$ 0.570
201Qwen3 0.6B (Non-reasoning)$0.110R$ 0.627
202Qwen3 0.6B (Reasoning)$0.110R$ 0.627
203Qwen3 1.7B (Non-reasoning)$0.110R$ 0.627
204Qwen3 1.7B (Reasoning)$0.110R$ 0.627
205Qwen3 4B (Non-reasoning)$0.110R$ 0.627
206Qwen3 4B (Reasoning)$0.110R$ 0.627
207Mistral: Mistral 7B Instruct v0.1$0.110R$ 0.627
208Microsoft: Phi 4$0.125R$ 0.713
209Gemma 4 26B A4B $0.130R$ 0.741
210Nous: Hermes 4 70B$0.130R$ 0.741
211Hermes 4 - Llama-3.1 70B (Non-reasoning)$0.130R$ 0.741
212Hermes 4 - Llama-3.1 70B (Reasoning)$0.130R$ 0.741
213Nex AGI: DeepSeek V3.1 Nex N1$0.135R$ 0.770
214Baidu: ERNIE 4.5 VL 28B A3B$0.140R$ 0.798
215DeepSeek V4 Flash$0.140R$ 0.798
216Ling-flash-2.0$0.140R$ 0.798
217Ring-flash-2.0$0.140R$ 0.798
218NousResearch: Hermes 2 Pro - Llama-3 8B$0.140R$ 0.798
219Qwen: Qwen3 235B A22B Thinking 2507$0.149R$ 0.852
220Qwen3 32B (Non-reasoning)$0.150R$ 0.855
221EssentialAI: Rnj 1 Instruct$0.150R$ 0.855
222Gemini 2.0 Flash$0.150R$ 0.855
223Llama 3.2 3B Instruct$0.150R$ 0.855
224Ministral 3 8B$0.150R$ 0.855
225Mistral: Ministral 3 8B 2512$0.150R$ 0.855
226GPT-4o-mini (2024-07-18)$0.150R$ 0.855
227GPT-4o-mini Search Preview$0.150R$ 0.855
228Llama 4 Scout$0.170R$ 0.969
229Qwen: Qwen3 VL 8B Instruct$0.180R$ 1.03
230Qwen3 8B (Non-reasoning)$0.180R$ 1.03
231Qwen3 8B (Reasoning)$0.180R$ 1.03
232Qwen3 VL 8B (Reasoning)$0.180R$ 1.03
233Arcee AI: Spotlight$0.180R$ 1.03
234Llama Guard 4 12B$0.180R$ 1.03
235Jamba 1.5 Mini$0.200R$ 1.14
236Jamba 1.6 Mini$0.200R$ 1.14
237Qwen: Qwen3 30B A3B Instruct 2507$0.200R$ 1.14
238Qwen: Qwen3 VL 30B A3B Instruct$0.200R$ 1.14
239Qwen3 30B A3B (Reasoning)$0.200R$ 1.14
240Qwen3 30B A3B 2507 (Reasoning)$0.200R$ 1.14
241Qwen3 30B A3B 2507 Instruct$0.200R$ 1.14
242Qwen3 VL 30B A3B (Reasoning)$0.200R$ 1.14
243MiniMax: MiniMax-01$0.200R$ 1.14
244Ministral 3 14B$0.200R$ 1.14
245Mistral Small (Sep '24)$0.200R$ 1.14
246Mistral: Ministral 3 14B 2512$0.200R$ 1.14
247Mistral: Mistral Small 4$0.200R$ 1.14
248NVIDIA Nemotron Nano 12B v2 VL (Non-reasoning)$0.200R$ 1.14
249NVIDIA Nemotron Nano 12B v2 VL (Reasoning)$0.200R$ 1.14
250DeepSeek V3$0.200R$ 1.14
251Seed-OSS-36B-Instruct$0.210R$ 1.20
252Arcee AI: Trinity Large Thinking$0.220R$ 1.25
253Qwen3 14B (Non-reasoning)$0.235R$ 1.34
254Trinity Large Thinking$0.235R$ 1.34
255Llama 3.2 11B Vision Instruct$0.245R$ 1.40
256Qwen: Qwen2.5 VL 72B Instruct$0.250R$ 1.43
257Qwen3 Omni 30B A3B (Reasoning)$0.250R$ 1.43
258Qwen3 Omni 30B A3B Instruct$0.250R$ 1.43
259Anthropic: Claude 3 Haiku$0.250R$ 1.43
260ByteDance Seed: Seed-2.0-Lite$0.250R$ 1.43
261Gemini 3.1 Flash Lite$0.250R$ 1.43
262Gemini 3.1 Flash Lite Preview$0.250R$ 1.43
263Google: Nano Banana 2 Lite (Gemini 3.1 Flash Lite Image)$0.250R$ 1.43
264Inception: Mercury 2$0.250R$ 1.43
265Mistral 7B Instruct$0.250R$ 1.43
266GPT-5 Mini$0.250R$ 1.43
267GPT-5 mini (minimal)$0.250R$ 1.43
268GPT-5.1-Codex-Mini$0.250R$ 1.43
269DeepSeek V3.1 Terminus$0.270R$ 1.54
270DeepSeek V3.2 Exp$0.270R$ 1.54
271DeepSeek V3.2 Exp (Non-reasoning)$0.275R$ 1.57
272Baidu: ERNIE 4.5 300B A47B $0.280R$ 1.60
273DeepSeek V3.2$0.280R$ 1.60
274DeepSeek V3.2 Exp (Reasoning)$0.280R$ 1.60
275Amazon: Nova 2 Lite$0.300R$ 1.71
276Nova 2.0 Lite (high)$0.300R$ 1.71
277Nova 2.0 Omni (low)$0.300R$ 1.71
278Nova 2.0 Omni (medium)$0.300R$ 1.71
279Nova 2.0 Omni (Non-reasoning)$0.300R$ 1.71
280Gemini 2.5 Flash$0.300R$ 1.71
281Gemini 2.5 Flash Preview (Reasoning)$0.300R$ 1.71
282Nano Banana (Gemini 2.5 Flash Image)$0.300R$ 1.71
283Ling-2.6-1T$0.300R$ 1.71
284Ring-2.6-1T$0.300R$ 1.71
285KAT-Coder-Pro V1$0.300R$ 1.71
286Kwaipilot: KAT-Coder-Pro V2$0.300R$ 1.71
287MiniMax-M2$0.300R$ 1.71
288MiniMax-M3$0.300R$ 1.71
289MiniMax: MiniMax M2-her$0.300R$ 1.71
290MiniMax: MiniMax M2.1$0.300R$ 1.71
291MiniMax: MiniMax M2.5$0.300R$ 1.71
292MiniMax: MiniMax M2.7$0.300R$ 1.71
293Mistral: Codestral 2508$0.300R$ 1.71
294Nous: Hermes 3 70B Instruct$0.300R$ 1.71
295Hermes 3 - Llama-3.1 70B$0.300R$ 1.71
296NVIDIA Nemotron 3 Super 120B A12B (Reasoning)$0.300R$ 1.71
297Qwen3 14B (Reasoning)$0.350R$ 1.99
298Llama 4 Maverick$0.350R$ 1.99
299Mistral: Mistral Small 3.1 24B$0.350R$ 1.99
300Qwen3.5 Omni Plus$0.400R$ 2.28
301Qwen3.7 Plus$0.400R$ 2.28
302MiniMax: MiniMax M1$0.400R$ 2.28
303Mistral: Devstral 2 2512$0.400R$ 2.28
304Mistral: Devstral Medium$0.400R$ 2.28
305Mistral: Mistral Medium 3$0.400R$ 2.28
306Mistral: Mistral Medium 3.1$0.400R$ 2.28
307GPT-4.1 Mini$0.400R$ 2.28
308Baidu: ERNIE 4.5 VL 424B A47B $0.420R$ 2.39
309DeepSeek V4 Pro$0.435R$ 2.48
310Qwen: Qwen3 Coder 30B A3B Instruct$0.450R$ 2.56
311Mistral: Mixtral 8x7B Instruct$0.450R$ 2.56
312Llama Guard 3 8B$0.480R$ 2.74
313Qwen: Qwen3 Next 80B A3B Instruct$0.500R$ 2.85
314Qwen3 Next 80B A3B (Reasoning)$0.500R$ 2.85
315Arcee AI: Coder Large$0.500R$ 2.85
316Command-R (Mar '24)$0.500R$ 2.85
317Gemini 3 Flash Preview (Non-reasoning)$0.500R$ 2.85
318Gemini 3 Flash Preview (Reasoning)$0.500R$ 2.85
319Google: Nano Banana 2 (Gemini 3.1 Flash Image)$0.500R$ 2.85
320Nano Banana 2 (Gemini 3.1 Flash Image Preview)$0.500R$ 2.85
321Mistral Large 3$0.500R$ 2.85
322Nex-N2-Pro$0.500R$ 2.85
323GPT-3.5 Turbo$0.500R$ 2.85
324GPT-3.5 Turbo$0.500R$ 2.85
325MiniMax M1 80k$0.550R$ 3.14
326Llama 3.1 70B Instruct$0.560R$ 3.19
327MoonshotAI: Kimi K2 0711$0.570R$ 3.25
328Llama 3.3 70B Instruct$0.580R$ 3.31
329Kimi K2$0.585R$ 3.33
330DeepSeek V3.1$0.590R$ 3.36
331Kimi K2 Thinking$0.600R$ 3.42
332MoonshotAI: Kimi K2 0905$0.600R$ 3.42
333MoonshotAI: Kimi K2.5$0.600R$ 3.42
334Llama 3.1 Nemotron Ultra 253B v1 (Reasoning)$0.600R$ 3.42
335GPT Audio Mini$0.600R$ 3.42
336WizardLM-2 8x22B$0.620R$ 3.53
337Gemma 2 27B$0.650R$ 3.71
338Llama 3 70B Instruct$0.650R$ 3.71
339QwQ 32B$0.660R$ 3.76
340Nemotron 3 Ultra 550B A55B (Reasoning)$0.675R$ 3.85
341Qwen: Qwen3 235B A22B Instruct 2507$0.700R$ 3.99
342Qwen: Qwen3 VL 235B A22B Instruct$0.700R$ 3.99
343Qwen: Qwen3 VL 32B Instruct$0.700R$ 3.99
344Qwen3 235B A22B (Reasoning)$0.700R$ 3.99
345Qwen3 32B (Reasoning)$0.700R$ 3.99
346Qwen3 VL 235B A22B (Reasoning)$0.700R$ 3.99
347Qwen3 VL 32B (Reasoning)$0.700R$ 3.99
348DeepSeek: R1$0.700R$ 3.99
349R1 Distill Llama 70B$0.700R$ 3.99
350Arcee AI: Virtuoso Large$0.750R$ 4.28
351Mancer: Weaver (alpha)$0.750R$ 4.28
352AionLabs: Aion-2.0$0.800R$ 4.56
353AionLabs: Aion-RP 1.0 (8B)$0.800R$ 4.56
354AlfredPros: CodeLLaMa 7B Instruct Solidity$0.800R$ 4.56
355Amazon: Nova Pro 1.0$0.800R$ 4.56
356Nova Pro$0.800R$ 4.56
357Claude 3.5 Haiku$0.800R$ 4.56
358Morph: Morph V3 Fast$0.800R$ 4.56
359Arcee AI: Maestro Reasoning$0.900R$ 5.13
360Morph: Morph V3 Large$0.900R$ 5.13
361Kimi K2.7 Code$0.950R$ 5.42
362MoonshotAI: Kimi K2.6$0.950R$ 5.42
363Claude 4.5 Haiku (Reasoning)$1.00R$ 5.70
364Claude Haiku 4.5$1.00R$ 5.70
365Mistral Small (Feb '24)$1.00R$ 5.70
366Nous: Hermes 3 405B Instruct$1.00R$ 5.70
367Nous: Hermes 4 405B$1.00R$ 5.70
368Hermes 4 - Llama-3.1 405B (Non-reasoning)$1.00R$ 5.70
369Hermes 4 - Llama-3.1 405B (Reasoning)$1.00R$ 5.70
370DeepSeek V3 0324$1.20R$ 6.81
371Qwen3 Max (Preview)$1.20R$ 6.84
372Qwen3 Max Thinking (Preview)$1.20R$ 6.84
373Llama 3.1 Nemotron 70B Instruct$1.20R$ 6.84
374Nova 2.0 Pro Preview (medium)$1.25R$ 7.13
375Cogito v2.1 (Reasoning)$1.25R$ 7.13
376Deep Cogito: Cogito v2.1 671B$1.25R$ 7.13
377Gemini 2.5 Pro$1.25R$ 7.13
378Gemini 2.5 Pro Preview (May' 25)$1.25R$ 7.13
379Gemini 2.5 Pro Preview 05-06$1.25R$ 7.13
380Gemini 2.5 Pro Preview 06-05$1.25R$ 7.13
381GPT-5$1.25R$ 7.13
382GPT-5 (ChatGPT)$1.25R$ 7.13
383GPT-5 (minimal)$1.25R$ 7.13
384GPT-5 Chat$1.25R$ 7.13
385GPT-5 Codex$1.25R$ 7.13
386GPT-5.1$1.25R$ 7.13
387GPT-5.1 Chat$1.25R$ 7.13
388GPT-5.1-Codex$1.25R$ 7.13
389GPT-5.1-Codex-Max$1.25R$ 7.13
390Qwen3.6 Max Preview$1.30R$ 7.41
391DeepSeek R1 (Jan '25)$1.35R$ 7.70
392Llama 3.2 Instruct 90B (Vision)$1.38R$ 7.87
393Qwen3 Coder 480B A35B Instruct$1.50R$ 8.55
394Gemini 3.5 Flash (minimal)$1.50R$ 8.55
395Google: Gemini 3.5 Flash$1.50R$ 8.55
396Qwen2.5 Max$1.60R$ 9.12
397GPT-5.2$1.75R$ 9.97
398GPT-5.2-Codex$1.75R$ 9.97
399GPT-5.3 Chat$1.75R$ 9.97
400GPT-5.3-Codex$1.75R$ 9.97
401AI21: Jamba Large 1.7$2.00R$ 11.40
402Jamba 1.5 Large$2.00R$ 11.40
403Jamba 1.6 Large$2.00R$ 11.40
404Gemini 3 Pro Preview (high)$2.00R$ 11.40
405Gemini 3 Pro Preview (low)$2.00R$ 11.40
406Gemini 3.1 Pro Preview$2.00R$ 11.40
407Gemini 3.1 Pro Preview Custom Tools$2.00R$ 11.40
408Google: Nano Banana Pro (Gemini 3 Pro Image)$2.00R$ 11.40
409Nano Banana Pro (Gemini 3 Pro Image Preview)$2.00R$ 11.40
410Mistral Large 2 (Jul '24)$2.00R$ 11.40
411Mistral Large$2.00R$ 11.40
412Mistral: Mixtral 8x22B Instruct$2.00R$ 11.40
413Mistral: Pixtral Large 2411$2.00R$ 11.40
414GPT-4.1$2.00R$ 11.40
415Qwen3.7 Max$2.50R$ 14.25
416Amazon: Nova Premier 1.0$2.50R$ 14.25
417Cohere: Command R+ (08-2024)$2.50R$ 14.25
418Inflection: Inflection 3 Pi$2.50R$ 14.25
419Inflection: Inflection 3 Productivity$2.50R$ 14.25
420GPT Audio$2.50R$ 14.25
421GPT-4o (2024-08-06)$2.50R$ 14.25
422GPT-4o (2024-11-20)$2.50R$ 14.25
423GPT-4o Audio$2.50R$ 14.25
424GPT-4o Search Preview$2.50R$ 14.25
425GPT-5 Image Mini$2.50R$ 14.25
426Llama 3.1 Instruct 405B$2.75R$ 15.68
427Mistral Medium$2.75R$ 15.68
428Mistral: Mistral Medium 3.5$2.75R$ 15.68
429Claude Sonnet 5$3.00R$ 17.10
430Claude 3 Sonnet$3.00R$ 17.10
431Claude 3.5 Sonnet (June '24)$3.00R$ 17.10
432Claude 3.5 Sonnet (Oct '24)$3.00R$ 17.10
433Claude 3.7 Sonnet$3.00R$ 17.10
434Claude 4 Sonnet (Reasoning)$3.00R$ 17.10
435Claude 4.5 Sonnet (Non-reasoning)$3.00R$ 17.10
436Claude 4.5 Sonnet (Reasoning)$3.00R$ 17.10
437Claude Sonnet 4$3.00R$ 17.10
438Claude Sonnet 4.5$3.00R$ 17.10
439Claude Sonnet 4.6$3.00R$ 17.10
440Claude Sonnet 4.6 (Adaptive Reasoning, Max Effort)$3.00R$ 17.10
441Claude Sonnet 4.6 (Non-reasoning, Low Effort)$3.00R$ 17.10
442Command-R+ (Apr '24)$3.00R$ 17.10
443Magnum v4 72B$3.00R$ 17.10
444Goliath 120B$3.75R$ 21.38
445AionLabs: Aion-1.0$4.00R$ 22.80
446Mistral Large 2 (Nov '24)$4.00R$ 22.80
447Claude Opus 4.5$5.00R$ 28.50
448Claude Opus 4.5 (Reasoning)$5.00R$ 28.50
449Claude Opus 4.6$5.00R$ 28.50
450Claude Opus 4.6 (Adaptive Reasoning, Max Effort)$5.00R$ 28.50
451Claude Opus 4.7$5.00R$ 28.50
452Claude Opus 4.8 (Adaptive Reasoning, Max Effort)$5.00R$ 28.50
453GPT Chat Latest$5.00R$ 28.50
454Claude Fable 5 (Adaptive Reasoning, Max Effort, Opus 4.8 Fallback)$10.00R$ 57.00
455GPT-4 Turbo$10.00R$ 57.00
456GPT-4 Turbo Preview$10.00R$ 57.00
457GPT-5 Image$10.00R$ 57.00
458Claude 3 Opus$15.00R$ 85.50
459Claude 4 Opus (Reasoning)$15.00R$ 85.50
460Claude 4.1 Opus (Non-reasoning)$15.00R$ 85.50
461Claude 4.1 Opus (Reasoning)$15.00R$ 85.50
462Claude Opus 4$15.00R$ 85.50
463Claude Opus 4.1$15.00R$ 85.50
464GPT-5 Pro$15.00R$ 85.50
465GPT-5.2 Pro$21.00R$ 119.70
466Claude Opus 4.6 (Fast)$30.00R$ 171.00
467Claude Opus 4.7 (Fast)$30.00R$ 171.00

APIs com Plano Gratuito

Estes modelos oferecem acesso via API sem custo (com limites de rate). Ideais para protótipos e projetos de baixo volume.

Claude 2.0

Anthropic

Grátis

Claude 2.1

Anthropic

Grátis

Claude 3.7 Sonnet (thinking)

Anthropic

Grátis

Claude Instant

Anthropic

Grátis

Command A+

Cohere

Grátis

DBRX Instruct

Databricks

Grátis

DeepHermes 3 - Llama-3.1 8B Preview (Non-reasoning)

Nous Research

Grátis

DeepHermes 3 - Mistral 24B Preview (Non-reasoning)

Nous Research

Grátis

DeepSeek Coder V2 Lite Instruct

DeepSeek

Grátis

DeepSeek LLM 67B Chat (V1)

DeepSeek

Grátis

DeepSeek R1 0528 Qwen3 8B

DeepSeek

Grátis

DeepSeek R1 Distill Llama 8B

DeepSeek

Grátis

DeepSeek R1 Distill Qwen 1.5B

DeepSeek

Grátis

DeepSeek R1 Distill Qwen 14B

DeepSeek

Grátis

DeepSeek V3.2 Speciale

DeepSeek

Grátis

DeepSeek-Coder-V2

DeepSeek

Grátis

DeepSeek-V2-Chat

DeepSeek

Grátis

DeepSeek-V2.5

DeepSeek

Grátis

DeepSeek-V2.5 (Dec '24)

DeepSeek

Grátis

DeepSeek: R1 Distill Qwen 32B

DeepSeek

Grátis

Devstral 2

Mistral

Grátis

Devstral Small (May '25)

Mistral

Grátis

DiffusionGemma 26B A4B

Google

Grátis

Doubao Seed Code

ByteDance Seed

Grátis

ERNIE 5.0 Thinking Preview

Baidu

Grátis

Exaone 4.0 1.2B (Non-reasoning)

LG AI Research

Grátis

EXAONE 4.0 32B (Non-reasoning)

LG AI Research

Grátis

EXAONE 4.0 32B (Reasoning)

LG AI Research

Grátis

EXAONE 4.5 33B

LG AI

Grátis

Gemini 1.0 Pro

Google

Grátis

Gemini 1.0 Ultra

Google

Grátis

Gemini 1.5 Flash (May '24)

Google

Grátis

Gemini 1.5 Flash (Sep '24)

Google

Grátis

Gemini 1.5 Flash-8B

Google

Grátis

Gemini 1.5 Pro (May '24)

Google

Grátis

Gemini 1.5 Pro (Sep '24)

Google

Grátis

Gemini 2.0 Flash (experimental)

Google

Grátis

Gemini 2.0 Flash Thinking Experimental (Dec '24)

Google

Grátis

Gemini 2.0 Flash Thinking Experimental (Jan '25)

Google

Grátis

Gemini 2.0 Flash-Lite (Feb '25)

Google

Grátis

Gemini 2.0 Flash-Lite (Preview)

Google

Grátis

Gemini 2.0 Pro Experimental (Feb '25)

Google

Grátis

Gemini 2.5 Flash Preview (Non-reasoning)

Google

Grátis

Gemini 2.5 Flash Preview (Sep '25) (Reasoning)

Google

Grátis

Gemini 2.5 Pro Preview (Mar' 25)

Google

Grátis

Gemini 3 Deep Think

Google

Grátis

Gemma 3 12B

Google

Grátis

Gemma 3 1B Instruct

Google

Grátis

Gemma 3 270M

Google

Grátis

Gemma 3 27B

Google

Grátis

Gemma 3 4B

Google

Grátis

Gemma 3n E2B Instruct

Google

Grátis

Gemma 3n E4B Instruct Preview (May '25)

Google

Grátis

Gemma 4 31B

Google

Grátis

Gemma 4 E2B (Non-reasoning)

Google

Grátis

Gemma 4 E2B (Reasoning)

Google

Grátis

Gemma 4 E4B (Non-reasoning)

Google

Grátis

Gemma 4 E4B (Reasoning)

Google

Grátis

GPT-3.5 Turbo (0613)

OpenAI

Grátis

GPT-4.5 (Preview)

OpenAI

Grátis

GPT-4o (ChatGPT)

OpenAI

Grátis

GPT-4o (March 2025, chatgpt-4o-latest)

OpenAI

Grátis

GPT-4o mini Realtime (Dec '24)

OpenAI

Grátis

GPT-4o Realtime (Dec '24)

OpenAI

Grátis

Granite 4.0 1B

IBM

Grátis

Granite 4.0 350M

IBM

Grátis

Granite 4.0 H 1B

IBM

Grátis

Granite 4.0 H 350M

IBM

Grátis

Granite 4.0 Micro

IBM

Grátis

Granite 4.1 30B

IBM

Grátis

Granite 4.1 3B

IBM

Grátis

HyperCLOVA X SEED Think (32B)

Naver

Grátis

Jamba 1.7 Mini

AI21 Labs

Grátis

Jamba Reasoning 3B

AI21 Labs

Grátis

JT-35B-Flash

China Mobile

Grátis

JT-35B-Flash

China Mobile

Grátis

JT-MINI

China Mobile

Grátis

K-EXAONE (Reasoning)

LG AI

Grátis

K2 Think V2

MBZUAI Institute of Foundation Models

Grátis

K2-V2 (high)

MBZUAI Institute of Foundation Models

Grátis

K2-V2 (medium)

MBZUAI Institute of Foundation Models

Grátis

Kimi Linear 48B A3B Instruct

Kimi

Grátis

LFM 40B

Liquid AI

Grátis

LFM2 1.2B

Liquid AI

Grátis

LFM2 2.6B

Liquid AI

Grátis

LFM2 8B A1B

Liquid AI

Grátis

LFM2.5-1.2B-Instruct

Liquid AI

Grátis

LFM2.5-1.2B-Thinking

Liquid AI

Grátis

LFM2.5-8B-A1B

Liquid AI

Grátis

LFM2.5-VL-1.6B

Liquid AI

Grátis

Ling-1T

InclusionAI

Grátis

Ling-mini-2.0

InclusionAI

Grátis

Llama 2 Chat 13B

Meta

Grátis

Llama 2 Chat 70B

Meta

Grátis

Llama 3.1 Nemotron Nano 4B v1.1 (Reasoning)

NVIDIA

Grátis

Llama 3.1 Tulu3 405B

Allen Institute for AI

Grátis

Llama 3.3 Nemotron Super 49B v1 (Non-reasoning)

NVIDIA

Grátis

Llama 3.3 Nemotron Super 49B v1 (Reasoning)

NVIDIA

Grátis

Llama 65B

Meta

Grátis

LongCat Flash Lite

LongCat

Grátis

Magistral Medium 1

Mistral

Grátis

Magistral Medium 1.2

Mistral AI

Grátis

Magistral Small 1

Mistral

Grátis

Magistral Small 1.2

Mistral

Grátis

Mi:dm K 2.5 Pro

Korea Telecom

Grátis

Mi:dm K 2.5 Pro Preview

Korea Telecom

Grátis

MiniMax M1 40k

MiniMax

Grátis

Mistral: Saba

Mistral AI

Grátis

Mixtral 8x22B Instruct

Mistral

Grátis

Molmo 7B-D

Allen Institute for AI

Grátis

Molmo2-8B

Allen Institute for AI

Grátis

Motif-2-12.7B-Reasoning

Motif Technologies

Grátis

Muse Spark

Meta

Grátis

Nanbeige4.1-3B

Nanbeige

Grátis

Nemotron Cascade 2 30B A3B

NVIDIA

Grátis

North Mini Code

Cohere

Grátis

NVIDIA Nemotron 3 Nano 4B

NVIDIA

Grátis

OLMo 2 32B

Allen Institute for AI

Grátis

OLMo 2 7B

Allen Institute for AI

Grátis

Olmo 3 32B Think

AllenAI

Grátis

Olmo 3 7B Think

Allen Institute for AI

Grátis

Olmo 3.1 32B Instruct

AllenAI

Grátis

Olmo 3.1 32B Think

Allen Institute for AI

Grátis

PALM-2

Google

Grátis

Phi-3 Mini Instruct 3.8B

Microsoft

Grátis

Phi-4 Mini Instruct

Microsoft

Grátis

Phi-4 Multimodal Instruct

Microsoft

Grátis

Qwen Chat 14B

Alibaba

Grátis

Qwen Chat 72B

Alibaba

Grátis

Qwen1.5 Chat 110B

Alibaba

Grátis

Qwen2 Instruct 72B

Alibaba

Grátis

Qwen2.5 72B Instruct

Alibaba

Grátis

Qwen2.5 Coder 32B Instruct

Alibaba

Grátis

Qwen2.5 Coder Instruct 7B

Alibaba

Grátis

Qwen2.5 Instruct 32B

Alibaba

Grátis

Qwen3 4B 2507 (Reasoning)

Alibaba

Grátis

Qwen3 4B 2507 Instruct

Alibaba

Grátis

Qwen3 VL 4B (Reasoning)

Alibaba

Grátis

Qwen3 VL 4B Instruct

Alibaba

Grátis

Qwen3.5 0.8B (Non-reasoning)

Alibaba

Grátis

Qwen3.5 0.8B (Reasoning)

Alibaba

Grátis

Qwen3.5 2B (Reasoning)

Alibaba

Grátis

QwQ 32B-Preview

Alibaba

Grátis

Ring-1T

InclusionAI

Grátis

Tiny Aya Global

Cohere

Grátis

Guia de Custo de APIs de IA para o Brasil

Como Funciona a Precificação por Token

A grande maioria das APIs de LLMs cobra por tokens processados, divididos em duas categorias: tokens de input(o texto que você envia ao modelo — seu prompt, contexto e histórico) e tokens de output (a resposta gerada pelo modelo). Em geral, o custo de output é 2–4× maior que o de input, pois requer mais computação para gerar.

Para o português brasileiro, 1.000 tokens equivalem a aproximadamente 750 palavras — ligeiramente menos eficiente que o inglês por causa de palavras mais longas e acentuação. Na prática, uma página A4 de texto corrido tem entre 600 e 900 tokens.

Exemplo Real de Custo Mensal

Imagine uma empresa que usa a API do GPT-4o para processar 100 e-mails por dia, com um prompt médio de 800 tokens e resposta de 300 tokens. Isso representa 110.000 tokens/dia × 30 dias = 3,3 milhões de tokens/mês. Com o preço de $2,50/M tokens de input e $10/M de output:

  • Input: 2,4M tokens × $2,50/M = $6,00/mêsR$ 34.20/mês
  • Output: 0,9M tokens × $10/M = $9,00/mêsR$ 51.30/mês
  • Total: $15,00/mêsR$ 85.50/mês

O mesmo volume com Claude Haiku (a ~$0,25/M input) custaria apenas R$ 9.83/mês — uma economia significativa para casos onde a qualidade máxima não é crítica.

Estratégias para Reduzir Custos de API no Brasil

1. Escolha o modelo certo para cada tarefa: classificação simples de texto pode usar Gemini Flash ou Claude Haiku; reserve GPT-4o ou Claude Opus para tarefas que realmente exigem raciocínio avançado.

2. Comprima os prompts: evite repetir contexto desnecessário. Sistemas de RAG bem implementados enviam apenas os trechos relevantes, não o documento inteiro.

3. Cache de respostas: se o mesmo prompt é enviado repetidamente (ex: categorização de produtos), armazene as respostas e reutilize. Providers como Anthropic oferecem prompt caching com desconto.

4. Use modelos open source via APIs de terceiros: Groq, Together AI e Fireworks oferecem modelos como Llama e Qwen por $0,01–$0,20/M tokens — 10–100× mais barato que os proprietários frontier.

IOF e Câmbio para Empresas Brasileiras

O pagamento das APIs de IA (OpenAI, Anthropic, Google) é feito em dólares americanos por cartão de crédito ou débito internacional. Para pessoas físicas, o IOF sobre compras internacionais foi zerado pelo governo Lula em janeiro de 2024 — você paga apenas o câmbio do cartão. Para pessoas jurídicas (CNPJ), as remessas internacionais ainda incidem IOF de 0,38%. Além do IOF, considere o spread do cartão (tipicamente 3–5% sobre o câmbio PTAX). Plataformas de pagamento como Wise podem oferecer câmbio mais próximo ao comercial.

Perguntas Frequentes sobre Custo de API

Quanto custa usar a API do ChatGPT (GPT-4o) em reais?

A API do GPT-4o custa $2,50 por milhão de tokens de input e $10,00 por milhão de tokens de output (preços de 2026). Com o câmbio em torno de R$ 5.70, isso equivale a aproximadamente R$ 14.25/M tokens de input. Para uma empresa brasileira que envia 1 milhão de tokens por dia, o custo mensal seria de aproximadamente R$ 428.

Qual é a API de IA mais barata disponível para empresas brasileiras?

Modelos open source como Qwen, Llama e Gemma podem ser rodados via APIs de terceiros (Groq, Together AI, Fireworks) por frações de centavo por milhão de tokens — chegando a $0,01–$0,10/M tokens. Entre as APIs proprietárias, Gemini Flash e Claude Haiku são as mais acessíveis, com preços a partir de $0,08–$0,25/M tokens de input.

Preciso pagar IOF ao usar APIs de IA no Brasil?

O IOF sobre compras internacionais no cartão de crédito foi zerado desde janeiro de 2024 para pessoas físicas. Empresas (CNPJ) ainda pagam IOF sobre remessas internacionais — consulte sua contabilidade. Os preços nesta tabela mostram o valor base em USD sem IOF adicional; inclua seu câmbio bancário real na estimativa final.

O que são tokens e como calcular o custo real do meu projeto?

Tokens são unidades de texto que os LLMs processam — em inglês, 1 token ≈ 4 caracteres; em português, pode ser um pouco menos por causa de acentuação. Uma página A4 tem ~600–800 tokens. Para estimar o custo: (tokens de input + tokens de output) × preço/1M tokens. Exemplo: prompt de 500 tokens + resposta de 300 tokens = 800 tokens × preço do modelo.

Vale mais a pena usar API ou assinar o plano premium do ChatGPT/Claude?

Para uso pessoal moderado, a assinatura (US$ 20/mês ≈ R$ 114/mês) costuma ser mais econômica. Para uso intensivo ou integração em produtos, a API é mais flexível e escalável. O ponto de virada geralmente acontece quando o consumo de tokens via API supera o custo da assinatura mensal.

Como os preços de API de IA variam ao longo do tempo?

Os preços caíram drasticamente: GPT-4 custava $30/M tokens em 2023; hoje modelos equivalentes custam $2–5/M. A tendência é de queda contínua conforme a competição aumenta. Atualizamos esta tabela semanalmente — verifique sempre os preços oficiais antes de comprometer seu budget.

Explorar no Benchmark