Quanto custa usar a API do ChatGPT, Claude, Gemini e outros LLMs para empresas e desenvolvedores brasileiros? Compare o preço por milhão de tokens convertido para BRL — sem surpresas na fatura.
Câmbio de referência: US$ 1 = R$ 5.70 • IOF zerado para PF desde jan/2024 • Última atualização: 16 de maio de 2026 •212 APIs listadas
212
APIs listadas
14
Com plano grátis
Grátis
Mais barata (input/1M)
$30.00
Mais cara (input/1M)
Como ler a tabela: preços são por milhão de tokens (input = o que você envia; output = a resposta do modelo). Em português, 1.000 tokens ≈ 750 palavras ≈ 1 página A4. O valor em BRL usa câmbio R$ 5.70/USD — substitua pelo câmbio do seu banco para estimativas precisas. Preços verificados nas páginas oficiais de precificação de cada empresa.
Estes modelos oferecem acesso via API sem custo (com limites de rate). Ideais para protótipos e projetos de baixo volume.
Claude 3.7 Sonnet (thinking)
Anthropic
Doubao Seed Code
ByteDance
ERNIE 5.0 Thinking Preview
Baidu
EXAONE 4.5 33B
LG AI
Gemini 2.5 Flash Preview (Sep '25) (Reasoning)
Granite 4.0 Micro
IBM
JT-35B-Flash
China Mobile
JT-MINI
China Mobile
K-EXAONE (Reasoning)
LG AI
Muse Spark
Meta
Nemotron Cascade 2 30B A3B
NVIDIA
Olmo 3 32B Think
AllenAI
Olmo 3.1 32B Instruct
AllenAI
Qwen2.5 Coder 32B Instruct
Alibaba
A grande maioria das APIs de LLMs cobra por tokens processados, divididos em duas categorias: tokens de input(o texto que você envia ao modelo — seu prompt, contexto e histórico) e tokens de output (a resposta gerada pelo modelo). Em geral, o custo de output é 2–4× maior que o de input, pois requer mais computação para gerar.
Para o português brasileiro, 1.000 tokens equivalem a aproximadamente 750 palavras — ligeiramente menos eficiente que o inglês por causa de palavras mais longas e acentuação. Na prática, uma página A4 de texto corrido tem entre 600 e 900 tokens.
Imagine uma empresa que usa a API do GPT-4o para processar 100 e-mails por dia, com um prompt médio de 800 tokens e resposta de 300 tokens. Isso representa 110.000 tokens/dia × 30 dias = 3,3 milhões de tokens/mês. Com o preço de $2,50/M tokens de input e $10/M de output:
O mesmo volume com Claude Haiku (a ~$0,25/M input) custaria apenas R$ 9.83/mês — uma economia significativa para casos onde a qualidade máxima não é crítica.
1. Escolha o modelo certo para cada tarefa: classificação simples de texto pode usar Gemini Flash ou Claude Haiku; reserve GPT-4o ou Claude Opus para tarefas que realmente exigem raciocínio avançado.
2. Comprima os prompts: evite repetir contexto desnecessário. Sistemas de RAG bem implementados enviam apenas os trechos relevantes, não o documento inteiro.
3. Cache de respostas: se o mesmo prompt é enviado repetidamente (ex: categorização de produtos), armazene as respostas e reutilize. Providers como Anthropic oferecem prompt caching com desconto.
4. Use modelos open source via APIs de terceiros: Groq, Together AI e Fireworks oferecem modelos como Llama e Qwen por $0,01–$0,20/M tokens — 10–100× mais barato que os proprietários frontier.
O pagamento das APIs de IA (OpenAI, Anthropic, Google) é feito em dólares americanos por cartão de crédito ou débito internacional. Para pessoas físicas, o IOF sobre compras internacionais foi zerado pelo governo Lula em janeiro de 2024 — você paga apenas o câmbio do cartão. Para pessoas jurídicas (CNPJ), as remessas internacionais ainda incidem IOF de 0,38%. Além do IOF, considere o spread do cartão (tipicamente 3–5% sobre o câmbio PTAX). Plataformas de pagamento como Wise podem oferecer câmbio mais próximo ao comercial.
A API do GPT-4o custa $2,50 por milhão de tokens de input e $10,00 por milhão de tokens de output (preços de 2026). Com o câmbio em torno de R$ 5.70, isso equivale a aproximadamente R$ 14.25/M tokens de input. Para uma empresa brasileira que envia 1 milhão de tokens por dia, o custo mensal seria de aproximadamente R$ 428.
Modelos open source como Qwen, Llama e Gemma podem ser rodados via APIs de terceiros (Groq, Together AI, Fireworks) por frações de centavo por milhão de tokens — chegando a $0,01–$0,10/M tokens. Entre as APIs proprietárias, Gemini Flash e Claude Haiku são as mais acessíveis, com preços a partir de $0,08–$0,25/M tokens de input.
O IOF sobre compras internacionais no cartão de crédito foi zerado desde janeiro de 2024 para pessoas físicas. Empresas (CNPJ) ainda pagam IOF sobre remessas internacionais — consulte sua contabilidade. Os preços nesta tabela mostram o valor base em USD sem IOF adicional; inclua seu câmbio bancário real na estimativa final.
Tokens são unidades de texto que os LLMs processam — em inglês, 1 token ≈ 4 caracteres; em português, pode ser um pouco menos por causa de acentuação. Uma página A4 tem ~600–800 tokens. Para estimar o custo: (tokens de input + tokens de output) × preço/1M tokens. Exemplo: prompt de 500 tokens + resposta de 300 tokens = 800 tokens × preço do modelo.
Para uso pessoal moderado, a assinatura (US$ 20/mês ≈ R$ 114/mês) costuma ser mais econômica. Para uso intensivo ou integração em produtos, a API é mais flexível e escalável. O ponto de virada geralmente acontece quando o consumo de tokens via API supera o custo da assinatura mensal.
Os preços caíram drasticamente: GPT-4 custava $30/M tokens em 2023; hoje modelos equivalentes custam $2–5/M. A tendência é de queda contínua conforme a competição aumenta. Atualizamos esta tabela semanalmente — verifique sempre os preços oficiais antes de comprometer seu budget.