Ranking 2026

Melhores LLMs Gratuitos

271 modelos de IA sem custo — open-source e planos gratuitos de API. Ordenados por AA Intelligence Index (Artificial Analysis, atualizado a cada 6h).

271
modelos gratuitos
110
open-source
161
API gratuita

Top 5 LLMs Gratuitos

Lista Completa de LLMs Gratuitos

#ModeloScore AA
1DeepSeek V4 Pro44.3
2GPT-5.5 Pro43.5
3Muse Spark43.1
4MoonshotAI: Kimi K2.642.8
5DeepSeek V4 Flash40.3
6MiniMax: MiniMax M2.738.1
7MoonshotAI: Kimi K2.538.1
8GLM-5-Turbo38.1
9Xiaomi: MiMo-V2-Omni35.0
10GLM 5V Turbo (Reasoning)34.5
11MiniMax: MiniMax M2.533.7
12MiniMax: MiniMax M2.131.4
13Grok 4.1 Fast30.6
14Mistral: Mistral Medium 3.529.9
15Gemma 4 31B29.4
16Command A+29.3
17JT-35B-Flash28.4
18Claude 3.7 Sonnet (thinking)27.1
19DeepSeek V3.1 Terminus26.3
20Doubao Seed Code26.0
21Step 3.5 Flash25.5
22DeepSeek V3.224.7
23K-EXAONE (Reasoning)24.7
24Gemini 2.5 Flash Preview (Sep '25) (Reasoning)23.8
25MoonshotAI: Kimi K2 090523.5
26Gemini 2.5 Pro Preview (Mar' 25)23.0
27EXAONE 4.5 33B23.0
28Qwen: Qwen3 235B A22B Instruct 250722.3
29DeepSeek V3.2 Speciale22.2
30ERNIE 5.0 Thinking Preview21.9
31Grok Code Fast 121.6
32Nemotron Cascade 2 30B A3B21.3
33Apriel-v1.5-15B-Thinker21.2
34DeepSeek V3.121.0
35Mistral: Mistral Small 420.8
36North Mini Code20.6
37Apriel-v1.6-15B-Thinker20.5
38Magistral Medium 1.220.1
39JT-35B-Flash18.5
40JT-MINI18.5
41Grok 318.4
42Qwen: Qwen3 235B A22B Thinking 250718.2
43Sonar Reasoning Pro17.8
44K2 Think V217.4
45LongCat Flash Lite17.2
46HyperCLOVA X SEED Think (32B)17.0
47Mi:dm K 2.5 Pro16.4
48Mi:dm K 2.5 Pro Preview16.4
49Ring-1T16.2
50INTELLECT-315.6
51Devstral 215.5
52Solar Open 100B (Reasoning)15.1
53Mistral: Mistral Medium 3.114.8
54MiniMax M1 40k14.4
55Qwen: Qwen3 VL 235B A22B Instruct14.3
56Llama 4 Maverick14.3
57K2-V2 (high)14.2
58K2-V2 (medium)14.2
59Solar Pro 314.1
60o1-mini14.0
61Qwen: Qwen3 Next 80B A3B Instruct13.7
62Qwen: Qwen3 Coder 30B A3B Instruct13.6
63GPT-4.5 (Preview)13.6
64Tri-21B-think Preview13.6
65Gemini 2.0 Flash Thinking Experimental (Jan '25)13.3
66Ling-1T12.8
67Motif-2-12.7B-Reasoning12.8
68DeepSeek: R112.6
69Gemma 4 E4B (Reasoning)12.5
70Magistral Medium 112.5
71Mistral: Mistral Medium 312.5
72Solar Pro 2 (Preview) (Reasoning)12.5
73Mistral: Devstral Medium12.4
74Tri-21B-Think12.4
75GPT-4o (March 2025, chatgpt-4o-latest)12.3
76Llama 3.3 Nemotron Super 49B v1 (Reasoning)12.2
77Qwen3 4B 2507 (Reasoning)12.0
78MiniCPM5-1B (Non-reasoning)12.0
79Magistral Small 1.211.9
80Gemini 2.0 Pro Experimental (Feb '25)11.8
81Devstral Small (May '25)11.8
82Gemini 2.5 Flash Preview (Non-reasoning)11.7
83Sonar Reasoning11.7
84Qwen: Qwen3 VL 32B Instruct11.1
85DeepSeek: R1 Distill Qwen 32B11.0
86Gemini 2.0 Flash (experimental)10.7
87Magistral Small 110.7
88EXAONE 4.0 32B (Reasoning)10.6
89DeepSeek R1 0528 Qwen3 8B10.4
90DeepSeek V310.4
91Nanbeige4.1-3B10.1
92Qwen: Qwen3 VL 30B A3B Instruct10.0
93Gemini 1.5 Pro (Sep '24)10.0
94Llama 4 Scout10.0
95Solar Pro 2 (Preview) (Non-reasoning)10.0
96R1 Distill Llama 70B9.9
97DeepSeek R1 Distill Qwen 14B9.8
98Falcon-H1R-7B9.8
99Qwen2.5 72B Instruct9.6
100Sonar9.5
101Step3 VL 10B9.5
102Qwen: Qwen3 30B A3B Thinking 25079.3
103Gemma 4 E2B (Reasoning)9.3
104QwQ 32B-Preview9.2
105Baidu: ERNIE 4.5 300B A47B 9.0
106Solar Pro 2 (Non-reasoning)9.0
107Gemma 4 E4B (Non-reasoning)8.9
108Granite 4.1 30B8.9
109Gemini 2.0 Flash-Lite (Feb '25)8.8
110NVIDIA Nemotron 3 Nano 4B8.8
111Gemini 2.0 Flash-Lite (Preview)8.6
112Llama 3.3 70B Instruct8.6
113Kimi Linear 48B A3B Instruct8.5
114Llama 3.1 Nemotron Nano 4B v1.1 (Reasoning)8.5
115Llama 3.3 Nemotron Super 49B v1 (Non-reasoning)8.5
116Qwen: Qwen3 VL 8B Instruct8.4
117Llama 3.1 Tulu3 405B8.3
118LFM2.5-8B-A1B8.3
119GPT-4o (ChatGPT)8.2
120Olmo 3.1 32B Think8.1
121Gemini 1.5 Flash (Sep '24)8.0
122Grok 2 (Dec '24)8.0
123Qwen3 VL 4B (Reasoning)7.9
124Llama 3.1 Nemotron 70B Instruct7.6
125Qwen2.5 Instruct 32B7.5
126Grok Beta7.5
127Qwen2.5 Coder 32B Instruct7.1
128Qwen3 4B 2507 Instruct7.1
129Qwen: Qwen3 30B A3B Instruct 25076.8
130DeepSeek-V2.5 (Dec '24)6.8
131Llama 3.1 70B Instruct6.8
132DeepSeek-V2.56.6
133Gemini 2.0 Flash Thinking Experimental (Dec '24)6.6
134Olmo 3.1 32B Instruct6.5
135Olmo 3 32B Think6.4
136DeepSeek R1 Distill Llama 8B6.4
137Gemma 4 E2B (Non-reasoning)6.4
138Mistral: Saba6.4
139Gemini 1.5 Pro (May '24)6.3
140R1 17766.3
141Reka Flash 36.3
142Llama 3.1 8B Instruct6.1
143Qwen2 Instruct 72B6.0
144EXAONE 4.0 32B (Non-reasoning)6.0
145Grok-16.0
146Mistral: Ministral 3 3B 25125.6
147Gemini 1.5 Flash-8B5.5
148AI21: Jamba Large 1.75.3
149DeepHermes 3 - Mistral 24B Preview (Non-reasoning)5.3
150DeepSeek-Coder-V25.1
151OLMo 2 32B5.0
152Gemini 1.5 Flash (May '24)4.9
153LFM2-24B-A2B4.9
154Microsoft: Phi 44.9
155Gemini 1.0 Ultra4.6
156Gemma 3n E4B Instruct Preview (May '25)4.6
157Phi-3 Mini Instruct 3.8B4.6
158Qwen2.5 Coder Instruct 7B 4.5
159Phi-4 Multimodal Instruct4.5
160Mixtral 8x22B Instruct4.4
161Mistral Large4.4
162Mistral: Mixtral 8x22B Instruct4.4
163Llama 3.2 3B Instruct4.2
164MiniCPM-V 4.6 1.3B4.2
165Jamba Reasoning 3B4.1
166Qwen1.5 Chat 110B4.1
167Qwen3 VL 4B Instruct4.1
168Olmo 3 7B Think4.0
169OLMo 2 7B3.9
170Claude 2.13.9
171Molmo 7B-D3.8
172Ling-mini-2.03.8
173DeepSeek R1 Distill Qwen 1.5B3.7
174Claude 2.03.6
175DeepSeek-V2-Chat3.6
176Llama 3 70B Instruct3.5
177Qwen Chat 72B3.4
178LFM 40B3.4
179Arctic Instruct3.4
180Llama 3.2 11B Vision Instruct3.3
181PALM-23.2
182Granite 4.1 3B3.2
183DeepSeek Coder V2 Lite Instruct3.1
184Gemini 1.0 Pro3.1
185DBRX Instruct3.0
186DeepSeek LLM 67B Chat (V1)3.0
187Llama 2 Chat 13B3.0
188Llama 2 Chat 70B3.0
189Phi-4 Mini Instruct3.0
190OpenChat 3.5 (1210)3.0
191Sarvam M (Reasoning)3.0
192Exaone 4.0 1.2B (Non-reasoning)2.9
193Jamba 1.7 Mini2.7
194Granite 4.0 H 1B2.7
195LFM2 2.6B2.7
196LFM2.5-1.2B-Instruct2.7
197LFM2.5-1.2B-Thinking2.7
198Gemma 3 270M2.4
199Granite 4.0 Micro2.4
200Mistral: Mixtral 8x7B Instruct2.4
201DeepHermes 3 - Llama-3.1 8B Preview (Non-reasoning)2.3
202Qwen Chat 14B2.1
203Claude Instant2.1
204Granite 4.0 1B2.1
205Llama 65B2.1
206Molmo2-8B2.0
207LFM2 8B A1B1.8
208Llama 3 8B Instruct1.2
209LFM2 1.2B1.1
210Llama 3.2 1B Instruct1.1
211Tiny Aya Global1.0
212Gemma 3 1B Instruct1.0
213Gemma 3n E2B Instruct1.0
214Granite 4.0 350M1.0
215Granite 4.0 H 350M1.0
216LFM2.5-VL-1.6B1.0
217AlfredPros: CodeLLaMa 7B Instruct Solidity
218Qwen: Qwen2.5 7B Instruct
219Qwen: Qwen2.5 VL 72B Instruct
220Wan 2.1
221Arcee AI: Trinity Large Thinking
222Arcee AI: Trinity Mini
223Baidu: ERNIE 4.5 21B A3B Thinking
224Baidu: ERNIE 4.5 VL 28B A3B
225Baidu: ERNIE 4.5 VL 424B A47B
226ByteDance: UI-TARS 7B
227DeepSeek V3.2 Exp
228EssentialAI: Rnj 1 Instruct
229Goliath 120B
230Gemini 3 Deep Think
231Ideogram 4.0
232Magnum v4 72B
233Llama Guard 3 8B
234Llama Guard 4 12B
235WizardLM-2 8x22B
236MiniMax: MiniMax-01
237Mistral: Devstral 2 2512
238Mistral: Ministral 3 14B 2512
239Mistral: Ministral 3 8B 2512
240Mistral: Mistral 7B Instruct v0.1
241Mistral: Mistral Nemo
242Mistral: Mistral Small 3.1 24B
243Mistral: Mistral Small 3.2 24B
244Mistral: Mistral Small Creative
245Mistral: Voxtral Small 24B 2507
246MoonshotAI: Kimi K2 0711
247MythoMax 13B
248Nex AGI: DeepSeek V3.1 Nex N1
249Nous: Hermes 3 405B Instruct
250Nous: Hermes 3 70B Instruct
251Nous: Hermes 4 405B
252Nous: Hermes 4 70B
253NousResearch: Hermes 2 Pro - Llama-3 8B
254GPT-3.5 Turbo (0613)
255GPT-4o mini Realtime (Dec '24)
256GPT-4o Realtime (Dec '24)
257Reka Edge
258ReMM SLERP 13B
259Sao10k: Llama 3 Euryale 70B v2.1
260Sao10K: Llama 3 8B Lunaris
261Sao10K: Llama 3.1 70B Hanami x1
262Sao10K: Llama 3.1 Euryale 70B v2.2
263Sao10K: Llama 3.3 Euryale 70B
264Stable Diffusion 3.5 Large
265Stable Video Diffusion 3D
266Tencent: Hunyuan A13B Instruct
267TheDrummer: Cydonia 24B V4.1
268TheDrummer: Rocinante 12B
269TheDrummer: Skyfall 36B V2
270TheDrummer: UnslopNemo 12B
271Tongyi DeepResearch 30B A3B

Como Acessar LLMs Gratuitos

Via Interface Web (sem código)

  • ChatGPT — GPT-4o mini grátis em chat.openai.com
  • Claude.ai — Claude 3.5 Haiku grátis (limite diário)
  • Gemini — Gemini 1.5 Flash grátis em gemini.google.com
  • Mistral Le Chat — Mistral Large grátis
  • Groq — Llama 3, Mistral via API rápida grátis

Rodar Localmente (open-source)

  • Ollama — instale e execute ollama run llama3
  • LM Studio — interface gráfica para modelos locais
  • Jan.ai — app desktop com interface amigável
  • Together.ai — inferência cloud com cota gratuita generosa
  • Replicate — pay-per-use, mas com créditos iniciais

Open-Source vs. API Gratuita: Qual Escolher?

CritérioOpen-SourceAPI Gratuita
Privacidade dos dadosTotal (roda local)Compartilhados com provedor
Custo de infraestruturaGPU própria ou cloudZero (dentro do limite)
Limite de usoIlimitadoRate limit diário/mensal
Facilidade de setupMédio (requer técnica)Imediato
Customização/fine-tuningTotalLimitada ou indisponível
Qualidade máxima disponívelLlama 3.1 405BGPT-4o, Gemini Ultra

Perguntas Frequentes

Qual o melhor LLM gratuito disponível hoje?
Com base no AA Intelligence Index, o melhor modelo gratuito atualmente é o DeepSeek V4 Pro (score 44.3), que pode ser acessado gratuitamente. Em seguida aparecem GPT-5.5 Pro e Muse Spark.
Qual a diferença entre LLM gratuito e open-source?
LLM gratuito significa que você pode usá-lo sem pagar — via interface web (ChatGPT free, Claude.ai, Gemini) ou via API com tier gratuito. Open-source vai além: o código e os pesos são públicos, permitindo rodar localmente, modificar e usar sem limites ou privacidade comprometida. Exemplos open-source: Llama 3, Mistral, Qwen. Exemplos gratuitos mas não open-source: GPT-4o-mini (API grátis com limite), Gemini Flash.
Como rodar um LLM open-source localmente?
A forma mais fácil é usar o Ollama (ollama.ai): instale, execute "ollama run llama3" e o modelo roda no seu computador. Para modelos maiores (70B+), é necessário GPU com pelo menos 40GB VRAM ou usar serviços como Groq, Together.ai e Replicate — que oferecem inferência gratuita com cota mensal.
LLMs gratuitos têm qualidade suficiente para uso profissional?
Sim, para muitos casos de uso. Modelos como Llama 3.1 70B, Mistral Large e Qwen 2.5 72B atingem performance comparável ou superior a GPT-3.5 e competem com GPT-4 em tarefas específicas. Para uso profissional de alto volume (produção, integração via API, SLA), a API paga geralmente oferece melhor confiabilidade e suporte.

Conteúdo relacionado: