Ranking 2026

Melhores LLMs Gratuitos

271 modelos de IA sem custo — open-source e planos gratuitos de API. Ordenados por AA Intelligence Index (Artificial Analysis, atualizado a cada 6h).

271

modelos gratuitos

110

open-source

161

API gratuita

Top 5 LLMs Gratuitos

Lista Completa de LLMs Gratuitos

#	Modelo	Empresa	Tipo	Score AA	Contexto	tok/s
1	DeepSeek V4 Pro	DeepSeek	open-source	44.3	1.0M tokens	97 tok/s
2	GPT-5.5 Pro	OpenAI	API grátis	43.5	1.1M tokens	—
3	Muse Spark	Meta	API grátis	43.1	—	—
4	MoonshotAI: Kimi K2.6	MoonshotAI	open-source	42.8	262K tokens	62 tok/s
5	DeepSeek V4 Flash	DeepSeek	open-source	40.3	1.0M tokens	110 tok/s
6	MiniMax: MiniMax M2.7	MiniMax	open-source	38.1	197K tokens	132 tok/s
7	MoonshotAI: Kimi K2.5	MoonshotAI	open-source	38.1	262K tokens	40 tok/s
8	GLM-5-Turbo	Z.ai	API grátis	38.1	203K tokens	—
9	Xiaomi: MiMo-V2-Omni	Xiaomi	API grátis	35.0	262K tokens	74 tok/s
10	GLM 5V Turbo (Reasoning)	Z.ai	API grátis	34.5	203K tokens	—
11	MiniMax: MiniMax M2.5	MiniMax	open-source	33.7	197K tokens	255 tok/s
12	MiniMax: MiniMax M2.1	MiniMax	open-source	31.4	197K tokens	238 tok/s
13	Grok 4.1 Fast	xAI	API grátis	30.6	2.0M tokens	—
14	Mistral: Mistral Medium 3.5	Mistral AI	open-source	29.9	262K tokens	151 tok/s
15	Gemma 4 31B	Google	API grátis	29.4	262K tokens	35 tok/s
16	Command A+	Cohere	API grátis	29.3	—	200 tok/s
17	JT-35B-Flash	China Mobile	API grátis	28.4	—	—
18	Claude 3.7 Sonnet (thinking)	Anthropic	API grátis	27.1	200K tokens	—
19	DeepSeek V3.1 Terminus	DeepSeek	open-source	26.3	164K tokens	—
20	Doubao Seed Code	ByteDance Seed	API grátis	26.0	—	—
21	Step 3.5 Flash	StepFun	open-source	25.5	262K tokens	189 tok/s
22	DeepSeek V3.2	DeepSeek	open-source	24.7	131K tokens	—
23	K-EXAONE (Reasoning)	LG AI	API grátis	24.7	—	—
24	Gemini 2.5 Flash Preview (Sep '25) (Reasoning)	Google	API grátis	23.8	—	—
25	MoonshotAI: Kimi K2 0905	MoonshotAI	open-source	23.5	262K tokens	26 tok/s
26	Gemini 2.5 Pro Preview (Mar' 25)	Google	API grátis	23.0	—	—
27	EXAONE 4.5 33B	LG AI	API grátis	23.0	—	—
28	Qwen: Qwen3 235B A22B Instruct 2507	Alibaba	open-source	22.3	262K tokens	68 tok/s
29	DeepSeek V3.2 Speciale	DeepSeek	open-source	22.2	164K tokens	—
30	ERNIE 5.0 Thinking Preview	Baidu	API grátis	21.9	—	—
31	Grok Code Fast 1	xAI	API grátis	21.6	256K tokens	—
32	Nemotron Cascade 2 30B A3B	NVIDIA	API grátis	21.3	—	—
33	Apriel-v1.5-15B-Thinker	ServiceNow	API grátis	21.2	—	—
34	DeepSeek V3.1	DeepSeek	open-source	21.0	164K tokens	—
35	Mistral: Mistral Small 4	Mistral AI	open-source	20.8	262K tokens	155 tok/s
36	North Mini Code	Cohere	API grátis	20.6	—	128 tok/s
37	Apriel-v1.6-15B-Thinker	ServiceNow	API grátis	20.5	—	—
38	Magistral Medium 1.2	Mistral AI	API grátis	20.1	—	—
39	JT-35B-Flash	China Mobile	API grátis	18.5	—	—
40	JT-MINI	China Mobile	API grátis	18.5	—	—
41	Grok 3	xAI	API grátis	18.4	131K tokens	—
42	Qwen: Qwen3 235B A22B Thinking 2507	Alibaba	open-source	18.2	131K tokens	—
43	Sonar Reasoning Pro	Perplexity	API grátis	17.8	128K tokens	—
44	K2 Think V2	MBZUAI Institute of Foundation Models	API grátis	17.4	—	—
45	LongCat Flash Lite	LongCat	API grátis	17.2	—	—
46	HyperCLOVA X SEED Think (32B)	Naver	API grátis	17.0	—	—
47	Mi:dm K 2.5 Pro	Korea Telecom	API grátis	16.4	—	—
48	Mi:dm K 2.5 Pro Preview	Korea Telecom	API grátis	16.4	—	—
49	Ring-1T	InclusionAI	API grátis	16.2	—	—
50	INTELLECT-3	Prime Intellect	open-source	15.6	131K tokens	—
51	Devstral 2	Mistral	API grátis	15.5	—	73 tok/s
52	Solar Open 100B (Reasoning)	Upstage	API grátis	15.1	—	—
53	Mistral: Mistral Medium 3.1	Mistral AI	open-source	14.8	131K tokens	140 tok/s
54	MiniMax M1 40k	MiniMax	API grátis	14.4	—	—
55	Qwen: Qwen3 VL 235B A22B Instruct	Alibaba	open-source	14.3	262K tokens	54 tok/s
56	Llama 4 Maverick	Meta	open-source	14.3	1.0M tokens	122 tok/s
57	K2-V2 (high)	MBZUAI Institute of Foundation Models	API grátis	14.2	—	—
58	K2-V2 (medium)	MBZUAI Institute of Foundation Models	API grátis	14.2	—	—
59	Solar Pro 3	Upstage	API grátis	14.1	128K tokens	—
60	o1-mini	OpenAI	API grátis	14.0	—	—
61	Qwen: Qwen3 Next 80B A3B Instruct	Alibaba	open-source	13.7	262K tokens	189 tok/s
62	Qwen: Qwen3 Coder 30B A3B Instruct	Alibaba	open-source	13.6	160K tokens	109 tok/s
63	GPT-4.5 (Preview)	OpenAI	API grátis	13.6	—	—
64	Tri-21B-think Preview	Trillion Labs	API grátis	13.6	—	—
65	Gemini 2.0 Flash Thinking Experimental (Jan '25)	Google	API grátis	13.3	—	—
66	Ling-1T	InclusionAI	API grátis	12.8	—	—
67	Motif-2-12.7B-Reasoning	Motif Technologies	API grátis	12.8	—	—
68	DeepSeek: R1	DeepSeek	open-source	12.6	164K tokens	—
69	Gemma 4 E4B (Reasoning)	Google	API grátis	12.5	—	—
70	Magistral Medium 1	Mistral	API grátis	12.5	—	—
71	Mistral: Mistral Medium 3	Mistral AI	open-source	12.5	131K tokens	48 tok/s
72	Solar Pro 2 (Preview) (Reasoning)	Upstage	API grátis	12.5	—	—
73	Mistral: Devstral Medium	Mistral AI	open-source	12.4	131K tokens	69 tok/s
74	Tri-21B-Think	Trillion Labs	API grátis	12.4	—	—
75	GPT-4o (March 2025, chatgpt-4o-latest)	OpenAI	API grátis	12.3	—	—
76	Llama 3.3 Nemotron Super 49B v1 (Reasoning)	NVIDIA	API grátis	12.2	—	—
77	Qwen3 4B 2507 (Reasoning)	Alibaba	API grátis	12.0	—	—
78	MiniCPM5-1B (Non-reasoning)	OpenBMB	API grátis	12.0	—	—
79	Magistral Small 1.2	Mistral	API grátis	11.9	—	—
80	Gemini 2.0 Pro Experimental (Feb '25)	Google	API grátis	11.8	—	—
81	Devstral Small (May '25)	Mistral	API grátis	11.8	—	—
82	Gemini 2.5 Flash Preview (Non-reasoning)	Google	API grátis	11.7	—	—
83	Sonar Reasoning	Perplexity	API grátis	11.7	127K tokens	—
84	Qwen: Qwen3 VL 32B Instruct	Alibaba	open-source	11.1	131K tokens	72 tok/s
85	DeepSeek: R1 Distill Qwen 32B	DeepSeek	open-source	11.0	128K tokens	—
86	Gemini 2.0 Flash (experimental)	Google	API grátis	10.7	—	—
87	Magistral Small 1	Mistral	API grátis	10.7	—	—
88	EXAONE 4.0 32B (Reasoning)	LG AI Research	API grátis	10.6	—	—
89	DeepSeek R1 0528 Qwen3 8B	DeepSeek	API grátis	10.4	—	—
90	DeepSeek V3	DeepSeek	open-source	10.4	131K tokens	—
91	Nanbeige4.1-3B	Nanbeige	API grátis	10.1	—	—
92	Qwen: Qwen3 VL 30B A3B Instruct	Alibaba	open-source	10.0	131K tokens	122 tok/s
93	Gemini 1.5 Pro (Sep '24)	Google	API grátis	10.0	—	—
94	Llama 4 Scout	Meta	open-source	10.0	10.0M tokens	109 tok/s
95	Solar Pro 2 (Preview) (Non-reasoning)	Upstage	API grátis	10.0	—	—
96	R1 Distill Llama 70B	DeepSeek	open-source	9.9	128K tokens	40 tok/s
97	DeepSeek R1 Distill Qwen 14B	DeepSeek	API grátis	9.8	—	—
98	Falcon-H1R-7B	TII UAE	API grátis	9.8	—	—
99	Qwen2.5 72B Instruct	Alibaba	open-source	9.6	33K tokens	—
100	Sonar	Perplexity	API grátis	9.5	—	—
101	Step3 VL 10B	StepFun	API grátis	9.5	—	—
102	Qwen: Qwen3 30B A3B Thinking 2507	Alibaba	open-source	9.3	131K tokens	—
103	Gemma 4 E2B (Reasoning)	Google	API grátis	9.3	—	—
104	QwQ 32B-Preview	Alibaba	API grátis	9.2	—	—
105	Baidu: ERNIE 4.5 300B A47B	Baidu	open-source	9.0	123K tokens	—
106	Solar Pro 2 (Non-reasoning)	Upstage	API grátis	9.0	—	—
107	Gemma 4 E4B (Non-reasoning)	Google	API grátis	8.9	—	—
108	Granite 4.1 30B	IBM	API grátis	8.9	—	—
109	Gemini 2.0 Flash-Lite (Feb '25)	Google	API grátis	8.8	—	—
110	NVIDIA Nemotron 3 Nano 4B	NVIDIA	API grátis	8.8	—	—
111	Gemini 2.0 Flash-Lite (Preview)	Google	API grátis	8.6	—	—
112	Llama 3.3 70B Instruct	Meta	open-source	8.6	131K tokens	94 tok/s
113	Kimi Linear 48B A3B Instruct	Kimi	API grátis	8.5	—	—
114	Llama 3.1 Nemotron Nano 4B v1.1 (Reasoning)	NVIDIA	API grátis	8.5	—	—
115	Llama 3.3 Nemotron Super 49B v1 (Non-reasoning)	NVIDIA	API grátis	8.5	—	—
116	Qwen: Qwen3 VL 8B Instruct	Alibaba	open-source	8.4	131K tokens	141 tok/s
117	Llama 3.1 Tulu3 405B	Allen Institute for AI	API grátis	8.3	—	—
118	LFM2.5-8B-A1B	Liquid AI	API grátis	8.3	—	230 tok/s
119	GPT-4o (ChatGPT)	OpenAI	API grátis	8.2	—	—
120	Olmo 3.1 32B Think	Allen Institute for AI	API grátis	8.1	—	—
121	Gemini 1.5 Flash (Sep '24)	Google	API grátis	8.0	—	—
122	Grok 2 (Dec '24)	xAI	API grátis	8.0	—	—
123	Qwen3 VL 4B (Reasoning)	Alibaba	API grátis	7.9	—	—
124	Llama 3.1 Nemotron 70B Instruct	NVIDIA	open-source	7.6	131K tokens	296 tok/s
125	Qwen2.5 Instruct 32B	Alibaba	API grátis	7.5	—	—
126	Grok Beta	xAI	API grátis	7.5	—	—
127	Qwen2.5 Coder 32B Instruct	Alibaba	open-source	7.1	33K tokens	—
128	Qwen3 4B 2507 Instruct	Alibaba	API grátis	7.1	—	—
129	Qwen: Qwen3 30B A3B Instruct 2507	Alibaba	open-source	6.8	262K tokens	106 tok/s
130	DeepSeek-V2.5 (Dec '24)	DeepSeek	API grátis	6.8	—	—
131	Llama 3.1 70B Instruct	Meta	open-source	6.8	131K tokens	37 tok/s
132	DeepSeek-V2.5	DeepSeek	API grátis	6.6	—	—
133	Gemini 2.0 Flash Thinking Experimental (Dec '24)	Google	API grátis	6.6	—	—
134	Olmo 3.1 32B Instruct	AllenAI	open-source	6.5	66K tokens	—
135	Olmo 3 32B Think	AllenAI	open-source	6.4	66K tokens	—
136	DeepSeek R1 Distill Llama 8B	DeepSeek	API grátis	6.4	—	—
137	Gemma 4 E2B (Non-reasoning)	Google	API grátis	6.4	—	—
138	Mistral: Saba	Mistral AI	open-source	6.4	33K tokens	—
139	Gemini 1.5 Pro (May '24)	Google	API grátis	6.3	—	—
140	R1 1776	Perplexity	API grátis	6.3	—	—
141	Reka Flash 3	Reka Flash 3	open-source	6.3	66K tokens	85 tok/s
142	Llama 3.1 8B Instruct	Meta	open-source	6.1	16K tokens	201 tok/s
143	Qwen2 Instruct 72B	Alibaba	API grátis	6.0	—	—
144	EXAONE 4.0 32B (Non-reasoning)	LG AI Research	API grátis	6.0	—	—
145	Grok-1	xAI	API grátis	6.0	—	—
146	Mistral: Ministral 3 3B 2512	Mistral AI	open-source	5.6	131K tokens	191 tok/s
147	Gemini 1.5 Flash-8B	Google	API grátis	5.5	—	—
148	AI21: Jamba Large 1.7	AI21 Labs	open-source	5.3	256K tokens	60 tok/s
149	DeepHermes 3 - Mistral 24B Preview (Non-reasoning)	Nous Research	API grátis	5.3	—	—
150	DeepSeek-Coder-V2	DeepSeek	API grátis	5.1	—	—
151	OLMo 2 32B	Allen Institute for AI	API grátis	5.0	—	—
152	Gemini 1.5 Flash (May '24)	Google	API grátis	4.9	—	—
153	LFM2-24B-A2B	LiquidAI	open-source	4.9	33K tokens	125 tok/s
154	Microsoft: Phi 4	Microsoft	open-source	4.9	16K tokens	43 tok/s
155	Gemini 1.0 Ultra	Google	API grátis	4.6	—	—
156	Gemma 3n E4B Instruct Preview (May '25)	Google	API grátis	4.6	—	—
157	Phi-3 Mini Instruct 3.8B	Microsoft	API grátis	4.6	—	—
158	Qwen2.5 Coder Instruct 7B	Alibaba	API grátis	4.5	—	—
159	Phi-4 Multimodal Instruct	Microsoft	API grátis	4.5	—	16 tok/s
160	Mixtral 8x22B Instruct	Mistral	API grátis	4.4	—	—
161	Mistral Large	Mistral AI	open-source	4.4	128K tokens	—
162	Mistral: Mixtral 8x22B Instruct	Mistral AI	open-source	4.4	66K tokens	—
163	Llama 3.2 3B Instruct	Meta	open-source	4.2	80K tokens	52 tok/s
164	MiniCPM-V 4.6 1.3B	OpenBMB	API grátis	4.2	—	—
165	Jamba Reasoning 3B	AI21 Labs	API grátis	4.1	—	—
166	Qwen1.5 Chat 110B	Alibaba	API grátis	4.1	—	—
167	Qwen3 VL 4B Instruct	Alibaba	API grátis	4.1	—	—
168	Olmo 3 7B Think	Allen Institute for AI	API grátis	4.0	—	—
169	OLMo 2 7B	Allen Institute for AI	API grátis	3.9	—	—
170	Claude 2.1	Anthropic	API grátis	3.9	—	—
171	Molmo 7B-D	Allen Institute for AI	API grátis	3.8	—	—
172	Ling-mini-2.0	InclusionAI	API grátis	3.8	—	—
173	DeepSeek R1 Distill Qwen 1.5B	DeepSeek	API grátis	3.7	—	—
174	Claude 2.0	Anthropic	API grátis	3.6	—	—
175	DeepSeek-V2-Chat	DeepSeek	API grátis	3.6	—	—
176	Llama 3 70B Instruct	Meta	open-source	3.5	8K tokens	43 tok/s
177	Qwen Chat 72B	Alibaba	API grátis	3.4	—	—
178	LFM 40B	Liquid AI	API grátis	3.4	—	—
179	Arctic Instruct	Snowflake	API grátis	3.4	—	—
180	Llama 3.2 11B Vision Instruct	Meta	open-source	3.3	131K tokens	86 tok/s
181	PALM-2	Google	API grátis	3.2	—	—
182	Granite 4.1 3B	IBM	API grátis	3.2	—	—
183	DeepSeek Coder V2 Lite Instruct	DeepSeek	API grátis	3.1	—	—
184	Gemini 1.0 Pro	Google	API grátis	3.1	—	—
185	DBRX Instruct	Databricks	API grátis	3.0	—	—
186	DeepSeek LLM 67B Chat (V1)	DeepSeek	API grátis	3.0	—	—
187	Llama 2 Chat 13B	Meta	API grátis	3.0	—	—
188	Llama 2 Chat 70B	Meta	API grátis	3.0	—	—
189	Phi-4 Mini Instruct	Microsoft	API grátis	3.0	—	46 tok/s
190	OpenChat 3.5 (1210)	OpenChat	API grátis	3.0	—	—
191	Sarvam M (Reasoning)	Sarvam	API grátis	3.0	—	—
192	Exaone 4.0 1.2B (Non-reasoning)	LG AI Research	API grátis	2.9	—	—
193	Jamba 1.7 Mini	AI21 Labs	API grátis	2.7	—	—
194	Granite 4.0 H 1B	IBM	API grátis	2.7	—	—
195	LFM2 2.6B	Liquid AI	API grátis	2.7	—	342 tok/s
196	LFM2.5-1.2B-Instruct	Liquid AI	API grátis	2.7	—	579 tok/s
197	LFM2.5-1.2B-Thinking	Liquid AI	API grátis	2.7	—	—
198	Gemma 3 270M	Google	API grátis	2.4	—	—
199	Granite 4.0 Micro	IBM	open-source	2.4	131K tokens	—
200	Mistral: Mixtral 8x7B Instruct	Mistral AI	open-source	2.4	33K tokens	—
201	DeepHermes 3 - Llama-3.1 8B Preview (Non-reasoning)	Nous Research	API grátis	2.3	—	—
202	Qwen Chat 14B	Alibaba	API grátis	2.1	—	—
203	Claude Instant	Anthropic	API grátis	2.1	—	—
204	Granite 4.0 1B	IBM	API grátis	2.1	—	—
205	Llama 65B	Meta	API grátis	2.1	—	—
206	Molmo2-8B	Allen Institute for AI	API grátis	2.0	—	—
207	LFM2 8B A1B	Liquid AI	API grátis	1.8	—	—
208	Llama 3 8B Instruct	Meta	open-source	1.2	8K tokens	85 tok/s
209	LFM2 1.2B	Liquid AI	API grátis	1.1	—	578 tok/s
210	Llama 3.2 1B Instruct	Meta	open-source	1.1	60K tokens	88 tok/s
211	Tiny Aya Global	Cohere	API grátis	1.0	—	135 tok/s
212	Gemma 3 1B Instruct	Google	API grátis	1.0	—	—
213	Gemma 3n E2B Instruct	Google	API grátis	1.0	—	—
214	Granite 4.0 350M	IBM	API grátis	1.0	—	—
215	Granite 4.0 H 350M	IBM	API grátis	1.0	—	—
216	LFM2.5-VL-1.6B	Liquid AI	API grátis	1.0	—	489 tok/s
217	AlfredPros: CodeLLaMa 7B Instruct Solidity	AlfredPros	open-source	—	4K tokens	—
218	Qwen: Qwen2.5 7B Instruct	Alibaba	open-source	—	33K tokens	—
219	Qwen: Qwen2.5 VL 72B Instruct	Alibaba	open-source	—	32K tokens	—
220	Wan 2.1	Alibaba	open-source	—	—	—
221	Arcee AI: Trinity Large Thinking	Arcee AI	open-source	—	262K tokens	—
222	Arcee AI: Trinity Mini	Arcee AI	open-source	—	131K tokens	—
223	Baidu: ERNIE 4.5 21B A3B Thinking	Baidu	open-source	—	131K tokens	—
224	Baidu: ERNIE 4.5 VL 28B A3B	Baidu	open-source	—	30K tokens	—
225	Baidu: ERNIE 4.5 VL 424B A47B	Baidu	open-source	—	123K tokens	—
226	ByteDance: UI-TARS 7B	ByteDance	open-source	—	128K tokens	—
227	DeepSeek V3.2 Exp	DeepSeek	open-source	—	164K tokens	—
228	EssentialAI: Rnj 1 Instruct	EssentialAI	open-source	—	33K tokens	—
229	Goliath 120B	Goliath 120B	open-source	—	6K tokens	—
230	Gemini 3 Deep Think	Google	API grátis	—	—	—
231	Ideogram 4.0	Ideogram	open-source	—	—	—
232	Magnum v4 72B	Magnum v4 72B	open-source	—	16K tokens	—
233	Llama Guard 3 8B	Meta	open-source	—	131K tokens	—
234	Llama Guard 4 12B	Meta	open-source	—	164K tokens	—
235	WizardLM-2 8x22B	Microsoft	open-source	—	66K tokens	—
236	MiniMax: MiniMax-01	MiniMax	open-source	—	1.0M tokens	—
237	Mistral: Devstral 2 2512	Mistral AI	open-source	—	262K tokens	—
238	Mistral: Ministral 3 14B 2512	Mistral AI	open-source	—	262K tokens	—
239	Mistral: Ministral 3 8B 2512	Mistral AI	open-source	—	262K tokens	—
240	Mistral: Mistral 7B Instruct v0.1	Mistral AI	open-source	—	3K tokens	—
241	Mistral: Mistral Nemo	Mistral AI	open-source	—	131K tokens	—
242	Mistral: Mistral Small 3.1 24B	Mistral AI	open-source	—	128K tokens	—
243	Mistral: Mistral Small 3.2 24B	Mistral AI	open-source	—	128K tokens	—
244	Mistral: Mistral Small Creative	Mistral AI	open-source	—	33K tokens	—
245	Mistral: Voxtral Small 24B 2507	Mistral AI	open-source	—	32K tokens	—
246	MoonshotAI: Kimi K2 0711	MoonshotAI	open-source	—	131K tokens	—
247	MythoMax 13B	MythoMax 13B	open-source	—	4K tokens	—
248	Nex AGI: DeepSeek V3.1 Nex N1	Nex AGI	open-source	—	131K tokens	—
249	Nous: Hermes 3 405B Instruct	Nous	open-source	—	131K tokens	—
250	Nous: Hermes 3 70B Instruct	Nous	open-source	—	131K tokens	—
251	Nous: Hermes 4 405B	Nous	open-source	—	131K tokens	—
252	Nous: Hermes 4 70B	Nous	open-source	—	131K tokens	—
253	NousResearch: Hermes 2 Pro - Llama-3 8B	NousResearch	open-source	—	8K tokens	—
254	GPT-3.5 Turbo (0613)	OpenAI	API grátis	—	—	—
255	GPT-4o mini Realtime (Dec '24)	OpenAI	API grátis	—	—	—
256	GPT-4o Realtime (Dec '24)	OpenAI	API grátis	—	—	—
257	Reka Edge	Reka Edge	open-source	—	16K tokens	—
258	ReMM SLERP 13B	ReMM SLERP 13B	open-source	—	6K tokens	—
259	Sao10k: Llama 3 Euryale 70B v2.1	Sao10k	open-source	—	8K tokens	—
260	Sao10K: Llama 3 8B Lunaris	Sao10K	open-source	—	8K tokens	—
261	Sao10K: Llama 3.1 70B Hanami x1	Sao10K	open-source	—	16K tokens	—
262	Sao10K: Llama 3.1 Euryale 70B v2.2	Sao10K	open-source	—	131K tokens	—
263	Sao10K: Llama 3.3 Euryale 70B	Sao10K	open-source	—	131K tokens	—
264	Stable Diffusion 3.5 Large	Stability AI	open-source	—	—	—
265	Stable Video Diffusion 3D	Stability AI	open-source	—	—	—
266	Tencent: Hunyuan A13B Instruct	Tencent	open-source	—	131K tokens	—
267	TheDrummer: Cydonia 24B V4.1	TheDrummer	open-source	—	131K tokens	—
268	TheDrummer: Rocinante 12B	TheDrummer	open-source	—	33K tokens	—
269	TheDrummer: Skyfall 36B V2	TheDrummer	open-source	—	33K tokens	—
270	TheDrummer: UnslopNemo 12B	TheDrummer	open-source	—	33K tokens	—
271	Tongyi DeepResearch 30B A3B	Tongyi DeepResearch 30B A3B	open-source	—	131K tokens	—

Como Acessar LLMs Gratuitos

Via Interface Web (sem código)

ChatGPT — GPT-4o mini grátis em chat.openai.com
Claude.ai — Claude 3.5 Haiku grátis (limite diário)
Gemini — Gemini 1.5 Flash grátis em gemini.google.com
Mistral Le Chat — Mistral Large grátis
Groq — Llama 3, Mistral via API rápida grátis

Rodar Localmente (open-source)

Ollama — instale e execute ollama run llama3
LM Studio — interface gráfica para modelos locais
Jan.ai — app desktop com interface amigável
Together.ai — inferência cloud com cota gratuita generosa
Replicate — pay-per-use, mas com créditos iniciais

Open-Source vs. API Gratuita: Qual Escolher?

Critério	Open-Source	API Gratuita
Privacidade dos dados	Total (roda local)	Compartilhados com provedor
Custo de infraestrutura	GPU própria ou cloud	Zero (dentro do limite)
Limite de uso	Ilimitado	Rate limit diário/mensal
Facilidade de setup	Médio (requer técnica)	Imediato
Customização/fine-tuning	Total	Limitada ou indisponível
Qualidade máxima disponível	Llama 3.1 405B	GPT-4o, Gemini Ultra

Perguntas Frequentes

Qual o melhor LLM gratuito disponível hoje?▾

Com base no AA Intelligence Index, o melhor modelo gratuito atualmente é o DeepSeek V4 Pro (score 44.3), que pode ser acessado gratuitamente. Em seguida aparecem GPT-5.5 Pro e Muse Spark.

Qual a diferença entre LLM gratuito e open-source?▾

LLM gratuito significa que você pode usá-lo sem pagar — via interface web (ChatGPT free, Claude.ai, Gemini) ou via API com tier gratuito. Open-source vai além: o código e os pesos são públicos, permitindo rodar localmente, modificar e usar sem limites ou privacidade comprometida. Exemplos open-source: Llama 3, Mistral, Qwen. Exemplos gratuitos mas não open-source: GPT-4o-mini (API grátis com limite), Gemini Flash.

Como rodar um LLM open-source localmente?▾

A forma mais fácil é usar o Ollama (ollama.ai): instale, execute "ollama run llama3" e o modelo roda no seu computador. Para modelos maiores (70B+), é necessário GPU com pelo menos 40GB VRAM ou usar serviços como Groq, Together.ai e Replicate — que oferecem inferência gratuita com cota mensal.

LLMs gratuitos têm qualidade suficiente para uso profissional?▾

Sim, para muitos casos de uso. Modelos como Llama 3.1 70B, Mistral Large e Qwen 2.5 72B atingem performance comparável ou superior a GPT-3.5 e competem com GPT-4 em tarefas específicas. Para uso profissional de alto volume (produção, integração via API, SLA), a API paga geralmente oferece melhor confiabilidade e suporte.

Conteúdo relacionado:

Benchmark Open-Source Ferramentas Gratuitas Ranking Custo-Benefício Melhores LLMs 2026 Benchmark Completo Como Escolher um LLM