Tipo de LLM treinado especificamente para raciocínio passo a passo complexo, geralmente com uma fase de "pensamento" interna antes da resposta final. Exemplos: o1, o3 (OpenAI), DeepSeek-R1, Claude 3.7 Sonnet.
Navegar por letra: