SWEN.AI
NotíciasFerramentas500+BenchmarkTutoriaisRankingGitHub RadarArtigosPatrocine
CtrlK
NotíciasFerramentasBenchmarkTutoriaisRanking
SWEN.AI
NotíciasFerramentas500+BenchmarkTutoriaisRankingGitHub RadarArtigosPatrocine
CtrlK
NotíciasFerramentasBenchmarkTutoriaisRanking
  1. Início
  2. Inteligência Artificial
  3. Resultados do LisanBench para GLM-5.2 mostram melhorias e...
Inteligência Artificial

Resultados do LisanBench para GLM-5.2 mostram melhorias em relação a versões anteriores

O modelo GLM-5.2-high obteve uma pontuação de 1834, superando o GLM-5, mas ainda fica atrás de modelos open-source como DeepSeek-V4 e Kimi. Em eficiência de raciocínio, é comparável ao GPT-5-medium e Gemini 3 Flash.

JB
Juliana Barros27 de junho de 2026, 20:05 Atualizado em há 8 minutos
2 min
Twitter Radar
x.com
Ver original
Compartilhar:
Resultados do LisanBench para GLM-5.2 mostram melhorias em relação a versões anteriores
Toque duas vezes para ampliar

# Resultados do LisanBench para GLM-5.2 mostram melhorias em relação a versões anteriores

Os resultados do LisanBench para o GLM-5.2 revelam avanços significativos frente às versões anteriores do modelo. O GLM-5.2-high alcançou 1834 pontos, quase dobrando o desempenho do GLM-5.

GLM-5.2-high ocupa a 29ª posição no LisanBench

O GLM-5.2-high obteve uma pontuação de 1834 no benchmark, ocupando a 29ª posição no ranking geral. Em comparação, o GLM-5 havia registrado apenas 986,83 pontos. Este salto de desempenho é expressivo, mas o modelo ainda fica atrás de concorrentes open-source como o DeepSeek-V4 e os modelos Kimi. Segundo o relatório do LisanBench, o DeepSeek-V4 lidera com uma pontuação de 2450.

Eficiência de raciocínio comparável a GPT-5-medium e Gemini 3 Flash

Os scores de raciocínio do Kimi-K2.5 são aproximadamente equivalentes aos do GLM-5.2. No entanto, o Kimi consome em média apenas cerca de 19 mil tokens, contra aproximadamente 32 mil tokens do GLM-5.2. Essa diferença indica que o Kimi é mais eficiente no uso de tokens para atingir resultados semelhantes de raciocínio.

Em termos de eficiência de raciocínio, o GLM-5.2 se posiciona muito próximo do GPT-5-medium e do Gemini 3 Flash. Isso coloca o modelo em um patamar competitivo entre soluções proprietárias, mesmo que ainda precise evoluir para rivalizar com os líderes do segmento open-source no LisanBench. De acordo com o LisanBench, o Gemini 3 Flash utiliza cerca de 28 mil tokens para alcançar resultados comparáveis, destacando-se pela eficiência.

Ver no Ranking SWEN.AI →

GPT-5, Gemini, DeepSeek — por ELO, preço e velocidade

Abrir Benchmark
Compartilhar:

Benchmark de IA

Compare GPT, Claude, Gemini e mais: preços, velocidade e benchmarks.

Ver Ranking GeralComparar ModelosTop LLMs 2026

Explore outras categorias

Relacionadas

  • Carta do secretário de Comércio Howard Lutnick para Tom Brown da Anthropic
  • DeepSeek lança módulo de decodificação DSpark e open source DeepSpec
  • Anthropic não exigirá mais licença para transferências do modelo Claude Mythos 5
  • Google lança variações de design para o AI Studio