Resultados do LisanBench para GLM-5.2 mostram melhorias em…

# Resultados do LisanBench para GLM-5.2 mostram melhorias em relação a versões anteriores

Os resultados do LisanBench para o GLM-5.2 revelam avanços significativos frente às versões anteriores do modelo. O GLM-5.2-high alcançou 1834 pontos, quase dobrando o desempenho do GLM-5.

GLM-5.2-high ocupa a 29ª posição no LisanBench

O GLM-5.2-high obteve uma pontuação de 1834 no benchmark, ocupando a 29ª posição no ranking geral. Em comparação, o GLM-5 havia registrado apenas 986,83 pontos. Este salto de desempenho é expressivo, mas o modelo ainda fica atrás de concorrentes open-source como o DeepSeek-V4 e os modelos Kimi. Segundo o relatório do LisanBench, o DeepSeek-V4 lidera com uma pontuação de 2450.

Eficiência de raciocínio comparável a GPT-5-medium e Gemini 3 Flash

Os scores de raciocínio do Kimi-K2.5 são aproximadamente equivalentes aos do GLM-5.2. No entanto, o Kimi consome em média apenas cerca de 19 mil tokens, contra aproximadamente 32 mil tokens do GLM-5.2. Essa diferença indica que o Kimi é mais eficiente no uso de tokens para atingir resultados semelhantes de raciocínio.

Em termos de eficiência de raciocínio, o GLM-5.2 se posiciona muito próximo do GPT-5-medium e do Gemini 3 Flash. Isso coloca o modelo em um patamar competitivo entre soluções proprietárias, mesmo que ainda precise evoluir para rivalizar com os líderes do segmento open-source no LisanBench. De acordo com o LisanBench, o Gemini 3 Flash utiliza cerca de 28 mil tokens para alcançar resultados comparáveis, destacando-se pela eficiência.

# Resultados do LisanBench para GLM-5.2 mostram melhorias em relação a versões anteriores

Os resultados do LisanBench para o GLM-5.2 revelam avanços significativos frente às versões anteriores do modelo. O GLM-5.2-high alcançou 1834 pontos, quase dobrando o desempenho do GLM-5.

Resultados do LisanBench para GLM-5.2 mostram melhorias em relação a versões anteriores

GLM-5.2-high ocupa a 29ª posição no LisanBench

Eficiência de raciocínio comparável a GPT-5-medium e Gemini 3 Flash

Explore outras categorias

Resultados do LisanBench para GLM-5.2 mostram melhorias em relação a versões anteriores

GLM-5.2-high ocupa a 29ª posição no LisanBench

Eficiência de raciocínio comparável a GPT-5-medium e Gemini 3 Flash

Relacionadas

Explore outras categorias

Relacionadas