# Resultados do LisanBench para GLM-5.2 mostram melhorias em relação a versões anteriores
Os resultados do LisanBench para o GLM-5.2 revelam avanços significativos frente às versões anteriores do modelo. O GLM-5.2-high alcançou 1834 pontos, quase dobrando o desempenho do GLM-5.
GLM-5.2-high ocupa a 29ª posição no LisanBench
O GLM-5.2-high obteve uma pontuação de 1834 no benchmark, ocupando a 29ª posição no ranking geral. Em comparação, o GLM-5 havia registrado apenas 986,83 pontos. Este salto de desempenho é expressivo, mas o modelo ainda fica atrás de concorrentes open-source como o DeepSeek-V4 e os modelos Kimi. Segundo o relatório do LisanBench, o DeepSeek-V4 lidera com uma pontuação de 2450.
Eficiência de raciocínio comparável a GPT-5-medium e Gemini 3 Flash
Os scores de raciocínio do Kimi-K2.5 são aproximadamente equivalentes aos do GLM-5.2. No entanto, o Kimi consome em média apenas cerca de 19 mil tokens, contra aproximadamente 32 mil tokens do GLM-5.2. Essa diferença indica que o Kimi é mais eficiente no uso de tokens para atingir resultados semelhantes de raciocínio.
Em termos de eficiência de raciocínio, o GLM-5.2 se posiciona muito próximo do GPT-5-medium e do Gemini 3 Flash. Isso coloca o modelo em um patamar competitivo entre soluções proprietárias, mesmo que ainda precise evoluir para rivalizar com os líderes do segmento open-source no LisanBench. De acordo com o LisanBench, o Gemini 3 Flash utiliza cerca de 28 mil tokens para alcançar resultados comparáveis, destacando-se pela eficiência.