Z ai lança GLM-5.2 com desempenho notável em benchmark…

Título: Z ai Revoluciona com GLM-5.2, Destacando-se no Benchmark CritPt

Subtítulo: GLM-5.2 da Z ai Alcança Paridade com Claude Opus 4.8 e Supera Modelos Abertos. Modelos Proprietários como GPT-5.5 Pro Mantêm a Liderança com 30.6%.

Categoria: Inteligência Artificial

O recente lançamento do GLM-5.2 pela Z ai trouxe um desempenho impressionante no CritPt, um benchmark rigoroso para problemas de física em nível de pesquisa. Este modelo não só igualou o desempenho do Claude Opus 4.8, mas também superou significativamente outros modelos de código aberto.

Principais Conclusões:

➤ O GLM-5.2 da @Zai_org destaca-se entre os modelos de código aberto, liderando com uma margem considerável. O modelo DeepSeek V4 Pro, por exemplo, alcançou apenas 12.9% no CritPt.

➤ Empatando com Claude Opus 4.8, que pontuou 20.9%, o GLM-5.2 também superou diversos modelos proprietários, como GPT-5.5, Gemini 3.1 Pro e Claude Opus 4.7.

➤ Modelos proprietários ainda dominam o topo do ranking, com o GPT-5.5 Pro alcançando a liderança com uma pontuação de 30.6%.

➤ O GLM-5.2 representa um avanço significativo em relação ao seu antecessor, o GLM-5.1, que marcou apenas 4.6% no CritPt há cerca de dez semanas, demonstrando um salto de desempenho de 4.5 vezes.

O desempenho do GLM-5.2 no CritPt é um testemunho da inovação contínua da Z ai no campo da inteligência artificial, destacando-se como um dos principais concorrentes no desenvolvimento de modelos de linguagem avançados.