Título: Z ai Revoluciona com GLM-5.2, Destacando-se no Benchmark CritPt
Subtítulo: GLM-5.2 da Z ai Alcança Paridade com Claude Opus 4.8 e Supera Modelos Abertos. Modelos Proprietários como GPT-5.5 Pro Mantêm a Liderança com 30.6%.
Categoria: Inteligência Artificial
O recente lançamento do GLM-5.2 pela Z ai trouxe um desempenho impressionante no CritPt, um benchmark rigoroso para problemas de física em nível de pesquisa. Este modelo não só igualou o desempenho do Claude Opus 4.8, mas também superou significativamente outros modelos de código aberto.
Principais Conclusões:
➤ O GLM-5.2 da @Zai_org destaca-se entre os modelos de código aberto, liderando com uma margem considerável. O modelo DeepSeek V4 Pro, por exemplo, alcançou apenas 12.9% no CritPt.
➤ Empatando com Claude Opus 4.8, que pontuou 20.9%, o GLM-5.2 também superou diversos modelos proprietários, como GPT-5.5, Gemini 3.1 Pro e Claude Opus 4.7.
➤ Modelos proprietários ainda dominam o topo do ranking, com o GPT-5.5 Pro alcançando a liderança com uma pontuação de 30.6%.
➤ O GLM-5.2 representa um avanço significativo em relação ao seu antecessor, o GLM-5.1, que marcou apenas 4.6% no CritPt há cerca de dez semanas, demonstrando um salto de desempenho de 4.5 vezes.
O desempenho do GLM-5.2 no CritPt é um testemunho da inovação contínua da Z ai no campo da inteligência artificial, destacando-se como um dos principais concorrentes no desenvolvimento de modelos de linguagem avançados.