Sistema de pontuação derivado do xadrez, adaptado para comparar modelos de IA com base em confrontos diretos avaliados por humanos. Usado pelo Chatbot Arena (LMSYS) para criar rankings de preferência humana.
Navegar por letra: