Glossário de IA

Benchmark (IA)

Letra B

Definição

Conjunto padronizado de tarefas e métricas usado para avaliar e comparar o desempenho de modelos de IA. Exemplos incluem MMLU, HumanEval, GPQA e Chatbot Arena. Benchmarks permitem comparações objetivas entre modelos.

Termos Relacionados

ELO Score

Ver também

← Glossário completo Benchmark de IA Modelos de IA Ferramentas Guias

Navegar por letra:

A B C D E F G H I L M N O P Q R S T U V W Z