Glossário de IA

Benchmark (IA)

Letra B

Definição

Conjunto padronizado de tarefas e métricas usado para avaliar e comparar o desempenho de modelos de IA. Exemplos incluem MMLU, HumanEval, GPQA e Chatbot Arena. Benchmarks permitem comparações objetivas entre modelos.

Termos Relacionados

Ver também

Navegar por letra: