Inteligência Artificial

Modelos de IA de ponta falham em novo benchmark de TI da IBM e Artificial Analysis

O ITBench-AA revela que modelos como GPT-4o e Claude 3.5 pontuam abaixo de 50% em tarefas complexas de TI corporativa.

SW
Redação SWEN.AI27 de maio de 2026, 17:20 Atualizado há cerca de 1 hora
3 min
Google News
huggingface.co
Ver original
Compartilhe:
Modelos de IA de ponta falham em novo benchmark de TI da IBM e Artificial Analysis
Toque duas vezes para ampliar

Ver no Ranking SWEN.AI →

Compare Claude, GPT-5, Qwen por ELO, preço e velocidade

Abrir Benchmark
Compartilhar:

Benchmark de IA

Compare GPT, Claude, Gemini e mais: preços, velocidade e benchmarks em português.

Explore outras categorias