Inteligência Artificial

Memória Intel Optane permite rodar LLM de 1 trilhão de parâmetros em GPU única

Com 768GB de RAM Optane, sistema executou o modelo Kimi K2.5 a 4 tokens por segundo, provando viabilidade de hardware alternativo para grandes modelos.

SW
Redação SWEN.AI23 de maio de 2026, 11:20 Atualizado há cerca de 1 hora
4 min
Google News
tomshardware.com
Ver original
Compartilhe:
Memória Intel Optane permite rodar LLM de 1 trilhão de parâmetros em GPU única
Toque duas vezes para ampliar

Ver no Ranking SWEN.AI →

Compare Llama por ELO, preço e velocidade

Abrir Benchmark
Compartilhar:

Benchmark de IA

Compare GPT, Claude, Gemini e mais: preços, velocidade e benchmarks em português.

Explore outras categorias