Glossário de IA

Quantização

Letra Q

Definição

Técnica que reduz o tamanho de um modelo de IA comprimindo seus parâmetros de ponto flutuante de 32 ou 16 bits para 8, 4 ou até 1 bit. Permite rodar modelos grandes em hardware mais simples com pequena perda de qualidade.

Termos Relacionados

Ollama

Ver também

← Glossário completo Benchmark de IA Modelos de IA Ferramentas Guias

Navegar por letra:

A B C D E F G H I L M N O P Q R S T U V W Z