Espaço Latente é a representação interna comprimida que um modelo de IA aprende para codificar dados complexos. Em vez de trabalhar diretamente com pixels de uma imagem ou palavras de um texto, o modelo cria um mapa de coordenadas de menor dimensão onde exemplos similares ficam próximos. Por exemplo, em um modelo de geração de imagens, o espaço latente pode ter 512 dimensões — cada ponto nesse espaço corresponde a uma possível imagem. Imagens de rostos ficariam agrupadas numa região; paisagens, em outra. O poder do espaço latente está na continuidade: mover-se gradualmente entre dois pontos gera exemplos intermediários coerentes (interpolação), o que não seria possível com os dados brutos. Modelos de difusão como o Stable Diffusion operam no espaço latente (latent diffusion), o que os torna mais eficientes que modelos que operam diretamente em pixels. O conceito é central em autoencoders, VAEs, GANs e modelos de difusão. No contexto de LLMs, as representações internas das camadas intermediárias do Transformer formam um espaço latente de linguagem.
Navegar por letra: