Técnica em redes neurais que permite ao modelo focar em partes relevantes dos dados de entrada. É a base da arquitetura Transformer usada em GPT, BERT e outros LLMs.
Navegar por letra: