RAG (Retrieval-Augmented Generation) é uma técnica que combina recuperação de informação com geração de texto para produzir respostas fundamentadas em documentos reais. O processo funciona em duas etapas: primeiro, o sistema busca documentos relevantes em uma base de conhecimento (usando busca semântica por embeddings); depois, esses documentos são incluídos no contexto do modelo de linguagem, que gera uma resposta baseada nas informações recuperadas. RAG resolve o principal problema dos LLMs: o conhecimento estático limitado à data de corte do treinamento e a tendência a alucinar. Com RAG, o modelo pode responder sobre documentos que nunca viu durante o treinamento — contratos da empresa, documentação técnica, notícias recentes. Para o mercado brasileiro, RAG é a base de assistentes jurídicos (que consultam jurisprudência em tempo real), sistemas de atendimento ao cliente (que consultam base de conhecimento interna) e assistentes de compliance (que verificam regulamentos atualizados). Ferramentas como LangChain, LlamaIndex e o próprio Supabase com pgvector facilitam a implementação de RAG em produção. É considerada a técnica mais impactante para aplicações empresariais de IA em 2024-2026.
Navegar por letra: