Glossário de IA

OCR (Reconhecimento Óptico de Caracteres)

Letra O

Definição

OCR (Optical Character Recognition, ou Reconhecimento Óptico de Caracteres) é a tecnologia que converte imagens de texto — como documentos escaneados, fotos de placas ou páginas de livros — em texto digital editável e pesquisável. O processo analisa os padrões visuais de cada caractere e os mapeia para o código de texto correspondente. A evolução do OCR seguiu a evolução da IA: as primeiras soluções usavam padrões fixos; soluções modernas usam redes neurais convolucionais e Transformers, com desempenho muito superior em fontes variadas, documentos danificados e textos manuscritos. No Brasil, o OCR é tecnologia crítica para a digitalização de documentos públicos, cartórios e arquivos históricos. É também fundamental em processos de onboarding digital de clientes em bancos e fintechs — extraindo dados de RG, CPF e comprovantes de renda automaticamente. Ferramentas como o Tesseract (open source), o Google Cloud Vision, o Azure Document Intelligence e o Amazon Textract são as mais usadas. Para documentos jurídicos e médicos manuscritos em português, soluções especializadas são necessárias, pois a caligrafia e terminologia técnica apresentam desafios adicionais que os modelos genéricos ainda não resolvem completamente.

Termos Relacionados

Ver também

Navegar por letra: