OCR

OCR

También conocido como: Optical Character Recognition, Reconocimiento Óptico de Caracteres

Definición

OCR (Optical Character Recognition) es la tecnología que convierte imágenes de texto (escaneos, fotos) en texto digital editable y searchable. Usada para procesar PDFs escaneados de estados de cuenta.

Contexto LATAM

En LATAM muchos bancos regionales y algunos formatos viejos entregan PDFs escaneados (no nativos digitales). OCR es necesario para extraer datos de estos documentos. La precisión moderna en español supera 98% en escaneos de buena calidad.

Ejemplo concreto

Un PDF escaneado de Banco del Bajío de 2018 se procesa con OCR primero (convirtiendo la imagen en texto) y luego con parsing estructurado (interpretando el layout de columnas como movimientos).

¿Cómo lo maneja finO$?

finO$ aplica OCR automáticamente cuando detecta un PDF escaneado o de baja calidad. Para PDFs nativos (mayoría de bancos modernos) salta OCR y va directo a parsing estructurado, mejorando velocidad y precisión.

¿Necesitas convertir estados de cuenta bancarios a JSON estructurado?

Contexto LATAM

Ejemplo concreto

¿Cómo lo maneja finO$?

Términos relacionados