Volver al glosario
Documentos

PDF nativo vs escaneado

Definición

Un PDF nativo (digital) contiene texto seleccionable y metadata estructurada generada digitalmente. Un PDF escaneado es solo una imagen de un documento físico, sin texto extraible directamente.

Contexto LATAM

Los bancos modernos en LATAM generalmente entregan PDFs nativos desde su banca en línea. Sin embargo, algunos formatos viejos o impresiones re-escaneadas (cuando el cliente imprime y vuelve a digitalizar) requieren OCR para extracción.

Ejemplo concreto

Un PDF de BBVA México descargado desde Net Cash es nativo — puedes seleccionar y copiar texto. Un PDF que recibiste por WhatsApp tras imprimirlo y volverlo a escanear es escaneado — necesita OCR.

¿Cómo lo maneja finO$?

finO$ detecta automáticamente el tipo de PDF: nativos van directo a parsing estructurado (más rápido, precisión 99%+). Escaneados pasan por OCR primero (precisión 97%+ en buena calidad).

Términos relacionados

¿Necesitas convertir estados de cuenta bancarios a JSON estructurado?