Detección de anomalías en documentos para originación de créditos

Validación inteligente de identidad e ingresos con IA, Textract y machine learning sobre AWS

¿Qué hace esta solución?

Implementamos un motor de detección de anomalías en documentos de originación que revisa automáticamente los PDFs, imágenes y archivos adjuntos de una solicitud de crédito (identidad, ingresos, respaldo laboral, estados de cuenta, etc.), combinando Amazon Textract, machine learning e IA generativa cuando es necesario.

Extrae y normaliza datos clave desde documentos estructurados y no estructurados (scans, fotos, PDFs).
Cruza la información entre documentos y contra fuentes de referencia (internas y externas) para detectar inconsistencias y señales de falsificación.
Entrega un score de riesgo documental y explicaciones claras, para que tus analistas prioricen los casos que realmente ameritan una revisión profunda.

Documentos de originación

Identidad, ingresos, respaldo laboral, estados de cuenta

Motor de anomalías (IA en AWS)

Textract + ML + Reglas configurables

Verificación inteligente accionable

Scores y alertas priorizadas

Audiencia

¿Para quién es esta solución?

Segmentos de empresa

Tamaño y madurez

Organizaciones con miles de solicitudes de crédito mensuales y procesos de originación parcial o totalmente digitales.
Equipos que ya piden documentos como cédula/pasaporte, liquidaciones, certificados de renta, estados de cuenta, contratos, boletas, etc., pero que no logran revisar todo a profundidad.
Operación bajo marcos de cumplimiento regulatorio estricto (CMF, superintendencias, reguladores locales).

Stakeholders y cargos típicos

Negocio y riesgo: Chief Risk Officer, Gerente de Riesgo de Crédito, Gerente de Originación, Product Owner de Créditos.
Fraude y cumplimiento: Gerente de Fraude, Oficial de Cumplimiento, Gerente de Cumplimiento Normativo.
Tecnología y datos: CTO, Arquitecto de Soluciones, Chief Data Officer, equipos de Datos & IA, equipos de Integración / APIs.

Problema

La documentación de originación es hoy un cuello de botella y una puerta de entrada al fraude

Las áreas de crédito y riesgo dedican enormes cantidades de tiempo a validar manualmente documentos: cédulas, liquidaciones, certificados, contratos, estados de cuenta, etc.
En muchos casos, los analistas solo alcanzan a revisar campo por campo de forma superficial (fechas, montos, RUT, nombre), dejando poco espacio para detectar ediciones sutiles o inconsistencias entre documentos.
La proliferación de sitios que generan pay stubs, certificados e incluso estados de cuenta falsos en minutos hace que validar "a ojo" sea cada vez menos efectivo.
La presión por responder rápido al cliente empuja a reducir el muestreo o relajar controles, sobre todo en campañas intensivas o segmentos de bajo ticket.
El resultado combina lo peor de dos mundos: Riesgo de aceptar solicitudes con documentos falsos o adulterados y Fricción para clientes legítimos que deben reenviar documentos o abandonar el proceso.

Volumen creciente

Miles de solicitudes diarias

Revisión manual

Cientos de horas de especialistas

Riesgos ocultos

Documentos falsos, adulterados o inconsistentes

Pérdidas y litigios

Costo estructural del negocio

Impacto global

El fraude documental en créditos está creciendo y es costoso

$12.5B

Pérdidas por fraude en EE.UU. (2024)

Impacto típico en tu operación de originación
Pérdidas directas por créditos otorgados con documentos de identidad, ingresos o respaldo laboral falsos o alterados.
Costo operativo y desgaste de equipos que revisan manualmente documentación en el 100 % de los casos o en muestras cada vez más grandes.
Riesgo reputacional y sanciones regulatorias cuando se detecta que los procesos de KYC y verificación documental no estaban a la altura de las expectativas del regulador.

Preguntas para aterrizarlo a tu realidad
¿Qué porcentaje estimas de tus solicitudes presenta inconsistencias en los documentos (fechas, montos, empleador, identidad)?
¿Cuánto tiempo dedica hoy un analista, en promedio, a la revisión documental por solicitud en tus productos clave?
¿Tienes registros de casos donde el fraude documental se descubrió después del desembolso? ¿Qué monto y qué impacto tuvieron?
Si pudieras reducir significativamente el tiempo de revisión y, al mismo tiempo, aumentar la detección temprana de documentos falsos, ¿cómo cambiaría tu apetito de riesgo y tus objetivos de crecimiento?

Solución

Un motor de verificación documental para originación de créditos

Recibe y clasifica los documentos subidos por el cliente (ID, comprobantes de ingresos, respaldo laboral, estados de cuenta, etc.).

Usa Amazon Textract y técnicas de computer vision para extraer texto y campos relevantes desde documentos escaneados o fotografiados, y parsers específicos cuando los documentos ya son digitales y estructurados (PDFs generados, XML, etc.).

Normaliza y cruza los datos entre documentos y contra fuentes de referencia para detectar inconsistencias y patrones sospechosos.

Alimenta modelos de machine learning entrenados en Amazon SageMaker que calculan un score de riesgo documental y proponen acciones (aprobar, revisar, rechazar).

Cuando la complejidad del documento lo amerita (cartas, explicaciones libres, anexos), puede incorporar IA generativa para interpretar texto no estructurado y explicar las anomalías.

Input

Documentos de solicitud de crédito

Motor + IA + Reglas

Análisis inteligente de anomalías

Verificación & Alertas

Decisiones de crédito informadas

Funcionamiento

¿Cómo se integra en tu flujo de originación?

Carga de documentos por el cliente

Desde tus canales actuales (web, app móvil, sucursal digital, ejecutivos). El cliente sube fotos, PDFs o arrastra archivos generados por sus proveedores (liquidaciones, certificados, estados de cuenta, etc.).

Clasificación y extracción inteligente

El sistema identifica el tipo de documento (ID, liquidación, certificado, estado de cuenta, contrato, etc.). Para imágenes / scans usa Amazon Textract para OCR y extracción de campos clave. Para documentos ya estructurados, usa parsers específicos sin necesidad de OCR.

Normalización y enriquecimiento con fuentes de referencia

Se mapean todos los campos a un diccionario de variables estándar. Se consulta a fuentes de referencia (bases internas, bureaus, servicios tributarios, previsionales) para contrastar la información.