Detección de anomalías en documentos para originación de créditos
Validación inteligente de identidad e ingresos con IA, Textract y machine learning sobre AWS
¿Qué hace esta solución?
Implementamos un motor de detección de anomalías en documentos de originación que revisa automáticamente los PDFs, imágenes y archivos adjuntos de una solicitud de crédito (identidad, ingresos, respaldo laboral, estados de cuenta, etc.), combinando Amazon Textract, machine learning e IA generativa cuando es necesario.
- Extrae y normaliza datos clave desde documentos estructurados y no estructurados (scans, fotos, PDFs).
- Cruza la información entre documentos y contra fuentes de referencia (internas y externas) para detectar inconsistencias y señales de falsificación.
- Entrega un score de riesgo documental y explicaciones claras, para que tus analistas prioricen los casos que realmente ameritan una revisión profunda.
Identidad, ingresos, respaldo laboral, estados de cuenta
Textract + ML + Reglas configurables
Scores y alertas priorizadas
Audiencia
¿Para quién es esta solución?
- Bancos de consumo y banca universal.
- Bancos y compañías de crédito automotriz e hipotecario.
- Fintech de préstamos personales, BNPL y crédito al consumo.
- Cooperativas de ahorro y crédito, cajas de compensación, microfinancieras.
- Organizaciones con miles de solicitudes de crédito mensuales y procesos de originación parcial o totalmente digitales.
- Equipos que ya piden documentos como cédula/pasaporte, liquidaciones, certificados de renta, estados de cuenta, contratos, boletas, etc., pero que no logran revisar todo a profundidad.
- Operación bajo marcos de cumplimiento regulatorio estricto (CMF, superintendencias, reguladores locales).
- Negocio y riesgo: Chief Risk Officer, Gerente de Riesgo de Crédito, Gerente de Originación, Product Owner de Créditos.
- Fraude y cumplimiento: Gerente de Fraude, Oficial de Cumplimiento, Gerente de Cumplimiento Normativo.
- Tecnología y datos: CTO, Arquitecto de Soluciones, Chief Data Officer, equipos de Datos & IA, equipos de Integración / APIs.
Problema
La documentación de originación es hoy un cuello de botella y una puerta de entrada al fraude
- Las áreas de crédito y riesgo dedican enormes cantidades de tiempo a validar manualmente documentos: cédulas, liquidaciones, certificados, contratos, estados de cuenta, etc.
- En muchos casos, los analistas solo alcanzan a revisar campo por campo de forma superficial (fechas, montos, RUT, nombre), dejando poco espacio para detectar ediciones sutiles o inconsistencias entre documentos.
- La proliferación de sitios que generan pay stubs, certificados e incluso estados de cuenta falsos en minutos hace que validar "a ojo" sea cada vez menos efectivo.
- La presión por responder rápido al cliente empuja a reducir el muestreo o relajar controles, sobre todo en campañas intensivas o segmentos de bajo ticket.
- El resultado combina lo peor de dos mundos: Riesgo de aceptar solicitudes con documentos falsos o adulterados y Fricción para clientes legítimos que deben reenviar documentos o abandonar el proceso.
Miles de solicitudes diarias
Cientos de horas de especialistas
Documentos falsos, adulterados o inconsistentes
Costo estructural del negocio
Impacto global
El fraude documental en créditos está creciendo y es costoso
$12.5B
Pérdidas por fraude en EE.UU. (2024)
- 449K | Casos de fraude con tarjetas de crédito
- 42% | Mortgages con ingresos falsificados
- Impacto típico en tu operación de originación
- Pérdidas directas por créditos otorgados con documentos de identidad, ingresos o respaldo laboral falsos o alterados.
- Costo operativo y desgaste de equipos que revisan manualmente documentación en el 100 % de los casos o en muestras cada vez más grandes.
- Riesgo reputacional y sanciones regulatorias cuando se detecta que los procesos de KYC y verificación documental no estaban a la altura de las expectativas del regulador.
- Preguntas para aterrizarlo a tu realidad
- ¿Qué porcentaje estimas de tus solicitudes presenta inconsistencias en los documentos (fechas, montos, empleador, identidad)?
- ¿Cuánto tiempo dedica hoy un analista, en promedio, a la revisión documental por solicitud en tus productos clave?
- ¿Tienes registros de casos donde el fraude documental se descubrió después del desembolso? ¿Qué monto y qué impacto tuvieron?
- Si pudieras reducir significativamente el tiempo de revisión y, al mismo tiempo, aumentar la detección temprana de documentos falsos, ¿cómo cambiaría tu apetito de riesgo y tus objetivos de crecimiento?
Solución
Un motor de verificación documental para originación de créditos
Recibe y clasifica los documentos subidos por el cliente (ID, comprobantes de ingresos, respaldo laboral, estados de cuenta, etc.).
Usa Amazon Textract y técnicas de computer vision para extraer texto y campos relevantes desde documentos escaneados o fotografiados, y parsers específicos cuando los documentos ya son digitales y estructurados (PDFs generados, XML, etc.).
Normaliza y cruza los datos entre documentos y contra fuentes de referencia para detectar inconsistencias y patrones sospechosos.
Alimenta modelos de machine learning entrenados en Amazon SageMaker que calculan un score de riesgo documental y proponen acciones (aprobar, revisar, rechazar).
Cuando la complejidad del documento lo amerita (cartas, explicaciones libres, anexos), puede incorporar IA generativa para interpretar texto no estructurado y explicar las anomalías.
Documentos de solicitud de crédito
Análisis inteligente de anomalías
Decisiones de crédito informadas
Funcionamiento
¿Cómo se integra en tu flujo de originación?
Carga de documentos por el cliente
Desde tus canales actuales (web, app móvil, sucursal digital, ejecutivos). El cliente sube fotos, PDFs o arrastra archivos generados por sus proveedores (liquidaciones, certificados, estados de cuenta, etc.).
Clasificación y extracción inteligente
El sistema identifica el tipo de documento (ID, liquidación, certificado, estado de cuenta, contrato, etc.). Para imágenes / scans usa Amazon Textract para OCR y extracción de campos clave. Para documentos ya estructurados, usa parsers específicos sin necesidad de OCR.
Normalización y enriquecimiento con fuentes de referencia
Se mapean todos los campos a un diccionario de variables estándar. Se consulta a fuentes de referencia (bases internas, bureaus, servicios tributarios, previsionales) para contrastar la información.
Detección de anomalías
Modelos de ML en Amazon SageMaker y lógicas en AWS Lambda evalúan: Consistencia entre documentos (ingreso declarado vs
liquidaciones vs estado de cuenta). Señales típicas de falsificación. Reglas de negocio específicas por producto y segmento.
Score y acciones recomendadas
Se genera un score de riesgo documental por solicitud y por tipo de documento. El sistema devuelve un JSON a tu motor de originación con score de riesgo, bandera de «documento sospechoso», explicación en texto y datos estructurados para tu core.
Métricas
Los indicadores que esta solución mueve
- Porcentaje de solicitudes con documentación inconsistente o sospechosa detectada antes de la aprobación.
- Tasa de fraude por adulteración de documentos detectado vs no detectado.
- Número de casos en que se descubre fraude documental después del desembolso (meta: reducción fuerte).
- Tiempo promedio de verificación documental por solicitud.
- Horas-hombre dedicadas a revisión manual de documentos por mes.
- Porcentaje de solicitudes que requieren revisión manual exhaustiva vs revisión rápida asistida por IA.
- SLA de aprobación (por ejemplo, pasar de días a horas o minutos en segmentos digitales).
- Porcentaje de solicitudes abandonadas por fricción asociada a documentación.
- Volumen de créditos aprobados con confianza elevada en la veracidad de los documentos.
¿Qué puedes esperar al implementar el motor de anomalías documentales?
70%
Reducción en tiempo de revisión
20-30pp
Mejora en detección de fraude
30-50%
Reducción de pérdidas
24h
SLA de aprobación
Casos de Éxito y Soluciones en LATAM
Cargando entradas del blog…