Predicción de niveles de morosidad de cartera para una empresa del sector de transacciones financieras y no financieras usando modelos de machine learning
Cargando...
Archivos
Fecha
2024-12
Título de la revista
Publicado en
Publicado por
URL de la fuente
Enlace a contenidos multimedia
ISSN de la revista
Título del volumen
Resumen
La presente investigación tiene como objetivo desarrollar y evaluar modelos de clasificación multiclase para predecir los niveles de morosidad e incumplimiento de pago en los clientes de una empresa en el sector de transacciones financieras y no financieras utilizando técnicas avanzadas de machine learning. El estudio busca optimizar la gestión de cobro de cartera permitiendo que la empresa identifique clientes con alta probabilidad de impago y tome acciones preventivas.
El diseño metodológico es cuantitativo, no experimental y transeccional, empleando modelos de aprendizaje supervisado como Random Forest, XGBoost, LightGBM, LSTM, Transformes y redes neuronales, y técnicas de procesamiento de datos como Label Encoding, One-Hot Encoding, z-score standaritation y SMOTE para balance de clases. La base de datos contiene 1.685.889 registros de clientes, recolectados durante 13 meses, y variables que incluyen características financieras y propias de los clientes.
El análisis descriptivo inicial incluye la segmentación de clientes por franjas de mora, identificación de patrones estacionales y selección de variables clave. La base de datos fue segmentada en conjuntos de entrenamiento, validación y prueba, lo que aseguró una evaluación completa y equilibrada de los modelos predictivos. Entre las métricas de evaluación empleadas se incluyeron MCC, F1 Score, Recall, AUC, Accuracy, Precisión y Kappa, permitiendo una comparación exhaustiva de la precisión y la robustez de cada modelo.
Se realiza la construcción y modelado de la proyección para la gestión de cobranza de cartera utilizando los resultados del modelo XGBoost mostrando el alcance que puede llegar a tener su implementación, resaltando el potencial de los algoritmos de machine learning para mejorar la toma de decisiones financieras. Los resultados sugieren que a futuro la investigación podría beneficiarse si también se exploran modelos basados en transformer, que han demostrado ser efectivos en el manejo de secuencias temporales y podrían ofrecer mejoras en la precisión y adaptabilidad en entornos complejos de datos financieros.
Descripción
Abstract
The research aims to develop and evaluate multiclass classification models to predict delinquency levels and payment defaults among clients in the financial and non-financial transactions sector. Using advanced machine learning techniques, the study seeks to optimize portfolio collection management, enabling the company to identify high-risk clients and take preventive actions.
The methodological design is quantitative, non-experimental, and cross-sectional, employing supervised learning models such as Random Forest, XGBoost, LightGBM, LSTM, Transformers, and convolutional neural networks, along with data processing techniques like Label Encoding, One-Hot Encoding, and SMOTE for class balancing. The database comprises 1,685,889 client records collected over 13 months, with variables including financial characteristics and client-specific attributes.
The initial descriptive analysis includes segmenting clients by delinquency categories, identifying seasonal patterns, and selecting key variables. The database is divided into training, validation, and test sets, ensuring a thorough evaluation of the predictive models. Evaluation metrics include MCC, F1 Score, Recall, AUC, Accuracy, Precision, and Kappa to compare the models’ accuracy and robustness.
A projection model for portfolio collection management was developed using XGBoost results, demonstrating the scope and potential of its implementation, highlighting machine learning algorithms' value in enhancing financial decision-making. The findings suggest that future research could benefit from exploring transformer-based models, which have proven effective in handling temporal sequences and may improve precision and adaptability in complex financial data environments.
Palabras clave
Modelos multiclase, XGBoost, Cartera, Gestión de cobranza, Franjas de mora,, Machine learning, MCC
Keywords
Multiclass models, XGBoost, Portfolio, Collections management, Delinquency bands, Machine learning, MCC