Predicción interpretable de permanencia laboral para cargos administrativos en Colombia mediante el uso del modelo de Machine Learning Cubist

Cargando...
Miniatura

Fecha

Título de la revista

Publicado en

Publicado por

URL de la fuente

Enlace a contenidos multimedia

ISSN de la revista

Título del volumen

Resumen

La rotación temprana de personal genera impactos económicos, sociales y culturales que afectan la sostenibilidad de las empresas. La predicción es un reto importante aún, pese al uso de múltiples enfoques analíticos. Objetivo: Identificar patrones sociodemográficos asociados a la permanencia laboral usando el modelo Cubist ensamblado, y comparar su desempeño con Lasso, CART y Cubist sin ensamble. Metodología: Los datos analizados, corresponden a la Encuesta de Calidad de Vida del DANE (2023). Se aplicó imputación por MICE, selección de variables con Chi², V de Cramer y Kruskal-Wallis, y se entrenaron modelos con 70 % de los datos (n = 2747), validando con el 30 % restante (n = 1774). Resultados: El modelo Cubist ensamblado (150 comités, 90 vecinos) mostró el mejor rendimiento, respecto a los 3 comparados. Las variables más influyentes para el incremento de la permanencia laboral, fueron edad, salario, tipo de contrato y, en menor medida, educación de la madre, indicando posibles investigaciones a futuro con datos dedicados a este objeto de estudio, comparar los resultados obtenidos, profundizar sobre la explicación de la afectación en permanencia de estas variables.

Descripción

Abstract

Early employee turnover generates economic, social, and cultural impacts that compromise business sustainability. Despite the application of various analytical approaches, its prediction remains a challenge. Objective: To identify sociodemographic patterns associated with job retention using the Cubist model, and compare its performance against Lasso regression, CART, and Cubist without ensemble. Methodology: Data from the 2023 Quality of Life Survey (DANE) were analyzed. Independent variables were imputed using MICE and selected through Chi-square, V of Cramel, and Kruskal-Wallis tests. Models were trained on 70% of the data (n = 2,747) and validated on the remaining 30% (n = 1,774). Results: The ensemble Cubist model (150 committees, 90 neighbors) outperformed the other three. The most influential variables were age, salary, and contract type. Mother’s education showed a weaker but relevant influence, suggesting future research with dedicated datasets to explore and compare the effects of these variables on job retention.

Palabras clave

Rotación de personal, Permanencia laboral, Evaluación de personal, Machine Learning, Árboles de decisión, Cubist, Talento Humano

Temáticas

Citación

Aprobación

Revisión

Complementado por

Referenciado por