Predicción interpretable de permanencia laboral para cargos administrativos en Colombia mediante el uso del modelo de Machine Learning Cubist
| dc.contributor.advisor | Ramos Montaña, Jesus David | |
| dc.contributor.author | Rojas Gutierrez, Gustavo Adolfo | |
| dc.date.accessioned | 2025-07-16T16:31:44Z | |
| dc.date.available | 2025-07-16T16:31:44Z | |
| dc.date.issued | 2025-06 | |
| dc.description.abstract | La rotación temprana de personal genera impactos económicos, sociales y culturales que afectan la sostenibilidad de las empresas. La predicción es un reto importante aún, pese al uso de múltiples enfoques analíticos. Objetivo: Identificar patrones sociodemográficos asociados a la permanencia laboral usando el modelo Cubist ensamblado, y comparar su desempeño con Lasso, CART y Cubist sin ensamble. Metodología: Los datos analizados, corresponden a la Encuesta de Calidad de Vida del DANE (2023). Se aplicó imputación por MICE, selección de variables con Chi², V de Cramer y Kruskal-Wallis, y se entrenaron modelos con 70 % de los datos (n = 2747), validando con el 30 % restante (n = 1774). Resultados: El modelo Cubist ensamblado (150 comités, 90 vecinos) mostró el mejor rendimiento, respecto a los 3 comparados. Las variables más influyentes para el incremento de la permanencia laboral, fueron edad, salario, tipo de contrato y, en menor medida, educación de la madre, indicando posibles investigaciones a futuro con datos dedicados a este objeto de estudio, comparar los resultados obtenidos, profundizar sobre la explicación de la afectación en permanencia de estas variables. | |
| dc.description.abstractenglish | Early employee turnover generates economic, social, and cultural impacts that compromise business sustainability. Despite the application of various analytical approaches, its prediction remains a challenge. Objective: To identify sociodemographic patterns associated with job retention using the Cubist model, and compare its performance against Lasso regression, CART, and Cubist without ensemble. Methodology: Data from the 2023 Quality of Life Survey (DANE) were analyzed. Independent variables were imputed using MICE and selected through Chi-square, V of Cramel, and Kruskal-Wallis tests. Models were trained on 70% of the data (n = 2,747) and validated on the remaining 30% (n = 1,774). Results: The ensemble Cubist model (150 committees, 90 neighbors) outperformed the other three. The most influential variables were age, salary, and contract type. Mother’s education showed a weaker but relevant influence, suggesting future research with dedicated datasets to explore and compare the effects of these variables on job retention. | |
| dc.identifier.uri | https://hdl.handle.net/20.500.12495/14976 | |
| dc.language.iso | es | |
| dc.relation.references | Alegre, A., & Almonte, A (2020) Validez predictiva de una batería de pruebas de selección de personal en relación con la duración en el trabajo. Gestión de las Personas y Tecnología, 13(37) | |
| dc.relation.references | Bohórquez, M., Torys, J., & Paredes Aguirre, M. (2020). Modelos de predicción de deserción de clientes para una administradora de fondos ecuatoriana. Revista Compendium: Cuadernos de Economía y Administración, 7(1). | |
| dc.relation.references | Carazo, C., & Prieto, L (2024). El valor de p del test no es un ‘índice matemático’, es simplemente una frecuencia relativa [The p-value of the test is not a 'mathematical index', it is simply a relative frequency]. Revista de Neurología 78(7) https://doi.org/10.33588/rn.7807.2023164. | |
| dc.relation.references | Chen, J., Él, Y., Liang, Y., Wang, W., & Duan, X. (2024). Estimación del valor calorífico bruto del carbón basada en el modelo de regresión cubista. Scientific Reports, 14, 23176. https://doi.org/10.1038/s41598-024-74469-3 | |
| dc.relation.references | Departamento Administrativo Nacional de Estadística - DANE. (2024). Encuesta Nacional de Calidad de Vida - ECV 2023. Dirección de Metodología y Producción Estadística - DIMPE. https://microdatos.dane.gov.co/index.php/catalog/827 | |
| dc.relation.references | Díaz, B., Meleán, R., & Marín, W (2021). Rendimiento académico de estudiantes en Educación Superior: predicciones de factores influyentes a partir de árboles de decisión. Telos, 23(3). | |
| dc.relation.references | Freijeiro, L., Febrero, M., & González, W (2020). A critical review of LASSO and its derivatives for variable selection under dependence among covariates. arXiv preprint arXiv:2012.11470. https://arxiv.org/abs/2012.11470 | |
| dc.relation.references | Gonzalez, A., Miles, J., Prato, J., & Sorondo, Á (2023). Perfiles organizacionales que impactan en la aplicación de las prácticas de gestión: El caso de las pymes uruguayas. Revista de la Universidad CLAEH, 42(2), Artículo 7. https://doi.org/10.29192/claeh.42.2.7 | |
| dc.relation.references | Guerrero, P., & Guerrero, J. (2023). La gran renuncia, aspectos psicológicos, económicos, y la resiliencia organizacional en EUA y México. RICSH Revista Iberoamericana de las Ciencias Sociales y Humanísticas, 12(23), 15-49. | |
| dc.relation.references | Hodson, T., Over, T., & Foks, S (2021). Mean squared error, deconstructed. Journal of Advances in Modeling Earth Systems, 13(12), e2021MS002681. https://doi.org/10.1029/2021MS002681 | |
| dc.relation.references | Hodson, T (2022). Root-mean-square error (RMSE) or mean absolute error (MAE): When to use them or not. Geoscientific Model Development, 15(14). https://doi.org/10.5194/gmd-15-5481-202 | |
| dc.relation.references | Khaledian, Y., & Miller, B. (2020). Selecting appropriate machine learning methods for digital soil mapping. Applied Mathematical Modelling, 81 | |
| dc.relation.references | Kuhn M, Quinlan, R (2025). _Cubist: Rule- And Instance-Based Regression Modeling_. R package version 0.5.0, https://CRAN.R-project.org/package=Cubist | |
| dc.relation.references | Kuhn, M. (2008). Building Predictive Models in R Using the caret Package. Journal of Statistical Software, 28(5),1–26. https://doi.org/10.18637/jss.v028.i05 | |
| dc.relation.references | Landa, B., Romero, R., & Rodriguez, M (2021). Rendimiento académico de estudiantes en Educación Superior: predicciones de factores influyentes a partir de árboles de decisión. Telos: Revista de Estudios Interdisciplinarios en Ciencias Sociales, 23(3), 616-639. | |
| dc.relation.references | Langle, M., Méndez, O y Sánchez, J (2021) Factores predictores del índice de rotación de personal: el caso de una empresa maquiladora en Reynosa. Análisis Económico, 36(93) | |
| dc.relation.references | Littlewood, H & Colín, A (2024). Diseño de tests de selección de personal a partir de la teoría clásica de los tests: El caso de vendedores de vehículos. Contaduría y Administración, 69(3). | |
| dc.relation.references | Llanos, M., & Castillo, K. (2022). Efecto del absentismo y la rotación de personal en la productividad y venta de carne porcina ecuatoriana: Período 2020-2021. Estudios de Administración, 29(2) | |
| dc.relation.references | Martínez, P., Cassaretto, M., y Tavera, M (2020) Variables predictoras del compromiso laboral y académico en trabajadores y estudiantes de una universidad peruana. Pensamiento Psicológico, 18(1) | |
| dc.relation.references | Menezes, N, & Narita, R (2023). Labor market turnover and inequality in Latin America (IDB Working Paper No..1519). Inter-American Development., https://publications.iadb.org/en/labor-market-turnover-and-inequality-latin-america | |
| dc.relation.references | Méndez, D y Jiménez, M (2023) Analítica de Talento, Un enfoque conductual para la Toma de decisiones en las organizaciones. Editorial Digital Tecnológico de Monterrey. | |
| dc.relation.references | Molina, M (2024). Un baile épico. Técnicas de regularización en regresión múltiple. Revista Electrónica de AnestesiaR, 16(5), 4 | |
| dc.relation.references | Mora, Y., Romero, C., Muñoz, I., & Sierra, J. (2021). Compromiso organizacional y factores demográficos que propician el ausentismo laboral en franquicias de Barranquilla - Colombia. Revista de Ciencias Sociales (Ve), 27(2). Universidad del Zulia. | |
| dc.relation.references | Pazmiño, R., Andrade, A., y Montalvo, F (2023) Disrupción tecnológica en la gestión del talento humano. Journal of Science and Research, 8(1) | |
| dc.relation.references | Pinto, C., Mori, F., Castro, C., & Bardales, J (2021). Selección de personal y desempeño laboral de los colaboradores, dirección de operaciones agrarias de Tarapoto-región San Martín. Ciencia Latina Revista Científica Multidisciplinar, 5(4) | |
| dc.relation.references | R Core Team (2024). R: A language and environment for statistical computing. R Foundation for Statistical Computing. https://www.R-project.org/ | |
| dc.relation.references | Rodríguez, A. (2016). Validez predictiva e impacto adverso de la entrevista conductual estructurada en el sector público. Revista de Psicología del Trabajo y de las Organizaciones, 32(2), 75-85. | |
| dc.relation.references | Rodríguez, M., Macías, A., Rosales, A., Miranda, C., Norzagaray, C., Ocampo, C., Tapia, C., Lípez, D., Villa, J., Bravo, J., Guevara, K y Reyna, W (2022). Aplicaciones del análisis contingencial en diversos contextos. Grupo Becas para la Superación Educativa de México, S.C. Universidad UDF Santa María. | |
| dc.relation.references | Salessi, S., & Gabini, S. (2024). Rol del job crafting y del trabajo significativo en la explicación del arraigo laboral. Revista Psicologia: Organizações e Trabalho, 24 (contínuo), e25067- e25067. | |
| dc.relation.references | Silva, L., Souza, C., Silva, C., Filgueiras, R., Sena-Souza, J., Fernandes-Filho, E., & Leite, M (2023). Mapping the effects of climate change on reference evapotranspiration in future scenarios in the Brazilian semi-arid region - South America. Revista Brasileira de Geografia Física, 16(2) | |
| dc.relation.references | Therneau, T & Atkinson B (2025). rpart: Recursive Partitioning and Regression Trees_. R package version 4.1.24, https://CRAN.R-project.org/package=rpart | |
| dc.relation.references | Terán, A., Ramírez, C., & Martínez, A (2020) Confiabilidad y validez de un instrumento de selección de capital humano. Revista Mexicana de Economía y Finanzas, 15(3) | |
| dc.relation.references | Thomas, O., & Reimann, O. (2022). The bias blind spot among HR employees in hiring decisions. Business Research Quarterly, 37(1). | |
| dc.relation.references | Van Buuren, S, Groothuis-Oudshoorn, K (2011). mice: Multivariate Imputation by Chained Equations in R. Journal ofStatistical Software, 45(3), 1-67. DOI 10.18637/jss.v045.i03. | |
| dc.relation.references | Vesga, J., García, M., Forero, C., Aguilar, M., Jaramillo, J., Quiroz, E., Castaño, E., Andrade, V., y Gómez, M (2020) Aspectos de la cultura organizacional y su relación con la disposición al cambio organizacional. Suma Psicológica, 27(1) | |
| dc.relation.references | Zhou, D., Chahal, R., Gotlib, I., & Liu, S. (2024). Comparison of Lasso and stepwise regression in psychological data. Methodology, 20(2), 121–143. https://doi.org/10.5964/meth.11523 | |
| dc.rights | Attribution-NonCommercial-NoDerivatives 4.0 International | en |
| dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/4.0/ | |
| dc.subject | Rotación de personal | |
| dc.subject | Permanencia laboral | |
| dc.subject | Evaluación de personal | |
| dc.subject | Machine Learning | |
| dc.subject | Árboles de decisión | |
| dc.subject | Cubist | |
| dc.subject | Talento Humano | |
| dc.subject.keywords | Attrition | |
| dc.subject.keywords | Job permanency | |
| dc.subject.keywords | Decisional Tree | |
| dc.subject.keywords | Human Talent | |
| dc.subject.keywords | Machine Learning | |
| dc.subject.keywords | Personal assessment | |
| dc.subject.keywords | Cubist | |
| dc.title | Predicción interpretable de permanencia laboral para cargos administrativos en Colombia mediante el uso del modelo de Machine Learning Cubist | |
| dc.title.translated | Interpretable prediction of job retention for administrative positions in Colombia using the Cubist Machine Learning model |
Archivos
Bloque original
1 - 1 de 1
Cargando...
- Nombre:
- Trabajo de grado.pdf
- Tamaño:
- 709.79 KB
- Formato:
- Adobe Portable Document Format
Bloque de licencias
1 - 3 de 3
Cargando...
- Nombre:
- license.txt
- Tamaño:
- 1.95 KB
- Formato:
- Item-specific license agreed upon to submission
- Descripción:
Cargando...
- Nombre:
- Carta de autorizacion.pdf
- Tamaño:
- 214.35 KB
- Formato:
- Adobe Portable Document Format
- Descripción:
Cargando...
- Nombre:
- Anexo 1 acta de aprobacion.pdf
- Tamaño:
- 381.8 KB
- Formato:
- Adobe Portable Document Format
- Descripción:
