Predicción interpretable de permanencia laboral para cargos administrativos en Colombia mediante el uso del modelo de Machine Learning Cubist

dc.contributor.advisorRamos Montaña, Jesus David
dc.contributor.authorRojas Gutierrez, Gustavo Adolfo
dc.date.accessioned2025-07-16T16:31:44Z
dc.date.available2025-07-16T16:31:44Z
dc.date.issued2025-06
dc.description.abstractLa rotación temprana de personal genera impactos económicos, sociales y culturales que afectan la sostenibilidad de las empresas. La predicción es un reto importante aún, pese al uso de múltiples enfoques analíticos. Objetivo: Identificar patrones sociodemográficos asociados a la permanencia laboral usando el modelo Cubist ensamblado, y comparar su desempeño con Lasso, CART y Cubist sin ensamble. Metodología: Los datos analizados, corresponden a la Encuesta de Calidad de Vida del DANE (2023). Se aplicó imputación por MICE, selección de variables con Chi², V de Cramer y Kruskal-Wallis, y se entrenaron modelos con 70 % de los datos (n = 2747), validando con el 30 % restante (n = 1774). Resultados: El modelo Cubist ensamblado (150 comités, 90 vecinos) mostró el mejor rendimiento, respecto a los 3 comparados. Las variables más influyentes para el incremento de la permanencia laboral, fueron edad, salario, tipo de contrato y, en menor medida, educación de la madre, indicando posibles investigaciones a futuro con datos dedicados a este objeto de estudio, comparar los resultados obtenidos, profundizar sobre la explicación de la afectación en permanencia de estas variables.
dc.description.abstractenglishEarly employee turnover generates economic, social, and cultural impacts that compromise business sustainability. Despite the application of various analytical approaches, its prediction remains a challenge. Objective: To identify sociodemographic patterns associated with job retention using the Cubist model, and compare its performance against Lasso regression, CART, and Cubist without ensemble. Methodology: Data from the 2023 Quality of Life Survey (DANE) were analyzed. Independent variables were imputed using MICE and selected through Chi-square, V of Cramel, and Kruskal-Wallis tests. Models were trained on 70% of the data (n = 2,747) and validated on the remaining 30% (n = 1,774). Results: The ensemble Cubist model (150 committees, 90 neighbors) outperformed the other three. The most influential variables were age, salary, and contract type. Mother’s education showed a weaker but relevant influence, suggesting future research with dedicated datasets to explore and compare the effects of these variables on job retention.
dc.identifier.urihttps://hdl.handle.net/20.500.12495/14976
dc.language.isoes
dc.relation.referencesAlegre, A., & Almonte, A (2020) Validez predictiva de una batería de pruebas de selección de personal en relación con la duración en el trabajo. Gestión de las Personas y Tecnología, 13(37)
dc.relation.referencesBohórquez, M., Torys, J., & Paredes Aguirre, M. (2020). Modelos de predicción de deserción de clientes para una administradora de fondos ecuatoriana. Revista Compendium: Cuadernos de Economía y Administración, 7(1).
dc.relation.referencesCarazo, C., & Prieto, L (2024). El valor de p del test no es un ‘índice matemático’, es simplemente una frecuencia relativa [The p-value of the test is not a 'mathematical index', it is simply a relative frequency]. Revista de Neurología 78(7) https://doi.org/10.33588/rn.7807.2023164.
dc.relation.referencesChen, J., Él, Y., Liang, Y., Wang, W., & Duan, X. (2024). Estimación del valor calorífico bruto del carbón basada en el modelo de regresión cubista. Scientific Reports, 14, 23176. https://doi.org/10.1038/s41598-024-74469-3
dc.relation.referencesDepartamento Administrativo Nacional de Estadística - DANE. (2024). Encuesta Nacional de Calidad de Vida - ECV 2023. Dirección de Metodología y Producción Estadística - DIMPE. https://microdatos.dane.gov.co/index.php/catalog/827
dc.relation.referencesDíaz, B., Meleán, R., & Marín, W (2021). Rendimiento académico de estudiantes en Educación Superior: predicciones de factores influyentes a partir de árboles de decisión. Telos, 23(3).
dc.relation.referencesFreijeiro, L., Febrero, M., & González, W (2020). A critical review of LASSO and its derivatives for variable selection under dependence among covariates. arXiv preprint arXiv:2012.11470. https://arxiv.org/abs/2012.11470
dc.relation.referencesGonzalez, A., Miles, J., Prato, J., & Sorondo, Á (2023). Perfiles organizacionales que impactan en la aplicación de las prácticas de gestión: El caso de las pymes uruguayas. Revista de la Universidad CLAEH, 42(2), Artículo 7. https://doi.org/10.29192/claeh.42.2.7
dc.relation.referencesGuerrero, P., & Guerrero, J. (2023). La gran renuncia, aspectos psicológicos, económicos, y la resiliencia organizacional en EUA y México. RICSH Revista Iberoamericana de las Ciencias Sociales y Humanísticas, 12(23), 15-49.
dc.relation.referencesHodson, T., Over, T., & Foks, S (2021). Mean squared error, deconstructed. Journal of Advances in Modeling Earth Systems, 13(12), e2021MS002681. https://doi.org/10.1029/2021MS002681
dc.relation.referencesHodson, T (2022). Root-mean-square error (RMSE) or mean absolute error (MAE): When to use them or not. Geoscientific Model Development, 15(14). https://doi.org/10.5194/gmd-15-5481-202
dc.relation.referencesKhaledian, Y., & Miller, B. (2020). Selecting appropriate machine learning methods for digital soil mapping. Applied Mathematical Modelling, 81
dc.relation.referencesKuhn M, Quinlan, R (2025). _Cubist: Rule- And Instance-Based Regression Modeling_. R package version 0.5.0, https://CRAN.R-project.org/package=Cubist
dc.relation.referencesKuhn, M. (2008). Building Predictive Models in R Using the caret Package. Journal of Statistical Software, 28(5),1–26. https://doi.org/10.18637/jss.v028.i05
dc.relation.referencesLanda, B., Romero, R., & Rodriguez, M (2021). Rendimiento académico de estudiantes en Educación Superior: predicciones de factores influyentes a partir de árboles de decisión. Telos: Revista de Estudios Interdisciplinarios en Ciencias Sociales, 23(3), 616-639.
dc.relation.referencesLangle, M., Méndez, O y Sánchez, J (2021) Factores predictores del índice de rotación de personal: el caso de una empresa maquiladora en Reynosa. Análisis Económico, 36(93)
dc.relation.referencesLittlewood, H & Colín, A (2024). Diseño de tests de selección de personal a partir de la teoría clásica de los tests: El caso de vendedores de vehículos. Contaduría y Administración, 69(3).
dc.relation.referencesLlanos, M., & Castillo, K. (2022). Efecto del absentismo y la rotación de personal en la productividad y venta de carne porcina ecuatoriana: Período 2020-2021. Estudios de Administración, 29(2)
dc.relation.referencesMartínez, P., Cassaretto, M., y Tavera, M (2020) Variables predictoras del compromiso laboral y académico en trabajadores y estudiantes de una universidad peruana. Pensamiento Psicológico, 18(1)
dc.relation.referencesMenezes, N, & Narita, R (2023). Labor market turnover and inequality in Latin America (IDB Working Paper No..1519). Inter-American Development., https://publications.iadb.org/en/labor-market-turnover-and-inequality-latin-america
dc.relation.referencesMéndez, D y Jiménez, M (2023) Analítica de Talento, Un enfoque conductual para la Toma de decisiones en las organizaciones. Editorial Digital Tecnológico de Monterrey.
dc.relation.referencesMolina, M (2024). Un baile épico. Técnicas de regularización en regresión múltiple. Revista Electrónica de AnestesiaR, 16(5), 4
dc.relation.referencesMora, Y., Romero, C., Muñoz, I., & Sierra, J. (2021). Compromiso organizacional y factores demográficos que propician el ausentismo laboral en franquicias de Barranquilla - Colombia. Revista de Ciencias Sociales (Ve), 27(2). Universidad del Zulia.
dc.relation.referencesPazmiño, R., Andrade, A., y Montalvo, F (2023) Disrupción tecnológica en la gestión del talento humano. Journal of Science and Research, 8(1)
dc.relation.referencesPinto, C., Mori, F., Castro, C., & Bardales, J (2021). Selección de personal y desempeño laboral de los colaboradores, dirección de operaciones agrarias de Tarapoto-región San Martín. Ciencia Latina Revista Científica Multidisciplinar, 5(4)
dc.relation.referencesR Core Team (2024). R: A language and environment for statistical computing. R Foundation for Statistical Computing. https://www.R-project.org/
dc.relation.referencesRodríguez, A. (2016). Validez predictiva e impacto adverso de la entrevista conductual estructurada en el sector público. Revista de Psicología del Trabajo y de las Organizaciones, 32(2), 75-85.
dc.relation.referencesRodríguez, M., Macías, A., Rosales, A., Miranda, C., Norzagaray, C., Ocampo, C., Tapia, C., Lípez, D., Villa, J., Bravo, J., Guevara, K y Reyna, W (2022). Aplicaciones del análisis contingencial en diversos contextos. Grupo Becas para la Superación Educativa de México, S.C. Universidad UDF Santa María.
dc.relation.referencesSalessi, S., & Gabini, S. (2024). Rol del job crafting y del trabajo significativo en la explicación del arraigo laboral. Revista Psicologia: Organizações e Trabalho, 24 (contínuo), e25067- e25067.
dc.relation.referencesSilva, L., Souza, C., Silva, C., Filgueiras, R., Sena-Souza, J., Fernandes-Filho, E., & Leite, M (2023). Mapping the effects of climate change on reference evapotranspiration in future scenarios in the Brazilian semi-arid region - South America. Revista Brasileira de Geografia Física, 16(2)
dc.relation.referencesTherneau, T & Atkinson B (2025). rpart: Recursive Partitioning and Regression Trees_. R package version 4.1.24, https://CRAN.R-project.org/package=rpart
dc.relation.referencesTerán, A., Ramírez, C., & Martínez, A (2020) Confiabilidad y validez de un instrumento de selección de capital humano. Revista Mexicana de Economía y Finanzas, 15(3)
dc.relation.referencesThomas, O., & Reimann, O. (2022). The bias blind spot among HR employees in hiring decisions. Business Research Quarterly, 37(1).
dc.relation.referencesVan Buuren, S, Groothuis-Oudshoorn, K (2011). mice: Multivariate Imputation by Chained Equations in R. Journal ofStatistical Software, 45(3), 1-67. DOI 10.18637/jss.v045.i03.
dc.relation.referencesVesga, J., García, M., Forero, C., Aguilar, M., Jaramillo, J., Quiroz, E., Castaño, E., Andrade, V., y Gómez, M (2020) Aspectos de la cultura organizacional y su relación con la disposición al cambio organizacional. Suma Psicológica, 27(1)
dc.relation.referencesZhou, D., Chahal, R., Gotlib, I., & Liu, S. (2024). Comparison of Lasso and stepwise regression in psychological data. Methodology, 20(2), 121–143. https://doi.org/10.5964/meth.11523
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 Internationalen
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subjectRotación de personal
dc.subjectPermanencia laboral
dc.subjectEvaluación de personal
dc.subjectMachine Learning
dc.subjectÁrboles de decisión
dc.subjectCubist
dc.subjectTalento Humano
dc.subject.keywordsAttrition
dc.subject.keywordsJob permanency
dc.subject.keywordsDecisional Tree
dc.subject.keywordsHuman Talent
dc.subject.keywordsMachine Learning
dc.subject.keywordsPersonal assessment
dc.subject.keywordsCubist
dc.titlePredicción interpretable de permanencia laboral para cargos administrativos en Colombia mediante el uso del modelo de Machine Learning Cubist
dc.title.translatedInterpretable prediction of job retention for administrative positions in Colombia using the Cubist Machine Learning model

Archivos

Bloque original

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
Trabajo de grado.pdf
Tamaño:
709.79 KB
Formato:
Adobe Portable Document Format

Bloque de licencias

Mostrando 1 - 3 de 3
Cargando...
Miniatura
Nombre:
license.txt
Tamaño:
1.95 KB
Formato:
Item-specific license agreed upon to submission
Descripción:
Cargando...
Miniatura
Nombre:
Carta de autorizacion.pdf
Tamaño:
214.35 KB
Formato:
Adobe Portable Document Format
Descripción:
Cargando...
Miniatura
Nombre:
Anexo 1 acta de aprobacion.pdf
Tamaño:
381.8 KB
Formato:
Adobe Portable Document Format
Descripción: