Ciencia de datos en educación media: explorando correlaciones y prediciendo resultados saber 11 a partir del proceso formativo

dc.contributor.advisorMartínez Lobo, Danny Samuel
dc.contributor.authorQuintero Chitiva, Erik Antonio
dc.date.accessioned2025-07-11T21:42:59Z
dc.date.available2025-07-11T21:42:59Z
dc.date.issued2025-06
dc.description.abstractEsta investigación explora la relación entre las calificaciones obtenidas por una Institución Educativa Distrital (IED) en diferentes y los resultados alcanzados en las áreas evaluadas en las pruebas Saber 11. Se realizó un Análisis de Correlaciones Canónicas (ACC) tomando como variables explicativas las calificaciones obtenidas por los estudiantes en las asignaturas que cursaron en una IED logrando explicar un 25\% de la varianza de los resultados de las cinco áreas que evalúa el Instituto Colombiano para la Evaluación de la Educación (ICFES). La interpretación de los resultados del ACC reveló que en la IED las asignaturas de Lengua Castellana, Idioma Extranjero y Convivencia tienen una influencia significativa en los resultados de las áreas evaluadas con las pruebas Saber 11, lo que destaca la importancia de las habilidades comunicativas. Adicionalmente, la identificación de relaciones débiles entre los resultados de las pruebas y asignaturas específicas como física, química, matemáticas, entre otras; que desde la práctica pedagógica se esperaría que tuvieran altas magnitudes directas de correlación con el grupo de resultados en las áreas evaluadas por el ICFES, muestra una dinámica de multicausalidad entre las asignaturas. Finalmente, para la predicción del puntaje total en la prueba Saber 11, se construyó un Modelo Lineal Generalizado (MLG) que indicó que las valoraciones de las asignaturas Química, Lengua Castellana y Tecnología e Informática tienen un mayor impacto en los resultados obtenidos por los estudiantes de la IED en dichas pruebas.
dc.description.abstractenglishThis research explores the relationship between grades obtained by a District Educational Institution (DEI) in different subjects and the results achEIved in the areas evaluated in the Saber 11 tests. A Canonical Correlation Analysis (CCA) was performed, taking the grades obtained by students in the subjects they took at an DEI as explanatory variables, managing to explain 25\% of the variance in the results of the five areas evaluated by the Colombian Institute for the Evaluation of Education (ICFES). The interpretation of the CCA results revealed that in the DEI, the subjects of Spanish Language, Foreign Language, and Coexistence have a significant influence on the results of the areas evaluated with the Saber 11 tests, which highlights the importance of communicative skills. Additionally, the identification of weak relationships between test results and specific subjects such as physics, chemistry, and mathematics, among others; which from pedagogical practice would be expected to have high direct correlation magnitudes with the group of results in the areas evaluated by ICFES, shows a dynamic of multicausality among subjects. Finally, for the prediction of the total score in the Saber 11 test, a Generalized Linear Model (GLM) was built which indicated that the valuations of the subjects Chemistry, Spanish Language, and Technology and Informatics have a greater impact on the results obtained by the DEI students in said tests.
dc.identifier.urihttps://hdl.handle.net/20.500.12495/14933
dc.language.isoes
dc.relation.referencesCalderón, V. V., & Ardila, L. F. (2024). Predicción del desempeño en las pruebas Saber 11 utilizando variables del contexto socio-económico de los aplicantes mediante un análisis estadístico con técnicas de machine learning Policy Brief. https://doi.org/10.31235/osf.io/94ukx
dc.relation.referencesCaucali Medina, J. D. (2020). Impacto positivo de la participación cultural en los resultados académicos de las pruebas Saber 11 en Bogotá en los años 2015 y 2017. [Universidad de los Andes]. In Uniandes. http://hdl.handle.net/1992/43886
dc.relation.referencesChica Gómez, S. M., Galvis Gutiérrez, D. M., & Ramirez Hassan, A. (2010). Determinantes del rendimiento académico en Colombia. Pruebas ICFES - Saber 11o, 2009*. Revista Universidad EAFIT, 46, 48–72. https://repository.eafit.edu.co/server/api/core/bitstreams/2441541c-d044-4c5e-bb25-6dc72d67e7ce/content
dc.relation.referencesContreras, L. E., Fuentes, H. J., & Rodríguez, J. I. (2020). Predicción del rendimiento académico como indicador de éxito/fracaso de los estudiantes de ingeniería, mediante aprendizaje automático. Formación Universitaria, 13(5), 233–246. https://doi.org/10.4067/S0718-50062020000500233
dc.relation.referencesDíaz Monroy, L. G., & Morales Rivera, M. A. (2012). Análisis Estadístico de Datos Multivariados. In M. A. Morales Rivera, W. Llano, & M. Ossa (Eds.), Análisis Estadístico de Datos Multivariados (Primera edición, pp. 381–403). Universidad Nacional de Colombia.
dc.relation.referencesDunn, P. K., & Smyth, G. K. (2018). Generalized Linear Models With Examples in R. In Springer (Ed.), Generalized Linear Models Whit Examples in R (pp. 211–240). Springer Texts in Statistics. https://doi.org/https://doi.org/10.1007/978-1-4419-0118-7
dc.relation.referencesJunca Rodríguez, G. A. (2019). Desempeño académico en las pruebas Saber 11. Panorama Económico, 27, 8–38. https://doi.org/https://doi.org/10.32997/2463-0470-vol.27-num.1-2019-2615
dc.relation.referencesMartínez Cervera, D. E., Salcedo Parra, O. J., & Aguilera Prado, M. A. (2021). Forecasting model with machine learning in higher education ICFES exams. Article in International Journal of Electrical and Computer Engineering, 11(6), 5402–5410. https://doi.org/10.11591/ijece.v11i6.pp5402-5410
dc.relation.referencesMartínez Lobo, D. S. (2013). Análisis de la relación entre las pruebas Saber Pro y los cursos realizados por estudiantes de la Licenciatura en Matemáticas utilizando Correlación Canónica [Universidad Industrial de Santander]. https://noesis.uis.edu.co/server/api/core/bitstreams/a7471ba0-ba5a-46e9-87b9-e24bdded93ab/content
dc.relation.referencesMontes, I., David Garcés, J. C., & Jaramillo, A. J. (2014). Academic achievement: which role plays the institutional factors? Cetro de Investigaciones Económicas y Financieras. https://core.ac.uk/download/47241998.pdf
dc.relation.referencesOjeda, A. Á. (2015). Análisis de la incidencia del contexto escolar en la prueba SABER 11. https://repositorio.uniandes.edu.co/server/api/core/bitstreams/becc46f3-acd4-48cc-ba48-8215fd1cb30f/content
dc.relation.referencesOtálora Salazar, M. J., & Torres León, D. F. (2022). Mapa de brecha de evidencia de los Factores Asociados al Aprendizaje sobre el desempeño en la prueba Saber 11. [Universidad de los Andes]. https://repositorio.uniandes.edu.co/server/api/core/bitstreams/becd5a3c-a353-46a6-a41d-aa14a92696b1/content
dc.relation.referencesRodríguez Rosero, D. D., Ordoñez Ortega Ruber Erlinton, & HidalgoVillota, M. E. (2021). Academic performance determinants of high school students in the Department of Nariño, Colombia. Lecturas de Economia, 94, 87–126. https://doi.org/10.17533/UDEA.LE.N94A341834
dc.relation.referencesSáenz Castro, D. P., & Toro Velez, S. (2023). Acciones de mejora para la formación en educación media según el análisis de resultados en Saber 11. Revista de Investigación y Pedagógia Praxis & Saber, 14. https://doi.org/10.19053/22160159.v14
dc.relation.referencesSMECE. (2023). Informe de Ciudad SMECE 2023. https://smece.educacionbogota.edu.co/sites/default/files/2024-01/Informe%20de%20Ciudad%20SMECE%202023.pdf
dc.relation.referencesSolano, J. A., Lancheros Cuesta, D. J., Umaña Ibáñez, S. F., & Coronado-Hernández, J. R. (2021). Predictive models assessment based on CRISP-DM methodology for students performance in Colombia - Saber 11 Test. Procedia Computer Science, 198, 512–517. https://doi.org/https://doi.org/10.1016/j.procs.2021.12.278
dc.relation.referencesTimarán-Pereira, R., Caicedo-Zambrano, J., & Hidalgo-Troya, A. (2019). Árboles de decisión para predecir factores asociados al desempeño académico de estudiantes de bachillerato en las pruebas Saber 11°. Revista de Investigación, Desarrollo e Innovación, 9(2), 363–378. https://doi.org/10.19053/20278306.v9.n2.2019.9184
dc.rightsAttribution-NonCommercial-ShareAlike 4.0 Internationalen
dc.rights.urihttp://creativecommons.org/licenses/by-nc-sa/4.0/
dc.subjectAnálisis de correlaciones canónicas
dc.subjectModelos lineales generalizados
dc.subjectInstituciones educativas distritales
dc.subjectPruebas Saber 11
dc.subject.keywordsCanonical correlation analysis
dc.subject.keywordsGeneralized linear models
dc.subject.keywordsDistrict educational institutions
dc.subject.keywordsSaber 11 Tests
dc.titleCiencia de datos en educación media: explorando correlaciones y prediciendo resultados saber 11 a partir del proceso formativo
dc.title.translatedData Science in Secondary Education: Exploring Correlations and Predicting Saber 11 Test Results From the Formative Process

Archivos

Bloque original

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
Trabajo de grado.pdf
Tamaño:
204.52 KB
Formato:
Adobe Portable Document Format

Bloque de licencias

Mostrando 1 - 3 de 3
Cargando...
Miniatura
Nombre:
license.txt
Tamaño:
1.95 KB
Formato:
Item-specific license agreed upon to submission
Descripción:
Cargando...
Miniatura
Nombre:
Carta de autorizacion.pdf
Tamaño:
167.63 KB
Formato:
Adobe Portable Document Format
Descripción:
Cargando...
Miniatura
Nombre:
Anexo1 Acta de aprobacion.pdf
Tamaño:
381.8 KB
Formato:
Adobe Portable Document Format
Descripción: