Ciencia de datos en educación media: explorando correlaciones y prediciendo resultados saber 11 a partir del proceso formativo
| dc.contributor.advisor | Martínez Lobo, Danny Samuel | |
| dc.contributor.author | Quintero Chitiva, Erik Antonio | |
| dc.date.accessioned | 2025-07-11T21:42:59Z | |
| dc.date.available | 2025-07-11T21:42:59Z | |
| dc.date.issued | 2025-06 | |
| dc.description.abstract | Esta investigación explora la relación entre las calificaciones obtenidas por una Institución Educativa Distrital (IED) en diferentes y los resultados alcanzados en las áreas evaluadas en las pruebas Saber 11. Se realizó un Análisis de Correlaciones Canónicas (ACC) tomando como variables explicativas las calificaciones obtenidas por los estudiantes en las asignaturas que cursaron en una IED logrando explicar un 25\% de la varianza de los resultados de las cinco áreas que evalúa el Instituto Colombiano para la Evaluación de la Educación (ICFES). La interpretación de los resultados del ACC reveló que en la IED las asignaturas de Lengua Castellana, Idioma Extranjero y Convivencia tienen una influencia significativa en los resultados de las áreas evaluadas con las pruebas Saber 11, lo que destaca la importancia de las habilidades comunicativas. Adicionalmente, la identificación de relaciones débiles entre los resultados de las pruebas y asignaturas específicas como física, química, matemáticas, entre otras; que desde la práctica pedagógica se esperaría que tuvieran altas magnitudes directas de correlación con el grupo de resultados en las áreas evaluadas por el ICFES, muestra una dinámica de multicausalidad entre las asignaturas. Finalmente, para la predicción del puntaje total en la prueba Saber 11, se construyó un Modelo Lineal Generalizado (MLG) que indicó que las valoraciones de las asignaturas Química, Lengua Castellana y Tecnología e Informática tienen un mayor impacto en los resultados obtenidos por los estudiantes de la IED en dichas pruebas. | |
| dc.description.abstractenglish | This research explores the relationship between grades obtained by a District Educational Institution (DEI) in different subjects and the results achEIved in the areas evaluated in the Saber 11 tests. A Canonical Correlation Analysis (CCA) was performed, taking the grades obtained by students in the subjects they took at an DEI as explanatory variables, managing to explain 25\% of the variance in the results of the five areas evaluated by the Colombian Institute for the Evaluation of Education (ICFES). The interpretation of the CCA results revealed that in the DEI, the subjects of Spanish Language, Foreign Language, and Coexistence have a significant influence on the results of the areas evaluated with the Saber 11 tests, which highlights the importance of communicative skills. Additionally, the identification of weak relationships between test results and specific subjects such as physics, chemistry, and mathematics, among others; which from pedagogical practice would be expected to have high direct correlation magnitudes with the group of results in the areas evaluated by ICFES, shows a dynamic of multicausality among subjects. Finally, for the prediction of the total score in the Saber 11 test, a Generalized Linear Model (GLM) was built which indicated that the valuations of the subjects Chemistry, Spanish Language, and Technology and Informatics have a greater impact on the results obtained by the DEI students in said tests. | |
| dc.identifier.uri | https://hdl.handle.net/20.500.12495/14933 | |
| dc.language.iso | es | |
| dc.relation.references | Calderón, V. V., & Ardila, L. F. (2024). Predicción del desempeño en las pruebas Saber 11 utilizando variables del contexto socio-económico de los aplicantes mediante un análisis estadístico con técnicas de machine learning Policy Brief. https://doi.org/10.31235/osf.io/94ukx | |
| dc.relation.references | Caucali Medina, J. D. (2020). Impacto positivo de la participación cultural en los resultados académicos de las pruebas Saber 11 en Bogotá en los años 2015 y 2017. [Universidad de los Andes]. In Uniandes. http://hdl.handle.net/1992/43886 | |
| dc.relation.references | Chica Gómez, S. M., Galvis Gutiérrez, D. M., & Ramirez Hassan, A. (2010). Determinantes del rendimiento académico en Colombia. Pruebas ICFES - Saber 11o, 2009*. Revista Universidad EAFIT, 46, 48–72. https://repository.eafit.edu.co/server/api/core/bitstreams/2441541c-d044-4c5e-bb25-6dc72d67e7ce/content | |
| dc.relation.references | Contreras, L. E., Fuentes, H. J., & Rodríguez, J. I. (2020). Predicción del rendimiento académico como indicador de éxito/fracaso de los estudiantes de ingeniería, mediante aprendizaje automático. Formación Universitaria, 13(5), 233–246. https://doi.org/10.4067/S0718-50062020000500233 | |
| dc.relation.references | Díaz Monroy, L. G., & Morales Rivera, M. A. (2012). Análisis Estadístico de Datos Multivariados. In M. A. Morales Rivera, W. Llano, & M. Ossa (Eds.), Análisis Estadístico de Datos Multivariados (Primera edición, pp. 381–403). Universidad Nacional de Colombia. | |
| dc.relation.references | Dunn, P. K., & Smyth, G. K. (2018). Generalized Linear Models With Examples in R. In Springer (Ed.), Generalized Linear Models Whit Examples in R (pp. 211–240). Springer Texts in Statistics. https://doi.org/https://doi.org/10.1007/978-1-4419-0118-7 | |
| dc.relation.references | Junca Rodríguez, G. A. (2019). Desempeño académico en las pruebas Saber 11. Panorama Económico, 27, 8–38. https://doi.org/https://doi.org/10.32997/2463-0470-vol.27-num.1-2019-2615 | |
| dc.relation.references | Martínez Cervera, D. E., Salcedo Parra, O. J., & Aguilera Prado, M. A. (2021). Forecasting model with machine learning in higher education ICFES exams. Article in International Journal of Electrical and Computer Engineering, 11(6), 5402–5410. https://doi.org/10.11591/ijece.v11i6.pp5402-5410 | |
| dc.relation.references | Martínez Lobo, D. S. (2013). Análisis de la relación entre las pruebas Saber Pro y los cursos realizados por estudiantes de la Licenciatura en Matemáticas utilizando Correlación Canónica [Universidad Industrial de Santander]. https://noesis.uis.edu.co/server/api/core/bitstreams/a7471ba0-ba5a-46e9-87b9-e24bdded93ab/content | |
| dc.relation.references | Montes, I., David Garcés, J. C., & Jaramillo, A. J. (2014). Academic achievement: which role plays the institutional factors? Cetro de Investigaciones Económicas y Financieras. https://core.ac.uk/download/47241998.pdf | |
| dc.relation.references | Ojeda, A. Á. (2015). Análisis de la incidencia del contexto escolar en la prueba SABER 11. https://repositorio.uniandes.edu.co/server/api/core/bitstreams/becc46f3-acd4-48cc-ba48-8215fd1cb30f/content | |
| dc.relation.references | Otálora Salazar, M. J., & Torres León, D. F. (2022). Mapa de brecha de evidencia de los Factores Asociados al Aprendizaje sobre el desempeño en la prueba Saber 11. [Universidad de los Andes]. https://repositorio.uniandes.edu.co/server/api/core/bitstreams/becd5a3c-a353-46a6-a41d-aa14a92696b1/content | |
| dc.relation.references | Rodríguez Rosero, D. D., Ordoñez Ortega Ruber Erlinton, & HidalgoVillota, M. E. (2021). Academic performance determinants of high school students in the Department of Nariño, Colombia. Lecturas de Economia, 94, 87–126. https://doi.org/10.17533/UDEA.LE.N94A341834 | |
| dc.relation.references | Sáenz Castro, D. P., & Toro Velez, S. (2023). Acciones de mejora para la formación en educación media según el análisis de resultados en Saber 11. Revista de Investigación y Pedagógia Praxis & Saber, 14. https://doi.org/10.19053/22160159.v14 | |
| dc.relation.references | SMECE. (2023). Informe de Ciudad SMECE 2023. https://smece.educacionbogota.edu.co/sites/default/files/2024-01/Informe%20de%20Ciudad%20SMECE%202023.pdf | |
| dc.relation.references | Solano, J. A., Lancheros Cuesta, D. J., Umaña Ibáñez, S. F., & Coronado-Hernández, J. R. (2021). Predictive models assessment based on CRISP-DM methodology for students performance in Colombia - Saber 11 Test. Procedia Computer Science, 198, 512–517. https://doi.org/https://doi.org/10.1016/j.procs.2021.12.278 | |
| dc.relation.references | Timarán-Pereira, R., Caicedo-Zambrano, J., & Hidalgo-Troya, A. (2019). Árboles de decisión para predecir factores asociados al desempeño académico de estudiantes de bachillerato en las pruebas Saber 11°. Revista de Investigación, Desarrollo e Innovación, 9(2), 363–378. https://doi.org/10.19053/20278306.v9.n2.2019.9184 | |
| dc.rights | Attribution-NonCommercial-ShareAlike 4.0 International | en |
| dc.rights.uri | http://creativecommons.org/licenses/by-nc-sa/4.0/ | |
| dc.subject | Análisis de correlaciones canónicas | |
| dc.subject | Modelos lineales generalizados | |
| dc.subject | Instituciones educativas distritales | |
| dc.subject | Pruebas Saber 11 | |
| dc.subject.keywords | Canonical correlation analysis | |
| dc.subject.keywords | Generalized linear models | |
| dc.subject.keywords | District educational institutions | |
| dc.subject.keywords | Saber 11 Tests | |
| dc.title | Ciencia de datos en educación media: explorando correlaciones y prediciendo resultados saber 11 a partir del proceso formativo | |
| dc.title.translated | Data Science in Secondary Education: Exploring Correlations and Predicting Saber 11 Test Results From the Formative Process |
Archivos
Bloque original
1 - 1 de 1
Cargando...
- Nombre:
- Trabajo de grado.pdf
- Tamaño:
- 204.52 KB
- Formato:
- Adobe Portable Document Format
Bloque de licencias
1 - 3 de 3
Cargando...
- Nombre:
- license.txt
- Tamaño:
- 1.95 KB
- Formato:
- Item-specific license agreed upon to submission
- Descripción:
Cargando...
- Nombre:
- Carta de autorizacion.pdf
- Tamaño:
- 167.63 KB
- Formato:
- Adobe Portable Document Format
- Descripción:
Cargando...
- Nombre:
- Anexo1 Acta de aprobacion.pdf
- Tamaño:
- 381.8 KB
- Formato:
- Adobe Portable Document Format
- Descripción:
