Desarrollo de un modelo de Machine Learning para la clasificación de tipos de dengue de acuerdo a su nivel de severidad: Un estudio de caso de Bucaramanga, Colombia

dc.contributor.advisorRamos Montaña, Jesús David
dc.contributor.authorRojas Sánchez, Juan David
dc.contributor.orcidRojas Sánchez, Juan David [0009-0000-8844-4172]
dc.date.accessioned2023-06-10T15:58:55Z
dc.date.available2023-06-10T15:58:55Z
dc.date.issued2023
dc.description.abstractEl dengue en Colombia y en la región representa una importante problemática de salud pública, por las condiciones geográficas y sociales que hay en el país, se presentan focos cíclicos de contagio. Los avances en machine learning (ML) y ciencia de datos para la clasificación de pacientes puede representar una reducción de esfuerzos médicos, económicos y humanos para el tratamiento de la enfermedad. El diagnóstico temprano, ofrece conocimiento y seguimiento de la enfermedad. Los datos obtenidos provienen del municipio de Bucaramanga, Santander, uno de los departamentos más afectados por los brotes de dengue. Para lograr el objetivo de construir un clasificador de tipos de dengue se construyen 4 modelos ML: Regresión Logística Regularizada (RL), Random Forest (RF), Maquina de Soporte Vectorial para Clasificación (SVC) y una propuesta de ensamble de estos tres modelos que toma como meta-clasificador al algoritmo de XGBoost. Los resultados muestran como mejor modelo al modelo ensamblado (AUC = 0.9386, Accuracy = 0.936, F1-Score = 0.947), seguido de la Regresión Logística regularizada por norma L2 (AUC = 0.95, Accuracy = 0.871, F1-Score = 0.895), la Máquina de Soporte de Vectorial - Kernel Radial (AUC = 0.984, Accuracy = 0.857, F1-Score = 0.867) y por último, el Random Forest (AUC = 0.94, Accuracy = 0.833, F1-Score = 0.865). Además se encontró que factores como antecedentes familiares por dengue, dolor abdominal, vomito y diarrea presentan una relación causal con el presentar dengue con signos de alarma.spa
dc.description.abstractenglishDengue in Colombia and in the region represents a major public health problem, due to the geographical and social conditions in the country, there are cyclical outbreaks of contagion. Advances in machine learning (ML) and data science for the classification of patients may represent a reduction of medical, economic and human efforts for the treatment of the disease. Early diagnosis offers knowledge and monitoring of the disease. The data obtained come from the municipality of Bucaramanga, Santander, one of the departments most affected by dengue outbreaks. To achieve the objective of building a classifier of dengue types, 4 ML models are built: Regularized Logistic Regression (RL), Random Forest (RF), Support Vector Classification Machine (SVC) and a proposal for the assembly of these three models that takes the XGBoost algorithm as meta-classifier. The results show that the best model is the ensemble model (AUC = 0.9386, Accuracy = 0.936, F1-Score = 0.947), followed by the Logistic Regression regularized by norm L2 (AUC = 0.95, Accuracy = 0. 871, F1-Score = 0.895), the Support Vector-Radial Kernel Machine (AUC = 0.984, Accuracy = 0.857, F1-Score = 0.867) and lastly, the Random Forest (AUC = 0.94, Accuracy = 0.833, F1-Score = 0.865). It was also found that factors such as family history of dengue, abdominal pain, vomiting and diarrhea had a causal relationship with the presentation of dengue with alarm signs.eng
dc.description.degreelevelPregradospa
dc.description.degreenameEstadísticospa
dc.format.mimetypeapplication/pdf
dc.identifier.instnameinstname:Universidad El Bosquespa
dc.identifier.reponamereponame:Repositorio Institucional Universidad El Bosquespa
dc.identifier.repourlrepourl:https://repositorio.unbosque.edu.co
dc.identifier.urihttps://hdl.handle.net/20.500.12495/10797
dc.language.isospa
dc.publisher.facultyFacultad de Cienciasspa
dc.publisher.grantorUniversidad El Bosquespa
dc.publisher.programEstadísticaspa
dc.rightsAtribución-NoComercial-CompartirIgual 4.0 Internacional*
dc.rights.accessrightsinfo:eu-repo/semantics/openAccess
dc.rights.accessrightshttps://purl.org/coar/access_right/c_abf2
dc.rights.localAcceso abiertospa
dc.rights.urihttps://creativecommons.org/licenses/by-nc-sa/4.0/*
dc.subjectBioestadísticaspa
dc.subjectMachine Learningspa
dc.subjectDenguespa
dc.subjectClasificaciónspa
dc.subject.ddc519.5
dc.subject.keywordsBiostatisticsspa
dc.subject.keywordsMachine Learningspa
dc.subject.keywordsDenguespa
dc.subject.keywordsClassificationspa
dc.titleDesarrollo de un modelo de Machine Learning para la clasificación de tipos de dengue de acuerdo a su nivel de severidad: Un estudio de caso de Bucaramanga, Colombiaspa
dc.title.translatedDevelopment of a Machine Learning model for the classification of dengue types according to their severity level: A case study of Bucaramanga, Colombiaspa
dc.type.coarhttps://purl.org/coar/resource_type/c_7a1f
dc.type.coarversionhttps://purl.org/coar/version/c_ab4af688f83e57aa
dc.type.driverinfo:eu-repo/semantics/bachelorThesis
dc.type.hasversioninfo:eu-repo/semantics/acceptedVersion
dc.type.localTesis/Trabajo de grado - Monografía - Pregradospa

Archivos

Bloque original
Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
Desarrollo de un modelo de Machine Learning para la clasificación de tipos de dengue de acuerdo a su nivel de severidad: Un estudio de caso de Bucaramanga, Colombia
Tamaño:
1.07 MB
Formato:
Adobe Portable Document Format
Descripción:
Desarrollo de un modelo de Machine Learning para la clasificación de tipos de dengue de acuerdo a su nivel de severidad: Un estudio de caso de Bucaramanga, Colombia
Bloque de licencias
Mostrando 1 - 2 de 2
No hay miniatura disponible
Nombre:
license.txt
Tamaño:
1.95 KB
Formato:
Item-specific license agreed upon to submission
Descripción:
No hay miniatura disponible
Nombre:
Carta.pdf
Tamaño:
382.28 KB
Formato:
Adobe Portable Document Format
Descripción:
Carta autorización

Colecciones