Ramos Montaña, Jesús DavidBastidas Rodríguez, Angie Lorena2023-12-152023-12-152023https://hdl.handle.net/20.500.12495/11792En Colombia, las enfermedades coronarias son una de las principales causas de muerte. El uso de técnicas de Machine Learning para diagnóstico temprano se ha mostrado ser valioso. Sin embargo, la gran cantidad de literatura científica dificulta su análisis eficiente. Por ello, son fundamentales las herramientas de minería de texto para procesar y extraer información de manera automática. Para este trabajo se obtuvieron 71 documentos sobre el diagnóstico de enfermedades coronarias mediante técnicas de Machine Learning en inglés, abarcando el período de 2010 a 2022. De estos documentos se extrajeron metadatos, como el título, autor, palabras clave, año de publicación, revista donde se publicó y resumen (abstract). A estos datos se les aplicaron técnicas de minería de texto y se convirtieron en datos estructurados. Luego, se utilizaron tres métodos diferentes de clustering (Jerárquico, K-Means y DBSCAN), donde se calculó la matriz de términos ponderados mediante TF-IDF y donde la métrica utilizada para medir la similitud entre documentos se realizó a través de la distancia coseno. Además, mediante métricas para la validación de los clústeres, se determinó qué método tiene el mejor rendimiento en la agrupación de los documentos textuales. Considerando las condiciones específicas de los datos, se concluyó que el clustering mediante el método K-Means agrupó los documentos de manera más adecuada, a pesar de ser un método antiguo, sigue siendo efectivo.application/pdfspaAtribución-NoComercial-CompartirIgual 4.0 InternacionalMinería de textoClustering de textoClustering JerárquicoClustering K-MeansClustering DBSCANMachine LearningEnfermedades coronariasDiagnostico519.5Construcción de clústeres de artículos científicos en inglés (2010 - 2022) relacionados con técnicas de Machine Learning en el diagnóstico de enfermedades coronariasTesis/Trabajo de grado - Monografía - PregradoText miningText clusteringHierarchical clusteringK-Means clusteringDBSCAN clusteringMachine LearningCoronary heart diseasesDiagnosisinstname:Universidad El Bosquereponame:Repositorio Institucional Universidad El Bosquerepourl:https://repositorio.unbosque.edu.coConstruction of clusters of scientific articles in English (2010 - 2022) related to Machine Learning techniques in the diagnosis of coronary heart diseasesAcceso abiertoinfo:eu-repo/semantics/openAccessinfo:eu-repo/semantics/openAccess