Predicción de la etiología del dolor torácico en urgencias mediante el uso de datos sintéticos y machine learning
Cargando...
Fecha
2025-03
Título de la revista
Publicado en
Publicado por
URL de la fuente
Enlace a contenidos multimedia
ISSN de la revista
Título del volumen
Resumen
Introducción: El dolor en el tórax es una de las principales causas de ingreso a los servicios de urgencias y representa un desafío diagnóstico debido a la amplia gama de etiologías que incluye tanto condiciones graves como benignas. La identificación rápida y precisa de la causa subyacente es crucial para optimizar el tratamiento, reducir complicaciones y mejorar la asignación de recursos en los servicios de urgencias. Este estudio tuvo como objetivo desarrollar un modelo de predicción basado en aprendizaje automático supervisado para establecer la etiología del dolor torácico, entrenado mediante el uso de un conjunto de datos sintéticos creados a partir de modelos epidemiológicos basados en publicaciones en su mayoría locales, y etiquetados por un grupo de médicos especialistas (urgenciólogos, internistas e intensivistas).
Métodos: En la primera fase del estudio se empleó la información epidemiológica disponible principalmente en bases de datos bibliográficas latinoamericanas y de universidades de Colombia para obtener descripciones sobre la prevalencia de antecedentes patológicos, manifestaciones clínicas y hallazgos al examen físico de nueve enfermedades que pueden presentarse con dolor torácico (síndrome coronario agudo, tromboembolia pulmonar, disección aortica aguda, emergencia hipertensiva, insuficiencia cardíaca aguda, neumonía, pericarditis, otras causas gastrointestinales y costocondritis), posteriormente se implementaron diversos métodos de programación en lenguaje Python para la construcción de un conjunto de datos para cada una de las enfermedades, obteniendo como resultado una base de datos conformada por 500 pacientes (4500 observaciones en total para las nueve enfermedades), cada uno de los cuales contenía información de 79 campos o variables (epidemiológicas y clínicas).
En la siguiente fase se estableció la construcción del caso clínico a partir de las observaciones registradas en las bases de datos, empelando programación estructurada para obtener como resultado una viñeta clínica por cada observación, esto con el fin de facilitar el proceso de revisión por parte de los médicos especialistas.
En la tercera fase dichas viñetas fueron aleatorizadas en grupos de 450 y entregadas en formato de Microsoft Excel a 10 médicos especialistas para su etiquetado, que consistía en consignar el diagnóstico que consideran más probable de un listado de nueve enfermedades.
En cuarta fase se estableció la construcción del modelo de predicción de dolor torácico para las nueve enfermedades, a partir de la base de datos completa (4500 observaciones), se aleatorizó y se tomaron 3600 (80%) para entrenar diferentes modelos de machine learning (Random Forest, XGBoost, SVM, etc) y posteriormente se realizó una validación con los 900 casos restantes (20%). Adicionalmente se midió el Kappa de Cohen con respecto a las etiquetas originales de acuerdo con el modelo epidemiológico desarrollado en Python, comparando el rendimiento entre médicos y los modelos de machine learning.
Resultados: Se obtuvo una base de datos sintética con 4500 observaciones cada una con su respectiva etiqueta por parte de un equipo de médicos especialistas. Adicionalmente se evaluaron múltiples algoritmos de machine learning, incluyendo Random Forest, Gradient Boosting, LightGBM, XGBoost, CatBoost y Máquinas de vectores de soporte (SVM). Los resultados mostraron que el modelo basado en SVM presentó el mejor desempeño, alcanzando una sensibilidad promedio de 87.6%, especificidad promedio de 98.4%, valor predictivo positivo promedio de 88.5% y valor predictivo negativo promedio de 98.5% con respecto a los datos etiquetados por el grupo médico; así como un área bajo la curva (AUC) de 0.99 y una exactitud de 88% lo que refleja una excelente capacidad para diferenciar entre las nueve etiologías consideradas en el estudio, reforzando su potencial como herramienta de apoyo clínico. En comparación con lo anterior, la exactitud de los médicos fue de 72% con respecto al diagnóstico establecido previo al etiquetado.
Conclusiones: Los datos sintéticos prometen ser una alternativa válida para superar las limitaciones de acceso a grandes volúmenes de información médica, proporcionando una base sólida para entrenar modelos predictivos. Por otro lado, el modelo basado en SVM se posiciona como una herramienta eficaz que podría apoyar el diagnóstico diferencial del dolor torácico en entornos de urgencias. Sin embargo, es necesario validar esto incluyendo tanto análisis de usabilidad como de desempeño diagnóstico en escenarios clínicos.
Descripción
Abstract
Introduction: Chest pain is one of the leading causes of emergency department admissions and represents a diagnostic challenge due to its wide range of etiologies, including both serious and benign conditions. Rapid and accurate identification of the underlying cause is crucial to optimize treatment, reduce complications, and improve resource allocation in emergency departments. This study aimed to develop a supervised machine learning-based prediction model to determine the etiology of chest pain. This model was trained using a synthetic dataset created from epidemiological models based on mostly local publications and labeled by a group of specialist physicians (emergency physicians, internists, and intensivists).
Methods: In the first phase of the study, epidemiological information available primarily in Latin American bibliographic databases and those from Colombian universities was used to obtain descriptions of the prevalence of pathological history, clinical manifestations, and physical examination findings for nine diseases that can present with chest pain (acute coronary syndrome, pulmonary thromboembolism, acute aortic dissection, hypertensive emergency, acute heart failure, pneumonia, pericarditis, other gastrointestinal causes, and costochondritis). Various programming methods in Python were subsequently implemented to construct a dataset for each of the diseases, resulting in a database consisting of 500 patients (4,500 observations in total for the nine diseases), each of which contained information on 79 fields or variables (epidemiological and clinical). In the next phase, the clinical case was constructed from the observations recorded in the databases, using structured programming to produce a clinical vignette for each observation. This was done to facilitate the review process by the specialist physicians.
In the third phase, these vignettes were randomized into groups of 450 and delivered in Microsoft Excel format to 10 specialist physicians for labeling. The labeling consisted of recording the diagnosis they considered most likely from a list of nine diseases.
In the fourth phase, the chest pain prediction model was built for the nine diseases. Based on the entire database (4,500 observations), the model was randomized, and 3,600 (80%) were selected to train different machine learning models (Random Forest, XGBoost, SVM, etc.). Validation was then performed on the remaining 900 cases (20%). Cohen's Kappa was also measured against the original labels according to the epidemiological model developed in Python, comparing the performance of physicians and machine learning models.
Results: A synthetic database with 4,500 observations, each with its respective label, was obtained by a team of specialist physicians. Multiple machine learning algorithms were also evaluated, including Random Forest, Gradient Boosting, LightGBM, XGBoost, CatBoost, and Support Vector Machines (SVM). The results showed that the SVM-based model performed best, achieving an average sensitivity of 87.6%, an average specificity of 98.4%, an average positive predictive value of 88.5%, and an average negative predictive value of 98.5% against the data labeled by the medical group. It also had an area under the curve (AUC) of 0.99 and an accuracy of 88%, reflecting an excellent ability to differentiate between the nine etiologies considered in the study, reinforcing its potential as a clinical support tool. Compared to the previous results, physicians' accuracy was 72% with respect to the diagnosis established prior to labeling.
Conclusions: Synthetic data promises to be a valid alternative to overcome the limitations of access to large volumes of medical information, providing a solid foundation for training predictive models. Furthermore, the SVM-based model is positioned as an effective tool that could support the differential diagnosis of chest pain in emergency settings. However, this requires validation, including both usability and diagnostic performance analyses in clinical settings.
Palabras clave
Dolor torácico, Diagnóstico diferencial, Síndrome coronario agudo, Tromboembolia pulmonar, Disección aortica aguda, Inteligencia artificial, Aprendizaje automático, Datos sintéticos
Keywords
Chest pain, Differential diagnosis, Acute coronary syndrome, Pulmonary thromboembolism, Acute aortic dissection, Artificial intelligence, Machine learning, Synthetic data