Desarrollo y validación de un modelo de Machine Learning para la predicción de Covid-19 Prolongado en pacientes con enfermedades crónicas no transmisibles

Cargando...
Miniatura

Fecha

Título de la revista

Publicado en

Publicado por

URL de la fuente

Enlace a contenidos multimedia

ISSN de la revista

Título del volumen

Resumen

El Covid-19 prolongado es una de las principales secuelas a mediano y largo plazo de la enfermedad por Covid-19. Al ser una condición multifactorial, su estudio requiere herramientas analíticas avanzadas que detecten patrones complejos, sobre todo en pacientes con mayor vulnerabilidad clínica como aquellos con enfermedades crónicas no transmisibles, en quienes la detección temprana podría orientar medidas terapéuticas oportunas. Este estudio de cohorte retrospectiva utilizó métodos de Machine Learning para la predicción de Covid-19 prolongado en personas con hipertensión o diabetes atendidos en un centro de alta complejidad. El diagnóstico se estableció siguiendo los criterios de la OMS verificados mediante encuestas estructuradas a personas con antecedente de hipertensión o diabetes y de infección por SARS-CoV-2, identificadas desde las bases de datos de atención de las instituciones involucradas. Los antecedentes y características del episodio agudo fueron confirmadas mediante la revisión de sus historias clínicas. Se entrenaron 8 modelos de Machine Learning que fueron validados en un segundo centro con población diferente, seleccionando el mejor modelo con métricas de discriminación/calibración y evaluando la importancia de sus predictores. Entre los 860 participantes (entrenamiento= 771, validación= 89), la prevalencia de Covid-19 prolongado fue de 48.9% y la mediana de tiempo de seguimiento fue de 34.5 meses. El mejor modelo fue el CatBoost (AUC= 0.693, exactitud= 75.3%, precisión= 77.8%, sensibilidad= 74.5%, F1-score= 0.761 y Brier-Score= 0.223). Las características más importantes fueron la cantidad de síntomas, la multicomorbilidad, la edad, el sexo femenino, la desaturación al ingreso, la cantidad de atenciones y el tiempo de estancia hospitalaria durante la enfermedad aguda. La implementación de modelos avanzados de predicción como el CatBoost en entornos hospitalarios, es una estrategia útil para la identificación de personas con enfermedades crónicas no transmisibles a riesgo de presentar Covid-19 prolongado.

Descripción

Abstract

Prolonged Covid-19 is one of the main medium- and long-term sequelae of Covid-19 disease. Being a multifactorial condition, its study requires advanced analytical tools that detect complex patterns, especially in patients with greater clinical vulnerability such as those with chronic non-communicable diseases, in whom early detection could guide timely therapeutic measures. This retrospective cohort study used Machine Learning methods for the prediction of prolonged Covid-19 in people with hypertension or diabetes attended in a high complexity center. The diagnosis was established following WHO criteria verified by structured surveys of people with a history of hypertension or diabetes and SARS-CoV-2 infection, identified from the care databases of the institutions involved. The history and characteristics of the acute episode were confirmed by reviewing their medical records. Eight Machine Learning models were trained and validated in a second center with a different population, selecting the best model with discrimination/calibration metrics and evaluating the significance of its predictors. Among the 860 participants (training= 771, validation= 89), the prevalence of prolonged Covid-19 was 48.9% and the median follow-up time was 34.5 months. The best model was CatBoost (AUC= 0.693, accuracy= 75.3%, precision= 77.8%, sensitivity= 74.5%, F1-score= 0.761 and Brier-Score= 0.223). The most important characteristics were number of symptoms, multicomorbidity, age, female sex, desaturation at admission, number of attendances and length of hospital stay during acute illness. The implementation of advanced prediction models such as CatBoost in hospital settings is a useful strategy for the identification of persons with chronic noncommunicable diseases at risk for prolonged Covid-19.

Palabras clave

Síndrome post agudo de Covid-19, Hipertensión, Diabetes Mellitus Tipo 2, Algoritmos de Aprendizaje Automático, Modelos de Aprendizaje Predictivo

Temáticas

Citación

Aprobación

Revisión

Complementado por

Referenciado por