Clasificación de deposiciones en lactantes menores de doce meses mediante inteligencia artificial como herramienta diagnóstica

Cargando...
Miniatura

Fecha

Título de la revista

Publicado en

Publicado por

URL de la fuente

Enlace a contenidos multimedia

ISSN de la revista

Título del volumen

Resumen

Objetivo: evaluar la concordancia entre un modelo de inteligencia artificial (IA) y la clasificación realizada por gastroenterólogos pediatras en la consistencia de las deposiciones en lactantes menores de 12 meses, utilizando la escala BITSS. Metodología: se realizó un estudio observacional, transversal y retrospectivo basado en un banco fotográfico de deposiciones en pañales. De 1100 imágenes que cumplían criterios de calidad, 896 alcanzaron acuerdo por mayoría entre tres gastroenterólogos, quienes constituyeron la referencia clínica. Las imágenes se organizaron en las siete categorías de BITSS y en una versión agrupada en cuatro. Se entrenaron veinte modelos de IA, asignando el 85% de las imágenes al entrenamiento y el 15% a la validación. El desempeño se evaluó mediante sensibilidad, especificidad, precisión, F1-score y exactitud. La concordancia entre especialistas se estimó con Kappa de Fleiss y tanto el acuerdo por pares como la concordancia IA-referencia se midieron con Kappa ponderado. Resultados: los especialistas obtuvieron un acuerdo total del 24.7% y parcial del 75.3%, con un Kappa de Fleiss de 0.24. En siete categorías, el Modelo 7 alcanzó una exactitud de 0.56, con variabilidad entre clases. En la versión de cuatro categorías, el Modelo 19 mostró mejor desempeño, con una exactitud de 0.76, sensibilidades de 0.93 para estreñimiento y 0.86 para blandas, y especificidades predominantemente entre 0.95 y 0.98. La concordancia IA-referencia se ubicó entre moderada y sustancial. Conclusiones: La variabilidad inter-observador evidencia la necesidad de métodos más estandarizados. La IA mostró concordancia sustancial, especialmente con categorías agrupadas, respaldando su utilidad como herramienta complementaria.

Descripción

Abstract

Objective: To evaluate the concordance between an artificial intelligence (AI) model and the classification performed by pediatric gastroenterologists regarding stool consistency in infants under 12 months, using the BITSS scale. Methods: An observational, cross-sectional, and retrospective study was conducted using a photographic database of diapered stools. Of 1100 images that met quality criteria, 896 achieved majority agreement among three gastroenterologists, who served as the clinical reference. Images were organized into the seven original BITSS categories and an alternative four-category grouping. Twenty AI models were trained, allocating 85% of the images for training and 15% for validation. Performance was assessed through sensitivity, specificity, precision, F1-score, and accuracy. Inter-specialist agreement was measured using Fleiss’ Kappa, while pairwise agreement and AI-reference concordance were evaluated using weighted Kappa. Results :The specialists achieved a total agreement of 24.7% and partial agreement of 75.3%, with a Fleiss’ Kappa of 0.24. In the seven-category system, Model 7 reached an accuracy of 0.56 with variability across classes. In the four-category version, Model 19 demonstrated superior performance, achieving 0.76 accuracy, with sensitivities of 0.93 for constipation and 0.86 for soft stools, and specificities predominantly between 0.95 and 0.98. AI-reference concordance ranged from moderate to substantial. Conclusions: Inter-observer variability highlights the need for more standardized methods. The AI model showed substantial concordance, particularly with grouped categories, supporting its usefulness as a complementary tool.

Palabras clave

Inteligencia artificial, Aprendizaje profundo, Gastroenterología, Pediatría, Heces

Temáticas

Citación

Aprobación

Revisión

Complementado por

Referenciado por