Análisis predictivo de incidentes ambientales en redes de hidrocarburos colombianas mediante ciencia de datos

Cargando...
Miniatura

Fecha

Título de la revista

Publicado en

Publicado por

URL de la fuente

Enlace a contenidos multimedia

ISSN de la revista

Título del volumen

Resumen

Este estudio desarrolló un modelo predictivo que permite anticipar incidentes ambientales asociados a derrames de crudo en las redes de transporte de hidrocarburos en Colombia, utilizando técnicas de aprendizaje automático y análisis geoespacial. Para ello, se emplearon datos históricos recopilados por la Agencia Nacional de Licencias Ambientales (ANLA) entre1990 y 2025, incluyendo variables geográficas y operativas. Estos datos fueron sometidos a un riguroso proceso de limpieza, transformación y selección de características, seguido por la aplicación y comparación de diversos modelos predictivos. A lo largo de la investigacion, XGBoost demostro ser el modelo con mejor desempeño, alcanzando óptimos puntajes en métricas AUC-ROC, lo que evidencia una excelente capacidad de discriminación. El modelo permitió identificar patrones espaciales que coinciden con regiones de alta actividad petrolera y vulnerabilidad ambiental como Putumayo, Meta y Santander, lo cual refuerza la aplicabilidad del modelo como herramienta para la toma de decisiones. El modelo propuesto aporta una herramienta útil para la toma de decisiones orientadas a la prevención y gestión de emergencias ambientales en el sector hidrocarburos.

Descripción

Abstract

This study developed a predictive model that allows for the anticipation of environmental incidents associated with oil spills in hydrocarbon transportation networks in Colombia, using machine learning techniques and geospatial analysis. Historical data collected by the National Environmental Licensing Agency (ANLA) between 1990 and 2025, including geographic and operational variables, were used. These data were subjected to a rigorous process of cleaning, transformation, and feature selection, followed by the application and comparison of various predictive models. Throughout the research, XGBoost proved to be the best-performing model, achieving optimal scores in AUC-ROC metrics, demonstrating excellent discrimination capabilities. The model identified spatial patterns that coincide with regions of high oil activity and environmental vulnerability, such as Putumayo, Meta, and Santander, which reinforces the model's applicability as a decision-making tool. The proposed model provides a useful tool for decisionmaking aimed at the prevention and management of environmental emergencies in the hydrocarbon sector.

Palabras clave

Machine Learning, Riesgos Ambientales, Derrames de Crudo, Aprendizje Automatico, Colombia, Ciencia de Datos, Oleductos

Temáticas

Citación

Aprobación

Revisión

Complementado por

Referenciado por