Optimización del análisis y predicción de tráfico urbano en Bogotá mediante machine y deep learning
Cargando...
Archivos
Fecha
Autores
Título de la revista
Publicado en
Publicado por
URL de la fuente
Enlace a contenidos multimedia
ISSN de la revista
Título del volumen
Resumen
Este estudio presenta un enfoque integral para el modelado y predicción de la velocidad promedio vehicular en Bogotá, utilizando más de 20 millones de registros recolectados en 2022 mediante sensores Wi-Fi y Bluetooth distribuidos por la malla vial. Tras un riguroso proceso de carga, unificación (que llegó a consumir hasta 45 GB de RAM), limpieza e imputación de datos faltantes con el método MICE, se analizaron y procesaron series de tiempo para 720 segmentos viales, seleccionando aquellos con al menos el 70 por ciento de registros esperados, terminando así en 653 segmentos de vía. Se entrenaron modelos de aprendizaje profundo (LSTM, BiLSTM y Transformer) para predecir la velocidad promedio con una proyección de una hora, generando resultados cada 15 minutos. También se aplicaron modelos ARIMA por segmento para extraer parámetros temporales y realizar agrupamiento mediante KMeans, DBSCAN y Clustering Aglomerativo, destacándose KMeans por su desempeño. Los modelos fueron evaluados y comparados entre sí con métricas como RMSE, MAE, SMAPE, Accuracy. Además, se entrenaron modelos de Isolation Forest y Autoencoders para la detección de anomalías en velocidad. La implementación se realizó en Google Colab Pro+, requiriendo en etapas críticas el uso de la GPU A100. Los resultados demuestran la viabilidad del enfoque propuesto para fortalecer la toma de decisiones en movilidad urbana mediante predicción y análisis de patrones de tráfico a gran escala.
Descripción
Abstract
This study presents a comprehensive approach for modeling and predicting average vehicle speed in Bogotá, using more than 20 million records collected in 2022 through Wi-Fi and Bluetooth sensors distributed throughout the road network. After a rigorous process of data loading, unification (which consumed up to 45 GB of RAM), cleaning, and imputation of missing data using the MICE method, time series were analyzed and processed for 720 road segments, selecting those with at least 70% of the expected records, resulting in 653 final segments. Deep learning models (LSTM, BiLSTM, and Transformer) were trained to predict the average speed with a one-hour forecast, generating results every 15 minutes. ARIMA models were also applied per segment to extract temporal parameters and perform clustering using KMeans, DBSCAN, and Agglomerative Clustering, with KMeans standing out for its performance. The models were evaluated and compared using metrics such as RMSE, MAE, SMAPE, and Accuracy. Additionally, Isolation Forest and Autoencoder models were trained for anomaly detection in speed data. The implementation was carried out on Google Colab Pro+, requiring the use of the A100 GPU during critical stages. The results demonstrate the feasibility of the proposed approach to support urban mobility decision-making through large-scale traffic pattern prediction and analysis.
Palabras clave
Tráfico urbano, Predicción, Machine Learning, Deep Learning, LSTM, BILSTM, Transformer, Clustering, Detección de anomalías
