Pronóstico de precios de aguacate Hass y papelillo en Colombia mediante métodos de series temporales
| dc.contributor.advisor | Pacheco López, Mario José | |
| dc.contributor.author | Melo Bayona, Karol Ximena | |
| dc.contributor.author | Morales Rodríguez, Yenny Xiomara | |
| dc.contributor.author | Jaramillo Piza, Orlando Stiven | |
| dc.date.accessioned | 2025-07-15T15:06:40Z | |
| dc.date.available | 2025-07-15T15:06:40Z | |
| dc.date.issued | 2025-06 | |
| dc.description.abstract | En Colombia, la producción agropecuaria representa una parte importante del Producto Interno Bruto y muchas familias encuentran el sustento en las diversas actividades que la componen. Sin embargo, los precios de algunos productos suelen ser volátiles, como en productos perecederos tales como el aguacate, generando incertidumbre alrededor de cuándo es el mejor momento para vender y sobre la rentabilidad de la producción. En este trabajo, se aborda el caso específico del aguacate papelillo y aguacate Hass, con el objetivo de comparar diferentes técnicas de modelamiento para la predicción de los precios de estos productos, incluyendo técnicas de modelamiento estadístico o, en particular de Machine Learning, usando datos recolectados por el DANE sobre los precios nacionales semanales disponibles del aguacate Hass y el aguacate papelillo entre el 10 de noviembre de 2012 y el 27 de diciembre de 2024. Entre los principales resultados se observó que los modelos de Machine Learning, particularmente los modelos basados en árboles de decisión son más eficientes en estas predicciones, superando el rendimiento de los modelos estadísticos. En el caso del aguacate papelillo, el modelo Decision Tree, registró los menores errores, con un RMSE de 1 245.95, MAE de 1 221.45, y un MAPE de 14.09%. De forma similar, para el aguacate Hass este mismo modelo se destacó, obteniendo las menores métricas de error, con un RMSE de 942.43, MAE de 829.07 y MAPE de 15.50%. | |
| dc.description.abstractenglish | In Colombia, agricultural production represents a significant portion of the Gross Domestic Product, and many families earn a living through its diverse activities. However, the prices of some products, such as those of perishable goods like avocados, are often volatile, generating uncertainty about the best time to sell and the profitability of production. This paper addresses the specific case of papelillo and Hass avocados. The objective is to compare different modeling techniques for predicting the prices of these products, including statistical modeling techniques or, in particular, machine learning techniques, using data collected by DANE (National Statistics Institute) on the available weekly national prices of Hass and papelillo avocados between November 10, 2012, and December 27, 2024. Among the main results, it was observed that machine learning models, particularly those based on decision trees, are more efficient in these predictions, surpassing the performance of statistical models. In the case of the papelillo avocado, the Decision Tree model recorded the lowest errors, with an RMSE of 1,245.95, MAE of 1,221.45, and MAPE of 14.09%. Similarly, for the Hass avocado, this same model stood out, obtaining the lowest error metrics, with an RMSE of 942.43, MAE of 829.07, and MAPE of 15.50%. | |
| dc.description.sponsorship | Universidad El Bosque | |
| dc.identifier.uri | https://hdl.handle.net/20.500.12495/14957 | |
| dc.language.iso | es | |
| dc.relation.references | ADAMA Colombia. (s.f.). El Niño y la agricultura en Colombia. https://www.adama.com/colombia/es/el-nino-y-la-agricultura-en-colombia ID: PMC12047798. | |
| dc.relation.references | Adineh, A. H., Narimani, Z., & Satapathy, S. C. (2021). Importance of data preprocessing in time series prediction using SARIMA: A case study. International Journal of Knowledge-Based and Intelligent Engineering Systems, 24(4), 331–342. https://doi.org/10.3233/KES-200065 | |
| dc.relation.references | Akiba, T., Sano, S., Yanase, T., Ohta, T., & Koyama, M. (2019). Optuna: A next-generation hyperparameter optimization framework [Preprint]. arXiv. https://doi.org/10.48550/arXiv.1907.10902 | |
| dc.relation.references | Amat Rodrigo, J., & Escobar Ortiz, J. (2025). skforecast (Version 0.16.0) [Computer software]. https://doi.org/10.5281/zenodo.8382788 | |
| dc.relation.references | Amazon. (s.f.). ¿Qué es el boosting? Recuperado el 10 de mayo de 2025, de https://aws.amazon.com/es/what-is/boosting/ | |
| dc.relation.references | Analdex. (2025, 17 de febrero). Informe exportaciones de aguacate Hass 2024. https://analdex.org/2025/02/17/informe-exportaciones-de-aguacate-hass-2024/ | |
| dc.relation.references | Asociación Nacional de Comercio Exterior – ANALDEX. (2025, febrero 17). Informe de exportaciones de aguacate Hass 2024. https://analdex.org/2025/02/17/informe-exportaciones-de-aguacate-hass-2024/ | |
| dc.relation.references | Bartz, E., Bartz-Beielstein, T., Zaefferer, M., & Mersmann, O. (Eds.). (2022). Hyperparameter tuning for machine and deep learning with R: A practical guide. Springer. | |
| dc.relation.references | Berzal F. (2018). Redes neuronales & Deep learning. | |
| dc.relation.references | Banco de la República. (2025, abril 30). La Junta Directiva del Banco de la República reduce la tasa de interés en abril de 2025. https://www.banrep.gov.co/es/noticias/junta-directiva-abril-2025 | |
| dc.relation.references | Box, G. E. P., Jenkins, G. M., Reinsen, G. C., & Ljung, G. M. (2016). Time Series Analysis: Forecasting and Control (5th ed.). | |
| dc.relation.references | Chen, Z., Goh, H. S., Sin, K. L., Lim, K., Chung, N. K. H., & Liew, X. Y. (2021). Automated Agriculture Commodity Price Prediction System with Machine Learning Techniques. Advances in Science, Technology and Engineering Systems Journal, 6(4), 376–384. https://doi.org/10.25046/aj060442 | |
| dc.relation.references | CorpoHass. (s.f.). Iniciativas. https://www.corpohass.com/iniciativas/ | |
| dc.relation.references | Departamento Administrativo Nacional de Estadística – DANE. (2025a). Índice de Precios al Consumidor (IPC). https://sitios.dane.gov.co/ipc/visorIPC/#!/ | |
| dc.relation.references | Departamento Administrativo Nacional de Estadística – DANE. (2025b). Producto Interno Bruto trimestral – Información técnica. https://www.dane.gov.co/index.php/estadisticas-por-tema/cuentas-nacionales/cuentas-nacionales-trimestrales/pib-informacion-tecnica | |
| dc.relation.references | El Colombiano. (2024a, marzo 1). ¿Por qué el aguacate está caro en Colombia? https://www.elcolombiano.com/negocios/agro/por-que-el-aguacate-esta-caro-en-colombia-BC24151176 | |
| dc.relation.references | El Colombiano. (2024b, abril 15). Empleos verdes en Colombia: Formación sostenible. https://www.elcolombiano.com/empleos/contenidos/empleos-verdes-colombia-formacion-sostenible-NM27092539 | |
| dc.relation.references | Gómez Arango, M. A., & Diaz Valencia, E. (2024). Predicción del rendimiento de cultivos agrícolas en los cinco corregimientos de la ciudad de Medellín, utilizando modelos de Machine Learning. | |
| dc.relation.references | Gujarati, D., & Down, P. (2009). Econometría (5th ed.). | |
| dc.relation.references | James, G., Witten, D., Hastie, T., & Tibshirani, R. (2013). An introduction to statistical learning: with applications in R (2nd ed.). Springer. | |
| dc.relation.references | Mariño Villalba, J. A. (2023). Una comparación entre modelos estadísticos y de Machine Learning para la predicción de series de tiempo multivariadas (Informe de investigación). Universidad Nacional de Colombia, Facultad de Ciencias, Departamento de Estadística. Bogotá, Colombia | |
| dc.relation.references | Ministerio de Agricultura y Desarrollo Rural. (2020). Análisis de afectación de las cadenas productivas agropecuarias derivada de la emergencia sanitaria por COVID-19. https://sioc.minagricultura.gov.co/Boletines/Forms/AllItems.aspx | |
| dc.relation.references | Nayak, A. K., Sharma, K. C., Bhakar, R., & Tiwari, H. (2025). Probabilistic online learning framework for short-term wind power forecasting using ensemble bagging regression model. Energy Conversion and Management, 323(A), 115-130. https://doi.org/10.1016/j.enconman.2024.115130 | |
| dc.relation.references | Özden, C. (2023). Comparative Analysis of CNN, LSTM And Random Forest for Multivariate Agricultural Price Forecasting. Black Sea Journal of Agriculture, 6(4), 422–426. https://doi.org/10.47115/bsagriculture.1304625 | |
| dc.relation.references | Portafolio. (2024, marzo 27). Colombia impulsa el crecimiento del aguacate Hass: Exportaciones aumentan un 15,7 % en 2024. https://www.portafolio.co/economia/agro/colombia-impulsa-el-crecimiento-del-aguacate-hass-exportaciones-aumentan-un-15-7-en-2024-618559 | |
| dc.relation.references | Ramírez Castañeda, L. N., Cristancho Cruz, S. L., & Cleves Leguizamo, J. A. (2021). Modelos de Fluctuaciones de Precios Agricolas - Estudio Comparativo de Frutas Tropicales en Colombia. Revista de Ciencias Sociales, XXVII(Especial 4), 197–212. https://dialnet.unirioja.es/servlet/articulo?codigo=8145517 | |
| dc.relation.references | Rana, H., Farooq, M. U., Kazi, A. K., Baig, M. A., & Akhtar, M. A. (2024). Prediction of Agricultural Commodity Prices using Big Data Framework. Engineering, Technology & Applied Science Research, 14(1), 12652–12658. https://doi.org/10.48084/etasr.6468 | |
| dc.relation.references | Ruiz Hernández, J. A., Barrios Puente, G., & Gómez Gómez, A. A. (2019). Análisis del precio de la manzana mediante un modelo SARIMA. Revista Mexicana de Ciencias Agrícolas, 10(2), 225–237. | |
| dc.relation.references | Sal, M. (2024). Predicción del precio de azúcar en Argentina a partir de modelos de Machine Learning. https://repositorio.utdt.edu/handle/20.500.13098/12972 | |
| dc.relation.references | scikit-learn developers. (s.f.). Linear models — scikit-learn 1.3.0 documentation. Recuperado el 10 de mayo de 2025, de https://scikit-learn.org/stable/modules/linear_model.html | |
| dc.relation.references | Sun, F., Meng, X., Zhang, Y., Wang, Y., Jiang, H., & Liu, P. (2023). Agricultural Product Price Forecasting Methods: A Review. In Agriculture (Switzerland) (Vol. 13, Issue 9). Multidisciplinary Digital Publishing Institute (MDPI). https://doi.org/10.3390/agriculture13091671 | |
| dc.relation.references | Torre-Torres, O. V. D. l., del Río-Rama, M. d. l. C., & Álvarez-García, J. (2024). Non-commodity agricultural price hedging with minimum tracking error portfolios: The case of Mexican Hass avocado. Agriculture, 14(10), 1692. https://doi.org/10.3390/agriculture14101692 | |
| dc.relation.references | Unidad de Planificación Rural Agropecuaria (UPRA). (2025). Visor geográfico del sector agropecuario: Aguacate. https://upra.gov.co/ | |
| dc.relation.references | Yu, X., Liu, B., & Lai, Y. (2024). Monthly Pork Price Prediction Applying Projection Pursuit Regression: Modeling, Empirical Research, Comparison, and Sustainability Implications. Sustainability (Switzerland), 16(4). https://doi.org/10.3390/su1604146 | |
| dc.relation.references | Zdansky, J. (2006). BINSEG: an efficient speaker-based segmentation technique. Interspeech 2006, paper 1459-Thu1A1O.2-0. https://doi.org/10.21437/Interspeech.2006-567 | |
| dc.relation.references | Zhang, N., An, Q., Zhang, S., & Ma, H. (2024). Price prediction for fresh agricultural products based on a boosting ensemble algorithm. Mathematics, 13(1), 71. https://doi.org/10.3390/math13010071 | |
| dc.relation.references | Zhao T, Chen G, Suraphee S, Phoophiwfa T, Busababodhin P. A hybrid TCN-XGBoost model for agricultural product market price forecasting. PLoS One. 2025 May 2;20(5):e0322496. doi: 10.1371/journal.pone.0322496. PMID: 40315255; PMCID: PMC12047798. | |
| dc.rights | Attribution 4.0 International | en |
| dc.rights.uri | http://creativecommons.org/licenses/by/4.0/ | |
| dc.subject | Aguacate | |
| dc.subject | Machine Learning | |
| dc.subject | Series temporales | |
| dc.subject.keywords | Avocado | |
| dc.subject.keywords | Machine Learning | |
| dc.subject.keywords | Time series | |
| dc.title | Pronóstico de precios de aguacate Hass y papelillo en Colombia mediante métodos de series temporales | |
| dc.title.translated | Forecasting Hass and Papelillo avocado prices in Colombia using time series methods |
Archivos
Bloque original
1 - 1 de 1
Cargando...
- Nombre:
- Trabajo de grado.pdf
- Tamaño:
- 1.19 MB
- Formato:
- Adobe Portable Document Format
Bloque de licencias
1 - 3 de 3
Cargando...
- Nombre:
- license.txt
- Tamaño:
- 1.95 KB
- Formato:
- Item-specific license agreed upon to submission
- Descripción:
Cargando...
- Nombre:
- Carta de autorizacion.pdf
- Tamaño:
- 357.33 KB
- Formato:
- Adobe Portable Document Format
- Descripción:
Cargando...
- Nombre:
- Anexo 1 acta de aprobacion.pdf
- Tamaño:
- 381.8 KB
- Formato:
- Adobe Portable Document Format
- Descripción:
