Implementación de modelos estadísticos para la estimación de la demanda de combustibles en Costa Rica
Guardado en:
Autor: | |
---|---|
Formato: | tesis de maestría |
Fecha de Publicación: | 2022 |
Descripción: | La pandemia del Covid-19, ha constituido un reto enorme para la humanidad, generando importantes desafíos en las diversas áreas del conocimiento, y la Estadística no es la excepción, pues muchos modelos, requieren el desarrollo de diversas modificaciones en su tratamiento, para la adecuada internalización de este cambio tan importante en el contexto. De ahí nace la motivación del presente trabajo, el cual busca generar un aporte, que permita dar diversas alternativas para la estimación de series de tiempo o cronológicas, las cuales han sido expuestas a una perturbación fuerte como es el caso de la pandemia, que ocasiona importantes errores al momento de pronosticar el comportamiento a futuro de la serie. En este estudio, se empleó la información de la demanda de combustible de Costa Rica de 2010 a 2020 en litros para los productos Súper (RON 95), Regular (RON 91) y Diésel (Diésel 50 ppm), que son los combustibles de mayor consumo a nivel nacional, son de gran importancia en la economía del país, y han sido una de las demandas más afectadas por la pandemia. Para lograr lo anterior, se desarrollaron diversos modelos estadísticos de series de tiempo, como por ejemplo los modelos de suavizamiento exponencial, modelos ARIMA, modelos de Series de Tiempo Estructurales Bayesianas y modelos de minería de datos como XGBoost y el uso de Vectores de Soporte de Regresión, empleando datos estadísticos de las series de ventas de combustible, datos de movilidad de Google y datos asociados a la evolución del Covid-19. El fin de utilizar este conjunto de modelos, fue aprovechar las diversas características y bondades que cada uno de ellos ofrece, y de este modo poder enfrentar un escenario de estimación complejo, comprendiendo que, en diversas ocasiones los mejores resultados se obtienen de emplear diversos modelos, por ejemplo para la gasolina regular, el mejor resultado se obtuvo por medio de un modelo XGBoost (7,55% de Error Absoluto Medio), mientras que para el Diésel el mejor resultado fue del modelo Bayesiano (8,84% de Error Absoluto Medio). Además, se observó que en ocasiones el trabajo conjunto de todas estas técnicas puede ser una gran alternativa, como se observó en el caso de la gasolina Súper, en la cual se empleó el modelo conjunto estimado por medio de Vectores de Soporte de Regresión, utilizando como variables explicativas, las estimaciones de los otros modelos y permitió obtener los mejores resultados con 9,91% de Error Absoluto Medio. |
País: | Kérwá |
Institución: | Universidad de Costa Rica |
Repositorio: | Kérwá |
Lenguaje: | Español |
OAI Identifier: | oai:kerwa.ucr.ac.cr:10669/87430 |
Acceso en línea: | https://hdl.handle.net/10669/87430 |
Palabra clave: | Pandemia CORONAVIRUS Demanda Pronóstico Estimación Gasolinas Diésel Movilidad Ciencia de datos Minería de datos Series de tiempo Machine learning Modelos apilados Datos de Google COVID-19 |