La Sobreparametrización en el ARIMA: una aplicación a datos costarricenses

 

Guardado en:
Detalles Bibliográficos
Autor: Gamboa Sanabria, César Andrés
Formato: tesis de maestría
Fecha de Publicación:2023
Descripción:Estimar modelos de series cronológicas es una labor ampliamente extendida en múltiples campos de la investigación y uno de los objetivos es generar pronósticos de la forma más precisa posible dentro de un horizonte determinado. Existe una amplia gama de modelos que puede utilizarse con este fin, entre ellos están los modelos Autorregresivos Integrados de Medias Móviles ($ARIMA$), e incluso existen diversos métodos de estimación automática o semi-automática para esta rama de la Estadística. A pesar de esto, encontrar un modelo que posea un buen ajuste a los datos no es fácil, pues se deben considerar tanto aspectos teóricos como prácticos, y de la temática de estudio para así obtener un modelo adecuado que genere pronósticos realistas y pertinentes para la toma de decisiones dentro de lo posible. Esta investigación propone hacer uso del método denominado sobreparametrización en conjunto con el método de permutaciones del análisis combinatorio para someter a prueba un espectro más amplio de posibles modelos ARIMA. En la selección de modelos ARIMA, los métodos más tradicionales como los correlogramas u otros, no suelen cubrir muchas alternativas para definir la cantidad de coeficientes a estimar en el modelo, lo cual representa un método de estimación que no es óptimo. Por lo tanto, la presente tesis propone una metodología para obtener pronósticos más precisos en comparación a los métodos tradicionales. Los resultados encontrados se contrastan con datos simulados de series cronológicas y cuatro series reales para ajustar modelos ARIMA con la función auto.arima(), la sobreparametrización y un modelo ARIMA de orden bajo. Para cada una de estas series se realiza una partición del 80% para entrenar los modelos y el restante 20% para validación de los pronósticos. En cada una de estas series se realizó un análisis visual del comportamiento de los errores y posteriormente se evalúa la calidad de los resultados de cada modelo obtenido con las tres técnicas descritas mediante medidas de bondad de ajuste (AIC, AICc y BIC) y de precisión (RMSE, MAE y MAPE). Al tener datos que vienen de un proceso con bajo número de parámetros, la sobreparametrización logra captar de buena manera el comportamiento de la serie en comparación a las otras alternativas, y cuando el proceso que gobierna la serie es de un mayor grado. La metodología propuesta es capaz de capturar de mejor forma el comportamiento de la serie y conseguir pronósticos con una precisión mayor a los de los métodos tradicionales, ya que en los resultados de entrenamiento, la sobreparametrización obtuvo el mejor ajuste un 58,33% de las veces y la mejor precisión el 45,45% de las veces, mientras que al evaluar los resultados sobre los conjuntos de datos de validación, la sobreparametrización obtuvo el mejor ajuste el 50% de las veces, mientras que las mejores medidas de precisión se alcanzaron un 67% del tiempo.
País:Kérwá
Institución:Universidad de Costa Rica
Repositorio:Kérwá
Lenguaje:Español
OAI Identifier:oai:kerwa.ucr.ac.cr:10669/88030
Acceso en línea:https://hdl.handle.net/10669/88030
Palabra clave:ARIMA
ESTADÍSTICA
MODELO MATEMÁTICO