Diferenciación estacional y auto.arima
Comencé a estudiar diferentes algoritmos de pronóstico, usando R. Como ejemplo, tal vez no sea el mejor (debido a la falta de estacionalidad), estoy usando acciones de Facebook.
Conjunto de entrenamiento:
SYMBOL <- getSymbols("FB", from = "2015-01-01", to = "2019-12-31")
Stocks_FB_day <- get(SYMBOL[1])
Stocks_FB_day_Cl <- Cl(Stocks_FB_day)
Equipo de prueba:
SYMBOL <- getSymbols("FB", from = "2020-01-01", to = "2020-01-21")
Stocks_FB_day <- get(SYMBOL[1])
He construido diferentes modelos, incluido ARIMA. Sé que este no es el más adecuado para los datos de existencias diarias, sin embargo, he decidido intentarlo. Teniendo en cuenta que hay aproximadamente 252 observaciones por año, he creado gráficos de descomposición, usando stl()
funciones y estableciendo frecuencias iguales a 126 (medio año) y 252 (un año completo). Ambos gráficos muestran que las señales estacionales no son realmente esenciales. Aqui esta uno de ellos:

También se puede concluir a partir de los gráficos ACF y PACF (¿tal vez estoy equivocado?):

Estos son mis experimentos con auto.arima
función:

Cada vez que escribía "D = 1" (si la frecuencia era 252 o 126), forzando la diferenciación estacional, obtenía valores de AIC más altos, sin embargo, predicciones más precisas. No estoy diciendo que obtener líneas planas / casi planas no sea apropiado, sin embargo, a veces desea saber más que solo una dirección general de su pronóstico futuro si es posible.

Supongo que he cometido muchos errores y es muy posible que todo el enfoque no sea apropiado en absoluto.
La pregunta principal es:
"¿Tiene sentido forzar la diferenciación estacional (D = 1) en los casos en que da mejores valores de pronóstico (los comparo con un conjunto de reserva, calculando MAPE, por ejemplo) incluso si parece ser innecesario, debido a el hecho de que la estacionalidad sea débil? "
Respuestas
Como consejo general, puede oponerse a lo que le dicen los datos que tiene frente a usted si tiene un conocimiento previo confiable del dominio . En este caso, eso sería conocimiento sobre el mercado de valores en general, o conocimiento sobre el negocio de Facebook específicamente, que haya adquirido previamente independientemente de la serie de precios de acciones que esté viendo.
Pero si el conocimiento del dominio no dice que debería ser estacional, y los datos realmente no parecen estacionales, y dices al azar "oye, ¿qué pasa si intento forzar la estacionalidad?" y obtiene mejores resultados de las muestras, definitivamente debería ser escéptico acerca de si realmente ha mejorado su modelo de una manera que sea útil en el futuro. Por supuesto, es posible que el conocimiento del dominio sea defectuoso, o que agregar la diferenciación estacional haya solucionado un problema real pero no relacionado con su modelo que podría justificar mejor solucionarlo directamente.
Veo a mucha gente aquí que está aprendiendo sobre pronósticos que parecen gravitar hacia los precios de las acciones como primer proyecto. Desafortunadamente, la naturaleza del dominio es que, dentro de la clase de modelos ARIMA, los precios de las acciones casi siempre se modelan mejor como caminatas al azar, por lo que no es muy interesante desde el punto de vista del aprendizaje. Esta es una propiedad fundamental del dominio y se debe a la forma en que las expectativas agregadas de precios futuros influyen en los inversores para modificar la trayectoria futura del precio comprando o vendiendo el activo. Este mecanismo de retroalimentación tiende a atenuar cualquier movimiento que se pueda anticipar fácilmente, por lo que todo lo que puede observar fácilmente es ruido.
Los precios de las acciones no suelen tener un patrón fuertemente estacional por esta razón. Si fuera posible obtener beneficios fiables comprando en temporada baja y vendiendo en temporada alta, todo el mundo lo haría. Esto haría que el precio en temporada baja aumentara y el de temporada alta cayera, lo que eventualmente haría desaparecer esta ventaja. El conocimiento previo del dominio en este caso dice que los precios de las acciones probablemente no sean estacionales de esta manera.
Entonces, en este caso, sería escéptico de agregar la diferenciación estacional e investigaría más a fondo por qué el nivel de su pronóstico no estacional parece estar mucho más lejos (no puedo decirlo por la información que ha publicado hasta ahora ).