Diferenciação sazonal e auto.arima
Comecei a estudar diferentes algoritmos de previsão, usando R. Como exemplo, talvez não o melhor (por falta de sazonalidade), estou usando ações do Facebook.
Conjunto de treinamento:
SYMBOL <- getSymbols("FB", from = "2015-01-01", to = "2019-12-31")
Stocks_FB_day <- get(SYMBOL[1])
Stocks_FB_day_Cl <- Cl(Stocks_FB_day)
Conjunto de teste:
SYMBOL <- getSymbols("FB", from = "2020-01-01", to = "2020-01-21")
Stocks_FB_day <- get(SYMBOL[1])
Construí diferentes modelos, incluindo ARIMA. Sei que este não é o mais adequado para dados diários de estoque, no entanto, decidi fazer uma tentativa. Levando em consideração que há aproximadamente 252 observações por ano, criei gráficos de decomposição, usando stl()
funções e configurando frequências iguais a 126 (meio ano) e 252 (ano inteiro). Ambos os gráficos mostram que os sinais sazonais não são realmente essenciais. Aqui está um deles:

Também pode ser concluído a partir dos gráficos ACF e PACF (talvez eu esteja errado?):

Estes são meus experimentos com auto.arima
funções:

Cada vez que escrevia "D = 1" (se a frequência era 252 ou 126), forçando a diferenciação sazonal, obtinha valores de AIC mais altos, no entanto, previsões mais precisas. Não estou dizendo que obter linhas planas / quase planas não seja apropriado, no entanto, às vezes você quer saber mais do que apenas uma direção geral de sua previsão futura, se possível.

Suponho que cometi muitos erros e é altamente possível que toda a abordagem não seja apropriada.
A grande questão é:
"Faz sentido forçar a diferenciação sazonal (D = 1) nos casos em que dá melhores valores de previsão (eu os comparo com um conjunto de validação, calculando MAPE, por exemplo), mesmo que pareça desnecessário, devido a o fato de que a sazonalidade é fraca? "
Respostas
Como conselho geral, você pode contestar o que os dados que tem à sua frente indicam se você tem um conhecimento prévio confiável do domínio . Nesse caso, seria o conhecimento sobre o mercado de ações em geral, ou sobre os negócios do Facebook especificamente, que você adquiriu anteriormente, independentemente da série de preços das ações que está olhando.
Mas se o conhecimento do domínio não disser que deve ser sazonal, e os dados não parecerem realmente sazonais, e você disser aleatoriamente "ei, e se eu tentar forçar a sazonalidade?" e você obtém melhores resultados de amostra, você definitivamente deve ser cético sobre se você realmente melhorou seu modelo de uma forma que será útil no futuro. Obviamente, é possível que o conhecimento do domínio seja defeituoso ou que a adição da diferenciação sazonal tenha corrigido um problema real, mas não relacionado com o seu modelo, que você poderia justificar melhor corrigir diretamente.
Vejo muitas pessoas aqui que estão aprendendo sobre previsões que parecem gravitar em torno dos preços das ações como um primeiro projeto. Infelizmente, a natureza do domínio é que, dentro da classe de modelos ARIMA, os preços das ações são quase sempre melhor modelados como passeios aleatórios, portanto, não muito interessantes do ponto de vista do aprendizado. Esta é uma propriedade fundamental do domínio e deve-se à maneira como as expectativas agregadas de preços futuros influenciam os investidores a modificar a trajetória futura do preço comprando ou vendendo o ativo. Este mecanismo de feedback tende a atenuar qualquer movimento facilmente antecipado, então tudo que você pode observar facilmente é o ruído.
Os preços das ações normalmente não apresentam um padrão fortemente sazonal por esse motivo. Se fosse possível obter lucros confiáveis comprando na baixa temporada e vendendo na alta temporada, todos fariam isso. Isso faria com que o preço da baixa temporada aumentasse e o da alta caísse, acabando por fazer essa vantagem desaparecer. O conhecimento prévio do domínio, neste caso, diz que os preços das ações provavelmente não são sazonais dessa forma.
Portanto, neste caso, seria cético em adicionar a diferenciação sazonal e investigaria mais por que o nível de sua previsão não sazonal parece estar muito mais distante (não posso dizer com base nas informações que você postou até agora )