Mevsimsel farklılık ve auto.arima
R'yi kullanarak farklı tahmin algoritmaları çalışmaya başladım.Örnek olarak, belki de en iyisi değil (mevsimsellik eksikliği nedeniyle), Facebook hisse senetlerini kullanıyorum.
Eğitim Seti:
SYMBOL <- getSymbols("FB", from = "2015-01-01", to = "2019-12-31")
Stocks_FB_day <- get(SYMBOL[1])
Stocks_FB_day_Cl <- Cl(Stocks_FB_day)
Test seti:
SYMBOL <- getSymbols("FB", from = "2020-01-01", to = "2020-01-21")
Stocks_FB_day <- get(SYMBOL[1])
ARIMA dahil farklı modeller yaptım. Bunun günlük hisse senedi verileri için en uygun olmadığını biliyorum, ancak denemeye karar verdim. Yılda yaklaşık 252 gözlem olduğunu göz önünde bulundurarak stl()
, 126 (yarım yıl) ve 252'ye (tam bir yıl) eşit fonksiyon ve ayar frekansları kullanarak ayrıştırma grafikleri oluşturdum . Her iki grafik de mevsimsel sinyallerin gerçekten gerekli olmadığını gösteriyor. İşte bunlardan biri:
ACF ve PACF grafiklerinden de çıkarılabilir (belki yanılıyorum?):
Bunlar auto.arima
işlevle ilgili deneylerim :
Her zaman "D = 1" yazdığımda (frekans 252 veya 126 olsun), mevsimsel farklılığı zorlayarak, daha yüksek AIC değerleri, ancak daha doğru tahminler elde ettim. Düz / neredeyse düz hatlar elde etmenin uygun olmadığını söylemiyorum, yine de bazen, eğer mümkünse, gelecek tahmininizin genel bir yönünden daha fazlasını bilmek istersiniz.
Pek çok hata yaptığımı varsayıyorum ve tüm yaklaşımın hiç de uygun olmaması oldukça olası.
Asıl soru şudur:
"Mevsimsel farklılığı zorlamak (D = 1) daha iyi tahmin değerleri verdiği durumlarda (bunları bir uzatma kümesiyle karşılaştırıyorum, örneğin MAPE'yi hesaplıyorum) nedeniyle gereksiz görünse bile mantıklı geliyor mu? mevsimselliğin zayıf olduğu gerçeği? "
Yanıtlar
Genel bir tavsiye olarak, önceden güvenilir bir alan bilgisine sahipseniz, önünüzdeki verilerin size söylediklerini geri çekebilirsiniz . Bu durumda, daha önce baktığınız hisse senedi fiyat serilerinden bağımsız olarak edindiğiniz genel olarak borsa hakkında bilgi veya özellikle Facebook'un işi hakkında bilgi olacaktır.
Ancak, alan bilgisi sezonluk olması gerektiğini söylemiyorsa ve veriler gerçekten mevsimsel görünmüyorsa ve rastgele "hey, ya mevsimselliği zorlamaya çalışsaydım?" ve örnek sonuçlardan daha iyi hale gelirseniz, modelinizi gelecekte faydalı olacak şekilde gerçekten geliştirip geliştirmediğiniz konusunda kesinlikle şüpheci olmalısınız. Elbette, alan bilgisinin kusurlu olması veya mevsimsel farklılığın eklenmesi, modelinizle ilgili gerçek ancak ilgisiz bir sorunu çözmüş olabilir ve bu sorunu doğrudan düzeltmeyi daha iyi gerekçelendirebilirsiniz.
Burada ilk proje olarak hisse senedi fiyatlarına yönelmiş gibi görünen tahminler hakkında bilgi sahibi olan birçok insan görüyorum. Maalesef, alanın doğası, ARIMA modelleri sınıfında, hisse senedi fiyatlarının hemen hemen her zaman en iyi rastgele yürüyüşler olarak modellenmesidir, bu nedenle öğrenme açısından çok ilginç değildir. Bu, alanın temel bir özelliğidir ve gelecekteki fiyatlara ilişkin toplam beklentilerin, yatırımcıları varlığı satın alarak veya satarak fiyatın gelecekteki yolunu değiştirmeleri için etkileme biçiminden kaynaklanmaktadır. Bu geribildirim mekanizması, kolayca tahmin edilebilecek herhangi bir hareketi zayıflatma eğilimindedir, bu nedenle kolayca gözlemleyebileceğiniz tek şey gürültüdür.
Bu nedenle hisse senedi fiyatları genellikle mevsimsel bir yapıya sahip değildir. Düşük sezonda alıp yüksek sezonda satarak güvenilir kar elde etmek mümkün olsaydı herkes yapardı. Bu, düşük sezondaki fiyatın artmasına ve yüksek sezondaki fiyatın düşmesine ve sonunda bu avantajın ortadan kalkmasına neden olur. Bu durumda önceki alan bilgisi, hisse senedi fiyatlarının muhtemelen bu şekilde sezonluk olmadığını söylüyor .
Bu durumda, bu durumda, mevsimsel farklılıkları eklemek konusunda şüpheci olurum ve mevsimsel olmayan tahmininizin seviyesinin neden çok daha düşük göründüğünü daha ayrıntılı olarak araştırırım (Şimdiye kadar gönderdiğiniz bilgilerden anlayamıyorum. ).