ความแตกต่างตามฤดูกาลและ auto.arima
ฉันได้เริ่มศึกษาอัลกอริทึมการพยากรณ์ที่แตกต่างกันโดยใช้ R เป็นตัวอย่างอาจจะไม่ใช่วิธีที่ดีที่สุด (เนื่องจากไม่มีฤดูกาล) ฉันใช้หุ้น Facebook
ชุดฝึก:
SYMBOL <- getSymbols("FB", from = "2015-01-01", to = "2019-12-31")
Stocks_FB_day <- get(SYMBOL[1])
Stocks_FB_day_Cl <- Cl(Stocks_FB_day)
ชุดการทดสอบ:
SYMBOL <- getSymbols("FB", from = "2020-01-01", to = "2020-01-21")
Stocks_FB_day <- get(SYMBOL[1])
ฉันได้สร้างโมเดลต่างๆรวมถึง ARIMA ฉันรู้ว่าอันนี้ไม่เหมาะสมที่สุดสำหรับข้อมูลหุ้นรายวันอย่างไรก็ตามฉันตัดสินใจที่จะลองดู เมื่อพิจารณาว่ามีการสังเกตประมาณ 252 ครั้งต่อปีฉันได้สร้างแผนการย่อยสลายโดยใช้stl()
ฟังก์ชันและการตั้งค่าความถี่เท่ากับ 126 (ครึ่งปี) และ 252 (หนึ่งปีเต็ม) ทั้งสองแปลงแสดงให้เห็นว่าสัญญาณตามฤดูกาลไม่จำเป็นจริงๆ นี่คือหนึ่งในนั้น:

นอกจากนี้ยังสามารถสรุปได้จากกราฟ ACF และ PACF (ฉันอาจจะผิด?):

นี่คือการทดลองของฉันกับauto.arima
ฟังก์ชัน:

ทุกครั้งที่ฉันเขียน "D = 1" (ไม่ว่าจะเป็นความถี่ 252 หรือ 126) โดยบังคับให้มีความแตกต่างตามฤดูกาลฉันจะได้ค่า AIC ที่สูงขึ้นอย่างไรก็ตามการคาดการณ์ที่แม่นยำยิ่งขึ้น ฉันไม่ได้บอกว่าการกำหนดเส้นแบน / เกือบจะไม่เหมาะสมอย่างไรก็ตามบางครั้งคุณต้องการทราบมากกว่าทิศทางโดยรวมของการคาดการณ์ในอนาคตของคุณหากเป็นไปได้

ฉันคิดว่าฉันทำผิดพลาดมากมายและเป็นไปได้สูงว่าแนวทางทั้งหมดไม่เหมาะสมเลย
คำถามสำคัญคือ:
"มันสมเหตุสมผลหรือไม่ที่จะบังคับให้เกิดความแตกต่างตามฤดูกาล (D = 1) ในกรณีที่ให้ค่าการคาดการณ์ที่ดีกว่า (ฉันเปรียบเทียบกับชุดการระงับการคำนวณ MAPE เป็นต้น) แม้ว่าจะดูเหมือนว่าไม่จำเป็นก็ตามเนื่องจาก ความจริงที่ว่าฤดูกาลอ่อนแอ? "
คำตอบ
ตามคำแนะนำทั่วไปคุณสามารถผลักดันสิ่งที่ข้อมูลที่คุณมีอยู่ตรงหน้ากำลังบอกคุณได้หากคุณมีความรู้เกี่ยวกับโดเมนมาก่อนที่เชื่อถือได้ ในกรณีนี้นั่นจะเป็นความรู้เกี่ยวกับตลาดหุ้นโดยทั่วไปหรือความรู้เกี่ยวกับธุรกิจของ Facebook โดยเฉพาะซึ่งก่อนหน้านี้คุณได้มาโดยไม่ขึ้นอยู่กับชุดราคาหุ้นที่คุณกำลังดูอยู่
แต่ถ้าความรู้เกี่ยวกับโดเมนไม่ได้บอกว่าควรเป็นไปตามฤดูกาลและข้อมูลไม่ได้เป็นไปตามฤดูกาลจริงๆและคุณจะสุ่มว่า "เดี๋ยวก่อนถ้าฉันพยายามบังคับให้เป็นฤดูกาลล่ะ" และคุณจะได้รับผลลัพธ์จากตัวอย่างที่ดีขึ้นคุณควรสงสัยว่าคุณได้ปรับปรุงโมเดลของคุณอย่างแท้จริงในลักษณะที่จะเป็นประโยชน์ในอนาคตหรือไม่ เป็นไปได้แน่นอนว่าความรู้เกี่ยวกับโดเมนนั้นมีข้อบกพร่องหรือการเพิ่มความแตกต่างตามฤดูกาลได้แก้ไขปัญหาที่แท้จริง แต่ไม่เกี่ยวข้องกับโมเดลของคุณซึ่งคุณสามารถแก้ไขได้โดยตรง
ฉันเห็นผู้คนมากมายที่นี่ซึ่งกำลังเรียนรู้เกี่ยวกับการคาดการณ์ที่ดูเหมือนจะโน้มน้าวต่อราคาหุ้นเป็นโครงการแรก น่าเสียดายที่ลักษณะของโดเมนคือภายในคลาสของโมเดล ARIMA ราคาหุ้นมักจะจำลองได้ดีที่สุดว่าเป็นการเดินแบบสุ่มดังนั้นจึงไม่น่าสนใจมากนักจากมุมมองการเรียนรู้ นี่เป็นคุณสมบัติพื้นฐานของโดเมนและเกิดจากวิธีที่ความคาดหวังโดยรวมของราคาในอนาคตมีอิทธิพลต่อนักลงทุนในการปรับเปลี่ยนเส้นทางในอนาคตของราคาโดยการซื้อหรือขายสินทรัพย์ กลไกตอบรับนี้มีแนวโน้มที่จะลดทอนการเคลื่อนไหวที่คาดการณ์ไว้ได้อย่างง่ายดายดังนั้นสิ่งที่คุณสังเกตได้ง่ายคือเสียงรบกวน
โดยปกติราคาหุ้นจะไม่มีรูปแบบตามฤดูกาลที่ชัดเจนด้วยเหตุนี้ หากสามารถทำกำไรได้อย่างน่าเชื่อถือโดยการซื้อในช่วงนอกฤดูกาลท่องเที่ยวและขายในช่วงไฮซีซันทุกคนจะทำเช่นนั้น ซึ่งจะทำให้ราคาในช่วงนอกฤดูท่องเที่ยวเพิ่มขึ้นและช่วงที่อยู่ในช่วงไฮซีซั่นจะลดลงทำให้ข้อได้เปรียบนี้หายไปในที่สุด ความรู้เกี่ยวกับโดเมนเดิมในกรณีนี้กล่าวว่าราคาหุ้นอาจไม่เป็นไปตามฤดูกาลด้วยวิธีนี้
ดังนั้นในกรณีนี้ฉันจะสงสัยในการเพิ่มความแตกต่างตามฤดูกาลและฉันจะตรวจสอบเพิ่มเติมว่าเหตุใดระดับการคาดการณ์ที่ไม่ใช่ฤดูกาลของคุณจึงดูห่างไกลกว่ามาก (ฉันไม่สามารถบอกได้จากข้อมูลที่คุณโพสต์จนถึงตอนนี้ ).