Sự khác biệt theo mùa và auto.arima

Aug 16 2020

Tôi đã bắt đầu nghiên cứu các thuật toán dự báo khác nhau, sử dụng R. Ví dụ, có thể không phải là thuật toán tốt nhất (do thiếu tính thời vụ), tôi đang sử dụng cổ phiếu Facebook.

Tập huấn luyện:

SYMBOL <- getSymbols("FB", from = "2015-01-01", to = "2019-12-31")
Stocks_FB_day <- get(SYMBOL[1])
Stocks_FB_day_Cl <- Cl(Stocks_FB_day)

Bộ thử nghiệm:

SYMBOL <- getSymbols("FB", from = "2020-01-01", to = "2020-01-21")
Stocks_FB_day <- get(SYMBOL[1])

Tôi đã xây dựng các mô hình khác nhau, bao gồm cả ARIMA. Tôi biết cái này không phù hợp nhất cho dữ liệu chứng khoán hàng ngày, tuy nhiên, tôi đã quyết định dùng thử. Tính đến rằng có khoảng 252 quan sát mỗi năm, tôi đã tạo các đồ thị phân hủy, sử dụng stl()hàm và cài đặt tần số bằng 126 (nửa năm) và 252 (một năm). Cả hai âm mưu đều cho thấy tín hiệu theo mùa không thực sự thiết yếu. Đây là một trong số chúng:

Nó cũng có thể được kết luận từ đồ thị ACF và PACF (có thể tôi sai?):

Đây là những thử nghiệm của tôi với auto.arimachức năng:

Mỗi lần tôi viết "D = 1" (cho dù tần số là 252 hay 126), buộc phải thực hiện sự khác biệt theo mùa, tuy nhiên, tôi lại nhận được các giá trị AIC cao hơn, các dự đoán chính xác hơn. Tôi không nói rằng việc tạo ra các đường bằng phẳng / gần như bằng phẳng là không thích hợp, tuy nhiên, đôi khi bạn muốn biết nhiều hơn chỉ là một hướng tổng thể về dự báo tương lai của bạn nếu có thể.

Tôi cho rằng mình đã mắc rất nhiều sai lầm và rất có thể toàn bộ cách tiếp cận không phù hợp chút nào.

Câu hỏi chính là:

"Có hợp lý không khi ép chênh lệch theo mùa (D = 1) trong trường hợp nó cung cấp các giá trị dự báo tốt hơn (tôi so sánh chúng với một tập hợp giữ lại, tính toán MAPE, chẳng hạn) ngay cả khi nó có vẻ không cần thiết thực tế là tính thời vụ là yếu? "

Trả lời

3 ChrisHaug Aug 16 2020 at 21:41

Theo lời khuyên chung, bạn có thể chống lại những gì dữ liệu bạn có trước mặt bạn đang cho bạn biết nếu bạn có kiến thức miền đáng tin cậy trước đó . Trong trường hợp này, đó sẽ là kiến ​​thức về thị trường chứng khoán nói chung, hoặc kiến ​​thức cụ thể về hoạt động kinh doanh của Facebook mà bạn đã có được trước đó độc lập với chuỗi giá cổ phiếu bạn đang xem.

Nhưng nếu kiến ​​thức miền không nói rằng nó phải theo mùa và dữ liệu không thực sự trông theo mùa, và bạn ngẫu nhiên nói "này, nếu tôi cố ép buộc thời vụ thì sao?" và bạn nhận được kết quả tốt hơn từ các kết quả mẫu, bạn chắc chắn nên nghi ngờ về việc liệu bạn có thực sự cải thiện mô hình của mình theo cách sẽ hữu ích trong tương lai hay không. Tất nhiên, có thể kiến ​​thức miền bị sai sót hoặc việc thêm chênh lệch theo mùa đã khắc phục một sự cố thực sự nhưng không liên quan với mô hình của bạn mà tốt hơn bạn có thể biện minh cho việc sửa chữa trực tiếp.

Tôi thấy rất nhiều người ở đây đang tìm hiểu về dự báo dường như thu hút giá cổ phiếu như một dự án đầu tiên. Thật không may, bản chất của miền là, trong lớp mô hình ARIMA, giá cổ phiếu hầu như luôn được mô hình hóa tốt nhất dưới dạng các bước đi ngẫu nhiên, do đó, không thú vị lắm từ quan điểm học tập. Đây là thuộc tính cơ bản của miền và đó là do cách tổng hợp kỳ vọng về giá trong tương lai ảnh hưởng đến các nhà đầu tư để sửa đổi đường đi trong tương lai của giá bằng cách mua hoặc bán tài sản. Cơ chế phản hồi này có xu hướng làm giảm bớt bất kỳ chuyển động dễ dàng dự đoán nào, vì vậy tất cả những gì bạn có thể dễ dàng quan sát là tiếng ồn.

Giá cổ phiếu thường không có xu hướng theo mùa mạnh vì lý do này. Nếu có thể kiếm được lợi nhuận đáng tin cậy bằng cách mua vào mùa thấp điểm và bán vào mùa cao điểm, thì mọi người sẽ làm điều đó. Điều này sẽ khiến giá vào mùa thấp điểm tăng lên và giá vào mùa cao điểm giảm, cuối cùng khiến lợi thế này biến mất. Kiến thức miền trước trong trường hợp này nói rằng giá cổ phiếu có thể không theo mùa theo cách này.

Vì vậy, trong trường hợp này, tôi sẽ nghi ngờ việc thêm vào sự khác biệt theo mùa và tôi sẽ điều tra thêm tại sao mức độ dự báo không theo mùa của bạn dường như thấp hơn nhiều (tôi không thể biết từ thông tin bạn đã đăng cho đến nay ).