मौसमी अलग और ऑटो
मैंने आर का उपयोग करके विभिन्न पूर्वानुमान एल्गोरिदम का अध्ययन करना शुरू कर दिया है। उदाहरण के रूप में, शायद सबसे अच्छा एक नहीं (मौसमी की कमी के कारण), मैं फेसबुक स्टॉक का उपयोग कर रहा हूं।
प्रशिक्षण सेट:
SYMBOL <- getSymbols("FB", from = "2015-01-01", to = "2019-12-31")
Stocks_FB_day <- get(SYMBOL[1])
Stocks_FB_day_Cl <- Cl(Stocks_FB_day)
परीक्षण सेट:
SYMBOL <- getSymbols("FB", from = "2020-01-01", to = "2020-01-21")
Stocks_FB_day <- get(SYMBOL[1])
मैंने ARIMA सहित विभिन्न मॉडल बनाए हैं। मुझे पता है कि यह दैनिक स्टॉक डेटा के लिए सबसे उपयुक्त नहीं है, हालांकि, मैंने इसे एक कोशिश देने का फैसला किया है। इस बात को ध्यान में रखते हुए कि प्रति वर्ष लगभग 252 अवलोकन होते हैं, मैंने stl()
फ़ंक्शन और सेटिंग आवृत्तियों को 126 (आधा वर्ष) और 252 (एक पूर्ण वर्ष) के बराबर आवृत्तियों का उपयोग करके बनाया है । दोनों भूखंड बताते हैं कि मौसमी संकेत वास्तव में आवश्यक नहीं हैं। उनमें से एक यहां पर है:
यह ACF और PACF ग्राफ़ (शायद मैं गलत हूं?) से भी निष्कर्ष निकाला जा सकता है।
ये auto.arima
समारोह के साथ मेरे प्रयोग हैं :
हर बार जब मैंने "डी = 1" लिखा था (चाहे आवृत्ति 252 या 126 थी), मौसमी अंतर को मजबूर करते हुए, मुझे उच्च एआईसी मान मिला, हालांकि, अधिक सटीक भविष्यवाणियां। मैं यह नहीं कह रहा हूं कि सपाट / लगभग समतल लाइनें प्राप्त करना उचित नहीं है, फिर भी, कभी-कभी आप अपने भविष्य के पूर्वानुमान के समग्र दिशा से अधिक जानना चाहते हैं यदि यह संभव है।
मुझे लगता है कि मैंने बहुत सारी गलतियाँ की हैं और यह बहुत संभव है कि संपूर्ण दृष्टिकोण बिल्कुल भी उचित न हो।
प्रमुख प्रश्न है:
"क्या यह उन मामलों में मौसमी भिन्नता (डी = 1) के लिए मजबूर करने के लिए समझ में आता है जब यह बेहतर पूर्वानुमान मान देता है (मैं उन्हें एक होल्ड-आउट सेट के साथ तुलना करता हूं, एमएपीई की गणना करता है, उदाहरण के लिए) भले ही यह अनावश्यक लगता हो, रखने के कारण तथ्य यह है कि मौसमी कमजोर है? "
जवाब
सामान्य सलाह के रूप में, आप अपने सामने मौजूद डेटा के बारे में बता सकते हैं कि क्या आपके पास विश्वसनीय पूर्व डोमेन ज्ञान है । इस मामले में, कि सामान्य रूप से शेयर बाजार के बारे में जानकारी होगी, या विशेष रूप से फेसबुक के व्यापार के बारे में ज्ञान होगा, जिसे आपने पहले शेयर मूल्य श्रृंखला से स्वतंत्र रूप से हासिल किया है जिसे आप देख रहे हैं।
लेकिन अगर डोमेन ज्ञान यह नहीं कहता है कि यह मौसमी होना चाहिए, और डेटा वास्तव में मौसमी नहीं दिखता है, और आप बेतरतीब ढंग से कहते हैं "हे, क्या होगा अगर मैंने मौसमी को मजबूर करने की कोशिश की?" और आप बेहतर नमूना परिणाम प्राप्त करते हैं, आपको निश्चित रूप से संदेह होना चाहिए कि क्या आपने वास्तव में अपने मॉडल को इस तरह से बेहतर बनाया है जो भविष्य में उपयोगी होगा। यह निश्चित रूप से संभव है कि डोमेन ज्ञान त्रुटिपूर्ण है, या कि मौसमी अंतर को जोड़ने से आपके मॉडल के साथ एक वास्तविक लेकिन असंबंधित समस्या ठीक हो गई है जिसे आप सीधे फिक्सिंग को बेहतर ठहरा सकते हैं।
मैं यहां बहुत से लोगों को देखता हूं जो पूर्वानुमान के बारे में सीख रहे हैं जो पहली परियोजना के रूप में स्टॉक की कीमतों की ओर इशारा करते हैं। दुर्भाग्य से, डोमेन की प्रकृति यह है कि, ARIMA मॉडल के वर्ग के भीतर, स्टॉक की कीमतें लगभग हमेशा सबसे अच्छे मॉडल के रूप में यादृच्छिक रूप से चलती हैं, इसलिए एक सीखने के दृष्टिकोण से बहुत दिलचस्प नहीं है। यह डोमेन की एक मौलिक संपत्ति है और यह भविष्य की कीमतों की कुल अपेक्षाओं के कारण है जो निवेशकों को संपत्ति खरीदने या बेचने के द्वारा मूल्य के भविष्य के मार्ग को संशोधित करने के लिए प्रभावित करते हैं। यह प्रतिक्रिया तंत्र किसी भी आसानी से प्रत्याशित कदम को आकर्षित करने के लिए जाता है, इसलिए आप आसानी से देख सकते हैं सभी शोर है।
स्टॉक की कीमतों में आमतौर पर इस कारण से एक मजबूत मौसमी पैटर्न नहीं होता है। यदि कम सीजन में खरीद कर और उच्च सीजन में बेचकर विश्वसनीय मुनाफा कमाना संभव था, तो हर कोई ऐसा करेगा। इससे निम्न सीजन में कीमत बढ़ जाती है, और उच्च सीजन में गिरावट के कारण, अंततः यह लाभ गायब हो जाता है। इस मामले में पूर्व डोमेन ज्ञान का कहना है कि स्टॉक की कीमतें शायद इस तरह से मौसमी नहीं हैं ।
इसलिए, इस मामले में मुझे मौसमी अंतर को जोड़ने में संदेह होगा और मैं आगे की जांच करूंगा कि आपके गैर-मौसमी पूर्वानुमान का स्तर बहुत अधिक क्यों प्रतीत होता है (मैं अब तक आपके द्वारा पोस्ट की गई जानकारी से नहीं बता सकता हूं ) है।