मौसमी अलग और ऑटो

Aug 16 2020

मैंने आर का उपयोग करके विभिन्न पूर्वानुमान एल्गोरिदम का अध्ययन करना शुरू कर दिया है। उदाहरण के रूप में, शायद सबसे अच्छा एक नहीं (मौसमी की कमी के कारण), मैं फेसबुक स्टॉक का उपयोग कर रहा हूं।

प्रशिक्षण सेट:

SYMBOL <- getSymbols("FB", from = "2015-01-01", to = "2019-12-31")
Stocks_FB_day <- get(SYMBOL[1])
Stocks_FB_day_Cl <- Cl(Stocks_FB_day)

परीक्षण सेट:

SYMBOL <- getSymbols("FB", from = "2020-01-01", to = "2020-01-21")
Stocks_FB_day <- get(SYMBOL[1])

मैंने ARIMA सहित विभिन्न मॉडल बनाए हैं। मुझे पता है कि यह दैनिक स्टॉक डेटा के लिए सबसे उपयुक्त नहीं है, हालांकि, मैंने इसे एक कोशिश देने का फैसला किया है। इस बात को ध्यान में रखते हुए कि प्रति वर्ष लगभग 252 अवलोकन होते हैं, मैंने stl()फ़ंक्शन और सेटिंग आवृत्तियों को 126 (आधा वर्ष) और 252 (एक पूर्ण वर्ष) के बराबर आवृत्तियों का उपयोग करके बनाया है । दोनों भूखंड बताते हैं कि मौसमी संकेत वास्तव में आवश्यक नहीं हैं। उनमें से एक यहां पर है:

यह ACF और PACF ग्राफ़ (शायद मैं गलत हूं?) से भी निष्कर्ष निकाला जा सकता है।

ये auto.arimaसमारोह के साथ मेरे प्रयोग हैं :

हर बार जब मैंने "डी = 1" लिखा था (चाहे आवृत्ति 252 या 126 थी), मौसमी अंतर को मजबूर करते हुए, मुझे उच्च एआईसी मान मिला, हालांकि, अधिक सटीक भविष्यवाणियां। मैं यह नहीं कह रहा हूं कि सपाट / लगभग समतल लाइनें प्राप्त करना उचित नहीं है, फिर भी, कभी-कभी आप अपने भविष्य के पूर्वानुमान के समग्र दिशा से अधिक जानना चाहते हैं यदि यह संभव है।

मुझे लगता है कि मैंने बहुत सारी गलतियाँ की हैं और यह बहुत संभव है कि संपूर्ण दृष्टिकोण बिल्कुल भी उचित न हो।

प्रमुख प्रश्न है:

"क्या यह उन मामलों में मौसमी भिन्नता (डी = 1) के लिए मजबूर करने के लिए समझ में आता है जब यह बेहतर पूर्वानुमान मान देता है (मैं उन्हें एक होल्ड-आउट सेट के साथ तुलना करता हूं, एमएपीई की गणना करता है, उदाहरण के लिए) भले ही यह अनावश्यक लगता हो, रखने के कारण तथ्य यह है कि मौसमी कमजोर है? "

जवाब

3 ChrisHaug Aug 16 2020 at 21:41

सामान्य सलाह के रूप में, आप अपने सामने मौजूद डेटा के बारे में बता सकते हैं कि क्या आपके पास विश्वसनीय पूर्व डोमेन ज्ञान है । इस मामले में, कि सामान्य रूप से शेयर बाजार के बारे में जानकारी होगी, या विशेष रूप से फेसबुक के व्यापार के बारे में ज्ञान होगा, जिसे आपने पहले शेयर मूल्य श्रृंखला से स्वतंत्र रूप से हासिल किया है जिसे आप देख रहे हैं।

लेकिन अगर डोमेन ज्ञान यह नहीं कहता है कि यह मौसमी होना चाहिए, और डेटा वास्तव में मौसमी नहीं दिखता है, और आप बेतरतीब ढंग से कहते हैं "हे, क्या होगा अगर मैंने मौसमी को मजबूर करने की कोशिश की?" और आप बेहतर नमूना परिणाम प्राप्त करते हैं, आपको निश्चित रूप से संदेह होना चाहिए कि क्या आपने वास्तव में अपने मॉडल को इस तरह से बेहतर बनाया है जो भविष्य में उपयोगी होगा। यह निश्चित रूप से संभव है कि डोमेन ज्ञान त्रुटिपूर्ण है, या कि मौसमी अंतर को जोड़ने से आपके मॉडल के साथ एक वास्तविक लेकिन असंबंधित समस्या ठीक हो गई है जिसे आप सीधे फिक्सिंग को बेहतर ठहरा सकते हैं।

मैं यहां बहुत से लोगों को देखता हूं जो पूर्वानुमान के बारे में सीख रहे हैं जो पहली परियोजना के रूप में स्टॉक की कीमतों की ओर इशारा करते हैं। दुर्भाग्य से, डोमेन की प्रकृति यह है कि, ARIMA मॉडल के वर्ग के भीतर, स्टॉक की कीमतें लगभग हमेशा सबसे अच्छे मॉडल के रूप में यादृच्छिक रूप से चलती हैं, इसलिए एक सीखने के दृष्टिकोण से बहुत दिलचस्प नहीं है। यह डोमेन की एक मौलिक संपत्ति है और यह भविष्य की कीमतों की कुल अपेक्षाओं के कारण है जो निवेशकों को संपत्ति खरीदने या बेचने के द्वारा मूल्य के भविष्य के मार्ग को संशोधित करने के लिए प्रभावित करते हैं। यह प्रतिक्रिया तंत्र किसी भी आसानी से प्रत्याशित कदम को आकर्षित करने के लिए जाता है, इसलिए आप आसानी से देख सकते हैं सभी शोर है।

स्टॉक की कीमतों में आमतौर पर इस कारण से एक मजबूत मौसमी पैटर्न नहीं होता है। यदि कम सीजन में खरीद कर और उच्च सीजन में बेचकर विश्वसनीय मुनाफा कमाना संभव था, तो हर कोई ऐसा करेगा। इससे निम्न सीजन में कीमत बढ़ जाती है, और उच्च सीजन में गिरावट के कारण, अंततः यह लाभ गायब हो जाता है। इस मामले में पूर्व डोमेन ज्ञान का कहना है कि स्टॉक की कीमतें शायद इस तरह से मौसमी नहीं हैं ।

इसलिए, इस मामले में मुझे मौसमी अंतर को जोड़ने में संदेह होगा और मैं आगे की जांच करूंगा कि आपके गैर-मौसमी पूर्वानुमान का स्तर बहुत अधिक क्यों प्रतीत होता है (मैं अब तक आपके द्वारा पोस्ट की गई जानकारी से नहीं बता सकता हूं ) है।