ट्रेन_टेस्ट_स्प्लिट में random_state का महत्व क्या है? [डुप्लिकेट]

Nov 28 2020

इस विशेष पंक्ति में random_state = 0 का क्या महत्व है ??

X_train, X_test, y_train, y_test = train_test_split(X,  y, test_size = 0.25, random_state = 0)

जवाब

1 ombk Nov 28 2020 at 02:18

रैंडम राज्य डेटा को सैंपल करने के तरीके को ठीक करने के लिए एक पैरामीटर है। इसलिए, यदि आप उसी मॉडल को पुन: पेश करना चाहते हैं, जिसके लिए आप कोई मूल्य चुनते हैं random_stateऔर अगली बार जब आप अपना कोड चलाते हैं तो आपको समान डेटा स्प्लिट मिलेगा।

उदाहरण आपके पास है list1=[1,2,3,4], मान लीजिए कि आप इसे random_stateक्रमचय के लिए जोड़ सकते हैं , सूची 1 के लिए random_state=0होगा [2,3,4,1], क्योंकि random_state=2यह [3,1,4,2]आदि हो सकता है ... X_train X_testआदि के लिए एक ही बात ...

प्रत्येक यादृच्छिक संख्या जिसे आप इनपुट करते हैं, एक अलग विभाजन देगा।

seralouk Nov 28 2020 at 03:42

random_stateबस यादृच्छिक जनरेटर के लिए एक बीज सेट करता है, ताकि आपकी ट्रेन-परीक्षण विभाजन हमेशा नियतात्मक हो। यदि आप एक बीज निर्धारित नहीं करते हैं, तो यह हर बार अलग होता है।

प्रलेखन :

random_state: int, RandomStateउदाहरण या None, वैकल्पिक (डिफ़ॉल्ट = None)
यदि int, random_stateयादृच्छिक संख्या जनरेटर द्वारा उपयोग किया जाने वाला बीज है; अगर RandomStateउदाहरण के लिए, random_stateयादृच्छिक संख्या जनरेटर है; यदि None, यादृच्छिक संख्या जनरेटर RandomStateद्वारा उपयोग की जाने वाली आवृत्ति है np.random