ट्रेन_टेस्ट_स्प्लिट में random_state का महत्व क्या है? [डुप्लिकेट]
इस विशेष पंक्ति में random_state = 0 का क्या महत्व है ??
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.25, random_state = 0)
जवाब
रैंडम राज्य डेटा को सैंपल करने के तरीके को ठीक करने के लिए एक पैरामीटर है। इसलिए, यदि आप उसी मॉडल को पुन: पेश करना चाहते हैं, जिसके लिए आप कोई मूल्य चुनते हैं random_state
और अगली बार जब आप अपना कोड चलाते हैं तो आपको समान डेटा स्प्लिट मिलेगा।
उदाहरण आपके पास है list1=[1,2,3,4]
, मान लीजिए कि आप इसे random_state
क्रमचय के लिए जोड़ सकते हैं , सूची 1 के लिए random_state=0
होगा [2,3,4,1]
, क्योंकि random_state=2
यह [3,1,4,2]
आदि हो सकता है ... X_train
X_test
आदि के लिए एक ही बात ...
प्रत्येक यादृच्छिक संख्या जिसे आप इनपुट करते हैं, एक अलग विभाजन देगा।
random_state
बस यादृच्छिक जनरेटर के लिए एक बीज सेट करता है, ताकि आपकी ट्रेन-परीक्षण विभाजन हमेशा नियतात्मक हो। यदि आप एक बीज निर्धारित नहीं करते हैं, तो यह हर बार अलग होता है।
प्रलेखन :
random_state
:int
,RandomState
उदाहरण याNone
, वैकल्पिक (डिफ़ॉल्ट =None
)
यदिint
,random_state
यादृच्छिक संख्या जनरेटर द्वारा उपयोग किया जाने वाला बीज है; अगरRandomState
उदाहरण के लिए,random_state
यादृच्छिक संख्या जनरेटर है; यदिNone
, यादृच्छिक संख्या जनरेटरRandomState
द्वारा उपयोग की जाने वाली आवृत्ति हैnp.random
।