Welche Bedeutung hat random_state in train_test_split? [Duplikat]
Welche Bedeutung hat random_state = 0 in dieser bestimmten Zeile?
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.25, random_state = 0)
Antworten
Der Zufallsstatus ist ein Parameter, mit dem festgelegt wird, wie die Daten abgetastet werden. Wenn Sie also dasselbe Modell reproduzieren möchten, für das Sie einen beliebigen Wert ausgewählt haben, random_state
und wenn Sie Ihren Code das nächste Mal ausführen, erhalten Sie dieselbe Datenaufteilung.
Beispiel Sie haben eine list1=[1,2,3,4]
, sagen wir, Sie können eine random_state
für die Permutation hinzufügen , denn random_state=0
die Liste1 wird sein [2,3,4,1]
, denn random_state=2
es könnte [3,1,4,2]
etc sein ... dasselbe für X_train
X_test
etc ...
Jede von Ihnen eingegebene Zufallszahl ergibt eine andere Aufteilung.
random_state
Setzt einfach einen Startwert auf den Zufallsgenerator, sodass Ihre Zugtestaufteilungen immer deterministisch sind. Wenn Sie keinen Startwert festlegen, ist dieser jedes Mal anders.
Dokumentation :
random_state
:int
,RandomState
Instanz oderNone
, optional (Standard =None
)
Ifint
,random_state
ist der vom Zufallszahlengenerator verwendete Startwert; WennRandomState
Instanz,random_state
ist der Zufallszahlengenerator; WennNone
, ist der ZufallszahlengeneratorRandomState
die vonnp.random
.