Jakie jest znaczenie random_state w train_test_split? [duplikować]
Jakie jest znaczenie random_state = 0 w tym konkretnym wierszu?
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.25, random_state = 0)
Odpowiedzi
Stan losowy to parametr określający sposób próbkowania danych. Dlatego jeśli chcesz odtworzyć ten sam model, wybierz dowolną wartość random_state
i następnym razem, gdy uruchomisz kod, otrzymasz ten sam podział danych.
Przykład, że masz list1=[1,2,3,4]
, powiedzmy, że możesz dodać do niego a random_state
dla permutacji, ponieważ random_state=0
lista1 będzie [2,3,4,1]
, random_state=2
ponieważ może to być [3,1,4,2]
itp ... to samo dla X_train
X_test
itp ...
Każda wprowadzona liczba losowa da inny podział.
random_state
po prostu ustawia ziarno w generatorze losowym, aby podziały testu pociągu były zawsze deterministyczne. Jeśli nie ustawisz nasionka, za każdym razem jest ono inne.
dokumentacja :
random_state
:int
,RandomState
wystąpienie lubNone
opcjonalne (domyślnie =None
)
Jeśliint
,random_state
jest ziarnem używanym przez generator liczb losowych; JeśliRandomState
instancja,random_state
to generator liczb losowych; JeśliNone
generator liczb losowych jestRandomState
instancją używaną przeznp.random
.