Train_test_split'te random_state'in önemi nedir? [çiftleme]

Nov 28 2020

Bu belirli satırda random_state = 0'ın önemi nedir ?

X_train, X_test, y_train, y_test = train_test_split(X,  y, test_size = 0.25, random_state = 0)

Yanıtlar

1 ombk Nov 28 2020 at 02:18

Rastgele durum, verilerin örneklenme şeklini sabitleyen bir parametredir. Bu nedenle, aynı modeli yeniden üretmek istiyorsanız, herhangi bir değeri seçersiniz random_stateve kodunuzu bir dahaki sefer çalıştırdığınızda aynı veri bölüşümünü elde edersiniz.

Eğer bir var Örnek list1=[1,2,3,4], hadi bunu bir ekleyebileceğiniz söylemek random_stateiçin, permütasyon için random_state=0list1 olacak [2,3,4,1]için, random_state=2bu olabilir [3,1,4,2]vs ... için aynı şeyi X_train X_testvs ...

Girdiğiniz her rasgele sayı farklı bir bölme sağlayacaktır.

seralouk Nov 28 2020 at 03:42

random_statebasitçe rastgele oluşturucuya bir tohum ayarlar, böylece tren testi bölümleriniz her zaman belirleyicidir. Bir tohum belirlemezseniz, her seferinde farklıdır.

belgeler :

random_state: int, RandomStateörnek veya Noneisteğe bağlı (varsayılan = None)
If int, random_staterastgele sayı oluşturucu tarafından kullanılan tohumdur; Eğer RandomState, örneğin, random_staterasgele sayı üreteci; If None, rasgele sayı üreteci, RandomStatetarafından kullanılan örnektir np.random.