¿Cuál es el significado de random_state en train_test_split? [duplicar]
¿Cuál es el significado de random_state = 0 en esta línea en particular?
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.25, random_state = 0)
Respuestas
El estado aleatorio es un parámetro para corregir la forma en que se muestrean los datos. Por lo tanto, si desea reproducir el mismo modelo, elija cualquier valor random_state
y la próxima vez que ejecute su código obtendrá la misma división de datos.
Ejemplo tienes una list1=[1,2,3,4]
, digamos que se pueden agregar a una random_state
de permutación, para random_state=0
será la lista1 [2,3,4,1]
, para la random_state=2
que podría ser [3,1,4,2]
, etc ... lo mismo para X_train
X_test
etc ...
Cada número aleatorio que ingrese dará una división diferente.
random_state
simplemente establece una semilla para el generador aleatorio, de modo que sus divisiones de prueba de tren sean siempre deterministas. Si no establece una semilla, es diferente cada vez.
documentación :
random_state
:int
,RandomState
instancia oNone
, opcional (predeterminado =None
)
Siint
,random_state
es la semilla utilizada por el generador de números aleatorios; Si es elRandomState
caso,random_state
es el generador de números aleatorios; SiNone
, el generador de números aleatorios es laRandomState
instancia utilizada pornp.random
.