Qual é o significado de random_state em train_test_split? [duplicado]
Qual é o significado de random_state = 0 nesta linha particular ??
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.25, random_state = 0)
Respostas
O estado aleatório é um parâmetro para corrigir a forma como os dados estão sendo amostrados. Portanto, se você quiser reproduzir o mesmo modelo, escolheu qualquer valor para random_state
e da próxima vez que executar seu código, obterá a mesma divisão de dados.
Por exemplo, você tem um list1=[1,2,3,4]
, digamos que você possa adicionar a ele um random_state
para permutação, para random_state=0
a lista1 será [2,3,4,1]
, random_state=2
pois poderia ser [3,1,4,2]
etc ... mesma coisa para X_train
X_test
etc ...
Cada número aleatório inserido dará uma divisão diferente.
random_state
simplesmente define uma semente para o gerador aleatório, de modo que as divisões do teste do trem sejam sempre determinísticas. Se você não definir uma semente, será diferente a cada vez.
documentação :
random_state
:int
,RandomState
instância ouNone
, opcional (padrão =None
)
Seint
,random_state
é a semente usada pelo gerador de números aleatórios; SeRandomState
instância,random_state
é o gerador de números aleatórios; SeNone
, o gerador de números aleatórios é aRandomState
instância usada pornp.random
.