train_test_split에서 random_state의 중요성은 무엇입니까? [복제]
Nov 28 2020
이 특정 줄에서 random_state = 0 의 중요성은 무엇입니까 ??
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.25, random_state = 0)
답변
1 ombk Nov 28 2020 at 02:18
랜덤 상태는 데이터가 샘플링되는 방식을 수정하는 매개 변수입니다. 따라서 동일한 모델을 재현하려면 값을 선택 random_state
하고 다음에 코드를 실행할 때 동일한 데이터 분할을 얻습니다.
당신이이 예 list1=[1,2,3,4]
,하자 당신이 그것을에 추가 할 수있는 말 random_state
에 대한 순열에 대한 random_state=0
목록 1이 될 것입니다 [2,3,4,1]
위해, random_state=2
이 수 [3,1,4,2]
등 ...에 대한 같은 일 X_train
X_test
등 ...
입력 한 각 난수는 다른 분할을 제공합니다.
seralouk Nov 28 2020 at 03:42
random_state
난수 생성기에 시드를 설정하기 만하면 기차 테스트 분할이 항상 결정적입니다. 시드를 설정하지 않으면 매번 달라집니다.
문서 :
random_state
:int
,RandomState
인스턴스 또는None
, 옵션 (기본값 =None
)
의 경우int
,random_state
난수 생성기에 의해 사용되는 씨앗입니다RandomState
인스턴스 인 경우random_state
난수 생성기입니다. 이면None
난수 생성기가에서RandomState
사용 하는 인스턴스np.random
입니다.