train_test_split에서 random_state의 중요성은 무엇입니까? [복제]

Nov 28 2020

이 특정 줄에서 random_state = 0 의 중요성은 무엇입니까 ??

X_train, X_test, y_train, y_test = train_test_split(X,  y, test_size = 0.25, random_state = 0)

답변

1 ombk Nov 28 2020 at 02:18

랜덤 상태는 데이터가 샘플링되는 방식을 수정하는 매개 변수입니다. 따라서 동일한 모델을 재현하려면 값을 선택 random_state하고 다음에 코드를 실행할 때 동일한 데이터 분할을 얻습니다.

당신이이 예 list1=[1,2,3,4],하자 당신이 그것을에 추가 할 수있는 말 random_state에 대한 순열에 대한 random_state=0목록 1이 될 것입니다 [2,3,4,1]위해, random_state=2이 수 [3,1,4,2]등 ...에 대한 같은 일 X_train X_test등 ...

입력 한 각 난수는 다른 분할을 제공합니다.

seralouk Nov 28 2020 at 03:42

random_state난수 생성기에 시드를 설정하기 만하면 기차 테스트 분할이 항상 결정적입니다. 시드를 설정하지 않으면 매번 달라집니다.

문서 :

random_state: int, RandomState인스턴스 또는 None, 옵션 (기본값 = None)
의 경우 int, random_state난수 생성기에 의해 사용되는 씨앗입니다 RandomState인스턴스 인 경우 random_state난수 생성기입니다. 이면 None난수 생성기가에서 RandomState사용 하는 인스턴스 np.random입니다.