기계 학습과 통계에서 샘플과 케이스의 차이점은 무엇입니까?

Aug 15 2020

나는에 그것을 발견 이 질문 하고 이 API 샘플 수단을 Keras의 API 상태 그 문서 등 통계의 경우 :

손실 함수에 가중치를 부여하는 데 사용되는 테스트 샘플에 대한 선택적 Numpy 가중치 배열입니다. 입력 샘플과 길이가 같은 플랫 (1D) Numpy 배열 (가중치와 샘플 사이의 1 : 1 매핑)을 전달하거나 시간 데이터의 경우 모양 (samples, sequence_length)이있는 2D 배열을 전달할 수 있습니다. ), 모든 샘플의 모든 시간 단계에 다른 가중치를 적용합니다. x가 데이터 세트 인 경우이 인수는 지원되지 않으며 대신 샘플 가중치를 x의 세 번째 요소로 전달합니다.

내가 이해하는 바와 같이, 여기에있는 샘플은 앞서 언급 한 질문의 샘플과 매우 잘 맞습니다. 그렇다면 내 질문은 왜 우리가 기계 학습의 샘플을 통계의 사례를 참조하는 것입니까? 통계에서 표본은 여러 사례를 손상 시키며 모집단의 일부입니다.

답변

2 RichardHardy Aug 15 2020 at 17:07

주된 설명은 단순히 다른 전통이라고 생각합니다. 그들은 다른 용어로 거의 무작위로 시작했으며 계속됩니다. 깊고 철학적 인 설명이 없다고 생각합니다. 그런데 통계 및 기계 학습 응용 분야의 용어도 분야에 따라 다릅니다. 일부 (생물학?) 는 통계적 문제를 위해 샘플 대신 샘플 을 사용할 수도 있습니다 . 도메인에서 용어를 복사하기 때문입니다.