機械学習と統計におけるサンプルとケースの違いは?

Aug 15 2020

この質問とKerasのこのAPIで、そのAPIのドキュメントに次のように記載されているように、サンプルは統計のケースを意味することがわかりました。

損失関数の重み付けに使用される、テストサンプルの重みのオプションのNumpy配列。入力サンプルと同じ長さのフラット(1D)Numpy配列(重みとサンプル間の1:1マッピング)を渡すか、時間データの場合は形状(samples、sequence_length)の2D配列を渡すことができます。 )、すべてのサンプルのすべてのタイムステップに異なる重みを適用します。xがデータセットの場合、この引数はサポートされません。代わりに、サンプルの重みをxの3番目の要素として渡します。

私が理解しているように、ここのサンプルは前述の質問のサンプルと非常によく一致しています。私の質問は、なぜ統計でケースを学習する機械のサンプルを参照するのですか?統計では、サンプルは複数のケースを危険にさらし、母集団の一部です。

回答

2 RichardHardy Aug 15 2020 at 17:07

主な説明は単に異なる伝統だと思います。彼らはほとんどランダムに異なる用語で始まり、ただ続けています。深い哲学的な説明はないと思います。ちなみに、統計や機械学習のアプリケーションの用語も分野によって異なります。一部の(生物学?)は、ドメインから用語をコピーするだけなので、統計上の問題にもサンプルの代わりにサンプルを使用する可能性があります。