Der Unterschied zwischen Stichprobe und Fall beim maschinellen Lernen und in der Statistik?

Aug 15 2020

Ich finde, dass in dieser Frage und dieser API von Keras ein Beispiel einen Fall in der Statistik bedeutet, da in der Dokumentation dieser API Folgendes angegeben ist:

Optional Numpy Array von Gewichten für die Testproben, die zur Gewichtung der Verlustfunktion verwendet werden. Sie können entweder ein flaches (1D) Numpy-Array mit der gleichen Länge wie die eingegebenen Samples übergeben (1: 1-Zuordnung zwischen Gewichten und Samples) oder bei zeitlichen Daten ein 2D-Array mit Form (Samples, sequence_length) übergeben ), um jedem Zeitschritt jeder Probe ein anderes Gewicht zuzuweisen. Dieses Argument wird nicht unterstützt, wenn x ein Datensatz ist. Übergeben Sie stattdessen Stichprobengewichte als drittes Element von x.

Soweit ich weiß, stimmt die Stichprobe hier sehr gut mit der in der oben genannten Frage überein. Meine Frage ist dann, warum wir uns auf eine Stichprobe beim maschinellen Lernen eines Falles in der Statistik beziehen. In der Statistik gefährdet eine Stichprobe mehrere Fälle und ist Teil einer Population.

Antworten

2 RichardHardy Aug 15 2020 at 17:07

Ich denke, die Haupterklärung sind einfach unterschiedliche Traditionen. Sie begannen ziemlich zufällig mit unterschiedlicher Terminologie und fahren einfach fort. Ich glaube nicht, dass es eine tiefe, philosophische Erklärung gibt. Übrigens variiert die Terminologie in Anwendungen der Statistik und des maschinellen Lernens auch in den verschiedenen Bereichen. Einige (Biologie?) verwenden wahrscheinlich auch Stichproben anstelle von Stichproben für statistische Probleme, da sie nur die Begriffe aus ihrer Domäne kopieren.