La differenza tra campione e caso nell'apprendimento automatico e nelle statistiche?

Aug 15 2020

Trovo che in questa domanda e in questa API di Keras un campione significhi un caso in statistica poiché la documentazione di quell'API afferma che:

Matrice di pesi Numpy opzionale per i campioni di prova, utilizzata per pesare la funzione di perdita. Puoi passare un array Numpy piatto (1D) con la stessa lunghezza dei campioni di input (mappatura 1: 1 tra pesi e campioni) o, nel caso di dati temporali, puoi passare un array 2D con forma (samples, sequence_length ), per applicare un peso diverso a ogni timestep di ogni campione. Questo argomento non è supportato quando x è un set di dati, passa invece i pesi campione come terzo elemento di x.

Da quanto ho capito, l'esempio qui si allinea molto bene con quello nella domanda di cui sopra, quindi la mia domanda è perché ci riferiamo a un campione di apprendimento automatico un caso in statistica? Nelle statistiche, un campione compromette più casi e fa parte di una popolazione.

Risposte

2 RichardHardy Aug 15 2020 at 17:07

Penso che la spiegazione principale sia semplicemente tradizioni diverse. Hanno iniziato praticamente in modo casuale con una terminologia diversa e continuano. Non credo che ci sia una spiegazione filosofica profonda. A proposito, anche la terminologia nelle applicazioni delle statistiche e dell'apprendimento automatico varia tra i campi; alcuni (biologia?) probabilmente usano campioni invece di sample anche per problemi statistici, poiché copiano semplicemente i termini dal loro dominio.