Różnica między próbą a przypadkiem w uczeniu maszynowym i statystykach?

Aug 15 2020

Uważam, że w tym pytaniu i tym API Keras próbka oznacza przypadek w statystykach, ponieważ dokumentacja tego API stwierdza, że:

Opcjonalna tablica wag Numpy dla próbek testowych, używana do ważenia funkcji straty. Możesz przekazać płaską (1D) tablicę Numpy o tej samej długości co próbki wejściowe (mapowanie 1: 1 między wagami i próbkami) lub w przypadku danych czasowych możesz przekazać tablicę 2D z kształtem (próbki, długość_sekwencji ), aby przypisać inną wagę do każdego kroku czasowego każdej próbki. Ten argument nie jest obsługiwany, gdy x jest zbiorem danych, zamiast tego przekaż przykładowe wagi jako trzeci element x.

Jak rozumiem, próbka tutaj bardzo dobrze pokrywa się z tą w powyższym pytaniu, więc moje pytanie brzmi: dlaczego odnosimy się do próbki w uczeniu maszynowym przypadku w statystykach? W statystykach próbka naraża wiele przypadków i jest częścią populacji.

Odpowiedzi

2 RichardHardy Aug 15 2020 at 17:07

Myślę, że głównym wytłumaczeniem są po prostu różne tradycje. Zaczęli dość przypadkowo, używając innej terminologii i po prostu kontynuują. Myślę, że nie ma żadnego głębokiego, filozoficznego wyjaśnienia. Nawiasem mówiąc, terminologia dotycząca zastosowań statystyki i uczenia maszynowego również różni się w poszczególnych dziedzinach; niektórzy (biologia?) prawdopodobnie używają próbek zamiast próbek również do problemów statystycznych, ponieważ po prostu kopiują termin (y) ze swojej domeny.