Różnica między próbą a przypadkiem w uczeniu maszynowym i statystykach?
Uważam, że w tym pytaniu i tym API Keras próbka oznacza przypadek w statystykach, ponieważ dokumentacja tego API stwierdza, że:
Opcjonalna tablica wag Numpy dla próbek testowych, używana do ważenia funkcji straty. Możesz przekazać płaską (1D) tablicę Numpy o tej samej długości co próbki wejściowe (mapowanie 1: 1 między wagami i próbkami) lub w przypadku danych czasowych możesz przekazać tablicę 2D z kształtem (próbki, długość_sekwencji ), aby przypisać inną wagę do każdego kroku czasowego każdej próbki. Ten argument nie jest obsługiwany, gdy x jest zbiorem danych, zamiast tego przekaż przykładowe wagi jako trzeci element x.
Jak rozumiem, próbka tutaj bardzo dobrze pokrywa się z tą w powyższym pytaniu, więc moje pytanie brzmi: dlaczego odnosimy się do próbki w uczeniu maszynowym przypadku w statystykach? W statystykach próbka naraża wiele przypadków i jest częścią populacji.
Odpowiedzi
Myślę, że głównym wytłumaczeniem są po prostu różne tradycje. Zaczęli dość przypadkowo, używając innej terminologii i po prostu kontynuują. Myślę, że nie ma żadnego głębokiego, filozoficznego wyjaśnienia. Nawiasem mówiąc, terminologia dotycząca zastosowań statystyki i uczenia maszynowego również różni się w poszczególnych dziedzinach; niektórzy (biologia?) prawdopodobnie używają próbek zamiast próbek również do problemów statystycznych, ponieważ po prostu kopiują termin (y) ze swojej domeny.