Perbedaan antara sampel dan kasus dalam pembelajaran mesin dan statistik?

Aug 15 2020

Saya menemukan bahwa dalam pertanyaan ini dan contoh API Keras ini berarti kasus dalam statistik karena dokumentasi API tersebut menyatakan bahwa:

Susunan bobot Numpy opsional untuk sampel uji, yang digunakan untuk memberi bobot pada fungsi kerugian. Anda dapat meneruskan larik Numpy datar (1D) dengan panjang yang sama dengan sampel masukan (pemetaan 1: 1 antara bobot dan sampel), atau dalam kasus data temporal, Anda dapat meneruskan larik 2D dengan bentuk (sampel, panjang_urutan ), untuk menerapkan bobot yang berbeda ke setiap langkah waktu setiap sampel. Argumen ini tidak didukung jika x adalah kumpulan data, sebagai gantinya berikan bobot sampel sebagai elemen ketiga dari x.

Seperti yang saya pahami, sampel di sini sangat selaras dengan yang ada di pertanyaan yang disebutkan di atas, lalu pertanyaan saya adalah mengapa kami merujuk ke sampel dalam pembelajaran mesin kasus dalam statistik? Dalam statistik, sampel mengkompromikan banyak kasus dan merupakan bagian dari populasi.

Jawaban

2 RichardHardy Aug 15 2020 at 17:07

Saya pikir penjelasan utamanya hanyalah tradisi yang berbeda. Mereka mulai secara acak dengan terminologi yang berbeda dan terus berlanjut. Saya kira tidak ada penjelasan filosofis yang dalam. Omong-omong, terminologi dalam aplikasi statistik dan pembelajaran mesin juga bervariasi di berbagai bidang; beberapa (biologi?) mungkin menggunakan sampel daripada sampel untuk masalah statistik juga, karena mereka hanya menyalin istilah dari domain mereka.