Pembelajaran Mesin untuk Analisis Data

Pembelajaran mesin adalah subbidang ilmu komputer yang menangani tugas-tugas seperti pengenalan pola, visi komputer, pengenalan ucapan, analitik teks dan memiliki hubungan yang kuat dengan statistik dan pengoptimalan matematika. Aplikasi termasuk pengembangan mesin pencari, penyaringan spam, Optical Character Recognition (OCR) antara lain. Batasan antara data mining, pengenalan pola dan bidang pembelajaran statistik tidak jelas dan pada dasarnya semuanya mengacu pada masalah yang serupa.

Pembelajaran mesin dapat dibagi menjadi dua jenis tugas -

Pembelajaran yang Diawasi
Pembelajaran Tanpa Pengawasan

Pembelajaran yang Diawasi

Pembelajaran yang diawasi mengacu pada jenis masalah di mana ada data input yang didefinisikan sebagai matriks X dan kami tertarik untuk memprediksi respons y . Dimana X = {x ₁ , x ₂ ,…, x _n } memiliki n prediktor dan memiliki dua nilai y = {c ₁ , c ₂ } .

Contoh penerapannya adalah memprediksi kemungkinan pengguna web mengklik iklan menggunakan fitur demografis sebagai prediktor. Ini sering disebut untuk memprediksi rasio klik-tayang (CTR). Kemudian y = {klik, tidak - klik} dan prediktornya bisa berupa alamat IP yang digunakan, hari ia memasuki situs, kota pengguna, negara di antara fitur-fitur lain yang mungkin tersedia.

Pembelajaran Tanpa Pengawasan

Pembelajaran tanpa pengawasan berkaitan dengan masalah menemukan kelompok yang serupa dalam satu sama lain tanpa harus belajar dari kelas. Ada beberapa pendekatan untuk tugas mempelajari pemetaan dari prediktor hingga menemukan kelompok yang memiliki contoh serupa di setiap kelompok dan berbeda satu sama lain.

Contoh penerapan unsupervised learning adalah segmentasi pelanggan. Misalnya, dalam industri telekomunikasi, tugas umum adalah membagi pengguna menurut penggunaan yang mereka berikan untuk telepon. Ini akan memungkinkan departemen pemasaran untuk menargetkan setiap kelompok dengan produk yang berbeda.