Analisis data dengan Tableau — Customer Centric Analytics menggunakan model K-means dan RFM
Latar Belakang Kasus
Studi kasusnya adalah 400k+ data tingkat transaksional yang dihasilkan oleh perusahaan e-niaga di Tiongkok dari Februari hingga April 2016. Tujuan dari proyek ini adalah untuk mengidentifikasi pelanggan bernilai tinggi yang membeli dengan harga lebih rendah dengan kontribusi terbanyak dan untuk menghasilkan strategi pemasaran untuk meningkatkan retensi pelanggan dan untuk mengoptimalkan profitabilitas.
Model K-means dan RFM adalah dua metode yang saya gunakan untuk mengeksplorasi dan menganalisis data di Tableau.
Seperti biasa, persiapan data penting dan memastikan kualitas data dan hasil yang sangat akurat.
Eksplorasi Data dan Bercerita
Bagaimana mengelompokkan pelanggan ke dalam kelompok berdasarkan data yang diberikan?
Bagaimana menafsirkan kelompok klaster untuk keputusan bisnis yang lebih baik?
Pengelompokan menggunakan K-means
Inilah Tableau Viz menggunakan metode K-means (interaktif)
K-means cluster adalah algoritma pembelajaran tanpa pengawasan. Grup cluster dapat diatur sebanyak yang kita inginkan jika kita dapat memberi arti pada setiap grup cluster.
Dalam hal ini, data dipisahkan menjadi 10 kelompok cluster.
Virtualisasi diterapkan di dasbor, membantu kami memahami grup klaster dan mengidentifikasi pelanggan bernilai tinggi secara lebih efektif dan efisien.
Grafik pencar membantu kami memvirtualisasikan segmen dari berbagai jenis perilaku pelanggan. Namun pada diagram batang terlihat bahwa tidak terdapat hubungan linier antara jumlah pelanggan dan jumlah pengeluaran dalam kelompok klaster. Di sisi lain, heat map dengan jelas menunjukkan kelompok klaster pelanggan bernilai tinggi tersebut: Klaster 8, Klaster 10, Klaster 7 & Klaster 5.
Interpretasi kelompok cluster bernilai tinggi
Grup klaster ini memiliki setidaknya $500 rata-rata per pesanan transaksional. Dalam Klaster 8, perilaku pelanggan menunjukkan bahwa mereka adalah wanita berpenghasilan tinggi yang sangat memikirkan kualitas hidup mereka: masing-masing 57% dan 41% pengeluaran untuk peralatan rumah tangga dan barang mewah. Secara ekuivalen, Cluster 10 cenderung mirip dengan Cluster 8, tetapi jumlah rata-rata per pesanan transaksionalnya sekitar 33% lebih rendah dari Cluster 8.
Kelompok Kluster 7 dan Kluster 5 lebih cenderung pada keluarga muda yang memiliki balita dan menyukai aktivitas di luar ruangan. Demikian pula, lebih dari 40% pengeluarannya adalah untuk kesejahteraan inang betina.
Batasan K-means
- Tidak semua kelompok klaster dapat diinterpretasikan menjadi business insight. K-means tidak mengizinkan pengembangan kumpulan kluster yang optimal dan untuk hasil yang efektif, Anda harus memutuskan kluster sebelumnya.
- Dalam studi kasus kami, beberapa cluster memiliki kesamaan yang kuat, dan yang lainnya memiliki data yang tidak mencukupi, yang menjadi kendala untuk interpretasi lebih lanjut.
Inilah Tableau Viz menggunakan metode model RFM (interaktif)
Namun, model RFM dapat mengatasi keterbatasan K-means karena berorientasi pada detail, pengetahuan bisnis, dan kenyataan.
Apa itu model RFM?
R mengacu pada kebaruan: Kapan aktivitas pengeluaran terakhir?
F mengacu pada frekuensi: Seberapa sering mereka membeli?
M mengacu pada moneter: Berapa banyak pendapatan yang dihasilkan?
Berapa banyak kelompok yang dikelompokkan menggunakan model RFM? Mengapa?
Menggunakan model RFM untuk mengelompokkan data menjadi 5 kelompok berdasarkan skor RFM. Selama Anda dapat membuat data Anda berarti, Anda dapat mengatur grup cluster sebanyak yang Anda inginkan. Kami, bagaimanapun, lebih tertarik pada pelanggan bernilai tinggi itu, terutama kehilangan pelanggan terbaik.
Apa arti skor RFM?
Skor RFM terdiri dari tiga digit yang mencakup aspek kemutakhiran, frekuensi, dan moneter. Setiap skala penilaian adalah dari 1 sampai 5. 1 mengacu pada yang terbanyak dan 5 mengacu pada yang kurang.
111, misalnya, dapat dijelaskan bahwa klien yang secara rutin membeli barang dalam jumlah besar dari kami, dianggap sebagai “Pelanggan Terbaik” bagi kami.
Interpretasi untuk dasbor
Dasbor bersifat interaktif. Coba klik plot pencar atau klik di mana pun Anda merasa tertarik. Juga, untuk diingat, di pojok kanan bawah, ada filter Pengelompokan RFM.
Formulir detail pelanggan membantu pemangku kepentingan untuk mengetahui daftar grup klaster tertentu dengan cepat. Loss best customer, misalnya, merupakan target potensial dimana stakeholder dapat mengoptimalkan kinerjanya melalui kampanye promosi pemasaran.
Untuk mengidentifikasi perilaku pelanggan penting untuk bisnis. Dasbor menunjukkan kepada kita bahwa 996 pelanggan terbaik yang ditentukan memberikan kontribusi 42% dari keseluruhan penjualan selama dua bulan.
Pengambilan Proyek
Proyek ini membantu saya memahami cara mengelompokkan pelanggan menggunakan model K-means dan RFM. Saya menyadari bahwa K-means memiliki keterbatasan ketika kuantitas data terbatas. Namun, model RFM membantu saya mengidentifikasi grup klaster berdasarkan perilaku pelanggan.
Kami dapat menggabungkan output dari kedua grup klaster dalam model K-means dan RFM secara bersamaan untuk wawasan bisnis lebih lanjut dan merancang strategi pemasaran yang berbeda untuk meningkatkan retensi pelanggan dan memaksimalkan profitabilitas.

