การวิเคราะห์ข้อมูลด้วย Tableau — Customer Centric Analytics โดยใช้ K-means และโมเดล RFM
พื้นหลังของเคส
กรณีศึกษาคือข้อมูลระดับธุรกรรมมากกว่า 400,000 รายการที่สร้างขึ้นโดยบริษัทอีคอมเมิร์ซในประเทศจีนตั้งแต่เดือนกุมภาพันธ์ถึงเมษายน 2016 วัตถุประสงค์ของโครงการนี้คือการระบุลูกค้าที่มีมูลค่าสูงที่ซื้อด้วยเงินที่จ่ายน้อยกว่าและมีจำนวนมากที่สุด กลยุทธ์ทางการตลาดเพื่อปรับปรุงการรักษาลูกค้าและเพิ่มความสามารถในการทำกำไร
ค่าเฉลี่ย K และโมเดล RFM เป็นสองวิธีที่ฉันใช้ในการสำรวจและวิเคราะห์ข้อมูลใน Tableau
เช่นเคย การเตรียมข้อมูลเป็นสิ่งสำคัญและรับประกันคุณภาพของข้อมูลและผลลัพธ์ที่มีความแม่นยำสูง
การสำรวจข้อมูลและการเล่าเรื่อง
จะจัดกลุ่มลูกค้าเป็นกลุ่มตามข้อมูลที่กำหนดได้อย่างไร
จะตีความกลุ่มคลัสเตอร์เพื่อการตัดสินใจทางธุรกิจที่ดีขึ้นได้อย่างไร
การรวมกลุ่มโดยใช้ K-mean
นี่คือTableau Vizโดยใช้วิธี K-means (แบบโต้ตอบ)
K-means cluster เป็นอัลกอริทึมการเรียนรู้แบบไม่มีผู้ดูแล กลุ่มคลัสเตอร์สามารถตั้งค่าได้มากเท่าที่เราต้องการหากเราสามารถให้ความหมายแก่แต่ละกลุ่มคลัสเตอร์ได้
ในกรณีนี้ ข้อมูลถูกแยกออกเป็น 10 กลุ่มคลัสเตอร์
มีการใช้ Virtualization ในแดชบอร์ด ช่วยให้เราเข้าใจกลุ่มคลัสเตอร์และระบุลูกค้าที่มีคุณค่าสูงได้อย่างมีประสิทธิภาพและมีประสิทธิภาพมากขึ้น
กราฟกระจายช่วยให้เราจำลองเซกเมนต์ของพฤติกรรมลูกค้าประเภทต่างๆ ในรูปแบบเสมือนจริง อย่างไรก็ตาม ในแผนภูมิแท่ง แสดงว่าไม่มีความสัมพันธ์เชิงเส้นตรงระหว่างจำนวนลูกค้าและจำนวนค่าใช้จ่ายในกลุ่มคลัสเตอร์ ในทางกลับกัน แผนที่ความร้อนจะแสดงกลุ่มคลัสเตอร์ลูกค้าที่มีมูลค่าสูงอย่างชัดเจน: คลัสเตอร์ 8, คลัสเตอร์ 10, คลัสเตอร์ 7 และคลัสเตอร์ 5
การตีความของกลุ่มคลัสเตอร์ที่มีมูลค่าสูง
กลุ่มคลัสเตอร์เหล่านี้มีอย่างน้อย $500 โดยเฉลี่ยต่อคำสั่งการทำธุรกรรม ในแง่ของคลัสเตอร์ 8 พฤติกรรมของลูกค้าแสดงให้เห็นว่าพวกเธอเป็นผู้หญิงที่มีรายได้สูงและคำนึงถึงคุณภาพชีวิตของตนเองเป็นอย่างมาก โดย 57% และ 41% ใช้จ่ายกับเครื่องใช้ในบ้านและสินค้าฟุ่มเฟือยตามลำดับ ในทำนองเดียวกัน คลัสเตอร์ 10 มีแนวโน้มที่จะคล้ายกับคลัสเตอร์ 8 แต่จำนวนเงินเฉลี่ยต่อคำสั่งซื้อธุรกรรมต่ำกว่าคลัสเตอร์ 8 ประมาณ 33%
กลุ่มของคลัสเตอร์ 7 และคลัสเตอร์ 5 มีแนวโน้มที่จะเป็นครอบครัวเล็กที่มีทารกและชอบกิจกรรมกลางแจ้ง ในทำนองเดียวกัน ค่าใช้จ่ายกว่า 40% เป็นไปเพื่อความเป็นอยู่ที่ดีของเจ้าของที่พักหญิง
ข้อจำกัดของ K-mean
- กลุ่มคลัสเตอร์บางกลุ่มไม่สามารถตีความเป็นข้อมูลเชิงลึกทางธุรกิจได้ K-mean ไม่อนุญาตให้มีการพัฒนาชุดคลัสเตอร์ที่เหมาะสมที่สุด และเพื่อให้ได้ผลลัพธ์ที่มีประสิทธิภาพ คุณควรตัดสินใจเลือกคลัสเตอร์ก่อน
- ในกรณีศึกษาของเรา หลายกลุ่มมีความคล้ายคลึงกันอย่างมาก และกลุ่มอื่นๆ มีข้อมูลไม่เพียงพอ ซึ่งเป็นอุปสรรคในการตีความเพิ่มเติม
นี่คือTableau Vizโดยใช้วิธีแบบจำลอง RFM (แบบโต้ตอบ)
อย่างไรก็ตาม แบบจำลอง RFM สามารถแก้ไขข้อจำกัดของค่าเฉลี่ย K เนื่องจากการเน้นรายละเอียด ความรู้ทางธุรกิจ และความเป็นจริง
RFM Model คืออะไร?
R หมายถึงความใหม่: กิจกรรมการใช้จ่ายครั้งล่าสุดเมื่อใด
F หมายถึงความถี่: พวกเขาซื้อบ่อยแค่ไหน?
M หมายถึงตัวเงิน: สร้างรายได้เท่าไหร่?
มีกี่กลุ่มที่จัดกลุ่มโดยใช้โมเดล RFM ทำไม
การใช้โมเดล RFM เพื่อจัดกลุ่มข้อมูลออกเป็น 5 กลุ่มตามคะแนน RFM ตราบใดที่คุณสามารถสร้างความหมายให้กับข้อมูลของคุณ คุณสามารถตั้งค่ากลุ่มคลัสเตอร์ได้มากเท่าที่คุณต้องการ อย่างไรก็ตาม เราสนใจลูกค้าที่มีมูลค่าสูงเหล่านั้นมากกว่า โดยเฉพาะลูกค้าที่ดีที่สุดที่หายไป
คะแนน RFM หมายถึงอะไร?
คะแนน RFM ประกอบด้วยตัวเลขสามหลักซึ่งรวมถึงด้านความใหม่ ความถี่ และตัวเงิน แต่ละมาตราส่วนการให้คะแนนมีตั้งแต่ 1 ถึง 5 1 หมายถึงมากที่สุดและ 5 หมายถึงน้อยที่สุด
ตัวอย่างเช่น 111 สามารถอธิบายเพิ่มเติมได้ว่าลูกค้าที่ซื้อสินค้าจำนวนมากจากเราเป็นประจำถือเป็น "ลูกค้าที่ดีที่สุด" สำหรับเรา
การตีความสำหรับแดชบอร์ด
แดชบอร์ดเป็นแบบโต้ตอบ ลองคลิกแผนกระจายหรือคลิกที่ใดก็ได้ที่คุณรู้สึกทึ่ง นอกจากนี้ โปรดทราบว่าที่มุมขวาล่าง มีตัวกรองการจัดกลุ่ม RFM
แบบฟอร์มรายละเอียดลูกค้าช่วยให้ผู้มีส่วนได้เสียสามารถค้นหารายการสำหรับกลุ่มคลัสเตอร์บางกลุ่มได้อย่างรวดเร็ว ตัวอย่างเช่น การสูญเสียลูกค้าที่ดีที่สุด เป็นเป้าหมายที่เป็นไปได้ที่ผู้มีส่วนได้ส่วนเสียสามารถเพิ่มประสิทธิภาพการทำงานผ่านแคมเปญส่งเสริมการตลาด
การระบุพฤติกรรมของลูกค้ามีความสำคัญต่อธุรกิจ แดชบอร์ดแสดงให้เราเห็นว่า 996 รายกำหนดลูกค้าที่ดีที่สุดที่มีส่วนร่วม 42% ของยอดขายโดยรวมในช่วงสองเดือน
โครงการ Takeaway
โครงการนี้ช่วยให้ฉันเข้าใจวิธีจัดกลุ่มลูกค้าโดยใช้ K-means และโมเดล RFM ฉันรู้ว่าค่าเฉลี่ย K มีข้อจำกัดเมื่อปริมาณข้อมูลมีจำกัด อย่างไรก็ตาม โมเดล RFM ช่วยให้ฉันระบุกลุ่มคลัสเตอร์ตามพฤติกรรมของลูกค้าได้
เราสามารถรวมผลลัพธ์จากทั้งสองกลุ่มคลัสเตอร์ในโมเดล K-mean และ RFM เข้าด้วยกันเพื่อรับข้อมูลเชิงลึกทางธุรกิจเพิ่มเติม และออกแบบกลยุทธ์ทางการตลาดที่แตกต่างกันเพื่อปรับปรุงการรักษาลูกค้าและเพิ่มผลกำไรสูงสุด

