การวิเคราะห์ข้อมูลด้วย Tableau — Customer Centric Analytics โดยใช้ K-means และโมเดล RFM

Dec 02 2022

ความเป็นมา กรณีศึกษาคือข้อมูลระดับธุรกรรมมากกว่า 400,000 รายการที่สร้างขึ้นโดยบริษัทอีคอมเมิร์ซในประเทศจีนตั้งแต่เดือนกุมภาพันธ์ถึงเมษายน 2016 วัตถุประสงค์ของโครงการนี้คือการระบุลูกค้าที่มีมูลค่าสูงซึ่งซื้อด้วยเงินที่น้อยกว่าโดยมีส่วนร่วมมากที่สุดและเพื่อ กำหนดกลยุทธ์ทางการตลาดเพื่อปรับปรุงการรักษาลูกค้าและเพิ่มผลกำไร

พื้นหลังของเคส

กรณีศึกษาคือข้อมูลระดับธุรกรรมมากกว่า 400,000 รายการที่สร้างขึ้นโดยบริษัทอีคอมเมิร์ซในประเทศจีนตั้งแต่เดือนกุมภาพันธ์ถึงเมษายน 2016 วัตถุประสงค์ของโครงการนี้คือการระบุลูกค้าที่มีมูลค่าสูงที่ซื้อด้วยเงินที่จ่ายน้อยกว่าและมีจำนวนมากที่สุด กลยุทธ์ทางการตลาดเพื่อปรับปรุงการรักษาลูกค้าและเพิ่มความสามารถในการทำกำไร

ค่าเฉลี่ย K และโมเดล RFM เป็นสองวิธีที่ฉันใช้ในการสำรวจและวิเคราะห์ข้อมูลใน Tableau

เช่นเคย การเตรียมข้อมูลเป็นสิ่งสำคัญและรับประกันคุณภาพของข้อมูลและผลลัพธ์ที่มีความแม่นยำสูง

การสำรวจข้อมูลและการเล่าเรื่อง

จะจัดกลุ่มลูกค้าเป็นกลุ่มตามข้อมูลที่กำหนดได้อย่างไร

จะตีความกลุ่มคลัสเตอร์เพื่อการตัดสินใจทางธุรกิจที่ดีขึ้นได้อย่างไร

การรวมกลุ่มโดยใช้ K-mean

นี่คือTableau Vizโดยใช้วิธี K-means (แบบโต้ตอบ)

K-means cluster เป็นอัลกอริทึมการเรียนรู้แบบไม่มีผู้ดูแล กลุ่มคลัสเตอร์สามารถตั้งค่าได้มากเท่าที่เราต้องการหากเราสามารถให้ความหมายแก่แต่ละกลุ่มคลัสเตอร์ได้

ในกรณีนี้ ข้อมูลถูกแยกออกเป็น 10 กลุ่มคลัสเตอร์

มีการใช้ Virtualization ในแดชบอร์ด ช่วยให้เราเข้าใจกลุ่มคลัสเตอร์และระบุลูกค้าที่มีคุณค่าสูงได้อย่างมีประสิทธิภาพและมีประสิทธิภาพมากขึ้น

กราฟกระจายช่วยให้เราจำลองเซกเมนต์ของพฤติกรรมลูกค้าประเภทต่างๆ ในรูปแบบเสมือนจริง อย่างไรก็ตาม ในแผนภูมิแท่ง แสดงว่าไม่มีความสัมพันธ์เชิงเส้นตรงระหว่างจำนวนลูกค้าและจำนวนค่าใช้จ่ายในกลุ่มคลัสเตอร์ ในทางกลับกัน แผนที่ความร้อนจะแสดงกลุ่มคลัสเตอร์ลูกค้าที่มีมูลค่าสูงอย่างชัดเจน: คลัสเตอร์ 8, คลัสเตอร์ 10, คลัสเตอร์ 7 และคลัสเตอร์ 5

การตีความของกลุ่มคลัสเตอร์ที่มีมูลค่าสูง

กลุ่มคลัสเตอร์เหล่านี้มีอย่างน้อย $500 โดยเฉลี่ยต่อคำสั่งการทำธุรกรรม ในแง่ของคลัสเตอร์ 8 พฤติกรรมของลูกค้าแสดงให้เห็นว่าพวกเธอเป็นผู้หญิงที่มีรายได้สูงและคำนึงถึงคุณภาพชีวิตของตนเองเป็นอย่างมาก โดย 57% และ 41% ใช้จ่ายกับเครื่องใช้ในบ้านและสินค้าฟุ่มเฟือยตามลำดับ ในทำนองเดียวกัน คลัสเตอร์ 10 มีแนวโน้มที่จะคล้ายกับคลัสเตอร์ 8 แต่จำนวนเงินเฉลี่ยต่อคำสั่งซื้อธุรกรรมต่ำกว่าคลัสเตอร์ 8 ประมาณ 33%

กลุ่มของคลัสเตอร์ 7 และคลัสเตอร์ 5 มีแนวโน้มที่จะเป็นครอบครัวเล็กที่มีทารกและชอบกิจกรรมกลางแจ้ง ในทำนองเดียวกัน ค่าใช้จ่ายกว่า 40% เป็นไปเพื่อความเป็นอยู่ที่ดีของเจ้าของที่พักหญิง

ข้อจำกัดของ K-mean

กลุ่มคลัสเตอร์บางกลุ่มไม่สามารถตีความเป็นข้อมูลเชิงลึกทางธุรกิจได้ K-mean ไม่อนุญาตให้มีการพัฒนาชุดคลัสเตอร์ที่เหมาะสมที่สุด และเพื่อให้ได้ผลลัพธ์ที่มีประสิทธิภาพ คุณควรตัดสินใจเลือกคลัสเตอร์ก่อน
ในกรณีศึกษาของเรา หลายกลุ่มมีความคล้ายคลึงกันอย่างมาก และกลุ่มอื่นๆ มีข้อมูลไม่เพียงพอ ซึ่งเป็นอุปสรรคในการตีความเพิ่มเติม

นี่คือTableau Vizโดยใช้วิธีแบบจำลอง RFM (แบบโต้ตอบ)

อย่างไรก็ตาม แบบจำลอง RFM สามารถแก้ไขข้อจำกัดของค่าเฉลี่ย K เนื่องจากการเน้นรายละเอียด ความรู้ทางธุรกิจ และความเป็นจริง

RFM Model คืออะไร?

R หมายถึงความใหม่: กิจกรรมการใช้จ่ายครั้งล่าสุดเมื่อใด

F หมายถึงความถี่: พวกเขาซื้อบ่อยแค่ไหน?

M หมายถึงตัวเงิน: สร้างรายได้เท่าไหร่?

มีกี่กลุ่มที่จัดกลุ่มโดยใช้โมเดล RFM ทำไม

การใช้โมเดล RFM เพื่อจัดกลุ่มข้อมูลออกเป็น 5 กลุ่มตามคะแนน RFM ตราบใดที่คุณสามารถสร้างความหมายให้กับข้อมูลของคุณ คุณสามารถตั้งค่ากลุ่มคลัสเตอร์ได้มากเท่าที่คุณต้องการ อย่างไรก็ตาม เราสนใจลูกค้าที่มีมูลค่าสูงเหล่านั้นมากกว่า โดยเฉพาะลูกค้าที่ดีที่สุดที่หายไป

คะแนน RFM หมายถึงอะไร?

คะแนน RFM ประกอบด้วยตัวเลขสามหลักซึ่งรวมถึงด้านความใหม่ ความถี่ และตัวเงิน แต่ละมาตราส่วนการให้คะแนนมีตั้งแต่ 1 ถึง 5 1 หมายถึงมากที่สุดและ 5 หมายถึงน้อยที่สุด

ตัวอย่างเช่น 111 สามารถอธิบายเพิ่มเติมได้ว่าลูกค้าที่ซื้อสินค้าจำนวนมากจากเราเป็นประจำถือเป็น "ลูกค้าที่ดีที่สุด" สำหรับเรา

การตีความสำหรับแดชบอร์ด

แดชบอร์ดเป็นแบบโต้ตอบ ลองคลิกแผนกระจายหรือคลิกที่ใดก็ได้ที่คุณรู้สึกทึ่ง นอกจากนี้ โปรดทราบว่าที่มุมขวาล่าง มีตัวกรองการจัดกลุ่ม RFM

แบบฟอร์มรายละเอียดลูกค้าช่วยให้ผู้มีส่วนได้เสียสามารถค้นหารายการสำหรับกลุ่มคลัสเตอร์บางกลุ่มได้อย่างรวดเร็ว ตัวอย่างเช่น การสูญเสียลูกค้าที่ดีที่สุด เป็นเป้าหมายที่เป็นไปได้ที่ผู้มีส่วนได้ส่วนเสียสามารถเพิ่มประสิทธิภาพการทำงานผ่านแคมเปญส่งเสริมการตลาด

การระบุพฤติกรรมของลูกค้ามีความสำคัญต่อธุรกิจ แดชบอร์ดแสดงให้เราเห็นว่า 996 รายกำหนดลูกค้าที่ดีที่สุดที่มีส่วนร่วม 42% ของยอดขายโดยรวมในช่วงสองเดือน

โครงการ Takeaway

โครงการนี้ช่วยให้ฉันเข้าใจวิธีจัดกลุ่มลูกค้าโดยใช้ K-means และโมเดล RFM ฉันรู้ว่าค่าเฉลี่ย K มีข้อจำกัดเมื่อปริมาณข้อมูลมีจำกัด อย่างไรก็ตาม โมเดล RFM ช่วยให้ฉันระบุกลุ่มคลัสเตอร์ตามพฤติกรรมของลูกค้าได้

เราสามารถรวมผลลัพธ์จากทั้งสองกลุ่มคลัสเตอร์ในโมเดล K-mean และ RFM เข้าด้วยกันเพื่อรับข้อมูลเชิงลึกทางธุรกิจเพิ่มเติม และออกแบบกลยุทธ์ทางการตลาดที่แตกต่างกันเพื่อปรับปรุงการรักษาลูกค้าและเพิ่มผลกำไรสูงสุด