Анализ данных с помощью Tableau — Аналитика, ориентированная на клиента, с использованием K-средних и модели RFM

Dec 02 2022
Предыстория дела В тематическом исследовании использовалось более 400 000 данных на уровне транзакций, которые были сгенерированы компанией электронной коммерции в Китае с февраля по апрель 2016 года. разработать маркетинговые стратегии для улучшения удержания клиентов и оптимизации прибыльности.

Предыстория дела

Тематическое исследование представляло собой более 400 000 данных на уровне транзакций, которые были сгенерированы компанией электронной коммерции в Китае с февраля по апрель 2016 года. маркетинговые стратегии для улучшения удержания клиентов и оптимизации прибыльности.

K-средние и модель RFM — это два метода, которые я использовал для изучения и анализа данных в Tableau.

Как всегда, подготовка данных важна и обеспечивает качество данных и высокоточные результаты.

Исследование данных и рассказывание историй

Как сгруппировать клиентов в группы по заданным данным?

Как интерпретировать кластерные группы для принятия лучших бизнес-решений?

Кластеризация с использованием K-средних

Вот Tableau Viz с использованием метода K-средних (интерактивный)

Кластер K-средних — это алгоритм обучения без учителя. Кластерных групп можно установить столько, сколько мы хотим, если мы можем придать смысл каждой кластерной группе.

В этом случае данные были разделены на 10 кластерных групп.

На панели инструментов была применена виртуализация, которая помогла нам понять группы кластеров и более эффективно и результативно идентифицировать ценных клиентов.

Точечная диаграмма помогает нам виртуализировать сегменты различных типов поведения клиентов. Однако на гистограмме видно, что между количеством клиентов и суммами расходов в кластерных группах нет линейной зависимости. С другой стороны, тепловая карта четко показывает кластерные группы клиентов с высокой ценностью: Кластер 8, Кластер 10, Кластер 7 и Кластер 5.

Интерпретации кластерных групп высокой ценности

Эти кластерные группы имеют в среднем не менее 500 долларов США на транзакционный заказ. Что касается Кластера 8, поведение клиентов показывает, что это женщины с высоким доходом, которые высоко ценят качество своей жизни: 57% и 41% расходов на бытовую технику и предметы роскоши соответственно. Аналогично, Кластер 10 имеет тенденцию быть похожим на Кластер 8, но его средняя сумма за транзакционный заказ примерно на 33% ниже, чем у Кластера 8.

Группы Кластера 7 и Кластера 5 больше подходят для молодой семьи, в которой есть младенец и которая любит активный отдых. Точно так же более 40% его расходов приходится на благополучие принимающей женщины.

Ограничение K-средних

  1. Не все группы кластеров можно интерпретировать для получения бизнес-аналитики. K-средние не позволяют разработать оптимальный набор кластеров, и для получения эффективных результатов вам следует заранее определиться с кластером.
  2. В нашем примере несколько кластеров имеют сильное сходство, а по другим недостаточно данных, что является препятствием для дальнейшей интерпретации.

Вот Tableau Viz с использованием метода модели RFM (интерактивный)

Однако модель RFM может устранить ограничения K-средних из-за ориентированности на детали, бизнес-знаний и реальности.

Что такое RFM-модель?

R относится к давности: когда в последний раз были расходы?

F относится к частоте: как часто они покупают?

M относится к денежному выражению: какой доход был получен?

Сколько групп было сгруппировано с использованием модели RFM? Почему?

Использование модели RFM для кластеризации данных в 5 групп на основе оценок RFM. Пока вы можете придать смысл своим данным, вы можете устанавливать группы кластеров столько, сколько хотите. Мы, тем не менее, больше заинтересованы в тех ценных клиентах, особенно в потерянных лучших клиентах.

Что означает оценка RFM?

Баллы RFM состоят из трех цифр, которые включают аспекты новизны, частоты и денежного обращения. Каждая шкала оценивается от 1 до 5. 1 соответствует большему, а 5 соответствует меньшему.

111, например, можно уточнить, что клиент, который регулярно покупает у нас товары в больших количествах, считается для нас «Лучшим клиентом».

Интерпретации для приборной панели

Приборная панель интерактивна. Попробуйте щелкнуть точечный график или щелкнуть там, где вы чувствуете себя очарованным. Кроме того, чтобы помнить об этом, в правом нижнем углу есть фильтр группировки RFM.

Форма сведений о клиенте помогает заинтересованным сторонам быстро узнать список для определенной кластерной группы. Потеря лучшего клиента, например, является потенциальной целью, где заинтересованные стороны могут оптимизировать свои показатели с помощью маркетинговых кампаний по продвижению.

Для бизнеса важно определить поведение клиента. Приборная панель показывает нам, что 996 лучших клиентов принесли 42% от общего объема продаж за два месяца.

Проект на вынос

Этот проект помогает мне понять, как группировать клиентов с помощью K-средних и модели RFM. Я понял, что K-means имеет ограничения, когда количество данных ограничено. Однако модель RFM помогает мне идентифицировать группы кластеров по поведению клиентов.

Мы можем объединить результаты обеих кластерных групп в модели K-средних и RFM для дальнейшего понимания бизнеса и разработки различных маркетинговых стратегий для улучшения удержания клиентов и максимизации прибыльности.