Analyse de données avec Tableau — Customer Centric Analytics utilisant K-means et le modèle RFM
Contexte de l'affaire
L'étude de cas portait sur plus de 400 000 données de niveau transactionnel générées par une entreprise de commerce électronique en Chine de février à avril 2016. Les objectifs de ce projet sont d'identifier les clients de grande valeur qui achètent avec le moins avec le plus de contribution et de proposer stratégies de marketing pour améliorer la fidélisation de la clientèle et optimiser la rentabilité.
K-means et le modèle RFM sont les deux méthodes que j'ai utilisées pour explorer et analyser les données dans Tableau.
Comme toujours, la préparation des données est importante et garantit la qualité des données et des résultats très précis.
Exploration de données et narration
Comment regrouper les clients en groupes selon des données données ?
Comment interpréter les groupes de clusters pour de meilleures décisions commerciales ?
Regroupement à l'aide de K-means
Voici le Tableau Viz utilisant la méthode K-means (interactif)
Le cluster K-means est un algorithme d'apprentissage non supervisé. Les groupes de clusters peuvent être définis autant que nous le voulons si nous pouvons donner une signification à chaque groupe de clusters.
Dans ce cas, les données ont été séparées en 10 groupes de clusters.
La virtualisation a été appliquée dans le tableau de bord, nous aidant à comprendre les groupes de clusters et à identifier les clients de grande valeur de manière plus efficace et efficiente.
Le nuage de points nous aide à virtualiser des segments de différents types de comportement des clients. Dans le graphique à barres, cependant, il montre qu'il n'y a pas de relation linéaire entre le nombre de clients et les montants des dépenses dans les groupes de grappes. D'autre part, la carte thermique montre clairement ces groupes de clusters de clients à forte valeur : cluster 8, cluster 10, cluster 7 et cluster 5.
Interprétations des groupes de clusters de grande valeur
Ces groupes de clusters ont au moins 500 $ en moyenne par commande transactionnelle. En ce qui concerne le cluster 8, le comportement des clients montre qu'il s'agit de femmes à revenu élevé qui accordent une grande importance à leur qualité de vie : 57 % et 41 % des dépenses en appareils électroménagers et en produits de luxe respectivement. De manière équivalente, le cluster 10 a tendance à être similaire au cluster 8, mais son montant moyen par commande transactionnelle est d'environ 33 % inférieur à celui du cluster 8.
Les groupes du cluster 7 et du cluster 5 sont plus susceptibles d'avoir une jeune famille qui a un bébé et aime les activités de plein air. De même, plus de 40% de ses dépenses sont destinées au bien-être de l'hôte féminin.
Limitation des K-means
- Tous les groupes de clusters ne peuvent pas être interprétés en informations commerciales. K-means ne permet pas le développement d'un ensemble optimal de clusters et pour des résultats efficaces, vous devez choisir le cluster avant.
- Dans notre étude de cas, plusieurs clusters ont une forte similarité, et d'autres ont des données insuffisantes, ce qui est un obstacle pour une interprétation ultérieure.
Voici le Tableau Viz utilisant la méthode du modèle RFM (interactif)
Cependant, le modèle RFM peut répondre aux limites des K-moyennes en raison de la connaissance et de la réalité axées sur les détails.
Qu'est-ce que le modèle RFM ?
R fait référence à la récence : à quand remonte la dernière activité de dépense ?
F fait référence à la fréquence : à quelle fréquence achètent-ils ?
M fait référence à monétaire : combien de revenus ont été générés ?
Combien de groupes ont été regroupés à l'aide du modèle RFM ? Pourquoi?
Utilisation du modèle RFM pour regrouper les données en 5 groupes en fonction des scores RFM. Tant que vous pouvez donner un sens à vos données, vous pouvez définir autant de groupes de clusters que vous le souhaitez. Néanmoins, nous sommes plus intéressés par ces clients de grande valeur, en particulier les meilleurs clients perdus.
Que signifie le score RFM ?
Les scores RFM se composent de trois chiffres qui incluent des aspects de récence, de fréquence et monétaires. Chaque échelle de notation va de 1 à 5. 1 correspond au plus et 5 au moins.
111, par exemple, il peut être élaboré que le client qui nous achète régulièrement des marchandises en grande quantité, est considéré comme « le meilleur client » pour nous.
Interprétations pour le tableau de bord
Le tableau de bord est interactif. Essayez de cliquer sur les nuages de points ou de cliquer là où vous vous sentez fasciné. De plus, pour garder cela à l'esprit, dans le coin inférieur droit, il y a un filtre de groupement RFM.
Le formulaire de détails du client aide les parties prenantes à trouver rapidement la liste de certains groupes de clusters. La perte du meilleur client, par exemple, est la cible potentielle où les parties prenantes peuvent optimiser ses performances grâce à des campagnes de promotion marketing.
Identifier le comportement du client est important pour une entreprise. Le tableau de bord nous montre que 996 meilleurs clients définis ont contribué à 42 % des ventes globales sur deux mois.
Projet à emporter
Ce projet m'aide à comprendre comment regrouper les clients à l'aide de K-means et du modèle RFM. J'ai réalisé que K-means a des limites lorsque la quantité de données est limitée. Cependant, le modèle RFM m'aide à identifier les groupes de clusters en fonction des comportements des clients.
Nous pouvons combiner les résultats des deux groupes de clusters dans le modèle K-means et RFM pour obtenir des informations commerciales supplémentaires et concevoir différentes stratégies marketing pour améliorer la fidélisation de la clientèle et maximiser la rentabilité.

