Análise de dados com Tableau — Customer Centric Analytics usando K-means e modelo RFM
Histórico do Caso
O estudo de caso foi mais de 400 mil dados de nível transacional gerados por uma empresa de comércio eletrônico na China de fevereiro a abril de 2016. Os objetivos deste projeto são identificar clientes de alto valor que compram com menos com mais contribuição e chegar estratégias de marketing para melhorar a retenção de clientes e otimizar a lucratividade.
K-means e modelo RFM são os dois métodos que usei para explorar e analisar os dados no Tableau.
Como sempre, a preparação de dados é importante e garante a qualidade dos dados e resultados de alta precisão.
Exploração de dados e storytelling
Como agrupar clientes em grupos por dados fornecidos?
Como interpretar grupos de clusters para melhores decisões de negócios?
Agrupamento usando K-means
Aqui está o Tableau Viz usando o método K-means (interativo)
O cluster K-means é um algoritmo de aprendizado não supervisionado. Grupos de clusters podem ser definidos quantos quisermos se pudermos dar um significado a cada grupo de clusters.
Nesse caso, os dados foram separados em 10 grupos de clusters.
A virtualização foi aplicada no painel, ajudando-nos a entender os grupos de cluster e a identificar clientes de alto valor com mais eficácia e eficiência.
O gráfico de dispersão nos ajuda a virtualizar segmentos de diferentes tipos de comportamento do cliente. No gráfico de barras, no entanto, mostra que não há uma relação linear entre números de clientes e valores de gastos em grupos de conglomerados. Por outro lado, o mapa de calor mostra claramente os grupos de cluster de clientes de alto valor: Cluster 8, Cluster 10, Cluster 7 e Cluster 5.
Interpretações de grupos de clusters de alto valor
Esses grupos de clusters têm pelo menos US$ 500 em média por pedido transacional. Em termos do Cluster 8, o comportamento do cliente mostra que são mulheres de alta renda que pensam muito em sua qualidade de vida: 57% e 41% gastos com eletrodomésticos e bens de luxo, respectivamente. Equivalentemente, o Cluster 10 tende a ser semelhante ao Cluster 8, mas seu valor médio por pedido transacional é cerca de 33% menor que o Cluster 8.
Os grupos do Cluster 7 e Cluster 5 são mais propensos a uma família jovem que tem um bebê e gosta de atividades ao ar livre. Da mesma forma, mais de 40% de seus gastos são para o bem-estar da anfitriã.
Limitação de K-means
- Nem todos os grupos de clusters podem ser interpretados em insights de negócios. K-means não permite o desenvolvimento de um conjunto ideal de clusters e para resultados efetivos, você deve decidir sobre o cluster antes.
- Em nosso estudo de caso, vários clusters têm forte similaridade e outros têm dados insuficientes, o que é um obstáculo para uma interpretação mais aprofundada.
Aqui está o Tableau Viz usando o método de modelo RFM (interativo)
No entanto, o modelo RFM pode abordar as limitações do K-means devido ao conhecimento de negócios e realidade orientados para detalhes.
O que é o modelo RFM?
R refere-se à atualidade: quando foi a última atividade de gastos?
F refere-se à frequência: com que frequência eles compram?
M refere-se a monetária: quanta receita foi gerada?
Quantos grupos foram agrupados usando o modelo RFM? Por quê?
Usando o modelo RFM para agrupar dados em 5 grupos com base nas pontuações RFM. Contanto que você possa dar um significado aos seus dados, você pode definir grupos de clusters o quanto quiser. Nós, no entanto, estamos mais interessados nesses clientes de alto valor, especialmente os melhores clientes perdidos.
O que significa pontuação RFM?
As pontuações RFM consistem em três dígitos que incluem aspectos de atualidade, frequência e monetário. Cada escala de classificação é de 1 a 5. 1 refere-se ao máximo e 5 refere-se ao mínimo.
111, por exemplo, pode ser elaborado que o cliente que regularmente compra mercadorias em grandes quantidades de nós, é considerado “O Melhor Cliente” para nós.
Interpretações para o painel
O painel é interativo. Experimente clicar nos gráficos de dispersão ou clicar onde quer que se sinta fascinado. Além disso, para manter isso em mente, no canto inferior direito, há um filtro RFM Grouping.
O formulário de detalhes do cliente ajuda as partes interessadas a descobrir rapidamente a lista de determinado grupo de clusters. A perda de melhor cliente, por exemplo, é o alvo potencial onde as partes interessadas podem otimizar seu desempenho por meio de campanhas de promoção de marketing.
Identificar o comportamento do cliente é importante para uma empresa. O painel nos mostra que 996 melhores clientes definidos contribuíram com 42% das vendas totais em dois meses.
Projeto Takeaway
Este projeto me ajuda a entender como agrupar clientes usando o modelo K-means e RFM. Percebi que o K-means tem limitações quando a quantidade de dados é limitada. No entanto, o modelo RFM me ajuda a identificar grupos de clusters por comportamentos de clientes.
Podemos combinar os resultados de ambos os grupos de clusters no modelo K-means e RFM para obter mais insights de negócios e projetar diferentes estratégias de marketing para melhorar a retenção de clientes e maximizar a lucratividade.

