Análise de dados com Tableau — Customer Centric Analytics usando K-means e modelo RFM

Dec 02 2022
Histórico do caso O estudo de caso foi de mais de 400 mil dados de nível transacional gerados por uma empresa de comércio eletrônico na China de fevereiro a abril de 2016. Os objetivos deste projeto são identificar clientes de alto valor que compram com menos com mais contribuição e criar estratégias de marketing para melhorar a retenção de clientes e otimizar a lucratividade.

Histórico do Caso

O estudo de caso foi mais de 400 mil dados de nível transacional gerados por uma empresa de comércio eletrônico na China de fevereiro a abril de 2016. Os objetivos deste projeto são identificar clientes de alto valor que compram com menos com mais contribuição e chegar estratégias de marketing para melhorar a retenção de clientes e otimizar a lucratividade.

K-means e modelo RFM são os dois métodos que usei para explorar e analisar os dados no Tableau.

Como sempre, a preparação de dados é importante e garante a qualidade dos dados e resultados de alta precisão.

Exploração de dados e storytelling

Como agrupar clientes em grupos por dados fornecidos?

Como interpretar grupos de clusters para melhores decisões de negócios?

Agrupamento usando K-means

Aqui está o Tableau Viz usando o método K-means (interativo)

O cluster K-means é um algoritmo de aprendizado não supervisionado. Grupos de clusters podem ser definidos quantos quisermos se pudermos dar um significado a cada grupo de clusters.

Nesse caso, os dados foram separados em 10 grupos de clusters.

A virtualização foi aplicada no painel, ajudando-nos a entender os grupos de cluster e a identificar clientes de alto valor com mais eficácia e eficiência.

O gráfico de dispersão nos ajuda a virtualizar segmentos de diferentes tipos de comportamento do cliente. No gráfico de barras, no entanto, mostra que não há uma relação linear entre números de clientes e valores de gastos em grupos de conglomerados. Por outro lado, o mapa de calor mostra claramente os grupos de cluster de clientes de alto valor: Cluster 8, Cluster 10, Cluster 7 e Cluster 5.

Interpretações de grupos de clusters de alto valor

Esses grupos de clusters têm pelo menos US$ 500 em média por pedido transacional. Em termos do Cluster 8, o comportamento do cliente mostra que são mulheres de alta renda que pensam muito em sua qualidade de vida: 57% e 41% gastos com eletrodomésticos e bens de luxo, respectivamente. Equivalentemente, o Cluster 10 tende a ser semelhante ao Cluster 8, mas seu valor médio por pedido transacional é cerca de 33% menor que o Cluster 8.

Os grupos do Cluster 7 e Cluster 5 são mais propensos a uma família jovem que tem um bebê e gosta de atividades ao ar livre. Da mesma forma, mais de 40% de seus gastos são para o bem-estar da anfitriã.

Limitação de K-means

  1. Nem todos os grupos de clusters podem ser interpretados em insights de negócios. K-means não permite o desenvolvimento de um conjunto ideal de clusters e para resultados efetivos, você deve decidir sobre o cluster antes.
  2. Em nosso estudo de caso, vários clusters têm forte similaridade e outros têm dados insuficientes, o que é um obstáculo para uma interpretação mais aprofundada.

Aqui está o Tableau Viz usando o método de modelo RFM (interativo)

No entanto, o modelo RFM pode abordar as limitações do K-means devido ao conhecimento de negócios e realidade orientados para detalhes.

O que é o modelo RFM?

R refere-se à atualidade: quando foi a última atividade de gastos?

F refere-se à frequência: com que frequência eles compram?

M refere-se a monetária: quanta receita foi gerada?

Quantos grupos foram agrupados usando o modelo RFM? Por quê?

Usando o modelo RFM para agrupar dados em 5 grupos com base nas pontuações RFM. Contanto que você possa dar um significado aos seus dados, você pode definir grupos de clusters o quanto quiser. Nós, no entanto, estamos mais interessados ​​nesses clientes de alto valor, especialmente os melhores clientes perdidos.

O que significa pontuação RFM?

As pontuações RFM consistem em três dígitos que incluem aspectos de atualidade, frequência e monetário. Cada escala de classificação é de 1 a 5. 1 refere-se ao máximo e 5 refere-se ao mínimo.

111, por exemplo, pode ser elaborado que o cliente que regularmente compra mercadorias em grandes quantidades de nós, é considerado “O Melhor Cliente” para nós.

Interpretações para o painel

O painel é interativo. Experimente clicar nos gráficos de dispersão ou clicar onde quer que se sinta fascinado. Além disso, para manter isso em mente, no canto inferior direito, há um filtro RFM Grouping.

O formulário de detalhes do cliente ajuda as partes interessadas a descobrir rapidamente a lista de determinado grupo de clusters. A perda de melhor cliente, por exemplo, é o alvo potencial onde as partes interessadas podem otimizar seu desempenho por meio de campanhas de promoção de marketing.

Identificar o comportamento do cliente é importante para uma empresa. O painel nos mostra que 996 melhores clientes definidos contribuíram com 42% das vendas totais em dois meses.

Projeto Takeaway

Este projeto me ajuda a entender como agrupar clientes usando o modelo K-means e RFM. Percebi que o K-means tem limitações quando a quantidade de dados é limitada. No entanto, o modelo RFM me ajuda a identificar grupos de clusters por comportamentos de clientes.

Podemos combinar os resultados de ambos os grupos de clusters no modelo K-means e RFM para obter mais insights de negócios e projetar diferentes estratégias de marketing para melhorar a retenção de clientes e maximizar a lucratividade.