Análisis de datos con Tableau: Customer Centric Analytics usando K-means y modelo RFM
Antecedentes del caso
El caso de estudio fue más de 400k datos de nivel transaccional generados por una empresa de comercio electrónico en China de febrero a abril de 2016. Los objetivos de este proyecto son identificar a los clientes de alto valor que compran con menos con la mayor contribución y llegar a estrategias de marketing para mejorar la retención de clientes y optimizar la rentabilidad.
K-means y el modelo RFM son los dos métodos que utilicé para explorar y analizar los datos en Tableau.
Como siempre, la preparación de datos es importante y garantiza la calidad de los datos y resultados de alta precisión.
Exploración de datos y narración de historias
¿Cómo agrupar a los clientes en grupos según los datos dados?
¿Cómo interpretar los grupos de clústeres para tomar mejores decisiones comerciales?
Agrupación usando K-means
Aquí está Tableau Viz usando el método K-means (interactivo)
El clúster K-means es un algoritmo de aprendizaje no supervisado. Los grupos de conglomerados se pueden establecer tantos como queramos si podemos dar un significado a cada grupo de conglomerados.
En este caso, los datos se separaron en 10 grupos de conglomerados.
Se aplicó la virtualización en el tablero, lo que nos ayudó a comprender los grupos de clústeres e identificar a los clientes de alto valor de manera más efectiva y eficiente.
El gráfico de dispersión nos ayuda a virtualizar segmentos de diferentes tipos de comportamiento del cliente. En el gráfico de barras, sin embargo, muestra que no existe una relación lineal entre el número de clientes y los montos de los gastos en los grupos de conglomerados. Por otro lado, el mapa de calor muestra claramente esos grupos de clústeres de clientes de alto valor: Clúster 8, Clúster 10, Clúster 7 y Clúster 5.
Interpretaciones de grupos de conglomerados de alto valor
Estos grupos de clúster tienen un promedio de al menos $500 por pedido transaccional. En términos del Clúster 8, el comportamiento de los clientes muestra que son mujeres de altos ingresos que piensan muy bien en su calidad de vida: 57% y 41% gastan en electrodomésticos y artículos de lujo respectivamente. De manera equivalente, el Grupo 10 tiende a ser similar al Grupo 8, pero su monto promedio por pedido transaccional es aproximadamente un 33% más bajo que el Grupo 8.
Los grupos del Clúster 7 y el Clúster 5 son más probables para una familia joven que tiene un bebé y le gustan las actividades al aire libre. Asimismo, más del 40% de sus gastos son para el bienestar de la anfitriona.
Limitación de K-medias
- No todos los grupos de clústeres se pueden interpretar en conocimientos empresariales. K-means no permite el desarrollo de un conjunto óptimo de clústeres y para obtener resultados efectivos, debe decidirse por el clúster antes.
- En nuestro estudio de caso, varios grupos tienen una gran similitud y otros tienen datos insuficientes, lo que es un obstáculo para una interpretación posterior.
Aquí está Tableau Viz usando el método de modelo RFM (interactivo)
Sin embargo, el modelo RFM puede abordar las limitaciones de K-means debido al conocimiento y la realidad empresarial orientados a los detalles.
¿Qué es el modelo RFM?
R se refiere a la antigüedad: ¿Cuándo fue la última actividad de gasto?
F se refiere a la frecuencia: ¿Con qué frecuencia compran?
M se refiere a monetario: ¿Cuántos ingresos se generaron?
¿Cuántos grupos se agruparon usando el modelo RFM? ¿Por qué?
Uso del modelo RFM para agrupar datos en 5 grupos según las puntuaciones de RFM. Siempre que pueda dar un significado a sus datos, puede establecer grupos de clústeres tanto como desee. Nosotros, sin embargo, estamos más interesados en aquellos clientes de alto valor, especialmente en Lost best clients.
¿Qué significa la puntuación RFM?
Los puntajes de RFM consisten en tres dígitos que incluyen aspectos de actualidad, frecuencia y dinero. Cada escala de calificación es del 1 al 5. 1 se refiere a lo máximo y 5 se refiere a lo mínimo.
111, por ejemplo, se puede elaborar que el cliente que regularmente nos compra productos en grandes cantidades, es considerado como "El mejor cliente" para nosotros.
Interpretaciones para el tablero
El tablero es interactivo. Intente hacer clic en los diagramas de dispersión o haga clic donde se sienta fascinado. Además, para tener eso en cuenta, en la esquina inferior derecha, hay un filtro de Agrupación RFM.
El formulario de detalles del cliente ayuda a las partes interesadas a encontrar rápidamente la lista de determinados grupos de clústeres. La pérdida del mejor cliente, por ejemplo, es el objetivo potencial donde las partes interesadas pueden optimizar su desempeño a través de campañas de promoción de marketing.
Identificar el comportamiento del cliente es importante para una empresa. El tablero nos muestra que 996 mejores clientes definidos contribuyeron con el 42 % de las ventas totales durante dos meses.
Proyecto para llevar
Este proyecto me ayuda a comprender cómo agrupar clientes utilizando K-means y el modelo RFM. Me di cuenta de que K-means tiene limitaciones cuando la cantidad de datos es limitada. Sin embargo, el modelo RFM me ayuda a identificar grupos de clústeres por comportamientos de clientes.
Podemos combinar los resultados de ambos grupos de clústeres en el modelo K-means y RFM para obtener más información comercial y diseñar diferentes estrategias de marketing para mejorar la retención de clientes y maximizar la rentabilidad.

