Est-il logique de faire une analyse du panier de consommation avec des transactions regroupées par mois (ou semaine) ?
La plupart des articles sur Internet montrent l'analyse du panier de consommation en utilisant les données du supermarché (c'est-à-dire que les clients utilisent pour acheter beaucoup d'articles en une journée dans un supermarché), donc je pense qu'il est logique de regrouper les transactions par jour.
Dans mon travail, je fais une analyse du panier de consommation, mais comme la majorité des clients n'achètent que 2 ou 3 articles par jour, j'ai regroupé les données par mois (j'ai également essayé de regrouper par semaine). Au total, j'ai acheté 18 000 articles.
Ça a du sens?
Je l'ai fait pour avoir des règles plus importantes, comme$\{A\} \rightarrow \{B\}$, ou$\{A, B\} \rightarrow \{C\}$.
Obs. : J'utilise R (bibliothèque arules
).
Réponses
Je pense que l'exploration de modèles séquentiels pourrait être plus appropriée pour votre cas d'utilisation, vous pouvez donc recommander le prochain élément le plus probable dans la séquence. Sinon, utilisez peut-être tous les achats du client, quel que soit le moment. Les données sur une période de temps finie peuvent avoir un sens, mais dans votre cas, il semble que la coupure puisse être arbitraire. Si vous voulez emprunter cette voie, je ferais plus d'analyses de données exploratoires pour voir quelle période aurait du sens