Ürün özelliğini elde tutma ayrıntılı incelemesi — MCC katsayısı
Geçen sefer, ürün özelliklerini kullanıcıları elde tutma üzerindeki etkilerine göre sıralamak için Bilgi kazancı metriğini kullandık.
Bilgi kazanımı , karar ağacı olarak adlandırılan makine öğrenimi algoritmasında kullanılan oldukça sağlam ve kullanışlı bir yaklaşımdır . Her bir ürün özelliğinin kullanıcıları 2 gruba ne kadar iyi ayırdığını ölçmeye yardımcı olur: elde tutulan ve kullanılmayan.
Önceki bir gönderide belirttiğim gibi, ürün özelliğinin elde tutma üzerindeki etkisini değerlendirmek istediğimizde her iki durumu da dikkate almamız gerekir :
- Özelliği kullanan ve elinde tutanların yüzdesi
- Gelecekte kullanmayan ve elde tutulmayan kullanıcı yüzdesi
Bir önceki yazıda bahsettiğim feature18'e dönelim .
feature18 , 3. en yüksek Bilgi kazancına sahiptir (0.0139) ancak dikkatli bakarsak şunu görürüz:
- feature18'i kullanan kullanıcıların kullanıcıyı elde tutma oranı = %7,4
- feature18'i kullanmayan kullanıcıların kullanıcı tutma oranı = %19,9
Makine öğrenimi açısından bu tamamen normaldir, ancak ürün analitiği açısından bakıldığında, kullanıcıların iade edilmemek yerine büyük olasılıkla ürüne geri döndüğü ürün özelliklerini kullanarak sıralamak istediğimiz gibi değil.
Bu sorunun üstesinden gelmek için MCC katsayısını kullanmanızı öneririm . Bu katsayı, iki ikili değişken için bir korelasyon katsayısıdır.
MM hesaplamasının birkaç çeşidi vardır, ancak ben bunu kullanmayı tercih ediyorum:
O halde MCC katsayısını hesaplayalım ve görselleştirelim.
Yukarıdaki tablo bize çok ilginç birkaç fikir veriyor:
- feature18 ve diğerleri negatif bir değere sahiptir.
- pek çok popüler ürün özelliği (birçok kullanıcı tarafından kullanılır) elde tutma üzerinde olumsuz bir etkiye sahiptir.
Bu popüler özelliklerde yanlış bir şey yok. Bunlar bir tür kurulum özellikleridir. Kullanıcılar bunları "ilk katılım" sırasında ürünü yapılandırmak için kullandı.
Bu ürün özellikleri, dönüşüm hunisinin üst kısmında göründüğünden (düşük niyetli çok sayıda kullanıcının olduğu yerlerde), kullanıcıyı elde tutma oranı oldukça düşüktür.
Şimdi doğrudan MCC katsayısı ile Bilgi kazancını karşılaştırmak için bir tablo oluşturalım .
Dikkatli bakarsak, [geri dönen kullanıcı yüzdesi prd] metriği ağırlıklı ortalamanın altında olduğunda MM katsayısının negatif olduğunu görebiliriz.
Bu nedenle, MM katsayısını kullanarak, ürün özelliklerini kullanıcıyı elde tutma üzerindeki olumlu etkilerine göre sıralamayı başardık . Ayrıca, kullanıcıyı elde tutma üzerinde oldukça olumsuz etkisi olan ürün özelliklerini belirlemeyi başardık .