स्किकिट सीखें - Naïve Bayes के साथ वर्गीकरण
Nave बेयस तरीके एक मजबूत धारणा के साथ बेयस प्रमेय को लागू करने के आधार पर पर्यवेक्षित शिक्षण एल्गोरिदम का एक सेट है जो सभी भविष्यवक्ता एक-दूसरे के लिए स्वतंत्र होते हैं अर्थात किसी वर्ग में एक सुविधा की उपस्थिति उसी में किसी अन्य सुविधा की उपस्थिति से स्वतंत्र होती है कक्षा। यह भोली धारणा है यही वजह है कि इन तरीकों को नाओवे बेयस तरीके कहा जाता है।
बेयस प्रमेय में कक्षा की पूर्ववर्ती संभावना यानी लेबल की संभावना और कुछ देखी गई विशेषताओं को खोजने के लिए निम्नलिखित संबंध बताया गया है, $P\left(\begin{array}{c} Y\arrowvert features\end{array}\right)$।
$$P\left(\begin{array}{c} Y\arrowvert features\end{array}\right)=\left(\frac{P\lgroup Y\rgroup P\left(\begin{array}{c} features\arrowvert Y\end{array}\right)}{P\left(\begin{array}{c} features\end{array}\right)}\right)$$यहाँ, $P\left(\begin{array}{c} Y\arrowvert features\end{array}\right)$ वर्ग की पिछली संभावना है।
$P\left(\begin{array}{c} Y\end{array}\right)$ वर्ग की पूर्व संभावना है।
$P\left(\begin{array}{c} features\arrowvert Y\end{array}\right)$ संभावना है जो भविष्यवक्ता दी गई कक्षा की संभावना है।
$P\left(\begin{array}{c} features\end{array}\right)$ पूर्वसूचक की पूर्व संभावना है।
स्किटिट-लर्न अलग-अलग भोले बेयर्स के क्लासिफायर मॉडल प्रदान करता है, जैसे कि गाऊसी, बहुराष्ट्रीय, पूरक और बर्नौली। उनमें से सभी मुख्य रूप से उस धारणा से भिन्न होते हैं जो वे वितरण के संबंध में बनाते हैं$P\left(\begin{array}{c} features\arrowvert Y\end{array}\right)$ यानी भविष्यवक्ता द्वारा दी गई कक्षा की संभावना।
अनु क्रमांक | मॉडल वर्णन |
---|---|
1 | गौसियन नाओवे बेयस गाऊसी नाओवे बेयस क्लासिफायर मानता है कि प्रत्येक लेबल के डेटा को एक साधारण गाऊसी वितरण से खींचा जाता है। |
2 | बहुराष्ट्रीय Na Bayve Bayes यह मानता है कि सुविधाओं को एक साधारण बहुराष्ट्रीय वितरण से तैयार किया गया है। |
3 | बर्नौली नाओवे बेयस इस मॉडल में धारणा यह है कि प्रकृति में द्विआधारी (0s और 1s) की सुविधा है। बर्नौली नाओवे बेयस वर्गीकरण का एक अनुप्रयोग 'शब्दों के बैग' मॉडल के साथ पाठ वर्गीकरण है |
4 | पूरक Na Comve Bayes इसे मल्टीनोमियल बेयस क्लासिफायर द्वारा बनाई गई गंभीर मान्यताओं को सही करने के लिए डिज़ाइन किया गया था। असंतुलित डेटा सेट के लिए इस तरह का एनबी क्लासिफायरियर उपयुक्त है |
बिल्डिंग नाओवे बेयस क्लासिफायर
हम नैक्वे बेस क्लासिफायर को स्किकिट-लर्नकिट्स पर भी लागू कर सकते हैं। नीचे दिए गए उदाहरण में, हम GaussianNB को लागू कर रहे हैं और Scikit-leran के breast_cancer डाटासेट की फिटिंग कर रहे हैं।
उदाहरण
Import Sklearn
from sklearn.datasets import load_breast_cancer
from sklearn.model_selection import train_test_split
data = load_breast_cancer()
label_names = data['target_names']
labels = data['target']
feature_names = data['feature_names']
features = data['data']
print(label_names)
print(labels[0])
print(feature_names[0])
print(features[0])
train, test, train_labels, test_labels = train_test_split(
features,labels,test_size = 0.40, random_state = 42
)
from sklearn.naive_bayes import GaussianNB
GNBclf = GaussianNB()
model = GNBclf.fit(train, train_labels)
preds = GNBclf.predict(test)
print(preds)
उत्पादन
[
1 0 0 1 1 0 0 0 1 1 1 0 1 0 1 0 1 1 1 0 1 1 0 1 1 1 1
1 1 0 1 1 1 1 1 1 0 1 0 1 1 0 1 1 1 1 1 1 1 1 0 0 1 1
1 1 1 0 0 1 1 0 0 1 1 1 0 0 1 1 0 0 1 0 1 1 1 1 1 1 0
1 1 0 0 0 0 0 1 1 1 1 1 1 1 1 0 0 1 0 0 1 0 0 1 1 1 0
1 1 0 1 1 0 0 0 1 1 1 0 0 1 1 0 1 0 0 1 1 0 0 0 1 1 1
0 1 1 0 0 1 0 1 1 0 1 0 0 1 1 1 1 1 1 1 0 0 1 1 1 1 1
1 1 1 1 1 1 1 0 1 1 1 0 1 1 0 1 1 1 1 1 1 0 0 0 1 1 0
1 0 1 1 1 1 0 1 1 0 1 1 1 0 1 0 0 1 1 1 1 1 1 1 1 0 1
1 1 1 1 0 1 0 0 1 1 0 1
]
उपरोक्त आउटपुट में 0s और 1s की एक श्रृंखला होती है, जो मूल रूप से ट्यूमर वर्ग से घातक मूल्यों और सौम्य हैं।