मशीन लर्निंग - प्रदर्शन मेट्रिक्स
विभिन्न मीट्रिक हैं जिनका उपयोग हम एमएल एल्गोरिदम, वर्गीकरण और साथ ही प्रतिगमन एल्गोरिदम के प्रदर्शन का मूल्यांकन करने के लिए कर सकते हैं। एमएल प्रदर्शन का मूल्यांकन करने के लिए हमें सावधानीपूर्वक चयन करना चाहिए क्योंकि -
एमएल एल्गोरिदम का प्रदर्शन कैसे मापा जाता है और इसकी तुलना पूरी तरह से आपके द्वारा चुनी गई मीट्रिक पर निर्भर होगी।
आप परिणाम में विभिन्न विशेषताओं के महत्व को किस तरह से मापते हैं, यह आपके द्वारा चुने गए मीट्रिक से पूरी तरह प्रभावित होगा।
वर्गीकरण समस्याओं के लिए प्रदर्शन मेट्रिक्स
हमने पिछले अध्यायों में वर्गीकरण और इसके एल्गोरिदम पर चर्चा की है। यहां, हम विभिन्न प्रदर्शन मेट्रिक्स पर चर्चा करने जा रहे हैं जिनका उपयोग वर्गीकरण समस्याओं के लिए भविष्यवाणियों के मूल्यांकन के लिए किया जा सकता है।
असमंजस का जाल
यह एक वर्गीकरण समस्या के प्रदर्शन को मापने का सबसे आसान तरीका है जहां आउटपुट दो या अधिक प्रकार की कक्षाओं का हो सकता है। एक भ्रम मैट्रिक्स कुछ नहीं है, लेकिन दो आयामों वाली एक तालिका है। "वास्तविक" और "पूर्वानुमानित" और इसके बाद, दोनों आयामों में "ट्रू पॉज़िटिव्स (टीपी)", "ट्रू नेगेटिव्स (टीएन)", "गलत पॉज़िटिव्स (एफपी)", "गलत नकारात्मक (एफएन)" जैसा कि नीचे दिखाया गया है।
भ्रम मैट्रिक्स से जुड़े शब्दों की व्याख्या इस प्रकार है -
True Positives (TP) - यह तब होता है जब डेटा बिंदु का वास्तविक वर्ग और अनुमानित कक्षा दोनों 1 है।
True Negatives (TN) - यह मामला है जब वास्तविक बिंदु और अनुमानित बिंदु दोनों डेटा बिंदु 0 है।
False Positives (FP) - ऐसा तब होता है जब डेटा बिंदु का वास्तविक वर्ग 0 होता है और डेटा बिंदु का अनुमानित वर्ग 1 होता है।
False Negatives (FN) - यह तब होता है जब डेटा बिंदु का वास्तविक वर्ग 1 होता है और डेटा बिंदु का अनुमानित वर्ग 0 होता है।
हम अपने वर्गीकरण मॉडल के कन्फ्यूजन मैट्रिक्स की गणना करने के लिए sklearn.metrics के confusion_matrix फ़ंक्शन का उपयोग कर सकते हैं।
वर्गीकरण सटीकता
यह वर्गीकरण एल्गोरिदम के लिए सबसे आम प्रदर्शन मीट्रिक है। इसे सही भविष्यवाणियों की संख्या के रूप में परिभाषित किया जा सकता है जो सभी पूर्वानुमानों के अनुपात के रूप में किए गए हैं। हम निम्न सूत्र की सहायता से भ्रम मैट्रिक्स द्वारा आसानी से गणना कर सकते हैं -
$ $ सटीकता = \ frac {TP + TN} {+++} $$हम अपने वर्गीकरण मॉडल की सटीकता की गणना करने के लिए sklearn.metrics के सटीकता_score फ़ंक्शन का उपयोग कर सकते हैं।
वर्गीकरण रिपोर्ट
इस रिपोर्ट में Precisions, Recall, F1 और Support के स्कोर शामिल हैं। उन्हें इस प्रकार समझाया गया है -
शुद्धता
दस्तावेज़ पुनर्प्राप्ति में प्रयुक्त परिशुद्धता, को हमारे एमएल मॉडल द्वारा लौटाए गए सही दस्तावेजों की संख्या के रूप में परिभाषित किया जा सकता है। हम निम्न सूत्र की सहायता से भ्रम मैट्रिक्स द्वारा आसानी से गणना कर सकते हैं -
$$ प्रेसिजन = \ frac {टी.पी.} {टी.पी. + एफपी} $$स्मरण या संवेदनशीलता
हमारे एमएल मॉडल द्वारा दी गई सकारात्मकता की संख्या के रूप में याद किया जा सकता है। हम निम्न सूत्र की सहायता से भ्रम मैट्रिक्स द्वारा आसानी से गणना कर सकते हैं -
$ $ याद = \ frac {TP} {TP + FN} $ $विशेषता
याद के विपरीत, विशिष्टता, हमारे एमएल मॉडल द्वारा लौटाई गई नकारात्मक की संख्या के रूप में परिभाषित की जा सकती है। हम निम्न सूत्र की सहायता से भ्रम मैट्रिक्स द्वारा आसानी से गणना कर सकते हैं -
$ $ विशिष्टता = \ frac {TN} {TN + FP} $ $सहयोग
समर्थन को सही प्रतिक्रिया के नमूनों की संख्या के रूप में परिभाषित किया जा सकता है जो लक्ष्य मानों के प्रत्येक वर्ग में निहित हैं।
एफ 1 स्कोर
यह स्कोर हमें सटीक और स्मरण का हार्मोनिक साधन देगा। गणितीय रूप से, F1 स्कोर सटीक और रिकॉल का भारित औसत है। F1 का सबसे अच्छा मूल्य 1 होगा और सबसे खराब 0. हम निम्न सूत्र की मदद से F1 स्कोर की गणना कर सकते हैं -
= = (∗) / (+)
एफ 1 स्कोर सटीक और याद के बराबर सापेक्ष योगदान दे रहा है।
हम अपने वर्गीकरण मॉडल की वर्गीकरण रिपोर्ट प्राप्त करने के लिए sklearn.metrics के वर्गीकरण_ उपयोग कर सकते हैं।
एयूसी (आरओसी वक्र के तहत क्षेत्र)
AUC (एरिया अंडर कर्व) -ROC (रिसीवर ऑपरेटिंग कैरेक्टरिस्टिक) एक प्रदर्शन मीट्रिक है, जो वर्गीकरण समस्याओं के लिए अलग-अलग सीमा मूल्यों पर आधारित है। जैसा कि नाम से पता चलता है, आरओसी एक संभावना वक्र है और एयूसी पृथक्करण को मापता है। सरल शब्दों में, AUC-ROC मीट्रिक हमें कक्षाओं को अलग करने में मॉडल की क्षमता के बारे में बताएगी। उच्च एयूसी, बेहतर मॉडल।
गणितीय रूप से, इसे विभिन्न दहलीज मूल्यों पर TPR (ट्रू पॉजिटिव रेट) यानी संवेदनशीलता या रिकॉल बनाम FPR (फाल्स पॉजिटिव रेट) यानी 1-स्पेसिफिकेशन की साजिश रचकर बनाया जा सकता है। निम्नलिखित ग्राफ में ROC, AUC का Y- अक्ष पर TPR और X- अक्ष पर FPR दर्शाया गया है -
हम AUC-ROC की गणना करने के लिए sklearn.metrics के roc_auc_score फ़ंक्शन का उपयोग कर सकते हैं।
LOGLOSS (लघुगणक हानि)
इसे लॉजिस्टिक रिग्रेशन लॉस या क्रॉस-एन्ट्रापी लॉस भी कहा जाता है। यह मूल रूप से संभाव्यता अनुमानों पर परिभाषित किया गया है और एक वर्गीकरण मॉडल के प्रदर्शन को मापता है जहां इनपुट 0 और 1 के बीच एक संभाव्यता मूल्य है। इसे सटीकता के साथ विभेदित करके अधिक स्पष्ट रूप से समझा जा सकता है। जैसा कि हम जानते हैं कि सटीकता हमारे मॉडल में भविष्यवाणियों (अनुमानित मूल्य = वास्तविक मूल्य) की गिनती है, जबकि लॉग लॉस हमारी भविष्यवाणी की अनिश्चितता की मात्रा है जो वास्तविक लेबल से भिन्न होता है। लॉग लॉस मान की सहायता से, हम अपने मॉडल के प्रदर्शन के बारे में अधिक सटीक विचार रख सकते हैं। हम लॉग नुकसान की गणना करने के लिए sklearn.metrics के log_loss फ़ंक्शन का उपयोग कर सकते हैं।
उदाहरण
निम्नलिखित पायथन में एक सरल नुस्खा है, जो हमें इस बारे में जानकारी देगा कि हम उपर्युक्त प्रदर्शन मेट्रिक्स का उपयोग कैसे कर सकते हैं।
from sklearn.metrics import confusion_matrix
from sklearn.metrics import accuracy_score
from sklearn.metrics import classification_report
from sklearn.metrics import roc_auc_score
from sklearn.metrics import log_loss
X_actual = [1, 1, 0, 1, 0, 0, 1, 0, 0, 0]
Y_predic = [1, 0, 1, 1, 1, 0, 1, 1, 0, 0]
results = confusion_matrix(X_actual, Y_predic)
print ('Confusion Matrix :')
print(results)
print ('Accuracy Score is',accuracy_score(X_actual, Y_predic))
print ('Classification Report : ')
print (classification_report(X_actual, Y_predic))
print('AUC-ROC:',roc_auc_score(X_actual, Y_predic))
print('LOGLOSS Value is',log_loss(X_actual, Y_predic))
उत्पादन
Confusion Matrix :
[
[3 3]
[1 3]
]
Accuracy Score is 0.6
Classification Report :
precision recall f1-score support
0 0.75 0.50 0.60 6
1 0.50 0.75 0.60 4
micro avg 0.60 0.60 0.60 10
macro avg 0.62 0.62 0.60 10
weighted avg 0.65 0.60 0.60 10
AUC-ROC: 0.625
LOGLOSS Value is 13.815750437193334
प्रतिगमन समस्याओं के लिए प्रदर्शन मेट्रिक्स
हमने पिछले अध्यायों में प्रतिगमन और इसके एल्गोरिदम पर चर्चा की है। यहां, हम विभिन्न प्रदर्शन मेट्रिक्स पर चर्चा करने जा रहे हैं जिनका उपयोग प्रतिगमन समस्याओं के लिए भविष्यवाणियों का मूल्यांकन करने के लिए किया जा सकता है।
मीन एब्सोल्यूट एरर (MAE)
यह प्रतिगमन समस्याओं में उपयोग की जाने वाली सबसे सरल त्रुटि मीट्रिक है। यह मूल रूप से अनुमानित और वास्तविक मूल्यों के बीच पूर्ण अंतर के औसत का योग है। सरल शब्दों में, MAE से हम अंदाजा लगा सकते हैं कि भविष्यवाणियाँ कितनी गलत थीं। MAE मॉडल की दिशा को इंगित नहीं करता है अर्थात मॉडल के अंडरपरफॉर्मेंस या ओवरपरफॉर्मेंस के बारे में कोई संकेत नहीं है। निम्नलिखित MAE की गणना करने का सूत्र है -
$ $ MAE = \ frac {1} {n} \ sum | Y - \ hat {Y} | $$यहां, = वास्तविक आउटपुट मान
और $ \ hat {Y} $ = पूर्वनिर्धारित आउटपुट मान।
हम MAE की गणना करने के लिए sklearn.metrics के माध्य__अब्दुलए_रोर फ़ंक्शन का उपयोग कर सकते हैं।
मीन स्क्वायर एरर (MSE)
MSE MAE की तरह है, लेकिन केवल अंतर यह है कि यह पूर्ण मूल्य का उपयोग करने के बजाय उन सभी को समेटने से पहले वास्तविक और अनुमानित आउटपुट मानों के अंतर को बढ़ाता है। अंतर को निम्नलिखित समीकरण में देखा जा सकता है -
$ $ MSE = \ frac {1} {n} \ sum (Y - \ hat {Y}) $ $यहां, = वास्तविक आउटपुट मान
और $ \ hat {Y} $ = पूर्वनिर्धारित आउटपुट मान।
हम MSE की गणना करने के लिए sklearn.metrics के माध्य__क्वायर्ड_रोर फ़ंक्शन का उपयोग कर सकते हैं।
आर चुकता (R 2 )
चुकता मीट्रिक आम तौर पर व्याख्यात्मक उद्देश्य के लिए उपयोग किया जाता है और वास्तविक आउटपुट मूल्यों के लिए अनुमानित आउटपुट मानों के एक सेट की अच्छाई या फिट का संकेत प्रदान करता है। निम्नलिखित सूत्र हमें इसे समझने में मदद करेंगे -
$ $ R ^ {2} = 1 - \ frac {\ frac {1} {n} \ sum_ {i {= 1}} ^ n (Y_ {i} - \ hat {Y_ {i}}) ^ 2} {\ frac {1} {n} \ sum_ {{मैं = 1}} ^ n (Y_ {मैं} - \ बार {Y_i) ^ 2}} $$उपरोक्त समीकरण में, अंश MSE है और भाजक मानों में भिन्नता है।
हम R स्क्वेर्ड वैल्यू की गणना करने के लिए sklearn.metrics के r2_score फ़ंक्शन का उपयोग कर सकते हैं।
उदाहरण
निम्नलिखित पायथन में एक सरल नुस्खा है, जो हमें इस बारे में जानकारी देगा कि हम प्रतिगमन के बारे में ऊपर बताए गए प्रदर्शन मैट्रिक्स का उपयोग कैसे कर सकते हैं -
from sklearn.metrics import r2_score
from sklearn.metrics import mean_absolute_error
from sklearn.metrics import mean_squared_error
X_actual = [5, -1, 2, 10]
Y_predic = [3.5, -0.9, 2, 9.9]
print ('R Squared =',r2_score(X_actual, Y_predic))
print ('MAE =',mean_absolute_error(X_actual, Y_predic))
print ('MSE =',mean_squared_error(X_actual, Y_predic))
उत्पादन
R Squared = 0.9656060606060606
MAE = 0.42499999999999993
MSE = 0.5674999999999999