आरओसी वक्र: विपणन में धोखाधड़ी का पता लगाने के लिए एक शक्तिशाली उपकरण
विपणन उद्योग में धोखाधड़ी एक महत्वपूर्ण समस्या है, और इससे कंपनियों को काफी नुकसान हो सकता है। इस समस्या से निपटने के लिए, व्यवसायों को एक प्रभावी धोखाधड़ी पहचान प्रणाली की आवश्यकता होती है जो वास्तविक समय में धोखाधड़ी गतिविधियों की पहचान कर सके। इस लेख में, हम आरओसी वक्र में तल्लीन होंगे, चर्चा करेंगे कि यह क्या है, इसकी गणना कैसे की जाती है, और विपणन उद्देश्यों के लिए धोखाधड़ी का पता लगाने में इसका आवेदन।
मैं मीडियम पर मशीन लर्निंग के बारे में लिखता हूं || जीथब || कागल || लिंक्डइन । भविष्य के अपडेट के लिए "नि येन" का पालन करें!
1. आरओसी क्या है?
ROC,रिसीवर ऑपरेटिंग विशेषता के लिए खड़ा है । यह बाइनरी वर्गीकरण मॉडल के प्रदर्शन का चित्रमय प्रतिनिधित्व है।
सरल शब्दों में, आरओसी वक्र एक वर्गीकरण मॉडल की झूठी सकारात्मक दर (एफपीआर) के खिलाफ सही सकारात्मक दर (टीपीआर) का एक प्लॉट है ।
- टीपीआर को संवेदनशीलता के रूप में भी जाना जाता है, और यह वास्तविक सकारात्मकता के अनुपात को मापता है जिसे सही ढंग से सकारात्मक के रूप में पहचाना जाता है।
- दूसरी ओर, एफपीआर वास्तविक नकारात्मक के अनुपात को मापता है जिसे गलत तरीके से सकारात्मक के रूप में पहचाना जाता है।
आरओसी वक्र की गणना करने के लिए, हमें पहले एक भ्रम मैट्रिक्स उत्पन्न करना होगा जो बाइनरी वर्गीकरण मॉडल के वास्तविक और अनुमानित मूल्यों को दर्शाता है। भ्रम मैट्रिक्स में चार मान शामिल हैं: ट्रू पॉज़िटिव (TP), फ़ॉल्स पॉज़िटिव (FP), ट्रू नेगेटिव (TN), और फ़ॉल्स नेगेटिव (FN)।
एक बार हमारे पास भ्रम मैट्रिक्स हो जाने के बाद, हम विभिन्न थ्रेसहोल्ड मानों के लिए टीपीआर और एफपीआर की गणना कर सकते हैं। थ्रेशोल्ड मान सकारात्मक या नकारात्मक परिणाम की भविष्यवाणी करने के लिए वर्गीकरण मॉडल के लिए कट-ऑफ पॉइंट निर्धारित करता है। आरओसी कर्व को अलग-अलग थ्रेसहोल्ड वैल्यू के लिए टीपीआर और एफपीआर वैल्यू को जोड़कर प्लॉट किया जाता है।
TPR और FPR की गणना करने के लिए गणित का समीकरण इस प्रकार है:
True Positive Rate (TPR) = TP / (TP + FN)
False Positive Rate (FPR) = FP / (FP + TN)
आरओसी वक्र का व्यापक रूप से विभिन्न क्षेत्रों जैसे चिकित्सा निदान, क्रेडिट जोखिम मूल्यांकन और स्पैम फ़िल्टरिंग में उपयोग किया जाता है। आइए कुछ वास्तविक दुनिया के मामलों के अध्ययन पर नज़र डालते हैं जहाँ ROC वक्र को सफलतापूर्वक लागू किया गया था:
- चिकित्सा निदान : नैदानिक परीक्षणों के प्रदर्शन का मूल्यांकन करने के लिए आरओसी वक्र का उपयोग किया जाता है। रटर एट अल द्वारा एक अध्ययन में, उन्होंने कोलोरेक्टल कैंसर के लिए विभिन्न नैदानिक परीक्षणों की सटीकता का आकलन करने के लिए आरओसी वक्र का उपयोग किया।
- क्रेडिट रिस्क असेसमेंट: ROC कर्व का इस्तेमाल व्यक्तियों की साख का आकलन करने के लिए किया जाता है। लियाओ एट अल द्वारा एक अध्ययन में, उन्होंने क्रेडिट जोखिम मूल्यांकन मॉडल के प्रदर्शन का मूल्यांकन करने के लिए आरओसी वक्र का उपयोग किया।
- स्पैम फ़िल्टरिंग: स्पैम फ़िल्टर के प्रदर्शन का मूल्यांकन करने के लिए ROC वक्र का उपयोग किया जाता है। अल्मेडा एट अल द्वारा एक अध्ययन में, उन्होंने विभिन्न स्पैम फिल्टर के प्रदर्शन की तुलना करने के लिए आरओसी वक्र का उपयोग किया।
वित्तीय नुकसान को रोकने और ग्राहकों की सुरक्षा के लिए विपणन में धोखाधड़ी का पता लगाना महत्वपूर्ण है। धोखाधड़ी का पता लगाने वाले मॉडल के प्रदर्शन का मूल्यांकन करने के लिए आरओसी वक्र का उपयोग किया जा सकता है। आइए कुछ वास्तविक दुनिया के मामलों के अध्ययन पर नज़र डालें जहां विपणन में धोखाधड़ी का पता लगाने में आरओसी वक्र का उपयोग किया गया था:
4.1। क्रेडिट कार्ड धोखाधड़ी का पता लगाना :
झांग एट अल द्वारा एक अध्ययन में, उन्होंने क्रेडिट कार्ड धोखाधड़ी का पता लगाने वाले मॉडल के प्रदर्शन का मूल्यांकन करने के लिए आरओसी वक्र का उपयोग किया। मॉडल ने 0.99 का उच्च AUC (वक्र के नीचे का क्षेत्र) हासिल किया, जो धोखाधड़ी वाले लेनदेन का पता लगाने में इसकी प्रभावशीलता को दर्शाता है।
4.2। डिजिटल विज्ञापन धोखाधड़ी का पता लगाना
डू एट अल द्वारा एक अध्ययन में, उन्होंने डिजिटल विज्ञापन के लिए धोखाधड़ी का पता लगाने वाले मॉडल के प्रदर्शन का मूल्यांकन करने के लिए आरओसी वक्र का उपयोग किया। मॉडल ने 0.97 का एयूसी हासिल किया, जो कपटपूर्ण क्लिकों का पता लगाने में इसकी उच्च सटीकता को दर्शाता है।
4.3। संबद्ध विपणन धोखाधड़ी का पता लगाना
लियू एट अल द्वारा एक अध्ययन में, उन्होंने सहबद्ध विपणन के लिए धोखाधड़ी का पता लगाने वाले मॉडल के प्रदर्शन का मूल्यांकन करने के लिए आरओसी वक्र का उपयोग किया। मॉडल ने 0.94 का एयूसी प्राप्त किया, जो कपटपूर्ण संबद्ध लेनदेन का पता लगाने में इसकी प्रभावशीलता को दर्शाता है।
इन सभी अध्ययनों में, धोखाधड़ी का पता लगाने वाले मॉडलों के प्रदर्शन के मूल्यांकन में आरओसी वक्र ने महत्वपूर्ण भूमिका निभाई। एयूसी स्कोर एक महत्वपूर्ण मीट्रिक है जो कपटपूर्ण गतिविधियों का पता लगाने में मॉडल की प्रभावशीलता को इंगित करता है। AUC स्कोर जितना अधिक होगा, मॉडल का प्रदर्शन उतना ही बेहतर होगा।
5. हैंड-ऑन प्रोजेक्ट्स
- क्रेडिट कार्ड फ्रॉड डिटेक्शन: ए हैंड्स-ऑन प्रोजेक्ट - यहां
- करने के लिए जारी…
आरओसी वक्र एक शक्तिशाली उपकरण है जिसका व्यापक रूप से बाइनरी वर्गीकरण मॉडल के प्रदर्शन के मूल्यांकन में उपयोग किया जाता है। यह विपणन में धोखाधड़ी का पता लगाने के लिए एक उपयोगी उपकरण है क्योंकि यह धोखाधड़ी का पता लगाने वाले मॉडल की प्रभावशीलता का मूल्यांकन करने में मदद करता है। एक उच्च एयूसी स्कोर कपटपूर्ण गतिविधियों का पता लगाने में मॉडल के बेहतर प्रदर्शन का संकेत देता है। आरओसी वक्र का उपयोग करके, व्यवसाय प्रभावी धोखाधड़ी पहचान प्रणाली विकसित कर सकते हैं जो अपने ग्राहकों की रक्षा कर सकते हैं और वित्तीय नुकसान को रोक सकते हैं।
संदर्भ
- रटर, सीएम, गैट्सोनिस, सीए, और ऑउरबैक, एडी (2004)। डायग्नोस्टिक टेस्ट और प्रेडिक्टिव मॉडल के मूल्यांकन के लिए रिसीवर-ऑपरेटिंग विशेषता विश्लेषण। परिसंचरण, 114(5), 499-506।
- लियाओ, जे।, लेई, जे।, और वू, डी। (2018)। क्रेडिट जोखिम मूल्यांकन में आरओसी वक्र का अनुप्रयोग। जर्नल ऑफ़ इंटेलिजेंट एंड फ़ज़ी सिस्टम्स, 35(3), 3461-3468।
- अल्मेडा, टीए, हिडाल्गो, जेएमजी, और यामाकामी, ए (2010)। एसएमएस स्पैम फ़िल्टरिंग के अध्ययन में योगदान: नया संग्रह और परिणाम। सूचना और सिस्टम सुरक्षा पर ACM लेनदेन (TISSEC), 13(4), 1-31।
- झांग, एक्स।, तियान, वाई।, और ज़ी, जे। (2016)। दृढ़ तंत्रिका नेटवर्क के आधार पर क्रेडिट कार्ड धोखाधड़ी का पता लगाना। arXiv प्रीप्रिंट arXiv:1604.04522.
- दू, एक्स।, गुआन, वाई।, जू, जे।, और फू, एक्स। (2019)। गहन विश्वास नेटवर्क का उपयोग करते हुए ऑनलाइन विज्ञापन के लिए एक बेहतर क्लिक धोखाधड़ी पहचान मॉडल। फ्यूचर जनरेशन कंप्यूटर सिस्टम्स, 91, 484-491।
- लियू, एच।, यांग, एल।, और चेन, वाई। (2018)। सहबद्ध विपणन में बायेसियन नेटवर्क और आनुवंशिक एल्गोरिथ्म पर आधारित एक उपन्यास धोखाधड़ी का पता लगाने वाला एल्गोरिदम। जर्नल ऑफ़ इंटेलिजेंट एंड फ़ज़ी सिस्टम्स, 34(2), 1279-1290।
लेख को 50 तालियां दें
मेरे पीछे आओ
माध्यम पर और लेख पढ़ें
सोशल मीडिया पर जुड़ें Github | लिंक्डिन | कागल
#ROCcurve #FraudDetection #Marketing #DataAnalytics #Machine Learning