पाइथन में लॉजिस्टिक रिग्रेशन - केस स्टडी

इस बात पर विचार करें कि एक बैंक आपके पास एक मशीन लर्निंग एप्लिकेशन विकसित करने के लिए पहुंचता है, जो संभावित ग्राहकों की पहचान करने में उनकी मदद करेगा जो उनके साथ एक टर्म डिपॉजिट (कुछ बैंकों द्वारा फिक्स्ड डिपॉजिट भी कहा जाता है) खोलेंगे। संभावित ग्राहकों के बारे में जानकारी एकत्र करने के लिए बैंक नियमित रूप से टेलीफ़ोनिक कॉल या वेब फॉर्म के माध्यम से एक सर्वेक्षण करता है। सर्वेक्षण प्रकृति में सामान्य है और बहुत बड़े दर्शकों पर आयोजित किया जाता है, जिनमें से कई को इस बैंक के साथ काम करने में रुचि नहीं हो सकती है। शेष में से, केवल कुछ ही सावधि जमा खोलने में दिलचस्पी ले सकते हैं। दूसरों को बैंक द्वारा दी जाने वाली अन्य सुविधाओं में रुचि हो सकती है। इसलिए टीडी खोलने वाले ग्राहकों की पहचान के लिए सर्वेक्षण आवश्यक रूप से नहीं किया गया है। आपका कार्य उन सभी ग्राहकों की पहचान करना है, जो बैंक आपके साथ साझा करने जा रहे विनम्र सर्वेक्षण डेटा से टीडी खोलने की उच्च संभावना रखते हैं।

सौभाग्य से, मशीन लर्निंग मॉडल विकसित करने के इच्छुक लोगों के लिए इस तरह का एक डेटा सार्वजनिक रूप से उपलब्ध है। यह डेटा कुछ छात्रों द्वारा यूसी इरविन में बाहरी फंडिंग के साथ तैयार किया गया था। डेटाबेस के एक भाग के रूप में उपलब्ध हैUCI Machine Learning Repositoryऔर दुनिया भर में छात्रों, शिक्षकों और शोधकर्ताओं द्वारा व्यापक रूप से उपयोग किया जाता है। यहां से डाटा डाउनलोड किया जा सकता है ।

अगले अध्यायों में, अब हम उसी डेटा का उपयोग करके एप्लिकेशन डेवलपमेंट करते हैं।