डेटा विश्लेषण के लिए मशीन लर्निंग
मशीन लर्निंग कंप्यूटर विज्ञान का एक उपक्षेत्र है जो पैटर्न मान्यता, कंप्यूटर दृष्टि, भाषण मान्यता, पाठ विश्लेषण जैसे कार्यों से संबंधित है और सांख्यिकी और गणितीय अनुकूलन के साथ एक मजबूत लिंक है। एप्लिकेशन में खोज इंजन, स्पैम फ़िल्टरिंग, ऑप्टिकल कैरेक्टर रिकॉग्निशन (OCR) आदि का विकास शामिल है। डेटा माइनिंग, पैटर्न रिकग्निशन और स्टैटिस्टिकल लर्निंग के क्षेत्र के बीच की सीमाएँ स्पष्ट नहीं हैं और मूल रूप से सभी समान समस्याओं का उल्लेख करते हैं।
मशीन लर्निंग को दो प्रकार के कार्य में विभाजित किया जा सकता है -
- पर्यवेक्षित अध्ययन
- अनसुचित शिक्षा
पर्यवेक्षित अध्ययन
पर्यवेक्षित शिक्षण एक प्रकार की समस्या को संदर्भित करता है जहां मैट्रिक्स एक्स के रूप में परिभाषित एक इनपुट डेटा होता है और हम एक प्रतिक्रिया वाई की भविष्यवाणी करने में रुचि रखते हैं । जहाँ X = {x 1 , x 2 ,…, x n } में n भविष्यवाणियां हैं और जिसके दो मूल्य हैं y = {c 1 , c 2 } ।
एक उदाहरण अनुप्रयोग एक वेब उपयोगकर्ता की भविष्यवाणियों के रूप में जनसांख्यिकीय सुविधाओं का उपयोग करके विज्ञापनों पर क्लिक करने की संभावना का अनुमान लगाने के लिए होगा। यह अक्सर दर (CTR) के माध्यम से क्लिक की भविष्यवाणी करने के लिए कहा जाता है। फिर y = {क्लिक करें, नहीं - क्लिक करें} और भविष्यवाणियां इस्तेमाल किया गया आईपी पता हो सकता है, जिस दिन वह साइट में प्रवेश करता है, उपयोगकर्ता का शहर, अन्य सुविधाओं के बीच देश जो उपलब्ध हो सकता है।
अनसुचित शिक्षा
एक समूह के बिना सीखने के लिए एक दूसरे के भीतर समान हैं, उन समूहों को खोजने की समस्या से अनसुचित शिक्षण सौदे करता है। भविष्यवक्ताओं से मानचित्रण सीखने के लिए कई समूह हैं जो प्रत्येक समूह में समान उदाहरण साझा करते हैं और एक दूसरे के साथ भिन्न हैं।
अनुपयोगी अधिगम का एक उदाहरण अनुप्रयोग ग्राहक विभाजन है। उदाहरण के लिए, दूरसंचार उद्योग में उपयोगकर्ताओं को फोन पर दिए गए उपयोग के अनुसार खंड बनाना एक सामान्य कार्य है। यह विपणन विभाग को एक अलग उत्पाद के साथ प्रत्येक समूह को लक्षित करने की अनुमति देगा।