खेल परिदृश्य में मशीन लर्निंग एप्लिकेशन के लिए एक ढांचा
खेल परिदृश्य में उपयोग करने के लिए प्रस्तावित ढांचे को निम्नलिखित विषयों पर विचार करने की आवश्यकता है:
(1) डोमेन समझ; (2) डेटा समझ; (3) डेटा तैयार करना और फीचर एक्सट्रैक्शन, डेटा के सबसेट और डेटा प्रीप्रोसेसिंग (मैच बनाम एक्सटर्नल फीचर्स) को परिभाषित करना; (4) खेल भविष्यवाणी मॉडल मूल्यांकन (मॉडल प्रदर्शन, प्रशिक्षण और परीक्षण डेटा); (5) अंत में मॉडल परिनियोजन।
1 - डोमेन समझ: इसके लिए समस्या, मॉडलिंग लक्ष्य और खेल की विशिष्ट विशेषताओं को जानना आवश्यक है;
2 - डेटा समझ: कुछ विचार करने योग्य बात यह है कि सार्वजनिक रूप से उपलब्ध कुछ डेटासेट का उपयोग करके डेटा कैसे प्राप्त किया जाएगा, उदाहरण के लिए, यह किस प्रकार के डेटा से निपट रहा है? खिलाड़ी, प्रशिक्षण डेटा, वर्षों के साथ प्रदर्शन से मेल खाता है। संभावित विश्लेषण निर्धारित करने के लिए ये सभी सूचनाएं महत्वपूर्ण हैं। वर्ग चर को भी महत्वपूर्ण माना जाता है, उदाहरण के लिए, वर्गीकरण समस्या से निपटने पर परिणाम जीत, हार और ड्रा होगा। संख्यात्मक समस्या जैसे घरेलू बिंदुओं और दूर बिंदुओं के अंतर के आधार पर अंकों की भविष्यवाणी करना;
3 - डेटा तैयार करना और फीचर निष्कर्षण: सुविधाओं के संबंध में, डेटा को मैच-संबंधित और स्थायी सुविधाओं में विभाजित करना उचित लगता है। प्रीप्रोसेसिंग प्रक्रिया मानती है कि मिलान से संबंधित विशेषताएं वास्तविक घटना खेल (मीटर प्राप्त, पास किए गए, और इसी तरह) के बारे में सूचनाएं हैं, किसी भी स्थिति को घटना पर गिनना संभव है। अन्यथा, बाहरी विशेषता आगामी घटना से पहले जानी जाती है (दूरी तय की गई है, मीटर कवर किया गया है, व्यायाम दिनचर्या की संख्या और आगे);
4 - खेल भविष्यवाणी मॉडल (प्रदर्शन, प्रशिक्षण और परीक्षण डेटा): पहला कदम संभावित मॉडल का चयन है, पिछले साहित्य की तलाश करें, तारीख के सबसेट के साथ पूर्व-चयनित मॉडल का प्रयोग उपयोग करने के लिए सर्वोत्तम तकनीक प्रदान करेगा। अत्यधिक असंतुलन डेटा के लिए मानक वर्गीकरण मैट्रिक्स, सटीकता वर्गीकरण या रिसीवर ऑपरेटिंग विशेषता (आरओसी) वक्र का उपयोग करके सही मूल्यांकन के आधार पर मॉडल प्रदर्शन का मूल्यांकन किया जाता है। प्रशिक्षण और परीक्षण के संबंध में , प्रशिक्षण और परीक्षण द्वारा डेटा का क्रॉस-सत्यापन और पृथक्करण उपयुक्त है। प्रशिक्षण डेटा के क्रम को संरक्षित करें, आगामी मैचों की भविष्यवाणी पिछली घटनाओं / मैचों के आधार पर की जाती है। निम्नलिखित के रूप में हल की गई समस्या के आधार पर प्रशिक्षण बनाम परीक्षण को विभाजित करना भी महत्वपूर्ण है:
पिछले सीज़न भविष्य के सीज़न में मैचों की भविष्यवाणी करने के लिए प्रासंगिक नहीं हो सकते हैं, खासकर उन खेलों में जहां टीम रोस्टर और ताकत साल-दर-साल महत्वपूर्ण रूप से बदल सकती है। यह दृष्टिकोण मॉडल प्रदर्शन की एक विश्वसनीय तस्वीर नहीं दे सकता है (हालांकि इसे कुछ हद तक कम किया जा सकता है यदि खिलाड़ी स्तर के डेटा को शामिल किया जाता है, और इसलिए खिलाड़ी के बदलाव सीजन से सीजन तक कैप्चर किए जाएंगे)।
5 - मॉडल परिनियोजन: मॉडल के सभी आयात मापदंडों को सेट करने के बाद, नए प्रशिक्षण डेटा के साथ परीक्षण करें, इसलिए इसे ऑनलाइन उपलब्ध कराना और गतिशील रूप से इनपुट डेटा, मिलान / घटना और बाहरी सुविधाओं को प्राप्त करना संभव है।
निष्कर्ष
खेल परिदृश्य में भविष्यवाणी के लिए अच्छी सटीकता की आवश्यकता होती है। एक डोमेन विशेषज्ञ द्वारा सत्यापित गणितीय और सांख्यिकीय मॉडल का उपयोग करके परिणाम प्राप्त किए जाते हैं। यह लेख डेटा माइनिंग (CRISP-DM) के लिए क्रॉस-इंडस्ट्री स्टैंडर्ड प्रोसेस के बारे में जानकारी प्रदान करता है, जो स्पोर्ट रिजल्ट प्रेडिक्शन (SRP-CRISP-DM) के लिए एक फ्रेमवर्क है।
बंकर और थबताह 2017 - खेल के परिणाम की भविष्यवाणी के लिए एक मशीन लर्निंग फ्रेमवर्क।