मशीन लर्निंग और सांख्यिकी में नमूना और मामले के बीच अंतर?
मैं में लगता है कि इस सवाल का और इस एपीआई Keras का एक नमूना का मतलब है कि एपीआई कहा गया है कि के प्रलेखन के रूप में आंकड़े में एक मामला:
परीक्षण के नमूने के लिए वजन की वैकल्पिक गांठदार सरणी, जिसका उपयोग नुकसान फ़ंक्शन को भारित करने के लिए किया जाता है। आप इनपुट नमूने (1: 1 वजन और नमूनों के बीच 1 मैपिंग) के साथ समान लंबाई के साथ एक फ्लैट (1D) Numpy सरणी पास कर सकते हैं, या लौकिक डेटा के मामले में, आप आकृति (नमूने, अनुक्रम -length) के साथ 2 डी सरणी पास कर सकते हैं ), हर नमूने के टाइमस्टेप के लिए एक अलग वजन लागू करने के लिए। जब x डेटासेट होता है तो यह तर्क समर्थित नहीं होता है, इसके बजाय x के तीसरे तत्व के रूप में नमूना वेट पास करें।
जैसा कि मैं समझता हूं, यहां का नमूना उपरोक्त प्रश्न में बहुत अच्छी तरह से संरेखित है, तो मेरा सवाल यह है कि हम आंकड़ों में एक मामले को जानने के लिए मशीन में एक नमूना का संदर्भ क्यों देते हैं? आंकड़ों में, एक नमूना कई मामलों से समझौता करता है और यह आबादी का एक हिस्सा है।
जवाब
मुझे लगता है कि मुख्य व्याख्या बस अलग-अलग परंपराएं हैं। उन्होंने विभिन्न शब्दावली के साथ बहुत अधिक यादृच्छिक रूप से शुरुआत की और वे अभी भी जारी हैं। मुझे नहीं लगता कि कोई गहरी, दार्शनिक व्याख्या है। वैसे, आंकड़ों और मशीन सीखने के अनुप्रयोगों में शब्दावली भी क्षेत्रों में भिन्न होती है; कुछ (जीव विज्ञान?) शायद का उपयोग नमूने के बजाय नमूना है, साथ ही सांख्यिकीय समस्याओं के लिए के रूप में वे सिर्फ अपने डोमेन से कॉपी शब्द (शब्दों)।