मुझे DQN में लक्ष्य की अद्यतन आवृत्ति कैसे चुननी चाहिए?

Aug 18 2020

मैं एक समस्या से निपट रहा हूं जिसे मैं DQN के साथ हल करने की कोशिश कर रहा हूं। एक सामान्य प्रश्न जो मेरे पास है वह लक्ष्य की अद्यतन आवृत्ति के बारे में है। इसे कैसे बदलना चाहिए? इस हाइपरपरमीटर को हम किस कारक के आधार पर बढ़ाते या घटाते हैं?

जवाब

1 Kashan Aug 18 2020 at 15:05

जैसा कि आपने स्वयं कहा है, यह एक अतिपरिवर्तन है। इसलिए, कोई भी (यहां तक ​​कि) यह नहीं कह सकता कि आदर्श अपडेट आवृत्ति क्या है। आपको परीक्षण और प्रयास करना होगा।

कहा गया है कि, एक बात याद रखें कि लक्ष्य एनएन को वास्तविक नेटवर्क की यथासंभव बारीकी से नकल करनी चाहिए। इसलिए यदि आप लंबी संख्या के चलने के बाद इसे अपडेट करते हैं, तो मुझे लगता है कि आप सटीकता खोना शुरू कर देंगे। इसके विपरीत, यदि आप इसे अक्सर अपडेट करते हैं, तो आप लक्ष्य नेटवर्क (जो प्रशिक्षण दर को बढ़ावा देने और प्रशिक्षण समय को कम करने के लिए है) का उपयोग करने का लाभ खो देते हैं और प्रशिक्षण को अधिक समय लगेगा।

मेरा सुझाव हर 5 से 8 एपिसोड के बाद अपडेट करने की कोशिश करना है।