ฉันจะเลือกความถี่ในการอัปเดตของเป้าหมายใน DQN ได้อย่างไร
ฉันได้รับการจัดการกับปัญหาที่ฉันพยายามแก้ไขด้วย DQN คำถามทั่วไปที่ฉันมีคือเกี่ยวกับความถี่ในการอัปเดตของเป้าหมาย ควรเปลี่ยนอย่างไร ขึ้นอยู่กับปัจจัยใดที่เราเพิ่มหรือลดไฮเปอร์พารามิเตอร์นี้?
คำตอบ
อย่างที่คุณบอกว่าตัวเองเป็นไฮเปอร์พารามิเตอร์ ดังนั้นจึงไม่มีใคร (แม้แต่คุณ) สามารถพูดได้ว่าความถี่ในการอัปเดตในอุดมคติคืออะไร คุณต้องทดสอบและลอง
ต้องบอกว่าจำสิ่งหนึ่งที่ NN เป้าหมายควรเลียนแบบเครือข่ายจริงให้ใกล้เคียงที่สุด ดังนั้นหากคุณอัปเดตหลังจากใช้ตัวเลขเป็นเวลานานฉันคิดว่าคุณจะเริ่มสูญเสียความแม่นยำ ในทางตรงกันข้ามหากคุณอัปเดตบ่อยเกินไปคุณจะสูญเสียประโยชน์จากการใช้เครือข่ายเป้าหมาย (ซึ่งเป็นการเพิ่มอัตราการฝึกอบรมและลดเวลาในการฝึกอบรม) และการฝึกอบรมจะใช้เวลามากขึ้น
คำแนะนำของฉันคือลองอัปเดตทุกๆ 5 ถึง 8 ตอน