DQNでターゲットの更新頻度をどのように選択する必要がありますか?
Aug 18 2020
私はDQNで解決しようとしている問題に取り組んできました。私が持っている一般的な質問は、ターゲットの更新頻度に関するものです。どのように変更する必要がありますか?このハイパーパラメータをどのような要因で増減しますか?
回答
1 Kashan Aug 18 2020 at 15:05
あなたが自分で言ったように、それはハイパーパラメータです。したがって、誰も(あなたでさえ)理想的な更新頻度を言うことはできません。テストして試す必要があります。
そうは言っても、ターゲットNNが実際のネットワークを可能な限り模倣する必要があることを1つ覚えておいてください。したがって、長時間実行した後に更新すると、精度が低下し始めると思います。逆に、更新頻度が高すぎると、ターゲットネットワークを使用するメリットが失われ(トレーニングレートが上がり、トレーニング時間が短縮されます)、トレーニングにかかる時間が長くなります。
私の提案は、5〜8エピソードごとに更新してみることです。