時系列-パラメータキャリブレーション
前書き
統計モデルまたは機械学習モデルには、データのモデル化方法に大きく影響するいくつかのパラメーターがあります。たとえば、ARIMAにはp、d、qの値があります。これらのパラメータは、実際の値とモデル化された値の間の誤差が最小になるように決定されます。パラメータキャリブレーションは、モデルフィッティングの最も重要で時間のかかるタスクであると言われています。したがって、最適なパラメータを選択することが非常に重要です。
パラメータの校正方法
パラメータを調整するには、さまざまな方法があります。このセクションでは、それらのいくつかについて詳しく説明します。
ヒットアンドトライ
モデルをキャリブレーションする一般的な方法の1つは、時系列を視覚化することから始めて、いくつかのパラメーター値を直感的に試し、十分にフィットするまで何度も変更する手動キャリブレーションです。私たちが試しているモデルをよく理解する必要があります。ARIMAモデルの場合、手動キャリブレーションは、「p」パラメーターの自己相関プロット、「q」パラメーターの偏自己相関プロット、および時系列の定常性を確認するためのADFテストと「d」パラメーターの設定を使用して行われます。 。これらすべてについては、次の章で詳しく説明します。
グリッド検索
モデルを調整するもう1つの方法は、グリッド検索です。これは、基本的に、パラメーターの可能なすべての組み合わせに対してモデルを作成し、エラーが最小のモデルを選択することを意味します。これは時間がかかるため、キャリブレーションするパラメーターの数とそれらが取る値の範囲が少ない場合に役立ちます。これには、ネストされた複数のforループが含まれるためです。
遺伝的アルゴリズム
遺伝的アルゴリズムは、優れたソリューションが最終的に最も「最適な」ソリューションに進化するという生物学的原理に基づいて機能します。突然変異、交差、選択の生物学的操作を使用して、最終的に最適なソリューションに到達します。
詳細については、ベイズ最適化やスウォーム最適化などの他のパラメーター最適化手法について読むことができます。