ニューラルネットワークの入力として使用する金融価格の正規化
ニューラルネットワークの入力として使用するために、金融価格を正規化/標準化するための最良の方法を探しています。おそらく、金融価格が正規分布に従わず、テストセットのように正規化に必要な最大値または最小値を知ることさえできないため、トレーニングセットの価格よりも高いまたは低い価格が存在する可能性があります。
だから私は自分のデータをローリングウィンドウで標準化できると思ったので、価格はその時に標準化されました $t$次のように計算されます:\ begin {equation} p'_ {t} = \ frac {p_ {t} -E(p_ {tk:t})} {\ sigma(p_ {tk:t})} \ end {equation }
どこで $p_{t-k:t}$ 私は長さkのウィンドウ内の価格の連続を意味します(期間tkからtまで)
それは意味がありますか?深く学ぶことができる研究はありますか?適応正規化方法を見つけましたが、それは私がしなければならないことにはあまりにも進んでいます(私の目標は価格を予測することではないので、モデルを助けることができる単なる入力変数です)
回答
一般的に、金融価格は定常的ではありません。ただし、理論的および経験的な理由から、対数が返されると考えています($\log($価格$)$)静止に近い。多くの場合、それらは推論を可能にするために「十分に近い」と見なされます。価格が定常に近くないことの唯一の例外は、鉱工業生産がゆっくりと変化するために平均回帰する傾向がある価格である可能性があります。たとえば、商品価格です。
ただし、これには大きな注意点があります。すべての資産(商品を含む)の価格と対数リターンは、永続的で時間とともに変化する変動を示すことがわかっています。修正は、GARCHモデルのようなものを使用して、対数リターンの条件付き分散をモデル化することです。
使用可能な推論を得るためにGARCHモデルを使用する必要がない場合があります。ただし、必ずログリターンを使用する必要があります。誰かがログリターンを使用しなかったときに、(産業界と学界で)十分なプレゼンテーションが冒頭のスライドで終了するのを見てきました。標準的な返品を使用する場合でも、多くの場合、懐疑的な見方があります。
データを正規化する方法として正しい答えはありません。Nayakらによるこの良い記事を見つけました。(2014)金融時系列データにさまざまな正規化手法を提供します。私はあなたの特定のテクニックを見たことがありません。一般的に、問題は、lokalウィンドウで通常の最小/最大正規化のデータ損失を説明している間だと思います$k$、長期間にわたって、データがウィンドウの外で大きくなる可能性があるという最小/最大と同じ問題があります。私は個人的にzスコアの正規化から始めます(Nayak et al。、2014で説明されています)。
$p'_t = \frac{p_t-E(p))}{\sigma(p)}$
おそらくあなたにぴったりだと思いますが、データの範囲に応じて他のアイデアを試してみてください。