ファイナンス機械学習

ファイナンス機械学習 データ分析4 分数次差分をとった特徴量

価格データが過去の水準の履歴に依存する。履歴を無視し、複雑なテクニックを適用した結果、偽の発見が得られることもある。この章では、可能な限り多くの履歴を保持し、データの定常的なものへの変換方法を紹介する。

定常性とメモリのジレンマと、書籍で紹介する手法

定常性とメモリのトレードオフが存在する。差分を取ることでより定常にすることは可能だが、メモリを消してしまう。機械学習アルゴリズムで予測をするという観点から、その目的を損なう。

この分野の文献では、非定常時系列を定常にするために、整数時差分を使用する。著者による、実用的で非伝統的な新しい方法として、差分オペレータを非整数次に一般化する手法が紹介されている。具体的に長期メモリ、イテレーションによる推定、ウェイトの収束性を確認し性質を確認した。

実装

提案されている手法から、時系列の分数次差分を取るために、拡大ウィンドウを実装する。しかし、この方法では、ウェイト損失をコントロールしない場合に、トレンドのみが示され、コントロールしても期待する結果を得るために他の方法を考える。固定幅ウィンドウを使用することで、定常的な値を取得することを確認した。また、この方法が、過度にメモリを放棄せずに定常性が得られたことの確認をした。また、具体的な特徴量の変換の試し方についてもまとめで紹介されている。