ファイナンス機械学習

ファイナンス機械学習 分野の理解を深める

はじめには、モチベーションなどが書いてあったので、割愛します。

プロジェクトが失敗する原因とメタ戦略パラダイム

そもそも失敗の可能性が高い分野であり、要因はいくつかある。

  • バックテストの過学習(オーバーフィッティング)に陥る
  • スタンダードなファクター投資戦略を選択し投資効率が良くないものを作る
  • 一人で巨大なシステムを作り上げようとする

より良い選択肢として、MRIの基礎研究などでも使用された、メタ戦略パラダイムがある。(著者によると、成功しているクオンツファームはすべて採用しているとのこと)

プロセス全体の外観を理解しながら、特定のタスクのエキスパートになる。全員が貢献し機能して達成するようなチームの方が、単純なマネジメントよりも良い結果を残せる。

簡単にまとめながら読み進めました。ちょっと試せば儲かるというような甘い世界ではないということを再認識させられます。

ビギナーズラックなど短期的にはあるかもしれません。しかし、このように組織されたところがいずれ多くの可能性からより良い手法を解決するたびに、そういったラッキーが減るだけでなく、長期的な運用も徐々に難しいものになっていくのではないかと想像します。

チームの構成

具体的に、チームは6つにわかれる。

データキュレータ

他チームが活用する世界にあふれるデータを活用できるように整理する。データは(専門知識が必要なもの)金融ならではの文脈を含む必要がある。

特徴量アナリスト

データから、シグナルを発見し、その発見を集めカタログ化することで、他のチームから有効活用できるようにする。

ストラテジスト

カタログ化されたシグナル(特徴量)を投資アルゴリズムへ変換する。構築する理論が、行動バイアス、アービトラージ(情報の非対称性)、規則からくる制約なのかと、ブラックボックスで発見された特徴量を、投資戦略としてホワイトボックスで扱えるようにする。また、デプロイできるようにプロトタイプを作成する。

バックテスター

バックテストの過学習(オーバーフィット)の可能性を評価する。そしてこの評価は、他のチームへは知らされず、経営陣だけに知らされることになる。

デプロイメントチーム

プロトタイプの投資戦略を本番環境へ統合する。デプロイされたものが、プロトタイプと一致しているかの確認、時間的制約に対応するために、あらゆる高速化の手段の策を講じる。

ポートフォリオオーバーサイト

投資戦略がデプロイされたら、次のような流れで運用される。

  1. エンバーゴ:この期間では、資金は実際には扱わず、バックテスト以降のデータに対して投資戦略のパフォーマンスがバックテストと整合的かを判断する。
  2. 紙上のトレーディング:この期間でも、資金は実際には扱わず、リアルタイムのデータに対して走らせ、観測からポジションのまでの経過時間を考慮し、投資戦略が期待通りに機能するか証拠を集める。
  3. 卒業:実際の資金を管理、運用する。パフォーマンスが計測され、アトリビューション分析がされる。
  4. 再分配:ポートフォリオ分散の観点から、頻繁に再評価、分配が行われる。
  5. 退役:期待以下のパフォーマンスが長期間続き、戦略の根拠となる理論が実証的な証拠によって裏付けられなくなったとき、その投資戦略はアンデプロイされる。

他のチームへは知らせないのは、おそらく、データキュレータ、特徴量アナリスト、ストラテジストのそれぞれのチームが、評価結果を確認することで、この評価に依存して、評価自体にオーバーフィットしないためかなと考えました。ここの分離の仕方は興味深いです。

また、ポートフォリオオーバーサイトの流れも、非常に堅実で、デプロイメントチームの存在も非常に重要であることがわかります。

こうして俯瞰してみると、それぞれのチームが機能しなければどこかで破綻することが容易に想像できます。

1章は入門ということで環境についての解説でしたが、とても読みごたえがありました。このほかにも特定の分野、チームごとにどの章を読むべきか、課題と解決法、機械学習のアルゴリズムがどのように役立つかなど、幅広い視点でも書かれており、とても有益な経験が共有された実感があります。また参考文献についても多く記載されていることを確認しましたので、参照して学びを深めていくこともできると確信しました。