ファイナンス機械学習

ファイナンス機械学習 データ分析2 ラベリング

金融データのラベルのつけ方を学びます。

固定時間ホライズン法

ほとんどの機械学習の論文はこの方法。一般的ではあるが、タイムバーを使用する、固定された閾値でラベル付けをするので、このアプローチは避けるべき。より良い方法として、可変閾値によるラベル付け、出来高バー、ドルバーを使用する。などがあるが、価格が経路依存なのが欠点。また、著者からは戦略の構築の仕方として、取引所のロスカットされたであろうポジションから利益を得るようなものは非現実であるとの指摘があった。

動的閾値

正しく目標を設定する(リスク管理)ために、日次ボラティリティを計算し、デフォルトの利益確定とストップロスの制限を設定する。ローリング指数加重標準偏差を使用する。

調べてみると、指数加重標準偏差はプロのリスク管理でも当たり前に使用されているようでした。長期間の移動平均でも大きな変動に機敏に反応できるという指数加重移動平均の性質を標準偏差に応用したものとのことです。

トリプルバリア法

既存の文献にない方法。2つの水平バリア(利食い・損切)と1つの垂直バリア(有効期限)から構成される。

図式や経路について紹介があり、とても興味深かったです。

サイドとサイズの学習

ポジション(ロング・ショート)を設定するためのモデルがない際に、サイドの学習が重要で、その具体的な実装方法が紹介されていました。

メタラベリング

サイドを設定するためのモデルがある場合に、次にサイズを学習する。ベットにいくら投入するか、適切なベットサイズを求める。二値予測(ベットするかしないか)の訓練をする。混同行列(偽陽性、偽陰性)などの説明がありましたが、分類期の効率性を測定するF1スコアは、適合率と再現率の調和平均によって測定される。メタラベリングのアイデアでは、1次モデルで、投資機会を見つけ、2次モデルで採用するか見送るかを判断する。

この1次モデル、2次モデルの考え方がとてもわかりやすくおもしろかったです。メタラベリング後半部分の、メタラベリングの優位性の解説部分は、この部分をしっかりと補足しており、4つの理由と、筆者の経験上での、標準のラベリングモデルとの比較が記述されており、非常に得るものが多く勉強になりました。

クオンタメンタルな手法

ヘッジファンドの専門知識と、クオンタメンタルな手法を組み合わせるために設計されたテクノロジーの開発の具体的な例として、メタラベリングが非常に有用である。その理由として、メタラベリングを使用することで、裁量的なポートフォリオマネージャの投資アイデアを実行すべきかの判断ができ、特徴量に多くのものを設定できることがある。

ここも非常に読みごたえがあり、AIに置き換えられるまでの具体的な流れを想像する助けになるなと思いました。

不要なラベルの削除

分類器がうまく機能しないケースに対応するため、出現回数が極めて少ないラベルに関連する観測値を削除する手順が紹介されていました。