マイクロストラクチャ(明示された取引ルール下での資産取引のプロセスと結果)のデータ(注文のキャンセルなどの取引所から購入できるFIXメッセージ)は、取引の参加者の意図の理解に活用でき、機械学習モデルの構築で重要な要素。
その複雑さはデータの量と多様性から増しており、モデルも観点を変えながら、価格情報、出来高、PIN理論、VPINと進化してきた。
価格情報を扱うものには、ティックルール(アグレッサーのサイドを決定する)、Roll(ビッドアスクスプレッドの説明を提案し、流動性を測る初期の試み)モデルがある。
出来高を見る、戦略取引モデルでは、ビッドかアスクか、ボリュームとオーダーフローの不均衡を見る。Kyle、Amihud、Hasbrouckのラムダについて確認した。タイムバーは5分を推奨し、市場と同期した確率的サンプリングが良い結果を出す可能性を指摘した。
PIN理論、VPIN理論といった、連続取引モデルは、様々な不確実性の原因・イベントが発生する確率を変数として取り入れていることもあり人気が高い。それぞれの式とVPINの予測力を確かめた論文を紹介している。
データから得られる特徴量として、オーダーサイズの分布、気配(キャンセル率、指値注文、成行注文)、考え方として、時間加重平均価格実行アルゴリズム、オプション市場、符号付きオーダーフローの系列相関にも触れている。
こちらもそれぞれ式も紹介されており、要点を抑えて学べました。ボラリティ推定量やビッドアスクスプレッド推定量についての解説もあります。