ファイナンス機械学習 ファイナンス機械学習 バックテスト2 バックテストの危険性 2020-06-28 hawk タカの技術ブログ プロも犯す誤りをリストする クオンツ投資の7つの罪があり(生存バイアスなど7つが紹介)、それ以外も共通して、バックテストが完璧であっ …
ファイナンス機械学習 ファイナンス機械学習 バックテスト1 ベットサイズの決定 2020-06-27 hawk タカの技術ブログ 投資戦略はベットサイズを適切にしないと損失を出すため、機械学習の予測に基づいた決定のアプローチを検討する。 戦略とは独立して …
ファイナンス機械学習 ファイナンス機械学習 モデリング4 交差検証法によるハイパーパラメータの調整 2020-06-26 hawk タカの技術ブログ ハイパーパラメータの調整は、フィッティングの重要なステップ。調整を間違うと、過学習が行われ、実際のパフォーマンスが出ないことがある。 …
ファイナンス機械学習 ファイナンス機械学習 モデリング3 特徴量の重要度 2020-06-25 hawk タカの技術ブログ 同じデータに何度もテストを繰り返す行為が嘘の発見に繋がり、米国統計協会は倫理ガイドラインにおいて、科学的不正と指摘している。 …
ファイナンス機械学習 ファイナンス機械学習 モデリング2 交差検証法 2020-06-24 hawk タカの技術ブログ 交差検証の目的は、過学習を防ぐために汎化誤差を測ること。交差検証は、過学習を検知できるわけではない。ハイパーパラメータの設定次第で、交差検 …
ファイナンス機械学習 ファイナンス機械学習 モデリング1 アンサンブル法 2020-06-23 hawk タカの技術ブログ アンサンブル法のいくつかを効果的にし、金融分野での誤用につながる誤りを回避する方法を紹介する。 誤りの3つの要因 アンサンブル …
ファイナンス機械学習 ファイナンス機械学習 データ分析4 分数次差分をとった特徴量 2020-06-22 hawk タカの技術ブログ 価格データが過去の水準の履歴に依存する。履歴を無視し、複雑なテクニックを適用した結果、偽の発見が得られることもある。この章では、可能な限り …
ファイナンス機械学習 ファイナンス機械学習 データ分析3 標本の重みづけ 2020-06-21 hawk タカの技術ブログ 観測値が独立同分布な過程によって生成されているわけでないという問題に対処するための重みづけの使い方を学びます。 重複した結果 …
ファイナンス機械学習 ファイナンス機械学習 データ分析2 ラベリング 2020-06-20 hawk タカの技術ブログ 金融データのラベルのつけ方を学びます。 固定時間ホライズン法 ほとんどの機械学習の論文はこの方法。一般的ではあるが、タイムバー …
ファイナンス機械学習 ファイナンス機械学習 データ分析1 データ構造 2020-06-19 hawk タカの技術ブログ 加工済みのデータセットを使うのではなく、有益な特徴量を抽出できるように加工する。 横着せずに世界を他人の目ではなく、自分の …