Python Pythonで機械学習を学ぶ モデルの評価指標 2020-07-30 hawk タカの技術ブログ 分類モデル 混同行列と関連指標 精度を考えた時に、予測と結果で4つのパターンが存在する。 (正解と予測して答えが正解の時 …
Pandas Pythonで機械学習を学ぶ ハイパーパラメータチューニング グリッドサーチ 2020-07-29 hawk タカの技術ブログ 汎化性能を向上するために、ハイパーパラメータ(学習器に人が設定する引数、例えば決定木の深さなど)のチューニング手法の一つグリッドサーチを学 …
Python Pythonで機械学習を学ぶ モデルの検証法を確認する ホールドアウト法、交差検証法 2020-07-28 hawk タカの技術ブログ 機械学習モデルでは汎化性能(学習したデータだけでなく、未知のデータでも正しく予想できること)が求められる。 ホールドアウト法 …
Python Python scikit-learn 分類問題を生成する make_classification 2020-07-27 hawk タカの技術ブログ ランダムな n クラス分類の問題を生成 PCAの学習時にも使用した、make_classification() 関数で生成できます。 …
Python Python scikit-learn に含まれるデータセットを確認する 2020-07-26 hawk タカの技術ブログ データセット scikit-learn には、外部サイトからファイルをダウンロードせずに利用できる標準のデータセットが sklear …
Python Pythonで機械学習を学ぶ 主成分分析 2020-07-25 hawk タカの技術ブログ 教師なし学習の次元圧縮の一つ。データが持つ情報をできるだけ残して変数の数を圧縮できる。探索的分析・予測モデル構築時の前処理として使われている。 サンプルコード …
Python Pythonで機械学習を学ぶ クラスタリング k-means法 2020-07-24 hawk タカの技術ブログ クラスタリングは教師なし学習の一つ。データに着目し、隠れた構造や知見を発見するためのモデルを構築すること。(教師あり学習では、目的変数と説 …
Python Pythonで機械学習を学ぶ スケーリングで予測精度を向上させる 2020-07-20 hawk タカの技術ブログ 説明変数の標準化を実施し、変数間の単位、大きさの異なりを消し、数値の大小と意味するところを合致させる。 以前に紹介したロジス …
Pandas Python csvをPandasのDataFrameオブジェクトとして読み込む、区切り文字の指定など 2020-07-19 hawk タカの技術ブログ タイトルの通り、csvからPandasのDataFrameのオブジェクトとして読み込みます。区切り文字を、引数 delimiter=";" …
Python Pythonで機械学習を学ぶ SVM 2020-07-17 hawk タカの技術ブログ カテゴリを識別する境界線をそのカテゴリのマージンが最大になるように設定する手法。 以下の「Forest Fires Data Set」で実験します。 http …