Python Pythonで機械学習を学ぶ 主成分分析 2020-07-25 hawk タカの技術ブログ 教師なし学習の次元圧縮の一つ。データが持つ情報をできるだけ残して変数の数を圧縮できる。探索的分析・予測モデル構築時の前処理として使われている。 サンプルコード …
Python Pythonで機械学習を学ぶ クラスタリング k-means法 2020-07-24 hawk タカの技術ブログ クラスタリングは教師なし学習の一つ。データに着目し、隠れた構造や知見を発見するためのモデルを構築すること。(教師あり学習では、目的変数と説 …
Pandas Python Pandas DataFrame 任意の変数を二値化する 回帰を分類にする時などに使える 2020-07-23 hawk タカの技術ブログ 任意の変数を二値化する import pandas as pd df = pd.DataFrame({'a': [ …
Pandas Python Pandas DataFrame のyes, noをTrue, Falseに変換する 2020-07-22 hawk タカの技術ブログ https://hawk-tech-blog.com/python-machine-learning-basic-decision-tr …
Pandas Python Pandas DataFrameを結合する 2020-07-21 hawk タカの技術ブログ 複数のDataFrameを pd.concat で 結合してみます。 import pandas as pd df1 = pd.D …
Python Pythonで機械学習を学ぶ スケーリングで予測精度を向上させる 2020-07-20 hawk タカの技術ブログ 説明変数の標準化を実施し、変数間の単位、大きさの異なりを消し、数値の大小と意味するところを合致させる。 以前に紹介したロジス …
Pandas Python csvをPandasのDataFrameオブジェクトとして読み込む、区切り文字の指定など 2020-07-19 hawk タカの技術ブログ タイトルの通り、csvからPandasのDataFrameのオブジェクトとして読み込みます。区切り文字を、引数 delimiter=";" …
Pandas Python xlsxをPandasのDataFrameオブジェクトとして読み込む 2020-07-18 hawk タカの技術ブログ 機械学習などでcsvを扱うなどは一般的なサンプルでよく見ます。今回は、タイトルの通り、xlsxからPandasのDataFrameのオブジ …
Python Pythonで機械学習を学ぶ SVM 2020-07-17 hawk タカの技術ブログ カテゴリを識別する境界線をそのカテゴリのマージンが最大になるように設定する手法。 以下の「Forest Fires Data Set」で実験します。 http …
Python Pythonで機械学習を学ぶ k近傍法(k-NN) 2020-07-16 hawk タカの技術ブログ 入力されたデータの属性に近いデータをk個選び、そのk個のデータがどの分類に多いかを調べて、多いものを入力データの分類とする分類方法。 …