Adobe PythonでPDFをdocxに変換する pdf2docxをインストール サンプルコード付き 2020-08-04 hawk タカの技術ブログ 取引先の関係で、PDFをword(docx)に変換したいことがあると思います。ファイル名を変更したかったり、一部分を書き換えたかったり…こ …
Adobe PythonでPDFを操作する PyPDF2をインストール サンプルコード付き 2020-08-03 hawk タカの技術ブログ PDFを分割、結合など操作したい時、フリーソフトや、Adobeのツールで作業することもあります。単純作業の繰り返しを効率化したい場合にPy …
Python Pythonで機械学習を学ぶ 勾配ブースティング 2020-08-02 hawk タカの技術ブログ 回帰のための開発されたアルゴリズム、確率的勾配降下法をブースティングに応用したもの。 アーリーストッピング 学習時にス …
Python Pythonで機械学習を学ぶ AdaBoost 2020-08-01 hawk タカの技術ブログ AdaBoostの基本的なアイディアは、重み付きクラス分類アルゴリズムで、重みをルール(正しく分類できる時、小さく / 分類できない時、大 …
Python Pythonで機械学習を学ぶ アンサンブル学習 2020-07-31 hawk タカの技術ブログ 複数のモデルを組み合わせて予測することで精度向上を狙います。 代表的なアルゴリズムとして、ランダムフォレストと勾配ブースティングがあ …
Python Pythonで機械学習を学ぶ モデルの評価指標 2020-07-30 hawk タカの技術ブログ 分類モデル 混同行列と関連指標 精度を考えた時に、予測と結果で4つのパターンが存在する。 (正解と予測して答えが正解の時 …
Pandas Pythonで機械学習を学ぶ ハイパーパラメータチューニング グリッドサーチ 2020-07-29 hawk タカの技術ブログ 汎化性能を向上するために、ハイパーパラメータ(学習器に人が設定する引数、例えば決定木の深さなど)のチューニング手法の一つグリッドサーチを学 …
Python Pythonで機械学習を学ぶ モデルの検証法を確認する ホールドアウト法、交差検証法 2020-07-28 hawk タカの技術ブログ 機械学習モデルでは汎化性能(学習したデータだけでなく、未知のデータでも正しく予想できること)が求められる。 ホールドアウト法 …
Python Python scikit-learn 分類問題を生成する make_classification 2020-07-27 hawk タカの技術ブログ ランダムな n クラス分類の問題を生成 PCAの学習時にも使用した、make_classification() 関数で生成できます。 …
Python Python scikit-learn に含まれるデータセットを確認する 2020-07-26 hawk タカの技術ブログ データセット scikit-learn には、外部サイトからファイルをダウンロードせずに利用できる標準のデータセットが sklear …