データセット
scikit-learn には、外部サイトからファイルをダウンロードせずに利用できる標準のデータセットが sklearn.datasets に用意されています。
概要 | 問題 | 関数名 |
---|---|---|
ボストン住宅価格データセット | 回帰 | load_boston () |
虹彩データセット | 分類 | load_iris () |
糖尿病データセット | 回帰 | load_diabetes () |
ディジット データセット | 分類 | load_digits () |
物理運動の隠れ値のデータセット | 分類 | load_linnerud () |
ワイン データセット | 分類 | load_wine () |
乳癌ウィスコンシン州のデータセット | 分類 | load_breast_cancer () |
OpenMLからデータセットを読み込む
OpenML から「名前」または「データセットのID」でデータセットをフェッチします。fetch_openml() 関数を使います。
例えば iris をダウンロードする場合は以下を実行します。
from sklearn.datasets import fetch_openml
dataset = fetch_openml('iris')