mlbenchのBreastCanserデータセットについてのメモ
胸の腫瘍が良性のものか悪性のものかを予測するためのデータセット。良性(benign)と悪性(malignan)の2つを9の変数から予測する。
データの内容は一列目から
- Id・・・データのサンプル
- Cl.thickness・・・腫瘍(?)の大きさ
- Cell.size・・・細胞の大きさ
- Cell.shape・・・細胞の形
- Marg.adhesion ・・・周辺への癒着
- Epith.c.size・・・上皮細胞のサイズ
- Bare.nuclei・・・裸の核(?)
- Bl.cromatin・・・クロマチン
- Normal.nucleoli・・・核小体
- Mitoses・・・体細胞分裂
- Class・・・ 良性か悪性かの腫瘍
全ての予測変数は1〜10までのカテゴリー(順序)変数に変更されている。