mlbenchのBreastCanserデータセットについてのメモ

胸の腫瘍が良性のものか悪性のものかを予測するためのデータセット。良性(benign)と悪性(malignan)の2つを9の変数から予測する。
データの内容は一列目から

  1. Id・・・データのサンプル
  2. Cl.thickness・・・腫瘍(?)の大きさ
  3. Cell.size・・・細胞の大きさ
  4. Cell.shape・・・細胞の形
  5. Marg.adhesion ・・・周辺への癒着
  6. Epith.c.size・・・上皮細胞のサイズ
  7. Bare.nuclei・・・裸の核(?)
  8. Bl.cromatin・・・クロマチン
  9. Normal.nucleoli・・・核小体
  10. Mitoses・・・体細胞分裂
  11. Class・・・ 良性か悪性かの腫瘍

全ての予測変数は1〜10までのカテゴリー(順序)変数に変更されている。