データベース Japan.Rで発表してきました。
2011/11/26のJapan.Rで発表してきました。
当日の場所は去年と同じ立川の統計数理研究所、新宿から30分ほどでしょうか。
当日は、午前中から@SakaueさんのR入門セッションがあったようです。
私は朝が弱いので参加していません...
というわけで午後のブースセッションからの参加です。
私が発表した内容はなぜかRではなく、データベース
MySQLで情報分析用のデータベースを構築しようという話でした。
とにかく、データを分析しようとしている方にはデータベースの構築に関して
知識を身に付けることをオススメします。
特に、業務で大量のデータを処理している方は
実際にデータベースを正しい方法論で構築することをオススメします。
データベースのソフトに関しては、色々ありますが
データ量に応じて、Excel→SQLite→MySQLをオススメします。
ただ、複数人でデータを共有するならMySQLがよいでしょう。
とはいえ、まぁDBMSとしては、ユーザーが使いやすいと
思うのであれば、なんでもいいと思います。
情報分析用のRDBMSでのデータベース構築にはいろいろお作法があって、
データウェアハウスという分野で語られています。
スキーマをスタースキーマで構築して、スタークエリーで問い合わせるといったような話題です。
それと、MySQL上のデータをデータマイニング用にRでロードする方法の解説が、今回の資料です。
実際にはここに書かれていること+ETLと呼ばれるデータの更新、追加処理に関する
話も必要なのですが、それはあまりにもアドバンスなので省略しています。
情報分析をするけれどもデータベースは苦手という方は是非チャレンジしてみてください。
何かご質問などあれば、コメントでお気軽に問い合わせください。