データベース Japan.Rで発表してきました。

2011/11/26のJapan.Rで発表してきました。


当日の場所は去年と同じ立川の統計数理研究所、新宿から30分ほどでしょうか。


当日は、午前中から@SakaueさんのR入門セッションがあったようです。
私は朝が弱いので参加していません...


というわけで午後のブースセッションからの参加です。


私が発表した内容はなぜかRではなく、データベース
MySQLで情報分析用のデータベースを構築しようという話でした。


とにかく、データを分析しようとしている方にはデータベースの構築に関して
知識を身に付けることをオススメします。


特に、業務で大量のデータを処理している方は
実際にデータベースを正しい方法論で構築することをオススメします。


データベースのソフトに関しては、色々ありますが
データ量に応じて、ExcelSQLiteMySQLをオススメします。
ただ、複数人でデータを共有するならMySQLがよいでしょう。
とはいえ、まぁDBMSとしては、ユーザーが使いやすいと
思うのであれば、なんでもいいと思います。


情報分析用のRDBMSでのデータベース構築にはいろいろお作法があって、
データウェアハウスという分野で語られています。


スキーマをスタースキーマで構築して、スタークエリーで問い合わせるといったような話題です。
それと、MySQL上のデータをデータマイニング用にRでロードする方法の解説が、今回の資料です。



実際にはここに書かれていること+ETLと呼ばれるデータの更新、追加処理に関する
話も必要なのですが、それはあまりにもアドバンスなので省略しています。


情報分析をするけれどもデータベースは苦手という方は是非チャレンジしてみてください。


何かご質問などあれば、コメントでお気軽に問い合わせください。