2013-01-01から1年間の記事一覧

QuantumGISに同心円をらくらくで描く方法

仕事柄、地図を記載するときはスケールバーでスケールを表すことよりも中心点からの同心円で表す事が多いです。 QuantumGISで同心円を描こうとするとき、通常は「ベクタ」→「空間演算ツール」→「バッファ」で 同心円を記述しますが、これだと単一の地点に円…

deldirでコンビニ位置データのボロノイ分割を行う。

R

この記事はRAdventCalendar2013に参加しています。 この記事は4日目になります。 これがはじめてというわけではないですがRのdeldirパッケージを使ってみました。 パッケージdeldirはドロネー(Delaunay)分割とディリクレ(Dirichlet)分割(ボロノイ分割、テ…

Rのspdepのパッケージを使って、コンビニのドミナント出店戦略を定量化する

R

こんにちは、集計野郎マクガイバーです。 コンビニの出店戦略ではセブンイレブンのドミナント戦略が有名で公式ホームページにも記載してあるくらいです。 しかし、その実態に関してはどの程度そうであるのかといったような厳密な検証情報はなく、特定都市に…

arulesSequenceをWindowsRStudioから呼び出せるように修正するパッチ

R

わんばんこ、年末も近づいてきてアソシエーション真っ盛りの季節ですね! さて、RのarulesSequenceパッケージのcspade関数をWindows7でRStudioから呼び出そうとしたところ、エラーになる事象が発生。 同様の事象は海外でも報告されている。(以下のリンクを…

1次元ハイブリッドモンテカルロを実装してみた

1次元HMCのコードを書いたのでメモ動機はNUTSに挑戦する前にパラメータと尤度、ハミルトニアンの振る舞いについて理解しておきたかったので 偉大なる先輩のblogはこちら ハイブリッドモンテカルロを実装してみた http://d.hatena.ne.jp/koh_ta/20121116/1353…

Stanチュートリアルの資料を作成しました。

前回のBUGS/Stan勉強会#1でご要望のあったStanチュートリアルの資料を作成しました。 StanTutorial from Teito Nakagawa

PostGISのよく使う機能をまとめた

PostGISの中でも頻繁に使用する機能について調べたので、参照用にSQLとその使用方法についてまとめておきます。 GISは空間参照系や楕円体のあたりなど技術的にもマニアックだが、とりあえず理解している範囲内で基本的なことをメモ。 PostGISについて Posgre…

第1回BUGS/Stan勉強会を開催しました

こんにちはStanエヴァンジェリストの駆け出しベイジアンです。掲題の通り、第1回BUGS/stan勉強会を開催したので報告します。 BUGS/Stanって何? 改めて、BUGS/Stanとは何ぞやということを説明しておくとベイズ推定による柔軟なモデリングを実現するためのDSL…

ドラマの視聴率を予測する(2)〜stanを用いて、キャストの視聴率を算出する。

こんにちは、進撃のアナリストです。 前回の記事から早4ヶ月、今回もドラマの視聴率データを用いて、キャストの視聴率を算出したいと思います。 今回は前回とは異なりstanを用います。前回はキャスト視聴率は単なる按分平均を用いて算出していました。 今回…

データサイエンティストを超えた!Excelの条件付き書式設ティストに俺はなる!(2)〜作成したマクロをボタンで呼び出せるようにする。

こんにちは、マクロマンです。 前回の続きとして、前回作成した関数をエクセルにてボタンで呼び出す手続きをまとめたのでメモ 前回作成したマクロは業務内容によっては、結構使う事が多い*1です。 わざわざ関数を直接呼び出すのが面倒なのでボタン一つで呼び…

BUGS/Stan勉強会を開催します/Intoroduction of Stan

こんにちは、三十路手前のアナリストです。掲題の通り、9月29日にBUGS/Stan勉強会を開催します。 ATNDリンク BUGS/stan勉強会 #1 内容や趣旨についてはATNDを見てもらうとわかると思いますが、 独学だと理解が危ういのでいろいろな方にご指摘頂ける勉強会の…

Windows8にrstanをインストールする。

こんにちわ。BUGSにはまってしまって大変なアナリストです。どうにもこうにもWINBUGSが遅くていや遅すぎて使えないので、今日はRからstanを叩くrstanをインストールしてみたいと思います。環境はWindows8 64bitです。1.Rtoolsをインストール 以下のサイトか…

Rのflexmixパッケージで混合分布モデルによるクラスタ分析を行う。

R

Rで混合分布クラスタリングを行うときに有名なパッケージとしてflexmixが存在します。この記事ではflexmixの簡単な使い方を解説します。 flexmix自体は潜在クラス回帰を行うパッケージなのですが、混合分布クラスタリングを行うことも出来ます。 flexmixはR…

ドラマの視聴率を予測する(1)〜初回視聴率を予測して、キャストの視聴率を算出する。

こんにちは、ソーシャルビッグデータサイエンティストです。 最近のデータ解析ブームの流れにのって何か面白いデータ解析でもやってみようと思い、データサイエンティストこじらせた結果、 「今まで機械学習的な方法論使ってないところに機械学習的な方法論…

PostgreSQLの集約関数で来店日付の間隔をらくらく集計

ある論文によると、顧客が優良顧客であるかそうでないかの定義に、顧客の来店間隔の標準偏差を用いることができるそうです。 また、RFM分析をやっていても、Rは現在からのスナップショットなので、一ヶ月に一回しか来ない人に対して「もう、一ヶ月も来ていな…

協調フィルタリングについてまとめてみた。

A Survey of Collaborative Filtering Techniques(Xiaoyuan Su and Taghi M. Khoshgoftaar, 2009,Advances in Artificial Intelligence)仕事で協調フィルタリングについて調べる必要が出てきたのだが、あまりよい日本語の文献を見つけられなかったため(後に…

データサイエンティストを超えた!Excelの条件付き書式設ティストに俺はなる!〜VBA行別列別条件付き書式設定自動化マクロ

VBA

闇の中答えを探し求めている〜こんにちはVBA界の若頭です。 データ解析しているとExcelのことが愛おしくなって、「お前だけはもう離さない」なんてことになりますよね。 そんな僕らの友達、Excelの素晴らしい機能の1つに「条件付き書式設定」があります。 こ…

IT苦手な人のためのWindows+gitでRStudioによるバージョン管理入門

R

『何を求め、どこへ行くのか』〜こんにちはR界の若頭です。 WindowsでRStudioを使ってRのコードを書いている人って、多いと思います。IT苦手だけど、データマイニングしたいという人に多いんじゃないでしょうか。で、RStudioにいつからだったかバージョン管…

究極のデータサイエンティストVS至高のデータサイエンティスト

ネットで面白いコピペを発見したので貼り付けておきますね。 山岡「こちらが我々の考える究極のデータサイエンティストです。」 京極「なんやて、経済学部出身やないか!ITに統計学、業務、この中で先の二つの技術的素養が必要なデータサイエンティストには…

Rのデータフレームに対してSQLのUNIONとINTERSECTを実行する。

R

タイトルのまんまの問題で恐ろしくはまって自作関数をつくろうとしていたので、メモ参考:R help - union of two data frames http://r.789695.n4.nabble.com/union-of-two-data-frames-td848979.html #2つの異なるデータフレームを作成する df1 <- data.fr…