Rstan でベイズ分析を行うための環境を作る方法メモ
『基礎からのベイズ統計学』第6章以降はベイズ統計学を使った応用例(たぶん基本的で大事な)が紹介されています。こういうのは、実際に自分で分析をして結果を見るのが大切です。ただ『基礎からのベイズ統計学』では、分析環境を整える方法は省略されています。
私は環境構築にちょっと手間取ってしまいました。私のようなプロではない*1方向けに、参考になるかもしれないので、ベイズ統計分析の環境を作るためのメモを書いておきます。
なお、R のバージョンは 3.2.1、Rstudio のバージョンは 0.99 。2015年8月4日時点での情報です。R と Rstudio に関する情報はあふれているので省きます。環境構築は2ステップです。
1.Rstan パッケージの導入
『基礎からのベイズ統計学』では、Rstan
を使って MCMC の計算を行います。Rstan のインストールは簡単です。次のコードで一発OK。
install.packages("rstan")
最近まではちょっと大変だったそうですが、いまは便利。
2.Rtools のインストール
次に必要なのは、Rtools。これには1つ、気をつけることがあります。こちらの小杉先生のスライド14ページ目に載っていることを忘れないでください。
Rtools はこちらから最新版をダウンロードします。
https://cran.r-project.org/bin/windows/Rtools/
そしてインストール。基本「次へ」でいいのですが、下の画面にだけ注意。「EDIT the system PATH」は必ずチェックをつけておきます。
あとは「次へ」とインストールだけ。インストールが完了したら、ベイズ分析をRで行うための環境が整います。
実際に分析をやってみる。
『基礎からのベイズ統計学』の本文中にある分析を行うためのRスクリプトは朝倉書店さんのページからダウンロードできます(右下のほう)。
「chap6」フォルダにある「chap6.R」をテキストエディタで開いて、「###6.1.1 正規分布の平均に関する推測」のスクリプトを Rstudio のソースエディタにコピペします。「data611.R」と「model611.stan」の2つのファイルは R の作業ディレクトリに置いておきます。作業ディレクトリは
getwd()
で示される場所です。
あとは、先ほど Rstudio のソースエディタにコピーしたコードを実行します。まず library(rstan)
から cha<-1
までを実行*2。ここまで一瞬です。次の fit <- stan(file = ~~~~
が本番で、分析が終わるまで少し時間がかかるので、待ちましょう。
こんな表示が出てきたら成功です。私の場合は30秒ほどかかりました。
あとは print(~~
や traceplot(~~
で分析結果や憧れのかっこいいトレースラインが表示されます。黒で表示されると思っていたので、オレンジ色でビックリ。
はじめてのMCMC、成功バンザイ!
【後記】
実は、Rtools は必要にかられて以前にインストールしていたので大丈夫だと思っていたのですが、うまく分析できませんでした。
調べてみると Rtools のインストール時に間違ったことをしていて、TJO さんの過去エントリーと同じ現象が出ました。
tjo.hatenablog.com
上記ブログを見て環境変数をいじってもダメだったので、Rtools をいったんアンインストールしたあと、今回のエントリーのように再インストールして解決しました。