【追記あり】マルコフ連鎖の収束診断の基準と書き方メモ
マルコフ連鎖の収束って、どうやって書けばいいのかわからないので、ざっと調べることにしました。事の発端は、ShinyStanで収束診断(DIAGNOSE)をするとき3つの指標が示されるのですが、3つの指標全部が None じゃないといけないか、と r-wakalang で質問したことです。回答もいたただけて、もう少し書き方も含めて調べてみようとなりました。
r-wakalang はこちら。
github.com
ShinyStan の使い方は↓の33ページ以降が役立ちます。
cinii で検索したり、twitter で流れてきたものをかいつまんで読んでいます。全部で4つです。
●浅田他(2014)では「収束診断方法は複数あり~」「Gelman-Rubin統計量(R-hat)は1.1未満となっているときに、連鎖が定常状態に収束していると判断した」「Gelman-Rubin統計量(R-hat)の点推定値は~~のいずれも1.1以下であった」とあり、R-hatの計算方法として古谷(2010)、マッカーシー(2007)を参考せよとある。
●Namba et al.(2018)には「The value of Rhat for all parameters equalled 1.0, indicating convergence across the four chains.」とあります。
●清水(2017)には「サンプリング回数を1万回、バーンイン期間を5000回、マルコフ連鎖の数を4に指定して推定したところ、すべてのパラメータのR_hatが1となり、収束が確認された」とあり、脚注に「1に近いと収束したと判断される指標。1.05以下が目安とされる(Gelman, Carlin, Stern, &Rubin, 2004)」とBDAの第2版が引用されていました。
ちなみに、こちらではBDA第2版で「1.1より下」という基準が引用されています。ん~、とりあえず出張から帰ったら最新版のBDA3を確認する。
takehiko-i-hayashi.hatenablog.com
●渡辺他(2017)では「計算の結果,Gelman-Rubin 統計量はすべてのパラメータに対して1.01以下となり,各マルコフ連鎖が定常状態に収束していることを目視で確認した」とあり、BDA第3版が引用されていました。
ざっと調べたところ書き方も含め、1.1未満、1.0になってる、1.05以下と思ったよりいろいろありました。みどり本も帰ったら確認してみよう。
Bayesian Data Analysis, Third Edition (Chapman & Hall/CRC Texts in Statistical Science)
- 作者: Andrew Gelman,John B. Carlin,Hal S. Stern,Donald B. Rubin,David B. Dunson
- 出版社/メーカー: Chapman and Hall/CRC
- 発売日: 2011/12/15
- メディア: ハードカバー
- この商品を含むブログを見る
データ解析のための統計モデリング入門――一般化線形モデル・階層ベイズモデル・MCMC (確率と情報の科学)
- 作者: 久保拓弥
- 出版社/メーカー: 岩波書店
- 発売日: 2012/05/19
- メディア: 単行本
- 購入: 16人 クリック: 163回
- この商品を含むブログ (29件) を見る
参考文献
浅田正彦, 長田穣, 深澤圭太, & 落合啓二. (2014). 状態空間モデルを用いた階層ベイズ推定法によるキョン (Muntiacus reevesi) の個体数推定. 哺乳類科学, 54(1), 53-72.
Namba, S., Kabir, R. S., Miyatani, M., & Nakao, T. (2018). Dynamic displays enhance the ability to おりdiscriminate genuine and posed facial expressions of emotion. Frontiers in Psychology, 9, 672.
清水裕士. (2017). 二者関係データをマルチレベル分析に適用した場合に生じる諸問題とその解決法. 実験社会心理学研究, 56(2), 142-152.
渡辺 憲, 高麗 秀昭, 小林 功, 柳田 高志, 鳥羽 景介, 三井 幸成, 階層ベイズモデルを用いた丸太の天然乾燥における乾燥時間の推定および丸太の諸形質が乾燥性に及ぼす影響の評価, 木材学会誌, 公開日 2017/03/30, Online ISSN 1880-7577, Print ISSN 0021-4795, https://doi.org/10.2488/jwrs.63.63, https://www.jstage.jst.go.jp/article/jwrs/63/2/63_63/_article/-char/ja
追記(2018年6月16日)
BDA3を確認。Rhat ついては287ページに「閾値として1.1の設定で一般的によしとしてきた」と書いてあった。犬4匹本では,Rhat について(Gelman-Rubin統計量として)184ページで言及されている。みどり本では,206ページで言及されている。犬4匹本もみどり本もRhatの目安は1.1。豊田先生編著『基礎からのベイズ統計学』には190ページでGelman(1996)を引用して,Rhatが1.1ないしは1.2より小さいことが収束の判断として紹介されている。
データ解析のための統計モデリング入門――一般化線形モデル・階層ベイズモデル・MCMC (確率と情報の科学)
- 作者: 久保拓弥
- 出版社/メーカー: 岩波書店
- 発売日: 2012/05/19
- メディア: 単行本
- 購入: 16人 クリック: 163回
- この商品を含むブログ (29件) を見る
ベイズ統計モデリング: R,JAGS, Stanによるチュートリアル 原著第2版
- 作者: John K. Kruschke,前田和寛,小杉考司
- 出版社/メーカー: 共立出版
- 発売日: 2017/07/22
- メディア: 大型本
- この商品を含むブログ (2件) を見る
基礎からのベイズ統計学: ハミルトニアンモンテカルロ法による実践的入門
- 作者: 豊田秀樹
- 出版社/メーカー: 朝倉書店
- 発売日: 2015/06/25
- メディア: 単行本
- この商品を含むブログ (6件) を見る
というわけで,収束の判断のRhatについては1.1より小さいことが目安でよさそう(もちろんRhatだけで判断していいかどうかは別問題ということで)。