Knowledge As Practice

JAIST(東京)で Transformative Service Research に取り組んでる社会人大学院生の研究・勉強メモ

【追記あり】マルコフ連鎖の収束診断の基準と書き方メモ

マルコフ連鎖の収束って、どうやって書けばいいのかわからないので、ざっと調べることにしました。事の発端は、ShinyStanで収束診断(DIAGNOSE)をするとき3つの指標が示されるのですが、3つの指標全部が None じゃないといけないか、と r-wakalang で質問したことです。回答もいたただけて、もう少し書き方も含めて調べてみようとなりました。

 
r-wakalang はこちら。 github.com

 
ShinyStan の使い方は↓の33ページ以降が役立ちます。

www.slideshare.net

 
cinii で検索したり、twitter で流れてきたものをかいつまんで読んでいます。全部で4つです。

 
●浅田他(2014)では「収束診断方法は複数あり~」「Gelman-Rubin統計量(R-hat)は1.1未満となっているときに、連鎖が定常状態に収束していると判断した」「Gelman-Rubin統計量(R-hat)の点推定値は~~のいずれも1.1以下であった」とあり、R-hatの計算方法として古谷(2010)、マッカーシー(2007)を参考せよとある。

 
●Namba et al.(2018)には「The value of Rhat for all parameters equalled 1.0, indicating convergence across the four chains.」とあります。

 
●清水(2017)には「サンプリング回数を1万回、バーンイン期間を5000回、マルコフ連鎖の数を4に指定して推定したところ、すべてのパラメータのR_hatが1となり、収束が確認された」とあり、脚注に「1に近いと収束したと判断される指標。1.05以下が目安とされる(Gelman, Carlin, Stern, &Rubin, 2004)」とBDAの第2版が引用されていました。

 
ちなみに、こちらではBDA第2版で「1.1より下」という基準が引用されています。ん~、とりあえず出張から帰ったら最新版のBDA3を確認する。 takehiko-i-hayashi.hatenablog.com

 
●渡辺他(2017)では「計算の結果,Gelman-Rubin 統計量はすべてのパラメータに対して1.01以下となり,各マルコフ連鎖が定常状態に収束していることを目視で確認した」とあり、BDA第3版が引用されていました。

 
ざっと調べたところ書き方も含め、1.1未満、1.0になってる、1.05以下と思ったよりいろいろありました。みどり本も帰ったら確認してみよう。

Bayesian Data Analysis, Third Edition (Chapman & Hall/CRC Texts in Statistical Science)

Bayesian Data Analysis, Third Edition (Chapman & Hall/CRC Texts in Statistical Science)

  • 作者: Andrew Gelman,John B. Carlin,Hal S. Stern,Donald B. Rubin,David B. Dunson
  • 出版社/メーカー: Chapman and Hall/CRC
  • 発売日: 2011/12/15
  • メディア: ハードカバー
  • この商品を含むブログを見る

 

参考文献

浅田正彦, 長田穣, 深澤圭太, & 落合啓二. (2014). 状態空間モデルを用いた階層ベイズ推定法によるキョン (Muntiacus reevesi) の個体数推定. 哺乳類科学, 54(1), 53-72.

Namba, S., Kabir, R. S., Miyatani, M., & Nakao, T. (2018). Dynamic displays enhance the ability to おりdiscriminate genuine and posed facial expressions of emotion. Frontiers in Psychology, 9, 672.

清水裕士. (2017). 二者関係データをマルチレベル分析に適用した場合に生じる諸問題とその解決法. 実験社会心理学研究, 56(2), 142-152.

渡辺 憲, 高麗 秀昭, 小林 功, 柳田 高志, 鳥羽 景介, 三井 幸成, 階層ベイズモデルを用いた丸太の天然乾燥における乾燥時間の推定および丸太の諸形質が乾燥性に及ぼす影響の評価, 木材学会誌, 公開日 2017/03/30, Online ISSN 1880-7577, Print ISSN 0021-4795, https://doi.org/10.2488/jwrs.63.63, https://www.jstage.jst.go.jp/article/jwrs/63/2/63_63/_article/-char/ja

 

追記(2018年6月16日)

BDA3を確認。Rhat ついては287ページに「閾値として1.1の設定で一般的によしとしてきた」と書いてあった。犬4匹本では,Rhat について(Gelman-Rubin統計量として)184ページで言及されている。みどり本では,206ページで言及されている。犬4匹本もみどり本もRhatの目安は1.1。豊田先生編著『基礎からのベイズ統計学』には190ページでGelman(1996)を引用して,Rhatが1.1ないしは1.2より小さいことが収束の判断として紹介されている。

ベイズ統計モデリング: R,JAGS, Stanによるチュートリアル 原著第2版

ベイズ統計モデリング: R,JAGS, Stanによるチュートリアル 原著第2版

基礎からのベイズ統計学: ハミルトニアンモンテカルロ法による実践的入門

基礎からのベイズ統計学: ハミルトニアンモンテカルロ法による実践的入門

 
というわけで,収束の判断のRhatについては1.1より小さいことが目安でよさそう(もちろんRhatだけで判断していいかどうかは別問題ということで)。

クリエイティブ・コモンズ・ライセンス
この 作品 は クリエイティブ・コモンズ 表示 - 継承 4.0 国際 ライセンスの下に提供されています。