経営学でベイズ推定はどう扱われているのか
ほぼ1年ぶりの更新です。これはStanアドベントカレンダー2019の9日目のエントリーです。
今年の出来事しては『たのしいベイズモデリング2』の14章を担当したことでしょうか。とても簡単な分析なのですが(重回帰分析)、自分と同じフィールドの人たちに気楽にベイズ推定を知ってもらえたらいいなという動機で書きました。
このエントリーも同じ動機で書きます。というか、自分用メモです。タイトルに「経営学」とありますが、私の興味のある領域はサービス業の顧客の行動です。広く言えば消費者行動論ですが、サービスに限定しています。
さて、サービス研究ではあまりベイジアンは見かけません。しかし、少しずつ広まっていくように感じています。今年7月に研究発表大会に参加したとき、たまたま入った会場で「なんでp値ないの?」「それはベイズで分析しているからです」みたいなやり取りを聞くことができました。そして、自分がよくチェックしている論文誌でついにベイズ推定を使った論文が出ました。これです。
www.sciencedirect.com
(Journal of Retailing and Consumer Servicesはほどよいレベルの論文誌で、興味もよくかぶっている好き)
今回はこの論文を少し紹介しようと思います(Stanと関係なくてスミマセン)。
この研究ではカスタマーエクスペリエンス(CX)が顧客による口コミ(WOM:Word of Mouth)に及ぼす影響を調べています。そして、CXは顧客同士のやりとり(PTP:Peer to Peer)・サービスの結果品質(SOQ:Service Outcome Quality)・顧客の心の余裕(POM:Peace of Mind)に影響を受けている仮説を元にベイズ推定による構造方程式モデリング(SEM)を行っています。超事前分布を使った階層が2つのアプローチです。
わかりにくいですが、図示(?)すると
PTP →
SOQ → CX → WOM
POM →
という感じになっていて、それぞれの潜在変数は質問票(コロンビア・ボゴタの大学生293人が対象で5件法)を使って探索的因子分析で出されています。その後のSEMもいっしょにSPSSで分析したと書かれていました。StanでもJAGSでもなくて残念・・・。
著者たちはベイズを使う理由を一段落を費やして書いています。メインになるところを引用します。
This approach has multiple advantages over traditional covariance based structural equation modeling, such as: (1) it does not rely on large-dimensional datasets to achieve sufficient statistical validity of the results (we model the relationships as unknown parameters, rather than estimates of an unobserved “true” value); (2) the two-hierarchy approach, where the unobserved follow the hypothesized relationships, is more aligned with reality, where declared perceptions are naturally noisy and non-homogeneous between participants; and (3) it provides a natural framework for incorporating prior information (including prior beliefs or biases and using imperfect information), which offers a more flexible approach to human psyche, learning and neural processing of information.
みらい翻訳を使って訳すと
(1) 結果の十分な統計的妥当性を達成するために大きな次元データセットに依存しない(観測されていない「真」値の推定値ではなく、未知のパラメータとして関係をモデル化する) (2) 観察されないものが仮定された関係に従うという2階層アプローチは宣言された知覚が必然的に参加者間でノイズが多く不均質であるという現実とより一致している (3) 事前情報(以前の信念または偏見を含み、不完全な情報を使用するさまを組み込むための自然な枠組みを提供し、人間の心理、学習、神経処理へのより柔軟なアプローチを提供する。
直訳ですが意味はくみ取れます。ここでいう2階層アプローチというのは、5件法のデータは多項分布から発生するとし、その超事前分布を正規分布かガンマ分布にすることらしい。
推定はサンプリングが40000(うちバーンイン期間が1000)、チェーン数は記述なし。収束したことを示すためにトレースプロットを見せていました(他の収束診断の指標はなし)。現時点では厳しい収束診断は求められていないようです。
知りたい4つのパラメータ(図の「→」)については事後分布の図を4つ載せて「ゼロになるのは無視できるレベルだから強いエビデンスがあるといえる」みたいに書かれていました("All the posterior densities for the β parameters have negligible mass below zero, indicating that there is strong evidence of significance of the relationships")。
その後は解釈が述べられて終わるのですが、全部で12ページの論文(実質8ページくらい)で比較的読みやすいように思いました。今後、詳しく読んでいこうと思います(一人で読むのはつらいので誰かいっしょに読んでください。遠くてもANAの便があるところだったら、どこにでも行きます)。
ということで自分用メモを終わります。以下、おまけの文献リスト。
【おまけ1】
Journal of Management では、過去2回ベイズ特集が組まれています。英語で書くときの例文探しに向いているかもしれない。
https://journals.sagepub.com/toc/joma/39/1
https://journals.sagepub.com/toc/joma/41/2
【おまけ2】
比較的新しい研究手法を扱うことも多い『組織科学』ではまだベイズ関連の論文が出ていないようです。時間の問題かな。
【おまけ3】
『マーケティング・サイエンス』の近年の論文では次の3つがベイズ関連です(『マーケティング・サイエンス』はハードルが高く読みこなせない・・・)