読者です 読者をやめる 読者になる 読者になる

Knowledge As Practice

顧客幸福(customers' well-being)を軸にサービス研究をしている社会人博士学生(JAIST@東京)のブログ。

統計的因果推論の勉強会 第2回を開催しました!

統計的因果推論 統計分析

宮川本と星野本の第2章が今回の内容です。毎月それぞれ1章ずつ読み進めています。参加者は私を含めて7人くらい。減ると思って心配していましたが,前回より増えてよかったです。

 
使用したスライドはこちらです。

 
speakerdeck.com

 
第2章はどちらも導入部の終わり,といった感じです。キーワードは

  • 潜在反応モデル(反実仮想モデル)
  • 共変量
  • 傾向スコア

 
でしょうか。例題として,簡単な傾向スコアによる分析もやってみました。R 仲間が増えないかな。我々は文系統計学エンドユーザーなので,数式のところは理解が不足してしまいます。宮川本も星野本も,読んでいて「?」なところは多く出てきます。それでも,統計的因果推論は今後の役に立つかも,ということでコツコツ学んでいます。

 
今回は「強く無視できる割り当て条件(強い意味での無視可能性)」への理解がイマイチでした。どうして傾向スコアで条件付ければ交絡のことを考えなくていいのか,というのがボンヤリしています。

 
きっとこれは星野本3章を読んでいけば解決できるはず,という期待を持ちながら来月に向けて勉強を続けていきます。

 
P.S.
スライドのアップ先を Slideshare から Speaker Deck に移りました。SlideshareMac で作ったPDFで日本がうまく表示されなかったので(解決策はあるみたいですが,面倒ですね)。

統計的因果推論の勉強会の1回目を開催しました!

統計的因果推論 統計分析 参加報告

2016年5月28日に統計的因果推論のクローズドな勉強会を開催しました。参加者は5名でした。私を含め全員が非専門家ですので「学び合い」がキーワードです。

 
対象は下のスライドにあるとおり,経営学を学ぶ統計学エンドユーザーです。進行は,私が宮川本と星野本を1章ずつまとめたものを発表し,それについて不明点の質疑応答を行うというようにしました。印象としては,潜在反応モデル/反実仮想モデルが腑に落ちるかどうかが重要のようです。

 

www.slideshare.net

 
やはり,こういうのは発表する人がいちばん勉強になるような気がします。いろいろと質問を受けて,刺激にもなりました。2冊とも第1章はガイダンスみたいなものなので,本番は翌月の第2章からです。来月もがんばります。

統計的因果推論の勉強会の前準備

社会人博士 書籍紹介 読んだ論文 統計的因果推論

きっかけは,先月の月1ゼミでした。3時間のゼミのうち,はじめの1時間は輪読をしています。その中で私が「統計的因果推論というものがあるらしい」と情報共有をして,その後「日本社会心理学会 春の方法論セミナー」のページを紹介したところ,先生が興味を示されました。そして,5月からゼミ前の90分間を使って,自由参加で統計的因果推論の勉強会(1回につき1章ずつ)をスタートすることにしました。私が音頭を取って…*1

 
私を含め,参加者となるのは経営学(主にマネジメント)を勉強・研究しに来ている社会人学生なので,基本,文系が多いです。統計分析の基本知識を一緒に復習しながら,勉強会を進めていく予定です。

 
まず,統計的因果推論勉強会の前準備をするために,資料にあたりました。そのまとめメモとして,書き残しておきます。書籍,ブログ・スライド,Cinii で検索した日本語論文の3タイプに分けます。

 

書籍

代表的なのは次の2冊。必ず紹介されています。もう紹介も不要なレベル。

統計的因果推論―回帰分析の新しい枠組み (シリーズ・予測と発見の科学)

統計的因果推論―回帰分析の新しい枠組み (シリーズ・予測と発見の科学)

 
ただし,数学を学部のときに学んでいない人にはきついです。宮川本は6章より先はサッパリ(目は通した)。現時点では,宮川本・星野本も合わせて3割くらい理解できたかどうか,というところ。私のような文系には次の森田本でイメージをつかむのがよさそうです。16章に説明があります。ただし,アニメが好きな人に限ります。

 
もう1つ日本語ではタイトルど直球の本があります。上記2冊よりはやさしい印象ですが,数式はけっこう出てきます。この本は4割くらい理解できたかもしれません。

統計的因果推論 (統計解析スタンダード)

統計的因果推論 (統計解析スタンダード)

 
もっと文系にやさしく統計的因果推論を説明している本はないかと,洋書もチェックしました。次の2つが読みやすそうでした。Kindle のサンプルをチェック後,まず私は ”Primer” のほうを購入して読み進めています。今年出たばかりだし,著者の1人が Judea Pearl なので,大きなまちがいはないだろう,そして薄い(印刷版だと160ページくらい)というのが選定理由です。とりあえず,1章まではついていけてます。

Counterfactuals and Causal Inference: Methods and Principles for Social Research (Analytical Methods for Social Research)

Counterfactuals and Causal Inference: Methods and Principles for Social Research (Analytical Methods for Social Research)

Causal Inference in Statistics: A Primer

Causal Inference in Statistics: A Primer

 

ブログ

Google で「統計的因果推論」で検索。結果の10ページ目まで確認して,私にとって参考になるのは次のものでした。

 
星野本を4回に分けてまとめてくれています。やっぱり難しい。いつかはわかるようになりたいです。
smrmkt.hatenablog.jp

 
こちらも星野本の実践例。もともと本にRのコードが付いているから,実際にやってみるのができるんですね。
www.fisproject.jp

 
こちらも読み応えがあります(まだ読み切れてない)。この分野は林先生のブログがとても勉強になります。
takehiko-i-hayashi.hatenablog.com

 
清水先生の LiNGAM まではたどり着けていません…(理解力と数学力が)。

 

論文など

検索すると,宮川先生・黒木先生を中心にいろいろ出てきます。でも,まだ自分には難しくて読めない。次のものはなんとか読めるんじゃないか,文系でも興味深いじゃないかというものをピックアップしました。少しずつ読んでいこうと思います(難しくて挫折する恐れ大)。

 
社会科学分野における統計的因果推論のためのマッチング手法の活用 : 企業金融の研究における適用とその問題
ci.nii.ac.jp

 
「特集 因果的説明とベイジアンネットワーク」の以下の5本(『哲学論叢』35巻,pp. 81–141,2008)

 
因果とは何かをめぐる哲学的論争(1)D.ルイスの反事実的条件法による分析とその批判
http://repository.kulib.kyoto-u.ac.jp/dspace/handle/2433/96279

 
因果とは何かをめぐる哲学的論争(2)メンジーズの機能主義とそれに対する批判
http://repository.kulib.kyoto-u.ac.jp/dspace/handle/2433/96278

 
哲学者のためのベイジアンネットワーク入門
http://repository.kulib.kyoto-u.ac.jp/dspace/handle/2433/96277

 
ベイジアンネットワーク、共通原因、そして因果的マルコフ条件
http://repository.kulib.kyoto-u.ac.jp/dspace/handle/2433/96276

 
ベイジアンネットワークと確率の解釈
[
http://repository.kulib.kyoto-u.ac.jp/dspace/handle/2433/96275]

 
あと2つほど。
因果効果におけるバックドア/フロントドア基準について
http://www.math.chuo-u.ac.jp/\~sugiyama/14/14-01.pdf

 
<研究ノート>因果推論の理論と分析手法
ci.nii.ac.jp

*1:とても大きなプレッシャーですが,これくらいやらないと動かないので,がんばります。ちなみに裏目標として,他のゼミ生の方にも統計分析に興味を持ってもらって,こっそりR仲間を増やし,いっしょにベイズ統計を勉強できるようになりたいです。

博士後期課程に入学しました

社会人博士

2016年4月から JAIST 東京社会人コース 博士後期課程の学生になりました。知識科学系です。

 
たぶん今後、大学院名に「北陸」が付いているから、「場所は東京なんですよ」と誤解を解くセリフを何回もする難行が待ち構えてるんだと思います。また、所属研究科が「先端科学技術研究科」なので「自分は文系です。経営、マーケティング系の研究やってます」と誤解を解くセリフを何回もする難行も待ち構えてるんだと思います。

 
私の場合は入学までこのようなスケジュールでした。

 
2015年3月 指導をお願いしたい先生とコンタクト・面会

11月 出願

12月 入学試験

2016年1月 合格発表(うろ覚え)

2~3月 いろいろ手続き(1月からゼミに見学参加)

4月 入学・履修手続き・コースワークスタート!

 
昨年の春にDBSを修了したので、1年間ブランクがあります。最終的にJAIST 東京社会人コースにしたのは、次の3つの理由+α*1です。

  • 当然、学生は社会人のみ。
  • サービス研究が盛ん。
  • 雰囲気がカリカリ・ピリピリしてない。

 
基本、自分の研究は量的研究がメインですが、質的研究法にも触れて、幅を広げたいところ。大学院名に「先端科学」が入っているのに、人類学や哲学やデザインの先生がいる JAIST は私にはよさそうです。

 
希少種である社会人博士後期課程の生活は今後もアップしていこうと思います。なお、入学したのはこちらです。 「準備中」という表示がさみしい…。

先端知識科学プログラム | 北陸先端科学技術大学院大学 東京サテライト

*1:偶然にも自分のブログタイトルに「知識」が入ってた。

サービス学会 国内大会 第4回@神戸に参加してきました

サービス研究 参加報告

ここ最近、統計の勉強そっちのけでずっと参加報告ばかりですが、そういう時期なんです…。2016年3月28~29日に神戸大学で開催されたサービス学会第4回国内大会に参加しました。実際に参加したのは29日だけです。本当は2日間にしたかったんですが、仕事やら何やらで1日に…。社会人学生あるあるです。

 
今回のサービス学会 国内大会の概要はこちら。
http://ja.serviceology.org/events/domestic2016.html

 
サービス学会はマーケティング学会と同様、実務家がとっても多いです。なので、社会人学生*1も参加しやすい。発表もいろいろ。完全に数理なものもあれば、現場密着の発表もあります。分野も幅広い。どちらかというと工学系が多いですが、経営系もがんばっています。大会プログラムは誰でも見ることができるので、見てみてください。

 
個人的には、ポスター発表が好き。直接いろいろと質問できるので。自分のフィールドの歯科医院に関する研究がいくつかあったのは驚きでした。自分くらいしかやってないだろうと思っていたので。

 
なお今回参加して、いちばん印象に残ったのが、学会長がいちばん前の席に座って積極的に質問をされていたことです。これは学会長より年下の自分が後ろの席でこそこそ聞いている場合ではないな、と反省した次第。今年度はがんばります…。

*1:まあ、実務家ですから当たり前なのですが。

行動計量学会 春の合宿セミナーに参加

参加報告 統計分析

機械学習(Aコース)ではなく、統計分析のコース(Bコース)を選びました。2016年3月25日~27日の3日間開催されるのですが、仕事やその他の都合で25日夜~26日の夕方までの参加です。

 
概要はこちらのページにあります。
http://www.bsj.gr.jp/event/spring_semi.html#18th

 
HAD はこれまでちょくちょく使っていたのですが、開発者直々に教えていただけるよいチャンスだと思って参加した次第です。ちなみに、私の使い方は

  • ざっとデータを HAD でいじってみて、あたりをつける。
  • その後、R や SPSS などで確かめる。

 
という、たぶんよくある使い方をしています。HAD の使い方で今回いちばんヒットしたのは、データの読み込みボタンがあること。ぜんぜん気づきませんでした…。とても便利*1

 
春の合宿セミナーについての他の感想としては、こういう会にもっと社会人大学院生が出てくれたらいいなということです*2。ふだん忙しいからこそ、ちょっと時間をがんばって作って、1日でもいいから集中して学べる環境にいると、効率よく勉強できると思います。

 
それに直接、講師の先生に質問できるいい機会です。講義修了後の懇親会的な催しで、いくつか質問に答えていただけて、統計分析の悩みがすっきりしました。やっぱりフットワーク軽く、詳しい先生のところに訊きに行くのはとても大事だなと再確認できた2日間でした。

*1:基本、コピペで済むんですが、まれにショートカットキーを押し間違えて、貼り付けできないことがある自分には便利。

*2:機械学習のコースには社会人が多いように思いました

量的アプローチによる価値共創の研究発表@第6回知識共創フォーラム in 金沢

ベイズデータ分析 ノンプログラマーのためのR入門 サービス研究 統計分析

先週(2016年3月12〜13日),金沢で開催された第6回知識共創フォーラムで発表をしてきました。相馬・清水(2015)*1に大きく影響を受けた分析の結果発表でした。もともと潜在ランク理論はどこかで知っていて,自分の研究に使えそうだなぁと思っていたところに相馬・清水(2015)が出たので,その時はとても驚きました。

 
発表タイトルは「価値共創の促進に意味はあるか?」です。情報学系な人には参考にならないと思いますが,経営学系で量的な研究をされる方(本当に少ないと思うけれど…)の少しでも参考になれば,と思います。

 
発表に使ったスライドは下です。

www.slideshare.net

 

分析の方法・ツールなど

分析の方法・ツールなどは次のとおりです。過去,本ブログや Kobe.R で発表してきたまとめ的な分析を行いました。

 

分析の方法 使用したツール
潜在ランク理論 exametrica
ウィルコクソンの順位和検定 R, wlicox.test()
クラスカル・ウォリス検定 R, kruskal.test()
線形連関の検定 R, coin::lbl_test()
ベイズ推定による多項ロジスティック回帰 R, brms::brm()
ロジスティック回帰(普通の) R, glm()

 
今回の発表はケーススタディが多い(ような気がする)共創研究に量的アプローチを行った例です。分析に使ったアンケートは1〜7のリッカート尺度なので,独立性の検定にはノンパラメトリック検定を使っています。

 

ベイズ推定による多項ロジスティック回帰

brms パッケージを使用しました。以下のコードで一発です。下でも書きましたが,brm()のオプションはまだ理解していません。

library(brms)
rstan_options(auto_write = TRUE)
options(mc.cores = parallel::detectCores())
fit1 <- brm(qol ~ kyousou, data = d, family = categorical)

 
使用したデータはこちらに置いておきました。気になる方はお試しください。

www.dropbox.com

 

分析でわからないところ

誰にも聞けなかった(というか,周りにわかる人がいない)ため,自信がない・わからないところは次のとおりです。

  • 最後の2つの分析(多項ロジスティックと普通のロジスティック回帰)では,アンケート結果を間隔尺度として扱いました。尺度の扱いに一貫性がないのはどうかなぁ,と思っていますが判断がつきません…。

  • さらに,多項ロジスティック回帰はアンケート結果を名義尺度にしてしまいました。これも適切かどうか…。1〜7のうちどの選択肢が選ばれるかという観点から多項ロジスティック回帰でやってみようとした次第です。

  • 多項ロジスティック回帰はベイズ推定を使ってやってみましたが,オプションは初期値ままです。収束はしたので大丈夫かとは思いましたが,適切な初期設定を知りたいところです。

 

発表を終えて

実は,今回が初めての口頭発表でした。聞いてくれた方のうち,おもしろいと思ってくれた方はいたようでホッとしました。どのへんがおもしろかったか,ちゃんと確認しておけばよかった。また今回の発表では因果関係を示したわけではないので,因果を調べられるようになりたいものです。

*1:相馬敏彦・清水裕士(2015)「ワンランク上のブランド・コミットメントはどう形成されるのか? ─顧客の潜在ランクへの分類と拡張版投資モデルのブランドの適用─」『マーケティングジャーナル』第35巻第3号,75-94頁.

クリエイティブ・コモンズ・ライセンス
この 作品 は クリエイティブ・コモンズ 表示 - 継承 4.0 国際 ライセンスの下に提供されています。