統計的因果推論の勉強会 第3回を開催しました!
最近,ブログは月1更新。仕事と学生はなんとか両立できていると信じたい・・・。
さて,先日,「経営学系統計学エンドユーザー*1のための統計的因果推論 勉強会」第3回を実施しました。これで3回目。クローズド*2。
今回の内容は宮川本と星野本の第3章です。宮川本はパス解析,星野本は傾向スコアについて。星野本は核心に入ってため,難しく,一気に第3章全部はつらいため,60〜69頁をやりました。数式が増えて,本当につらい。
宮川本は構造方程式モデリング(SEM)の話を中心に組んでみました。みんなが SEM に慣れているわけではないので3つ実例を見ながら進行。また,みかけの相関と選択バイアスについても復習をしました。
ちなみに因果ダイアグラムを用いたみかけの相関と選択バイアスについては『岩波DS Vol.3』の中の「相関と因果と丸と矢印のはなし はじめてのバックドア基準」が感動的にわかりやすいです。これは次回の勉強会でみんなで読んでみようと思っています。
- 作者: 岩波データサイエンス刊行委員会
- 出版社/メーカー: 岩波書店
- 発売日: 2016/06/10
- メディア: 単行本(ソフトカバー)
- この商品を含むブログ (3件) を見る
スライドはこちらです。
なお,星野本第3章の詳解は↓に載っています。私にはかなり難しくて,理解が厳しい・・・。
d.hatena.ne.jp
また,こちらのブログ「調査観察データにおける因果推論」のシリーズも詳しく解説されています。
smrmkt.hatenablog.jp
星野本でやれることはやったと思い,『岩波DS Vol.3』を読み直してみるのがいい気がしてきました。次回は岩波DSを題材にもう少し傾向スコアについて勉強を進めていこうと思います。
統計的因果推論の勉強会 第2回を開催しました!
宮川本と星野本の第2章が今回の内容です。毎月それぞれ1章ずつ読み進めています。参加者は私を含めて7人くらい。減ると思って心配していましたが,前回より増えてよかったです。
使用したスライドはこちらです。
第2章はどちらも導入部の終わり,といった感じです。キーワードは
- 潜在反応モデル(反実仮想モデル)
- 共変量
- 傾向スコア
でしょうか。例題として,簡単な傾向スコアによる分析もやってみました。R 仲間が増えないかな。我々は文系統計学エンドユーザーなので,数式のところは理解が不足してしまいます。宮川本も星野本も,読んでいて「?」なところは多く出てきます。それでも,統計的因果推論は今後の役に立つかも,ということでコツコツ学んでいます。
今回は「強く無視できる割り当て条件(強い意味での無視可能性)」への理解がイマイチでした。どうして傾向スコアで条件付ければ交絡のことを考えなくていいのか,というのがボンヤリしています。
きっとこれは星野本3章を読んでいけば解決できるはず,という期待を持ちながら来月に向けて勉強を続けていきます。
P.S.
スライドのアップ先を Slideshare から Speaker Deck に移りました。Slideshare は Mac で作ったPDFで日本がうまく表示されなかったので(解決策はあるみたいですが,面倒ですね)。
統計的因果推論の勉強会の1回目を開催しました!
2016年5月28日に統計的因果推論のクローズドな勉強会を開催しました。参加者は5名でした。私を含め全員が非専門家ですので「学び合い」がキーワードです。
対象は下のスライドにあるとおり,経営学を学ぶ統計学エンドユーザーです。進行は,私が宮川本と星野本を1章ずつまとめたものを発表し,それについて不明点の質疑応答を行うというようにしました。印象としては,潜在反応モデル/反実仮想モデルが腑に落ちるかどうかが重要のようです。
www.slideshare.net
やはり,こういうのは発表する人がいちばん勉強になるような気がします。いろいろと質問を受けて,刺激にもなりました。2冊とも第1章はガイダンスみたいなものなので,本番は翌月の第2章からです。来月もがんばります。
統計的因果推論の勉強会の前準備
きっかけは,先月の月1ゼミでした。3時間のゼミのうち,はじめの1時間は輪読をしています。その中で私が「統計的因果推論というものがあるらしい」と情報共有をして,その後「日本社会心理学会 春の方法論セミナー」のページを紹介したところ,先生が興味を示されました。そして,5月からゼミ前の90分間を使って,自由参加で統計的因果推論の勉強会(1回につき1章ずつ)をスタートすることにしました。私が音頭を取って…*1。
私を含め,参加者となるのは経営学(主にマネジメント)を勉強・研究しに来ている社会人学生なので,基本,文系が多いです。統計分析の基本知識を一緒に復習しながら,勉強会を進めていく予定です。
まず,統計的因果推論勉強会の前準備をするために,資料にあたりました。そのまとめメモとして,書き残しておきます。書籍,ブログ・スライド,Cinii で検索した日本語論文の3タイプに分けます。
書籍
代表的なのは次の2冊。必ず紹介されています。もう紹介も不要なレベル。
統計的因果推論―回帰分析の新しい枠組み (シリーズ・予測と発見の科学)
- 作者: 宮川雅巳
- 出版社/メーカー: 朝倉書店
- 発売日: 2004/04
- メディア: 単行本
- 購入: 6人 クリック: 67回
- この商品を含むブログ (23件) を見る
調査観察データの統計科学―因果推論・選択バイアス・データ融合 (シリーズ確率と情報の科学)
- 作者: 星野崇宏
- 出版社/メーカー: 岩波書店
- 発売日: 2009/07/29
- メディア: 単行本
- 購入: 29人 クリック: 285回
- この商品を含むブログ (26件) を見る
ただし,数学を学部のときに学んでいない人にはきついです。宮川本は6章より先はサッパリ(目は通した)。現時点では,宮川本・星野本も合わせて3割くらい理解できたかどうか,というところ。私のような文系には次の森田本でイメージをつかむのがよさそうです。16章に説明があります。ただし,アニメが好きな人に限ります。
- 作者: 森田果
- 出版社/メーカー: 日本評論社
- 発売日: 2014/06/09
- メディア: 単行本
- この商品を含むブログ (7件) を見る
もう1つ日本語ではタイトルど直球の本があります。上記2冊よりはやさしい印象ですが,数式はけっこう出てきます。この本は4割くらい理解できたかもしれません。
- 作者: 岩崎学
- 出版社/メーカー: 朝倉書店
- 発売日: 2015/11/11
- メディア: 単行本
- この商品を含むブログ (2件) を見る
もっと文系にやさしく統計的因果推論を説明している本はないかと,洋書もチェックしました。次の2つが読みやすそうでした。Kindle のサンプルをチェック後,まず私は ”Primer” のほうを購入して読み進めています。今年出たばかりだし,著者の1人が Judea Pearl なので,大きなまちがいはないだろう,そして薄い(印刷版だと160ページくらい)というのが選定理由です。とりあえず,1章まではついていけてます。
- 作者: Stephen L. Morgan,Christopher Winship
- 出版社/メーカー: Cambridge University Press
- 発売日: 2014/11/17
- メディア: Kindle版
- この商品を含むブログを見る
Causal Inference in Statistics: A Primer
- 作者: Judea Pearl,Madelyn Glymour,Nicholas P. Jewell
- 出版社/メーカー: Wiley
- 発売日: 2016/01/25
- メディア: Kindle版
- この商品を含むブログを見る
ブログ
Google で「統計的因果推論」で検索。結果の10ページ目まで確認して,私にとって参考になるのは次のものでした。
星野本を4回に分けてまとめてくれています。やっぱり難しい。いつかはわかるようになりたいです。
smrmkt.hatenablog.jp
こちらも星野本の実践例。もともと本にRのコードが付いているから,実際にやってみるのができるんですね。
www.fisproject.jp
こちらも読み応えがあります(まだ読み切れてない)。この分野は林先生のブログがとても勉強になります。
takehiko-i-hayashi.hatenablog.com
清水先生の LiNGAM まではたどり着けていません…(理解力と数学力が)。
論文など
検索すると,宮川先生・黒木先生を中心にいろいろ出てきます。でも,まだ自分には難しくて読めない。次のものはなんとか読めるんじゃないか,文系でも興味深いじゃないかというものをピックアップしました。少しずつ読んでいこうと思います(難しくて挫折する恐れ大)。
社会科学分野における統計的因果推論のためのマッチング手法の活用 : 企業金融の研究における適用とその問題
ci.nii.ac.jp
「特集 因果的説明とベイジアンネットワーク」の以下の5本(『哲学論叢』35巻,pp. 81–141,2008)
因果とは何かをめぐる哲学的論争(1)D.ルイスの反事実的条件法による分析とその批判
http://repository.kulib.kyoto-u.ac.jp/dspace/handle/2433/96279
因果とは何かをめぐる哲学的論争(2)メンジーズの機能主義とそれに対する批判
http://repository.kulib.kyoto-u.ac.jp/dspace/handle/2433/96278
哲学者のためのベイジアンネットワーク入門
http://repository.kulib.kyoto-u.ac.jp/dspace/handle/2433/96277
ベイジアンネットワーク、共通原因、そして因果的マルコフ条件
http://repository.kulib.kyoto-u.ac.jp/dspace/handle/2433/96276
ベイジアンネットワークと確率の解釈
[
http://repository.kulib.kyoto-u.ac.jp/dspace/handle/2433/96275]
あと2つほど。
因果効果におけるバックドア/フロントドア基準について
http://www.math.chuo-u.ac.jp/\~sugiyama/14/14-01.pdf
<研究ノート>因果推論の理論と分析手法
ci.nii.ac.jp
博士後期課程に入学しました
2016年4月から JAIST 東京社会人コース 博士後期課程の学生になりました。知識科学系です。
たぶん今後、大学院名に「北陸」が付いているから、「場所は東京なんですよ」と誤解を解くセリフを何回もする難行が待ち構えてるんだと思います。また、所属研究科が「先端科学技術研究科」なので「自分は文系です。経営、マーケティング系の研究やってます」と誤解を解くセリフを何回もする難行も待ち構えてるんだと思います。
私の場合は入学までこのようなスケジュールでした。
2015年3月 指導をお願いしたい先生とコンタクト・面会
↓
11月 出願
↓
12月 入学試験
↓
2016年1月 合格発表(うろ覚え)
↓
2~3月 いろいろ手続き(1月からゼミに見学参加)
↓
4月 入学・履修手続き・コースワークスタート!
昨年の春にDBSを修了したので、1年間ブランクがあります。最終的にJAIST 東京社会人コースにしたのは、次の3つの理由+α*1です。
- 当然、学生は社会人のみ。
- サービス研究が盛ん。
- 雰囲気がカリカリ・ピリピリしてない。
基本、自分の研究は量的研究がメインですが、質的研究法にも触れて、幅を広げたいところ。大学院名に「先端科学」が入っているのに、人類学や哲学やデザインの先生がいる JAIST は私にはよさそうです。
希少種である社会人博士後期課程の生活は今後もアップしていこうと思います。なお、入学したのはこちらです。
「準備中」という表示がさみしい…。
先端知識科学プログラム | 北陸先端科学技術大学院大学 東京サテライト
*1:偶然にも自分のブログタイトルに「知識」が入ってた。
サービス学会 国内大会 第4回@神戸に参加してきました
ここ最近、統計の勉強そっちのけでずっと参加報告ばかりですが、そういう時期なんです…。2016年3月28~29日に神戸大学で開催されたサービス学会第4回国内大会に参加しました。実際に参加したのは29日だけです。本当は2日間にしたかったんですが、仕事やら何やらで1日に…。社会人学生あるあるです。
今回のサービス学会 国内大会の概要はこちら。
http://ja.serviceology.org/events/domestic2016.html
サービス学会はマーケティング学会と同様、実務家がとっても多いです。なので、社会人学生*1も参加しやすい。発表もいろいろ。完全に数理なものもあれば、現場密着の発表もあります。分野も幅広い。どちらかというと工学系が多いですが、経営系もがんばっています。大会プログラムは誰でも見ることができるので、見てみてください。
個人的には、ポスター発表が好き。直接いろいろと質問できるので。自分のフィールドの歯科医院に関する研究がいくつかあったのは驚きでした。自分くらいしかやってないだろうと思っていたので。
なお今回参加して、いちばん印象に残ったのが、学会長がいちばん前の席に座って積極的に質問をされていたことです。これは学会長より年下の自分が後ろの席でこそこそ聞いている場合ではないな、と反省した次第。今年度はがんばります…。
*1:まあ、実務家ですから当たり前なのですが。
行動計量学会 春の合宿セミナーに参加
機械学習(Aコース)ではなく、統計分析のコース(Bコース)を選びました。2016年3月25日~27日の3日間開催されるのですが、仕事やその他の都合で25日夜~26日の夕方までの参加です。
概要はこちらのページにあります。
http://www.bsj.gr.jp/event/spring_semi.html#18th
HAD はこれまでちょくちょく使っていたのですが、開発者直々に教えていただけるよいチャンスだと思って参加した次第です。ちなみに、私の使い方は
- ざっとデータを HAD でいじってみて、あたりをつける。
- その後、R や SPSS などで確かめる。
という、たぶんよくある使い方をしています。HAD の使い方で今回いちばんヒットしたのは、データの読み込みボタンがあること。ぜんぜん気づきませんでした…。とても便利*1。
春の合宿セミナーについての他の感想としては、こういう会にもっと社会人大学院生が出てくれたらいいなということです*2。ふだん忙しいからこそ、ちょっと時間をがんばって作って、1日でもいいから集中して学べる環境にいると、効率よく勉強できると思います。
それに直接、講師の先生に質問できるいい機会です。講義修了後の懇親会的な催しで、いくつか質問に答えていただけて、統計分析の悩みがすっきりしました。やっぱりフットワーク軽く、詳しい先生のところに訊きに行くのはとても大事だなと再確認できた2日間でした。