統計的因果推論の勉強会の1回目を開催しました!
2016年5月28日に統計的因果推論のクローズドな勉強会を開催しました。参加者は5名でした。私を含め全員が非専門家ですので「学び合い」がキーワードです。
対象は下のスライドにあるとおり,経営学を学ぶ統計学エンドユーザーです。進行は,私が宮川本と星野本を1章ずつまとめたものを発表し,それについて不明点の質疑応答を行うというようにしました。印象としては,潜在反応モデル/反実仮想モデルが腑に落ちるかどうかが重要のようです。
www.slideshare.net
やはり,こういうのは発表する人がいちばん勉強になるような気がします。いろいろと質問を受けて,刺激にもなりました。2冊とも第1章はガイダンスみたいなものなので,本番は翌月の第2章からです。来月もがんばります。
統計的因果推論の勉強会の前準備
きっかけは,先月の月1ゼミでした。3時間のゼミのうち,はじめの1時間は輪読をしています。その中で私が「統計的因果推論というものがあるらしい」と情報共有をして,その後「日本社会心理学会 春の方法論セミナー」のページを紹介したところ,先生が興味を示されました。そして,5月からゼミ前の90分間を使って,自由参加で統計的因果推論の勉強会(1回につき1章ずつ)をスタートすることにしました。私が音頭を取って…*1。
私を含め,参加者となるのは経営学(主にマネジメント)を勉強・研究しに来ている社会人学生なので,基本,文系が多いです。統計分析の基本知識を一緒に復習しながら,勉強会を進めていく予定です。
まず,統計的因果推論勉強会の前準備をするために,資料にあたりました。そのまとめメモとして,書き残しておきます。書籍,ブログ・スライド,Cinii で検索した日本語論文の3タイプに分けます。
書籍
代表的なのは次の2冊。必ず紹介されています。もう紹介も不要なレベル。
統計的因果推論―回帰分析の新しい枠組み (シリーズ・予測と発見の科学)
- 作者: 宮川雅巳
- 出版社/メーカー: 朝倉書店
- 発売日: 2004/04
- メディア: 単行本
- 購入: 6人 クリック: 67回
- この商品を含むブログ (23件) を見る
調査観察データの統計科学―因果推論・選択バイアス・データ融合 (シリーズ確率と情報の科学)
- 作者: 星野崇宏
- 出版社/メーカー: 岩波書店
- 発売日: 2009/07/29
- メディア: 単行本
- 購入: 29人 クリック: 285回
- この商品を含むブログ (26件) を見る
ただし,数学を学部のときに学んでいない人にはきついです。宮川本は6章より先はサッパリ(目は通した)。現時点では,宮川本・星野本も合わせて3割くらい理解できたかどうか,というところ。私のような文系には次の森田本でイメージをつかむのがよさそうです。16章に説明があります。ただし,アニメが好きな人に限ります。
- 作者: 森田果
- 出版社/メーカー: 日本評論社
- 発売日: 2014/06/09
- メディア: 単行本
- この商品を含むブログ (7件) を見る
もう1つ日本語ではタイトルど直球の本があります。上記2冊よりはやさしい印象ですが,数式はけっこう出てきます。この本は4割くらい理解できたかもしれません。
- 作者: 岩崎学
- 出版社/メーカー: 朝倉書店
- 発売日: 2015/11/11
- メディア: 単行本
- この商品を含むブログ (2件) を見る
もっと文系にやさしく統計的因果推論を説明している本はないかと,洋書もチェックしました。次の2つが読みやすそうでした。Kindle のサンプルをチェック後,まず私は ”Primer” のほうを購入して読み進めています。今年出たばかりだし,著者の1人が Judea Pearl なので,大きなまちがいはないだろう,そして薄い(印刷版だと160ページくらい)というのが選定理由です。とりあえず,1章まではついていけてます。
- 作者: Stephen L. Morgan,Christopher Winship
- 出版社/メーカー: Cambridge University Press
- 発売日: 2014/11/17
- メディア: Kindle版
- この商品を含むブログを見る
Causal Inference in Statistics: A Primer
- 作者: Judea Pearl,Madelyn Glymour,Nicholas P. Jewell
- 出版社/メーカー: Wiley
- 発売日: 2016/01/25
- メディア: Kindle版
- この商品を含むブログを見る
ブログ
Google で「統計的因果推論」で検索。結果の10ページ目まで確認して,私にとって参考になるのは次のものでした。
星野本を4回に分けてまとめてくれています。やっぱり難しい。いつかはわかるようになりたいです。
smrmkt.hatenablog.jp
こちらも星野本の実践例。もともと本にRのコードが付いているから,実際にやってみるのができるんですね。
www.fisproject.jp
こちらも読み応えがあります(まだ読み切れてない)。この分野は林先生のブログがとても勉強になります。
takehiko-i-hayashi.hatenablog.com
清水先生の LiNGAM まではたどり着けていません…(理解力と数学力が)。
論文など
検索すると,宮川先生・黒木先生を中心にいろいろ出てきます。でも,まだ自分には難しくて読めない。次のものはなんとか読めるんじゃないか,文系でも興味深いじゃないかというものをピックアップしました。少しずつ読んでいこうと思います(難しくて挫折する恐れ大)。
社会科学分野における統計的因果推論のためのマッチング手法の活用 : 企業金融の研究における適用とその問題
ci.nii.ac.jp
「特集 因果的説明とベイジアンネットワーク」の以下の5本(『哲学論叢』35巻,pp. 81–141,2008)
因果とは何かをめぐる哲学的論争(1)D.ルイスの反事実的条件法による分析とその批判
http://repository.kulib.kyoto-u.ac.jp/dspace/handle/2433/96279
因果とは何かをめぐる哲学的論争(2)メンジーズの機能主義とそれに対する批判
http://repository.kulib.kyoto-u.ac.jp/dspace/handle/2433/96278
哲学者のためのベイジアンネットワーク入門
http://repository.kulib.kyoto-u.ac.jp/dspace/handle/2433/96277
ベイジアンネットワーク、共通原因、そして因果的マルコフ条件
http://repository.kulib.kyoto-u.ac.jp/dspace/handle/2433/96276
ベイジアンネットワークと確率の解釈
[
http://repository.kulib.kyoto-u.ac.jp/dspace/handle/2433/96275]
あと2つほど。
因果効果におけるバックドア/フロントドア基準について
http://www.math.chuo-u.ac.jp/\~sugiyama/14/14-01.pdf
<研究ノート>因果推論の理論と分析手法
ci.nii.ac.jp
博士後期課程に入学しました
2016年4月から JAIST 東京社会人コース 博士後期課程の学生になりました。知識科学系です。
たぶん今後、大学院名に「北陸」が付いているから、「場所は東京なんですよ」と誤解を解くセリフを何回もする難行が待ち構えてるんだと思います。また、所属研究科が「先端科学技術研究科」なので「自分は文系です。経営、マーケティング系の研究やってます」と誤解を解くセリフを何回もする難行も待ち構えてるんだと思います。
私の場合は入学までこのようなスケジュールでした。
2015年3月 指導をお願いしたい先生とコンタクト・面会
↓
11月 出願
↓
12月 入学試験
↓
2016年1月 合格発表(うろ覚え)
↓
2~3月 いろいろ手続き(1月からゼミに見学参加)
↓
4月 入学・履修手続き・コースワークスタート!
昨年の春にDBSを修了したので、1年間ブランクがあります。最終的にJAIST 東京社会人コースにしたのは、次の3つの理由+α*1です。
- 当然、学生は社会人のみ。
- サービス研究が盛ん。
- 雰囲気がカリカリ・ピリピリしてない。
基本、自分の研究は量的研究がメインですが、質的研究法にも触れて、幅を広げたいところ。大学院名に「先端科学」が入っているのに、人類学や哲学やデザインの先生がいる JAIST は私にはよさそうです。
希少種である社会人博士後期課程の生活は今後もアップしていこうと思います。なお、入学したのはこちらです。
「準備中」という表示がさみしい…。
先端知識科学プログラム | 北陸先端科学技術大学院大学 東京サテライト
*1:偶然にも自分のブログタイトルに「知識」が入ってた。
サービス学会 国内大会 第4回@神戸に参加してきました
ここ最近、統計の勉強そっちのけでずっと参加報告ばかりですが、そういう時期なんです…。2016年3月28~29日に神戸大学で開催されたサービス学会第4回国内大会に参加しました。実際に参加したのは29日だけです。本当は2日間にしたかったんですが、仕事やら何やらで1日に…。社会人学生あるあるです。
今回のサービス学会 国内大会の概要はこちら。
http://ja.serviceology.org/events/domestic2016.html
サービス学会はマーケティング学会と同様、実務家がとっても多いです。なので、社会人学生*1も参加しやすい。発表もいろいろ。完全に数理なものもあれば、現場密着の発表もあります。分野も幅広い。どちらかというと工学系が多いですが、経営系もがんばっています。大会プログラムは誰でも見ることができるので、見てみてください。
個人的には、ポスター発表が好き。直接いろいろと質問できるので。自分のフィールドの歯科医院に関する研究がいくつかあったのは驚きでした。自分くらいしかやってないだろうと思っていたので。
なお今回参加して、いちばん印象に残ったのが、学会長がいちばん前の席に座って積極的に質問をされていたことです。これは学会長より年下の自分が後ろの席でこそこそ聞いている場合ではないな、と反省した次第。今年度はがんばります…。
*1:まあ、実務家ですから当たり前なのですが。
行動計量学会 春の合宿セミナーに参加
機械学習(Aコース)ではなく、統計分析のコース(Bコース)を選びました。2016年3月25日~27日の3日間開催されるのですが、仕事やその他の都合で25日夜~26日の夕方までの参加です。
概要はこちらのページにあります。
http://www.bsj.gr.jp/event/spring_semi.html#18th
HAD はこれまでちょくちょく使っていたのですが、開発者直々に教えていただけるよいチャンスだと思って参加した次第です。ちなみに、私の使い方は
- ざっとデータを HAD でいじってみて、あたりをつける。
- その後、R や SPSS などで確かめる。
という、たぶんよくある使い方をしています。HAD の使い方で今回いちばんヒットしたのは、データの読み込みボタンがあること。ぜんぜん気づきませんでした…。とても便利*1。
春の合宿セミナーについての他の感想としては、こういう会にもっと社会人大学院生が出てくれたらいいなということです*2。ふだん忙しいからこそ、ちょっと時間をがんばって作って、1日でもいいから集中して学べる環境にいると、効率よく勉強できると思います。
それに直接、講師の先生に質問できるいい機会です。講義修了後の懇親会的な催しで、いくつか質問に答えていただけて、統計分析の悩みがすっきりしました。やっぱりフットワーク軽く、詳しい先生のところに訊きに行くのはとても大事だなと再確認できた2日間でした。
量的アプローチによる価値共創の研究発表@第6回知識共創フォーラム in 金沢
先週(2016年3月12〜13日),金沢で開催された第6回知識共創フォーラムで発表をしてきました。相馬・清水(2015)*1に大きく影響を受けた分析の結果発表でした。もともと潜在ランク理論はどこかで知っていて,自分の研究に使えそうだなぁと思っていたところに相馬・清水(2015)が出たので,その時はとても驚きました。
発表タイトルは「価値共創の促進に意味はあるか?」です。情報学系な人には参考にならないと思いますが,経営学系で量的な研究をされる方(本当に少ないと思うけれど…)の少しでも参考になれば,と思います。
発表に使ったスライドは下です。
www.slideshare.net
分析の方法・ツールなど
分析の方法・ツールなどは次のとおりです。過去,本ブログや Kobe.R で発表してきたまとめ的な分析を行いました。
分析の方法 | 使用したツール |
---|---|
潜在ランク理論 | exametrica |
ウィルコクソンの順位和検定 | R, wlicox.test() |
クラスカル・ウォリス検定 | R, kruskal.test() |
線形連関の検定 | R, coin::lbl_test() |
ベイズ推定による多項ロジスティック回帰 | R, brms::brm() |
ロジスティック回帰(普通の) | R, glm() |
今回の発表はケーススタディが多い(ような気がする)共創研究に量的アプローチを行った例です。分析に使ったアンケートは1〜7のリッカート尺度なので,独立性の検定にはノンパラメトリック検定を使っています。
ベイズ推定による多項ロジスティック回帰
brms パッケージを使用しました。以下のコードで一発です。下でも書きましたが,brm()のオプションはまだ理解していません。
library(brms) rstan_options(auto_write = TRUE) options(mc.cores = parallel::detectCores()) fit1 <- brm(qol ~ kyousou, data = d, family = categorical)
使用したデータはこちらに置いておきました。気になる方はお試しください。
分析でわからないところ
誰にも聞けなかった(というか,周りにわかる人がいない)ため,自信がない・わからないところは次のとおりです。
最後の2つの分析(多項ロジスティックと普通のロジスティック回帰)では,アンケート結果を間隔尺度として扱いました。尺度の扱いに一貫性がないのはどうかなぁ,と思っていますが判断がつきません…。
さらに,多項ロジスティック回帰はアンケート結果を名義尺度にしてしまいました。これも適切かどうか…。1〜7のうちどの選択肢が選ばれるかという観点から多項ロジスティック回帰でやってみようとした次第です。
多項ロジスティック回帰はベイズ推定を使ってやってみましたが,オプションは初期値ままです。収束はしたので大丈夫かとは思いましたが,適切な初期設定を知りたいところです。
発表を終えて
実は,今回が初めての口頭発表でした。聞いてくれた方のうち,おもしろいと思ってくれた方はいたようでホッとしました。どのへんがおもしろかったか,ちゃんと確認しておけばよかった。また今回の発表では因果関係を示したわけではないので,因果を調べられるようになりたいものです。
*1:相馬敏彦・清水裕士(2015)「ワンランク上のブランド・コミットメントはどう形成されるのか? ─顧客の潜在ランクへの分類と拡張版投資モデルのブランドの適用─」『マーケティングジャーナル』第35巻第3号,75-94頁.
その有意差に意味あるの? ~ノンパラメトリック検定と効果量の出し方~
Kobe.R 第24回で発表をしてきました。今回は来週日曜日に金沢で発表する内容のデータ分析部分(特にRの操作)をメインに切り出したものを発表しました。
↓使用したスライドはこちらにあります↓
RPubs - Rによるノンパラメトリック検定と効果量の出し方
slideshare はこちらです。Rstuido だと Rpubs にも PDF にも簡単出力できるので便利ですね。
トピックとしては
- wilcox.test(マイ・ホイットニーのU検定)は formula を使ったほうがわかりやすいこと。
- 効果量 cliff の d は orddom パッケージの delta で確認できること。
- R の発表は Rmd が便利だよ。
の3つでした。
使用したデータはこちらからダウンロードできるようにしました。どうぞお試しください。
Dropbox - data2.txt
@kazutan先生にご参加いただき、Rmd を使って発表できたいい経験ができました。というか、急遽、Rmarkdown について発表をお願いいたしました。急なお願いにも対応してくださり、感謝です。
【追記 2016年3月6日】
今回のデータのように順位にタイがある場合のウィルコクソンの順位和検定は coin パッケージの wilcox_test() がよりよいようです。でも、結果はほとんど変わりません。
【普通のウィルコクソンの順位和検定】
wilcox.test(rank ~ gender, data = d, correct = F)
Wilcoxon rank sum test
data: rank by factor(gender)
W = 27532, p-value = 0.07193
alternative hypothesis: true location shift is not equal to 0
【coin パッケージのウィルコクソンの順位和検定*1】
wilcox_test(rank ~ factor(gender), data = d)
Asymptotic Wilcoxon-Mann-Whitney Test
data: rank by factor(gender) (0, 1)
Z = -1.7995, p-value = 0.07193
alternative hypothesis: true mu is not equal to 0
【より正確にするならこう】
wilcox_test(rank ~ factor(gender), data = d, distribution = "exact")
Exact Wilcoxon-Mann-Whitney Test
data: rank by factor(gender) (0, 1)
Z = -1.7995, p-value = 0.07194
alternative hypothesis: true mu is not equal to 0
*1:gender を因子型にしないと動かない。