読者です 読者をやめる 読者になる 読者になる

Knowledge As Practice

JAIST(品川)でサービス経営の研究をしている社会人大学院生の研究・勉強メモ(統計分析多め)。

旅人と RStudio

このエントリーは RStudio Advent Calendar 2016 の23日目のエントリーです。ちなみ,本日は Osaka.stan 第2回に参加してきます。 さて,私は仕事柄,出張が多く,2016年は12月末までに224泊する予定です。だいたい1日ごとに移動しています。たぶん,日本で…

rstanで分析をするのに必要なR力(りょく)

Stan Advent Calendar 2016 の 4日目です。非マニア枠です。 本日のエントリーは Stan を普通に使える人、情報科学・データ科学な人を対象にしていません。少し R に慣れてきて、ベイズ統計モデリングにも興味を持ち始めた人向け。ずばりターゲットは次のよ…

4章まで読了。『StanとRでベイズ統計モデリング』

当初1〜8章まででいいかなと目次を見てつぶやいたら,著者の方から「10章も読んだほういい」というアドバイスをいただきました(感謝です。読むモチベーションもあがります)。ということで,1〜8章+10章を読むことを目標にします*1。自分の復習として感想を…

統計的因果推論勉強会 第5回を開催しました!

経営学系統計分析エンドユーザーのため統計的因果推論勉強会第5回を行いました。最近週休3日制を打ち出した某有名大企業の新しいオフィス内での開催で,とても楽しかったです。参加者は7名(クローズド)。 speakerdeck.com 今回は宮川本の第5章(の特にバッ…

勉強会ツールとしての R Notebooks

RStudio をプロジェクタで映すと,ソースエディタが小さく見にくいです。必要なところだけを集中して,見やすくすることってできないだろうか,という動機から,もう1つの選択肢である R Notebooks(あーるのーとぶっく*1)を使えるようにしてみました。 RSt…

R を使うための Jupyter notebook インストールメモ

【2016年9月27日追記あり(いちばん下)】 -- 土曜と日曜(2016年9月24日・25日),石川・品川の人たちと合宿に参加しました。2日目に3時間ほどのRの実習をする機会に恵まれ,つたないながらファシリテーター的な役割を務めました。ゼミは多国籍チーム(4カ…

統計的因果推論の勉強会 第3回を開催しました!

最近,ブログは月1更新。仕事と学生はなんとか両立できていると信じたい・・・。 さて,先日,「経営学系統計学エンドユーザー*1のための統計的因果推論 勉強会」第3回を実施しました。これで3回目。クローズド*2。 今回の内容は宮川本と星野本の第3章です。宮…

統計的因果推論の勉強会 第2回を開催しました!

宮川本と星野本の第2章が今回の内容です。毎月それぞれ1章ずつ読み進めています。参加者は私を含めて7人くらい。減ると思って心配していましたが,前回より増えてよかったです。 使用したスライドはこちらです。 speakerdeck.com 第2章はどちらも導入部の終…

統計的因果推論の勉強会の1回目を開催しました!

2016年5月28日に統計的因果推論のクローズドな勉強会を開催しました。参加者は5名でした。私を含め全員が非専門家ですので「学び合い」がキーワードです。 対象は下のスライドにあるとおり,経営学を学ぶ統計学エンドユーザーです。進行は,私が宮川本と星野…

行動計量学会 春の合宿セミナーに参加

機械学習(Aコース)ではなく、統計分析のコース(Bコース)を選びました。2016年3月25日~27日の3日間開催されるのですが、仕事やその他の都合で25日夜~26日の夕方までの参加です。 概要はこちらのページにあります。 http://www.bsj.gr.jp/event/spring_s…

量的アプローチによる価値共創の研究発表@第6回知識共創フォーラム in 金沢

先週(2016年3月12〜13日),金沢で開催された第6回知識共創フォーラムで発表をしてきました。相馬・清水(2015)*1に大きく影響を受けた分析の結果発表でした。もともと潜在ランク理論はどこかで知っていて,自分の研究に使えそうだなぁと思っていたところ…

その有意差に意味あるの? ~ノンパラメトリック検定と効果量の出し方~

Kobe.R 第24回で発表をしてきました。今回は来週日曜日に金沢で発表する内容のデータ分析部分(特にRの操作)をメインに切り出したものを発表しました。 ↓使用したスライドはこちらにあります↓ RPubs - Rによるノンパラメトリック検定と効果量の出し方 slide…

論文「顧客収益性の統計的分析」を読む

最近、統計分析の学習をしていなかったので、勉強になる論文を読んでみました。マルチレベル分析の経営学での応用事例を検索していて見つけたものです。偶然というか、第1著者は私の専門職学位論文の分析パートをチェックしてくださった先生、第3著者は専門…

今年のデータ分析の学習はじめはドキュメント作成からスタート

今年は Reproducible research を意識したいです(下のスライドが参考になります)。昨年はデータと分析結果がとっ散らかって、自分が分析した手順・内容を忘れしまい、何度も同じことを繰り返すことがありましたので…。 Rでreproducible research from sfch…

Rによるカテゴリカルデータ分析事例(3) ~{rms}パッケージによる順序ロジスティック回帰~

●2016年1月3日 追記 本エントリー中で使っている makedummies() がさらに便利に使えるようになっています。 アップデート版の使い方はコメント欄を参照してください。 以上、追記終わり。 ---- 前回までに、あるサービスを受けた500人の顧客の満足度および変…

Rによるカテゴリカルデータ分析事例(2) ~(1) の補足:等分散性を確認していたか?~

前回のエントリーを書いたあと、現在は手に入りにくい本『Rによる統計解析の基礎』(私は買いました)の最新版『Rによる保健医療データ解析演習』を確認し、さらに「マイナーだけど最強の統計的検定 Brunner-Munzel 検定」を読むと、ウィルコクソンの順位和…

Rによるカテゴリカルデータ分析事例(1)  {coin}パッケージによるウィルコクソンの順位和検定とクラスカル・ウォリス検定

先日(2015年12月26日土曜日)に開催された Kobe.R 第23回で発表を行いました。当日はちょっと風邪気味だったため、あまり準備ができず、テキトーな内容になってしまいました…。そのため、ここで補足をしたいと思います。 kobexr.doorkeeper.jp 発表タイトル…

Rでダミー変数をつくる。makedummies 関数で。

●2015年12月28日 追記 makedummies 関数の作者の方から、コメントで情報をいただきました。 以下のように、 install_github で 簡単に makedummies が使えるようになっています。 ## devtools がなければインストール→ install.packages("devtools") library…

Rによる級内相関係数(ICC)の2つの出し方

2~3ヶ月前から、マルチレベル分析*1を学んでいます。分析自体はできます(便利なことに、コード1行でできるので)。しかし、手持ちのデータでマルチレベル分析を使うべきなのかどうか、迷います。そんなときは級内相関係数(ICC)を確認するのが一般的なよ…

読了 『完全独習 ベイズ統計学』(2015)

個人的に大きなイベントが終わり、うまくいきそうなので、学びと研究を再開です。 リハビリとして、今年11月に出版された『完全独習 ベイズ統計学入門』を読んで、ブログを書きます。本の詳細は下をクリックしてください。 完全独習 ベイズ統計学入門作者: …

統計学エンドユーザーのための JAGS 入門

岩波データサイエンス vol.1 のどこかのページに「初心者はJAGS(BUGS)」と書いてあったので*1、こつこつ学び始めています。世の中は Stan 大人気ですが、気にしない…。まず JAGS に慣れてから Stan をやります…。本エントリーは、前回のエントリーと多くが…

「データ解析ハッカソン無料対策講座」に参加しました

日曜日(2015年10月25日)は、ソレイユデータ道場が開催した「データ解析ハッカソン無料対策講座」に参加してきました。これは、2015年11月7日に開催される「第一回データ解析ハッカソン」の事前準備講座的なものです(たぶん)。 ちなみに11月7日に開催され…

MCMC の理解を深めるベイズ統計スライド厳選集

別にクルマを運転するのに、クルマやエンジンの構造を知らなくても運転できる。スマホも電波のことやタッチパネルの動作原理を知らなくても、スマホは使える。冷蔵庫がどうして冷えてるかなんてわからなくても、自然と使ってる。 でも、どうして動くのか、構…

最近読んだ統計分析のオススメ本を2冊

ちょっと端境期です。自分の研究ツールを磨こうと統計学関連の本を読んでいます。この1~2週間で読んでよかったのは次の2つです。 馬場真哉『平均と分散から始める一般化線形モデル入門』 三中信宏『みなか先生といっしょに統計学の王国を歩いてみよう』 背…

RStudio よりもいい環境を求めて…

Rstudio がなんか最近モッサリしてきたので(もともとだったかもしれないけど)、もっといい環境がないかと探しました。 ITエンジニア・プログラマの人たちは、かっこいいエディタを使っているという…。なんかちょっと憧れる。あとはRが簡単に動けばよし。候…

Kobe.R で発表してきました!

社会人の場合、仕事が込み合ってくると、勉強の時間を避けない事態がまま発生します。そういうときもイライラせず、「●日後にはこの状況を抜けるので、次はこういう勉強しよう」とスケジュールを再確認するのがメンタル的にもいいように思います。というわけ…

非ITエンジニアのための Stan と Rstan でベイズな重回帰分析

前回に続いて、Stan と Rstan で重回帰分析を行います。単回帰分析ができれば、重回帰分析はすんなりできます。っていうか、できました。変数が増えただけ、だからです。ほんのちょっぴり、Stan コードを洗練させました(IT系の方には「どこが?」と言われそ…

非ITエンジニアのための Stan と Rstan でベイズな単回帰分析

『基礎からのベイズ統計学』には単回帰分析の例がなかったので、Stan による単回帰分析の練習をしました。今回のエントリーはR および統計の初心者は抜けだした、『基礎からベイズ統計学』を読んでだいたいわかった社会科学系の方が対象です。ITエンジニアや…

ついに読了! 『基礎からのベイズ統計学』 11日目

ついに『基礎からのベイズ統計学』も最後。11回かかりました。1回あたり、16ページを読み進んだことになります。移動中、出張先のホテル、自宅でコツコツ読み進めることができました。 最終章である第8章では、比率の差、相関係数の差、切断データの推測、級…

マーケティング・サイエンスの一端を知る

今日は日本マーケティング・サイエンス学会(略して、JIMS。ジムズって言うとか)の論文誌『マーケティング・サイエンス』とRで学ぶデータサイエンスシリーズの『マーケティング・モデル』第2版を読んでいました。 『マーケティング・サイエンス』は先日、…

分布がいろいろ増えるぞ『基礎からのベイズ統計学』 10日目

ついに『基礎からのベイズ統計学』10日目です。今回は第7章を読み進めました。ようやくポアソン分布とか指数分布とか、自分にはなじみにのない分布に慣れてきたところです。第7章では他に、幾何分布、負の二項分布が加わります。 Stan に慣れはじめたところ…

ロイヤルティ、コミットメントなどで顧客をセグメントできる潜在クラス分析のまとめ

潜在クラス分析(Latent Class Analysis,、略して LCA)というのを勉強する必要性が出てきたので、少し調べました。自分が知らないことを調べる・学ぶときは、多くの人がするように、私もまずネット上で探し、その後、書籍や論文で探します。 潜在クラス分析…

『実証分析入門』

今日は『実証分析入門』を読みました。「入門」というタイトルですが、統計分析の入門ではなくて、統計分析を用いて因果関係を調べる手法の入門です。だから、意外と内容は重い。 実証分析入門 データから「因果関係」を読み解く作法作者: 森田果出版社/メー…

【非連続で読んでいく】 『基礎からのベイズ統計学』 2日目

『基礎からのベイズ統計学』を非連続で読んでいくシリースの2回目です。もう自分用勉強ログです。飽きっぽい人間なので、こうやってブログを書くことをできるだけ習慣づけて、学習グセをつけています(あとでまとめて書くこともありますけど)。 前回は13ペ…

R と dplyr と格闘する

ずっとインプットのために論文を読んでいたら、R の操作を忘れそうです。そういえば昨年、マーケティング・リサーチの授業のときに講師をされた他大学の先生は「分析方法はしばらく使ってないと忘れてしまう。なのでその都度思い出してる」と言っていたよう…

数学の記述がものすごく丁寧・親切! 『基礎から深く理解するラッシュモデリング』

ある論文を読んでいて、急に「ラッシュモデル」というまったく知らない単語に出会いました。ネット上を探しても、wikipedia を見てもよくわからない。どうも、このラッシュモデルを理解しないと読めない論文だったので、やさしい本を探しました。 そしてたど…

【非連続で読んでいく】 『基礎からのベイズ統計学』 1日目

なんとかブログネタをひねり出します。 最近買って、少しずつ読み進めているのがコレ。『基礎からのベイス統計学』。まえがきで「数I 、II、 A、 B」を履修していれば大丈夫、的なことが書いてありましたが、数式変形の連続で、けっこうしんどい。 数学の中…

社員満足度(ES)をネタに分析の練習

SPSS も使わないと操作方法を忘れちゃう、ということで使ってみました。社員満足度を測るようなサイト(食べログの会社版みたいなものかな?)があったので、そのデータを自分で打ち込み分析。業界は小売業にして、トップ30社を分析対象にしました。変数は8…

【書籍紹介】『マーケティング・データ分析の基礎』

R の基本操作に一通り慣れたので、次のステッフに選んだ本はこちら。Usuful R シリーズです。 マーケティング・データ分析の基礎 (シリーズ Useful R 3) 作者: 里村卓也,金明哲 出版社/メーカー: 共立出版 発売日: 2014/10/24 メディア: 単行本 この商品を含…

コーヒー関連の上場企業を主成分分析してみた

Rによる主成分分析の練習結果を記録しておきます。何について分析するか、そしてデータ集めがいちばん大変でした。サントリーが JT の飲料事業を買うというニュースがつい先日出たので、コーヒーについて調べることにしました(やや強引)。コーヒー関連の上…

SPSS と R の主成分分析の違い

いま DBS の「ビジネス統計学」という授業を復習として受けています。今日は主成分分析がテーマの1つでした。授業では SPSS をメインしています。教材の1つとして『文系のための SPSS 超入門』なのですが、こういうデータが載っていました。 銀行名 資本金 …

女性はスマホに費やす時間が増え、本や雑誌に費やす時間は減ったと感じている。あなたはどう?

東海道線に乗っていると、女性のほうが男性よりスマホを使っているように思います。自分の見た光景は実態に合っているのかどうか、確認してみました。無料のネットリサーチを使って、100名に次のような質問に答えてもらっています。 Q1:以前(2~3年前)…

ビッグデータの分析例 by Yahoo!リアルタイム検索

昨日、サービス業へのマイナス感情についてのエントリーを書きましたが、2014年にYahoo!の中の人がもっと詳しい感情の分析をしています。 人はいつ「楽しい」や「つらい」と感じるのか?~つぶやき分析で見えた感情の推移~Twitter の分析はマーケティング・…

統計分析と社会人教育

昨日はビジネス統計学という授業に修了生特典として参加していました。DBS の修了生向けに公開されている授業に出席できるので、復習にちょうどいいのです。私も2年前に同じ授業を受けていました。在学生の様子を後ろから見ていたのですが、おもしろいように…

dplyr と tidyr でクロス集計表をつくる group_by() & tally() 編

ゴールデンウィークはRと格闘してました。前回と今回はその記録です。 前回とはちょっと違った方法で、クロス集計表を作ってみます。結果は同じです。今回は group_by() を使って列をグループ化する、という作業が1つ増えています。検索すると、今回の方法が…

dplyr と tidyr でクロス集計表をつくる count() 編

どうやったらデータフレーム形式のクロス集計表が簡単にできるかな、と探していたところ、次の2つにページに行き着きました。 クロス集計〜公式:dplyr + tidyr = (xtabs|(f)table) - My Life as a Mock Quantd.hatena.ne.jp dplyr cross tab with missing v…

書籍紹介 『Rではじめるビジネス統計分析』:動かないコードもあるけど、勉強になる

さらにRに慣れるため『楽しいR』の次は『Rではじめるビジネス統計分析』を読み始めました。 Rではじめるビジネス統計分析 作者: 末吉正成,里洋平,酒巻隆治,小林雄一郎,大城信晃 出版社/メーカー: 翔泳社 発売日: 2014/07/18 メディア: 大型本 この商品を含む…

書籍紹介 『楽しいR』:初級~中級者にオススメでは?

先日、豊澤栄治さんが書かれた『楽しいR』を読みました。買ってません。スミマセン(図書館で借りました…)。Amazon でレビューも投稿しましたが、もう少し詳しくブログで書いておきます。 楽しいR ビジネスに役立つデータの扱い方・読み解き方を知りたい人…

「スマホ」と「スマートフォン」の違い

先日、スマートフォンはいつ頃から一般的になったのかと調べようと思いました。そこで、Googleトレンドで検索。そのときに「スマートフォンって、スマホというから、スマホの検索数も調べよう」と思い、2つを検索した結果、自分的には驚きの結果が表示されま…

クリエイティブ・コモンズ・ライセンス
この 作品 は クリエイティブ・コモンズ 表示 - 継承 4.0 国際 ライセンスの下に提供されています。