統計分析
日曜日(2015年10月25日)は、ソレイユデータ道場が開催した「データ解析ハッカソン無料対策講座」に参加してきました。これは、2015年11月7日に開催される「第一回データ解析ハッカソン」の事前準備講座的なものです(たぶん)。 ちなみに11月7日に開催され…
別にクルマを運転するのに、クルマやエンジンの構造を知らなくても運転できる。スマホも電波のことやタッチパネルの動作原理を知らなくても、スマホは使える。冷蔵庫がどうして冷えてるかなんてわからなくても、自然と使ってる。 でも、どうして動くのか、構…
ちょっと端境期です。自分の研究ツールを磨こうと統計学関連の本を読んでいます。この1~2週間で読んでよかったのは次の2つです。 馬場真哉『平均と分散から始める一般化線形モデル入門』 三中信宏『みなか先生といっしょに統計学の王国を歩いてみよう』 背…
Rstudio がなんか最近モッサリしてきたので(もともとだったかもしれないけど)、もっといい環境がないかと探しました。 ITエンジニア・プログラマの人たちは、かっこいいエディタを使っているという…。なんかちょっと憧れる。あとはRが簡単に動けばよし。候…
社会人の場合、仕事が込み合ってくると、勉強の時間を避けない事態がまま発生します。そういうときもイライラせず、「●日後にはこの状況を抜けるので、次はこういう勉強しよう」とスケジュールを再確認するのがメンタル的にもいいように思います。というわけ…
前回に続いて、Stan と Rstan で重回帰分析を行います。単回帰分析ができれば、重回帰分析はすんなりできます。っていうか、できました。変数が増えただけ、だからです。ほんのちょっぴり、Stan コードを洗練させました(IT系の方には「どこが?」と言われそ…
『基礎からのベイズ統計学』には単回帰分析の例がなかったので、Stan による単回帰分析の練習をしました。今回のエントリーはR および統計の初心者は抜けだした、『基礎からベイズ統計学』を読んでだいたいわかった社会科学系の方が対象です。ITエンジニアや…
ついに『基礎からのベイズ統計学』も最後。11回かかりました。1回あたり、16ページを読み進んだことになります。移動中、出張先のホテル、自宅でコツコツ読み進めることができました。 最終章である第8章では、比率の差、相関係数の差、切断データの推測、級…
今日は日本マーケティング・サイエンス学会(略して、JIMS。ジムズって言うとか)の論文誌『マーケティング・サイエンス』とRで学ぶデータサイエンスシリーズの『マーケティング・モデル』第2版を読んでいました。 『マーケティング・サイエンス』は先日、…
ついに『基礎からのベイズ統計学』10日目です。今回は第7章を読み進めました。ようやくポアソン分布とか指数分布とか、自分にはなじみにのない分布に慣れてきたところです。第7章では他に、幾何分布、負の二項分布が加わります。 Stan に慣れはじめたところ…
潜在クラス分析(Latent Class Analysis,、略して LCA)というのを勉強する必要性が出てきたので、少し調べました。自分が知らないことを調べる・学ぶときは、多くの人がするように、私もまずネット上で探し、その後、書籍や論文で探します。 潜在クラス分析…
今日は『実証分析入門』を読みました。「入門」というタイトルですが、統計分析の入門ではなくて、統計分析を用いて因果関係を調べる手法の入門です。だから、意外と内容は重い。 実証分析入門 データから「因果関係」を読み解く作法作者: 森田果出版社/メー…
『基礎からのベイズ統計学』を非連続で読んでいくシリースの2回目です。もう自分用勉強ログです。飽きっぽい人間なので、こうやってブログを書くことをできるだけ習慣づけて、学習グセをつけています(あとでまとめて書くこともありますけど)。 前回は13ペ…
ずっとインプットのために論文を読んでいたら、R の操作を忘れそうです。そういえば昨年、マーケティング・リサーチの授業のときに講師をされた他大学の先生は「分析方法はしばらく使ってないと忘れてしまう。なのでその都度思い出してる」と言っていたよう…
ある論文を読んでいて、急に「ラッシュモデル」というまったく知らない単語に出会いました。ネット上を探しても、wikipedia を見てもよくわからない。どうも、このラッシュモデルを理解しないと読めない論文だったので、やさしい本を探しました。 そしてたど…
なんとかブログネタをひねり出します。 最近買って、少しずつ読み進めているのがコレ。『基礎からのベイス統計学』。まえがきで「数I 、II、 A、 B」を履修していれば大丈夫、的なことが書いてありましたが、数式変形の連続で、けっこうしんどい。 数学の中…
SPSS も使わないと操作方法を忘れちゃう、ということで使ってみました。社員満足度を測るようなサイト(食べログの会社版みたいなものかな?)があったので、そのデータを自分で打ち込み分析。業界は小売業にして、トップ30社を分析対象にしました。変数は8…
R の基本操作に一通り慣れたので、次のステッフに選んだ本はこちら。Usuful R シリーズです。 マーケティング・データ分析の基礎 (シリーズ Useful R 3) 作者: 里村卓也,金明哲 出版社/メーカー: 共立出版 発売日: 2014/10/24 メディア: 単行本 この商品を含…
Rによる主成分分析の練習結果を記録しておきます。何について分析するか、そしてデータ集めがいちばん大変でした。サントリーが JT の飲料事業を買うというニュースがつい先日出たので、コーヒーについて調べることにしました(やや強引)。コーヒー関連の上…
いま DBS の「ビジネス統計学」という授業を復習として受けています。今日は主成分分析がテーマの1つでした。授業では SPSS をメインしています。教材の1つとして『文系のための SPSS 超入門』なのですが、こういうデータが載っていました。 銀行名 資本金 …
東海道線に乗っていると、女性のほうが男性よりスマホを使っているように思います。自分の見た光景は実態に合っているのかどうか、確認してみました。無料のネットリサーチを使って、100名に次のような質問に答えてもらっています。 Q1:以前(2~3年前)…
昨日、サービス業へのマイナス感情についてのエントリーを書きましたが、2014年にYahoo!の中の人がもっと詳しい感情の分析をしています。 人はいつ「楽しい」や「つらい」と感じるのか?~つぶやき分析で見えた感情の推移~Twitter の分析はマーケティング・…
昨日はビジネス統計学という授業に修了生特典として参加していました。DBS の修了生向けに公開されている授業に出席できるので、復習にちょうどいいのです。私も2年前に同じ授業を受けていました。在学生の様子を後ろから見ていたのですが、おもしろいように…
ゴールデンウィークはRと格闘してました。前回と今回はその記録です。 前回とはちょっと違った方法で、クロス集計表を作ってみます。結果は同じです。今回は group_by() を使って列をグループ化する、という作業が1つ増えています。検索すると、今回の方法が…
どうやったらデータフレーム形式のクロス集計表が簡単にできるかな、と探していたところ、次の2つにページに行き着きました。 クロス集計〜公式:dplyr + tidyr = (xtabs|(f)table) - My Life as a Mock Quantd.hatena.ne.jp dplyr cross tab with missing v…
さらにRに慣れるため『楽しいR』の次は『Rではじめるビジネス統計分析』を読み始めました。 Rではじめるビジネス統計分析 作者: 末吉正成,里洋平,酒巻隆治,小林雄一郎,大城信晃 出版社/メーカー: 翔泳社 発売日: 2014/07/18 メディア: 大型本 この商品を含む…
先日、豊澤栄治さんが書かれた『楽しいR』を読みました。買ってません。スミマセン(図書館で借りました…)。Amazon でレビューも投稿しましたが、もう少し詳しくブログで書いておきます。 楽しいR ビジネスに役立つデータの扱い方・読み解き方を知りたい人…
先日、スマートフォンはいつ頃から一般的になったのかと調べようと思いました。そこで、Googleトレンドで検索。そのときに「スマートフォンって、スマホというから、スマホの検索数も調べよう」と思い、2つを検索した結果、自分的には驚きの結果が表示されま…