Knowledge As Practice

JAIST(東京)で Transformative Service Research に取り組んでる社会人大学院生の研究・勉強メモ

ノンプログラマーのためのR入門

保存版。Rpresentation の記法メモ

.Rpres に関する情報(日本語)が少ない! .Rpres は RStudio で作るプレゼンテーションスライドです*1。こういうことができますよ、という説明ページは見つかるんですが、じゃあどうすればいいかまでは書いていないところが多いです。 というわけで、来月(…

RStudio よりもいい環境を求めて…

Rstudio がなんか最近モッサリしてきたので(もともとだったかもしれないけど)、もっといい環境がないかと探しました。 ITエンジニア・プログラマの人たちは、かっこいいエディタを使っているという…。なんかちょっと憧れる。あとはRが簡単に動けばよし。候…

ついに読了! 『基礎からのベイズ統計学』 11日目

ついに『基礎からのベイズ統計学』も最後。11回かかりました。1回あたり、16ページを読み進んだことになります。移動中、出張先のホテル、自宅でコツコツ読み進めることができました。 最終章である第8章では、比率の差、相関係数の差、切断データの推測、級…

Rstan でベイズ分析を行うための環境を作る方法メモ

『基礎からのベイズ統計学』第6章以降はベイズ統計学を使った応用例(たぶん基本的で大事な)が紹介されています。こういうのは、実際に自分で分析をして結果を見るのが大切です。ただ『基礎からのベイズ統計学』では、分析環境を整える方法は省略されていま…

ggvis に関する情報のまとめ

もう今週は R と統計分析の勉強ウィークしました。量的研究を志向しているので、こういう勉強もそれなりに必要なのです…。 とはいえ、こればかりはやっていられませんから、ggvis の探求は今日でいったんお休みにしたいと思います。今後の勉強メモとして、必…

ggvis に5時間ほど触れてわかったこと

昨日に引き続き、ggvis をいじりました。仕事が終わってから、下のコースで5時間ほど格闘。開発者の発音によると、ggvis は「じーじーびず」と読むようです。 Data Visualization in R with ggvis | DataCampwww.datacamp.com ggplot2 よりできることは少な…

ggplot2 と ggvis の違い

新しいツールを学ぼうと、R のグラフィックツール ggvis をいじってみました。理由は、datacamp の作図コース*1では ggplot ではなく ggvis が使われているから。ggplot2 のほうがメジャーなので、そちらをしっかり学びたいですが、ggvis しかないので仕方な…

R のアップデートと Rstudio のアップデート方法

【2016年3月13日追記】 Mac では updateR() は使えないです。普通に R をダウンロードして,インストールし直しがよさそうです。 【2015年12月17日追記】 updateR()ですが、R3.2.3 にアップデートするときに使ってみたところ、うまくいきました。なお、RStud…

R と dplyr と格闘する

ずっとインプットのために論文を読んでいたら、R の操作を忘れそうです。そういえば昨年、マーケティング・リサーチの授業のときに講師をされた他大学の先生は「分析方法はしばらく使ってないと忘れてしまう。なのでその都度思い出してる」と言っていたよう…

ビジネス書1冊以下のコストでRの練習をする方法

Datacamp の無料体験版(アカウントを取って、Step1やStep3をやってみる)をやってみたら、後日「無料体験のとき10点の評価をしてくれてありがとう。通常なら月25ドルだけど、初月は特別9ドルにしてあげるよ」というメールが届きました。 10点満点の評価をし…

意外と便利? Rドキュメントのまとめサイト

R 関連のドキュメントを分野別に整理してくれている便利なサイトがあります。 Search all R packages and function manuals | Rdocumentation 例えば、みんな大好き dplyr のページはこんな感じ↓Manual and help on using the dplyr R Package| Rdocumentati…

ノンプログラマ、非ITエンジニアが R を学ぶにはどうするか

先日、twitter を眺めていたら、次のようなブログの紹介が流れてきました。 初心者でもほぼ無料でR言語を勉強できるコンテンツ10選 - paiza開発日誌 で、その中で紹介されているドットインストールのR言語入門を見てみました。 R言語入門 (全13回)よく知らな…

決定木 mvpart パッケージをインストールする方法(正しいかは自信ない)

【2015年6月14日追記】初めに Option2 を実行したのは、違うブログを見て Option1 と同じことを試したことがあったからです。そのときはダメでした。なので、Option2 を実行したという次第です。それでもダメでもう1度 Option1 をやったらうまく行ったという…

社員満足度(ES)をネタに分析の練習

SPSS も使わないと操作方法を忘れちゃう、ということで使ってみました。社員満足度を測るようなサイト(食べログの会社版みたいなものかな?)があったので、そのデータを自分で打ち込み分析。業界は小売業にして、トップ30社を分析対象にしました。変数は8…

【書籍紹介】『手を動かしながら学ぶ ビジネスに活かすデータマイニング』

3日連続の書籍紹介になります。最近、こちらの本を読みました。Amazonではあまりいい評価を得ていないようですが、読んでみて私は勉強になったので読んでよかったです。初心者レベルを超えているかどうかを測るにはいい本だと思います。 手を動かしながら学…

dplyr と tidyr の解説記事が載っているムック本

これをさらっと読みました。dplyr と tidyr について解説記事があります。活字になっている情報は少ないので、その点で貴重です。内容はネットで探せば出てくるレベルかもしれませんが、印刷されたものが手元にあって、さらっと確認するにはいい本です。 デ…

コーヒー関連の上場企業を主成分分析してみた

Rによる主成分分析の練習結果を記録しておきます。何について分析するか、そしてデータ集めがいちばん大変でした。サントリーが JT の飲料事業を買うというニュースがつい先日出たので、コーヒーについて調べることにしました(やや強引)。コーヒー関連の上…

SPSS と R の主成分分析の違い

いま DBS の「ビジネス統計学」という授業を復習として受けています。今日は主成分分析がテーマの1つでした。授業では SPSS をメインしています。教材の1つとして『文系のための SPSS 超入門』なのですが、こういうデータが載っていました。 銀行名 資本金 …

平均年収と正規分布の練習

修了したビジネススクールのアシスタントとして統計学の授業に参加しています。20名ほどが選択して受講していますが、ハタメだと受講生が理解しているかどうかわからないものです…(先生がわかってるかもしれないけど)。授業は基本、SPSS を使って進行(学…

女性はスマホに費やす時間が増え、本や雑誌に費やす時間は減ったと感じている。あなたはどう?

東海道線に乗っていると、女性のほうが男性よりスマホを使っているように思います。自分の見た光景は実態に合っているのかどうか、確認してみました。無料のネットリサーチを使って、100名に次のような質問に答えてもらっています。 Q1:以前(2~3年前)…

dplyr と tidyr の読み方(呼び方・発音)はコレが正解

ここ数日は dplyr と tidyr のエントリーが続いていましたが、書いている間ずっとなんて読めばいいのかわからないでいました。せっかくなので、どう読む(呼ぶ)のか調査。こちらの動画を参考に。 Hadley Wickham’s dplyr tutorial at useR! 2014, Part 1 | …

dplyr と tidyr でクロス集計表をつくる group_by() & tally() 編

ゴールデンウィークはRと格闘してました。前回と今回はその記録です。 前回とはちょっと違った方法で、クロス集計表を作ってみます。結果は同じです。今回は group_by() を使って列をグループ化する、という作業が1つ増えています。検索すると、今回の方法が…

dplyr と tidyr でクロス集計表をつくる count() 編

どうやったらデータフレーム形式のクロス集計表が簡単にできるかな、と探していたところ、次の2つにページに行き着きました。 クロス集計〜公式:dplyr + tidyr = (xtabs|(f)table) - My Life as a Mock Quantd.hatena.ne.jp dplyr cross tab with missing v…

【列の操作】直感的な操作ができる R パッケージ dplyr の簡単な使い方 その2

今回は【行の操作】直感的な操作ができる R パッケージ dplyr の簡単な使い方 その1 - サービス化する世界 │ The World Is Service. の続きです。今回は列の操作をまとめます。使うデータは同じで infert です。■列の操作に使う関数select() 必要な列だけを…

【行の操作】直感的な操作ができる R パッケージ dplyr の簡単な使い方 その1

なぜかクロス集計表を作るのが苦手です。table()を使えばすぐに作れますが、その後、列に名前をつけたり、データフレーム形式に直す必要があるので面倒に感じていました。そこでデータフレーム形式でクロス集計表を作る方法を知りたいなぁ、と思って検索。dp…

書籍紹介 『Rではじめるビジネス統計分析』:動かないコードもあるけど、勉強になる

さらにRに慣れるため『楽しいR』の次は『Rではじめるビジネス統計分析』を読み始めました。 Rではじめるビジネス統計分析 作者: 末吉正成,里洋平,酒巻隆治,小林雄一郎,大城信晃 出版社/メーカー: 翔泳社 発売日: 2014/07/18 メディア: 大型本 この商品を含む…

書籍紹介 『楽しいR』:初級~中級者にオススメでは?

先日、豊澤栄治さんが書かれた『楽しいR』を読みました。買ってません。スミマセン(図書館で借りました…)。Amazon でレビューも投稿しましたが、もう少し詳しくブログで書いておきます。 楽しいR ビジネスに役立つデータの扱い方・読み解き方を知りたい人…

クリエイティブ・コモンズ・ライセンス
この 作品 は クリエイティブ・コモンズ 表示 - 継承 4.0 国際 ライセンスの下に提供されています。