Knowledge As Practice

JAIST(東京)で Transformative Service Research に取り組んでる社会人大学院生の研究・勉強メモ

ノンプログラマーのためのR入門

R による整列ランク変換を使った分散分析

整列ランク変換(Aligned Rank Transform:ART)という言葉を聞いたことありますか? 私はなかったです。ART(えーあーるーてぃー。「あーと」ではない)について、Tokyo.R 第61回で LT をしてきました。補足も兼ねて ART についてまとめます。 きっかけ 先…

RMarkdown で参考文献を作るときにちょっとつまずいた話

Rを使うドキュメントはできるだけ RStudio内 で完結するように(コピペが面倒なのと,スライドも配布するPDF資料もRStudioでできるので)環境を整えているところですが,参考文献も自動で挿入できるようにしたいと思いました。やってみて,つまずいたところ…

ggdendro と PAC 分析を使ったサービス学会の発表

2017年3月28日(火)、広島県情報プラザというところで開催されたサービス学会第5回国内大会に参加してきました。仕事以外で広島に滞在したのは小学校の修学旅行ぶりです。 http://ja.serviceology.org/events/domestic2017.html 今回は研究をスタートし始…

R Markdown スライドとPDF 文章(日本語含む)作成メモ

月1回のゼミ前にRを使った統計分析の勉強会をすることになりました。せっかくなので(これまで何度か挫折した)R Markdown でやろうと思い立ち,今回は成功したので資料づくり(スライドとPDF)のメモを書いておきます。自分が忘れないように。 1)R Markdow…

旅人と RStudio

このエントリーは RStudio Advent Calendar 2016 の23日目のエントリーです。ちなみ,本日は Osaka.stan 第2回に参加してきます。 さて,私は仕事柄,出張が多く,2016年は12月末までに224泊する予定です。だいたい1日ごとに移動しています。たぶん,日本で…

rstanで分析をするのに必要なR力(りょく)

Stan Advent Calendar 2016 の 4日目です。非マニア枠です。 本日のエントリーは Stan を普通に使える人、情報科学・データ科学な人を対象にしていません。少し R に慣れてきて、ベイズ統計モデリングにも興味を持ち始めた人向け。ずばりターゲットは次のよ…

5章まで読了『StanとRでベイズ統計モデリング』

昨日はJapan.Rに初参加。4〜5時間ずっとスクリーンを見ていたので眼精疲労がスゴい。8割方よくわからなかった(領域が違うので)けれど,おもしろい収穫もありました*1。 さて,『StanとRでベイズ統計モデリング』を5章まで読み進めました。私は出張が多いの…

4章まで読了。『StanとRでベイズ統計モデリング』

当初1〜8章まででいいかなと目次を見てつぶやいたら,著者の方から「10章も読んだほういい」というアドバイスをいただきました(感謝です。読むモチベーションもあがります)。ということで,1〜8章+10章を読むことを目標にします*1。自分の復習として感想を…

統計的因果推論勉強会 第5回を開催しました!

経営学系統計分析エンドユーザーのため統計的因果推論勉強会第5回を行いました。最近週休3日制を打ち出した某有名大企業の新しいオフィス内での開催で,とても楽しかったです。参加者は7名(クローズド)。 speakerdeck.com 今回は宮川本の第5章(の特にバッ…

勉強会ツールとしての R Notebooks

RStudio をプロジェクタで映すと,ソースエディタが小さく見にくいです。必要なところだけを集中して,見やすくすることってできないだろうか,という動機から,もう1つの選択肢である R Notebooks(あーるのーとぶっく*1)を使えるようにしてみました。 RSt…

量的アプローチによる価値共創の研究発表@第6回知識共創フォーラム in 金沢

先週(2016年3月12〜13日),金沢で開催された第6回知識共創フォーラムで発表をしてきました。相馬・清水(2015)*1に大きく影響を受けた分析の結果発表でした。もともと潜在ランク理論はどこかで知っていて,自分の研究に使えそうだなぁと思っていたところ…

その有意差に意味あるの? ~ノンパラメトリック検定と効果量の出し方~

Kobe.R 第24回で発表をしてきました。今回は来週日曜日に金沢で発表する内容のデータ分析部分(特にRの操作)をメインに切り出したものを発表しました。 ↓使用したスライドはこちらにあります↓ RPubs - Rによるノンパラメトリック検定と効果量の出し方 slide…

論文「顧客収益性の統計的分析」を読む

最近、統計分析の学習をしていなかったので、勉強になる論文を読んでみました。マルチレベル分析の経営学での応用事例を検索していて見つけたものです。偶然というか、第1著者は私の専門職学位論文の分析パートをチェックしてくださった先生、第3著者は専門…

今年のデータ分析の学習はじめはドキュメント作成からスタート

今年は Reproducible research を意識したいです(下のスライドが参考になります)。昨年はデータと分析結果がとっ散らかって、自分が分析した手順・内容を忘れしまい、何度も同じことを繰り返すことがありましたので…。 Rでreproducible research from sfch…

Rによるカテゴリカルデータ分析事例(3) ~{rms}パッケージによる順序ロジスティック回帰~

●2016年1月3日 追記 本エントリー中で使っている makedummies() がさらに便利に使えるようになっています。 アップデート版の使い方はコメント欄を参照してください。 以上、追記終わり。 ---- 前回までに、あるサービスを受けた500人の顧客の満足度および変…

Rによるカテゴリカルデータ分析事例(2) ~(1) の補足:等分散性を確認していたか?~

前回のエントリーを書いたあと、現在は手に入りにくい本『Rによる統計解析の基礎』(私は買いました)の最新版『Rによる保健医療データ解析演習』を確認し、さらに「マイナーだけど最強の統計的検定 Brunner-Munzel 検定」を読むと、ウィルコクソンの順位和…

Rによるカテゴリカルデータ分析事例(1)  {coin}パッケージによるウィルコクソンの順位和検定とクラスカル・ウォリス検定

先日(2015年12月26日土曜日)に開催された Kobe.R 第23回で発表を行いました。当日はちょっと風邪気味だったため、あまり準備ができず、テキトーな内容になってしまいました…。そのため、ここで補足をしたいと思います。 kobexr.doorkeeper.jp 発表タイトル…

Rでダミー変数をつくる。makedummies 関数で。

●2015年12月28日 追記 makedummies 関数の作者の方から、コメントで情報をいただきました。 以下のように、 install_github で 簡単に makedummies が使えるようになっています。 ## devtools がなければインストール→ install.packages("devtools") library…

Rによる級内相関係数(ICC)の2つの出し方

2~3ヶ月前から、マルチレベル分析*1を学んでいます。分析自体はできます(便利なことに、コード1行でできるので)。しかし、手持ちのデータでマルチレベル分析を使うべきなのかどうか、迷います。そんなときは級内相関係数(ICC)を確認するのが一般的なよ…

統計学エンドユーザーのための JAGS 入門

岩波データサイエンス vol.1 のどこかのページに「初心者はJAGS(BUGS)」と書いてあったので*1、こつこつ学び始めています。世の中は Stan 大人気ですが、気にしない…。まず JAGS に慣れてから Stan をやります…。本エントリーは、前回のエントリーと多くが…

JAGS と Stan と lm

ここ最近、GLM や GLMM の学び直しをしていました。みどりぼんも2周目になり、6~7割は理解できるようになったと思います。そこで、唐突ですが3ヶ月ほど前に Stan&Rstan でやった、単回帰分析を JAGS&rjags でやります。元ネタ(?)はこちら。 hikaru112…

「ドットなしRprofile」に気をつけよう。最近の R 事件簿

ここ1~2週間、R関連の不具合で消耗していました。たぶん、私のような憂き目にあう人はいないかと思いますが、いちおう備忘録として書いておきます。 1.以前動いていた Rstan が動かない。 glmmstan が便利そうだなと思って、使ってみたのですが、コンパイ…

RStudio より軽くてサクサク。Sublime で R コンソールと連携

【追記 2016年4月26日】 sulibme text3 で R-box が動くという情報をいただいています。 コメント欄をご参照ください。 【追記 2016年3月24日】 私の環境(windows10, sublime text3)ではうまく動いていません。 現在はRstudio 使ってます…。 このブログの…

Kobe.R で発表「しません」でした

2015年10月3日(土)は Kobe.R に参加してきました。20名弱の参加だったと思います。グランフロント大阪・ナレッジサロンのミーティングルームを使っての開催でした。今回は発表者が多く、私も発表する予定でしたが、時間的に断念しました。 発表する予定だ…

保存版。Rpresentation の記法メモ

.Rpres に関する情報(日本語)が少ない! .Rpres は RStudio で作るプレゼンテーションスライドです*1。こういうことができますよ、という説明ページは見つかるんですが、じゃあどうすればいいかまでは書いていないところが多いです。 というわけで、来月(…

RStudio よりもいい環境を求めて…

Rstudio がなんか最近モッサリしてきたので(もともとだったかもしれないけど)、もっといい環境がないかと探しました。 ITエンジニア・プログラマの人たちは、かっこいいエディタを使っているという…。なんかちょっと憧れる。あとはRが簡単に動けばよし。候…

ついに読了! 『基礎からのベイズ統計学』 11日目

ついに『基礎からのベイズ統計学』も最後。11回かかりました。1回あたり、16ページを読み進んだことになります。移動中、出張先のホテル、自宅でコツコツ読み進めることができました。 最終章である第8章では、比率の差、相関係数の差、切断データの推測、級…

Rstan でベイズ分析を行うための環境を作る方法メモ

『基礎からのベイズ統計学』第6章以降はベイズ統計学を使った応用例(たぶん基本的で大事な)が紹介されています。こういうのは、実際に自分で分析をして結果を見るのが大切です。ただ『基礎からのベイズ統計学』では、分析環境を整える方法は省略されていま…

ggvis に関する情報のまとめ

もう今週は R と統計分析の勉強ウィークしました。量的研究を志向しているので、こういう勉強もそれなりに必要なのです…。 とはいえ、こればかりはやっていられませんから、ggvis の探求は今日でいったんお休みにしたいと思います。今後の勉強メモとして、必…

ggvis に5時間ほど触れてわかったこと

昨日に引き続き、ggvis をいじりました。仕事が終わってから、下のコースで5時間ほど格闘。開発者の発音によると、ggvis は「じーじーびず」と読むようです。 Data Visualization in R with ggvis | DataCampwww.datacamp.com ggplot2 よりできることは少な…

ggplot2 と ggvis の違い

新しいツールを学ぼうと、R のグラフィックツール ggvis をいじってみました。理由は、datacamp の作図コース*1では ggplot ではなく ggvis が使われているから。ggplot2 のほうがメジャーなので、そちらをしっかり学びたいですが、ggvis しかないので仕方な…

R のアップデートと Rstudio のアップデート方法

【2016年3月13日追記】 Mac では updateR() は使えないです。普通に R をダウンロードして,インストールし直しがよさそうです。 【2015年12月17日追記】 updateR()ですが、R3.2.3 にアップデートするときに使ってみたところ、うまくいきました。なお、RStud…

R と dplyr と格闘する

ずっとインプットのために論文を読んでいたら、R の操作を忘れそうです。そういえば昨年、マーケティング・リサーチの授業のときに講師をされた他大学の先生は「分析方法はしばらく使ってないと忘れてしまう。なのでその都度思い出してる」と言っていたよう…

ビジネス書1冊以下のコストでRの練習をする方法

Datacamp の無料体験版(アカウントを取って、Step1やStep3をやってみる)をやってみたら、後日「無料体験のとき10点の評価をしてくれてありがとう。通常なら月25ドルだけど、初月は特別9ドルにしてあげるよ」というメールが届きました。 10点満点の評価をし…

意外と便利? Rドキュメントのまとめサイト

R 関連のドキュメントを分野別に整理してくれている便利なサイトがあります。 Search all R packages and function manuals | Rdocumentation 例えば、みんな大好き dplyr のページはこんな感じ↓Manual and help on using the dplyr R Package| Rdocumentati…

ノンプログラマ、非ITエンジニアが R を学ぶにはどうするか

先日、twitter を眺めていたら、次のようなブログの紹介が流れてきました。 初心者でもほぼ無料でR言語を勉強できるコンテンツ10選 - paiza開発日誌 で、その中で紹介されているドットインストールのR言語入門を見てみました。 R言語入門 (全13回)よく知らな…

決定木 mvpart パッケージをインストールする方法(正しいかは自信ない)

【2015年6月14日追記】初めに Option2 を実行したのは、違うブログを見て Option1 と同じことを試したことがあったからです。そのときはダメでした。なので、Option2 を実行したという次第です。それでもダメでもう1度 Option1 をやったらうまく行ったという…

社員満足度(ES)をネタに分析の練習

SPSS も使わないと操作方法を忘れちゃう、ということで使ってみました。社員満足度を測るようなサイト(食べログの会社版みたいなものかな?)があったので、そのデータを自分で打ち込み分析。業界は小売業にして、トップ30社を分析対象にしました。変数は8…

【書籍紹介】『手を動かしながら学ぶ ビジネスに活かすデータマイニング』

3日連続の書籍紹介になります。最近、こちらの本を読みました。Amazonではあまりいい評価を得ていないようですが、読んでみて私は勉強になったので読んでよかったです。初心者レベルを超えているかどうかを測るにはいい本だと思います。 手を動かしながら学…

dplyr と tidyr の解説記事が載っているムック本

これをさらっと読みました。dplyr と tidyr について解説記事があります。活字になっている情報は少ないので、その点で貴重です。内容はネットで探せば出てくるレベルかもしれませんが、印刷されたものが手元にあって、さらっと確認するにはいい本です。 デ…

コーヒー関連の上場企業を主成分分析してみた

Rによる主成分分析の練習結果を記録しておきます。何について分析するか、そしてデータ集めがいちばん大変でした。サントリーが JT の飲料事業を買うというニュースがつい先日出たので、コーヒーについて調べることにしました(やや強引)。コーヒー関連の上…

SPSS と R の主成分分析の違い

いま DBS の「ビジネス統計学」という授業を復習として受けています。今日は主成分分析がテーマの1つでした。授業では SPSS をメインしています。教材の1つとして『文系のための SPSS 超入門』なのですが、こういうデータが載っていました。 銀行名 資本金 …

平均年収と正規分布の練習

修了したビジネススクールのアシスタントとして統計学の授業に参加しています。20名ほどが選択して受講していますが、ハタメだと受講生が理解しているかどうかわからないものです…(先生がわかってるかもしれないけど)。授業は基本、SPSS を使って進行(学…

女性はスマホに費やす時間が増え、本や雑誌に費やす時間は減ったと感じている。あなたはどう?

東海道線に乗っていると、女性のほうが男性よりスマホを使っているように思います。自分の見た光景は実態に合っているのかどうか、確認してみました。無料のネットリサーチを使って、100名に次のような質問に答えてもらっています。 Q1:以前(2~3年前)…

dplyr と tidyr の読み方(呼び方・発音)はコレが正解

ここ数日は dplyr と tidyr のエントリーが続いていましたが、書いている間ずっとなんて読めばいいのかわからないでいました。せっかくなので、どう読む(呼ぶ)のか調査。こちらの動画を参考に。 Hadley Wickham’s dplyr tutorial at useR! 2014, Part 1 | …

dplyr と tidyr でクロス集計表をつくる group_by() & tally() 編

ゴールデンウィークはRと格闘してました。前回と今回はその記録です。 前回とはちょっと違った方法で、クロス集計表を作ってみます。結果は同じです。今回は group_by() を使って列をグループ化する、という作業が1つ増えています。検索すると、今回の方法が…

dplyr と tidyr でクロス集計表をつくる count() 編

どうやったらデータフレーム形式のクロス集計表が簡単にできるかな、と探していたところ、次の2つにページに行き着きました。 クロス集計〜公式:dplyr + tidyr = (xtabs|(f)table) - My Life as a Mock Quantd.hatena.ne.jp dplyr cross tab with missing v…

【列の操作】直感的な操作ができる R パッケージ dplyr の簡単な使い方 その2

今回は【行の操作】直感的な操作ができる R パッケージ dplyr の簡単な使い方 その1 - サービス化する世界 │ The World Is Service. の続きです。今回は列の操作をまとめます。使うデータは同じで infert です。■列の操作に使う関数select() 必要な列だけを…

【行の操作】直感的な操作ができる R パッケージ dplyr の簡単な使い方 その1

なぜかクロス集計表を作るのが苦手です。table()を使えばすぐに作れますが、その後、列に名前をつけたり、データフレーム形式に直す必要があるので面倒に感じていました。そこでデータフレーム形式でクロス集計表を作る方法を知りたいなぁ、と思って検索。dp…

書籍紹介 『Rではじめるビジネス統計分析』:動かないコードもあるけど、勉強になる

さらにRに慣れるため『楽しいR』の次は『Rではじめるビジネス統計分析』を読み始めました。 Rではじめるビジネス統計分析 作者: 末吉正成,里洋平,酒巻隆治,小林雄一郎,大城信晃 出版社/メーカー: 翔泳社 発売日: 2014/07/18 メディア: 大型本 この商品を含む…

クリエイティブ・コモンズ・ライセンス
この 作品 は クリエイティブ・コモンズ 表示 - 継承 4.0 国際 ライセンスの下に提供されています。