【2021年4月刊行】
Rコマンダーで簡単! 医療系データ解析
対馬栄輝 著 東京図書
B5判変形 344頁 定価3520円
ISBN978-4-489-02358-3 C0047
Contents
■ はじめに
.
- 本ホームページでは,東京図書『Rコマンダーで簡単!医療系データ解析』の補足資料,情報を掲載します.
- 本書ではRとRコマンダーによる簡単な統計解析方法を解説しています.
本書の目的は,
①Rコマンダーを使用して基本的な統計解析,結果の読み方を習得する.
②web等で公開されている(これからも公開される),RやRコマンダーを活用した様々な統計手法を,将来的に自分でも操作できるようになる(高度な関数入力ではなくパッケージというオプションの活用).
の2点です.全ての統計手法が最初から入っている統計ソフトは理想です.しかし,世の中にそうした統計ソフトは出回っていません.「この論文で使用している○○検定が行いたい…」と思ったとき,人に頼ったり,お金で解決できればいいのですが,なかなかそういかないときもあります.
Rであれば,数多くの統計手法のオプション(パッケージ)がweb等で公開されています.パッケージを使用できるようになれば活用価値は上がります.本書の手順に従ってパッケージを使えるようになれば可能性が高まります.
Rコマンダーは誰でもすぐに簡単にできる,とはいえません.率直にいって,Rコマンダーは初心者にとって難しい統計ソフトです.たいていの人は,最初はやはり,その操作が面倒だからあきらめます.しかし,少しでいいので四苦八苦しながらでも試してみると,意外にすぐ慣れてきて,思ったより簡単にできるようになる人が多いのも事実です.統計解析は,必要に迫られた時に短時間で行うという場面が多いので,少し操作してできなければ「難しい,あきらめた」というケースが多いのです.
少し時間をとって,ゆっくり順を追って行えば誰でも必ずできるようになります.これからは自らが測定したデータを,よくわからないまま解析するとか,他人に解析をお願いするという時代ではなくなります.自分が何を行っているか,僅かでも理解していなければ大きな問題を引き起こします.
最初は「簡単に」とはいえませんが,世界でもトップレベルの精度を誇る統計ソフトが無料で入手できるなら,活用しない手はありません.戸惑いながらでも,まずは見よう見まねで操作してみてください.慣れるとすばらしさがわかります.
このホームページに記載されている,コマンド類を参考に,それぞれ該当箇所にコピー&ペーストすれば,入力作業も省略できて実行できます.是非,繰り返し練習して慣れてください.
★著者より
本書は数理的理論を修得することが目的ではありません.数理的な理論は数理統計学の専門家が扱います.各統計理論のエキスパートは世界中に沢山います.理論を知っていれば統計解析も正確にできるという誤解が世に出回っています.理論を修得することと,データから必要とする情報を得るスキルは異なります.しかし,理論家に何か言われると知識も希薄なので信じ込んでしまう統計信者も非常に多いのです.データから何を読みとるか,何を訴えているのかを把握できるのは指図する理論家ではなく実務家そのものです.その意味で著者は「統計学」という用語を使わず「データ解析」という用語を使っています.統計学の理論ではなく,データから訴えを読みとるデータ解析学の習得が必要なのです.
■ 各章の補足解説
まとめて対処 | 第2章 | 第3章 | 第4章 | 第5章 | 第6章 | 第7章 | 第8章 |
第9章 | 第10章 | 第11章 | 第12章 | 第13章 | 第14章 | 第15章 |
■ 更新情報&正誤情報
● 2021.5.4
CRANではR4.0.5を提供開始していますが,本書のパッケージ userfriendlyscience はR4.0.4までしか対応していません.代わりに rosetta のパッケージを使用すれば問題は解決します.
● 2021.10.20
本書p.317に誤植がありました.下の「本書に関する追加事項・変更・資料など」を参照してください.
■ 本書で使用するパッケージ
本書では,いくつかのパッケージを使用します.
パッケージとは,RまたはRコマンダーのオプションのようなものです.
できる限り,少ない構成で説明していますが,本書では,以下のパッケージを使用します.本書を読む前は「パッケージ?なにそれ?」と思うでしょう.
lmerTest
coin
agricolae
userfriendlyscience (R4.0.5より,rosetta に変更)
NSM3
vcd
ResourceSelection
exactRankTests
各章では,その都度必要なパッケージのインストール方法,起動方法(パッケージの呼び出し)を説明します.見た目は面倒なイメージがありますが,一度行えばあとは簡単です.
もし,各章ごとのインストール作業は面倒だというときは,最初に上の「まとめて対処」を参照しておけば,本書で紹介するパッケージを一度に全てインストールできます.できるだけ簡単にと思う人は,最初に行っておくと良いでしょう.
■ Rコマンド,Rスクリプト
本書では,R本来の難解な操作であるコマンド,Rスクリプトの入力も行います.
ただし,暗記するとか,関数の詳細を覚えるということは要求しません.
そもそも,こうした面倒を避けたいのでRコマンダーを使用しています.
しかしどうしても避けられないコマンド入力は,左上のメニューにある各章のページでにコマンドを掲載するので,マウスで範囲指定,コピー後に,Rに貼り付け,実行してください.
それでもどうしてもコマンドは触れたくない人には,無理にでも!とはいいません.他の手順で練習して慣れてからでも遅くはありませんので,焦らずに学習して下さい.
■ Rコマンダーショートカットの設定
Rの起動用のショートカットアイコン(ディスクトップにある起動用のアイコン)の設定を少しかえると,その後の面倒な手間が省けます.
ショートカットのつくり方はこちらで解説していますが,原則は,本ホームページからのコピー&ペーストで大丈夫です.
■ 本書で使用するEXCEL例題データ
以下のリンクからダウンロードしてください.
■ まとめて対処
RまたはRコマンダーをインストール後,1章ごとに,パッケージやコマンドの操作が,ちょくちょく入っています.上述したように,コマンドが使えなければ(いやなら)解析できませんということはありません.あくまで理想的な結果を得るためには,そういった作業も必要になるのです.
しかし,毎回,章ごとにパッケージをダウンロードして,コマンドを入れて…というのは面倒です.そこで,Rをインストールした後すぐに,ひとまとめに行ってしまうという手もあります.
ひとまとめに済ますための解説を左上メニューの「まとめて対処」のページに用意しておくので,面倒な人は最初に行っておけばよいと思います.
■ とにかく簡単に解析したい方
筆者は,Rコマンダーにさらに様々な手法を付加した,『改変Rコマンダー』も作成,配布しています.Rコマンダーと比較してメニューの数は増えており,パッケージのインストールやコマンド入力,本書で解説したようなショートカットの設定も不要となるので,本書の方法も簡単に解析できるメリットがあります.
CRANとは別配信のため,基盤となるRのバージョンは最新とは限りませんが,基本操作は同一ですし,精度が落ちることもありません.また,本書で説明している煩雑な手順の代わりに改変Rコマンダーメニューで選ぶ方法を,左上メニューの各章最下部で補足しています.
どちらを選ぶかは自由ですが,本書を活用するためには通常のR,Rコマンダーを使用してください.
まずは面倒な手順は省略したいという人は,改変Rコマンダーを使用してみて下さい.
改変Rコマンダーは,Windows版,Mac版(バージョンアップ停止中)の両方とも配信しています.
■ 本書に関する追加事項・変更・資料など
わかりにくい,この手法はどうやったらいいかなどの追加,質問に対して,こちらに追加していきます.ただし,必ず回答を約束できるわけではありませんのでご了承ください.
また,本書とは大きくかけ離れたような解析法の相談等は(本来,協力をしたいところですが),時間の都合上受け付けられませんことが多いので,返答は保証できませんことをご容赦ください.
出版社へのお問い合わせも同様です.
■ 誤植訂正
①Mendosaの多標本球形性検定
p<0.05のとき→②では,反復測定による分散分析
pが0.05以上のとき→②にGreenhouse-Geisserのε修正による反復測定分散分析が自動で選択されて出力される
↓訂正
①Mendosaの多標本球形性検定
pが0.05以上のとき→②では,反復測定による分散分析
p<0.05のとき→②にGreenhouse-Geisserのε修正による反復測定分散分析が自動で選択されて出力される
に訂正してください.
「②分散分析の結果」のところで,
……
→ここがp<0.05のときは,②多重比較法の結果も出力
↓訂正
→ここがp<0.05のときは,③多重比較法の結果も出力
に訂正してください.