07-2 Excelデータの読み込みと因子変数

データの作成

 データはMSエクセルを利用して作成してください.
 いくつかの作成例を挙げますので
,ダウンロードして参考にしてください.目次があるので,いくつかのデータを見てください.
■ 
データは数字部分になります.データの上には,変数名=測定項目名が文字で入力されています.
■ 
変数名は最上の1行に入力し,同じ変数名は使えません
■ 変数名は,日本語文字でも英字でも構いません.MacOSだと英字でなければ文字化けの可能性もあります.
■ 
アンダーバー _ やピリオド . 以外の半角記号(!,”,#,$,%,&など)は使えません数字で始まる変数名は,Rに読み込むと X が先頭に追加されます.
■ よくあるのは,
変数名に半角スペースが入っていることに気づかず,読み込めないときがあります.半角スペースも半角記号になります.結構,多く見られるミスです.
■ データの
欠損値(数字のないところ)も読み込みエラーになります.半角英字でNAと代入しておきます.
■ データは,必ず
1名分を1行に入力してください.2行にまたがって入力することはありません例をみる).また,違う被験者のデータを同じ行に入れることもありません.従って,データは必ず被検者の人数分の行になります
■ また,
データは変数(測定項目)の分だけ,列ができます.列はいくら多くても構いません.

 

因子変数=名義尺度のデータ

■ Rコマンダーでは,因子変数という扱いがあります.これは名義尺度のデータです.
■ 名義尺度の
データを文字で入力していればRコマンダーに読み込んだ段階で自動で名義尺度と認識されます.この例でいえば,A群,B群と文字で入力している「群」のデータです.
■ しかし,この例の右側データのように「群」をA群=0,B群=1のように数字で置き換えて入力する方法もあります(ちょっと不自然ですが数字でコード化して入力することがあります).
■ そうすると,
Rコマンダーで読み込んだ時に,名義尺度のデータではなく,単に数字のデータ(0と1の数字)と認識されるのです.群分けのデータのつもりだったのに,数値で扱われるのです.そのために,様々な計算ができなくなります.
■ そこで,Rコマンダー上で,0,1の数字のデータで入力されていますが,これは名義尺度=因子変数です,と認識させないとなりません
■ 因子変数への変換手順は第7章で解説しています.因子変数への変換を忘れると,半透明に表示されて選べない統計手法があるので,すぐにわかります.