はじめに
Rでは、間違った部分が存在すると、エラーが生じます。
最初の頃は、そのエラーだけで何日も費やすことがありますので、エラーとその解決策を今後の方のために残していきたいと思います。
R言語とはプログラミング言語の一つです。特に統計解析に強いとされます。さらにDeep learningの分野でも注目を浴びています。
Rでのエラーでよく出会うものを選んで、その原因と解決法を載せていきたいと思います。
CSVファイルのインポート
インポートの基本
ディレクトリを作業場所まで移動します。
#データをインポート、1行目を項目名とする(行列入れ替えでヘッダーに出来るように)
DATA.data <- read.csv(“DATA.csv”, header=T, row.names=1)
これで、csvファイルの読み込みが出来ます。
headerは、1行目を項目(列名)として設定する場合がT、設定しない場合(1行目がいきなり変数の場合)がFとなります。
1列目を項目(行名)としたい場合が、row.names=1。
その他に、
最初を読み飛ばす:skip
最初にコメントが入っているデータは、skipで読み飛ばすことも可能です。
(下は5行読み飛ばす: skip=5)
DATA.data <- read.csv("DATA.csv", header=T, row.names=1, skip=5)
データの区切り文字の指定:sep
区切り文字がタブやカンマが存在します。カンマ区切りで読み込む場合は、sep=”,”が必要です。
DATA.data <- read.csv("DATA.csv", header=T, row.names=1,sep=",", skip=5)
読む行数を指定:nrow
何行目まで読むか、行数を指定することも可能です。nrowを使用します。
(下記は5行目まで読み込む)
DATA.data <- read.csv("DATA.csv", header=T, row.names=1, nrow=5 )
指定した列を行名とする:row.names
指定した列を行名として使用することも可能です。(変数からは除かれます)
row.names=”列名”、もしくは、row.names=列番号
DATA.data <- read.csv("DATA.csv", header=T, row.names=1,sep=",",row.names="列名", skip=5)
問題 【重複した ‘row.names’ は許されません】
上記を実行しても
重複した ‘row.names’ は許されません
と出ました。
そこで困ったため、Google先生で確認すると、1列目に同じ項目がある(重複している)と読み込めないようです。
重複した1列目を変更することで解決しました。
これからも追記していく予定です。
Rの基本的なことであれば、下記の本がオススメです。
2016年に第3版が出ました。少し古いですが、基本が網羅されています。レビューも高評価。
基本ネットで調べれば出てきますが、本として包括的なテキストを持つことは、便利で私は一冊持っておくのが役立っています。
立ち読みも出来ますので、下記リンクから立ち読みしてみてください。
The R Tips 第3版: データ解析環境Rの基本技・グラフィックス活用集
こちらも高評価かつ新しい本になります。特に初心者におすすめの内容です。
知りたい内容があるか、目次で確認してもらえるので、必要であるか確認してみてください。
コメント