【Rでcsvファイルをインポート】

パソコン

はじめに

Rでは、間違った部分が存在すると、エラーが生じます。

最初の頃は、そのエラーだけで何日も費やすことがありますので、エラーとその解決策を今後の方のために残していきたいと思います。

R言語とはプログラミング言語の一つです。特に統計解析に強いとされます。さらにDeep learningの分野でも注目を浴びています。

Rでのエラーでよく出会うものを選んで、その原因と解決法を載せていきたいと思います。

Rをはじめよう生命科学のためのRStudio入門

CSVファイルのインポート

インポートの基本

ディレクトリを作業場所まで移動します。

#データをインポート、1行目を項目名とする(行列入れ替えでヘッダーに出来るように)

DATA.data <- read.csv(“DATA.csv”, header=T, row.names=1)

これで、csvファイルの読み込みが出来ます。

headerは、1行目を項目(列名)として設定する場合がT、設定しない場合(1行目がいきなり変数の場合)がFとなります。

1列目を項目(行名)としたい場合が、row.names=1。

その他に、

最初を読み飛ばす:skip

最初にコメントが入っているデータは、skipで読み飛ばすことも可能です。

(下は5行読み飛ばす: skip=5)

DATA.data <- read.csv("DATA.csv", header=T, row.names=1, skip=5)

データの区切り文字の指定:sep

区切り文字がタブやカンマが存在します。カンマ区切りで読み込む場合は、sep=”,”が必要です。

DATA.data <- read.csv("DATA.csv", header=T, row.names=1,sep=",", skip=5)

読む行数を指定:nrow

何行目まで読むか、行数を指定することも可能です。nrowを使用します。

(下記は5行目まで読み込む)

DATA.data <- read.csv("DATA.csv", header=T, row.names=1, nrow=5 )

指定した列を行名とする:row.names

指定した列を行名として使用することも可能です。(変数からは除かれます)

row.names=”列名”、もしくは、row.names=列番号

DATA.data <- read.csv("DATA.csv", header=T, row.names=1,sep=",",row.names="列名", skip=5)

問題 【重複した ‘row.names’ は許されません】

上記を実行しても

重複した ‘row.names’ は許されません

と出ました。

そこで困ったため、Google先生で確認すると、1列目に同じ項目がある(重複している)と読み込めないようです。

重複した1列目を変更することで解決しました。

 

これからも追記していく予定です。

Rの基本的なことであれば、下記の本がオススメです。

2016年に第3版が出ました。少し古いですが、基本が網羅されています。レビューも高評価。

基本ネットで調べれば出てきますが、本として包括的なテキストを持つことは、便利で私は一冊持っておくのが役立っています。

立ち読みも出来ますので、下記リンクから立ち読みしてみてください。

The R Tips 第3版: データ解析環境Rの基本技・グラフィックス活用集

こちらも高評価かつ新しい本になります。特に初心者におすすめの内容です。

知りたい内容があるか、目次で確認してもらえるので、必要であるか確認してみてください。

Rをはじめよう生命科学のためのRStudio入門

コメント

タイトルとURLをコピーしました