【Rでcsvファイルをインポート】

パソコン

はじめに

Rで行う作業の備忘録と、実際に困ったことの対処法です。

CSVファイルのインポート

インポートの基本

ディレクトリを作業場所まで移動します。

#データをインポート、1行目を項目名とする(行列入れ替えでヘッダーに出来るように)

DATA.data <- read.csv(“DATA.csv”, header=T, row.names=1)

これで、csvファイルの読み込みが出来ます。

headerは、1行目を項目(列名)として設定する場合がT、設定しない場合(1行目がいきなり変数の場合)がFとなります。

1列目を項目(行名)としたい場合が、row.names=1。

その他に、

最初を読み飛ばす:skip

最初にコメントが入っているデータは、skipで読み飛ばすことも可能です。

(下は5行読み飛ばす: skip=5)

DATA.data <- read.csv("DATA.csv", header=T, row.names=1, skip=5)

データの区切り文字の指定:sep

区切り文字がタブやカンマが存在します。カンマ区切りで読み込む場合は、sep=”,”が必要です。

DATA.data <- read.csv("DATA.csv", header=T, row.names=1,sep=",", skip=5)

読む行数を指定:nrow

何行目まで読むか、行数を指定することも可能です。nrowを使用します。

(下記は5行目まで読み込む)

DATA.data <- read.csv("DATA.csv", header=T, row.names=1, nrow=5 )

指定した列を行名とする:row.names

指定した列を行名として使用することも可能です。(変数からは除かれます)

row.names=”列名”、もしくは、row.names=列番号

DATA.data <- read.csv("DATA.csv", header=T, row.names=1,sep=",",row.names="列名", skip=5)

問題 【重複した ‘row.names’ は許されません】

上記を実行しても

重複した ‘row.names’ は許されません

と出ました。

そこで困ったため、Google先生で確認すると、1列目に同じ項目がある(重複している)と読み込めないようです。

重複した1列目を変更することで解決しました。

 

これからも追記していく予定です。

最後に

Rの基本的なことであれば、↑の本がオススメです。

2016年に第3版が出ました。少し古いですが、基本が網羅されています。レビューも高評価。

基本ネットで調べれば出てきますが、本として包括的なテキストを持つことは、便利で私は一冊持っておくのが役立っています。

立ち読みも出来ますので、画像をクリックして立ち読みしてみてください。

パソコン研究
スポンサーリンク
せっちゃんをフォローする
サジマニ【より良い生活のために】

コメント

タイトルとURLをコピーしました