Hazy Ideas

日々の勉強の気づきを書き出しています

R: データ整形

*個人用メモ

 

複数のデータセットを統合する。

行・列数が同じならcbind、rbindで結合できる。

2つのdata.frameを結合するにはmerge関数、だが遅いのが欠点。

plyrパッケージのjoin関数が早い。

 

dplyrにおいて、同様の関数はbind_rowsとbind_cols(読みやすい)

ただし、data.frameにのみ適応(cbind/rbindはvectorも対応)。

left_join (X, Y): 左側テーブルXの行を保持して、右側テーブルYの一致した行だけを保持する

right_join: 上の逆

 

tidyrのgather関数:行指向の型式を列指向にする。(データが縦長になるイメージ)

gather(key = A, value = B, c, d, e)

意味:新しい列名Aに対して、c,d,eの列名が格納される。c,d,eは1つに纏まってB列と名付けられる。

spread関数:列指向の形式を行指向にする。(データが横長になるイメージ)

spread(key = A, value =B)