今日は本の勉強ではなく、実際に今日やったことの備忘録。
一元配置分散分析(ANOVA)
3つ以上の比較対象があるときに、全体的な有意差があるか調べる手法。
csvかxlsの対象データをdata.frameとしてインポートする。
data <- data.frame(リスト名)
anova <- aov(応答変数~説明変数, d=data)
summary(anova)
多重比較
3つ以上の比較対象で、個々の差を調べる手法。
ANOVAで有意差があったときに行う(ことが多い)
Tukey-kramer法がよく使われる(総当たりの検定)
mc <- TukeyHSD(anova)
ヒートマップ作図
どこにどれだけ多いかを色で示す図。
系統樹を加えることで、個々のデータの相同性(距離)がわかる。
csvやxlsからインポートし、リスト型からダブル型に変換
data <- as.matrix(データ名)
このとき、列名・行名は行列データに含めない(colnameやrownameで別に名付ける必要がある)
hm <- heatmap(data)
もしくは、
hm2 <- heatmap.2(data)