Hazy Ideas

日々の勉強の気づきを書き出しています

R: ANOVA、多重比較検定、ヒートマップ

今日は本の勉強ではなく、実際に今日やったことの備忘録。

 

一元配置分散分析(ANOVA)

3つ以上の比較対象があるときに、全体的な有意差があるか調べる手法。

csvかxlsの対象データをdata.frameとしてインポートする。

data <- data.frame(リスト名)
anova <- aov(応答変数~説明変数, d=data)
summary(anova)

 

多重比較

3つ以上の比較対象で、個々の差を調べる手法。

ANOVAで有意差があったときに行う(ことが多い)

Tukey-kramer法がよく使われる(総当たりの検定)

mc <- TukeyHSD(anova)

 

ヒートマップ作図

どこにどれだけ多いかを色で示す図。

系統樹を加えることで、個々のデータの相同性(距離)がわかる。

csvやxlsからインポートし、リスト型からダブル型に変換

data <- as.matrix(データ名)

このとき、列名・行名は行列データに含めない(colnameやrownameで別に名付ける必要がある)

hm <- heatmap(data)

もしくは、

hm2 <- heatmap.2(data)