Hazy Ideas

日々の勉強の気づきを書き出しています

R: 確率分布と統計

*個人用メモ

 

正規分布:rnorm(n=数字, mean=平均, sd=標準偏差)

確率数値を返す:dnorm(確率分布)

 

二項分布:rbinom(n=試行回数, size=試行のサイズ, prob=成功確率)

 

ポアソン分布:rpois(n=出力するデータ個数, lamda=平均と分散)

 

統計

最小最大、平均、中央値: summary()

四分位計算: quantile()

相関係数: cor()

相関と散布図の一覧: GGally::ggpairs()

 

t検定: t.test ()(対応がある場合はpaired=TRUEをつける)

ANOVA(分散分析): aov()

 

予測したい結果が応答変数(依存変数)、入力する(予測に使用する)のが予測因子(独立変数)

単回帰: lm(x応答変数~y予測因子, data=データ)

重回帰: lm(x, y1 + y2 + y3, data=データ)

回帰結果のプロット: coefplot()

 

ロジスティック回帰、GLM: glm()

ポアソン回帰: glmのquasipoissonファミリを使う