*個人勉強用のノートです。
確率分布、リンク関数、線形予測因子を組み合わせたのがGLM(個体差のない前提)、さらに個体差も含めたモデルがGLMM。
人が観測できない・測定できなかったデータ、かつ原因不明の差異を組み込む。
過分散overdispersion: 期待した二項分布に対してばらつきが大きすぎる
(サンプル側ではなく、統計モデリングしている人間側の誤差を示す)
観測されていない個体差(生物学的・非生物学的な差異)、rとする
logit(q) = β1 + β2X + r
固定効果:β1、β2X
ランダム効果:r
確率分布を考える時、rはそもそも観測できなかった量なので何が正しいか(rがどの分布に従うか)分からない
GLMMのrは最尤推定はできない
L = ∫ p(y | β1, β2, r) p(r | s)dr
p(r |s)はたくさんのrの様々な可能性を考慮している(重み付け)
尤度Lは、二項分布と正規分布を掛け合わせている、つまり無数の二項分布を混ぜ合わせている
RではglmmMLを使う
coefはパラメーターの最尤推定値
Scale parameterは個体差rのばらつきであるsの最尤推定値
残差逸脱度、自由度、AIC
データのサンプリングには反復、擬似反復がある
同じ個体からサンプリングするのが反復replication
類似のグループからサンプリングするのが擬似反復pseudo replication
GLMMでは反復と擬似反復のランダム効果を指定することができる(しなければならない)
GLMMは二項分布のほか、負の二項分布と仮定することもできる
ガンマ分布や正規分布の場合は、lme4パッケージのglmer関数が使える