R: 一般化線形モデルGLM

＊個人勉強用のノートです。

個体が平均λのポアソン分布に従う、確率分布に対して、

個体ごとに異なる説明変数を持つ場合に、統計モデルを観測データに当てはめることをポアソン回帰、

それらの構造のモデルの総称を一般化線形モデルと言う。

モデリングの前に図示して眺める（plot）

線形予測因子とリンク関数 (β2: slope, β1: intercept)

logλ = β1+β2x

線形予測因子 linear predictor: 右辺、線形結合の式

リンク関数 link function: 左辺、λを含んだ式

ポアソン回帰のGLMで対数リンク関数が使われる理由；

推定計算に都合が良く、わかりやすいから

統計モデルへの当てはまりのよさfitting

パッケージglmを使えば、最尤推定値が得られる（切片と説明変数x）

因子型の説明変数（個体群にグループ）がある場合のGLM

因子fがどの程度影響するかもglmで推定可能

説明変数が数量型＋因子型の場合

logλ=β1 + β2x + βd　（dは因子fをダミー化した数値）

対数リンク関数に対して、平均λが線形予測子に等しい（リンク関数が何もない）場合、恒等リンク関数と呼ぶ

なんでも正規分布で直線回帰する（LM）のでは現実離れしている

→ポアソン分布を当てはめたり、応答変数を対数変換したりする（これをGLMと呼ぶ）

Hazy Ideas