*個人勉強用のノートです。
個体が平均λのポアソン分布に従う、確率分布に対して、
個体ごとに異なる説明変数を持つ場合に、統計モデルを観測データに当てはめることをポアソン回帰、
それらの構造のモデルの総称を一般化線形モデルと言う。
モデリングの前に図示して眺める(plot)
線形予測因子とリンク関数 (β2: slope, β1: intercept)
logλ = β1+β2x
線形予測因子 linear predictor: 右辺、線形結合の式
リンク関数 link function: 左辺、λを含んだ式
ポアソン回帰のGLMで対数リンク関数が使われる理由;
推定計算に都合が良く、わかりやすいから
統計モデルへの当てはまりのよさfitting
パッケージglmを使えば、最尤推定値が得られる(切片と説明変数x)
因子型の説明変数(個体群にグループ)がある場合のGLM
因子fがどの程度影響するかもglmで推定可能
説明変数が数量型+因子型の場合
logλ=β1 + β2x + βd (dは因子fをダミー化した数値)
対数リンク関数に対して、平均λが線形予測子に等しい(リンク関数が何もない)場合、恒等リンク関数と呼ぶ
なんでも正規分布で直線回帰する(LM)のでは現実離れしている
→ポアソン分布を当てはめたり、応答変数を対数変換したりする(これをGLMと呼ぶ)