Hazy Ideas

日々の勉強の気づきを書き出しています

R: 一般化線形モデルGLM

*個人勉強用のノートです。

 

個体が平均λのポアソン分布に従う、確率分布に対して、

個体ごとに異なる説明変数を持つ場合に、統計モデルを観測データに当てはめることをポアソン回帰、

それらの構造のモデルの総称を一般化線形モデルと言う。

 

モデリングの前に図示して眺める(plot)

 

線形予測因子とリンク関数 (β2: slope, β1: intercept)

logλ = β1+β2x

線形予測因子 linear predictor: 右辺、線形結合の式

リンク関数 link function: 左辺、λを含んだ式

 

ポアソン回帰のGLMで対数リンク関数が使われる理由;

推定計算に都合が良く、わかりやすいから

 

統計モデルへの当てはまりのよさfitting

パッケージglmを使えば、最尤推定値が得られる(切片と説明変数x)

 

因子型の説明変数(個体群にグループ)がある場合のGLM

因子fがどの程度影響するかもglmで推定可能

 

説明変数が数量型+因子型の場合

logλ=β1 + β2x + βd (dは因子fをダミー化した数値)

 

対数リンク関数に対して、平均λが線形予測子に等しい(リンク関数が何もない)場合、恒等リンク関数と呼ぶ

 

なんでも正規分布で直線回帰する(LM)のでは現実離れしている

ポアソン分布を当てはめたり、応答変数を対数変換したりする(これをGLMと呼ぶ)