では、モデルを作成します。変数chdは0/1なので、二項分布を仮定したモデルを組みます。モデルには職業を表す変数job(driver, conductor, bank worker)も含めることにしました。(※本データはコホート研究なので、オッズ比ではなく相対リスクが求められる気もしますが、今回はORとします)
#ロジット-二項モデル
#説明変数に脂肪、食物繊維、摂取エネルギー、体重、調査月、職業
fit <- glm(chd ~ fat + fibre + energy + weight + month + job + y,
data = diet,
family = binomial(link="logit"))
#結果
summary(fit)
Call:
glm(formula = chd ~ fat + fibre + energy + weight + month + job +
y, family = binomial(link = "logit"), data = diet)
Deviance Residuals:
Min 1Q Median 3Q Max
-2.0752 -0.4211 -0.2567 -0.1499 2.9383
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 2.41407 1.78929 1.349 0.17728
fat -0.25932 0.15530 -1.670 0.09496 .
fibre -0.99924 0.57815 -1.728 0.08393 .
energy 0.09327 0.09391 0.993 0.32064
weight 0.01472 0.02108 0.698 0.48509
month -0.05957 0.05790 -1.029 0.30357
jobConductor 1.03778 0.54414 1.907 0.05650 .
jobBank worker 1.55917 0.54841 2.843 0.00447 **
y -0.32176 0.04614 -6.973 3.1e-12 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 258.88 on 328 degrees of freedom
Residual deviance: 174.04 on 320 degrees of freedom
( 8 個の観測値が欠損のため削除されました )
AIC: 192.04
Number of Fisher Scoring iterations: 6
ID 学年 性別
Min. : 1.00 Min. :1 Length:300
1st Qu.: 75.75 1st Qu.:1 Class :character
Median :150.50 Median :2 Mode :character
Mean :150.50 Mean :2
3rd Qu.:225.25 3rd Qu.:3
Max. :300.00 Max. :3
身長 体重 FVC
Min. : 81.71 Min. :15.87 Min. :1.800
1st Qu.:115.70 1st Qu.:41.68 1st Qu.:2.700
Median :134.16 Median :48.62 Median :3.243
Mean :134.88 Mean :48.26 Mean :3.275
3rd Qu.:151.95 3rd Qu.:55.70 3rd Qu.:3.766
Max. :193.79 Max. :74.06 Max. :5.115
既往歴
Length:300
Class :character
Mode :character