2020-09-01から1ヶ月間の記事一覧
これも備忘録。 QGIS上で、観測値点などの座標データ、道路や水路などのベクターデータ、OSMなどの地図データを統合した後、 論文用に凡例、スケール、方位などを入れて、SVGや画像出力する。 データのレイヤーを整えた後、 Project -> New Print Layout で…
今日は本の勉強ではなく、実際に今日やったことの備忘録。 一元配置分散分析(ANOVA) 3つ以上の比較対象があるときに、全体的な有意差があるか調べる手法。 csvかxlsの対象データをdata.frameとしてインポートする。 data <- data.frame(リスト名)anova <- a…
*個人勉強用メモ 以前、Macに対してpython3とminicondaを入れたので、本来はこの環境で勉強すべきなのだが、どの道Anacondaに移行しろとなるので、Anacondaを入れることにした。 容量が小さいPCなので、結構大変だが仕方ない。独立した別環境で、動かせば問…
*個人勉強用メモです。 データのとる空間配置の影響があるような実験系の場合、 それぞれの場所が独立とは言い切れないことも多い(隣接している場合など)。 野外調査の場合は、空間構造が二次元、三次元となる。 場所jごとに空間関数がある観測データyjを…
*個人勉強用メモです。 一般化線形混合モデルGLMMを、階層事前分布を使ってベイズ化する。 個体差だけでなく複数の考慮が必要なモデルを扱える、より複雑なモデルのパラメータを推定することができる。 GLMMのリンク関数と線形予測子をlogit(q) = ß + r と…
*個人勉強用メモです。 MCMCによるパラメータ推定とベイズモデリングを、一般化線形モデルに適応する例を考える。 簡単な例として、ランダム項なしのモデル 平均 λ = exp(β1 + β2X)を考える。 尤度関数 L(β1, β2) = Π (y | λ) = Π (y | β1, β2, X) ベイズの…
*個人勉強用のノートです。 観測できないデータの不均質さを考慮したGLMMでも対応できない場合 ランダム効果の要因が増えるほど、パラメータ推定が困難になる。 ランダム効果の要因の数だけ多重積分を繰り返すため、計算時間が長くなり、最尤値の探索が困難…
*個人勉強用のノートです。 確率分布、リンク関数、線形予測因子を組み合わせたのがGLM(個体差のない前提)、さらに個体差も含めたモデルがGLMM。 人が観測できない・測定できなかったデータ、かつ原因不明の差異を組み込む。 過分散overdispersion: 期待…
*個人勉強用のノートです。 ロジスティック回帰:出来事が発生する確率を予測できる ポアソン回帰のオフセット項:人口密度などの割算値を扱う GLMは、確率分布・リンク関数・線形予測子を指定することで、複数の用途に使える 分布には連続と離散があり、そ…
*個人勉強用のノートです。 モデル検定とモデル選択の違い モデル検定:対立仮説と帰無仮説、検定、帰無仮説の棄却可否を判断 モデル選択:パラメーターの多い/少ないモデル、AICモデル選択による評価 尤度比検定では逸脱度の差を取り、検定統計量として使…
*個人勉強用のノートです。 観測データに当てはまりのいいモデルが、いい統計モデルではない。 変数が多いと当てはまりがいいけど、それって使えるの?(複雑で扱いづらい) 当てはまりのよさではなく、良い予測をするのがいいモデルと言う考え方→モデル選…
*個人勉強用のノートです。 個体が平均λのポアソン分布に従う、確率分布に対して、 個体ごとに異なる説明変数を持つ場合に、統計モデルを観測データに当てはめることをポアソン回帰、 それらの構造のモデルの総称を一般化線形モデルと言う。 モデリングの前…
決めた。 今日から毎日、 メインの研究とは別に、 R、Python、QGIS、ベイズの勉強、 もしくは、 Nature、Scienceの論文を読んで、 ブログを更新する。 ゼミとか、ジャーナルクラブがない環境なので、無理やりにでもやる理由を作らないといけない。 毎日投稿…