Hazy Ideas

日々の勉強の気づきを書き出しています

Python独学勉強 基礎統計 最初のメモ

先が見えないので、Pythonの勉強を進めることにした。ある程度は前もやったけど、環境が変わると動かし方忘れるし、コードもShellやRとこんがらがってる。。

 

今回使うのは、技術評論社Pythonで理解する統計解析の基礎」。まずは統計の基本を復習しながら、Pythonで基礎統計を一通りできるようにする。

 

ソースコードは以下。今回は簡単に、ZipでダウンロードしてローカルDocumentに格納して使う。

https://github.com/ghmagazine/python_stat_sample

緑色の「Code」をクリックし、「Zownload ZIP」で指定場所に落とせる。

 

PythonはAnacondaをローカルにインストールして使用。Dockerは使わない。

 

癖があるのは日本語のあるデータ。ダウンロードしたcsvファイルには日本語が含まれ、Excelで開くと文字化けするし、Jupyter Notebook上でも日本語を認識してくれない。

 

1. csvファイルを右クリック、「プログラムから開く」、「メモ帳」で開く。

2. この時は日本語が正しく表示されていること、右下の文字コード表記がUFT-8などになっていることを確認。

3. 「ファイル」、「名前を付けて保存」、文字コードを「UFT-8(ROM)付き」に変更。

 *ファイルの種類は変えなくてもよい

 *文字コードを「ANSI」にしてもうまくいかなかった

 *他のWindowsだと、「UFT-8 with BOM」しか表示されなかったのでこれに変更

4. Excelで開いて、日本語が正しく表示できることを確認。

5. Jupyter Notebook上でファイル内を確認。

 *この方法は簡単だけど、ファイル1つずつ変換なので数が多いと大変

 

意外と、こういう最初のセットアップが面倒で、すぐ忘れる。