先が見えないので、Pythonの勉強を進めることにした。ある程度は前もやったけど、環境が変わると動かし方忘れるし、コードもShellやRとこんがらがってる。。
今回使うのは、技術評論社「Pythonで理解する統計解析の基礎」。まずは統計の基本を復習しながら、Pythonで基礎統計を一通りできるようにする。
ソースコードは以下。今回は簡単に、ZipでダウンロードしてローカルDocumentに格納して使う。
https://github.com/ghmagazine/python_stat_sample
緑色の「Code」をクリックし、「Zownload ZIP」で指定場所に落とせる。
PythonはAnacondaをローカルにインストールして使用。Dockerは使わない。
癖があるのは日本語のあるデータ。ダウンロードしたcsvファイルには日本語が含まれ、Excelで開くと文字化けするし、Jupyter Notebook上でも日本語を認識してくれない。
1. csvファイルを右クリック、「プログラムから開く」、「メモ帳」で開く。
2. この時は日本語が正しく表示されていること、右下の文字コード表記がUFT-8などになっていることを確認。
3. 「ファイル」、「名前を付けて保存」、文字コードを「UFT-8(ROM)付き」に変更。
*ファイルの種類は変えなくてもよい
*他のWindowsだと、「UFT-8 with BOM」しか表示されなかったのでこれに変更
4. Excelで開いて、日本語が正しく表示できることを確認。
5. Jupyter Notebook上でファイル内を確認。
*この方法は簡単だけど、ファイル1つずつ変換なので数が多いと大変
意外と、こういう最初のセットアップが面倒で、すぐ忘れる。