ども、木村です。本業はデータサイエンティスト、副業でアプリ開発をしています。
本記事では、Pythonで統計学を学ぶ方法について解説します。
Pythonで統計学を学びたい方
手を動かしながら統計学を学びたい方
はじめに
私が初めて統計学を勉強した時、重厚長大な参考資料を片手に紙の上で計算をしながら勉強をしていました。
統計学をよくわかっておらず、数学も好きでなかった私にとってのこの作業は非常に苦痛なものでした。
そこで実際にPythonでソースコードを書きながら学習を進めたところ、まずは概念や仕組みをざっくりと理解することができ、Pythonライブラリで簡単に統計データを可視化できる楽しさを感じながら学習を進めることができました。
今回ご紹介する勉強はPythonを活用した勉強法に特化していますので、統計学を初めて触る方、一度勉強したけどモチベーションが維持できず挫折してしまった方にぜひ参考いただければ嬉しいです。
今回の勉強法はPythonを使うことを前提でご紹介します!
統計学を勉強するプロセス
以下のようなプロセスで学習を進めることをお勧めします。
- 動画で統計の概要を理解
- 書籍で統計の概要をさらに深掘り
- 書籍で演習問題をひたすらやってみる
- Kaggleコンペで分析ノートブックを公開
また、統計学を習得するためには以下の要素を勉強する必要があります。
- 記述統計
- 確率
- 正規分布と標準化
- 推測統計
- 区間推定
- 統計的仮説検定
- 検定の誤りと検定力
- 検定力分析
非常に学習する要素が多く、初めから統計学の小難しい書籍から入ると挫折するので学習序盤はUdemyなどの動画教材で、Pythonのコードを書きながら楽しく学ぶことをお薦めします。
動画で統計の概要を理解
最初に、統計学の各要素を網羅的に学習しましょう。
私のおすすめはUdemyが提供している「米国データサイエンティストが教える統計学超入門講座【Pythonで実践】」です。

数あるUdemyのデータサイエンス講座の中でも一際人気のある教材になっています。
統計学を体系的に学習できますし、説明も端的で入門者向けです。
またPythonを使って演習を解くことができるので、コード書きながら身体で統計学を学ぶことができます。
こちの教材は、教材提供者がTwitter上で定期的クーポンを発行しています。
こちらの教材は定価だと他の教材に比べて少々高いので、クーポンを利用するといいでしょう。
書籍で統計の概要をさらに深掘り
さらに学んだ内容を深く勉強したい、またはよりPythonを使って身体で覚えたい方は「Pythonで理解する統計解析の基礎」がお薦めです。
実はこの書籍は最近購入して読んでみたのですが、正直少し難しいです。
Pythonの基礎がわかっている、統計基礎概要もある程度わかっていないと読了するのは難しいかもしれません。
しかしながら自身の理解を底上げしてくれる良い教材でした。
書籍で演習問題をひたすらやってみる
自身がどのくらいPythonを使って統計分析ができるようになったのかを確認する方法として「Python実践データ分析100本ノック」をお薦めします。
演習問題が100本入っており、さまざまなユースケースに合わせたデータ分析方法を学習できます。
もちろん統計にまつわるケースも多数収録されているので非常にやりごたえのある教材です。
Kaggleコンペで分析ノートブックを公開
ここまでくればある程度データ分析を実践的にできるようになっていると思いますので、ぜひ一度Kaggleコンペに参加してみてはいかがでしょうか?
Kaggleのコンペでは通常のスコアを競い合うコンペだけでなく、参加者の役にたった分析ノートを公開した方もメダルがもらえるので腕試しにぴったりです。
まとめ:統計学を学んでデータサイエンティストに
統計学はデータサイエンティストとって必須スキルの一つです。
ぜひこの機会に挑戦してみてください。
Pythonの勉強法を徹底的にまとめました!
Pythonの勉強方法にお困りの方はぜひご参考ください!