文系出身・経理部40代が流行りのリスキリングとしてデータサイエンスを学び始めて2ヶ月目。これまでに学んだことと使った学習サイトや本など紹介します。
2ヶ月で学んだこと
データサイエンスといえば、統計学や数学(線形代数、微分積分など)を思い浮かべますが今の時点で全く学んでいません。プログラミング学習と機械学習モデルに時間を使いました。
プログラミング学習と機械学習モデルで実践したこと(無料教材)
以下がデータサイエンスにためにプログラミング学習で学んだことです。
- Googleコラボの使い方
- Python基礎
- numpy
- pandas
- scikit-learn
- matplotlib
- 機械学習モデル
- sql
1~7までは東京大学の「Pythonプログラミング入門」という無料サイトで学ぶことができます。
→ Pythonプログラミング入門 — Pythonプログラミング入門 documentation
8のsqlは「SQL攻略」という無料サイトで学べます。
→ SQL攻略 - Web上でSQLを実行しながらマスターするサイト
Kaggleコンペティションに参加(予定)
基礎学習の最後にKaggleコンペティションへの参加を予定しています。
Kaggleコンペティションは、データサイエンスや機械学習のスキルを競うプラットフォームです。参加者は企業や政府からの課題に取り組み、モデルの精度を競います。コンペには初心者向けから賞金があるものまで多様な形式があり、成績に応じてメダルや称号が授与されます。Kaggleは実践的なスキルを磨くための優れた場です。
以降のデータサイエンス学習&実践予定
2ヶ月で学んだことを実践で使っていきます。プログラミングや機械学習モデルはすべて覚えていないのでその都度調べ直しながら実践していきます。
まずは現在経理を担当している宿泊施設のデータ収集とEDAから始めていこうと思います。
今後は以下に実践した作業の記事をまとめていく予定です。