
データサイエンティストになりたい方におすすめのUdemy講座を紹介します。

Udemyはたくさん講座があるから、教えてもらえると助かる!
まず、データサイエンスを行う上で、
- コード管理をする「Git」
- 環境構築を行う「Docker」
- データ分析を行う「Python」
- データ分析を行う上での基盤となる「統計学」
が必要になり、上記のツールを学習し理解・使用できるようになる必要があります。
Udemyさんでは、上記のツールを学習する講座が多数ありますが、正直お金もかかるので、どの講座を選べばよいか迷っていまうと思います。

お金もかかるし、しっかり学べる講座を選びたいよね!

それなら、圧倒的にかめさんの講座がおすすめだね。

どうしてそんなにおすすめなの?

Udemyのいろいろな講座を受講してきたけど、一番わかりすいし、内容もとても充実している印象があるからだね。
まずは、Baranがかめさんの講座を受講したあとに、どれくらい上達したか見てみる?
▼ Contents
1. かめさん講座を受講した後の変化

まず、受講前の状況を振り返ってみます。
データサイエンスができるようになりたいと考えていましたが、当時の私は、、、
- コード管理をする「Git」=> 使用経験なし
- 環境構築を行う「Docker」=> 使用経験なし
- データ分析を行う「Python」=> 四則演算とif文、for文くらいは理解していた
- 「統計学」=>統計学3級程度の知識
と、データサイエンスを行う上での必須のツール知識が殆どありませんでした。
しかし、かめさん講座を受講し、独学を続けた結果、
コード管理をする「Git」
個人で作成したコードをGitHub上で公開できました。
環境構築を行う「Docker」
個人用のデータサイエンス環境構築ができるようになりました。以下は私の環境構築例です。(読まなくて大丈夫です!)
version: '3'
volumes:
db_data:
services:
mysql:
build:
context: ./mysql
dockerfile: Dockerfile
#image: mysql:8.0
container_name: datascience_mysql
command: mysqld --character-set-server=utf8mb4 --collation-server=utf8mb4_bin
restart: always
environment:
- MYSQL_DATABASE=${MYSQL_DATABASE}
- MYSQL_ROOT_USER=${MYSQL_ROOT_USER}
- MYSQL_ROOT_PASSWORD=${MYSQL_ROOT_PASSWORD}
- MYSQL_USER=${MYSQL_USER}
- MYSQL_PASSWORD=${MYSQL_PASSWORD}
- MYSQL_ROOT_Host=${MYSQL_ROOT_Host}
ports:
- '3306:3306'
volumes:
- ./mysql/conf.d:/etc/mysql/conf.d
- db_data:/var/lib/mysql
networks:
- app-net
app:
build:
context: ./work
dockerfile: Dockerfile
ports:
- '5555:8888'
container_name: datascience_app
volumes:
- '.:/work'
depends_on:
- mysql
links:
- mysql
networks:
- app-net
environment:
- DISPLAY=${DISPLAY}
networks:
app-net:
driver: bridge
FROM ubuntu:18.04
RUN apt-get update && apt-get install -y \
sudo \
wget \
vim \
curl \
unzip \
git \
tree
WORKDIR /opt
# anacondaのインストール
RUN wget https://repo.continuum.io/archive/Anaconda3-2020.07-Linux-x86_64.sh && \
sh /opt/Anaconda3-2020.07-Linux-x86_64.sh -b -p /opt/anaconda3 && \
rm -f Anaconda3-2020.07-Linux-x86_64.sh
ENV PATH /opt/anaconda3/bin:$PATH
COPY requirements.txt /opt/app/requirements.txt
WORKDIR /opt/app
RUN pip3 install --upgrade -r requirements.txt
COPY . /opt/app
WORKDIR /
CMD ["jupyter", "lab", "--ip=0.0.0.0", "--allow-root", "--LabApp.token=''"]
データ分析を行う「Python」、「統計学」
データサイエンスの基礎と応用例を学ぶことで、データサイエンスを行うことができるようになり、2021年1月に初コンペ参加で12位/514人中と健闘することができました。
また、2021年12月にProbspace主催の「米国株式市場 将来株価予測」で6位に入賞することができました。こちらの分析内容は以下のブログでまとめています。(現在、執筆中)

もちろん、全てがかめさんの講座でできるようになったわけではないですが、非常に役立ちました。

すごい成長しているように見える!
2. なぜかめさん講座をおすすめするのか?

成長できそうな感はでてきたけど、なんでそんなにおすすめなの?(2回目)

OK。では、ここから具体的におすすめできる理由を説明していくよ。
2.1 Udemy内での評価がとても高い
おすすめできる理由の第一は、圧倒的に受講者の評価が高いです。以下を見てください。(なお、評価は2021年7月時点です。)
Git講座

Docker講座

Python講座

統計学講座
現在4つの講座が用意されていますが、すべて受講者評価が4.7以上ととんでもなく高評価です。
講座評価はそのまま、講座の内容が良いということですね。

正直、評価4.7の講座はUdemy内ではなかなかないよー

めっちゃ評価高いし、信用できそうだね!
2.2 現役米国データサイエンティストが講師である
上記3つの講座は、現役でアメリカで活躍されている「かめ れおん」さんが作成されているため、データサイエンスを学ぶ方には参考になるのは間違いありません。

アメリカはデータサイエンスの本場だし、そこでご活躍されているかめさんの情報は非常に有益だね。
2.3 内容が基礎から応用まである
講座序盤~中盤までは取得するべき基礎内容が豊富ですが、終盤になると現役データサイエンティストがおすすめする応用例がいくつか紹介されています。
そのため、最初から最後まで学ぶことの多い講座構成となっているのもおすすめできる理由です。


基礎から応用まで網羅されているなんてすごい!コスパ良さそう!
2.4 説明が丁寧で内容がわかりやすい
講座内の動画ですが、かめさんはコードだけでなく説明図を用いて、とても詳しくわかりやすいようにご説明されているので、初心者にもわかりやすいです。

また、イケボと言われるほど声が聞き取りやすく、再生速度を1.25倍や1.5倍にしても聞き取れます。

イケボとか気になる。。
3. どんな講座があるのか?

興味が出てきたんだけど、実際どんな講座があるの?

すでに少し紹介しちゃったけど、もう一度おさらいしておきます。
それぞれの内容には「コース紹介」と「学習理由」が動画紹介されているので、講座内容を把握したい場合は、購入前にUdemyで見ておくといいよ。
3.1 Git講座(コード管理やチーム開発で必須)
Gitはコード管理に必須の知識です。データサイエンスに限らず、コーディングには必要な技術です。本講座を受講後は、少なくともご自身でコード管理や、他の人のコードを使用することが可能となります。

3.2 Docker講座(環境構築およびそのシェアに必須)
Dockerは、コードディング環境を構築する上で非常に便利で、こちらもほぼ必須の知識になっています。応用編では、Dockerを使って、AWSでデータサイエンス環境を構築するなど、かなり実践的な技術が身につくのもおすすめ理由の一つです。
私も受講後に、何度も再生し直しています。

3.3 Python講座(データサイエンスに必須)
こちらはデータサイエンスで非常によく使用されるPythonを学習する講座です。Python基礎を学びつつ、データサイエンス用のライブラリ(PandasやNumpy)、MatplotlibやSeabornなどグラフ化、OpenCVを用いた画像解析などを学べるなど、非常に濃い内容になっています。
データサイエンスに興味があれば、いの一番に受講しても良い講座です。

こちらは、Pythonの基礎を非常に詳しく学ぶことができます。オブジェクト指向や、Pythonでのコーディング作法、エラー処理やテストなど、独学だとなかなか手が届かない内容も網羅しており、Python初心者ならず、Pythonを使用している人にもとてもおすすめ講座です。
私も一通りPythonwo学習したあとに受講しましたが、デコレーションやオブジェクト指向などの理解がとても深まりました。
最初にPythonコーディング基礎ができていないと、途中で修正するのが非常に大変になるため、Python初心者はすぐに受講すべき講座と思います。

3.4 統計学講座(データサイエンスに必須)
こちらは、データサイエンスには必須の知識である統計学の基礎を網羅できる内容となっています。
範囲は、記述統計と推測統計のどちらも対応しており、内容的には統計検定2級程度の知識を取得できる構成となっています。また、この講座はPythonでの実装も含まれているため、上記のPython講座と合わせて、Pythonで統計学を学習できる内容になっています。
また、統計学は数学の知識がある程度必要ですが、そのあたりも考慮されており、確率やΣ計算などの知識があれば、スムーズに理解できると思います。


4. おすすめの学習方法
4.1 受講順序

でもどの講座からやればいいんだろう?初心者だから迷っちゃう。

どの講座もおすすめだけど、あえて言うならいかがおすすめかな。
- Git講座
- Docker講座
- Python入門講座=>データサイエンス向けPython講座
- 統計学講座
データサイエンスを実施するにはPythonは必須ですが、その前に自身の開発環境を整える必要があります。
そうなると、Docker知識が必要です。ただ、Docker講座内では少しだけGit知識を使用するため、Gitの知識があると、Docker講座がスムーズに進むと思います。
また、Git講座を受講しておくと、GitHubから他の人のコードをコピー(Clone)することもできるので、学習スピードも上がると思います。
なので、Git講座からをおすすめしますが、一番は学習目的に合わせて受講するのが良いです。
例えば、「データサイエンスに興味がある!」って人であれば、データサイエンス向け講座を最初に受講しても、全く問題はありません。
2021/12/24追記:最近はGoogle colabなどで簡単に環境構築もできるので、データサイエンスをすぐ学びたい方は③のPython講座からでも、まったく問題ないでしょう。
どの講座もDocker、Git、Pythonの知識が全くなくても受講できるように工夫されているので、安心して受講できます。

ちなみにバランは当初環境構築に困っていたので、Docker講座からはじめました。
4.2 講座の有効活用方法

講座内容も豊富で学習時間がかかりそう。。何かおすすめ学習方法はある?

全講座の全内容がおすすめだけど、受講した感じでは以下の学習方法が良さそうだったよ。
- 1周目
- (重要)手を動かす
- わからなくても一通りやってみて、どの講座にどんな内容があったかを理解しておく
- 再生速度を遅く(0.75倍)する
- 応用編は興味がある講座以外は後回しにする
- 講座を終えたら、自分で環境構築やコードを書いてみる
- (重要)わからない箇所はまず自分で調べる。それでもわからない場合は質問する。
- 2週目以降
- (重要)手を動かす
- 再生速度を早く(1.25倍または1.5倍)して、時間短縮する
- 各講座のまとめから再生して、理解していない箇所を確認する
- 応用編をベースに自分でも取り組んでみる
- (Python講座限定)使用できそうなコードはすぐ閲覧できるようにしておく(Jupyterlabであれば、同じフォルダーに講座コードを格納する。
1週目と2週目以降では、内容理解度が異なると思いますので、それぞれ学習方法案を表記してみました。
特に一番重要だと思ったのが、実際に自分の手でコードを記載していくことです。
講座を聞くだけでも効果はあると思いますが、実際に記載することで意図していない不具合やミスが生じますが、それを解決するのも一つの勉強だと思います。
実際に講座内容とともに自分で調査した内容は、かなり身についているのでぜひコード自分で書いてみてください。

今後、コードを書いていくと不具合はよく起こるので、自分で解決していく力や、質問していく力も必要になるので、今から慣れておくと良いと思うよ!
5. Windowsコマンド対応、Git講座忘備録

とても良さげな講座だけど、他に気にする箇所はある?

ええっと、これらの講座は「mac推奨」なので、Windows環境の方は、少しコマンドプロンプトでのコマンドを調べる必要があるかな。

それって、大変?おすすめサイトとかある?

調べればすぐ出てくるし、以下にバランが調べた内容とそのサイトを網羅しておいたから、役立ててみて。
Windows全般
通常、 Command PromptやPowerShellでアプリケーションを実行する場合は、その実行ファイルが置いてあるディレクトリに移動してから実行する必要があります。
毎回フルパスで指定したり、そのディレクトリに移動するのは面倒ですよね。
そういった場合は、当該アプリケーションを環境変数に設定し、どこからでも使用できるようにすることができます。
Windows10での環境変数の設定方法
■Windows10でのアクセス権変更コマンド
cacls ファイル名 /g ユーザー名:アクセス権
[cacls / chmod]ファイルのアクセス権を設定
cacls ファイルのアクセス権制御
Windowsコマンド集
Windows 10 で、現在サインインしているユーザーの「ユーザー名」や「ホームフォルダー(プロファイルフォルダー)」を確認する方法を紹介します。
【Windows】現在のユーザー名、ホームフォルダーなどを確認する
Git講座
P4Merge インストール
1. Visual Merge and Diff Tools | Perforce からダウンロード
2. [Select Features] では [Visual Merge Tool(P4Merge)] のみ選択し、他は [This feature will not be installed and will be uninstalled if already installed] を設定してインストールしないようにして進める。
【Git】【Windows】P4Merge の導入、設定をノート
エイリアスを使ってGitのコマンドを省略する方法を紹介します。
【1分でできる】Gitコマンドを省略する方法
6. その他情報
無料で統計学、Python、Docker、Git、英語を学びたい方は、かめさんのブログもおすすめです。
現在は統計学に関するブログを、随時更新中のようです。また、上記Udemy講座のクーポンを以下のブログで配布しているようなので、ご興味がある方は閲覧してみてください。

これらの情報が役に立てば嬉しいです

データサイエンスを学びたい方は、かめさんの口座を受講だね。私も購入する!

いいね!それでは良いデータサイエンスライフを!
お読みいただきありがとうございました。
以下の記事もご参考ください!
[…] データサイエンス向けのおすすめUdemy講座【結論:かめさん講座】 […]
[…] また,ちょくちょくと講座をブログ記事で取り上げてくれる人が出てきました.本当に感謝!(こことかこことかこことか […]
[…] データサイエンス向けのおすすめUdemy講座【結論:かめさん講座】 […]