今日は初心者の方のためのデータ分析用Pythonの勉強法と、そのおすすめの本について話したいと思います。
初心者の方がデータ分析をしたいと考えて、「Pythonをやっぱりやらなきゃいけないのかな」と感じる方も多いのではないでしょうか。
そういった方々に、どうやってPythonの勉強をしたらいいか、どんな本を使ったらいいかなどを紹介したいと思います。
まずはじめに、データ分析者初心者がPythonを使って何をするのかをはっきりさせておく必要があると思います。
これには大きくに3つの作業があると思います。1つ目がデータの加工、2つ目が集計、3つ目が可視化ですね。
データの加工というのは、基本的にデータはデータベースやデータレイクに入っているんですけれども、そういったものは直接、集計に使える状態になっているとは限らないんです。
綺麗になったらすぐ使えたりすることもありますが、いろいろな加工をしたりすることが必要です。そういった作業をするのがまず第一になります。
それができたら次に集計です。
集計といえばSQLという方もいると思いますし、そういった方はgroupbyとかでやったことがあるかもしれませんが、そういったことをPythonでもやったりするわけです。
そして最後にやりたいのは可視化でして、matplotlibやseabornなど、いろいろなライブラリを使って、集計結果を見えるようにします。
そういった一連の流れができるようになりたいと思っているんですが、では、どうしたらいいのかというところがありますよね。
また、機械学習やウェブスクレーピングとか色々ありますけれども、初心者の方はこういったものはもう後でいいと思います。
とりあえず、加工して集計して可視化する、これが一番大事になってきます。
私もPythonを始めてからは、ほぼデータ加工ばかりしていました。たまに集計をして、時には可視化する、といった感じでほぼ丸1日データ加工になります。よく使うのはpandasやNumPyですから、この2つはとりあえず使えるようにしておくといいでしょう。
それでは、おすすめの勉強法と練習法については、ひたすら演習を積むことです。ありがちなのが、テキスト関連で分厚い本を買って、「よし、これは最初から最後まで読むぞ」と言って始めることです。でも、そういう方法では、非効率なのでおすすめしません。
では、どうしたらいいかというと、私のおすすめとしては、この3番に書いてある通りで、たくさんの演習をこなすためにどうすればいいかというと、データサイエンス100本ノックというものがあります。これは名前の通り100本の問題があって、次々にやっていくものです。
Python用、SQL用、そしてR用があったかと思いますが、とりあえずこれでPython編をやれば、データ加工ができるようになります。なので、これに挑戦してみるのがいいと思います。
まず一番はじめはPCにPythonを入れて実行環境を作ります。
それから、適当な書籍の最初の方にある変数や定数、演算の仕方、if文やfor文、データフレームなど、基本的なことが書いてあるので、とりあえず書籍の最初の方だけをやってみてください。
そして、基本を押さえたら、もう演習をバンバンやるということです。おすすめは、先ほど紹介しました100本ノックで、これを2周ぐらいやれば、だいたいいいんじゃないかと思います。
で、これができれば、加工と集計はもうだいぶできるようになると思いますので、十分かなという気がします。
そして、ライブラリですが、使うライブラリは、pandasとNumPyとmatplotlibがあれば、もう十分じゃないかと思います。もちろん、中級者を目指していくのであれば、プラスアルファが必要ですけれども、初心者が何をやるかと言われたら、これで十分です。pandasができれば、という感じですね。
そして、pandasなどのコーディングも記憶して覚えておかなくてもよく、使いこなせなくてもOKです。何かあったら思い出して、「ああ、こんな感じで書けばできたな」と思い出しながら、ChatGPTに聞いたりして調べて、やりたいことができるようになればOKだと思います。
ですので、無理に暗記する必要はなくて、こんな感じで書けるんだなということを頭のどこかに置いておいて、必要な時に引っ張り出して使えるようにするのが目標です。
そして、レベルアップしたければ、機械学習するならscikit-learn、もう少し可視化したいならseaborn、アプリを作りたいならFlaskなど、色々あると思うので、そういうところへ進んでいくのもOKだと思います。
最後におすすめの本ですが、「どんな本で勉強したらいいですか」という質問があると思います。インターネットで調べると、理解しづらい記事がいっぱいあって、おすすめの本なんか20選や30選などが紹介されても、それでは困ってしまいますよね。ですので、ここで、厳選して2冊にまとめました。1冊目は、「Python1年生(翔泳社)」という本で、これは最初の方だけやれば十分です。興味があれば最後までやってもいいですが、それでいいと思います。
その後は、100本ノックへ進んで、手を動かしながら学ぶのがいいです。また一応「Pythonによるデータ分析入門」を2冊目として持っておいてもいいかもです。これはかなり分厚いですが、ハンドブック代わりに持っておけば、わからない時に役立ちます。私も初版を持っていましたが、2版目の方が良くなっているので、新しい方を買いましょう。
ということで、もしおすすめの本を紹介するなら、これらの2冊をおすすめします。初心者の方は、データの加工ができるようになりたいということであれば、まずは基本を抑え、そしてデータ分析100本ノックで頑張ってください。
そうすれば、きっとPythonによるデータ集計や分析ができるレベルになっていくと思いますよ!
ただし、あくまで最初の1歩ということで。。
======================================================
✅ Youtubeメンバーシップ始めました。有料学習動画を見ることができますので、ぜひご参加ください! https://www.youtube.com/@satoshi_data_analysis/join
✅ お仕事のご依頼はこちらまでお願いします info@mikage-tech.com