Google Colab便利ですよね!
環境設定とか必要ないので、個人レベルでぱっと何かやってみるのには最適かと思います。
また、Pandas Profilingも便利ですよね!
新しくデータを取得したときはデータの調査(EDA)をしないといけません。
よくやるのが、統計量とかデータ数、変数ごとのデータ数、欠損率や重複などではないでしょうか。
ただ、いちいちやってると結構めんどくさい。
そんな時に、Pandas Profilingをすると一発でいろんなことをやってくれる上に、HTMLで出力もしてくれる!
こんなに便利なことはありません。
そんなわけで僕もこの前google colabでpandas profilingを試したのでした。
そしたらエラーが出るわけです。
-
データサイエンティストとして3年間で3社経験した僕の転職体験談まとめ
こんにちわ、サトシです。33歳です。 今回は、データサイエンティストの3年間に3社で働いた僕が、データサイエンティストとしての転職活動についてまとめて書きたいと思います。 これまでSE→博士研究員→ポ ...
Google ColabでPandas profilingができない時の対処法
エラーはこんな感じのエラーです。
なんでだー!と思うかもしれませんが、エラーの解消策としてはpandas-prifilingのバージョンをアップグレードする必要があります。
なぜかはよくわかりませんが、とりあえずデフォルトのバージョンが古いみたいです。
なので、colabでpandas profilingをしたいときは、まず
!pip install pandas-profiling
でインストールしてから
!pip install --upgrade pandas_profiling
でアップグレードしましょう。
そして、ランタイムを再起動します。
ランライムの再起動ができてから再度pandas profilingをやってみると、動きました!
なので、ポイントはupgradeすること、そしてランタイムを再起動することです!
他のライブラリでもこの手のことをやる機会はたまにありますので、覚えておくといいかもしれません。