Python

Pandasでの文字列操作:strメソッドの活用方法

データ分析の現場では、数値データだけでなく、文字列データを扱うことも多いですよね。
顧客名や商品名、住所、日付など、文字列データの処理は避けて通れません。Pandasでは、strメソッドを活用することで、文字列データの操作がとても簡単に行えます。この記事では、Pandasのstrメソッドを使った文字列操作の基本と、その活用方法をわかりやすく解説します。

strメソッドの基本

Pandasでは、文字列データに対してstrメソッドを使うことで、さまざまな操作が簡単にできます。strメソッドは、Pandasの文字列データ(SeriesやDataFrameの列)に適用できる多くの便利な機能をまとめたものです。

strメソッドを使うと、文字列に対する操作をチェーンでつなげて行うことができます。たとえば、文字列を小文字に変換するには次のようにします。

このコードでは、Name列のすべての文字列が小文字に変換されています。文字列操作がチェーンでつなげられるのが便利ですよね。

文字列の変換

文字列データの処理でよく使うのが、文字列の変換です。大文字・小文字の変換や、文字列の置換など、strメソッドを使って簡単に行えます。

すべての名前を大文字に変換

各単語の最初の文字を大文字に変換

これで、文字列の見た目を自由に変えられますね!特に、データを一貫したフォーマットに整えるのに便利です。

文字列の置換

特定の文字列を別の文字列に置き換えたいときもありますよね。str.replaceメソッドを使うと簡単にできます。

これで、すべての'a'が'A'に置き換えられました。複数の文字列を一度に置き換えたいときにも使えますよ。

また、特定の部分だけを取り出したいときや、文字列を分割したいときにもstrメソッドが役立ちます。

最初の3文字を抽出

このようにして、簡単に部分文字列を取り出せます。これは、データの一部だけが必要なときに便利ですね。

文字列の分割

文字列を特定の区切り文字で分割して、それぞれの部分を別の列にすることができます。たとえば、フルネームを名前と苗字に分ける場合などです。

スペースで分割して、最初の部分を'First_Name'列に、次の部分を'Last_Name'列にしてみます。

このコードでは、スペースでフルネームを分割し、それぞれの部分を新しい列にしています。名前や住所のデータを整理するときに役立ちますよ!

文字列のフィルタリング

「特定の文字列を含む行だけを抽出したい」というニーズもよくありますよね。strメソッドを使って、文字列データを簡単にフィルタリングできます。

特定の文字列を含む行の抽出

たとえば、名前に'a'を含む行だけを抽出するには、str.containsメソッドを使います。

これで、'a'を含む名前だけが抽出されました。特定のパターンにマッチするデータを抽出したいときに便利です!

正規表現を使ったフィルタリング

正規表現を使って、もっと複雑なパターンにマッチする文字列をフィルタリングすることもできます。

このコードでは、'b'で始まる名前を抽出しています。正規表現を使うことで、より柔軟なフィルタリングが可能になります。

まとめ

Pandasのstrメソッドを使えば、文字列データの操作が驚くほど簡単にできます。大文字・小文字の変換、文字列の置換、部分文字列の抽出、文字列の分割、そしてフィルタリングまで、あらゆる操作が手軽に行えます。
データ分析をする上で、文字列操作は避けて通れません。この記事で紹介したテクニックを活用して、文字列データを自在に操れるようになりましょう!

======================================================
さらにデータサイエンスを学んでいきたいという方向けに「Pythonによるデータサイエンス」動画を提供しています。
基礎編・応用編それぞれ35時間以上の動画となっており、今なら50%OFFですので、ぜひチェックしてみてください!
>>>Pythonによるデータサイエンス基礎編
>>>Pythonによるデータサイエンス応用編

おすすめ記事

1

こんにちわ、サトシです。33歳です。 今回は、データサイエンティストの3年間に3社で働いた僕が、データサイエンティストとしての転職活動についてまとめて書きたいと思います。 これまでSE→博士研究員→ポ ...

2

お疲れさまです! 久しぶりの更新になってしまいましたが、僕が未経験からデータサイエンティストになるまでの転職活動の全記録を書き残しておきたいと思います。 僕は博士号を取得後に研究員として仕事をしていま ...

3

こんにちわ、サトシです。 今回は、企業でデータサイエンティストとして働いていた僕が、フリーランスとしてどのような手順で独立していったかについて書いていきたいと思います。 僕はSIer SE→博士過程→ ...

-Python

Copyright© さとぶろぐ , 2025 All Rights Reserved Powered by AFFINGER5.