Python

データの並び替えとランキング:sort_valuesとrankの使い方

データ分析を進めていくと、「データを並び替えたい!」「順位をつけたい!」という場面に必ず遭遇しますよね。
そんなときに役立つのが、Pandasのsort_valuesとrankメソッドです。これらのメソッドを使えば、データの並び替えやランキングがとっても簡単にできます。
この記事では、この2つのメソッドの使い方を、わかりやすく解説していきます。

データの並び替え:sort_valuesの使い方

データを並び替えることって、よくありますよね。例えば、売上が高い順に商品を並べたいとか、日付順に出来事を並べたいとか。Pandasのsort_valuesメソッドを使えば、これがサクッとできます。

基本的なsort_valuesの使い方

sort_valuesメソッドを使うと、指定した列を基準にデータフレームを並び替えることができます。まずは、基本的な使い方から見ていきましょう。

このコードでは、Score列を基準に昇順(小さい順)でデータを並び替えています。結果は、最も低いスコアから高いスコアの順に並び替えられますね。

降順での並び替え

「いやいや、高い順に並べたいんだよ!」という場合もありますよね。そのときは、ascending=Falseを指定するだけでOKです。

'Score'列を基準に降順で並び替え

このコードでは、Score列を基準に降順(大きい順)で並び替えています。これで、最高得点者が一番上に来ましたね!

複数の列での並び替え

時には、複数の列を基準にして並び替えたいこともありますよね。そんなときもsort_valuesが活躍します!

このコードでは、まずScoreを降順で、次にNameを昇順で並び替えています。複数の基準での並び替えもバッチリです!

ランキングの作成:rankの使い方

並び替えた結果を見たら、「これ、順位付けできないかな?」って思いますよね。そんなときに役立つのがrankメソッドです。このメソッドを使うと、データに順位をつけることができます。

 基本的なrankの使い方

rankメソッドは、指定した列に対して順位をつけ、その結果を新しい列として追加することができます。

このコードでは、Score列の値に基づいて順位が付けられています。デフォルトでは、同じ値があると平均順位がつけられます。

高いスコアが1位になるように、降順でランキングをつけたいこともありますよね。その場合は、ascending=Falseを指定します。

これで、最も高いスコアが1位にランクインしました!直感的で使いやすいですね。

同順位の扱い

同じスコアのデータがある場合、rankメソッドではいくつかの方法で同順位を扱うことができます。
• method='average': 同じ値には平均順位をつけます(デフォルト)。
• method='min': 同じ値には最小の順位をつけます。
• method='max': 同じ値には最大の順位をつけます。

これで、同じスコアが出たときの順位付けの違いがわかりますね。どの方法が最適かは、分析の目的に応じて選んでみてください!

まとめ

Pandasのsort_valuesとrankメソッドを使えば、データの並び替えとランキングが簡単にできますね!
sort_valuesで好きな順序にデータを並び替え、rankで順位付けをすることで、よりデータがわかりやすくなりますね。

おすすめ記事

1

こんにちわ、サトシです。33歳です。 今回は、データサイエンティストの3年間に3社で働いた僕が、データサイエンティストとしての転職活動についてまとめて書きたいと思います。 これまでSE→博士研究員→ポ ...

2

お疲れさまです! 久しぶりの更新になってしまいましたが、僕が未経験からデータサイエンティストになるまでの転職活動の全記録を書き残しておきたいと思います。 僕は博士号を取得後に研究員として仕事をしていま ...

3

こんにちわ、サトシです。 今回は、企業でデータサイエンティストとして働いていた僕が、フリーランスとしてどのような手順で独立していったかについて書いていきたいと思います。 僕はSIer SE→博士過程→ ...

-Python

Copyright© さとぶろぐ , 2025 All Rights Reserved Powered by AFFINGER5.