Pandasデータ変換: Applyメソッドの適用

2025年4月3日

applyメソッドはデータ変換においてとても重要ですので、この記事ではapplyメソッドの基本とその使い方を解説します！

1. apply()メソッドの基本
2. 高度なデータ変換の実装
3. 複数列へのapply()メソッドの適用

1. apply()メソッドの基本

Pandasのapply()メソッドは、DataFrameやSeriesの各要素に関数を適用するためのメソッドです。
まずサンプルのデータフレームを作ります。

import pandas as pd

# サンプルデータの作成
data = {'A': [1, 2, 3], 'B': [4, 5, 6]}
df = pd.DataFrame(data)
df

import pandas as pd

# サンプルデータの作成

data = {'A': [1, 2, 3], 'B': [4, 5, 6]}

df = pd.DataFrame(data)

次のようにデータフレームの各列に独自の関数を適用することができます。
今回は各列を2倍にします。

# 各列に対して2倍にする関数を適用
def custom_function(x):
    return x * 2

df_applied = df.apply(custom_function)
df_applied

# 各列に対して2倍にする関数を適用

def custom_function(x):

return x * 2

df_applied = df.apply(custom_function)

df_applied

このコード例では、custom_functionが各列に対して適用され、新しいDataFrame df_appliedが生成されます。

2. 高度なデータ変換の実装

apply()メソッドは、ラムダ関数を使用して特定の条件に基づいた変換にも利用できます。
例えば、次のコードで列 'A' の値が3以上の場合にその値を2倍にしてみます。

df['A'] = df['A'].apply(lambda x: x * 2 if x &gt;= 3 else x)
df

1 2	df['A'] = df['A'].apply(lambda x: x * 2 if x >= 3 else x) df

3. 複数列へのapply()メソッドの適用

apply()メソッドは単一の列だけでなく、複数列に対しても使うことができます。
これにより、より複雑なデータ変換を実行することができますね。

# 列 'A' と列 'B' の合計を計算する関数を適用
df['Sum'] = df.apply(lambda row: row['A'] + row['B'], axis=1)
df

# 列 'A' と列 'B' の合計を計算する関数を適用

df['Sum'] = df.apply(lambda row: row['A'] + row['B'], axis=1)

======================================================
さらにデータサイエンスを学んでいきたいという方向けに「Pythonによるデータサイエンス」動画を提供しています。
基礎編・応用編それぞれ35時間以上の動画となっており、今なら50%OFFですので、ぜひチェックしてみてください！
>>>Pythonによるデータサイエンス基礎編
>>>Pythonによるデータサイエンス応用編