Pandas transform() 和 apply() 两种方法的使用和区别

在本文中，我们将介绍 Pandas 中的 transform() 和 apply() 两种方法的使用和区别。这两种方法都可以应用于 DataFrame 和 Series 对象，但在使用时有些微小的差别。

transform()

transform() 方法是一个非常方便的方法，可以用于 DataFrame 和 Series 对象中。它可以将一个函数或一个转换器作用于每个元素，并返回一个新的 Series 或 DataFrame 对象。

下面是一个示例，从数据集中计算每个元素和所在列的均值的差值：

import pandas as pd

df = pd.DataFrame({'A': [1, 2, 3],
                   'B': [4, 5, 6],
                   'C': [7, 8, 9]})

df2 = df.transform(lambda x: x - x.mean())
print(df2)

输出结果如下：

     A    B    C
0 -1.0 -1.0 -1.0
1  0.0  0.0  0.0
2  1.0  1.0  1.0

transform() 方法会将每个元素减去所在列的均值，得到新的 DataFrame 对象。

apply()

apply() 方法也可以用于 DataFrame 和 Series 对象，不同的是，它可以将一个函数作用于整个 DataFrame 或 Series 对象的每一行或每一列，并返回一个新的 Series 或 DataFrame 对象。

下面是一个示例，应用 apply() 方法计算每一行的和并返回一个新的 Series 对象：

import pandas as pd

df = pd.DataFrame({'A': [1, 2, 3],
                   'B': [4, 5, 6],
                   'C': [7, 8, 9]})

df2 = df.apply(lambda x: x.sum(), axis=1)
print(df2)

输出结果如下：