Pandas 计算行平均值
在本文中,我们将介绍在 Pandas 中如何计算数据框中每行的平均值。本文将涵盖以下几个方面:
- 计算全部行的平均值
- 计算指定列的行平均值
- 设置新的行平均值列
阅读更多:Pandas 教程
计算全部行的平均值
Pandas 中可以很方便地计算每行的平均值,我们只需要使用 mean
函数即可。下面是一个简单的例子:
import pandas as pd
# 创建数据框
data = {
'A': [1, 2, 3],
'B': [4, 5, 6],
'C': [7, 8, 9]
}
df = pd.DataFrame(data)
# 计算每行的平均值
df['Row_Average'] = df.mean(axis=1)
print(df)
输出结果如下:
A B C Row_Average
0 1 4 7 4.000000
1 2 5 8 5.000000
2 3 6 9 6.000000
可以看到,在数据框最后新增了一列 Row_Average
,显示了每行的平均值。
计算指定列的行平均值
有时候我们只需要计算数据框中部分列的平均值并新增一列,下面是一个例子:
import pandas as pd
# 创建数据框
data = {
'A': [1, 2, 3],
'B': [4, 5, 6],
'C': [7, 8, 9]
}
df = pd.DataFrame(data)
# 计算指定列的平均值
df['Col_Average'] = df[['A', 'C']].mean(axis=1)
print(df)
输出结果如下:
A B C Col_Average
0 1 4 7 4.0
1 2 5 8 5.0
2 3 6 9 6.0
可以看到,新增的一列 Col_Average
计算的是 A 和 C 列的平均值。
设置新的行平均值列
如果我们想要将计算得到的每行平均值作为新的一列插入到数据框中,并删除原先的行数据,可以使用 insert
函数和 drop
函数,下面是一个例子:
import pandas as pd
# 创建数据框
data = {
'A': [1, 2, 3],
'B': [4, 5, 6],
'C': [7, 8, 9]
}
df = pd.DataFrame(data)
# 计算每行的平均值并插入数据框
df.insert(loc=0, column='Row_Average', value=df.mean(axis=1))
df = df.drop(['A', 'B', 'C'], axis=1)
print(df)
输出结果如下:
Row_Average
0 4.000000
1 5.000000
2 6.000000
可以看到,新增的一列 Row_Average
现在是数据框的第一列,并且原先的 A、B 和 C 列已经被删除了。
总结
本文介绍了在 Pandas 中如何计算数据框中每行的平均值,包括如何计算全部行的平均值、如何计算指定列的行平均值以及如何设置新的行平均值列。使用以上方法可以方便地统计和分析数据框中的行数据。