如何在Python中获取数据框中特定列的均值?
在数据分析中,获取指定列的均值是非常常见的操作,Python中pandas库提供了一种简单易用的方法来完成这项任务。本文将介绍使用两种方法获取数据框中特定列的均值。
阅读更多:Python 教程
方法1:使用pandas的mean()函数
pandas的mean()函数用于计算数据框或序列的均值。下面是使用mean()函数获取数据框中特定列(例如“score”列)的均值的示例代码:
import pandas as pd
# 创建一个示例数据框
df = pd.DataFrame({'student': ['Tom', 'John', 'Alice', 'Bob'],
'gender': ['M', 'M', 'F', 'M'],
'score': [78, 85, 92, 80]})
# 获取“score”列的均值
mean = df['score'].mean()
print('均值为:', mean)
输出结果为:
均值为: 83.75
在上面的示例代码中,首先我们创建了一个包含了学生姓名、性别和分数的示例数据框。然后,我们使用mean()函数来获取“score”列的均值,并把结果存储在变量mean中。最后,我们将结果打印出来。
需要注意的是,mean()函数只计算数值型数据的均值,因此,在使用该函数前需要确保选取的列包含数值型数据。
方法2:使用numpy库的mean()函数
除了pandas自带的mean函数,使用numpy库中的mean()函数也可以完成同样的任务。下面是使用numpy库计算数据框中特定列(例如“score”列)的均值的示例代码:
import pandas as pd
import numpy as np
# 创建一个示例数据框
df = pd.DataFrame({'student': ['Tom', 'John', 'Alice', 'Bob'],
'gender': ['M', 'M', 'F', 'M'],
'score': [78, 85, 92, 80]})
# 获取“score”列的均值
mean = np.mean(df['score'])
print('均值为:', mean)
输出结果为:
均值为: 83.75
在上面的示例代码中,我们先引入了numpy库,并把数据框中的“score”列传递给numpy库的mean()函数来计算均值。
需要注意的是,当选取的列不是数值型数据时,使用numpy库的mean()函数会出现错误。因此,使用mean()函数前需要先对数据进行类型转换,确保选取的列为数值型数据。
结论
本文介绍了使用pandas库和numpy库提供的函数,来获取数据框中特定列的均值。通过这些方法,我们可以快速、简便地索引数据框中的列,并计算它们的统计特征。
极客笔记