Pandas 获取列均值/平均值

在数据分析和处理中，计算均值是一项常见的任务。Pandas是一个流行的Python数据分析库，它包含许多方便的方法来计算数据的均值。在本文中，我们将介绍Pandas中获取列均值的方法，并提供一些示例来演示如何使用这些方法。

阅读更多：Pandas 教程

Pandas中的均值函数

Pandas中有许多函数可用于计算数据的均值。以下是其中的一些常用函数：

mean()：计算给定列的均值。
median()：计算给定列的中位数。
quantile(q)：计算给定列的q分位数，默认为0.5，即中位数。
mode()：计算给定列的众数。
std()：计算给定列的标准差。
var()：计算给定列的方差。

这些函数可以通过Pandas DataFrame对象的列名来调用。下面让我们看一下它们是如何工作的。

使用mean()函数获取列均值

mean()函数是Pandas计算均值的一种主要方法，它可以计算单个列的均值，也可以计算整个DataFrame的所有列的均值。让我们从一个示例开始。

假设我们有以下示例数据：

import pandas as pd

data = {
    '名字': ['A', 'B', 'C', 'D', 'E'],
    '年龄': [18, 22, 24, 30, 27],
    '工资': [20000, 25000, 30000, 40000, 50000]
}

df = pd.DataFrame(data)

print(df)

输出：

  名字  年龄      工资
0  A  18   20000
1  B  22   25000
2  C  24   30000
3  D  30   40000
4  E  27   50000

我们可以使用mean()函数来计算年龄和工资的均值。这里只给出一个示例：

mean_age = df['年龄'].mean()
mean_salary = df['工资'].mean()

print('平均年龄:', mean_age)
print('平均工资:', mean_salary)

输出：

平均年龄: 24.2
平均工资: 33000.0

在DataFrame中使用describe()函数获取所有列的汇总统计信息

除了使用上面的方法计算列的均值外，我们还可以使用Pandas的describe()函数获取所有列的汇总统计信息，其中包括各列的均值、中位数、标准差、最小值、最大值等。让我们看一下如何使用它：

summary = df.describe()

print(summary)

输出：

              年龄           工资
count   5.000000      5.000000
mean   24.200000  33000.000000
std     4.496913  11853.816859
min    18.000000  20000.000000
25%    22.000000  25000.000000
50%    24.000000  30000.000000
75%    27.000000  40000.000000
max    30.000000  50000.000000

我们可以看到，输出了所有列的汇总统计信息，包括count、mean、std、min、max等。有了这些信息，我们可以更好地了解数据的特征。