Pandas 数据框中如何对数值进行分组计数
在 Pandas 中,我们经常需要对数据进行分组统计,比如对数值进行计数。本文将介绍如何在 Pandas 数据框中对数值进行分组计数。
数据框的基本操作
首先,我们需要了解 Pandas 数据框的基本操作。
创建一个 Pandas 数据框:
import pandas as pd
data = {'name': ['Alice', 'Bob', 'Charlie', 'David', 'Emily'],
'age': [25, 30, 35, 40, 45],
'gender': ['Female', 'Male', 'Male', 'Male', 'Female'],
'score': [80, 90, 85, 95, 75]}
df = pd.DataFrame(data)
print(df)
输出:
name age gender score
0 Alice 25 Female 80
1 Bob 30 Male 90
2 Charlie 35 Male 85
3 David 40 Male 95
4 Emily 45 Female 75
我们可以使用 Pandas 中的 groupby
函数对数据进行分组操作。
分组计数
对数值进行分组计数,比如计算每个分数出现的次数,可以使用 value_counts
函数。
count = df['score'].value_counts()
print(count)
输出:
85 1
80 1
75 1
90 1
95 1
Name: score, dtype: int64
这个函数计算的是每个数值出现的次数,返回一个 Pandas 序列。
如果想要对数据框中的多个列进行分组计数,可以使用 groupby
函数和 value_counts
函数的组合。
count = df.groupby(['gender', 'score']).size()
print(count)
输出:
gender score
Female 75 1
80 1
Male 85 1
90 1
95 1
dtype: int64
这个函数计算的是每个分组中每个数值出现的次数,返回一个 Pandas 序列。
结论
本文介绍了在 Pandas 数据框中对数值进行分组计数的方法。通过使用 value_counts
函数和 groupby
函数,我们可以方便地进行数据分组统计。