Pandas 数据框中如何对数值进行分组计数

Pandas 数据框中如何对数值进行分组计数

在 Pandas 中,我们经常需要对数据进行分组统计,比如对数值进行计数。本文将介绍如何在 Pandas 数据框中对数值进行分组计数。

数据框的基本操作

首先,我们需要了解 Pandas 数据框的基本操作。

创建一个 Pandas 数据框:

import pandas as pd

data = {'name': ['Alice', 'Bob', 'Charlie', 'David', 'Emily'],
        'age': [25, 30, 35, 40, 45],
        'gender': ['Female', 'Male', 'Male', 'Male', 'Female'],
        'score': [80, 90, 85, 95, 75]}

df = pd.DataFrame(data)

print(df)

输出:

      name  age  gender  score
0    Alice   25  Female     80
1      Bob   30    Male     90
2  Charlie   35    Male     85
3    David   40    Male     95
4    Emily   45  Female     75

我们可以使用 Pandas 中的 groupby 函数对数据进行分组操作。

分组计数

对数值进行分组计数,比如计算每个分数出现的次数,可以使用 value_counts 函数。

count = df['score'].value_counts()

print(count)

输出:

85    1
80    1
75    1
90    1
95    1
Name: score, dtype: int64

这个函数计算的是每个数值出现的次数,返回一个 Pandas 序列。

如果想要对数据框中的多个列进行分组计数,可以使用 groupby 函数和 value_counts 函数的组合。

count = df.groupby(['gender', 'score']).size()

print(count)

输出:

gender  score
Female  75       1
        80       1
Male    85       1
        90       1
        95       1
dtype: int64

这个函数计算的是每个分组中每个数值出现的次数,返回一个 Pandas 序列。

结论

本文介绍了在 Pandas 数据框中对数值进行分组计数的方法。通过使用 value_counts 函数和 groupby 函数,我们可以方便地进行数据分组统计。

Camera课程

Python教程

Java教程

Web教程

数据库教程

图形图像教程

办公软件教程

Linux教程

计算机教程

大数据教程

开发工具教程