python 分组求和后和原数据合并|极客笔记

python 分组求和后和原数据合并

在数据处理过程中，经常会遇到需要对数据进行分组求和的情况。一种常见的情况是，我们需要对某个特定特征进行分组，并对每个组内的数据进行求和。完成分组求和后，我们可能需要将求和结果和原数据合并，以便进一步分析或可视化。

在本文中，我们将详细讨论如何使用Python对数据进行分组求和，并将求和结果和原数据进行合并的方法。

1. 数据准备

首先，让我们准备一份示例数据，用来演示分组求和和数据合并的过程。我们将使用Pandas库来处理数据。下面是我们准备的示例数据：

import pandas as pd

# 创建示例数据
data = {
    'Class': ['A', 'B', 'A', 'B', 'A', 'A', 'B', 'A', 'B'],
    'Score': [80, 90, 85, 88, 92, 78, 89, 87, 93]
}

df = pd.DataFrame(data)
print(df)

运行以上代码，我们得到的示例数据如下：

  Class  Score
0     A     80
1     B     90
2     A     85
3     B     88
4     A     92
5     A     78
6     B     89
7     A     87
8     B     93

以上示例数据包含了两列，分别是班级(Class)和分数(Score)。我们将根据班级对分数进行求和，并将求和结果合并回原数据。

2. 分组求和

接下来，我们将使用Pandas的groupby()和sum()方法对数据进行分组求和。代码如下：

# 对数据按班级进行分组并求和
grouped = df.groupby('Class').sum()
print(grouped)

运行以上代码，我们得到的分组求和结果如下：

       Score
Class       
A        422
B        360

以上结果显示了按班级进行分组求和后的结果。我们可以看到，班级A的总分为422，班级B的总分为360。

3. 数据合并

完成了分组求和后，我们需要将求和结果和原数据进行合并。我们可以使用merge()方法将两个数据表合并。代码如下：

# 将分组求和结果和原数据合并
merged = df.merge(grouped, left_on='Class', right_index=True, suffixes=('', '_Total'))
print(merged)

运行以上代码，我们得到的合并后的数据如下：

  Class  Score  Score_Total
0     A     80         422
2     A     85         422
4     A     92         422
5     A     78         422
7     A     87         422
1     B     90         360
3     B     88         360
6     B     89         360
8     B     93         360

以上合并后的数据包含了原数据中的班级和分数列，以及分组求和后的总分列。我们可以看到，合并后的数据保留了原数据的所有信息，并添加了总分列。