Pandas 如何在索引上合并dataframe

在本文中，我们将介绍在Pandas中如何基于索引合并dataframe。合并是数据处理中非常常见的操作之一，而Pandas提供了不同的方法来合并dataframe。其中，“基于索引”是其中一个常用且强大的合并方式。

什么是“基于索引”合并？

在Pandas中，dataframe的索引提供了非常重要的信息。索引是标识每行的唯一标识符。在某些情况下，我们想要使用索引来合并dataframe，而不是使用列上的某些值作为合并依据。这称为“基于索引”合并。在基于索引的合并中，我们使用一个或多个dataframe的索引作为合并依据。

以下是一些示例：

假设我们有两个dataframe，分别包含客户的个人信息和订单信息。客户信息dataframe的索引是客户ID，而订单信息dataframe的索引是订单ID。我们可以使用客户ID和订单ID作为合并依据来合并两个dataframe。

如何在索引上合并dataframe？

Pandas中的merge函数可以用于合并两个或多个dataframe。在基于索引的合并中，我们可以指定参数“left_index=True”和“right_index=True”来表示我们想要以左边和右边的dataframe索引来进行合并。

现在，我们将演示如何在两个dataframe上进行基于索引的合并。

假设我们有以下两个dataframe：

import pandas as pd

# 创建第一个dataframe
df1 = pd.DataFrame({'A': ['A0', 'A1', 'A2', 'A3'],
                    'B': ['B0', 'B1', 'B2', 'B3'],
                    'C': ['C0', 'C1', 'C2', 'C3'],
                    'D': ['D0', 'D1', 'D2', 'D3']},
                   index=[0, 1, 2, 3])

# 创建第二个dataframe
df2 = pd.DataFrame({'A': ['A4', 'A5', 'A6', 'A7'],
                    'B': ['B4', 'B5', 'B6', 'B7'],
                    'C': ['C4', 'C5', 'C6', 'C7'],
                    'D': ['D4', 'D5', 'D6', 'D7']},
                   index=[4, 5, 6, 7])

现在，我们将在索引上合并这两个dataframe：

#在索引上合并
merged_df = pd.merge(df1, df2, left_index=True, right_index=True)
print(merged_df)

输出结果为：

   A_x B_x C_x D_x A_y B_y C_y D_y
0  A0  B0  C0  D0  A4  B4  C4  D4
1  A1  B1  C1  D1  A5  B5  C5  D5
2  A2  B2  C2  D2  A6  B6  C6  D6
3  A3  B3  C3  D3  A7  B7  C7  D7

在输出结果中，我们可以看到以左边和右边dataframe的索引作为合并依据进行了基于索引的合并。输出结果中有四个带有后缀’_x’的列，它们是来自左边dataframe的列。同样，输出结果中还有四个带有后缀_y的列，它们是来自右边dataframe的列。

另一种基于索引的合并方法 – join函数

除了使用merge函数之外，Pandas还提供了join函数在索引上合并dataframe。join函数可以根据索引来合并dataframe，并且具有与merge函数相似的参数和功能。我们可以使用join函数来执行与上面相同的操作。

以下是使用join函数来合并两个dataframe的代码示例：

#使用join函数合并两个dataframe
joined_df = df1.join(df2, how='inner')
print(joined_df)

输出结果为：

   A_x B_x C_x D_x A_y B_y C_y D_y
4  A4  B4  C4  D4  A4  B4  C4  D4
5  A5  B5  C5  D5  A5  B5  C5  D5
6  A6  B6  C6  D6  A6  B6  C6  D6
7  A7  B7  C7  D7  A7  B7  C7  D7

使用join函数可以看到，两个dataframe合并了，它们的索引被使用作为合并依据。