如何使用 Pandas 的concat函数来合并两个 DataFrame
在数据分析和数据处理中,经常需要将多个数据集合并为一个更大的数据集。Pandas 是 Python 中一个强大的数据处理库,它提供了多种方式来合并数据,其中 concat()
函数是一个非常常用的功能。本文将详细介绍如何使用 Pandas 的 concat()
函数来合并两个 DataFrame,并提供多个示例代码以帮助理解和应用。
1. pandas concat()
函数简介
Pandas 的 concat()
函数主要用于沿着一条轴将多个对象堆叠到一起。例如,可以是沿着垂直轴(行)或水平轴(列)来合并数据。该函数的基本语法如下:
objs
: 一个序列或映射,这里面的每个对象都是要合并的 pandas 数据结构(Series 或 DataFrame)。axis
:{0/'index', 1/'columns'}
, 默认为 0,即沿着索引(行)合并。join
:{'inner', 'outer'}
, 默认为 ‘outer’。outer 返回所有的列,inner 返回两个 DataFrame 都有的列。ignore_index
: 布尔值,默认为 False。如果为 True,则不使用索引值,而是创建一个新的索引。keys
: 用于形成层次化索引的值。verify_integrity
: 布尔值,默认为 False。如果为 True,则检查新的轴是否包含重复项。sort
: 布尔值,默认为 False。在沿轴连接时排序。
2. 示例代码
示例 1: 基本的 DataFrame 合并
Output:
示例 2: 沿列合并 DataFrame
Output:
示例 3: 使用内连接合并 DataFrame
Output:
示例 4: 忽略原有索引并创建新索引
Output:
示例 5: 使用键创建层次化索引
Output:
示例 6: 检查合并后的 DataFrame 是否有重复的索引
示例 7: 在合并时排序列
Output:
示例 8: 使用多个 DataFrame 进行合并
Output:
示例 9: 合并具有不同列的 DataFrame
Output:
示例 10: 使用外连接合并 DataFrame
Output:
示例 11: 指定层次化索引的名称
Output:
示例 12: 合并时保留原有 DataFrame 的索引
Output:
示例 13: 检查合并后的 DataFrame 的完整性
Output:
示例 14: 合并具有相同列但不同顺序的 DataFrame
Output:
示例 15: 使用多级键合并多个 DataFrame
Output:
这些示例展示了如何使用 Pandas 的 concat()
函数来合并两个或多个 DataFrame。通过调整参数,可以灵活地处理不同的数据合并需求,例如保留索引、忽略索引、内连接或外连接等。