pandas 部分列名加前缀|极客笔记

pandas 部分列名加前缀

在数据处理过程中，有时候需要给数据集中的部分列名加上前缀，这样可以更清晰地区分不同来源或意义的列。在使用Python的数据处理库pandas时，我们可以借助一些方法来实现给部分列名加前缀的操作。本文将详细介绍如何使用pandas给部分列名加前缀。

1. 读取数据集

首先，我们需要准备一个示例数据集来进行演示。假设我们有一个名为data.csv的CSV文件，内容如下：

A,B,C,D
1,2,3,4
5,6,7,8
9,10,11,12

我们先利用pandas读取这个数据集，并展示数据集的基本信息：

import pandas as pd

# 读取数据集
df = pd.read_csv('data.csv')

# 显示数据集基本信息
print(df.info())
print(df.head())

运行以上代码，可以看到输出显示数据集的基本信息和前几行数据：

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 4 columns):
 #   Column  Non-Null Count  Dtype
---  ------  --------------  -----
 0   A       3 non-null      int64
 1   B       3 non-null      int64
 2   C       3 non-null      int64
 3   D       3 non-null      int64
dtypes: int64(4)
memory usage: 224.0 bytes
None

   A   B   C   D
0   1   2   3   4
1   5   6   7   8
2   9  10  11  12

现在我们已经成功读取了示例数据集，并展示了数据集的基本信息。

2. 给部分列名加前缀

接下来，我们将演示如何给数据集中部分列名加上指定的前缀。假设我们需要给列B和D加上前缀prefix_，我们可以使用pandas的rename()函数来实现。示例代码如下：

# 给部分列名加前缀
df = df.rename(columns={'B': 'prefix_B', 'D': 'prefix_D'})

# 显示修改后的列名
print(df.columns)

运行以上代码后，可以看到输出显示修改后的列名信息：

Index(['A', 'prefix_B', 'C', 'prefix_D'], dtype='object')

可以看到，列B和D已经成功加上了前缀prefix_。这样我们就实现了给部分列名加前缀的操作。

3. 将修改后的数据集保存为新文件

最后，我们可以将修改后的数据集保存为新的CSV文件，以便后续使用。示例代码如下：

# 将修改后的数据集保存为新的CSV文件
df.to_csv('new_data.csv', index=False)

运行以上代码后，将会生成一个新的CSV文件new_data.csv，内容如下：

A,prefix_B,C,prefix_D
1,2,3,4
5,6,7,8
9,10,11,12

结语

通过本文的介绍，我们学习了如何使用pandas给数据集中部分列名加上前缀。这个操作在数据处理过程中经常会用到，能够使数据集更加清晰易懂。

pandas 部分列名加前缀