Pandas DataFrame中的索引名称修改

在本文中，我们将介绍如何使用Pandas来修改DataFrame中的索引名称。

Pandas DataFrame中的索引

在Pandas中，DataFrame是一个二维表格，每一列可以有不同的数据类型。DataFrame中的每行和每列都有各自的索引。如果不指定索引，Pandas会自动创建一个默认的整数序列索引。DataFrame的索引可以用来访问和操作数据以及进行数据分析。在DataFrame中，可以通过以下代码来查看行索引和列索引：

import pandas as pd

df = pd.DataFrame({'country': ['China', 'India', 'USA'],
                   'population': [1409, 1339, 331],
                   'GDP': [14129, 2948, 18624]})

print(df.index)      # 行索引
print(df.columns)    # 列索引

输出结果为：

RangeIndex(start=0, stop=3, step=1)
Index(['country', 'population', 'GDP'], dtype='object')

在此示例中，行索引是默认的整数序列索引，而列索引是由’country’、’population’和’GDP’组成的Index对象。

修改DataFrame中的行索引

在Pandas中，我们可以用rename方法来修改DataFrame中的行索引。rename方法是一个很有用的函数，可以支持许多不同的重命名操作。例如，我们可以通过以下代码来将DataFrame的行索引从默认的整数序列索引重命名为国家名：

df = df.rename({0: 'China', 1: 'India', 2: 'USA'})
print(df.index)

输出结果为：

Index(['China', 'India', 'USA'], dtype='object')

所做的修改是将原来的行索引：0,1,2 重命名为 ‘China’, ‘India’, ‘USA’。如此一来，我们就可以通过这些字符串来访问每一行的数据。

除了使用rename方法，还可以在创建DataFrame时就指定行索引，例如：

df = pd.DataFrame({'population': [1409, 1339, 331],
                   'GDP': [14129, 2948, 18624]},
                  index=['China', 'India', 'USA'])

修改DataFrame中的列索引

和行索引类似，我们也可以通过rename方法来修改DataFrame中的列索引。rename方法的参数需要是一个字典，其中字典的键是原始列名，字典的值是新的列名。例如，我们可以通过以下代码将’population’列重命名为’pop’，将’GDP’列重命名为’gdp’：

df = df.rename(columns={'population': 'pop', 'GDP': 'gdp'})
print(df.columns)

输出结果为：

Index(['country', 'pop', 'gdp'], dtype='object')

所做的修改是将原来的列索引：’population’, ‘GDP’ 重命名为 ‘pop’, ‘gdp’。如此一来，我们就可以通过这些字符串来访问每一列的数据。

除了使用rename方法，还可以在创建DataFrame时就指定列索引，例如：

df = pd.DataFrame({'China': [1409, 14129],
                   'India': [1339, 2948],
                   'USA': [331, 18624]},
                  index=['pop', 'gdp'])