Pandas DataFrame中的索引名称修改

Pandas DataFrame中的索引名称修改

在本文中,我们将介绍如何使用Pandas来修改DataFrame中的索引名称。

阅读更多:Pandas 教程

Pandas DataFrame中的索引

在Pandas中,DataFrame是一个二维表格,每一列可以有不同的数据类型。DataFrame中的每行和每列都有各自的索引。如果不指定索引,Pandas会自动创建一个默认的整数序列索引。DataFrame的索引可以用来访问和操作数据以及进行数据分析。在DataFrame中,可以通过以下代码来查看行索引和列索引:

import pandas as pd

df = pd.DataFrame({'country': ['China', 'India', 'USA'],
                   'population': [1409, 1339, 331],
                   'GDP': [14129, 2948, 18624]})

print(df.index)      # 行索引
print(df.columns)    # 列索引

输出结果为:

RangeIndex(start=0, stop=3, step=1)
Index(['country', 'population', 'GDP'], dtype='object')

在此示例中,行索引是默认的整数序列索引,而列索引是由’country’、’population’和’GDP’组成的Index对象。

修改DataFrame中的行索引

在Pandas中,我们可以用rename方法来修改DataFrame中的行索引。rename方法是一个很有用的函数,可以支持许多不同的重命名操作。例如,我们可以通过以下代码来将DataFrame的行索引从默认的整数序列索引重命名为国家名:

df = df.rename({0: 'China', 1: 'India', 2: 'USA'})
print(df.index)

输出结果为:

Index(['China', 'India', 'USA'], dtype='object')

所做的修改是将原来的行索引:0,1,2 重命名为 ‘China’, ‘India’, ‘USA’。如此一来,我们就可以通过这些字符串来访问每一行的数据。

除了使用rename方法,还可以在创建DataFrame时就指定行索引,例如:

df = pd.DataFrame({'population': [1409, 1339, 331],
                   'GDP': [14129, 2948, 18624]},
                  index=['China', 'India', 'USA'])

修改DataFrame中的列索引

和行索引类似,我们也可以通过rename方法来修改DataFrame中的列索引。rename方法的参数需要是一个字典,其中字典的键是原始列名,字典的值是新的列名。例如,我们可以通过以下代码将’population’列重命名为’pop’,将’GDP’列重命名为’gdp’:

df = df.rename(columns={'population': 'pop', 'GDP': 'gdp'})
print(df.columns)

输出结果为:

Index(['country', 'pop', 'gdp'], dtype='object')

所做的修改是将原来的列索引:’population’, ‘GDP’ 重命名为 ‘pop’, ‘gdp’。如此一来,我们就可以通过这些字符串来访问每一列的数据。

除了使用rename方法,还可以在创建DataFrame时就指定列索引,例如:

df = pd.DataFrame({'China': [1409, 14129],
                   'India': [1339, 2948],
                   'USA': [331, 18624]},
                  index=['pop', 'gdp'])

总结

在本文中,我们介绍了如何使用Pandas来修改DataFrame中的行索引和列索引。重命名索引是一项常见的操作,可以方便我们对数据进行访问和处理。Pandas提供了rename方法来实现索引的重命名,也可以在创建DataFrame时就指定合适的索引。

Camera课程

Python教程

Java教程

Web教程

数据库教程

图形图像教程

办公软件教程

Linux教程

计算机教程

大数据教程

开发工具教程