Python Pandas – 设置索引名称

Python Pandas – 设置索引名称

Pandas 是 Python 中一个非常实用的数据分析和统计处理工具,其重要性不言自明。在 Pandas 中,DataFrame 是其中一个核心数据结构,类似于 Excel 中的一张表格。在 DataFrame 中,索引 Index 是其中一个非常重要的概念。在 Pandas 中,我们可以通过设置索引名称来更好地对数据进行处理。本文将从以下几个方面详细介绍 Python Pandas 中如何设置索引名称。

1. DataFrame 索引

在 Pandas 中,索引是用来唯一标识 DataFrame 中每一行数据的方式。我们可以使用自定义的一列或多列作为索引,也可以使用 Pandas 默认的数字索引。示例如下:

import pandas as pd

data = {
    "name": ["Alice", "Bob", "Cindy", "David"],
    "age": [25, 30, 35, 40],
    "gender": ["F", "M", "F", "M"]
}

df = pd.DataFrame(data)
print(df)

输出:

    name  age gender
0  Alice   25      F
1    Bob   30      M
2  Cindy   35      F
3  David   40      M

上述代码中,df 即为一个 DataFrame,其中默认使用数字索引,即索引为 0~3。接下来,我们将介绍如何设置 DataFrame 索引名称。

2. 设置索引名称

在 DataFrame 中,我们可以使用 set_index 方法指定某一列作为索引,同时可以使用 rename_axis 方法来设置索引名称。示例如下:

import pandas as pd

data = {
    "name": ["Alice", "Bob", "Cindy", "David"],
    "age": [25, 30, 35, 40],
    "gender": ["F", "M", "F", "M"]
}

df = pd.DataFrame(data)
df = df.set_index("name")
df = df.rename_axis('username')
print(df)

输出:

          age gender
username           
Alice      25      F
Bob        30      M
Cindy      35      F
David      40      M

上述代码中,我们首先使用 set_index 方法将 name 列设为索引,然后使用 rename_axis 方法将索引名称设置为 username。这时,我们可以看到 DataFrame 的索引已经更改为 username

另外,我们也可以直接使用 index.name 来更改索引名称,示例如下:

import pandas as pd

data = {
    "name": ["Alice", "Bob", "Cindy", "David"],
    "age": [25, 30, 35, 40],
    "gender": ["F", "M", "F", "M"]
}

df = pd.DataFrame(data)
df = df.set_index("name")
df.index.name = "username"
print(df)

输出:

          age gender
username           
Alice      25      F
Bob        30      M
Cindy      35      F
David      40      M

上述代码中,我们首先使用 set_index 方法将 name 列设为索引,然后使用 index.name 直接更改索引名称。这时,我们也可以看到 DataFrame 的索引已经更改为 username

结论

通过以上案例简单介绍了 Pandas 中如何设置索引名称,使用 set_index 方法将某一列设为索引,使用 rename_axisindex.name 来设置索引名称。如有需要,可以参照本文提供的示例代码进行操作。

Camera课程

Python教程

Java教程

Web教程

数据库教程

图形图像教程

办公软件教程

Linux教程

计算机教程

大数据教程

开发工具教程