Pandas保留几列,其他删除

Pandas保留几列,其他删除

Pandas保留几列,其他删除

引言

在使用Pandas进行数据处理和分析时,经常需要根据具体需求提取需要的数据列,并且删除其他无用的列。本文将详细介绍如何使用Pandas保留指定的几列数据,同时删除其他列。

1. 导入必要的库

在开始之前,我们需要导入Pandas库,并根据需要导入其他所需的库。

import pandas as pd

2. 创建示例数据

为了说明问题,我们首先创建一个包含多个数据列的示例数据。

data = {'姓名': ['张三', '李四', '王五', '赵六'],
        '年龄': [25, 30, 35, 40],
        '性别': ['男', '男', '女', '男'],
        '城市': ['北京', '上海', '广州', '深圳']}
df = pd.DataFrame(data)
print(df)

输出:

   姓名  年龄 性别  城市
0  张三  25  男  北京
1  李四  30  男  上海
2  王五  35  女  广州
3  赵六  40  男  深圳

3. 保留指定列

要保留指定的列,我们可以使用DataFrameloc属性,并通过列名传入需要保留的列。

df = df.loc[:, ['姓名', '性别', '城市']]
print(df)

输出:

   姓名 性别  城市
0  张三  男  北京
1  李四  男  上海
2  王五  女  广州
3  赵六  男  深圳

如上所示,只保留了指定的列。

4. 删除其他列

如果想要删除除指定列之外的其他列,我们可以使用drop方法来实现。

df = df.drop(columns=['年龄'])
print(df)

输出:

   姓名 性别  城市
0  张三  男  北京
1  李四  男  上海
2  王五  女  广州
3  赵六  男  深圳

以上示例中,我们使用drop方法删除了除姓名性别城市列之外的其他列。

5. 再次保留指定列

如果在删除其他列后,希望再次保留其他列,则可以重复使用loc属性进行保留。

df = df.loc[:, ['姓名', '性别']]
print(df)

输出:

   姓名 性别
0  张三  男
1  李四  男
2  王五  女
3  赵六  男

6. 重建索引

在删除了指定的列后,DataFrame的列索引可能会发生改变。如果需要按原来的索引进行排序,可以使用reset_index方法。

df = df.reset_index(drop=True)
print(df)

输出:

   姓名 性别
0  张三  男
1  李四  男
2  王五  女
3  赵六  男

通过reset_index方法,我们重新设置了索引,并将原来的索引删除。

7. 结论

通过使用Pandas库提供的方法,可以轻松地保留指定的列,并删除其他列。上述示例展示了如何使用loc属性保留指定列,以及使用drop方法删除其他列。如果需要按原来的索引进行排序,可以使用reset_index方法。使用这些方法,可以更方便地进行数据处理和分析。

Camera课程

Python教程

Java教程

Web教程

数据库教程

图形图像教程

办公软件教程

Linux教程

计算机教程

大数据教程

开发工具教程