Pandas保留几列，其他删除

引言

在使用Pandas进行数据处理和分析时，经常需要根据具体需求提取需要的数据列，并且删除其他无用的列。本文将详细介绍如何使用Pandas保留指定的几列数据，同时删除其他列。

1. 导入必要的库

在开始之前，我们需要导入Pandas库，并根据需要导入其他所需的库。

import pandas as pd

2. 创建示例数据

为了说明问题，我们首先创建一个包含多个数据列的示例数据。

data = {'姓名': ['张三', '李四', '王五', '赵六'],
        '年龄': [25, 30, 35, 40],
        '性别': ['男', '男', '女', '男'],
        '城市': ['北京', '上海', '广州', '深圳']}
df = pd.DataFrame(data)
print(df)

输出：

   姓名  年龄 性别  城市
0  张三  25  男  北京
1  李四  30  男  上海
2  王五  35  女  广州
3  赵六  40  男  深圳

3. 保留指定列

要保留指定的列，我们可以使用DataFrame的loc属性，并通过列名传入需要保留的列。

df = df.loc[:, ['姓名', '性别', '城市']]
print(df)

输出：

   姓名 性别  城市
0  张三  男  北京
1  李四  男  上海
2  王五  女  广州
3  赵六  男  深圳

如上所示，只保留了指定的列。

4. 删除其他列

如果想要删除除指定列之外的其他列，我们可以使用drop方法来实现。

df = df.drop(columns=['年龄'])
print(df)

输出：

   姓名 性别  城市
0  张三  男  北京
1  李四  男  上海
2  王五  女  广州
3  赵六  男  深圳

以上示例中，我们使用drop方法删除了除姓名、性别和城市列之外的其他列。

5. 再次保留指定列

如果在删除其他列后，希望再次保留其他列，则可以重复使用loc属性进行保留。

df = df.loc[:, ['姓名', '性别']]
print(df)

输出：

   姓名 性别
0  张三  男
1  李四  男
2  王五  女
3  赵六  男

6. 重建索引

在删除了指定的列后，DataFrame的列索引可能会发生改变。如果需要按原来的索引进行排序，可以使用reset_index方法。

df = df.reset_index(drop=True)
print(df)

输出：

   姓名 性别
0  张三  男
1  李四  男
2  王五  女
3  赵六  男

通过reset_index方法，我们重新设置了索引，并将原来的索引删除。

7. 结论

通过使用Pandas库提供的方法，可以轻松地保留指定的列，并删除其他列。上述示例展示了如何使用loc属性保留指定列，以及使用drop方法删除其他列。如果需要按原来的索引进行排序，可以使用reset_index方法。使用这些方法，可以更方便地进行数据处理和分析。

Pandas保留几列，其他删除

Pandas保留几列，其他删除

引言

1. 导入必要的库

2. 创建示例数据

3. 保留指定列

4. 删除其他列

5. 再次保留指定列

6. 重建索引

7. 结论

Camera课程

Python教程

Java教程

Web教程

数据库教程

图形图像教程

办公软件教程

Linux教程

计算机教程

大数据教程

开发工具教程

回顶部