pandas 删除数据
在数据处理中,经常需要对数据集进行删除操作,而 pandas 提供了多种方法来实现数据删除的功能。本文将详细介绍 pandas 中如何删除数据,包括删除行、删除列以及根据条件删除数据。
删除行
要删除行数据,可以使用 drop()
方法。以下是删除行的几种常见用法:
1. 按索引删除单行
import pandas as pd
data = {'A': [1, 2, 3, 4],
'B': [5, 6, 7, 8]}
df = pd.DataFrame(data)
# 删除第2行数据
df = df.drop(1)
print(df)
运行结果:
A B
0 1 5
2 3 7
3 4 8
2. 按索引删除多行
# 删除第1行和第3行数据
df = df.drop([0, 2])
print(df)
运行结果:
A B
3 4 8
删除列
要删除列数据,可以指定 axis=1
参数。以下是删除列的几种常见用法:
1. 按列名删除单列
# 删除列名为 'B' 的列
df = df.drop('B', axis=1)
print(df)
运行结果:
A
0 1
1 2
2 3
3 4
2. 按列名删除多列
# 删除列名为 'A' 和 'B' 的列
df = df.drop(['A', 'B'], axis=1)
print(df)
运行结果:
Empty DataFrame
Columns: []
Index: [0, 1, 2, 3]
根据条件删除数据
除了按索引或列名删除数据外,还可以根据条件来删除数据。以下是根据条件删除数据的几种常见用法:
1. 删除满足条件的行
# 删除 'A' 列中大于2的行
df = df[df['A'] <= 2]
print(df)
运行结果:
A
0 1
1 2
2. 删除满足条件的列
# 删除 'A' 列中的值为1的列
df = df.loc[:, df.columns != 'A']
print(df)
运行结果:
Empty DataFrame
Columns: []
Index: [0, 1, 2, 3]
通过以上介绍,我们可以看到 pandas 提供了多种删除数据的方法,可以根据具体的需求选择合适的方法来删除数据,从而实现数据集的精确处理。