pandas 删除行|极客笔记

pandas 删除行

在数据分析和处理中，经常会遇到需要删除DataFrame中某些行的情况。pandas是一个功能强大的数据处理工具，提供了丰富的方法来对DataFrame进行操作，包括删除行的操作。本文将详细介绍如何使用pandas删除DataFrame中的行。

删除指定行

按照索引删除行

通过drop方法可以根据索引删除行，可以使用index参数指定需要删除的行索引。示例代码如下：

import pandas as pd

data = {'A': [1, 2, 3],
        'B': [4, 5, 6],
        'C': [7, 8, 9]}

df = pd.DataFrame(data)

# 删除索引为1的行
df.drop(index=1, inplace=True)

print(df)

运行以上代码后，输出的结果如下：

   A  B  C
0  1  4  7
2  3  6  9

在上面的示例中，我们通过drop方法删除了索引为1的行。

按照条件删除行

利用drop方法和条件判断，可以删除满足某些条件的行。示例代码如下：

import pandas as pd

data = {'A': [1, 2, 3],
        'B': [4, 5, 6],
        'C': [7, 8, 9]}

df = pd.DataFrame(data)

# 删除A列值大于2的行
df = df.drop(df[df['A'] > 2].index)

print(df)

运行以上代码后，输出的结果如下：

   A  B  C
0  1  4  7
1  2  5  8

在上面的示例中，我们利用了条件判断df['A'] > 2来选择需要删除的行，然后调用drop方法删除这些行。

删除重复行

有时候DataFrame中可能会有重复的行，可以使用drop_duplicates方法来删除重复行。示例代码如下：

import pandas as pd

data = {'A': [1, 1, 2, 3],
        'B': [4, 4, 5, 6],
        'C': [7, 7, 8, 9]}

df = pd.DataFrame(data)

# 删除重复行
df = df.drop_duplicates()

print(df)

运行以上代码后，输出的结果如下：

在上面的示例中，我们通过drop_duplicates方法删除了重复的行。

删除缺失值行

对于含有缺失值的DataFrame，可以使用dropna方法来删除含有缺失值的行。示例代码如下：

import pandas as pd
import numpy as np

data = {'A': [1, np.nan, 2],
        'B': [4, 5, np.nan],
        'C': [7, 8, 9]}

df = pd.DataFrame(data)

# 删除含有缺失值的行
df = df.dropna()

print(df)

运行以上代码后，输出的结果如下：