pandas剔除姓名列中在指定list 中的字
在进行数据处理时,经常会遇到需要根据特定条件筛选或剔除数据的情况。在使用pandas处理数据时,有时候需要根据给定的列表来剔除姓名列中包含特定字的数据。本文将介绍如何使用pandas来实现这一功能。
数据准备
首先,我们需要准备一份包含姓名列的数据。我们使用pandas的DataFrame来创建一个示例数据:
import pandas as pd
data = {'姓名': ['张三', '李四', '王五', '赵六', '孙七']}
df = pd.DataFrame(data)
print(df)
运行以上代码,我们可以得到如下输出:
姓名
0 张三
1 李四
2 王五
3 赵六
4 孙七
剔除指定列表中的字
假设我们需要剔除姓名列中包含”四”和”六”的数据。我们可以使用pandas的str.contains方法结合逻辑运算符”~”来实现这个功能:
exclude_list = ['四', '六']
mask = df['姓名'].str.contains('|'.join(exclude_list))
result = df[~mask]
print(result)
运行以上代码,我们可以得到如下输出:
姓名
0 张三
2 王五
4 孙七
通过以上代码,我们成功剔除了姓名列中包含”四”和”六”的数据,得到了符合条件的数据。
结语
本文介绍了如何使用pandas剔除姓名列中在指定列表中的字。通过使用pandas的str.contains方法和逻辑运算符”~”,我们可以方便地实现这一功能。