使用’in’和’not in’运算符在Python Pandas中检查DataFrame中是否存在某个值
Pandas是一个强大的Python库,广泛用于数据操作和分析。在处理DataFrame时,经常需要检查数据集中是否存在特定的值。在本教程中,我们将探索如何使用Pandas中的’in’和’not in’运算符来确定DataFrame中某个值是否存在。
使用”in”运算符检查值
Python中的’in’运算符用于检查一个值是否存在于一个可迭代对象中。在Pandas的上下文中,我们可以使用’in’运算符来验证一个值是否存在于DataFrame中。让我们来看两个示例,演示如何使用’in’运算符来检查DataFrame中某个值的存在。
示例1:检查DataFrame列中是否存在某个值
在这个示例中,我们创建了一个包含两列的DataFrame:’Name’和’Age’。我们希望检查值’Alice’是否存在于’Name’列中。通过使用’in’运算符,我们使用”.values”属性将该值与’Name’列中的值进行比较。
考虑下面的代码示例。
import pandas as pd
# Create a DataFrame
df = pd.DataFrame({'Name': ['John', 'Alice', 'Bob', 'Emily'],'Age': [25, 30, 28, 35]})
# Check if a value exists in the 'Name' column
value = 'Alice'
if value in df['Name'].values:
print(f"{value} exists in the DataFrame.")
else:
print(f"{value} does not exist in the DataFrame.")
输出结果
如果找到了值,将显示相应的消息;否则,将打印出不同的消息。
当您执行此代码时,将产生以下输出结果 –
Alice exists in the DataFrame.
示例2:在DataFrame中检查值
在这个例子中,我们想要检查值’28’是否存在于整个DataFrame中。我们利用”in”运算符将该值与DataFrame中的所有值使用”.values”属性进行比较。
考虑下面显示的代码 –
import pandas as pd
# Create a DataFrame
df = pd.DataFrame({'Name': ['John', 'Alice', 'Bob', 'Emily'],'Age': [25, 30, 28, 35]})
# Check if a value exists in the DataFrame
value = 28
if value in df.values:
print(f"{value} exists in the DataFrame.")
else:
print(f"{value} does not exist in the DataFrame.")
输出
如果该值存在,则显示相应的消息;否则,打印另一条消息。
当您执行此代码时,将产生以下输出−
28 exists in the DataFrame.
使用”not in”运算符来检查值
在这个例子中,我们创建了一个包含两列的DataFrame: “Name”和”Age”。我们的目标是检查值”Michael”是否不存在于’Name’列中。
通过使用”not in”运算符,我们使用”.values”属性将值与”Name”列中的值进行比较。
考虑下面显示的代码。
import pandas as pd
# Create a DataFrame
df = pd.DataFrame({'Name': ['John', 'Alice', 'Bob', 'Emily'],'Age': [25, 30, 28, 35]})
# Check if a value does not exist in the 'Name' column
value = 'Michael'
if value not in df['Name'].values:
print(f"{value} does not exist in the DataFrame.")
else:
print(f"{value} exists in the DataFrame.")
输出
如果未找到该值,则显示相应的消息;否则,将打印出不同的消息。
执行此代码时,将产生以下输出 −
Michael does not exist in the DataFrame.
结论
在本教程中,我们探讨了如何利用Pandas中的“in”和“not in”运算符来检查DataFrame中值的存在或不存在。通过利用这些运算符,我们可以高效地确定特定列或整个DataFrame中的值的存在与否。
通过提供的代码示例,我们演示了如何使用“in”运算符来检查DataFrame列或整个DataFrame中的值是否存在。此外,我们还展示了使用“not in”运算符来检查值的不存在。
通过使用这些运算符,分析师和数据科学家可以有效地验证数据的存在或不存在,从而根据DataFrame结构中的可用信息做出明智的决策。
总而言之,Pandas中的“in”和“not in”运算符为值的存在和不存在提供了强大的工具,促进了高效的数据探索和分析。