Pandas如何创建数据框的视图
在本文中,我们将介绍如何在Pandas中创建数据框的视图,即数据框的子集,这个子集只包含或排除一些行、列或单元格。数据框视图是数据框的重要部分,这可以帮助我们得到我们需要的数据集。Pandas提供了许多方法来创建数据框视图,我们将逐一介绍。
阅读更多:Pandas 教程
创建数据框视图的方法
1. .loc方法
.loc方法用于按标签选择数据框的行和列。为了创建视图,我们可以选择我们感兴趣的行和列,然后使用.loc方法将它们选择出来。下面是一个例子:
import pandas as pd
data = {'name': ['Bob', 'Tom', 'Jerry', 'Mike'], 'age': [25, 37, 18, 24], 'gender':['M', 'M', 'M', 'M']}
df = pd.DataFrame(data)
# 创建一个只包括 'name' 和 'age' 列的视图
view = df.loc[:, ['name', 'age']]
print(view)
输出:
name age
0 Bob 25
1 Tom 37
2 Jerry 18
3 Mike 24
上面的代码创建了一个只包括’name’和’age’列的视图,我们可以看到输出的数据框中只有这两列。
2. .iloc方法
与.loc方法不同,.iloc方法用于按位置选择行和列。为了创建视图,我们需要选择我们感兴趣的行和列的位置,然后使用.iloc方法将其选择出来。下面是一个例子:
import pandas as pd
data = {'name': ['Bob', 'Tom', 'Jerry', 'Mike'], 'age': [25, 37, 18, 24], 'gender':['M', 'M', 'M', 'M']}
df = pd.DataFrame(data)
# 创建一个只包括第1和第2列的视图
view = df.iloc[:, [0, 1]]
print(view)
输出:
name age
0 Bob 25
1 Tom 37
2 Jerry 18
3 Mike 24
上面的代码创建了一个只包括第1和第2列的视图,我们可以看到输出的数据框中只有这两列。
3. .query方法
.query方法用于按照一些条件选择数据框的行。为了创建视图,我们需要将我们感兴趣的行的条件作为字符串传递给.query方法,然后使用它来选出我们想要的行。下面是一个例子:
import pandas as pd
data = {'name': ['Bob', 'Tom', 'Jerry', 'Mike'], 'age': [25, 37, 18, 24], 'gender':['M', 'M', 'M', 'M']}
df = pd.DataFrame(data)
# 创建一个只包括年龄大于25岁的人的视图
view = df.query('age > 25')
print(view)
输出:
name age gender
1 Tom 37 M
上面的代码创建了一个只包括年龄大于25岁的人的视图,我们可以看到输出的数据框中只有一个人。
4. .drop方法
.drop方法用于删除数据框中的行或列。为了创建视图,我们需要选择要删除的行或列,然后使用.drop方法进行删除。下面是一个例子:
import pandas as pd
data = {'name': ['Bob', 'Tom', 'Jerry', 'Mike'], 'age': [25, 37, 18, 24], 'gender':['M', 'M', 'M', 'M']}
df = pd.DataFrame(data)
# 创建一个没有'gender'列的视图
view = df.drop(['gender'], axis=1)
print(view)
输出:
name age
0 Bob 25
1 Tom 37
2 Jerry 18
3 Mike 24
上面的代码创建了一个没有’gender’列的视图,我们可以看到输出的数据框中只有’name’和’age’两列。
5. .head和.tail方法
.head方法用于选择数据框的前几行,而.tail方法则用于选择数据框的后几行。为了创建视图,我们只需要使用这两个方法来选择前几行或后几行即可。下面是一个例子:
import pandas as pd
data = {'name': ['Bob', 'Tom', 'Jerry', 'Mike'], 'age': [25, 37, 18, 24], 'gender':['M', 'M', 'M', 'M']}
df = pd.DataFrame(data)
# 创建一个包括前两行的视图
view = df.head(2)
print(view)
输出:
name age gender
0 Bob 25 M
1 Tom 37 M
上面的代码创建了一个包括前两行的视图,我们可以看到输出的数据框中只有前两行。
总结
在Pandas中,创建数据框视图有多种方法,可以选择行、列或单元格来创建视图。以上是最基本的创建数据框视图的方法,使用这些方法可以轻松创建需要的数据集。我们可以根据具体的需求选择适合的方法来创建数据框视图,并根据需要进一步处理和分析数据。