Python – 如何从Pandas DataFrame选择一列
Pandas是一个数据处理库,其中DataFrame类是数据处理中的常用工具。当我们用Pandas读取并操作数据时,操作DataFrame中的列是一个基本操作。本文将介绍如何使用Pandas从DataFrame中选择一列。
更多Pandas相关文章,请阅读:Pandas 教程
基本操作
在Pandas中,可以使用两种方法来选择DataFrame中的某个列:使用中括号[]
,或使用点 .
。
下面是一个简单的示例代码,创建了一个DataFrame并选取其中一列:
import pandas as pd
df = pd.DataFrame({
'name': ['Alice', 'Bob', 'Charlie', 'David'],
'age': [25, 45, 37, 19],
'city': ['A', 'B', 'C', 'A']
})
name_column = df['name']
print(name_column)
输出结果为:
0 Alice
1 Bob
2 Charlie
3 David
Name: name, dtype: object
我们还可以使用点操作符来选择一列:
name_column = df.name
print(name_column)
输出结果一样:
0 Alice
1 Bob
2 Charlie
3 David
Name: name, dtype: object
多列选择
当需要选择DataFrame中的多列时,可以在中括号中传递列名的列表:
selected_cols = df[['name', 'city']]
print(selected_cols)
输出结果为:
name city
0 Alice A
1 Bob B
2 Charlie C
3 David A
使用.
方式也可以选择多列,但必须先将列表转换为元组:
selected_cols = df.loc[:, ('name', 'city')]
print(selected_cols)
输出结果一样:
name city
0 Alice A
1 Bob B
2 Charlie C
3 David A
总结
本文介绍了如何使用Pandas从DataFrame中选择一列或多列。对于需要处理大量数据的数据分析人员来说,这是一种非常基础的操作。希望本文能够提供一个简单的入门指南。