Python Pandas – 显示每列中存在的唯一值
Python Pandas是一个非常强大的数据处理和分析库,适用于从各种数据源中收集、处理和处理数据。在这篇文章中,我们将介绍如何使用Pandas的unique()函数来查看数据中每个列存在的唯一值。
更多Pandas相关文章,请阅读:Pandas 教程
Pandas – 介绍
在我们开始讨论unique()函数之前,我们先来简单地介绍一下Pandas。Pandas是一个基于Python的数据处理和分析库,包含了许多实用的数据结构和数据操作函数,能够快速地处理大量的数据,并可以将数据导入到多种格式的文件中。
在Pandas中,数据通常被表示为DataFrame的形式,DataFrame可以看作是由多个Series组成的二维矩阵,每个Series代表了其中一列。Series表示的是一种带有标签的一维数组,其中每个元素都有一个与之相关联的标签,可以通过标签来索引。
Pandas.unique()函数
Pandas的unique()函数用于返回数组或DataFrame中不同的值。unique()函数的语法如下所示:
DataFrame.unique()
示例代码1 – 数组示例
让我们从一个简单的数组开始,使用unique()来查看其中不同的值:
import pandas as pd
arr = ['a', 'b', 'b', 'c', 'c', 'c']
uniq = pd.unique(arr)
print(uniq)
输出结果:
['a' 'b' 'c']
以上代码中,我们创建了一个简单的字符串数组,并使用Pandas的unique()函数查看数组中出现过的不同的值。结果中只剩下了’a’,’b’和’c’这三个值。
示例代码2 – DataFrame示例
下面让我们来看一个更加常用的用法,查看DataFrame中每一列的不同值。我们先来创建一个DataFrame:
import pandas as pd
data = {
'name':['Alice', 'Bob', 'Charlie', 'David', 'Emily'],
'age':[20, 25, 30, 35, 40],
'gender':['F', 'M', 'M', 'M', 'F']
}
df = pd.DataFrame(data)
print(df)
输出结果:
name age gender
0 Alice 20 F
1 Bob 25 M
2 Charlie 30 M
3 David 35 M
4 Emily 40 F
以上代码中,我们使用Python的字典类型来创建了一个包含了三列数据的DataFrame,其中包括姓名、年龄和性别。
现在,让我们使用unique()函数来查看每列中的唯一值:
import pandas as pd
data = {
'name':['Alice', 'Bob', 'Charlie', 'David', 'Emily'],
'age':[20, 25, 30, 35, 40],
'gender':['F', 'M', 'M', 'M', 'F']
}
df = pd.DataFrame(data)
for column in df.columns:
uniq = df[column].unique()
print(column, uniq)
输出结果:
name ['Alice' 'Bob' 'Charlie' 'David' 'Emily']
age [20 25 30 35 40]
gender ['F' 'M']
以上代码中,我们首先使用for循环遍历了DataFrame的每一列,并使用unique()函数来获取该列中的唯一值。对于姓名和年龄这两列来说,结果很好理解,每个姓名和年龄都是唯一的。而对于性别这一列来说,我们只有’M’和’F’两种取值。
结论
以上就是Pandas如何使用unique()函数查看DataFrame中每一列的不同值。虽然这个功能看起来很简单,但在实际的数据处理和分析中却是非常有用的。现在,你可以尝试更多的数据,使用这个函数来查看数据中每个列的不同取值,以便更好地了解数据。除此之外,Pandas还有许多其他实用的函数,可以帮助你更好地处理和分析数据。如果你正在学习数据处理和分析,Pandas是一个不错的选择,希望这篇文章对你有所帮助!