Python Pandas – 显示每列中存在的唯一值

Python Pandas – 显示每列中存在的唯一值

Python Pandas是一个非常强大的数据处理和分析库,适用于从各种数据源中收集、处理和处理数据。在这篇文章中,我们将介绍如何使用Pandas的unique()函数来查看数据中每个列存在的唯一值。

更多Pandas相关文章,请阅读:Pandas 教程

Pandas – 介绍

在我们开始讨论unique()函数之前,我们先来简单地介绍一下Pandas。Pandas是一个基于Python的数据处理和分析库,包含了许多实用的数据结构和数据操作函数,能够快速地处理大量的数据,并可以将数据导入到多种格式的文件中。

在Pandas中,数据通常被表示为DataFrame的形式,DataFrame可以看作是由多个Series组成的二维矩阵,每个Series代表了其中一列。Series表示的是一种带有标签的一维数组,其中每个元素都有一个与之相关联的标签,可以通过标签来索引。

Pandas.unique()函数

Pandas的unique()函数用于返回数组或DataFrame中不同的值。unique()函数的语法如下所示:

DataFrame.unique()

示例代码1 – 数组示例

让我们从一个简单的数组开始,使用unique()来查看其中不同的值:

import pandas as pd

arr = ['a', 'b', 'b', 'c', 'c', 'c']
uniq = pd.unique(arr)
print(uniq)

输出结果:

['a' 'b' 'c']

以上代码中,我们创建了一个简单的字符串数组,并使用Pandas的unique()函数查看数组中出现过的不同的值。结果中只剩下了’a’,’b’和’c’这三个值。

示例代码2 – DataFrame示例

下面让我们来看一个更加常用的用法,查看DataFrame中每一列的不同值。我们先来创建一个DataFrame:

import pandas as pd

data = {
    'name':['Alice', 'Bob', 'Charlie', 'David', 'Emily'],
    'age':[20, 25, 30, 35, 40],
    'gender':['F', 'M', 'M', 'M', 'F']
}

df = pd.DataFrame(data)
print(df)

输出结果:

       name  age gender
0     Alice   20      F
1       Bob   25      M
2   Charlie   30      M
3     David   35      M
4     Emily   40      F

以上代码中,我们使用Python的字典类型来创建了一个包含了三列数据的DataFrame,其中包括姓名、年龄和性别。

现在,让我们使用unique()函数来查看每列中的唯一值:

import pandas as pd

data = {
    'name':['Alice', 'Bob', 'Charlie', 'David', 'Emily'],
    'age':[20, 25, 30, 35, 40],
    'gender':['F', 'M', 'M', 'M', 'F']
}

df = pd.DataFrame(data)

for column in df.columns:
    uniq = df[column].unique()
    print(column, uniq)

输出结果:

name ['Alice' 'Bob' 'Charlie' 'David' 'Emily']
age [20 25 30 35 40]
gender ['F' 'M']

以上代码中,我们首先使用for循环遍历了DataFrame的每一列,并使用unique()函数来获取该列中的唯一值。对于姓名和年龄这两列来说,结果很好理解,每个姓名和年龄都是唯一的。而对于性别这一列来说,我们只有’M’和’F’两种取值。

结论

以上就是Pandas如何使用unique()函数查看DataFrame中每一列的不同值。虽然这个功能看起来很简单,但在实际的数据处理和分析中却是非常有用的。现在,你可以尝试更多的数据,使用这个函数来查看数据中每个列的不同取值,以便更好地了解数据。除此之外,Pandas还有许多其他实用的函数,可以帮助你更好地处理和分析数据。如果你正在学习数据处理和分析,Pandas是一个不错的选择,希望这篇文章对你有所帮助!

Camera课程

Python教程

Java教程

Web教程

数据库教程

图形图像教程

办公软件教程

Linux教程

计算机教程

大数据教程

开发工具教程

Pandas 教程