Pandas 简介

Python是世界上最流行的编程语言之一。由于Python的语法非常易学和易写，与其他编程语言相比，可以用更少的代码行完成大量任务。Python的许多内置库帮助我们在机器学习、数据科学、数据可视化等各个领域创建应用程序和模型。

有一个名为Pandas的库将被详细讨论。请继续阅读以了解更多有关该库的信息。

Pandas

你们中的许多人可能听说过数据科学和数据分析，对吧？这个库可以帮助我们轻松高效地处理数据。这是一个开源库，提供了各种数据结构和方法，用于操作数值数据和时间序列。

简而言之，Pandas帮助我们处理混乱的数据集，使其更易读和有关。

开始使用Pandas

首先，重要的是要知道它是否已安装在Python文件夹中。如果没有安装，可以使用pip命令进行安装。在终端中，使用cd命令定位到文件夹后，输入“pip install pandas”。

安装完成后，导入这个库是必要的。为了导入模块，在Python代码空间中输入以下内容：

import pandas as pd

在这里，“pd”用于在以后的代码中使用该模块时，我们可以简单地使用pd.来调用Pandas提供的功能。这不是强制性的，但在我们想要快速输入并得到相同结果时很有帮助！

我们知道Python中存在各种数据结构，如列表、元组和字典。而对于Pandas模块，我们还可以获得两个附加的数据结构，以使我们在处理和组织数据时更加便利。 Series和DataFrame 是该库提供的两种数据结构。让我们详细讨论各种数据结构：

Series

它是一个可以容纳各种数据类型（如整数、浮点数、字符串等）的一维数组。索引方式类似于普通列表。显示任何系列时，它就像Excel表格中的一列。

我们可以从现有文件创建一个Series。无论是CSV文件、SQL数据库、Excel文件还是来自Python程序的列表、元组等。

示例

以下是一个Python演示代码：

import pandas as pd
import numpy as np
ser = pd.Series()                         
arr = np.array([1,2,3,4,5])
ser = pd.Series(arr)
print(ser)

在这个源代码中，我们将一个数字数组转换成Series数据类型。

输出

以下代码的输出如下：

0        1
1    2
2    3
3    4
4    5
dtype: int64

正如之前提到的，索引与Python中的标准列表类似，从0开始。’dtype’表示Series中包含的数据类型。

DataFrame

这是数据的二维表格表示形式。行和列被很好地排列，就像在Excel电子表格中的数据一样。在DataFrame中，有实际的数据、行和列。

要创建一个DataFrame，可以使用预先存在的文件，如CSV文件或Excel文件，以及SQL数据库。

在Python CodeSpace中可以使用预先存在的数据来创建DataFrame！下面的源代码就说明了这一点：

示例

import pandas as pd
int_list = [1,2,3,4,5]
data_fr = pd.DataFrame(int_list)
print(data_fr)

在第一行中，我们导入了非常重要的Pandas库。在这里，我们有一个预先存在的列表，我们刚刚将其转换为DataFrame数据类型。以下代码的输出为：

输出

如我们所观察到的那样，元素的索引与Series数据类型和列表类似。下面是DataFrame的另一个示例：

示例

import pandas as pd
stats = {“Messi”:[400,500,600], “Ronaldo”:[87,350,761]}
chart = pd.DataFrame(stats)
print(chart)

在这里，我们已经使用了一个预先存在的字典数据类型。输出将是：

输出

Messi   Ronaldo
0    400     87
1    500     350
2    600     761

我们看到的数据比以前的字典更加组织得很好。这些数据类型在组织数据方面做得非常出色，因此使得我们很容易地研究数据。

Pandas 简介

Pandas 简介

Pandas

开始使用Pandas

Series

示例

输出

DataFrame

示例

输出

示例

输出

Camera课程

Python教程

Java教程

Web教程

数据库教程

图形图像教程

办公软件教程

Linux教程

计算机教程

大数据教程

开发工具教程

Pandas 精选笔记

回顶部