Pandas 从列表创建DataFrame
Pandas DataFrame是一个二维表格,具有行和列,一旦创建就无法更改。使用列表从头创建DataFrame是数据科学和信息技术中常见的任务。列表是一个有序的元素集合,是Python中最常用的数据结构之一。列表可以存储任何类型的值,如数字、字符串和布尔值。
在本文档中,我将提供详细的说明,介绍如何使用逐步说明、代码片段和各个子部分的解释来从列表创建Pandas DataFrame的真实示例。
DataFrame和列表之间的关键区别是什么
列表是Python中的一种基本数据结构,可以容纳任何数据类型的元素集合,而DataFrame是一种类似于电子表格或SQL表格的二维表格结构,将数据存储在行和列中。下面是DataFrame和列表之间的一些关键区别:
- 结构 - 列表是一个简单的一维值集合,而DataFrame是一个具有行和列的类似于表格的二维结构。
-
数据类型 - 列表可以容纳任何数据类型的元素,包括数字、字符串,甚至其他列表,而DataFrame设计用于以表格格式存储数据,具有特定数据类型的列,例如整数、浮点数和字符串。
-
大小 - 列表可以容纳任意数量的元素,而DataFrame通常设计用于容纳大量数据,可能有数百万行和列。
-
操作 - 列表支持基本操作,如索引、切片和追加,而DataFrame支持更复杂的操作,如过滤、连接和分组。
-
数据操作 - 列表提供基本的数据操作功能,而DataFrame提供强大的数据操作工具,如根据特定条件过滤、排序和汇总数据。
先决条件
在我们开始这个任务之前,您的系统上应该安装了以下几点:
推荐的设置列表如下:
- pip install pandas, bokeh
-
预计用户将可以访问任何独立的IDE,如VS-Code、PyCharm、Atom或Sublime Text。
-
也可以使用在线的Python编译器,如Kaggle.com、Google Cloud平台或其他任何编译器。
-
使用更新版本的Python。目前我使用的是3.10.9版本。
-
熟悉使用Jupyter笔记本的方法。
-
具备虚拟环境的知识和应用将会有益,但不是必需的。
-
预计使用者对统计学和数学有良好的理解。
所需步骤
导入库
要在Pandas中创建一个DataFrame,我们需要导入Pandas库。以下代码用于导入Pandas库:
import pandas as pd
创建列表
在我们使用列表创建DataFrame之前,我们首先需要创建列表来存储数据。在本节中,我将向您展示如何使用简单的数据和真实世界的示例创建列表。
创建一个名字列表
names = ['John', 'Mary', 'Peter', 'Jane', 'Daniel']
在上述代码片段中,我们创建了一个名为 names
的列表,其中包含了五个字符串值,表示个人的姓名。
创建一个年龄列表
ages = [32, 25, 41, 29, 36]
在上面的代码片段中,我们创建了一个名为ages
的列表,其中包含了五个整数值,表示个人的年龄。
创建一个布尔值列表
current_status = [True, False, True, False, True]
在上面的代码片段中,我们创建了一个名为current_status
的列表,其中包含五个布尔值,表示个体的当前状态。
从列表创建DataFrame
一旦我们有了包含数据的列表,我们可以使用pd.DataFrame()
函数在Pandas中创建一个DataFrame。我们可以将列表作为参数传递给pd.DataFrame()
函数。以下代码用于从列表创建DataFrame:
df = pd.DataFrame(list(zip(names, ages, current_status)), columns=['Name', 'Age', 'Current_Status'])
在上面的代码片段中,我们首先使用zip()
函数创建了一个元组列表。zip()
函数将这些列表合并为一个元组列表。然后我们将这个元组列表作为第一个参数传递给pd.DataFrame()
函数。
pd.DataFrame()
函数的第二个参数是DataFrame的列名列表。在这个示例中,我们使用columns=['Name', 'Age', 'Current_Status']
将列名指定为Name
,Age
和Current_Status
。
查看DataFrame
创建DataFrame后,我们可以使用.head()
函数来查看DataFrame的前几行。以下代码用于显示DataFrame的前几行 –
print(df.head())
在上面的代码片段中,我们使用了.head()
函数来显示DataFrame的前几行。
输出
Name Age Current_Status
0 John 32 True
1 Mary 25 False
2 Peter 41 True
3 Jane 29 False
4 Daniel 36 True
在上面的输出中,我们可以看到从列表创建数据帧。
结论
在本文档中,我提供了一个逐步指南,介绍了如何从列表创建Pandas DataFrame。我演示了如何导入Pandas库,创建列表,以及如何使用pd.DataFrame()
函数创建DataFrame。此外,我展示了如何使用.head()
函数查看DataFrame的前几行。按照这些说明,您现在应该能够从列表创建具有现实世界示例的Pandas DataFrame。