Python 创建 DataFrame
概述
DataFrame 是 Pandas 库中最重要的数据结构,它是二维带标签的数据结构,可以用于存储和分析各种类型的数据。它类似于电子表格或 SQL 中的表格,每列可以存储不同类型的数据(例如整数、浮点数、字符串等),每行具有唯一的行索引。DataFrame 提供了丰富的功能,可以对数据进行选择、过滤、操作和分析。
本文将详细介绍如何使用 Python 创建 DataFrame,并涵盖以下主题:
- 使用 Python 中的列表创建 DataFrame
- 使用 Python 中的字典创建 DataFrame
- 使用外部数据创建 DataFrame
使用 Python 中的列表创建 DataFrame
要创建一个简单的 DataFrame,可以使用 Python 中的列表。
下面是一个使用列表创建 DataFrame 的示例代码:
import pandas as pd
data = [['Alice', 25],
['Bob', 30],
['Charlie', 35]]
df = pd.DataFrame(data, columns=['Name', 'Age'])
print(df)
运行结果:
Name Age
0 Alice 25
1 Bob 30
2 Charlie 35
在上面的示例中,我们首先导入了 pandas 库,并定义了一个包含列表的变量 data
。然后,我们使用 pd.DataFrame()
函数并传入列表和列名来创建 DataFrame。最后,我们使用 print()
函数打印 DataFrame 的内容。
这里的 data
列表有三个元素,每个元素都是一个包含名字和年龄的列表。我们还指定了 columns
参数,用于指定 DataFrame 中列的名称。最终的 DataFrame 包含两列 "Name"
和 "Age"
。
使用 Python 中的字典创建 DataFrame
除了使用列表,我们还可以使用字典来创建 DataFrame。
下面是一个使用字典创建 DataFrame 的示例代码:
import pandas as pd
data = {'Name': ['Alice', 'Bob', 'Charlie'],
'Age': [25, 30, 35]}
df = pd.DataFrame(data)
print(df)
运行结果:
Name Age
0 Alice 25
1 Bob 30
2 Charlie 35
在上面的示例中,我们定义了一个字典变量 data
,它包含了两个键值对。字典的键作为 DataFrame 的列名,而字典的值作为列中的数据。我们使用 pd.DataFrame()
函数并传入字典来创建 DataFrame。最终的 DataFrame 结构与使用列表创建的 DataFrame 相同。
使用外部数据创建 DataFrame
除了使用列表和字典创建 DataFrame,我们还可以使用外部数据创建 DataFrame。Pandas 支持从多种数据源创建 DataFrame,包括 CSV 文件、Excel 文件、数据库等。
下面是一个使用 CSV 文件创建 DataFrame 的示例代码:
import pandas as pd
df = pd.read_csv('data.csv')
print(df)
假设我们有一个名为 data.csv
的 CSV 文件,其中包含以下数据:
Name,Age
Alice,25
Bob,30
Charlie,35
运行上述代码将读取 data.csv
文件中的数据,并将其转换为 DataFrame。然后使用 print()
函数打印 DataFrame 的内容。
总结
DataFrame 是 Pandas 库中最重要的数据结构,它提供了强大的功能来处理和分析数据。本文介绍了如何使用 Python 创建 DataFrame,并包括使用列表、字典以及外部数据创建 DataFrame 的示例代码。通过学习这些基础知识,您将能够更好地利用 Pandas 进行数据处理和分析工作。