Python 创建 DataFrame

Python 创建 DataFrame

Python 创建 DataFrame

概述

DataFrame 是 Pandas 库中最重要的数据结构,它是二维带标签的数据结构,可以用于存储和分析各种类型的数据。它类似于电子表格或 SQL 中的表格,每列可以存储不同类型的数据(例如整数、浮点数、字符串等),每行具有唯一的行索引。DataFrame 提供了丰富的功能,可以对数据进行选择、过滤、操作和分析。

本文将详细介绍如何使用 Python 创建 DataFrame,并涵盖以下主题:

  1. 使用 Python 中的列表创建 DataFrame
  2. 使用 Python 中的字典创建 DataFrame
  3. 使用外部数据创建 DataFrame

使用 Python 中的列表创建 DataFrame

要创建一个简单的 DataFrame,可以使用 Python 中的列表。

下面是一个使用列表创建 DataFrame 的示例代码:

import pandas as pd

data = [['Alice', 25], 
        ['Bob', 30], 
        ['Charlie', 35]]

df = pd.DataFrame(data, columns=['Name', 'Age'])

print(df)

运行结果:

      Name  Age
0    Alice   25
1      Bob   30
2  Charlie   35

在上面的示例中,我们首先导入了 pandas 库,并定义了一个包含列表的变量 data。然后,我们使用 pd.DataFrame() 函数并传入列表和列名来创建 DataFrame。最后,我们使用 print() 函数打印 DataFrame 的内容。

这里的 data 列表有三个元素,每个元素都是一个包含名字和年龄的列表。我们还指定了 columns 参数,用于指定 DataFrame 中列的名称。最终的 DataFrame 包含两列 "Name""Age"

使用 Python 中的字典创建 DataFrame

除了使用列表,我们还可以使用字典来创建 DataFrame。

下面是一个使用字典创建 DataFrame 的示例代码:

import pandas as pd

data = {'Name': ['Alice', 'Bob', 'Charlie'],
        'Age': [25, 30, 35]}

df = pd.DataFrame(data)

print(df)

运行结果:

      Name  Age
0    Alice   25
1      Bob   30
2  Charlie   35

在上面的示例中,我们定义了一个字典变量 data,它包含了两个键值对。字典的键作为 DataFrame 的列名,而字典的值作为列中的数据。我们使用 pd.DataFrame() 函数并传入字典来创建 DataFrame。最终的 DataFrame 结构与使用列表创建的 DataFrame 相同。

使用外部数据创建 DataFrame

除了使用列表和字典创建 DataFrame,我们还可以使用外部数据创建 DataFrame。Pandas 支持从多种数据源创建 DataFrame,包括 CSV 文件、Excel 文件、数据库等。

下面是一个使用 CSV 文件创建 DataFrame 的示例代码:

import pandas as pd

df = pd.read_csv('data.csv')

print(df)

假设我们有一个名为 data.csv 的 CSV 文件,其中包含以下数据:

Name,Age
Alice,25
Bob,30
Charlie,35

运行上述代码将读取 data.csv 文件中的数据,并将其转换为 DataFrame。然后使用 print() 函数打印 DataFrame 的内容。

总结

DataFrame 是 Pandas 库中最重要的数据结构,它提供了强大的功能来处理和分析数据。本文介绍了如何使用 Python 创建 DataFrame,并包括使用列表、字典以及外部数据创建 DataFrame 的示例代码。通过学习这些基础知识,您将能够更好地利用 Pandas 进行数据处理和分析工作。

Camera课程

Python教程

Java教程

Web教程

数据库教程

图形图像教程

办公软件教程

Linux教程

计算机教程

大数据教程

开发工具教程