如何使用 pandas 创建 DataFrame

如何使用 pandas 创建 DataFrame

参考:pandas create dataframe

在数据分析和数据科学领域,pandas 是 Python 中一个非常重要的库,它提供了高效的数据结构和数据分析工具。其中,DataFrame 是 pandas 中最核心的数据结构之一,用于处理结构化数据。本文将详细介绍如何使用 pandas 创建 DataFrame,并提供多个示例代码以帮助理解和掌握。

1. 导入 pandas 库

在开始创建 DataFrame 之前,首先需要导入 pandas 库。如果你的环境中还没有安装 pandas,可以通过 pip 安装:

pip install pandas

导入 pandas 库的代码如下:

import pandas as pd

2. 使用字典创建 DataFrame

可以通过传递字典来创建 DataFrame,字典的键将成为列名,字典的值(一个数组或列表)将成为数据。

示例代码 1

import pandas as pd

data = {
    "Column1": ["pandasdataframe.com", "example1", "example2"],
    "Column2": [10, 20, 30]
}
df = pd.DataFrame(data)
print(df)

Output:

如何使用 pandas 创建 DataFrame

3. 使用列表创建 DataFrame

除了字典,还可以通过列表的列表来创建 DataFrame。此时,需要额外传递列名。

示例代码 2

import pandas as pd

data = [
    ["pandasdataframe.com", 10],
    ["example1", 20],
    ["example2", 30]
]
columns = ["Column1", "Column2"]
df = pd.DataFrame(data, columns=columns)
print(df)

Output:

如何使用 pandas 创建 DataFrame

4. 使用 NumPy 数组创建 DataFrame

如果你在处理数值数据,使用 NumPy 数组创建 DataFrame 可以更高效。

示例代码 3

import pandas as pd
import numpy as np

data = np.array([
    ["pandasdataframe.com", 10],
    ["example1", 20],
    ["example2", 30]
])
columns = ["Column1", "Column2"]
df = pd.DataFrame(data, columns=columns)
print(df)

Output:

如何使用 pandas 创建 DataFrame

5. 从文件创建 DataFrame

pandas 支持从多种文件格式读取数据,如 CSV、Excel 等,直接创建 DataFrame。

示例代码 4

import pandas as pd

df = pd.read_csv("pandasdataframe.com_data.csv")

示例代码 5

import pandas as pd

df = pd.read_excel("pandasdataframe.com_data.xlsx")

6. 使用 Series 创建 DataFrame

如果已经有 pandas 的 Series 对象,可以直接用它们来创建 DataFrame。

示例代码 6

import pandas as pd

s1 = pd.Series(["pandasdataframe.com", "example1", "example2"])
s2 = pd.Series([10, 20, 30])

df = pd.DataFrame({
    "Column1": s1,
    "Column2": s2
})
print(df)

Output:

如何使用 pandas 创建 DataFrame

7. 设置索引

创建 DataFrame 时,可以指定索引,这对于后续的数据操作非常重要。

示例代码 7

import pandas as pd

data = {
    "Column1": ["pandasdataframe.com", "example1", "example2"],
    "Column2": [10, 20, 30]
}
index = ["Row1", "Row2", "Row3"]
df = pd.DataFrame(data, index=index)
print(df)

Output:

如何使用 pandas 创建 DataFrame

8. 使用字典列表创建 DataFrame

每个字典代表一行数据,字典的键是列名,值是数据。

示例代码 8

import pandas as pd

data = [
    {"Column1": "pandasdataframe.com", "Column2": 10},
    {"Column1": "example1", "Column2": 20},
    {"Column1": "example2", "Column2": 30}
]
df = pd.DataFrame(data)
print(df)

Output:

如何使用 pandas 创建 DataFrame

9. 多级索引

在 pandas 中,可以创建具有多级索引的 DataFrame,这对于高级数据分析非常有用。

示例代码 9

import pandas as pd

tuples = [("pandasdataframe.com", "2023"), ("example1", "2022"), ("example2", "2021")]
index = pd.MultiIndex.from_tuples(tuples, names=["Site", "Year"])
data = {"Column1": [1, 2, 3]}
df = pd.DataFrame(data, index=index)
print(df)

Output:

如何使用 pandas 创建 DataFrame

10. 空 DataFrame

有时候我们需要先创建一个空的 DataFrame,然后再逐步填充数据。

示例代码 10

import pandas as pd

df = pd.DataFrame(columns=["Column1", "Column2"])
print(df)

Output:

如何使用 pandas 创建 DataFrame

以上是使用 pandas 创建 DataFrame 的一些基本方法和示例。通过这些示例,你可以看到 pandas 在数据处理方面的灵活性和强大功能。在实际的数据分析工作中,合理地创建和使用 DataFrame 是非常关键的。

Camera课程

Python教程

Java教程

Web教程

数据库教程

图形图像教程

办公软件教程

Linux教程

计算机教程

大数据教程

开发工具教程