Pandas 如何将字典转换为Pandas数据帧

在本文中，我们将介绍Pandas如何将Python字典（dictionary）转换为Pandas数据帧（dataframe）。

字典转换为数据帧

在Pandas中有一个非常实用的函数叫做pd.DataFrame()，它可以让我们很方便地把字典转换为数据帧。这个函数接收一个字典作为输入参数，然后将它转换为数据帧。下面是一个例子：

import pandas as pd

# 定义一个字典
my_dict = {'name': ['John', 'Jessica', 'Scott'],
           'age': [28, 23, 45],
           'gender': ['M', 'F', 'M']}

# 将字典转换为数据帧
df = pd.DataFrame(my_dict)

# 查看数据帧
print(df)

执行这段代码，可以得到以下输出：

      name  age gender
0     John   28      M
1  Jessica   23      F
2    Scott   45      M

数据帧中的索引

当Pandas将字典转换为数据帧时，默认情况下会为每条记录生成一个索引（index），这个索引从0开始，以1递增。在上面的例子中，我们可以看到每行数据前有一个数字，这就是索引。

我们也可以在将字典转换为数据帧时指定索引列。例如，下面的代码将“name”列作为索引：

# 将name列作为索引
df2 = pd.DataFrame(my_dict, index=my_dict['name'])

# 查看数据帧
print(df2)

输出如下：

           name  age gender
John       John   28      M
Jessica  Jessica   23      F
Scott     Scott   45      M

指定列顺序

当我们将字典转换为数据帧时，默认情况下列的顺序与字典中指定的顺序是一致的。我们可以通过传递列名的有序列表来指定列的顺序。

# 指定列的顺序
df3 = pd.DataFrame(my_dict, columns=['name', 'gender', 'age'])

# 查看数据帧
print(df3)

输出如下：

      name gender  age
0     John      M   28
1  Jessica      F   23
2    Scott      M   45

注意，由于我们指定了列的顺序，所有在原始字典中没有指定的列都会在数据帧中出现，但它们的值都是NaN。

重命名列

当我们将字典转换为数据帧时，列名与字典中指定的键的名称是一致的。我们可以使用DataFrame.rename()方法来重命名列。

# 重命名列
df4 = pd.DataFrame(my_dict).rename(columns={'name': 'full_name', 'gender': 'sex'})

# 查看数据帧
print(df4)

输出如下：

  full_name  age sex
0      John   28   M
1   Jessica   23   F
2     Scott   45   M

处理缺失值

当字典转换为数据帧时，如果字典中的某些值是缺失值（例如None或NaN），那么这些值将会变成数据帧中的缺失值。Pandas使用numpy.nan表示缺失值。

# 指定字典的缺失值
my_dict_with_nan = {'name': ['John', 'Jessica', None],
                    'age': [28, 23, 45],
                    'gender': ['M', 'F', 'M']}

# 将字典转换为数据帧
df5 = pd.DataFrame(my_dict_with_nan)

# 查看数据帧
print(df5)

输出如下：

      name  age gender
0     John   28      M
1  Jessica   23      F
2     None   45      M

我们可以使用DataFrame.fillna()方法来处理缺失值。例如，我们可以把缺失值填充为0。

# 处理缺失值
df6 = df5.fillna(0)

# 查看数据帧
print(df6)

输出如下：

      name  age gender
0     John   28      M
1  Jessica   23      F
2        0   45      M

总结

在本文中，我们介绍了Pandas如何将字典转换为数据帧，并介绍了如何处理索引、指定列顺序、重命名列和处理缺失值。通过这些操作，我们可以方便地将Python中的数据转换为Pandas数据帧进行统计分析和数据可视化。

Pandas 如何将字典转换为Pandas数据帧

Pandas 如何将字典转换为Pandas数据帧

字典转换为数据帧

数据帧中的索引

指定列顺序

重命名列

处理缺失值

总结

Camera课程

Python教程

Java教程

Web教程

数据库教程

图形图像教程

办公软件教程

Linux教程

计算机教程

大数据教程

开发工具教程

回顶部