Python – 用Matplotlib为Pandas数据框绘制饼状图?

Python – 用Matplotlib为Pandas数据框绘制饼状图?

在数据可视化的领域,Matplotlib作为Python中最常用的绘图库之一,可以轻松地为数据框绘制各种各样的可视化图表。其中,饼状图是一种非常常见的图表类型,可以用来展示一个数据集的占比情况。本文将会讲解如何使用Matplotlib为Pandas数据框绘制饼状图,并提供Python代码示例和实际应用场景。

步骤 1:导入需要的库并读取数据集

在绘制饼状图之前,我们需要使用Pandas库读取并处理我们需要绘制的数据集,同时还需要导入Matplotlib库以生成图表。在此,我们使用Python内置的“wages.csv”数据集,其中包含了休斯敦市13个超市的工资数据。

# 导入需要的库
import pandas as pd
import matplotlib.pyplot as plt

# 读取数据集
df = pd.read_csv('wages.csv', index_col='Name')

# 查看前5行数据
df.head()

可以看到,数据集中包含了每个超市员工的姓名、性别、年龄、职位、出生日期、雇佣日期、工资等信息。我们将使用其中的“工资”列来绘制饼状图。

步骤 2:创建数据缩影,计算各种类的数量

在绘制饼状图之前,我们需要创建一个包含数据缩影的新数据框,该缩影包含各种类的数量。在这种情况下,“种类”指的是不同的工资范围。

# 创建缩影
wages_counts = df['Wages'].value_counts()

# 查看各种类数量
print(wages_counts)

可以看到,我们计算出了各种工资范围的数量。在此示例中,我们可以看到有14个工资范围。

步骤 3:绘制饼状图

有了包含各种类数量的缩影后,我们可以使用Matplotlib来绘制饼状图。我们首先设置一些绘图参数,然后使用 plt.pie() 函数来绘制饼状图。以下是示例代码。

# 设置绘图参数
labels = wages_counts.index
sizes = wages_counts.values

# 绘制饼状图
plt.pie(sizes, labels=labels, autopct='%1.1f%%', shadow=True, startangle=140)
plt.axis('equal')
plt.show()

上述代码将绘制一个简单的饼状图。在此示例中,我们使用了常用的参数 – labels (标签),sizes (数量),autopct (自动百分比),shadow (阴影效果) 和 startangle (起始角度)。

步骤 4:完整示例代码

最终,我们可以将上述示例代码结合起来,得到完整的代码示例。

# 导入需要的库
import pandas as pd
import matplotlib.pyplot as plt

# 读取数据集
df = pd.read_csv('wages.csv', index_col='Name')

# 创建缩影
wages_counts = df['Wages'].value_counts()

# 设置绘图参数
labels = wages_counts.index
sizes = wages_counts.values

# 绘制饼状图
plt.pie(sizes, labels=labels, autopct='%1.1f%%', shadow=True, startangle=140)
plt.axis('equal')
plt.show()

结论

在本文中,我们学习了如何使用Matplotlib为Pandas数据框绘制饼状图。我们首先使用Pandas读取和处理数据集,然后计算各种类的数量并创建绘图所需的数据缩影。最后,我们使用Matplotlib绘制饼状图,并设置标签、数量、百分比、阴影和起始角度等参数进行美化。通过这些步骤,我们可以轻松地为Pandas数据框绘制各种饼状图,并展示各种类别的占比情况。

Camera课程

Python教程

Java教程

Web教程

数据库教程

图形图像教程

办公软件教程

Linux教程

计算机教程

大数据教程

开发工具教程