使用seaborn为数据框绘制直方图

使用seaborn为数据框绘制直方图

在本文中,我们将介绍使用Numpy和seaborn库来绘制直方图,以展示数据框中某一列的分布情况。

阅读更多:Numpy 教程

运用Numpy和seaborn绘制直方图

首先,我们需要导入Numpy和seaborn库,并将数据框中需要绘制直方图的列提取出来。假设我们有一个包含房屋信息的数据框,我们希望展示该数据框中房屋售价的分布情况。

import numpy as np
import seaborn as sns
import pandas as pd

df = pd.read_csv('house_info.csv')
house_price = df['price']

然后,我们可以使用seaborn库的distplot()函数来绘制直方图。除了展示分布情况外,我们还可以通过设置参数来调整直方图的外观。

sns.distplot(house_price, kde = False, color = 'b')

通过设置kde参数为False,我们可以关闭该函数中的核密度估计,并将直方图的bins参数设置为默认值,即自动确定分组边界。此外,我们可以通过color参数来调整直方图的颜色,这里设为蓝色。

上图展示了售价的分布情况,横轴为售价,纵轴为频数。

调整直方图的外观

我们可以通过设置更多参数来调整直方图的外观。例如,我们可以加入核密度估计线,展示售价的概率密度函数。

sns.distplot(house_price, kde = True, color = 'b')

我们还可以通过修改y轴标签,将频率更改为百分比。

sns.distplot(house_price, kde = False, color = 'b')
plt.ylabel('Percentage')
plt.show()

除此之外,我们还可以修改分组边界、调整颜色和线型、设置透明度等等。

更多实用方法

除了distplot()函数外,seaborn库还提供了许多其他有用的绘图函数。

例如,我们可以使用jointplot()函数来展示两个变量之间的分布情况。

sns.jointplot(x = 'latitude', y = 'longitude', data = df)

我们展示了房屋售价和地理位置之间的关系。

此外,seaborn库还提供了类似于箱线图的绘图函数,例如violinplot()、boxplot()和swarmplot()等等。

总结

本文介绍了使用Numpy和seaborn库来绘制直方图的方法,包括如何提取数据框中的列、如何调整直方图的参数以及其他实用的绘图函数。通过这些方法,我们可以更加清晰地展示数据的分布情况,为数据分析提供更加科学的依据。

Camera课程

Python教程

Java教程

Web教程

数据库教程

图形图像教程

办公软件教程

Linux教程

计算机教程

大数据教程

开发工具教程