使用seaborn为数据框绘制直方图
在本文中,我们将介绍使用Numpy和seaborn库来绘制直方图,以展示数据框中某一列的分布情况。
阅读更多:Numpy 教程
运用Numpy和seaborn绘制直方图
首先,我们需要导入Numpy和seaborn库,并将数据框中需要绘制直方图的列提取出来。假设我们有一个包含房屋信息的数据框,我们希望展示该数据框中房屋售价的分布情况。
import numpy as np
import seaborn as sns
import pandas as pd
df = pd.read_csv('house_info.csv')
house_price = df['price']
然后,我们可以使用seaborn库的distplot()函数来绘制直方图。除了展示分布情况外,我们还可以通过设置参数来调整直方图的外观。
sns.distplot(house_price, kde = False, color = 'b')
通过设置kde参数为False,我们可以关闭该函数中的核密度估计,并将直方图的bins参数设置为默认值,即自动确定分组边界。此外,我们可以通过color参数来调整直方图的颜色,这里设为蓝色。
上图展示了售价的分布情况,横轴为售价,纵轴为频数。
调整直方图的外观
我们可以通过设置更多参数来调整直方图的外观。例如,我们可以加入核密度估计线,展示售价的概率密度函数。
sns.distplot(house_price, kde = True, color = 'b')
我们还可以通过修改y轴标签,将频率更改为百分比。
sns.distplot(house_price, kde = False, color = 'b')
plt.ylabel('Percentage')
plt.show()
除此之外,我们还可以修改分组边界、调整颜色和线型、设置透明度等等。
更多实用方法
除了distplot()函数外,seaborn库还提供了许多其他有用的绘图函数。
例如,我们可以使用jointplot()函数来展示两个变量之间的分布情况。
sns.jointplot(x = 'latitude', y = 'longitude', data = df)
我们展示了房屋售价和地理位置之间的关系。
此外,seaborn库还提供了类似于箱线图的绘图函数,例如violinplot()、boxplot()和swarmplot()等等。
总结
本文介绍了使用Numpy和seaborn库来绘制直方图的方法,包括如何提取数据框中的列、如何调整直方图的参数以及其他实用的绘图函数。通过这些方法,我们可以更加清晰地展示数据的分布情况,为数据分析提供更加科学的依据。