Python seaborn库
Seaborn是Python中用于可视化图形统计绘图的一种令人惊奇的库。Seaborn提供了许多颜色调色板和默认的美观样式,使Python中许多统计图更具吸引力。
Python Seaborn库的目标
Seaborn库旨在使理解和探索数据的核心部分更具吸引力。它是建立在 matplotlib 库的核心上,并提供面向数据集的API。
Seaborn还与Pandas数据结构紧密集成,通过这种方式,我们可以轻松地在给定变量的各种不同的可视化表示之间切换,以更好地理解所提供的数据集。
Python seaborn库的绘图类别
绘图通常用于可视化给定变量之间的关系。这些变量可以是类别,例如组、分区或类别,也可以是完全数值变量。我们可以使用seaborn库创建各种不同类别的绘图。
在seaborn库中,我们创建的绘图分为以下几个类别:
- 分布图: 此类型的图用于检查两种类型的分布,即,单变量和双变量分布。
- 关系图: 此类型的图用于理解两个给定变量之间的关系。
- 回归图: seaborn库中的回归图主要用于在探索性数据分析期间添加额外的视觉指导,以强调数据集的模式。
- 分类图: 分类图用于处理变量的各个类别以及如何将它们可视化。
- 多绘图网格: 多绘图网格也是一种类型的绘图,它是一种有用的方法,通过对单个数据集的不同子集绘制多个实例来绘制相同绘图。
- 矩阵图: 矩阵图是散点图的数组类型。
安装Python的seaborn库
在这里,我们将学习如何安装Python的seaborn库。安装seaborn库后,我们可以将其导入到我们的 Python程序 中,并在 Python中 使用它。
pip install seaborn
seaborn库的必需依赖项或前提条件:
我们必须拥有以下内容:
- Python已安装并具有最新版本(3.6+)。
- Numpy必须安装为1.13.3或更高版本。
- SciPy必须安装为1.0.1或更高版本。
- 必须安装panda库为0.22.0或更高版本。
- statsmodel库必须安装为0.8.0或更高版本。
- 还应安装matplotlib为2.1.2或更高版本。
现在,我们将学习如何在Python中使用seaborn库绘制一些基本图表示例。
使用seaborn库绘制图表
1. 折线图
seaborn折线图是seaborn库中最基本的图表之一。我们主要使用seaborn折线图以一种连续的方式来可视化给定的时间序列数据。
示例
# Importing seaborn library in program
import seaborn as sns
# Importing mataplotlib library to show graph in output
import matplotlib.pyplot as plt
# Setting style with set() function
sns.set(style="dark")
# Using dataset() function to declare data type
FMR = sns.load_dataset("fmri")
# Plotting various responses for different\
# Regions and events
sns.lineplot(x="timepoint",
y="signal",
hue="region",
style="event",
data=FMR) # using lineplot() function to create line plot
plt.show() # using show() function
输出:
解释: 在上述代码中,将数据集设置为fmri类型并设置线形图的样式后,我们使用 lineplot() 函数来绘制输出中的线形图。
2. Dist图
我们使用seaborn的 dist plots 绘制给定变量和数据的直方图结果。我们可以使用dist图绘制一些其他变化,如rugplot和kdeplot。
示例
# importing numpy as np library module
import numpy as np
# Importing seaborn library in program
import seaborn as sns
# Importing mataplotlib library to show graph in output
import matplotlib.pyplot as plt
# Selecting style for boxplot with set() function
sns.set(style="white")
# Generate a random univariate type distribution
ru = np.random.RandomState(10)
d = ru.normal(size=100)
# Plotting a simple histogram with kdeplot variation
sns.histplot(d, kde=True, color="m")
plot = sns.histplot(d, kde=True, color="m")
print(plot)
plt.show() # using show() function
输出:
3. Lmplot
Lmplot 是 seaborn 库中的另一个基本图表之一。Lmplot 显示了在给定的二维空间中,代表线性回归模型的线,并显示数据点。在这个二维空间中,我们可以将 x 和 y 变量分别设置为垂直和水平标签。
示例
# Importing seaborn library in program
import seaborn as sns
# Importing matplotlib library to show graph in output
import matplotlib.pyplot as plt
# Using set() function to set style
sns.set(style="ticks")
# Using dataset() function
ds = sns.load_dataset("anscombe")
# Showing results in the form of linear regression
sns.lmplot(x="x", y="y", data=ds)
plot = sns.lmplot(x="x", y="y", data=ds)
print(plot)
plt.show() # using show() function
输出:
<seaborn.axisgrid.FacetGrid object at 0x000002182DC89070>