Python 如何在Seaborn中为每个分组添加回归线
Seaborn提供的最有用的工具之一是能够在散点图中添加回归线。回归线可以帮助分析两个变量之间的关系,并识别数据中的趋势。
在本文中,我们将学习如何在Python的Seaborn中为每个分组添加回归线。Seaborn有多种方法可以制作两个数字之间的散点图。例如,为了制作我们需要的图,我们可以使用lmplot()函数。
Seaborn
Seaborn是一个基于统计学的Python库,用于制作图表。它构建在matplotlib之上,并且与Pandas的数据结构高效地配合工作。Seaborn帮助您查看数据并弄清其含义。其绘图函数适用于包含整个数据集的数组和数据帧,并执行统计聚合和语义映射,以制作有用的图。
其声明式API基于数据集,因此您可以专注于绘图的不同部分的含义,而不是如何绘制它们。Seaborn致力于使可视化数据成为查看和理解数据的主要方法。它为我们提供了专注于数据集的API,因此我们可以在不同的变量表示方式之间进行切换,以更好地理解数据集。
回归线
回归线是一条显示一组数据随时间变化的线。换句话说,它显示了给定数据的最佳趋势。
当进行预测时,回归线非常有用。它的目标是解释因变量(y变量)与一个或多个自变量(x变量)之间的关系。
如果我们将独立的变量放入回归线方程中,我们可以预测因变量在未来的行为。这种类型的线主要与散点图一起使用。
散点图
散点图用于按重要性分组项目,这可以帮助您在图表中更好地理解它们。它们可以制作二维图形,并在使用色调、大小和样式参数的含义时映射三个以上的变量。所有这些参数控制用于区分不同子集的视觉和语义信息。使用冗余语义可以使图表更易于理解。
散点图和回归线
散点图和回归线比较一个变量的值与另一个变量的值。通过观察点的模式或其相互之间的接近程度,我们可以找出这两个变量之间的关系。另一方面,只有在研究的变量之间似乎存在强有力的联系时,回归线才会连接它们。散点图可以给出关系的一个想法,但为了确保准确,我们还可以进行假设检验。散点图和回归线可以用于确定任何(x,y)对是否为异常值,预测在特定x值下的y,以及估计在特定x值下的平均y。
它没有告诉我们x和y彼此之间的关系。x和y之间的潜在关系可能是因果关系,也可能不是,相关性绝不表示有因果关系。
使用Seaborn为每个分组添加回归线
我们可以使用以下方法:
Seaborn有多种方法可以绘制两个数字之间的散点图。我们可以使用lmplot(),regplot()和scatterplot()函数在Seaborn中绘制散点图。但是它们在如何在散点图上添加回归线方面并不相同。
首先,我们将看两种在Seaborn中为散点图添加简单回归线的方法。要添加单个回归线,我们将使用lmplot()和regplot()函数。当你有一组具有第三种分类变量的数据时,为每个组添加回归线可能会有帮助。
使用Seaborn和lmplot()为每个组添加回归线
在散点图中,我们将使用lmplot()函数为每个组添加回归线。
示例
import seaborn
# load data
pg = seaborn.load_dataset('penguins')
# use lmplot
import matplotlib.pyplot as pltt
seaborn.lmplot(x="bill_length_mm",
y="flipper_length_mm",
hue="species",
markers='*',
data=pg,
height=6)
pltt.xlabel("Bill Length (mm)")
pltt.ylabel("Flipper Length (mm)")
输出
使用Seaborn的regplot()函数为每个组添加回归线
在散点图中,我们将使用regplot()函数为每个组添加回归线。
示例
import seaborn
pg = seaborn.load_dataset('penguins')
# use lmplot
import matplotlib.pyplot as pltt
seaborn.regplot(x="bill_length_mm",
y="flipper_length_mm",
data=pg,
)
pltt.xlabel("Bill Length (mm)")
pltt.ylabel("Flipper Length (mm)")
输出
结论
在本文中,我们了解到回归线通过使用x和y变量进行预测。我们了解到回归线主要是在使用Python的Seaborn库的散点图中使用的。我们还发现,在seaborn中主要有两种方法可以向散点图添加回归线,它们是regplot() 和 lmplot()。