Seaborn regplot()、lmplot()和residplot()之间的区别是什么

Seaborn regplot()、lmplot()和residplot()之间的区别是什么

Seaborn是一种基于matplotlib的Python数据可视化包。它提供了一个复杂的绘图工具,用于创建吸引人和教育性的统计图表。Seaborn帮助解决了Matplotlib的两个主要问题,它们是什么?

我们现在相信,教授学生使用ggplot2的方法生成这些图表,虽然需要更多的编码,但更先进、可适应和透明,将有益于学生。在这里,使用ggplot2重建了由residPlot()创建的基本图表,作为从residPlot()切换到ggplot2的资源,以帮助用户。

特征 regplot() lmplot() residplot()
目的 绘制两个变量之间的简单线性回归模型 绘制线性回归模型,同时按照另一个变量对一个变量进行分组 绘制线性回归模型的残差
可视化 散点图加上回归线和置信区间 散点图加上回归线和置信区间,具有按照另一个变量对一个变量进行分组的功能 残差的散点图,带有零参考线
实用性 用于快速可视化两个变量之间的关系和线性回归模型的拟合程度 用于可视化两个变量之间的关系和线性回归模型的拟合程度,同时考虑第三个变量的影响 用于可视化线性回归模型的残差并检查残差中的模式或结构
回归模型 简单线性回归模型 线性回归模型 线性回归模型
输出 散点图加上回归线和置信区间 散点图加上回归线和置信区间,按照第三个变量进行分组 残差的散点图,带有零参考线

seaborn.regplot()

使用seaborn.regplot()函数绘制数据和线性回归模型的拟合值。有几种选项可以用于估计回归模型,所有这些选项都是相互不兼容的。

语法

seaborn.regplot( x,  y,  data=None, x_estimator=None, x_bins=None,  
x_ci=’ci’, scatter=True, fit_reg=True, ci=95, n_boot=1000, units=None, 
order=1, logistic=False, lowess=False, robust=False, logx=False, 
x_partial=None, y_partial=None, truncate=False, dropna=True, 
x_jitter=None, y_jitter=None, label=None, color=None, marker=’o’,   
scatter_kws=None, line_kws=None, ax=None)

参数 − 以下是一些关键参数的描述 −

  • x, y − 这些是输入变量。如果是字符串,它们应与“数据”部分的列名相匹配。当使用pandas对象时,坐标轴将显示系列名称。

  • data − 这是一个数据框,其中每行表示一个观察值,每列表示一个变量。

  • lowess − 此参数接受布尔值,是可选的。如果为“True”,则使用“statsmodels”估计非参数性Lowess模型(局部加权线性回归)。

  • color − 应用于所有叙述部分的颜色。

  • marker − (可选) 用于散点图标记的符号。

返回值 − 包含绘图内容的坐标轴对象。

seaborn.Implot()

seaborn.lmplot()是Seaborn库中用于可视化两个数值变量之间关系的函数。它创建一个散点图并对数据拟合线性回归模型。这是一种方便的方式来可视化变量和回归模型之间的关系,还可以用于比较不同组或类别之间变量之间的关系。

以下是在Python中使用lmplot()函数的示例 −

import seaborn as sns
# Load the data
df = sns.load_dataset('titanic')
# Create an lmplot with fare and age as the x and y variables, and class as the hue
sns.lmplot(x='fare', y='age', hue='class', data=df)
# Show the plot
plt.show()

这将创建一个散点图,并根据类别列对数据进行线性回归模型的拟合。

lmplot()函数有几个参数可用于自定义绘图的外观和行为。一些主要的参数包括:

  • x - 用作x变量的列名。
  • y - 用作y变量的列名。
  • hue - 用于给点着色的列名。
  • data - 用于绘图的DataFrame。
  • col - 用于为每个唯一值创建子图的列名。
  • row - 用于为每个唯一值创建子图的列名。
  • fit_reg - 一个布尔值,指示是否对数据进行线性回归模型的拟合。
  • scatter_kws - 传递给scatter()函数的关键字参数的字典。
  • line_kws - 传递给plot()函数的关键字参数的字典。

    返回值 - 该方法返回具有绘图的FacetGrid对象,以供进一步调整。

seaborn.residplot()

语法

seaborn.residplot(x, y, data=None, lowess=False, x_partial=None, y_partial=None, order=1,
   robust=False, dropna=True, label=None, color=None, scatter_kws=None, line_kws=None, ax=None)

参数 − 下面给出了一些主要参数的描述 −

  • x − 预测变量的数据或“data”部分中的列名。

  • y − 响应变量的数据或“data”部分中的列名。

  • data − 包含“x”和“y”列的DataFrame。

  • lowess − (可选)使用lowess平滑器拟合剩余散点图。

  • dropna − 此参数(可选)接受布尔值。如果为True,则在拟合和绘图时忽略具有缺失数据的观测值。

结论

总之,regplot()、lmplot()和residplot()是Python库Seaborn中用于创建回归图的函数。这些图用于可视化两个变量之间的关系及其强度。

Regplot()是一个函数,它绘制数据的散点图,并拟合数据的线性回归模型。它允许您指定x和y变量、数据以及各种自定义选项,如点的颜色、大小和样式。

Lmplot()是一个函数,它将regplot()与分面图结合起来,允许您在单个图中绘制多个回归图。它允许您指定x和y变量、数据以及hue、col和row变量来创建分面图。它还允许您指定各种自定义选项,如点的颜色、大小和样式。

Residplot()是一个函数,它绘制线性回归模型的残差。它允许您指定x和y变量、数据以及各种自定义选项,如点的颜色、大小和样式。

Camera课程

Python教程

Java教程

Web教程

数据库教程

图形图像教程

办公软件教程

Linux教程

计算机教程

大数据教程

开发工具教程