OpenCV-Python 理解 K-Means 聚类

在本章中,我们将了解 K-Means 聚类的概念,以及它是如何工作的,等等。

K-Means 聚类原理

我们将用一个常用的例子来解释原理。

T 恤大小问题

举个例子,有一家公司将向市场推出一种新型 T 恤。显然,他们必须制造不同尺寸的衣服,以满足各种身材的人。为此,公司收集了一份人的身高和体重的数据,并将其绘制成图表,如下所示:

K-Means 聚类原理

公司不能制作所有尺寸的 T 恤。相反,他们将人们划分为小巧、中等和高大,并且仅制造这 3 种尺寸的衣服,以满足所有人的需求。将人群分为 3 组这种事情可以用 K-Means 聚类算法来完成,并且算法能够给我们找出最合适的 3 个尺寸,让所有人满意。如果不行,公司可以将人们分成更多的组,可能是 5 组,或者其它。查看下图:

K-Means 聚类原理

如何工作的?

该算法是一个迭代过程,我们将在图像的帮助下逐步解释它。

考虑如下的一组数据(你可以将其视为 T 恤问题)。我们需要将这些数据分成两组。

K-Means 聚类原理

步骤一: 算法随机选择两个中心点 C1C2(有时,任何两个数据都可以被选为中心点)。

步骤二: 计算从每个点到两个中心点的距离。如果测试数据更接近 C1,则该数据标记为'0'。如果它更接近 C2,则标记为'1'(如果有更多中心点,标记为'2','3'等)。

在这个例子中,我们用红色标记所有的'0',用蓝色标记所有的'1'。在上述操作之后,我们得到了下图:

K-Means 聚类原理

步骤三: 接下来,我们分别计算所有蓝点和红点的平均值,这将是我们的新中心点。将 C1C2 移过去。(要记住,这个图像所显示的并不是真正的值,也不是真正的规模,它仅用于演示)。

再来一次,使用新的中心点执行步骤二,并将数据标记为'0'和'1'。

然后我们得到了如下结果:

K-Means 聚类原理

现在,迭代 步骤二步骤三,直到两个中心点收敛到固定点。*( 或者可能根据我们所给的条件停止,如最大迭代次数,或达到特定的准去率等。) 这些点使得测试数据与其对应的中心点之间的距离之和最小。 或者简单地说,C1↔红色点C2↔蓝色点 之间的距离之和最小。

K-Means 聚类原理

最终结果大概如下所示:

K-Means 聚类原理

这只是对 K-Means 聚类的直观理解。有关更多详细信息和数学解释,请阅读任何规范的机器学习教科书或阅读额外资源中的链接。这只是 K-Means 聚类的顶层。这个算法有很多修改,如如何选择初始中心点,如何加速迭代过程等。

赞(1)
未经允许不得转载:极客笔记 » OpenCV-Python 理解 K-Means 聚类

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址
OpenCV-Python介绍
OpenCV-Python 教程在Windows安装OpenCV-Python在Fedora上安装OpenCV-Python在Ubuntu系统中安装OpenCV—Python
OpenCV-Python GUI功能
OpenCV-Python图像入门OpenCV-Python视频入门OpenCV-Python绘图功能OpenCV-Python鼠标作为画笔OpenCV-Python作为调色板的跟踪栏
OpenCV-Python 核心操作
OpenCV-Python图像基本操作OpenCV-Python图像的算术运算OpenCV-Python性能测量和改进技术
OpenCV-Python 图像处理
OpenCV-Python改变颜色空间OpenCV-Python图像的几何变换OpenCV-Python图像阈值OpenCV-Python平滑图像OpenCV-Python形态转换OpenCV-Python图像梯度OpenCV-Python Canny边缘检测OpenCV-Python图像金字塔OpenCV-Python轮廓入门OpenCV-Python轮廓特征OpenCV-Python轮廓属性OpenCV-Python更多轮廓功能OpenCV-Python轮廓层次结构OpenCV-Python直方图-查找,绘图,分析OpenCV-Python直方图均衡OpenCV-Python 2D直方图OpenCV-Python直方图反投影OpenCV-Python图像转换OpenCV-Python模板匹配OpenCV-Python霍夫线变换OpenCV-Python霍夫圆变换OpenCV-Python基于分水岭算法的图像分割OpenCV-Python基于 GrabCut 算法的交互式前景提取
OpenCV-Python 特征检测
OpenCV-Python理解特征OpenCV-Python Harris 角点检测OpenCV-Python Shi-Tomasi 角点检测和追踪的良好特征OpenCV-Python SIFT 简介(尺度不变特征变换)OpenCV-Python SURF 简介(加速鲁棒特性)OpenCV-Python角点检测的 FAST 算法OpenCV-Python BRIEF(二进制鲁棒独立基本特征)OpenCV-Python ORB算法OpenCV-Python特征匹配OpenCV-Python特征匹配+单应性查找对象
OpenCV-Python 视频分析
OpenCV-Python Meanshift 和 CamshiftOpenCV-Python光流OpenCV-Python背景减法
OpenCV-Python 相机校准和3D重建
OpenCV-Python相机校准OpenCV-Python姿势估计OpenCV-Python线性几何OpenCV-Python立体图像的深度图
OpenCV-Python 机器学习
OpenCV-Python K-最近邻算法OpenCV-Python 使用 kNN 进行手写识别OpenCV-Python 理解 SVMOpenCV-Python 使用 SVM 进行手写数据识别OpenCV-Python 理解 K-Means 聚类OpenCV-Python 中的 K-Means 聚类
OpenCV-Python 计算摄影
OpenCV-Python 图像去噪OpenCV-Python 图像修复OpenCV-Python 高动态范围(HDR)