<< Click to Display Table of Contents >> 聚类复制链接 |
聚类的目的是将一系列点分成若干类,事先是没有类别的,会输出离散数据,评价方法是互信息、轮廓系数。
聚类是一种无监督学习,算法使用的训练数据中的标签信息是未知的,目标是通过对无标记的训练样本的学习来揭示内在的性质和规律。聚类过程能够自动地形成簇结构,但是簇对应的概念语意需要由使用者来决定。聚类既能作为一个单独的过程,用于寻找数据的内在分布结构,也可以作为分类等其他学习任务的前驱过程。
应用场景:
•员工离职分析
•用户画像分析
产品支持的聚类为K-Means聚类。
可参考案例员工离职率分析。