聚类

<< Click to Display Table of Contents >>

当前位置:  深度分析 > 实验功能使用 > 节点 > 算法 

聚类

复制链接

聚类的目的是将一系列点分成若干类,事先是没有类别的,会输出离散数据,评价方法是互信息、轮廓系数。

聚类是一种无监督学习,算法使用的训练数据中的标签信息是未知的,目标是通过对无标记的训练样本的学习来揭示内在的性质和规律。聚类过程能够自动地形成簇结构,但是簇对应的概念语意需要由使用者来决定。聚类既能作为一个单独的过程,用于寻找数据的内在分布结构,也可以作为分类等其他学习任务的前驱过程。

应用场景:

员工离职分析

用户画像分析

产品支持的聚类为K-Means聚类。

可参考案例员工离职率分析