<< Click to Display Table of Contents >> 相关性分析 |
相关分析(correlation analysis)是研究现象之间是否存在某种依存关系,并对具体有依存关系的现象探讨其相关方向以及相关程度,是研究随机变量之间的相关关系的一种统计方法。 相关性度量有三种计算方法:Pearson,Kendall,Spearman.
用法:
选择两个以上数值特征作为输入数据。设置相关性分析后,可通过连接表格视图来查看相关性矩阵;通过连接图片视图来查看矩阵图。
注意事项:
不能选择字符串类型(string)字段。
❖相关性分析节点的配置方法
将相关性分析节点添加到实验后,可通过右侧的“配置项目”页面,对相关性分析节点进行设置。
【方式】衡量两个变量线性相关性的强弱;在方差和协方差的基础上达到的,对异常值敏感;服从正态分布或接近正态分布的单峰分布; Pearson data demand :两个变量为连续值数据。 Spearman: 衡量变革变量之间联系(变化趋势)的强弱;在秩(排序)的相对大小基础上得到,对异常值更稳健; Spearman Data Demand :两个变量均为连续数据或等级数据 Kendall: 基于协同过滤思想得到,衡量变量之间的协同趋势;对异常值稳健; Kendall Data Demand :两个变量均为连续数据或等级数据
【操作列】选择数值型字段,不能低于两个字段。
相关性分析节点右键菜单
❖相关性分析节点运行
运行节点,将数据传递给DM-Engine进行计算,得到输出结果。
❖相关性分析节点重置
已经运行过的节点进行重置,删除返回的结果,节点状态更改为未运行。
❖相关性分析节点重命名
在相关性分析节点的右键菜单中,选择“重命名”,可以对节点进行重命名。
❖删除相关性分析节点
在相关性分析节点的右键菜单中,选择“删除”或者点击键盘 delete 键进行删除,能够删除节点以及节点的输入、输出连线。
❖刷新相关性分析节点
在相关性分析节点的右键菜单中,选择“刷新”,可以更新同步数据或者参数信息。