<< Click to Display Table of Contents >> 选择输入数据 |
•预测
预测场景下,系统会自动勾选上强相关的数据列和较相关的数据列,不会勾选不相关的数据列。
用户可勾选/取消状态前的复选框,更改输入的字段。
列表中包括参数:选项、状态、字段名称、别名、关联度、不同率、相同率、缺省率。参数详细说明如下表所示。
参数 |
参数说明 |
选项 |
默认勾选绿色和黄色。 |
状态 |
•绿色为强相关列 •黄色为较相关列 •灰色为不相关列 |
字段名称 |
数据集字段名称 |
别名 |
字段别名 |
关联度 |
与目标列的关联度。将目标列与当前列进行相关性分析求百分比。 |
不同率 |
几乎所有值都不同的行。不同值的行/总行数。 |
相同率 |
几乎所有值都相同的行。最大的相同的值的行/总行数。 |
缺省率 |
缺少值的行。缺少值的行/总行数。 |
•聚类
聚类场景下,用户需勾选字段名称前的复选框,可对的单个、多个、以及全部的字段进行K-Means聚类分析。