选择输入数据

<< Click to Display Table of Contents >>

当前位置:  深度分析 > Auto Model 

选择输入数据

Previous pageReturn to chapter overviewNext page

预测

预测场景下,系统会自动勾选上强相关的数据列和较相关的数据列,不会勾选不相关的数据列。

选择输入数据

用户可勾选/取消状态前的复选框,更改输入的字段。

勾选取消字段

列表中包括参数:选项、状态、字段名称、别名、关联度、不同率、相同率、缺省率。参数详细说明如下表所示。

参数

参数说明

选项

默认勾选绿色和黄色。

状态

绿色为强相关列

黄色为较相关列

灰色为不相关列

字段名称

数据集字段名称

别名

字段别名

关联度

与目标列的关联度。将目标列与当前列进行相关性分析求百分比。

不同率

几乎所有值都不同的行。不同值的行/总行数。

相同率

几乎所有值都相同的行。最大的相同的值的行/总行数。

缺省率

缺少值的行。缺少值的行/总行数。

 

 

聚类

聚类场景下,用户需勾选字段名称前的复选框,可对的单个、多个、以及全部的字段进行K-Means聚类分析。

聚类-选择输入数据