<< Click to Display Table of Contents >> 选择输入数据复制链接 |
目的:主要用于选择需要计算的特征字段。
当选择预测场景时,系统会自动勾选上强相关的数据列和较相关的数据列,不会勾选不相关的数据列。列表中包括选项、状态、字段名称、别名、关联度、不同率、相同率、缺失率。
当选择聚类场景时,默认不勾选数据列,列表中不显示状态和关联度。用户需要选择模型输入的数据。
参数详细说明如下表所示。
参数 |
参数说明 |
---|---|
选项 |
默认勾选绿色和黄色 |
状态 |
绿色为强相关列 黄色为较相关列 灰色为不相关列 |
字段名称 |
数据集字段名称 |
别名 |
字段别名 |
关联度 |
与目标列的关联度。将目标列与当前列进行相关性分析求百分比。 |
不同率 |
几乎所有值都不同的行。不同值的行/总行数。 |
相同率 |
几乎所有值都相同的行。最大的相同值的行/总行数。 |
缺失率 |
缺少值的行。缺少值的行/总行数。 |
点击上一步,返回选择目标页面或选择任务页面,点击下一步,进入选择模型页面。
保存/另存为:右上角的保存高亮,点击保存/另存为,弹出保存/另存为对话框,选择路径,可以保存当前与之前步骤的Auto Model实验。