<< Click to Display Table of Contents >> 缺失值填充复制链接 |
1.概述
导入的数据中某些列可能存在部分值缺失或值为空的情况,用户可以使用缺失值填充功能,根据自己需要将该列的空值转换为自己需要的值。
输入:一个数据集。
输出:数据集。
注意:数据类型必须是字符串、字符、数值类型(双精度、单精度、整数、长整数等)。
2.配置方法
将缺失值填充节点添加到画布后,可通过右侧的“配置项目”页面,对缺失值填充进行设置。
2.1缺失值填充
缺失值填充支持的操作包括添加缺失值填充、编辑缺失值填充、删除缺失值填充、复制缺失值填充、粘贴缺失值填充。
添加缺失值填充:点击配置页面中的添加缺失值填充,在缺失值填充的对话框中,具体设置参考如下。
在原始字段后的下拉选项中选择“test填充”,名称默认为“test填充-缺失值填充”,替换为在下拉选项中选择“NULL”,点击“确定”。
缺失值填充设置说明参考下表。
设置 |
说明 |
---|---|
原始字段 |
数据集中的字段,可在下拉选项中选择所需字段。 |
名称 |
缺失值填充生成列的名称,默认是 “ 原列名-缺失值填充 ”, 可以对名称进行修改。 |
原值 |
要被填充的数据原值,被填充的列可能是字段串,也可能是数值类型。 •被填充列是字符串类型时,原值包括空、空字符串 •被填充列是数值类型时,原值只有空。 |
替换为 |
需要替换为的值,被填充的列可能是字段串,也可能是数值类型。 •被填充列是字符串类型时,替换值包括 -、NULL、自定义。 •被填充列是数值类型时,替换值包括最大值、最小值、平均值、0、自定义。 |
自定义值 |
替换为选择“自定义”时,自定义值可编辑,将原值替换为自定义输入的值。 |
编辑缺失值填充:在缺失值填充列表中,鼠标悬浮在添加的缺失值填充上,点击编辑图标便可进入缺失值填充对话框中编辑。
删除缺失值填充:在缺失值填充列表中,鼠标悬浮在添加的缺失值填充上,点击删除图标,缺失值填充被删除。
复制缺失值填充:点击缺失值填充右侧的复制图标,页面弹出提示“复制成功”。
粘贴缺失值填充:有复制的缺失值填充,点击缺失值填充右侧的粘贴图标,页面弹出提示“粘贴成功”。
3.查看结果
运行后可以直接在缺失值填充节点查看计算列后输出的元数据和探索数据,也可以连接数据集视图查看输出的元数据和探索数据。元数据和探索数据可参考深度分析 > 实验功能使用 > 节点 > 数据。