缺失值填充

<< Click to Display Table of Contents >>

当前位置:  数据准备 > 数据集 > 数据治理 

缺失值填充

复制链接

导入的数据中的某些列可能存在部分缺失或值为空的情况,用户可以使用缺失值填充功能,根据自己需要将该列的空值转换为自己需要的值。

选择类型是字符串、字符、数值类型(双精度、单精度、整数、长整数等)的列,在元数据上选中列或者在数据详情选中列头,点击【更多>缺失值填充】,对字段数据进行填充。

示例:

1)原始数据如图:

clip0076

2)选中该列,打开缺失值填充设置面板如图:

clip0094

属性说明如下:

设置

说明

名称

缺失值填充生成列的名称,默认是 “ 原列名-缺失值填充 ”, 可以对名称进行修改。

原值

要被填充的数据原值。被填充列是字符串类型时,原值包括空、空字符串;被填充列是数值类型时,原值包括空。

替换为

需要替换为的值。被填充列是字符串类型时,替换值包括 -、NULL、自定义;被填充列是数值类型时,替换值包括最大值、最小值、平均值、0、自定义。

自定义值

替换值选择自定义时,自定义值可编辑,将原值替换为自定义输入的值。

3)配置图示的缺失值填充将空值替换为“-”。

4)生成填充列如下:

clip0211

元数据tab下,生成填充列后,会自动选中该列,如果有纵向滚动条会滑动到新列的位置并选中新列。

在已创建的填充列上点击更多图标,可对其进行编辑、删除。