缺失值填充

<< Click to Display Table of Contents >>

当前位置:  数据准备 > 数据集 > 数据治理 

缺失值填充

复制链接

1.概述

1.1应用场景

导入的数据中的某些列可能存在部分缺失或值为空的情况,用户可以使用缺失值填充功能,根据自己需要将该列的空值转换为自己需要的值。

1.2功能简介

类型是字符串、字符、数值类型(双精度、单精度、整数、长整数等)的列中的空值或空字符串进行数据填充。

2.应用举例

对以下数据中test填充列进行数据填充

1)原始数据如图:

clip0076_zoom61

2)选中test填充列,在元数据上选中列或者在数据详情选中列头,点击【更多>缺失值填充】,对字段数据进行填充。打开缺失值填充设置面板如图:

queryvaluefilldemo1

clip0094_zoom65

3)配置图示的缺失值填充将空值替换为“-”。

4)生成填充列如下:

clip0211_zoom76

元数据选项卡下,生成填充列后,会自动选中该列,如果有纵向滚动条会滑动到新列的位置并选中新列。

在已创建的填充列上点击更多图标,可对其进行编辑、删除。

3.功能说明

clip0094_zoom65

设置

说明

名称

缺失值填充生成列的名称,默认是 “ 原列名-缺失值填充 ”, 可以对名称进行修改。

原值

要被填充的数据原值。被填充列是字符串类型时,原值包括空、空字符串;被填充列是数值类型时,原值包括空。

替换为

需要替换为的值。被填充列是字符串类型时,替换值包括 -、NULL、自定义;被填充列是数值类型时,替换值包括最大值、最小值、平均值、0、自定义。

自定义值

替换值选择自定义时,自定义值可编辑,将原值替换为自定义输入的值。