<< Click to Display Table of Contents >> 缺失值填充复制链接 |
1.概述
1.1应用场景
导入的数据中的某些列可能存在部分缺失或值为空的情况,用户可以使用缺失值填充功能,根据自己需要将该列的空值转换为自己需要的值。
1.2功能简介
对类型是字符串、字符、数值类型(双精度、单精度、整数、长整数等)的列中的空值或空字符串进行数据填充。
2.应用举例
对以下数据中test填充列进行数据填充
1)原始数据如图:
2)选中test填充列,在元数据上选中列或者在数据详情选中列头,点击【更多>缺失值填充】,对字段数据进行填充。打开缺失值填充设置面板如图:
3)配置图示的缺失值填充将空值替换为“-”。
4)生成填充列如下:
元数据选项卡下,生成填充列后,会自动选中该列,如果有纵向滚动条会滑动到新列的位置并选中新列。
在已创建的填充列上点击更多图标,可对其进行编辑、删除。
3.功能说明
设置 |
说明 |
---|---|
名称 |
缺失值填充生成列的名称,默认是 “ 原列名-缺失值填充 ”, 可以对名称进行修改。 |
原值 |
要被填充的数据原值。被填充列是字符串类型时,原值包括空、空字符串;被填充列是数值类型时,原值包括空。 |
替换为 |
需要替换为的值。被填充列是字符串类型时,替换值包括 -、NULL、自定义;被填充列是数值类型时,替换值包括最大值、最小值、平均值、0、自定义。 |
自定义值 |
替换值选择自定义时,自定义值可编辑,将原值替换为自定义输入的值。 |