缺失数据填充

<< Click to Display Table of Contents >>

当前位置:  创建数据集 > 自服务数据集 > 数据治理 

缺失数据填充

Previous pageReturn to chapter overviewNext page

选择类型是字符串、数值类型(双精度、单精度、整数、长整数等)的字段,在元数据上选中字段或者在细节数据选中字段的列头点击“更多”图标菜单中选择缺失值填充,对字段数据进行填充。

在整数类型的字段上点击更多图标,打开缺失值填充对话框,如图:

clip0366

【名称】缺失值填充生成列的名称,默认是 “ 原列名-缺失值填充 ”, 可以对名称进行修改。

【原值】要被填充的数据原值。被填充列是字符串类型时,原值包括空、空字符串;被填充列是数值类型时,原值包括空。

【替换为】需要替换的值。被填充列是字符串类型时,替换值包括 -、NULL、自定义;被填充列是数值类型时,替换值包括最大值、最小值、平均值、0、自定义。

【自定义值】替换值选择自定义时,自定义值可编辑,将原值替换为自定义输入的值。

 

例如:

原始数据如图:

clip0367

将 str 中的空字符串填充为 ” 空 ”,ID 中的空值填充为平均值。预览数据如图:

clip0368

生成填充列后,会自动选中该列,如果有纵向滚动条会滑动到新列的位置并选中新列。

在已创建的填充列上点击更多图标,可对其进行编辑、删除。