拆分数据

<< Click to Display Table of Contents >>

当前位置:  数据准备 > 数据集 > 数据治理 

拆分数据

复制链接

导入进数据集的某列有时用户想将其中的信息分成几部分,如某列的结构是“分公司+部门+岗位”,用户想要分别当做分公司,部门,岗位三个维度处理,这时候用户可以采用拆分数据功能。

选择类型是字符串的列,在元数据上选中字段或在数据详情选中列头,点击【更多>拆分列】,可以根据分隔符对数据进行全部拆分或部分拆分。

打开拆分列对话框,如图:

clip0214

功能

说明

分隔符

拆分列时所依据的分隔符,可以选择点、逗号、冒号、分号、连接号、下划线、省略号、空格、TAB键、斜杠、自定义。

自定义分隔符

当分隔符选择自定义时可用,用户可在此输入内容,自定义拆分列时所依据的分隔符。

拆分开始位置

拆分的起始位置,从第一个开始,还是从最后一个,或者是拆分全部。

拆分列数

根据输入值确定拆分后生成的列数,如果拆分开始位置是全部,则不需要输入拆分列数。

示例:

1)原始数据如图:

clip0218

2)将列进行拆分,分隔符是连接号,开始位置是全部。拆分结果如图:

clip0219

元数据tab下,生成拆分列后,会自动选中第一个列,如果有纵向滚动条会滑动到新列的位置并选中新列。

在已创建的拆分列上点击更多图标,可对其进行删除。