<< Click to Display Table of Contents >>
当前位置: 数据准备 > 数据集 > 自服务数据集
1.概述
从操作列表拖曳“去重”节点到自服务画布与一个输入节点连接,去重节点可以把连线节点的重复记录去掉。
2.应用场景
用户拿到的数据中可能存在大量的重复数据,可以使用“去重”节点来将完全重复的冗余数据去除。
1)新建自服务数据集,添加一个输入节点,输入节点的原始数据如下图所示:
2)连接去重节点之后重复记录被去掉。
➢注意:需要各列都重复的完全重复的行才会被去除。