组合数据集

<< Click to Display Table of Contents >>

当前位置:  数据准备 > 数据集 

组合数据集

复制链接

组合数据集提供了一个强大却又简单的方式,通过简单的拖拽操作,实现多个查询,多张表或视图联接(JOIN)或联合(UNION)在一起。这些查询,表,视图均可以来自于不同的数据源。

1.创建组合数据集

点击数据集页面左侧顶部的Add_icon图标,进入新建数据集页面。点击组合数据集进入创建页面。

clip0267

2.组合数据集数据集编辑区域

clip0269

2.1 选择组合的表

组合数据集必须由多个数据表进行组合,支持两种方式拖入表

从左边资源树上拖拽一个数据集到组合数据集编辑区域。任何类型(除了自服务数据集)的数据集都可以被添加进来。

展开数据源的表和视图节点,拖拽一张表或一个视图到组合数据集编辑区域。

2.2 将表添加进编辑区域

如果将表拖入到一个空白的组合数据集里,这张表会放入组合数据集编辑区域的左上角。

如果组合数据集编辑区域里已经有别的表,可以将新加的表放到:

第一张表之前

两张表之中

最后一张表之后

已存在的表上

其它空白区域如果添加到已存在的表上,新添加的表会替换老的表。

拖拽数据库中的表,如果两个表之间定义了外连接信息,当两个表拖入组合数据集之后,可以基于这些外连接信息将缺省的连接做好,而无需用户指定。

新插入的表,默认会找插入点的上一张表来产生连接。如果不存在上一张表,会找插入点的下一张表产生连接。也可以拖动连接线,来重新选择连接的左右两张表。

移动鼠标到连接线上,当鼠标变为可移动状态时,上/下拖动它到另一张表上。

组合数据集上,任何一张表都必须与任意一张别的表产生关系,所有连接线的个数为(表的个数-1)。当拽连接线导致某张表和别的表没有关系时,连接线的颜色会显示为红色,示意非法拖动连接线。

Query_Union

2.3 编辑组合数据集

clip0274

数据集支持的编辑操作:

操作

说明

移动表

选择表的表头部分,拖动表到新的位置,可以插入到另一个表之前,或附加到另一个表之后,也可以移动到另一个表上替换这个表。

编辑表

在表头右上角的按钮支持设置单个表的过滤和隐藏/显示所有列,详情参考数据治理>显示与隐藏数据治理>过滤

删除表

点击表头右上角上的 “ 删除数据集 ” 按钮即可删除表。

操作类型

点击表与表之间连接线上的图标,即可以打开 “ 操作类型 ” 窗口,来定义两张表之间的联接关系。

clip0271

联接表中的联接列选择后,产品会自动检测联接列在数据集中是否存在重复数据,如果存在,会用橙色文字提示用户进行去重。

DataExpantion

各组合含义可参考【自服务数据集>关联】

展示SQL语句

如果每个表都是开启了数据库内运算的SQL数据库表或数据集,则可以点击组合数据集编辑区域下方的 “ 展示 SQL 语句 ” 按钮,来查看这个组合数据集生成的 SQL 语句。

刷新数据

刷新数据按钮默认置灰,用户至少拖入2个数据集之后才会变为绿色的可点击状态。点击可以刷新预览数据。

当点击绿色的刷新数据按钮后,按钮会由绿色变为白色。如果再对子节点进行任何操作都会使这个按钮再次变绿。