创建自服务数据集

<< Click to Display Table of Contents >>

当前位置:  数据准备 > 数据集 > 自服务数据集 

创建自服务数据集

复制链接

1.创建自服务数据集

以下两种方式进入创建数据集页面:

【导航栏>创建数据集】,打开创建数据集导航页面后,点击自服务数据集进入创建页面。

clip0130

在已打开的数据集页面,通过【菜单栏>新建】,点击相应的数据集进入创建页面。

clip0143

2.自服务数据集数据编辑区域

进入自服务数据集创建界面后,自服务数据集的数据编辑区域整体布局如下:

clip0133

2.1 添加输入节点

自服务数据集左侧资源树上有数据和操作两个部分,两个部分可以互相切换。

clip0132

当选项卡为数据时,可以以拖动左侧项到右侧空白区域的方式添加数据节点,具体参考添加数据节点

当选项卡为操作时,可以以拖动左侧项到右侧空白区域的方式添加如下操作节点:

(具体参考操作节点各自的介绍,包括关联抽样排序透视表逆透视表分组和汇总自循环列镜像去重

clip0134

2.2 数据集结果节点

clip0135

数据集结果节点是所有节点数据处理的终结点,数据集结果节点只能有一个输入。

节点右键菜单:重命名。

2.3 节点编辑

clip0144

支持对节点进行如下操作:

操作

说明

选中

单击可以选中单个节点,也可以按 Ctrl 键对节点进行多选。或者拖拽鼠标框选单个或多个节点。

打开数据集

输入节点是数据集时,选中节点,右键菜单选择打开,可以直接打开数据集进行编辑,也可以双击打开数据集进行编辑。

重命名

节点右键菜单点击重命名,可以对节点进行重命名。

复制

选中输入节点可以复制。

删除

选中节点,鼠标右击,在右键菜单中点击删除,或者使用鼠标框选一个或多个节点点击键盘 Delete键进行删除,能够删除节点以及节点的输入、输出连线,数据集结果节点除外。

刷新

点击节点右键刷新,可以更新同步数据。

替换数据集

输入节点是数据集时,选中节点,右键菜单选择替换数据集,弹出弹框

queryshot7

选择用来替换当前数据集的数据集,目前多维数据集、流式数据集和组合数据集不可用于替换,不可选的数据集置灰。如果用来替换的数据集列有变化会提示。

queryshot8

数据库内计算/展示SQL语句

对于自服务数据集每个节点,当输入节点或节点本身都是支持数据库内计算的SQL数据集的情况下都可以勾选“数据库内计算”,勾选后,执行数据集查询时将会对SQL进行封装,计算将会下推到数据库内执行。

clip0212

如果一个节点的所有输入节点和节点自身都勾选了数据库内计算,则可以通过展示SQL语句,查看这个节点实际上进行数据库内计算时所执行的SQL语句。

注意:

操作节点未设置合法的属性,数据集节点数据更新后未刷新,数据节点无法正常运作等都可能导致数据节点不可用,这时数据节点右下角会有红色感叹号标记。

Query_SelfNodeInvalid

可以参考如下方式来消除这个状态:

双击或右键编辑,为操作节点配置正确的属性;

刷新元数据或在节点上右键点击刷新,更新数据节点;

根据提示对数据集进行改动使其可用。

2.4 节点连线

自动连线

以每个节点输入端或输出端所在边框的中点为圆心,在半径为 75px 半圆内区域会触发和其它节点的自动连线。

手动连线

不能自动连线的部分,都可以进行手动连线。手动连线时,当鼠标移至输出端时,空心圆点变为实心并放大,鼠标为十字同时会出现提示框;此时按住鼠标并移至下一节点的输入端时,下一节点的输入端圆点也会变为实心;如移动到输出端则该圆点也放大。

Query_SelfLine

删除连线

可以点击连线上的删除图标进行删除;删除节点也会自动删除左右的连线。

注意:输入节点只能连接一个输出节点,但镜像节点除外。

2.5 自动布局

默认情况下,数据集结果节点没有与输入节点连接时,【自动布局】为不可编辑的置灰状态,只有先将输入节点与数据集结果节点连接,自动布局才可使用。

点击自动布局,节点和节点之间的布局会根据既定算法优化,布局会更加合理美观。

布局前:

clip0137

布局后,格式如下:

clip0138

3.数据集编辑区数据治理

自服务数据集可以在每个操作节点中的元数据编辑区进行数据治理,也可以在最后输出结果节点的元数据编辑区进行数据治理。具体的数据治理说明参考数据治理

在自服务数据集的元数据区域,把鼠标移到字段上能看到字段的来源,方便追踪字段的原始节点:

clip0177