<< Click to Display Table of Contents >> 创建自服务数据集复制链接 |
1.创建自服务数据集
以下两种方式进入创建数据集页面:
•【导航栏>创建数据集】,打开创建数据集导航页面后,点击自服务数据集进入创建页面。
•在已打开的数据集页面,通过【菜单栏>新建】,点击相应的数据集进入创建页面。
2.自服务数据集数据编辑区域
进入自服务数据集创建界面后,自服务数据集的数据编辑区域整体布局如下:
2.1 添加输入节点
自服务数据集左侧资源树上有数据和操作两个部分,两个部分可以互相切换。
•当选项卡为数据时,可以以拖动左侧项到右侧空白区域的方式添加数据节点,具体参考添加数据节点 ;
•当选项卡为操作时,可以以拖动左侧项到右侧空白区域的方式添加如下操作节点:
(具体参考操作节点各自的介绍,包括关联、抽样、排序、透视表、逆透视表、分组和汇总、自循环列、镜像和去重)
2.2 数据集结果节点
数据集结果节点是所有节点数据处理的终结点,数据集结果节点只能有一个输入。
节点右键菜单:重命名。
2.3 节点编辑
支持对节点进行如下操作:
操作 |
说明 |
---|---|
选中 |
单击可以选中单个节点,也可以按 Ctrl 键对节点进行多选。或者拖拽鼠标框选单个或多个节点。 |
打开数据集 |
输入节点是数据集时,选中节点,右键菜单选择打开,可以直接打开数据集进行编辑,也可以双击打开数据集进行编辑。 |
重命名 |
节点右键菜单点击重命名,可以对节点进行重命名。 |
复制 |
选中输入节点可以复制。 |
删除 |
选中节点,鼠标右击,在右键菜单中点击删除,或者使用鼠标框选一个或多个节点点击键盘 Delete键进行删除,能够删除节点以及节点的输入、输出连线,数据集结果节点除外。 |
刷新 |
点击节点右键刷新,可以更新同步数据。 |
输入节点是数据集时,选中节点,右键菜单选择替换数据集,弹出弹框 选择用来替换当前数据集的数据集,目前多维数据集、流式数据集和组合数据集不可用于替换,不可选的数据集置灰。如果用来替换的数据集列有变化会提示。 |
|
数据库内计算/展示SQL语句 |
对于自服务数据集每个节点,当输入节点或节点本身都是支持数据库内计算的SQL数据集的情况下都可以勾选“数据库内计算”,勾选后,执行数据集查询时将会对SQL进行封装,计算将会下推到数据库内执行。 如果一个节点的所有输入节点和节点自身都勾选了数据库内计算,则可以通过展示SQL语句,查看这个节点实际上进行数据库内计算时所执行的SQL语句。 |
➢注意:
操作节点未设置合法的属性,数据集节点数据更新后未刷新,数据节点无法正常运作等都可能导致数据节点不可用,这时数据节点右下角会有红色感叹号标记。
可以参考如下方式来消除这个状态:
•双击或右键编辑,为操作节点配置正确的属性;
•刷新元数据或在节点上右键点击刷新,更新数据节点;
•根据提示对数据集进行改动使其可用。
2.4 节点连线
•自动连线
以每个节点输入端或输出端所在边框的中点为圆心,在半径为 75px 半圆内区域会触发和其它节点的自动连线。
•手动连线
不能自动连线的部分,都可以进行手动连线。手动连线时,当鼠标移至输出端时,空心圆点变为实心并放大,鼠标为十字同时会出现提示框;此时按住鼠标并移至下一节点的输入端时,下一节点的输入端圆点也会变为实心;如移动到输出端则该圆点也放大。
•删除连线
可以点击连线上的删除图标进行删除;删除节点也会自动删除左右的连线。
➢注意:输入节点只能连接一个输出节点,但镜像节点除外。
2.5 自动布局
默认情况下,数据集结果节点没有与输入节点连接时,【自动布局】为不可编辑的置灰状态,只有先将输入节点与数据集结果节点连接,自动布局才可使用。
点击自动布局,节点和节点之间的布局会根据既定算法优化,布局会更加合理美观。
布局前:
布局后,格式如下:
3.数据集编辑区数据治理
自服务数据集可以在每个操作节点中的元数据编辑区进行数据治理,也可以在最后输出结果节点的元数据编辑区进行数据治理。具体的数据治理说明参考数据治理。
•在自服务数据集的元数据区域,把鼠标移到字段上能看到字段的来源,方便追踪字段的原始节点: