数据模型构建方法

<< Click to Display Table of Contents >>

当前位置:  数据准备 > 数据集 > 数据模型 

数据模型构建方法

复制链接

1.创建数据模型

点击数据集页面左侧顶部的Add_icon图标,进入新建数据集页面,点击数据模型入口,进入模型编辑页面。

Query_DataModelCreat

1.1 添加模型节点

数据模型支持两种方式添加节点。

从左边资源树上拖拽一个数据集到数据集编辑区域。除了组合数据集、MDX数据集、流式数据集外的数据集都可以被添加进来。

展开数据源的表和视图节点,拖拽一张表或一个视图到数据集编辑区域。

Query_DataModelCanvas2

多个节点之间如果有同名的列,则会自动修改名称和别名使其不会重名,用户也可以自己修改别名进行调整。

columnName

如果节点不能下推数据库,则用橙色标识。

1.2 添加模型节点之间的关系

通过拖拽节点上的关联列到另一个节点的对应关联列上,来建立节点间的关系。

注意:

节点之间建立关系的列要求字段类型匹配。

Query_DataModelCanvas3

关系类型参考下方列表:

关系类型

说明

一对多(或多对一)

两个节点关联列中的值,一侧唯一,一侧具有重复值,比如部门与员工的关系,一个部门存在多个员工。

一对一

两个节点关联列中的值都是唯一的,比如员工与员工号的关系,一个员工对应一个员工号。

多对多

两个节点关联列中的值都是具有重复值,比如员工与项目的关系,一个员工负责多个项目,一个项目有多个员工共同负责。

不同关系类型展示效果如图:

Query_DataModelCanvas4

说明:

系统会根据您的数据选择最合适的模型关系。出于性能影响,用户应该尽量选择正确的模型关系。

注意:

两个节点之间只能存在一种关系,如果存在多种关系的场景,请使用计算列拼接想要关联的列再使用计算列构建关系。例:如需firstname和lastname两个列进行添加关系,则可以将firstname和lastname通过计算列形成一列之后再添加关系。

多个节点的关系不能成环,也不能存在孤立的节点。如下图,如果两个维度表同时与两个事实表关联,则存在环:

circle

可以调整为:

uncircle

2.编辑数据模型

点击编辑面板空白区域,右侧元数据面板展示全部节点结构信息,可对所有数据列进行编辑。

Query_DataModelCanvas5

点击单个节点,展示单节点结构信息,可对选中节点的数据列、过滤进行编辑。

Query_DataModelCanvas6

悬浮到节点的表头部分,出现可操作菜单:

editTable

【添加过滤】同元数据面板里的添加过滤,可以对原始列或明细计算列添加过滤条件。

【收起】【折叠】收起或展开此节点。

【打开数据源】如果节点直接来自于数据源表或视图,可以通过此入口打开数据源。

【打开数据集】如果节点来自于数据集,可以通过此入口打开数据集。

【重命名】重命名节点。重命名之后,元数据面板里的节点名称会同步。

【复制】【粘贴】复制节点。可以选择多个节点复制粘贴。也支持快捷键复制粘贴。

【删除】删除节点。可以选择多个节点删除。也支持快捷键删除。

【展开全部】【折叠全部】可以将面板上的所有节点展开和收起。

点击关系线,展示关系信息,可对模型关系进行编辑或删除。也支持通过快捷键删除关系。

Query_DataModelCanvas7

如果数据上是一对一的关系,将其改成一对多或多对一或多对多时,出现红色icon,提示:建议使用一对一的关系。

invalidRelation1

如果是一对多的关系,将其改成一对一或多对一时弹出错误提示(例如下图)。点击确定,关系回到之前的状态。如果将其改成多对多时出icon提示:建议使用一对多的关系。

invalidRelation2

如果是多对一的关系,逻辑同一对多。

如果是多对多的关系,将其改成一对一或一对多或多对一时也会提示不能修改。点击确定,关系回到之前的状态。

模型编辑面板工具栏

modelToolbar

【自动局部】自动调整模型节点的布局。

【缩放面板】可以通过下拉菜单和滑块调整面板的大小。

【自适应视图】点击自适应视图,将所有节点调整到可视范围内。

【显示导航视图】【隐藏导航视图】可以将导航视图显示和隐藏,通过导航视图可以快速调整面板可视区域

3.编辑元数据

单节点支持预览数据、显示总行数,整个模型不支持预览数据、显示总行数。

节点目录下仅显示此节点的明细列。节点目录下支持建子目录,可以将此节点的列拖入或移动到子目录。不能将某个节点下的列移动到别的节点或子目录下。数据模型不可跨节点创建层次;不能用度量列创建层次。

新建计算列窗口开放了聚合函数和多粒度表达式函数,支持建聚合计算列。新建的聚合计算列放到根目录下,聚合计算支持使用多个表的列进行计算。新建的明细计算列放到对应的节点下,明细计算列仅支持用单个节点的列进行计算,不支持使用多个表的列进行计算。

Query_DataModelCanvas9

数据模型中分析算法仅可以使用此节点的原始列和仅依赖该节点列的明细计算列。

4. 数据模型加速

模型计算支持内存计算,下推数据库计算,也支持集市计算。选中单个节点,可以点击抽取数据将节点数据抽取到VooltDB数据集市,将所有节点都抽取集市后,报告上任何绑定执行数据都会走VooltDB集市计算。

说明:

不支持调度任务里的同步数据任务、增量导入数据任务选择数据模型。

数据模型中节点抽取仅支持VooltDB。

数据模型的节点为集市数据集时,则不支持抽取。

5.制作报告中使用数据模型

创建好数据模型后,在制作报告页面可以将建立关系的不同节点字段同时拖入到报告组件中进行分析。

Query_DataModelCanvas8

鼠标悬浮到绑定字段上,显示来源表和字段名,快速查看数据来源。

Query_DataModelCanvas10

6.其它注意事项汇总

数据模型不能用在组合数据集和自服务数据集里。

数据模型在报告的过滤列和日期过滤列使用中,仅可以对此节点的原始列和仅依赖该节点列的明细计算列进行过滤。

数据模型不支持真分页。