<< Click to Display Table of Contents >> 数据复制链接 |
目前的数据节点共有两种,一种是左侧数据集资源树里的数据集节点,一种是插件数据集节点。
➢注意:
插件数据集节点需要定制开发。
1.数据集节点
可以查看该数据集中包含的元数据,探索数据的特征,对数据进行过滤。
1.1元数据
名称:数据集字段名称,支持搜索。将鼠标放到元数据名称上,显示数据来源提示信息。
别名:给字段设置的别名。
数据类型:数据集节点中各字段的数据类型,不可以修改,点击图标可以切换成具体数据类型。
显示隐藏列:设置字段的可见性。
•显示与隐藏所有列:点击可见性右侧的图标可以隐藏所有列的数据。点击,图标变为,隐藏的所有列变为可见。
•显示与隐藏单一列:点击某一列的图标可以设置该列不可见。点击,图标变为,该列变为可见。
•显示与隐藏多列:选中多个数据列,当列全部可见时,右键菜单可设置隐藏;当列全部不可见时,右键菜单可设置取消;当列部分可见时,右键菜单可设置隐藏和取消隐藏。
表达式:元数据区域可以通过点击字段名称的更多菜单选择新建计算列,新建分组,数据分箱,缺失值填充,拆分列,去空格,值映射,转换为日期列,转换为数字列等。此处不做过多介绍,详细用法请参照数据准备>数据治理。
1.2过滤数据
点击右上角过滤icon,可以增加过滤来筛选数据集的行数据,详细用法请参照制作可视化报告>数据处理与分析>数据过滤>过滤。
1.3探索数据
数据探索中对数据进行初步研究,以便更好地解释它的特殊性质。有助于选择合适的数据预处理和数据分析技术。它甚至可以处理一些通常由数据挖掘解决的问题,例如,有时可以通过对数据进行直观检查来发现模式。此外,数据探索中使用可视化界面用于更好的理解和解释数据挖掘结果。
字段名称:在字段名称中选择字段,可以直接定位并选中字段,而且支持搜索。
显示总行数:点击右上角的显示总行数按钮后,会弹出显示总行数对话框,显示出所预览数据集节点的总行数。
预览行数:数据集节点的默认显示行数。默认值为200行。预览行数可以修改,修改后,点击空白处预览行数发生变化。
统计:统计区域展示所选列的特征值。在左侧表内选择不同的列来显示不同列的特征值。
可视化:可视化区域通过两种图表展示所选列的数据分析结果。直方图展示所选列的数据分布,盒须图展示所选列的数据范围和异常数据分布情况。
2.插件数据集节点
插件数据集节点的配置项目与其他插件功能一样,包括插件说明、参数列表、变量、输出类型列表。用户可自定义,需要咨询销售了解定制开发流程。