数据

<< Click to Display Table of Contents >>

当前位置:  深度分析 > 实验功能使用 > 节点 

数据

复制链接

目前的数据节点共有两种,一种是左侧数据集资源树里的数据集节点,一种是插件数据集节点。

注意:

插件数据集节点需要定制开发。

1.数据集节点

可以查看该数据集中包含的元数据,探索数据的特征,对数据进行过滤。

1.1元数据

DepthAnalysis_Metadata

名称:数据集字段名称,支持搜索。将鼠标放到元数据名称上,显示数据来源提示信息。

别名:给字段设置的别名。

数据类型:数据集节点中各字段的数据类型,不可以修改,点击DepthAnalysis_specific_data_type 图标可以切换成具体数据类型。

可见性:设置字段在探索数据页面中的显示和隐藏。

显示隐藏列:勾选上“显示隐藏列”,【可见性】设置了不可见的列则会显示出来,显示成灰色,“可见”图标上会显示一条向右的斜线,表示此列为不可见,再次点击一下这个icon,该列变为可见。

表达式:元数据区域可以通过点击字段名称的更多菜单选择新建计算列,新建分组,数据分箱,缺失值填充,拆分列,去空格,值映射,转换为日期列,转换为数字列等。此处不做过多介绍,详细用法请参照数据准备>数据治理

1.2过滤数据

点击右上角过滤icon,可以增加过滤来筛选数据集的行数据,详细用法请参照制作可视化报告>数据处理与分析>数据过滤>过滤

1.3探索数据

数据探索中对数据进行初步研究,以便更好地解释它的特殊性质。有助于选择合适的数据预处理和数据分析技术。它甚至可以处理一些通常由数据挖掘解决的问题,例如,有时可以通过对数据进行直观检查来发现模式。此外,数据探索中使用可视化界面用于更好的理解和解释数据挖掘结果。

DepthAnalysis_DataSetExplorationData

字段名称:在字段名称中选择字段,可以直接定位并选中字段,而且支持搜索。

显示总行数:点击右上角的显示总行数按钮后,会弹出显示总行数对话框,显示出所预览数据集节点的总行数。

预览行数:数据集节点的默认显示行数。默认值为200行。预览行数可以修改,修改后,点击空白处预览行数发生变化。

统计:统计区域展示所选列的特征值。在左侧表内选择不同的列来显示不同列的特征值。

可视化:可视化区域通过两种图表展示所选列的数据分析结果。直方图展示所选列的数据分布,盒须图展示所选列的数据范围和异常数据分布情况。

2.插件数据集节点

插件数据集节点的配置项目与其他插件功能一样,包括插件说明、参数列表、变量、输出类型列表。用户可自定义,需要咨询销售了解定制开发流程。