数据分区

<< Click to Display Table of Contents >>

当前位置:  深度分析 > 数据变换 

数据分区

Previous pageReturn to chapter overviewNext page

一般做预测分析时,会将数据分为两大部分。一部分是训练数据,用于构建模型,一部分是测试数据,用于检验模型。数据分区就是把数据集节点的数据分为验证集和训练集。

拖拽一个数据集和一个数据分区节点到编辑区,连接数据集和数据分区节点。

ML26

 

数据分区的配置方法

将数据分区节点添加到实验后,可通过右侧的”配置项目“页面,对数据分区进行设置。

【训练集比例(%)】训练集占总样本数的比例,默认值是60。

【随机拆分】当不选中时按顺序抽取训练集。当选中时随机抽取训练集。默认未选中。

【随机数种子】生成随机数的种子。默认值是0。

设置数据分区后,可查看分区后的元数据、对数据进行过滤、探索数据。具体内容请参看 添加数据 章节。

 

数据分区节点重命名

在数据分区节点的右键菜单中,选择“重命名”,可以对节点进行重命名。

 

删除数据分区节点

在数据分区节点的右键菜单中,选择“删除”或者点击键盘 delete 键进行删除,能够删除节点以及节点的输入、输出连线。

 

刷新数据分区节点

在数据分区节点的右键菜单中,选择“刷新”,可以更新同步数据或者参数信息。