<< Click to Display Table of Contents >> 数据分区 |
一般做预测分析时,会将数据分为两大部分。一部分是训练数据,用于构建模型,一部分是测试数据,用于检验模型。数据分区就是把数据集节点的数据分为验证集和训练集。
拖拽一个数据集和一个数据分区节点到编辑区,连接数据集和数据分区节点。
❖数据分区的配置方法
将数据分区节点添加到实验后,可通过右侧的”配置项目“页面,对数据分区进行设置。
【训练集比例(%)】训练集占总样本数的比例,默认值是60。
【随机拆分】当不选中时按顺序抽取训练集。当选中时随机抽取训练集。默认未选中。
【随机数种子】生成随机数的种子。默认值是0。
设置数据分区后,可查看分区后的元数据、对数据进行过滤、探索数据。具体内容请参看 添加数据 章节。
❖数据分区节点重命名
在数据分区节点的右键菜单中,选择“重命名”,可以对节点进行重命名。
❖删除数据分区节点
在数据分区节点的右键菜单中,选择“删除”或者点击键盘 delete 键进行删除,能够删除节点以及节点的输入、输出连线。
❖刷新数据分区节点
在数据分区节点的右键菜单中,选择“刷新”,可以更新同步数据或者参数信息。