<< Click to Display Table of Contents >> 数据分区复制链接 |
1.概述
一般做预测分析时,会将数据分为两大部分。一部分是训练数据,用于构建模型,一部分是测试数据,用于检验模型。数据分区就是把数据集节点的数据分为验证集和训练集。
2.配置参数
拖拽一个数据集和一个数据分区节点到画布,连接数据集和数据分区节点。
将数据分区节点添加到实验后,可通过右侧的”配置项目“页面,对数据分区进行设置。
【训练集比例(%)】训练集占总样本数的比例,默认值是60。
【随机拆分】当不选中时按顺序抽取训练集。当选中时随机抽取训练集。默认未选中。
【随机数种子】生成随机数的种子。默认值是0。
设置数据分区后,可查看分区后的元数据、对数据进行过滤、探索数据。
元数据和探索数据可参考深度分析>实验功能使用>节点>数据。