决策树多分类

<< Click to Display Table of Contents >>

当前位置:  深度分析 > 算法 

决策树多分类

Previous pageReturn to chapter overviewNext page

决策树分类器,采用决策树算法进行分类模型训练。

 

用法:

该节点接收数据集节点的输入。设置决策树多分类后,可通过连接表格视图来查看性能指标;连接图片视图来查看混淆矩阵。

 

注意事项:

【目标列】只能选择一个字段。

ML190

决策树多分类节点的配置方法

将决策树多分类节点添加到实验后,可通过右侧的“配置项目”页面,对决策树多分类节点进行设置。

【分类准则】分为两种:gini: 基尼系数;entropy: 信息熵。

【分裂策略】best: 在所有分裂点中找到最优分裂点,适用小数据量;random: 随机在部分分裂点中找到局部最优分裂点,适用大数据量。

【最大深度】设置决策时的最大深度。设置为0时,禁用最大深度限制。

【分裂最小样本数】节点中样本量小于设定值,该节点停止分裂。

【叶子节点最小样本数】当前节点的子节点中的任一节点样本量小于设定值,则所有子节点被剪枝。

【叶子节点最小样本权值和】当前节点的子节点所有样本权重之和小于设定值,则所有子节点被剪枝。

【最大特征数】auto: 最大特征数=sqrt(特征总数) sqrt: 最大特征数=sqrt(特征总数) log2: 最大特征数=log2(特征总数) None: 最大特征数=特征总数

【随机种子】设置为0时,禁用随机种子。

【最大叶子节点】限制整棵树的叶子节点总数,设置为0时,禁用最大叶子节点数。

【最小不纯度降低值】当前节点分裂后的不纯度降低值小于设定值,则所有子节点被剪枝。

【类别权重】balanced: 自动平衡样本;None: 不进行样本平衡。

【训练集占比】通常训练集在整个数据集的占比为0.8,剩下的作为验证集。

【平行坐标图分筒数】设定平行坐标图上每个特征的分筒数量,当特征较多时建议适当减小分筒数,取值范围为大于等于2的整数。

【特征列】选择前置节点的特征列,可以为多列。

【目标列】选择前置节点的目标列,只能为1列,有分类属性的数据。

【选择数据】V9.3版本选择数据作为特征列/目标列时,选择数据支持数据类型筛选功能,方便用户根据算子需求选择需要的数据类型。包括全部、数值、文本和日期,数据类型会根据数据列显示不同,选择类型后会按选择的类型筛选数据。

选择数据

 

ML191

决策树多分类的属性配置

V9.3版本新增属性配置可以编辑节点名称、注释内容。详情参考添加数据中的属性配置

 

决策树多分类节点右键菜单

右键菜单

决策树多分类节点运行

运行节点,将数据传递给DM-Engine进行计算,得到输出结果。

 

决策树多分类节点重置

已经运行过的节点进行重置,删除返回的结果,节点状态更改为未运行。

 

决策树多分类节点重命名

决策树多分类节点的右键菜单中,选择“重命名”,可以对节点进行重命名。

 

刷新决策树多分类节点

决策树多分类节点的右键菜单中,选择“刷新”,可以更新同步数据或者参数信息。

 

保存为组合节点

决策树多分类节点的右键菜单中,选择“保存为组合节点”,可以将选中的节点保存为组合节点以实现复用节点,保存的节点的参数与原节点一致。

 

剪切决策树多分类节点

在决策树多分类节点的右键菜单中,选择“剪切”,在目标位置右键选择“粘贴”,可以实现节点的剪切粘贴。

 

复制决策树多分类节点

在决策树多分类节点的右键菜单中,选择“复制”,在目标位置右键选择“粘贴”,可以实现节点的复制粘贴。

 

删除决策树多分类节点

在决策树多分类节点的右键菜单中,选择“删除”或者点击键盘 delete 键进行删除,能够删除节点以及节点的输入、输出连线。