<< Click to Display Table of Contents >> 列标准化 |
列标准化主要用于消除特征间单位和尺度差异的影响。列标准化包括归一化和标准化两种处理。
归一化:
1)把数据变成(0,1)或者(1,-1)之间的小数。把数据映射到0~1范围之内处理,更加便捷快速。
2)把有量纲表达式变成无量纲表达式,便于不同单位或量级的指标能够进行比较和加权。
标准化:
在机器学习中,我们可能要处理不同种类的资料,例如,音讯和图片上的像素值,这些资料可能是高维度的,资料标准化后会使每个特征中的数值平均变为0(将每个特征的值都减掉原始资料中该特征的平均)、标准差变为1,这个方法被广泛的使用在许多机器学习算法中 (例如:支持向量机、逻辑回归和MLP)。
用法:
列标准化节点的左耳可连接数据节点,对该数据节点的数据进行标准化处理。右耳可连接数据集视图节点,并在数据集视图节点查看标准化后的结果。右耳也可连接其他算子节点进行后续计算。
❖列标准化的配置方法
将列标准化节点添加到实验后,可通过右侧的“配置项目”页面,对数据标准化进行设置。
【方式】列标准化方式有三种:StandardScaler、MinMaxScaler、MaxAbsScaler。
【操作列】选择需要被标准化的列。在选择数据弹窗选择列,输出结果为所有列(其中已选择列会经过处理得到标准化后数据)。
设置列标准化后,可通过连接数据集视图的探索数据功能来查看标准化结果;也可以连接其它算子节点进行后续计算。
列标准化右键菜单
❖列标准化节点运行
运行节点,将数据传递给DM-Engine进行计算,得到输出结果。
❖列标准化节点重置
已经运行过的节点进行重置,删除返回的结果,节点状态更改为未运行。
❖列标准化节点重命名
在标准化节点的右键菜单中,选择“重命名”,可以对节点进行重命名。
❖删除列标准化节点
在标准化节点的右键菜单中,选择“删除”或者点击键盘 delete 键进行删除,能够删除节点以及节点的输入、输出连线。
❖刷新列标准化节点
在标准化节点的右键菜单中,选择“刷新”,可以更新同步数据或者参数信息。