列标准化

<< Click to Display Table of Contents >>

当前位置:  深度分析 > 数据变换 

列标准化

Previous pageReturn to chapter overviewNext page

列标准化主要用于消除特征间单位和尺度差异的影响。列标准化包括归一化和标准化两种处理。

归一化:

1)把数据变成(0,1)或者(1,-1)之间的小数。把数据映射到0~1范围之内处理,更加便捷快速。

2)把有量纲表达式变成无量纲表达式,便于不同单位或量级的指标能够进行比较和加权。

标准化:

在机器学习中,我们可能要处理不同种类的资料,例如,音讯和图片上的像素值,这些资料可能是高维度的,资料标准化后会使每个特征中的数值平均变为0(将每个特征的值都减掉原始资料中该特征的平均)、标准差变为1,这个方法被广泛的使用在许多机器学习算法中 (例如:支持向量机、逻辑回归和MLP)。

 

用法:

列标准化节点的左耳可连接数据节点,对该数据节点的数据进行标准化处理。右耳可连接数据集视图节点,并在数据集视图节点查看标准化后的结果。右耳也可连接其他算子节点进行后续计算。

ML180

 

列标准化的配置方法

将列标准化节点添加到实验后,可通过右侧的“配置项目”页面,对数据标准化进行设置。

【方式】列标准化方式有三种:StandardScaler、MinMaxScaler、MaxAbsScaler。

【操作列】选择需要被标准化的列。在选择数据弹窗选择列,输出结果为所有列(其中已选择列会经过处理得到标准化后数据)。

设置列标准化后,可通过连接数据集视图的探索数据功能来查看标准化结果;也可以连接其它算子节点进行后续计算。

 

列标准化右键菜单

右键菜单

列标准化节点运行

运行节点,将数据传递给DM-Engine进行计算,得到输出结果。

 

列标准化节点重置

已经运行过的节点进行重置,删除返回的结果,节点状态更改为未运行。

 

列标准化节点重命名

在标准化节点的右键菜单中,选择“重命名”,可以对节点进行重命名。

 

删除列标准化节点

在标准化节点的右键菜单中,选择“删除”或者点击键盘 delete 键进行删除,能够删除节点以及节点的输入、输出连线。

 

刷新列标准化节点

在标准化节点的右键菜单中,选择“刷新”,可以更新同步数据或者参数信息。