<< Click to Display Table of Contents >> 标准化复制链接 |
1.概述
标准化主要用于消除特征间单位和尺度差异的影响。
在机器学习中,我们可能要处理不同种类的资料。
➢例如:音讯和图片上的像素值,这些资料可能是高维度的,资料标准化后会使每个特征中的数值平均变为0(将每个特征的值都减掉原始资料中该特征的平均)、标准差变为1。
这个方法被广泛的使用在许多机器学习算法中。
➢例如:支持向量机、逻辑回归和MLP。
输入:标准化节点的左耳可连接数据节点,对该数据节点的数据进行标准化处理。
输出:数据集,也可连接其他算子节点进行后续计算。
2.配置方法
将标准化节点添加到实验后,可通过右侧的“配置项目”页面,对数据标准化进行设置。
2.1参数列表
方式:该参数是用来指定合适的规范化方法,标准化方式有三种:StandardScaler、MinMaxScaler、MaxAbsScaler。
StandardScaler:标准化,每个特征中的数值平均变为0 。
MinMaxScaler:最小最大值标准化,它默认将每种特征的值都归一化到[0,1]之间。
MaxAbsScale:绝对值最大标准化,它通过除以最大值将训练集缩放至[-1,1]。
2.2选择变量
操作列:在操作列选择需要被标准化的列。在选择数据弹窗选择列,输出结果为所有列(其中已选择列会经过处理得到标准化后数据)。
➢说明:不支持文本类型。
选择数据页面操作见深度分析 > 使用功能使用 > 节点 > 插件节点 > 选择数据。
3.查看结果
可以连接数据集视图查看标准化输出数据,数据集视图会显示所有数据的元数据和探索数据,选择的操作列会被标准化。元数据和探索数据可参考深度分析 > 实验功能使用 > 节点 > 数据。