标准化

<< Click to Display Table of Contents >>

当前位置:  深度分析 > 实验功能使用 > 节点 > 数据变换 

标准化

复制链接

1.概述

标准化主要用于消除特征间单位和尺度差异的影响。

在机器学习中,我们可能要处理不同种类的资料。

例如:音讯和图片上的像素值,这些资料可能是高维度的,资料标准化后会使每个特征中的数值平均变为0(将每个特征的值都减掉原始资料中该特征的平均)、标准差变为1。

这个方法被广泛的使用在许多机器学习算法中。

例如:支持向量机、逻辑回归和MLP。

输入:标准化节点的左耳可连接数据节点,对该数据节点的数据进行标准化处理。

输出:数据集,也可连接其他算子节点进行后续计算。

2.配置方法

将标准化节点添加到实验后,可通过右侧的“配置项目”页面,对数据标准化进行设置。

DepthAnalysis_Standardization

2.1参数列表

方式:该参数是用来指定合适的规范化方法,标准化方式有三种:StandardScaler、MinMaxScaler、MaxAbsScaler。

StandardScaler:标准化,每个特征中的数值平均变为0 。

MinMaxScaler:最小最大值标准化,它默认将每种特征的值都归一化到[0,1]之间。

MaxAbsScale:绝对值最大标准化,它通过除以最大值将训练集缩放至[-1,1]。

2.2选择变量

操作列:在操作列选择需要被标准化的列。在选择数据弹窗选择列,输出结果为所有列(其中已选择列会经过处理得到标准化后数据)。

说明:不支持文本类型。

选择数据页面操作见深度分析 > 使用功能使用 > 节点 > 插件节点 > 选择数据

3.查看结果

可以连接数据集视图查看标准化输出数据,数据集视图会显示所有数据的元数据和探索数据,选择的操作列会被标准化。元数据和探索数据可参考深度分析 > 实验功能使用 > 节点 > 数据

DepthAnalysis_Standardization1