<< Click to Display Table of Contents >> 标准化复制链接 |
1.概述
数据的标准化(normalization)是将数据按比例缩放,使之落入一个小的特定区间。在某些比较和评价的指标处理中经常会用到,去除数据的单位限制,将其转化为无量纲的纯数值,便于不同单位或量级的指标能够进行比较和加权。
2.配置参数
拖拽一个数据集和一个标准化节点到画布,连接数据集和标准化节点。
将标准化节点添加到实验后,可通过右侧的”配置项目“页面,对数据标准化进行设置。
【方式】标准化方式有两种:离差标准化,Z-Score标准化。离差标准化是对原始数据的线性变换,使结果落到[0,1]区间。Z-Score标准化处理的数据符合标准正态分布,即均值为0,标准差为1。
【选择列】需要被标准化的数据类型的列。
设置标准化后,可查看标准化后的元数据、对数据进行过滤、探索数据。
元数据和探索数据可参考深度分析>实验功能使用>节点>数据。