K-S检验

<< Click to Display Table of Contents >>

当前位置:  深度分析 > 实验功能使用 > 节点 > 统计分析 

K-S检验

复制链接

1.概述

K-S检验(Kolmogorov-Smirnov Test)是用来检验数据是否符合常见概率分布的检验算法,该算法以“该数据符合某分布”作为“原假设”,以“该数据不符合某分布”作为“备择假设(与原假设对立的假设)”。当输出的检验值p值大于0.05时,认为“原假设”成立;当检验值p值小于等于0.05时,认为“备择假设”成立。K-S检验还可以用于检测两数据是否符合同一分布,输入两列数据后,该算法以“这两列数据符合同一分布”作为“原假设”,以“这两列数据不符合同一分布”作为“备择假设”。当输出的检验值p值大于0.05时,认为“原假设”成立;当检验值p值小于等于0.05时,认为“备择假设”成立。

输入:1个数据集。

输出:图片、表格、数据集。

2.配置方法

将K-S检验节点添加到实验后,可通过右侧的“配置项目”页面,对K-S检验节点进行设置。

DepthAnalysis11

2.1参数列表

测试模式:用于设置K-S检测的模式,默认值为same_distribution_test,可选值:same_distribution_test:使用两列数据判断是否符合同一分布;common_distribution_test:使用一列或多列数据判断这些数据是否符合“目标分布”所选的分布。

当选择测试模式为common_distribution_test时,需要选择目标分布类型、分布类型对应的参数和目标分布容量。

目标分布类型:用于设置K-S检测所用的概率分布类型,默认值为norm,可选值:norm:以正态分布为目标进行检测。uniform:以均匀分布为目标进行检测。poisson:以泊松分布为目标进行检测。binom:以二项分布为目标进行检测。expon:以指数分布为目标进行检测。

当“目标分布类型”为norm时:

μ:正态分布的期望值,默认值为0.0,取值范围为任意小数。

σ:正态分布的标准差,默认值为1.0,取值范围为大于等于0.0的小数。

当“目标分布类型”为uniform时:

a:均匀分布的采样下界,默认值为0.0,取值范围为任意小数。,该参数有效。

b:均匀分布的采样上界,默认值为1.0,取值范围为大于a的小数。

当“目标分布类型”为poisson时:

λ:泊松分布的期望值和方差,默认值为0.0,取值范围为大于等于0.0的小数。

当“目标分布类型”为binom时:

n:二项分布实验的次数,默认值为2,取值范围为大于等于0的整数。n为1时是二项分布的特殊情况,伯努利分布。

p:二项分布实验中事件发生的概率,默认值为0.5,取值范围为大于0且小于1的小数。

当“目标分布类型”为expon时:

λ:指数分布的参数,默认值为1.0,取值范围为大于0的小数。

2.2选择变量

数据列:选择需要检验的数据列,当“测试模式”为same_distribution_test时,数据列只能选择两个数值类型的字段;当“测试模式”为common_distribution_test时,数据列可以选择一个或多个数值类型字段。

3.查看结果

可通过连接表格视图和图片视图或多视图来查看结论,包含每个数据列的数据分布图和假设分析表。当假设结论为true时,代表假设成立,为false时,代表假设不成立。

DepthAnalysis12

DepthAnalysis13