<< Click to Display Table of Contents >> K-S检验复制链接 |
1.概述
K-S检验(Kolmogorov-Smirnov Test)是用来检验数据是否符合常见概率分布的检验算法,该算法以“该数据符合某分布”作为“原假设”,以“该数据不符合某分布”作为“备择假设(与原假设对立的假设)”。当输出的检验值p值大于0.05时,认为“原假设”成立;当检验值p值小于等于0.05时,认为“备择假设”成立。K-S检验还可以用于检测两数据是否符合同一分布,输入两列数据后,该算法以“这两列数据符合同一分布”作为“原假设”,以“这两列数据不符合同一分布”作为“备择假设”。当输出的检验值p值大于0.05时,认为“原假设”成立;当检验值p值小于等于0.05时,认为“备择假设”成立。
输入:1个数据集。
输出:图片、表格、数据集。
2.配置方法
将K-S检验节点添加到实验后,可通过右侧的“配置项目”页面,对K-S检验节点进行设置。
2.1参数列表
测试模式:用于设置K-S检测的模式,默认值为same_distribution_test,可选值:same_distribution_test:使用两列数据判断是否符合同一分布;common_distribution_test:使用一列或多列数据判断这些数据是否符合“目标分布”所选的分布。
当选择测试模式为common_distribution_test时,需要选择目标分布类型、分布类型对应的参数和目标分布容量。
目标分布类型:用于设置K-S检测所用的概率分布类型,默认值为norm,可选值:norm:以正态分布为目标进行检测。uniform:以均匀分布为目标进行检测。poisson:以泊松分布为目标进行检测。binom:以二项分布为目标进行检测。expon:以指数分布为目标进行检测。
当“目标分布类型”为norm时:
μ:正态分布的期望值,默认值为0.0,取值范围为任意小数。
σ:正态分布的标准差,默认值为1.0,取值范围为大于等于0.0的小数。
当“目标分布类型”为uniform时:
a:均匀分布的采样下界,默认值为0.0,取值范围为任意小数。,该参数有效。
b:均匀分布的采样上界,默认值为1.0,取值范围为大于a的小数。
当“目标分布类型”为poisson时:
λ:泊松分布的期望值和方差,默认值为0.0,取值范围为大于等于0.0的小数。
当“目标分布类型”为binom时:
n:二项分布实验的次数,默认值为2,取值范围为大于等于0的整数。n为1时是二项分布的特殊情况,伯努利分布。
p:二项分布实验中事件发生的概率,默认值为0.5,取值范围为大于0且小于1的小数。
当“目标分布类型”为expon时:
λ:指数分布的参数,默认值为1.0,取值范围为大于0的小数。
2.2选择变量
数据列:选择需要检验的数据列,当“测试模式”为same_distribution_test时,数据列只能选择两个数值类型的字段;当“测试模式”为common_distribution_test时,数据列可以选择一个或多个数值类型字段。
3.查看结果
可通过连接表格视图和图片视图或多视图来查看结论,包含每个数据列的数据分布图和假设分析表。当假设结论为true时,代表假设成立,为false时,代表假设不成立。