什么是Kruskal-Wallis检验?
Kruskal-Wallis检验是一种统计检验,用于比较两个或多个连续或离散变量的组。它是一种非参数检验,这意味着它不假定你的数据有特定的分布,并且类似于单程方差分析(ANOVA)。克鲁斯卡尔-瓦利斯检验有时被称为单程行列方差分析或克鲁斯卡尔-瓦利斯单程方差分析。
Kruskal-Wallis检验的假设如下:
无效假设(H0)是人口中位数相等;
备择假设(H1)是人口中位数不相等,或人口中位数与其他组的人口中位数不同。
Kruskal-Wallis检验的假设
Kruskal-Wallis检验的假设详见下文:
假设数据为非正态分布或采取偏态分布,当数据遵循正态分布时,应使用单因素方差分析;
所关注的变量应该有两个或多个独立组。该检验最常用于分析三个或更多的组:对于分析两个组使用Mann-Whitney U检验来代替;
假设数据在各组之间有类似的分布;
数据应该是随机选择的独立样本,即各组之间应该没有关系;
每组样本应至少有5个观测值,以达到足够的样本量。
这些假设与Mann-Whitney U检验相似,因为Kruskal-Wallis检验本质上是该检验的延伸,有两个以上的独立样本。而且,与Mann-Whitney U检验相似,Kruskal-Wallis检验是基于对数据进行排序并计算出一个检验统计量。
何时使用Kruskal-Wallis检验
当数据的正态性假设不成立时,Kruskal Wallis检验和其他非参数(或无分布)检验对于检验假设是有用的。它们对数据分布的形状不做任何假设,这使得它们在数据集很小的时候特别有用。值得注意的是,在进行非参数统计检验时,它们往往会比参数检验给出更保守的结果(更大的P值)。当感兴趣的变量是连续的(在一个范围内的任何数字,如年龄、身高、血压)或离散的(具有某种可以计算的数值,如鞋码、医院就诊次数、家庭人口数)时,应使用Kruskal Wallis检验。
手动计算Kruskal-Wallis检验
一位在心理学领域工作的研究人员可能对年轻人的睡眠习惯和他们的心理健康之间的关系感兴趣。他们对15名年轻人进行了一项小型调查,这些人报告说每晚平均睡眠时间超过8小时、6-8小时或少于6小时。然后他们用一个有效的分数来衡量他们的心理健康状况。表1显示了收集到的不同睡眠类别的原始幸福感分数以及每个类别的幸福感中位数。