hyc3140

https://bbs.iikx.com/?4

Kruskal-Wallis H检验(Kruskal-Wallis H Test)

热度 1已有 5386 次阅读2023-6-30 16:01 |个人分类:统计|系统分类:医学科学

Kruskal-Wallis H检验(Kruskal-Wallis H Test)用于推断计量资料或等级资料的多个独立样本所来自的多个总体分布是否有差别。在理论上检验假设H0应为多个总体分布相同，即多个样本来自同一总体。由于H检验对多个总体分布的形状差别不敏感，故在实际应用中检验假设H0可写作多个总体分布位置相同。对立的备择假设H1为多个总体分布位置不全相同。

一、适用条件

条件1：有一个观察变量和一个分组变量。

条件2：观察变量为非正态分布或方差不齐的连续变量或有序分类变量。

条件3：存在多个分组(k≥2)。

条件4：观察变量是相互独立的观测值。

什么是Kruskal-Wallis检验？

Kruskal-Wallis检验是一种统计检验，用于比较两个或多个连续或离散变量的组。它是一种非参数检验，这意味着它不假定你的数据有特定的分布，并且类似于单程方差分析（ANOVA）。克鲁斯卡尔-瓦利斯检验有时被称为单程行列方差分析或克鲁斯卡尔-瓦利斯单程方差分析。

Kruskal-Wallis检验的假设如下：

无效假设（H0）是人口中位数相等；

备择假设（H1）是人口中位数不相等，或人口中位数与其他组的人口中位数不同。

Kruskal-Wallis检验的假设

Kruskal-Wallis检验的假设详见下文：

假设数据为非正态分布或采取偏态分布，当数据遵循正态分布时，应使用单因素方差分析；

所关注的变量应该有两个或多个独立组。该检验最常用于分析三个或更多的组：对于分析两个组使用Mann-Whitney U检验来代替；

假设数据在各组之间有类似的分布；

数据应该是随机选择的独立样本，即各组之间应该没有关系；

每组样本应至少有5个观测值，以达到足够的样本量。

这些假设与Mann-Whitney U检验相似，因为Kruskal-Wallis检验本质上是该检验的延伸，有两个以上的独立样本。而且，与Mann-Whitney U检验相似，Kruskal-Wallis检验是基于对数据进行排序并计算出一个检验统计量。

何时使用Kruskal-Wallis检验

当数据的正态性假设不成立时，Kruskal Wallis检验和其他非参数（或无分布）检验对于检验假设是有用的。它们对数据分布的形状不做任何假设，这使得它们在数据集很小的时候特别有用。值得注意的是，在进行非参数统计检验时，它们往往会比参数检验给出更保守的结果（更大的P值）。当感兴趣的变量是连续的（在一个范围内的任何数字，如年龄、身高、血压）或离散的（具有某种可以计算的数值，如鞋码、医院就诊次数、家庭人口数）时，应使用Kruskal Wallis检验。

手动计算Kruskal-Wallis检验

一位在心理学领域工作的研究人员可能对年轻人的睡眠习惯和他们的心理健康之间的关系感兴趣。他们对15名年轻人进行了一项小型调查，这些人报告说每晚平均睡眠时间超过8小时、6-8小时或少于6小时。然后他们用一个有效的分数来衡量他们的心理健康状况。表1显示了收集到的不同睡眠类别的原始幸福感分数以及每个类别的幸福感中位数。

表1

每晚的睡眠时间	幸福感分值	中位数
>超过8小时	42, 34, 57, 69, 55	55
6-8小时	29, 66, 46, 68, 42	46
<6小时	16, 32, 35, 66, 59	35

由于我们所处理的是一个离散的结果变量，三个独立的小组，一个小的样本量，并且不能假设小组中的正态分布，所以Kruskal-Wallis检验适合于检验不同睡眠类别的幸福感得分是否存在差异。广泛使用的统计软件可以很容易地计算出这种统计检验，但通过手工操作，我们可以分五步完成。
第一步：提出无效假设和备择假设
本例中的假说如下：