相关性系数和显著性水平

已有 11091 次阅读2023-10-18 17:22 |个人分类:统计|系统分类:数理科学| 相关性

在统计学中,皮尔逊相关系数( Pearson correlation coefficient),又称皮尔逊积矩相关系数(Pearson product-moment correlation coefficient,简称 PPMCC或PCCs),是用于度量两个变量X和Y之间的相关(线性相关),其值介于-1与1之间。

P值,也就是Sig值或显著性值。如果P值小于0.01即说明某件事情的发生至少有99%的把握,如果P值小于0.05(并且大于0.01)则说明某件事情的发生至少有95%的把握。当P<0.01或P<0.05,则为说明水平显著。

相关系数,是研究变量之间线性相关程度的量,用于说明两个变量之间是否存在相关关系,以及相关关系的紧密程度。分为pearson相关系数Spearman相关系数。一般相关系数在0.7以上说明关系非常紧密;0.4-0.7之间说明关系紧密;0.2~0.4说明关系一般。

显著性回答的问题是他们之间是否有关系,说明得到的结果是不是偶然因素导致的(具有统计学意义);相关系数回答的问题是相关程度强弱。

假如说我得到”P<0.05,相关系数 R=0.279”,意味着二者之间确实(P<0.05)存在相关关系,而相关性为0.279。

而如果“P>0.05 相关系数R=0.799”,则意味着二者之间相关性很强(R=0.799),而这个高相关的结果可能是偶然因素导致的,即不具有统计学意义。


"r"称作“相关系数”,全称其实为Pearson直线相关系数(Pearson correlation coefficient),用于衡量两个定量变量之间线性关系的方向和密切程度。

r取值范围在-1到1之间,数值为正表明变量之间呈正相关(例如教育程度和收入等),数值为负表明变量之间呈负相关(例如吸烟量与肺功能等)。

r值接近0说明线性相关弱;绝对值接近1(即-1或 1)表明线性关系强。

值得提醒的是,如果r=0只能说明两变量不存在“线性相关”,并不表示两变量完全无关。比如当数据存在“曲线相关”时,Pearson相关系数也为0,但两变量是存在相关关系的。

总结而言,使用Pearson相关系数,需要注意:

1)两个变量都为“定量变量”;

2)在计算过程中,r消除了量纲(即单位,因为除掉了标准差),所以它只是一个数值,可以互相比较;

3)当数据存在明显的离群值时,要有慎用相关,可以分别计算纳入和不纳入离群值的相关系数,从而更准确的判断两变量的相关关系;

4)r=0表示无“线性相关”关系,但两变量可能存在非线性的相关。


路过

鸡蛋

鲜花

握手

雷人

评论 (0 个评论)

facelist

您需要登录后才可以评论 登录 | 注册

返回顶部