|||
P值,也就是Sig值或显著性值。如果P值小于0.01即说明某件事情的发生至少有99%的把握,如果P值小于0.05(并且大于0.01)则说明某件事情的发生至少有95%的把握。当P<0.01或P<0.05,则为说明水平显著。
相关系数,是研究变量之间线性相关程度的量,用于说明两个变量之间是否存在相关关系,以及相关关系的紧密程度。分为pearson相关系数、Spearman相关系数。一般相关系数在0.7以上说明关系非常紧密;0.4-0.7之间说明关系紧密;0.2~0.4说明关系一般。
显著性回答的问题是他们之间是否有关系,说明得到的结果是不是偶然因素导致的(具有统计学意义);相关系数回答的问题是相关程度强弱。
假如说我得到”P<0.05,相关系数 R=0.279”,意味着二者之间确实(P<0.05)存在相关关系,而相关性为0.279。
而如果“P>0.05 相关系数R=0.799”,则意味着二者之间相关性很强(R=0.799),而这个高相关的结果可能是偶然因素导致的,即不具有统计学意义。
"r"称作“相关系数”,全称其实为Pearson直线相关系数(Pearson correlation coefficient),用于衡量两个定量变量之间线性关系的方向和密切程度。
r取值范围在-1到1之间,数值为正表明变量之间呈正相关(例如教育程度和收入等),数值为负表明变量之间呈负相关(例如吸烟量与肺功能等)。
r值接近0说明线性相关弱;绝对值接近1(即-1或 1)表明线性关系强。
值得提醒的是,如果r=0只能说明两变量不存在“线性相关”,并不表示两变量完全无关。比如当数据存在“曲线相关”时,Pearson相关系数也为0,但两变量是存在相关关系的。
总结而言,使用Pearson相关系数,需要注意:
1)两个变量都为“定量变量”;
2)在计算过程中,r消除了量纲(即单位,因为除掉了标准差),所以它只是一个数值,可以互相比较;
3)当数据存在明显的离群值时,要有慎用相关,可以分别计算纳入和不纳入离群值的相关系数,从而更准确的判断两变量的相关关系;
4)r=0表示无“线性相关”关系,但两变量可能存在非线性的相关。