11月20日上午,suncitygroup太阳新城官网《学界讲堂》第六期在商管楼会议室圆满举行。本次讲座由肖淑红院长主持,由北美体育管理协会(NASSM)主席、上海体育学院管理学院名誉院长、佐治亚大学正教授张建辉教授讲授。
此次讲座是学界讲堂科研专题系列的第四讲,接下来张教授还会为我们带来最后一次精彩讲授。在今天的讲座中,张教授为我们带来了关于计量统计学中相关性研究的内容。
在生活中,随处可见关于变量的统计,而这些变量的变化在统计学中也具有不同的意义。比如在体育比赛中,跳高成绩的变化虽然微小,但成绩每增高0.1米,就会有质的突破。而在人体生理学统计中,体脂率从20%增至30%,与从30%增至40%相比,虽然在数量上都是10%的变化,但是人体的健康程度却有了非常大的差距。
相关系数是一个数字索引,它可以提供有关同一个人的两个或多个变量之间的关系性质的信息,而不仅仅是关系是否存在。当涉及两个变量时,称为简单相关。如果涉及两个以上的变量,则称为多重相关。
例如,当研究人的自信程度和打击率之间的关系时,我们首先要对两个变量做出相关性判断。确定两个变量之间关系性质的第一步,就是绘制数据图, 散点图是两个变量中关乎每个人对应数值的图表。相关系数的计算值,是散点图中点的一般模式的斜率,和包围点的椭圆的宽度的相关函数。
通过图示可以看到,变量之间的相关关系有正相关、负相关、不相关、独立四种情况,而根据数据分布的离散程度,又可以将相关程度分为强相关、弱相关和中度相关。
而在相关性的量上,我们将相关性用“r”表示,范围从-1到+1。当散射图的斜率为正或负时,相关系数的符号为正或负。当椭圆宽度较窄时,关联度越大,相关系数越大。系数的符号表示关系的方向,系数的绝对值表示关系的大小。
在相关性的类型上,有几种类型的相关系数,但在特定研究情况下应使用的相关系数主要取决于相关变量的测量水平(名义、序数、区间和比率)。此外,每种相关系数都有其特殊的假设。
行为科学中最常用的相关系数是皮尔逊积矩相关系数(PPMCC)。在使用皮尔逊积矩寻找变量相关性时,有许多的前提假设,PPMCC的假设需要包括以下内容:1.所有参数统计量;2.线性;3.同构性;4.连续数据。
因为皮尔逊的方法有很多严格的前提假设,所以在实际运用过程中,及时检验结果显示不显著也没有关系,这也是对后期他人研究工作的一种提醒,这种尝试可以使我们更加明确应该研究的领域是什么。
R^2被称为决定系数,它是相关系数的平方。决定系数表示相关的两个变量之间的共享方差的比例。相关系数大小的决定应该通过推断统计学来检验,解释相关系数的经验法则如下:
影响相关性的因素包括:1.两个变量的关联性(相关性越大,组内的关联性越强);2.群体的同质性(越相似,相关性越低;例如,对于男性和女性,两个变量可能彼此不相关,但是,当男性和女性被拉在一起时,它们可能是相关的);3.测量的可靠性(不可靠的测量低估了相关性)。
相关系数的使用包括但不限于:1.两个变量之间的关联;2.从一个变量预测另一个变量;3.可靠性检验;4.有效性检验。
除了皮尔逊积矩相关系数检验法外,张教授还解释了多重线性相关问题的一些检验方法和注意事项,并表示在接下来的讲授中向我们介绍信效度检验的一些方法。
最后,肖淑红院长就精彩的讲座内容向张教授表示了感谢,并期待下期张教授能对同学们提出的有关冰球的问题进行解答。
文:学术外联部 张博祎
图片:新闻宣传部 张明珠
编辑:新闻宣传部 邹承尧