在描述性统计方法中,一般来说每个问题只涉及一个变量,反映相应指标的变化情况。而对于两个或两个以上相关现象之间的因果关系,我们将考虑下面的几种分析方法:相关分析、回归分析和方差分析。其中相关分析和回归分析适合于因变量和自变量均为连续变量的情况,如“质量”和“用户满意度”的相关关系;而方差分析则适用于因变量为分类变量、自变量为连续变量的情况,如“收入”对“用户满意度”的影响。下面我们将介绍简单的相关分析。
在所有相关分析中,最简单的是两个因素之间的线性相关,它只涉及一个自变量和一个因变量。而且自变量数值发生变动,因变量的数值也发生大致均等的变动。从平面图上观察各点的分布近似地表现为一条直线,这种相关关系称为直线相关(也叫线性相关),如图所示。
线性相关分析常用相关系数r来表示两个变量间相互的关系,并判断其密切程度。相关系数r没有单位,在-1到+1之间波动,其绝对值越接近1,两个变量之间的相关关系越密切。不同r值的相关关系如图所示:
正相关:Y随X的增加而增加,X亦随Y的增加而增加,0<r<1。
负相关:Y随X的增加而减少,X亦随Y的增加而减少,-1<r<0。
无相关:不论X增加或减少,Y的大小不受其影响;反之亦然,r=0。
非线性相关:各点的排列不是直线趋势,呈某种曲线形状,此时求r已经没有多大意义。
示例 SIM手机质量和用户满意度相关分析
为分析SIM手机“质量”和“用户满意度”的相关关系,首先需要做两个变量的散点图,利用SPSS的绘图功能,做散点图如下:
散点图趋势表明,SIM手机质量和用户满意度成正相关的关系,即随着SIM手机质量的提高,它的用户满意度也会提高;而如果质量降低,它的用户满意度也会相应地降低。
利用SPSS软件的相关分析,得到两个变量的相关系数r为0.875,接近于1,进一步说明两个变量高度正相关。 |