在相关分析和回归分析中,往往要求自变量和因变量均为连续变量,而对于因变量为连续变量、自变量为分类变量的情况,一般要使用方差分析的方法。比如说,如果我们要分析不同年龄或不同收入的被调查者对产品的满意情况是否有明显的差异,或者说年龄或收入对“用户满意度”有没有影响,就不能用上面提到的相关分析或回归分析,而只能用方差分析方法。
方差分析在SPSS统计软件里可以实现,包括一元方差分析(Analysis of Variance,ANOVA)、协方差分析(Analysis of Covariance,ANCOVA)和多元方差分析(Multivariate Analysis of Variance,MANOVA),在这里,我们只简单介绍一元方差分析,至于协方差分析和 多元方差分析均是一元方差分析的推广,具体可以参考相关的统计学书籍。
一元方差分析是为了简化多个T检验而建立的综合性更强的分析方法。在统计分析中,如果我们要比较两组样本的平均值是否有显著性差异,比如说比较男性和女性的用户满意度是否有显著性的差异,一般可以采用T检验的方法。但是在涉及到多组分类数据的时候,比如说在对某品牌的调查中,高收入、低收入和中等收入的被调查者的用户满意度是否有显著性差异,这时如果要用T检验,就必须对高收入和低收入、低收入和中等收入、中等收入和高收入的被调查者进行两两比较,显得十分繁琐。因此,我们常用综合性更强的方差分析来取代。
方差分析将提出问题的方式进行了变化,即是否至少有一组数据的平均值与其它组的平均值有显著性差异。比如说,对于上面所述的三种收入的被调查者,是否有一种收入的被调查者的用户满意度的平均值与其它收入的被调查者的用户满意度有显著性差异。方差分析的思路是将所有样本的总变动分成两个部分,一部分是组内变动(within groups),代表本组内各样本与该组平均值的离散程度;另一部分是组间变动(between groups),代表各组平均值关于总平均值的离散程度。将这两个变动部分除以它们所对应的自由度,即得到均方差。然后,用组间变动的均方差除以组内变动的均方差,即可得到F检验值,根据统计值对应的显著性水平就可以判断不同组间是否有显著性的差异。事实上,如果不同组间的差异越大,组内的离散程度越小,那么组间变动的均方差越大,组内变动的均方差越小,即F值越大,越容易通过显著性水平检验。
示例 SIM手机不同收入水平被调查者的用户满意度方差分析
我们分析SIM手机三种收入水平的被调查者的用户满意度是否有显著性差异,研究被调查者的收入水平是否会影响其对SIM手机的满意程度,用SPSS软件的方差分析结果如下:
|
Sum of Squares |
df |
Mean Square |
F |
Sig. |
Between Groups |
6.863 |
2 |
3.432 |
0.674 |
0.51 |
Within Groups |
1333.341 |
262 |
5.089 |
|
|
Total |
1340.204 |
264 |
|
|
|
表中Sum of Squares表示组内和组间的变动情况,df代表自由度,Mean Square代表均方差,F检验值0.674,显著性水平0.51。一般情况下,显著性水平0.1以下差异显著。对于SIM手机来说,不同收入水平方差分析F值显著性水平0.51,没有通过显著性水平检验,说明三种收入的被调查者的用户满意度没有显著性差异,即被调查者的收入水平并不影响其对SIM手机的满意程度。
|