视频字幕
多变量正态分布是许多统计分析方法的重要前提假设。在SPSS中,我们需要结合使用三种主要方法来检验数据是否符合多变量正态分布:单变量正态性检验、变量间散点图检查,以及马氏距离异常值检测。
单变量正态性检验是多变量正态性检验的第一步。在SPSS中,我们通过分析菜单进入描述统计的探索功能。将需要检验的变量移入因变量列表,然后在图选项中勾选正态性图。系统会输出Shapiro-Wilk检验结果,如果p值小于0.05,则拒绝正态分布假设。
变量间散点图检查是评估多元正态性的重要方法。在SPSS中,通过图表构建器选择矩阵散点图,将所有变量移入矩阵变量框。如果数据符合多元正态分布,任意两个变量的散点图应该呈现椭圆形分布。如果看到扇形分布或明显的聚集现象,则可能偏离多元正态分布。
马氏距离异常值检测是评估多元正态性的第三种方法。在SPSS中,通过分析菜单进入线性回归,任选一个变量作为因变量,将所有变量作为自变量。在保存选项中勾选马氏距离,系统会生成MAH下划线1变量。在多元正态分布下,马氏距离的平方服从卡方分布。如果某个观测值的马氏距离远大于卡方临界值,则该观测值可能是多元异常值,表明数据偏离多元正态分布。
总结一下,在SPSS中进行多变量正态分布检验需要综合使用三种方法。首先检查单变量正态性,这是必要但非充分条件。然后观察变量间散点图,椭圆形分布表明符合多元正态假设。最后通过马氏距离检测多元异常值。只有综合这三种方法的结果,才能准确判断数据是否符合多元正态分布假设。