第五章相关分析

《第五章相关分析》由会员分享,可在线阅读,更多相关《第五章相关分析(34页珍藏版)》请在文档大全上搜索。
1、2022-6-1安徽工业大学安徽工业大学 管理学院管理学院1相关分析相关分析(Correlation Analysis)2022-6-1安徽工业大学安徽工业大学 管理学院管理学院2相关分析的意义相关分析的意义v寻找变量间的关系是科学研究的首要目的。变量间的关系最简单的划分即:有关与无关。v在统计学上,我们通常这样判断变量之间是否有关:如果一个变量的取值发生变化,另外一个变量的取值也相应发生变化,则这两个变量有关。如果一个变量的变化不引起另一个变量的变化则二者无关。2022-6-1安徽工业大学安徽工业大学 管理学院管理学院3二、相关分析的概念二、相关分析的概念n 变量之间的关系分为确定性关系和非
2、确定性关系。确定性关系:当一个变量值(自变量)确定后,另一个变量值(因变量)也就完全确定了,确定性关系往往可以表示成一个函数的形式,比如圆的面积和半径的关系: S=r 非确定性关系:给定了一个变量值后,另一个变量值可以在一定范围内变化,例如家庭的消费支出和家庭收入的关系。 研究者把非确定性关系称为相关关系。2022-6-1安徽工业大学安徽工业大学 管理学院管理学院4 1 通通过过考考试试 2 未未通通过过考考试试 1男男性性 40% 60% 2女女性性 40% 60% 总总计计 40% 60% 性别与四级英语考试通过率的相关统计性别与四级英语考试通过率的相关统计表述:统计结果显示,当性别取值不
3、同时,通过率变量表述:统计结果显示,当性别取值不同时,通过率变量的取值并未发生变化,因此性别与考试通过率无关。的取值并未发生变化,因此性别与考试通过率无关。自变量的不同取值在因变量上无差异,两变量无关。自变量的不同取值在因变量上无差异,两变量无关。自变量的不同取值在因变量上有差异,两变量有关。自变量的不同取值在因变量上有差异,两变量有关。2022-6-1安徽工业大学安徽工业大学 管理学院管理学院5 每月工资平均数 N 1 男性 752.40 452 2 女性 601.97 409 总计 680.95 861 表述:统计结果显示,当性别取值不同时,收入变表述:统计结果显示,当性别取值不同时,收入
4、变量的取值发生了变化,因此性别与月收入有关。量的取值发生了变化,因此性别与月收入有关。自变量因变量2022-6-1安徽工业大学安徽工业大学 管理学院管理学院6三、相关系数三、相关系数n相关分析的主要目的是研究变量之间关系的密切程度,相关分析的主要目的是研究变量之间关系的密切程度,以及根据样本的资料推断总体是否样关。反映变量之以及根据样本的资料推断总体是否样关。反映变量之间关系紧密程度的指标主要是相关系数间关系紧密程度的指标主要是相关系数rnPearson相关系数应用广泛,其计算公式及其性质如相关系数应用广泛,其计算公式及其性质如下:下:22)()()(yyxxyyxxr不相关与时,表示当为负相
5、关与时,表示当为正相关与时,表示当高度相关显著相关、低度相关微弱相关、yxryxryxrrrrr00018 . 08 . 05 . 05 . 03 . 03 . 02022-6-1安徽工业大学安徽工业大学 管理学院管理学院7双变量关系的统计类型双变量关系的统计类型 定类 定序 定距 定类 列联 cross-tabulate 列联 cross-tabulate 方差分析(分组平均数) compare means 定序 列联 cross-tabulate 积差相关 spearman correlation 积差相关 spearman correlation 积矩相关 pearson correla
6、tion 定距 积矩相关 pearson correlation 回归 regression 2022-6-1安徽工业大学安徽工业大学 管理学院管理学院8 定类 定序 定距 定类 卡方类测量 卡方类测量 Eta 系数 定序 Spearman相关系数 同 序 - 异 序对测量 Spearman 相关系数 定距 Pearson 相关系数 2022-6-1安徽工业大学安徽工业大学 管理学院管理学院9四、四、SPSS中相关分析中相关分析n在在Analyze的下拉菜单的下拉菜单Correlate命令项中有三命令项中有三个相关分析功能子命令个相关分析功能子命令:n Bivariate(两两相关分析过程)(
7、两两相关分析过程)n Partial (偏相关分析过程)(偏相关分析过程)n Distances(距离分析过程)(距离分析过程)2022-6-1安徽工业大学安徽工业大学 管理学院管理学院10Bivariate过过程程2022-6-1安徽工业大学安徽工业大学 管理学院管理学院11nBivariate过程用于进行两个或多个变量间的相关分析,如为多个变量,给出两两相关的分析结果。nPartial过程,当进行相关分析的两个变量的取值都受到其他变量的影响时,就可以利用偏相关分析对其他变量进行控制,输出控制其他变量影响后的相关系数。nDistances过程用于对同一变量各观察单位间的数值或各个不同变量间进
8、行相似性或不相似性分析一般不单独使用,而作为因子分析等的预分析。2022-6-1安徽工业大学安徽工业大学 管理学院管理学院12n在进行相关分析时,散点图是重要的工具,分析前应先做散点图,以初步确定两个变量间是否存在相关趋势,该趋势是否为直线趋势,以及数据中是否存在异常点。否则可能的出错误结论。nBivariate相关分析的步骤:相关分析的步骤:输入数据后,依次单击AnalyzeCorrelateBivariate,打开Bivariate Correlations对话框如图512022-6-1安徽工业大学安徽工业大学 管理学院管理学院13图图51 Bivariate Correlations 对
9、话框对话框不清楚变量之间是正相关还是不清楚变量之间是正相关还是负相关时选择此项。负相关时选择此项。清楚变量之间是正相关还是负清楚变量之间是正相关还是负相关时可选择此项。相关时可选择此项。计算积距相关系数,连续计算积距相关系数,连续性变量才可采用。性变量才可采用。计算计算Kendall秩相关系数,秩相关系数,适合于定序变量或不满足适合于定序变量或不满足正态分布假设的等间隔数正态分布假设的等间隔数据。据。计算计算Spearman秩相关系秩相关系数,适合于定序变量或不数,适合于定序变量或不满足正态分布假设的等间满足正态分布假设的等间隔数据。隔数据。在输出结果中,相关系数的在输出结果中,相关系数的右上
10、角上有右上角上有“”则表示显则表示显著性水平为著性水平为0.05;右上角上;右上角上有有“”则表示显著性水则表示显著性水平为平为0.01。见图见图522022-6-1安徽工业大学安徽工业大学 管理学院管理学院14图图52 Optins 对话框对话框对每一个变量输出对每一个变量输出均值、标准差和无均值、标准差和无缺省值的观测数。缺省值的观测数。对每一个变量输出对每一个变量输出交叉距阵和协方差交叉距阵和协方差距阵。距阵。计算某个统计量时,在这一计算某个统计量时,在这一对变量中排除有缺省值的观测对变量中排除有缺省值的观测值。值。对于任何分析,有缺省值的对于任何分析,有缺省值的观测值都会被排除。观测值
11、都会被排除。2022-6-1安徽工业大学安徽工业大学 管理学院管理学院15观测观测 号号12345678910体重体重(克)(克)83726990909590917570鸡冠重鸡冠重(毫克)(毫克)564218845610790683148连续变量相关分析实例数据表连续变量相关分析实例数据表相关分析实例相关分析实例1、连续变量的相关分析实例、连续变量的相关分析实例 十只小鸡的体重与鸡冠的数据如表所示(数据文件:小鸡(相关)小鸡(相关).sav):2022-6-1安徽工业大学安徽工业大学 管理学院管理学院16分析步骤1 1)输入数据,依次单击)输入数据,依次单击AnalyzeCorrelateA