登陆注册
12242200000055

第55章 统计分析(6)

复相关(multiplecorrelation)是以一个统计值简化多个自变量(X1,X2……Xa)与一个依变量(Y)的关系的统计方法,可表示为:

复相关是以积距相关为基础,统计值的值域是(0,1),只表示相关的强弱,不表示相关的方向,因为各自变量对依变量的影响的方向可能是不同的,不可能求得共同的影响方向。相关的平方值2称为决定系数(coefficientofdetermination),具有消减误差比例的意义。1-2是剩余误差,通常称为疏离系数(coefficientofalienation)。

为了形象地表达复相关系数的基本逻辑,我们用下面的三环图表示两个自变量X1和X2与Y的相关:

在左图中三个圆分别代表Y、X1和X2,整个圆代表当不知X1和X2时,仅用Y本身的平均值预测每个个案的Y值时全部的误差。当我们用X1来预测Y时,所消减的误差比例是21,即斜线阴影部分。当我们再引进X2来预测Y时,由于X2消减的误差中有一部分,即一个圆相交的斜线阴影部分已被X1所消减。

因此,要控制X1的影响才求得引进X2后能增加多少被消减的误差,用部分净相关可求得此结果,此结果以2(2,1)代表。在图中便是麻点阴影部分。因此X1和X2共同消减的误差是:

用于计算复相关的数据资料原则上必须满足两个前提条件:第一是各自变量与依变量的关系在分布上呈直线;第二是严格而言,复相关以下将要介绍的多元回归、因径分析和因素分析的每个项目或变量都应该是定距或以上测量层次,但是社会学研究中定距变量毕竟是少数,大量的变量都是定类或定序的。对于定序变量,如果希望采取复相关,多元回归等较为深入的统计方法。可以将之变为虚构变量。但是,这样做颇为麻烦。因此,一些社会学研究者宁愿将定序变量当作定距变量来分析(李沛良,1987)。尤其是当变量是由多个定序的项目相加而成时,等级增多了,比单个项目的定序较为接近定距变量。将定序变量当作定距变量分析在一定程度上有损与统计的精确性,但是为了能使用较为细致、深入的统计方法。这样做有时还是可取的。

三、多元回归分析

复相关测量两个以上的自变量与一个依变量的总相关。但是不能以各个个案的两个以上的自变量估计或预测一个依变的数值,同时也无法比较哪个自变量对依变量的影响力较强。在介绍了如何运用简单直线回归分析以一个自变量预测一个依变的数值。以简单直线回归为基础发展的多因直线回归分析(multiplelinearregressionanalysis)则可以解决上述复相关不能解决的两个问题,多因直线回归分析可表示为;我们曾介绍简单直线回归方程:

简单直线回归方程经标准化后成为直线回归方程:

相应的,分析多个自变量对一个依变量的影响的多因直线回归方程多是:

an表示n个自变量的回归方程式的截距,b是净回归系数,反映控制其他变量后,某个X变量对Y的影响力,与简单直线回归一样,多元直线回归方程式也是根据最小平方准则建立的。可以根据若干个自变量X值估计或预测依变量Y值。但是由于各自变量的单位不同。各b值的值域不固定,无法根据其大小比较各个自变量X对Y的影响力。如果要作比较,必须标准化将每个个案自变量和依变量的数值都转为标准值。用标准值建立标准多元直线回归方程式经过标准化,各X值和Y值的平均值都等于零,因此标准多元直线回归方程中的截距α等于零,方程中的β是标准净回归系数。其值域是[-1,1],可反映X对Y的影响力和方向,比较各β便可知道X对Y的相对影响力。

那么如何计算多元直线回归方程呢?

首先介绍两个自变量的分析,其模型是:

当只有两个自变量X1、X2时,求β1、β2的公式推导已经介绍过,当在3个自变量X1、X2、X3时,β1、β2、β3推导的道理是相同的。

因为:1=Σβnni

所以,当有3个自变量X1、X2、X3时;由于自身的相关低于1,并且截距相关是对称的,12=21,因此上述方程组可简化为:

1=β1+β221+β331

2=β112+β2+β332

3=β113+β223+β3

其实根据上面的这组公式,只要求得由4个变量组合的相关,不必像前面介绍的两自变量的β计算时作β的公式整理推导,直接将各相关系数代入上面的方程组,便可解出β1、β2和β3,根据β和b的关系,又可求得b1、b2和b3的值:

求得b1、b2和b3,便可计算截距:

a3=Y-b1X1-b2X2-b3X3

多元直线回归必须注意下列三个问题:

第一,直线关系。多元直线回归要各自变量与依变量的关系是直线的,如果发现资料中自变量与依变量的关系显曲线状态,解决的办法有两个:一是将变量转换为对数,倒数或方根等;二是采用多项式回归分析(polynominalregressionanalysis)。

第二,统计累赘。如果要比较3个以上的自变量对依变量的相对影响力,即比较β1、β2和β3的大小时,必须注意统计累赘(statisticalredundancy)的问题,β代表控制其他变量后其相应的自变量对依变量的相对影响力。例如β1=βY(1.23)代表控制了X1和X3后X2对Y的影响力。如果其中的两个自变量,如X1和X2之间的关系特别强在互相控制后会使各自的影响β1和β2显得微弱,而其他变量,X3的影响β3便会显得比β1和β2强。但是,可能实际上X1和X2对Y的影响力比X3大,这便是统计累赘的问题。为了避免统计累赘的问题,在选择自变量时不要引进互相之间相关强的变量。同时也不要随便引进不很重要的自变量。

第三,统计互动。统计互动(statisticalinteraction)是指两个或两个以上的自变量共处时可能会产生一种不同于它们各自的效果之和的互动效果①。

第六节推论统计简介

一、推论统计一般概念

推论统计是一门通过样本的统计值来估计总体的参数值的学问。在社会研究中,我们很少做普查,更多的是做抽样调查,所描述分析的资料也多为样本资料。

对样本资料的分析是叙述统计,如前所述,集中趋势、离散程度、相关分析、回归分析等。然而,抽样调查的目的是要由样本特征对总体作出结论,这就是推论统计。

推论统计分为两大类:(1)参数估计(parameterestimation);(2)假设检验(hypothesistesting)。所谓参数的估计,就是根据一个随机样本的统计值来估计总体之参数值是多少。例如,由样本算出的每月收入平均值680元,则在总体中平均是多少呢?可见参数之估计这类统计推论方法,是先看样本情况,才问总体的情况。至于假设之检验,在逻辑上与参数之估计有点不同;它是首先假设总体的情况是怎样的,然后以一个随机样本的统计值来检验这个假设是否正确。

换言之,要先构思总体的情况,才进行抽样和分析样本的资料。例如,我们先假设总体的情况,才进行抽样和分析样本的资料。例如,我们先假设总体的均值是750元,然后根据样本的均值来发问:原先的想法(即假设)对吗?由此可见,参数估计与假设检验,虽然都是用来作推论统计,但在逻辑上略有不同;前者是先看样本情况才问及总体的情况,后者则先构思总体的情况,然后才进行抽样和分析样本的资料。

二、参数估计

1.点值估计与间距估计

以样本的统计值来估计总体的参数值有两大类做法:一类是点值估计;另一类是间距估计。两者皆要求样本是以随机方法抽取的。

同类推荐
  • 电视制作技术

    电视制作技术

    《电视制作技术(第2版)》以实际应用为出发点,通过理论与训练相结合,由浅入深地介绍了电视节目制作中应掌握的基本操作技能和必要的基础知识。增加了关于媒介融合、下一代广播电视电视网、三网融合等概述性内容,同时加强了对高清节目制作的理论与实践的论述。突出了新技术应用,紧跟传媒技术发展现实和发展前沿。内容深入浅出、难易结合,实用性、针对性强。
  • 生态学实验

    生态学实验

    本教材编写的基本框架是,体现生态学教学的基本理念,并贯彻实验教学大纲的设计思想,将内容分为生态学实验基础、基础性实验、综合性实验三大模块。其中,生态学实验基础主要介绍生态学实验开展的基础知识、常用的实验技术和方法,特别是与后述实验(基础性实验、综合性实验)密切相关的技术和方法;基础性实验主要是针对理论课涉及的生态学原理进行的验证性和设计性实验,并做部分拓展;综合性实验是让学生在具备一定的实验设计能力和科研能力的基础上,整合一至多个生态学原理所开展的应用性较强的实验。
  • 战地情节

    战地情节

    《读·品·悟文学新观赏·青少年读写范典丛书:战地情节》收录实力作家邢庆杰小小说作品数十篇。   《读·品·悟文学新观赏·青少年读写范典丛书:战地情节》文字典雅秀丽,语言畅达明快,蕴藉着对现实生活的深刻体味。文章短小精悍,意蕴悠长,对生活的思考、对人生的解读,无不透出智慧与机敏。品读本书,让读者在轻松中领略到一种精神的愉悦,一种心空被洗涤和陶冶后的清亮。对提高文学素养和提升写作能力将大有裨益。
  • 希利尔趣讲世界史

    希利尔趣讲世界史

    所有人都知道,历史中有大智慧。所以,爸爸妈妈们都常给孩子讲历史人物和历史故事,正如许多给孩子看的历史读物一样,它们的讲述都不系统,也缺少基本的历史感,有的甚至就是另一种形式的道德说教。希利尔通过精彩的历史故事,激发孩子对知识的渴望。书中不仅将发生在这颗星球上的历史囊括殆尽,而且字里行间始终洋溢着一种崇敬之情,那就是——不论何种文化,它所经历的苦难和它所创造的辉煌,都值得钦佩尊敬。
  • 中外地理故事

    中外地理故事

    本书呈现在你眼前,会让你大开眼界,让你学到更多的地理知识。它不仅生动而翔实地讲述了上面提到的地理奇观,同时还能让你了解一些你从未听过的地理奇闻或找到长久以来困惑你的答案。相信通过对这些知识的了解,你会对自己身处的这个世界有更深的认识,并且对基于地理基础上的人类历史和文明有一个全新的认识。
热门推荐
  • 龙腾盛世天下

    龙腾盛世天下

    一个纨绔。社会的人渣。在一个碰巧的情况下改变自我创建了自己的势力从此慢慢雄霸世界成就一代王者
  • 钓金枝

    钓金枝

    本书以小说的形式直析都市女性的生存抉择,折射出现代社会给女性带来的生存困境。本书用投影的笔法揭露了社会中存在的贪婪、腐败、堕落等阴暗面,在冷峻的言语和深切的反思背后,作者以一颗善良豁达的爱心,带给读者以温暖和希望。本书语言利落,情节紧凑,生活在都市人海中的读者都能于其中窥见自己的影子。凌宝漪的现状来源于母亲凌准精心周密的部署,灰姑娘几经踌躇,转身飞上华美的枝头。原本的任性上升为骄纵和嚣张,她成了母亲的机器娃娃,她在台前表演,母亲在幕后操控。母亲成功离间了她和初恋情人赵饮的爱情,把她推给某机构书记田有利。在金钱的诱惑趋势下,她得到了从未有过的巨大满足。
  • 四教仪集解

    四教仪集解

    本书为公版书,为不受著作权法限制的作家、艺术家及其它人士发布的作品,供广大读者阅读交流。
  • 狂拽王妃:冰山王爷入怀

    狂拽王妃:冰山王爷入怀

    他忘记了她,她等着。终于她累了,他却不放了。“王爷,说好的君子动口不动手!”“对你本王不需要君子!”“说好了此生互不相干的呢?你要说话算话!”“证据呢?”“王爷……”某男不高兴了,直接扑到……“说,还走不走了?”某男…过后邪魅的问“……”怎么那么记仇………
  • 网游之操戈天下

    网游之操戈天下

    在《龙行》中被杀删号解帮的他,在《核动》中回归,战断天涯
  • 倾城王妃:腹黑王爷别过来

    倾城王妃:腹黑王爷别过来

    场景一:某侍卫上前禀报:“王爷,王妃进赌场了,赌输了,要砸场子。”某爷淡淡的开口:“随她。”场景二:一侍卫上前禀报:“王爷,王妃和五王妃换装为男子,进了青楼。”某爷:“随她,她惹事了你们打理。”侍卫嘴角抽了抽:“是。”场景三:一侍卫上前禀报:“王爷,萧妃把王妃的狗给勒晕了。”某爷:“把萧妃的手给剁了。”侍卫:“是。”一侍卫将一休书奉上:“王爷,王妃说要把这封休书给您,说要去泡遍天下美男。”某爷站起来:“来人呐,前去捉拿本王的王妃。”本书原名《腹黑王爷倾城王妃》。新文求支持。欧耶。
  • 智力比拼

    智力比拼

    经典智力大比拼,看看你的智商如何,没个简短的问答里都藏有大智慧,快来开启你的智慧之门吧!
  • 重生之创世纪

    重生之创世纪

    重生九六年,回到十四年前刚刚要上高中的自己,重回校园弥补曾经的遗憾,从零开始创业,漫漫商路,一步一步走向世界的巅峰...本书基本是基于现实的YY,除了重生这个人生最大的BUG外,并没有设定其它金手指,本书是一本以重生为噱头的创业,商战,官场和都市生活小说。
  • 市场营销调研

    市场营销调研

    本书介绍了从开始到完成整个市场调研过程各个阶段的计划、组织和实施市场调研的方法及应用,分别说明应用市场调研方法解决的典型实际问题,以及调研中应当采用的方法和步骤。
  • 雷霆机战

    雷霆机战

    2015年7月24日,NASA确认发现首颗位于“宜居带”最接近地球大小的行星(代号为“开普勒-452b”),与地球相似度高达98%,被称之为地球的“表哥”。夜里,我呆在空荡荡的阁楼里,看着满天的繁星,自言自语。“要5亿年才能飞到?开什么玩笑?”这时,我的身后突然传来了一个女子的声音!“你们需要5亿年,我们只需要,50年……”