登陆注册
12242200000052

第52章 统计分析(3)

例如:有3个分布,各含有5个数值,其内容如下:

3个分布的集中趋势都相同,都等于80。但是,每个分布各项目对中央趋势的离散有所不同。甲分布中,五个数值都相等,并无离势;乙分配中,各个数值,稍呈分离;丙分布中,则各数值的分散很大,对集中趋势偏散程度最大。

那么,什么是离散程度呢?

反映数据对于集中趋势的偏离程度的统计量就叫做离散程度统计量。

换言之,离散程度表示一组数值的差异情况或离散程度,测量的是分配的离中趋势。集中趋势的代表性如何,要由离散程度来表明。凡离散程度越大,集中趋势的代表性越小(如丙);离散程度越小,则集中趋势的代表性越大(如乙)。假如一组数据彼此相同,离散程度为0,集中趋势即该数值本身(如甲)。

因此,这种离散程度就是与集中趋势有关的衡量分散程度的度量值。

离散程度是指现象的某一数量标志的各项数值距离它的代表值的差异程度。它是反映总体标志数值分布特征的又一个重要特征。集中趋势统计量将总体各单位标志数值的差异抽象化了,从而反映出社会现象在一定条件下的一般水平。但是,同质总体中各单位标志数值之间的差异还是客观存在的,而且这种差异在有些问题的研究中非常重要。因此,统计分析在运用集中趋势法分析某一问题时,还必须进一步对被抽象化的各单位标志值的差异程度进行测定。这样,集中趋势和离散程度统计量分别反映同一总体在数量上的共性(集中范围和程度)与差异性(波动范围和差异程度),两者结合运用,有助于人们更全面地认识总体的分布特征。

1.定位层次:并众比率,可用犞R表示

异众比率是总体中非众数次数与总体全部次数之比。它虽也是一个相对指标,但与标准差系数不同,它不是由以绝对数形式表现的离散程度指标与其对应的平均指标众数所作的对比,事实上也没有与众数相配套的绝对数形式表现的标志变异指标。异众比率的计算公式为:

异众比率的意义在于指出众数所不能代表的那一部分调查单位数在总体中的比重。异众比率愈小,说明众数的次数愈接近总体次数,标志变异的程度愈小,众数的代表性愈大;异众比率愈大,说明众数的次数愈小,标志变异的程度愈大,众数的代表性愈小。

异众比率计算简单,只涉及众数次数和总体全体单位数,因而,它能用于其他离散程度统计指标均无法测定的定类尺度的测量。

2.定序层次:四分位差,可用Q表示

四分位差的公式:Q=Q3-Q1。

其意义是,舍弃资料的最大与最小的1/4,仅就中央部分的资料测其极差。

为什么要舍弃前后四分之一,留下中间的50%呢?为了避免受极端极值的影响。极端数往往出现在资料的两端,因而舍弃两端,来看50%的资料之差异。

再从位置求出位值。

例如:某电视台举行中学生智力竞赛,如有两个中学参加,甲中学有8人参加,乙中学有9人参加,共需回答10个问题。

这样的结果,它的含义是:离散数值越大,表明这一组数值对于集中趋势的分散越大,即越不集中;离散数值越小,则表明集中趋势分散越小。4对7相比4.75对7而言,相对比较集中。乙中学Q=4,说明乙中学的智力相对集中一点,智力水平比较平均;而甲中学Q=4.75,相对而言,比乙中学的智力水平要分散一点。

这说明甲中学8个人中有一半的人落在4.625-9.375区间内,而乙中学9个人中有50%的人落在5-9的区间内。也即说,乙中学的平均智力相对比较集中。

四分位差虽然克服了全距的缺点,不受极端值的影响,但它仅以两数之差为基准,损失资料太多,所以也是一个比较粗略的离散程度统计量,因而用途有限。一般当用中位数表示数据分布的集中趋势时,就用四位差表示离散程度。

3.定距层次:标准差用σ表示

对于定距、定比变量,我们可用标准差的测量法。

什么叫标准差?一群数值与其平均数之差的平方和除以全部个案数目所得的平方根,就是标准差。

标准差通常用一个小写希腊字母σ来表示。

例如:有10个家庭每个月比前两年增加开支的情况是:

①先计算10个家庭平均每月增加支出多少?

用集中趋势表示X=ΣX/n=41元。

②对这10个家庭讲,对这个平均值(41元)的偏差程度如何?往往用标准差表示。

这表示,这10个人家,每个月增长消费支出的标准差是19.5。

假如有另10户人家,其标准差是7.8,在这种情况下,19.5>7.8。这说明前10户人家支出的分布比较分散,有的用得多了很多,节省的人家十分节俭。而后10户人家则支出比较平均。

因此,标准差越大,表示分布越分散;而标准差越小,表示分布越集中。

第四节双变量统计分析

一、相关的意义及类型

1.什么是相关

简单地讲,所谓相关,就是指二列变量之间的相互关系。

社会现象是普遍联系和相互依存的。从数量上研究社会现象之间的依存关系,反映出各种条件或原因对现象变化的作用,对社会研究具有重要的意义。

例如:我们考察人的生理特征,个子的高低与体重的关系,要找出一个关系式来表示他们之间的相互关系。又如,农业生产上施肥量与农产量存在什么关系,降雨量的多少对农作物的产量有什么影响。在社会学中,我们研究父亲工资高低对子女的社会地位有什么影响。在教育心理学中,一个学生在中学时代的成绩与他大学里的成绩有什么关系,在大学里的成绩对他以后创造性研究又有什么关系。又如课程的设置与教育质量存在什么内在联系。以至有多种因素,例如一个人的知识高低与聪明、用功、父母教育、年龄、书籍多少是种什么关系(如下图所示)。

其中,哪个因素有影响,哪个因素不存在影响。把每一对抽出来,也就是变成两个变量的关系。

总之,我们要找出量与量的关系,即X,Y之间的关系。

但是,单讲相关是两列变量之间的相互关系,还不能刻画相关的本质含义。

变量之间的关系,现象之间的关系,存在着两种不同类型。

(1)函数关系,也即确定性关系。当一种现象(一个数值)的数量确定之后,另一种现象(另一个数值)也随之完全确定。如,圆的面积和它的半径之间的关系,又如自由落体运动中高度与动力加速度之间的关系等。这种变量关系我们称之为函数关系,研究这类关系是用数学分析的方法。

(2)相关关系。这种现象的变量关系并不是完全确定的。一个现象的数量确定了,而另一现象的变量还可能在一定范围内存在变化,并不随之完全确定。

例如,施肥和农作物产量的关系,农作物产量除了施肥多少的因素以外,还受土壤、种子、气候、耕作深度等好多其他因素的影响。又如儿子的身高,除了其父母身高的因素以外,还受营养、活动、环境等好多因素的影响。青少年犯罪除了家庭影响以外,还受社会交友、个人经历、生理心理等好多因素的作用。也即是说,在社会生活中,现象之间的依存关系,除了我们关心的因素之外,同时还会受着其他许多因素的影响,其中错综复杂的关系有些属于人们尚未认识的,有些虽已被认识但还无法控制的,再加上在计量上的误差,就造成了这些现象之间的变量关系的不确定性。但是不确定的变量关系还是有规律可循的,经过人们的大量观察,会发现许多现象变量之间确实存在着某种规律性。在这种情况下,我们在社会研究中,就应多观察些单位,消除无关因素的影响,以便研究现象因素之间的关系。我们就称这类现象因素之间的关系为相关关系,而研究这类相关关系的理论和方法,就是相关分析。

具体说,统计相关分析就是要:①确定现象的变量之间是否存在相关关系,并且找出合适的数学表达式;②测定现象之间相关的密切程度;③研究相关关系中哪些是主要因素,哪些是次要因素,这些因素之间的关系又如何。

以上就是我们所讲的相关之含义。

2.相关与回归

有时候这种通过一批观察数据来找出变量间的相互关系的方法,又叫“回归问题”。相关和回归的关系是怎样的呢?

这里有历史上的原因。“回归”这个名词原是由法兰西斯·高尔登(F.Galton)所始创的。1885年时,高尔登从事人类身高的研究(即研究父母的平均身高与子女身高的关系)。他发现子女的身高有低于其高个子父母的趋势,而矮个子父母的子女却往往有高于其父母的趋势。从整个人口看来,高个子的人“回归”于人口的平均身高,而矮个子的人则作相反的“回归”。不是高的更高,矮的更矮,而是向当中平均值的趋势发展。高尔登所创用的“回归”这个名词以后就为许多生物学家和统计学家所沿用。

从辩证法来看,回归具有否定的意味,子女比其父母较高是对矮个子的否定,而子女较其高个子父母为矮也是一种否定。

当然,后来“回归”这一词一般用来表明一种现象(一种变量)和另一种现象(变量)之间的关系,已经不是高尔登所创用时的原来意义了。

相关这个名词就是从“回归”推导出来的概念,表示事物间的内在联系和相互依存的关系。其义已包含了“回归”的含义。

在分析现象与现象之间的关系时,我们经常要分析其因果关系。那么,相关关系是否就是因果关系呢?我们的结论是:相关关系≠因果关系。

在一般的函数关系中,尤其是一些简单的自然现象分析中,我们可以指出其因果,而且因果关系是可以倒置的,即变量之间通常是互为因果,自变量和因变量可以相互调换,存在着互为反函数的关系。

在相关关系中,虽然在教学形式上也可以将自变量和因变量互相调换,但在实际工作中这种调换往往会失去实际意义。相关关系不一定是因果关系,例如天气冷了,气温降低导致人们多穿衣服,气温降低是自变量,多穿衣服是因变量,但绝不能把因果互换,讲因为多穿了衣服而导致天气变冷。可见相关关系≠因果关系。这是一方面的意义。

我们还可以从另一个意义上讲,相关关系≠因果关系。如植物的生长与大学生入学分数线的确定,我们可以求出他们之间的相关系数,进行回归分析,但其中并无因果关系。因而,相关分析必须根据所研究对象确实存在着的客观联系关系,决不能凭主观臆造某种联系(如国外有人研究太阳黑子与地球上的战争之间的相关系数)。同时,也要注意不要把无关的因素引进来。当然相关关系也可能是因果关系,这需要进一步分析。

以上所讲的实际上也是我们在进行相关分析时应注意的几个问题。

下面介绍相关的种类。

3.相关的种类

现象的相关关系可以按不同的标志加以区分。

(1)按相关的程度分完全相关、不完全相关和不相关。两个现象其中一个现象的数量变化由另一个现象的数量变化所确定,则称这两种现象间的关系为完全相关,例如圆的面积A决定于它的半径R,即A=πR。在这种情况下,相关关系即成为函数关系,也可以说函数关系是相关关系的一个特例。两个现象彼此互不影响,其数量变化各自独立,称为不相关现象,如棉花纤维的强度与工人出勤率一般认为是不相关的。两个现象之间的关系,介乎完全相关和不相关之间称为不完全相关,一般的相关现象都是指这种不完全相关,这是统计相关分析的主要研究对象。

(2)按相关的性质分正相关和负相关。两个相关现象,当一个现象的数量由小变大,另一个现象的数量也相应由小变大,这种相关称为正相关。例如,工人的工资随着产量的增加而增加。当一个现象的数量由小变大,而另一个现象的数量相反的由大变小,这种相关称为负相关。例如,商品流转的规模越大,而流通费用水平则越低。

(3)按相关的形式分线性相关和非线性相关。对于两个相关现象进行实际调查,获得反映这个变量相关关系的一系列数据。一种现象的一个数值和另一现象的相应数值,在平面直角坐标系中确定一个点,如果这些点的分布情况大致散布在一直线的附近两旁,则这两种现象构成线性相关的形式。如果现象相关点的分布,并不表现为直线的关系,而近似于某种曲线方程的关系,则这种相关关系称为非线性相关。例如,小麦的播种量和亩产量之间的相关关系就是一种非线性相关。

(4)按影响因素的多少分单相关和复相关。两个现象的相关,即一个因变量对于自变量的相关关系,称为单相关,又称简相关。当所研究的现象是几个变量的相关,即一个因变量对于两个或两个以上自变量的相关关系,称为复相关,又称多元相关。在实际工作中,如果存在多个自变量,可以抓住其中最主要的因素,研究其相关关系和复相关化成为单相关的问题。

二、交互分类法

所谓交互分类法,就是同时依据两个变量的值,将所研究的个案分类。交互分类表就是将两个变量各标志次数分配进行交互分类的统计表。例如,我们研究教育水平与最大志愿的关系。

从表102中,可以清楚地知道在每种教育条件下志愿的次数分布情况。

因此,这样的表又称为条件次数表。在表的最下端是每种教育水平的总次数,称为边缘次数,它们的分布情况就称为边缘分布。表中的其他次数,称为条件次数,表示在自变量的每个值(条件)的情况下依变量的各个值的个案数目(次数)。

同类推荐
  • 老师的承诺

    老师的承诺

    本书收入作者顾文显近年来发表在故事报刊的中、短篇故事,通过艺术手法塑造了许多形态各异、栩栩如生的人物,通过或曲折离奇的故事,或平凡普通的事例,宣扬了父母与子女之间的爱,老师和学生之间的爱,邻里之间、朋友之间、领导与下属之间的爱,甚至陌生人之间产生的关怀、帮助与理解。
  • 国际经济法作业集

    国际经济法作业集

    为更好地配合《国际经济法》课程的教学, 方便学生更好地学习国际经济法律、法规的相关知识, 结合《国际经济法》教材所涉及的相关理论和实际问题, 我们编写了本作业集。在编写过程中, 力求在把握国际经济法基本体系的基础上, 密切联系国际经济贸易法律事务, 将学术性与应用性融为一体, 以满足对学生知识结构的要求。
  • 豪夫童话(语文新课标课外读物)

    豪夫童话(语文新课标课外读物)

    现代中、小学生不能只局限于校园和课本,应该广开视野,广长见识,广泛了解博大的世界和社会,不断增加丰富的现代社会知识和世界信息,才有所精神准备,才能迅速地长大,将来才能够自由地翱翔于世界蓝天。否则,我们将永远是妈妈怀抱中的乖宝宝,将永远是温室里面的豆芽菜,那么,我们将怎样走向社会、走向世界呢?
  • 王子复仇记(语文新课标课外读物)

    王子复仇记(语文新课标课外读物)

    现代中、小学生不能只局限于校园和课本,应该广开视野,广长见识,广泛了解博大的世界和社会,不断增加丰富的现代社会知识和世界信息,才有所精神准备,才能迅速地长大,将来才能够自由地翱翔于世界蓝天。否则,我们将永远是妈妈怀抱中的乖宝宝,将永远是温室里面的豆芽菜,那么,我们将怎样走向社会、走向世界呢?
  • 创新型人才素质教育

    创新型人才素质教育

    当今世界是一个多层次生产力的发展局面。由于生产力发展水平的差异,国家与国家之间、地区与地区之间在经济和文化领域形成了巨大的差距。而这种差距首先是开发创新能力的差距,也就是创新的差距。创新,是一个国家、一个民族屹立于世界之林的最有力的“武器”。历史证明,创新是一个民族进步的灵魂,是一个国家兴旺发达的不竭动力。
热门推荐
  • 亿万遗产:豪门娇妻要离婚

    亿万遗产:豪门娇妻要离婚

    突然变成豪门继承人,拥有5000亿的你会做些什么?什么???还嫁了给一个同样出身豪门的老公!!!!!!等等,这个老公怎么有点儿眼熟?她、要、离、婚!一定要离婚!!!但是老公追来了怎么办???为了和这个家伙离婚,她要变强!爽文,恶毒女配各种被打脸,不爽你来找我。豪门对豪门,先婚后爱。每天中午十二点稳定更新欢迎收藏~背景是架空的,时间也是2020年之后,所以高科技和势力什么的别较真,反正怎么爽怎么来喽~~
  • 为君解罗裳:妖女倾天下

    为君解罗裳:妖女倾天下

    这东南国,谁人不知,谁人不晓,这要嫁的王爷,是传说中的暴君,杀人不眨眼,嗜血成狂的一个魔君的?圣旨一下,要千家的女儿嫁给东南国国的这个平南王爷,千家一听,仿佛是立马炸开了锅一样的,你不愿意去,我不愿意去,自然,就是由这个痴儿傻儿嫁过去了?
  • 轻松怀孕280天(健康女人时尚阅读书系)

    轻松怀孕280天(健康女人时尚阅读书系)

    “十月怀胎,一朝分娩”。妇女怀孕以后,一家人都热切地盼望着新一代早日顺利到来。为了保证整个妊娠期都能安全度过,孕妇的衣、食、住、行都要格外地注意。胎儿在母体内生长发育是否良好,能否顺利分娩,都是至关重要的大事。分娩的顺利与否,取决于从怀孕到分娩过程中的良好保健及充分准备,优质的孕前、孕期生活,是孕妇轻松分娩的重要前提。
  • 月言无泪

    月言无泪

    一道圣旨,她无奈踏上和亲之路;一面悬崖,斩断她所有的过去。为了爱情,她含泪背离家国,情根深种,换来的却是国破家仇之恨。爱她之人,皆不得好死;她爱之人,竟是幕后黑手。一场战争,他败北回国;一场和亲,心之所想。嗜血阴狠冷漠无情是他的标志,步步为营得到了天下,最后却丢失了心。
  • 泪倾城:月华无双

    泪倾城:月华无双

    奇异的穿越,不同的时空,迎接华无月的,到底是什么。。离奇身世,废物之体,如此狗血的情节,是否能奈何得了,那远处行来的冷清女子?爱情降临,她的束手无措,他的浅笑俊逸。背叛之时,挥刀起落,青丝断,情丝断。。回到原身,她又发现什么。看暗夜修罗华无月,如何在异世打造属于她的,盛世年华。。
  • 天下名人堂

    天下名人堂

    这是一个遵守弱肉强食规则的伪文明世界,这个世界有一袭世界名人榜,记录着世界上顶级的出名人物,不管是英明,还是臭名。其中有一个叫做德道安的公司,德道安臭名昭著,公司里头的榜上人物超过了200名,都是世界各地聚集在一起的狠角色。主角一行人所在的36号公司在一次任务中,遭遇了德道安的天下第一拳王和天下第一毒枭,得知了德道安在进行一项危及全世界的秘密行动...........
  • 御猫媳妇是恶霸

    御猫媳妇是恶霸

    恶女丁月华要休了她夫君展昭。下水救人的女混混穿越时空变成了御猫展昭的媳妇丁月华,这南侠竟然长得跟她那个杀千刀的负心汉一模一样!丁月华下定决心去开封府击鼓告状,甘愿坐牢也要休夫!【情节虚构,请勿模仿】
  • 最美的幸福之恋

    最美的幸福之恋

    她,一个神秘家族的宠儿。一段刻苦铭心的爱情,却因种种误会而分离,一句绝然的话让她带着身孕伤心离开。他,身世曲折,生性冷漠。因为自己的错失而错过了她。这一次,即使千难万阻,他也一定要把她追回来!
  • 有限正确记事簿

    有限正确记事簿

    “哟夏,你这么作死真的可以?”“小细节不要在意啦!”无论怎样,都得保有一个底线不是么?“真是可耻……都给本鸟注意点好不好!”虽然老是说节操什么的,毕竟节操才是生产力……嘛?反正掉了还可以从地上再拾的说。ps:书名是为了激励笔者本人,所以不必在意……嗯,就这样。笔者想要练练节操,节操才是第一生产力啊!
  • 天心正法修真道场设醮仪

    天心正法修真道场设醮仪

    本书为公版书,为不受著作权法限制的作家、艺术家及其它人士发布的作品,供广大读者阅读交流。汇聚授权电子版权。