袁方《社会学方法教程》笔记总结(18)

袁方 半岛在线注册/2009-01-06


(2)资料的分类和编码:<1>编码(复旦98<名>):就是将文字资料转化为数字形式的过程。编码的目的使用一组变量表示各项调查问题,用每一变量的不同取值表示对这一问题的不同回答,从而使文字资料转化为数字形式。<2>编码步骤:(A)对回答进行分类。(B)建立回答类别与变量数值之间的对应关系。(C)注意:(a)对于开放性问题,因实现不能预料到答案的情况,故无法在设计问卷时事先分类,这时,编码就要从对问题的回答进行分类开始。(b)一般的讲,开始时分类可细一些,当分析不要求过细的分类时可以将某些类别进行合并。分类的多少还要考虑统计分析方面的问题。(c)任何调查都不免有一些回答这对一个问题不做任何回答的情况,为此对问卷中的每个提问要增加一个无回答编码。对无回答编码的原则是明确区分无回答与其他回答,通常的习惯是用9或几个9来代表无回答。对无回答的项目,不能一概简单地认为是缺失数值或回答率低。统计缺失数据时,应结合回答人的情况分析。如行政人员不回答”技术职称”是正常的。
<3>编码项目:问卷编号、问卷所属区域或部门、其他要进行统计的分类标准。 <4>编码方法:(A)预编码:方法是在设计问卷时对回答的每一个种类都指定好其编码值,并印在问卷上。预编码主要限于回答类别事先已知的问题,这些问题主要是封闭性问题,或回答已经是数字而不需要做转换的问题。优点:处理资料时比较简单,省时省力。缺点:无法用于开放性回答,因为我们无法事先知道回答的种类。(B)后编码(南大2000<名>):是指对问卷的编码过程是在问卷回收之后进行的,而不是与问卷设计同时进行的,多用于对开放性问题的编码。比较费时费力。(C)边缘编码:实际上是一种预编码方法,它与一般预编码的不同之处在于,这种方法不仅指定了编码值,而且给出了每个项目记录回答的空间,现在应用得最多。边缘编码是在问卷上每个调查项目旁边的空白处标明填写编码的位置。问卷回收后,将每份问卷上的回答变成指定位置上的编码。(D)编码簿:用以指示每个编码的意义和变量的位置。作用是建立变量和调查内容、变量值与回答类别的一一对应关系。它可以(a)作为编码工作的指南。(b)使研究者在分析过程中便于查找变量及各种编码所代表的意义。(E)编码簿的主要项目:(a)问题号码。是在调查表或问卷上的问题的题号,有了题号就可以知道这一题目在资料卡片上的哪几列。(b)变量号码。有了变量号码,研究者可以知道变量的代号,方便分析计划的拟定,在分析时直接饮用变量号码而不必提及变量名称。(c)项目名称。又称变量名称,用概括性语言表明项目的含义。(d)编码的内容说明。即给出每一项目问题答案的分类以及分配给每一类别的数字。(e)列序号。即每一项目应当占哪几列。
(3)资料的登录:<1>个案登录:即将各个调查对象的全部数据资料以编码的形式记录在一张张卡片上,即建立个案档案。<2>总体登录:即将所有调查对象的全部数据记录在一张资料卡片上,这种方法适用于为电子计算机处理作准备。
(4)资料的汇总:就是根据研究目的,对分类后的各种数据进行计算和加总,汇集到有关的表格之中,以集中系统地反映调查资料总体内部的数量情况。汇总的目的:<1>初步了解数据的分布情况。<2>为编制次数分布表作准备。<3>为深入的统计分析作准备。<4>便于保存调查资料。
113、 计算机处理资料的一般过程。(1)输入前的准备:<1>资料的审查。<2>资料的分类与编码。<3>登录,即将问卷中的回答转录到资料卡片上。一般将编码、登录与数据输入过程结合起来,为此,越来越多地采用也边编码的方式。(2)输入数据:指通过对计算机输入设备的操作,将资料卡片中的资料送入计算机贮存起来,以备调用。输入方式:<1>键盘输入;<2>卡片输入;<3>光电输入。(3)资料的净化(复旦98<简>:对录入的数据进行检查的主要方法):<1>幅度检查(北大99<名>):使用一个自编的简单程序或者已有的统计软件可以将某一变量的分布显示出来,这样就可以检查出一部分错误。例如,变量性别的取值只有两个—–1(男)、2(女),因此,5和8是违规数字。这样,我们首先了解到,性别这个变量的数据有错误。然后,我们可以变出一个程序列出含有性别变量的违规值的学生的编号,通过核对问卷,就可以知道这些违规值是如何出现的,以及如何修正了。<2>逻辑检查:利用变量之间的逻辑关系来净化资料。(4)数据的处理。
  第十五章:资料的统计分析

114、     统计分析的作用:(1)可对资料进行简化和描述。(2)可对变量间的关系进行描述和深入地分析。(3)可通过样本资料推断总体。

115、     统计分析的步骤:(1)对应用统计分析的前提条件进行考察。统计分析是建立在树立统计理论基础上的,因此他的应用必须满足一定的理论前提。(2)制定统计分析方案:再次确定自变量与因变量。定义复合变量。问卷或调查表上出现的各个变量,一般称为基本变量或原始变量。用基本变量组合而成的新的变量,称作复合变量。变量分组:将类别或属性相同的变量组合成有意义的数组。提出统计计算的要求并提出适当的统计方法。(3)选择统计分析方法的原则。必须根据研究目的和资料本身的特点选择适当的统计分析方法。从研究目的考虑:是描述性研究还是解释性研究。描述性研究在于说明某种社会现象的状况;对于解释性研究,除了采用描述性研究的方法外,还要使用控制变量、建立因果统计模型和分类及综合变量等多种统计分析技术。研究资料的性质,主要考虑:变量的测量尺度;资料的收集方法;数据的分布形态;变量的个数。(4)对于统计结果的解释。统计分析是一种定量分析方法,但任何具体的两都是有质的规定性以及数量关系背后的社会背景情况,如果不了解这种质的规定性以及数量关系背后的社会背景情况,就可能做出肤浅、错误的甚至荒谬的解释。因此,对于统计结果的分析,有赖于对事物作深入地观察和了解,决不能凭表面的数据就轻易的下结论。
116、     单变量的统计描述:(1)变量的分布:频次分布:就是变量的每一取值出现的次数。对于连续性变量,如定距变量
,频次的计算必须分组进行。其中每组上限即下一组的下限,通常将下限包括在本组中,每组用组中值表示。频率分布:用变量每个取值的频次数除以总个案数,他是一个相对指标,派出了样本规模的影响,因而可以用来比较不同的样本。一般频率分布使用比率的形式表示的。(2)统计图与统计表。统计表就是以表格形式来表示变量的分布。在制作统计表时,如果有未回答或回答不符合要求的情况,可以有两种处理方法:(A)仍以调查总数为基础计算频率,这时应加入一类:未详。(B)以有效回答为基数计算频率,这时应在表的下面、紧接着表的地方注明:未详****户。统计图:是以图形表示变量的分布情况。统计图虽然不如统计表精确,但是更直观、生动、醒目。(A)圆瓣图:是用一个圆代表现象总体,每一瓣代表现象中的一类,其大小代表他在总体中所占的百分比频率。(B)条形图:多用于描述定类与定序变量的分布,他是以长条的高度表示变量不同取值的频率分布的,其中长条的宽度没有意义,一般均化成等宽长条。长条的排列可以使离散的,也可以使紧挨着的。(C)直方图:是由紧挨着的长条构成的,与长条图不同的是,他的条的宽度是有意义的,实际上它不是用长条的高度而是用长条的面积表示频率的大小,长条的纵轴高度表示频率密度(频率密度=频率/组距),长条的宽度表示组距。直方图仅适用于定距变量。(D)折线图:是用直线连接直方图中条形顶端的中点而成的。当组距逐渐减小时,折线将逐渐变为平滑,趋向为曲线。
               (3)集中趋势分析:是从一组数据中抽象出的一个代表值,以代表现象的共性和一般水平。除可以说明某一社会现象在一定条件下数量的一般水平外;集中趋势还可以对不同空间的同类现象或同一现象在不同时间的状态进行比较;以及分析某些社会现象之间的依存关系。众数(北大92:试用分布理论简述算术平均数、中位数和众数三者之间的关系):就是出现频率最高的变量值。众数可以适用于任何测量层次的变量,对于定类和定序变量,众数可直接从变量的频率分布中观察到;对于定距变量,如果变量是在第I组具有最高的频率密度,则用第I组的组中值表示变量的众数。中位数:是将观察总数一分为二的变量值。若将数据从小到大顺序排列,则取值于(N+1)/2处的变量值。当N为偶数,由于(N+1)/2处无数值,取中间位置左右两数的平均值。对于经过分组的资料,中位数的位置则是通过计算累计百分比频率得到的。即首先计算出含有累积频率50%的区间,然后求出这个区间的上下限值(U、L)最后利用公式
计算中位数值。中位数一般用于描述定序及定序以上的测量尺度的变量的集中趋势。               
平均数:仅适用于定距及定距以上变量,但有时也可用于定序变量。如求平均等级。对于分组值,一般用组中值来代替变量值,然后加权平均计算平均数。需要指出的是,用组中值计算的加权平均数知是用原始数据计算的平均数的近似值。由于分组是人为的,所以在变量分布不均匀的情况下,不同的分组会有不同的结果。分布与三值的关系:正态分布时,三值重合;偏态分布中,三值不重合,在正偏态时,由于左边频次密集,这使得中位数偏向左方,但由于右侧的变量取值大,故平均数叫中位数偏右,即平均数>中位数>众数;而在负偏态时则相反,有平均数100),则两个总体均值差的双侧置信区间为:
文本框:
成数差的双侧置信区间为:
文本框:
在未知时用代替。在两个总体成数未知时,用对应的样本成数代替。


相关话题/

  • 领限时大额优惠券,享本站正版半岛在线注册考试资料!
    大额优惠券
    优惠券领取后72小时内有效,10万种最新半岛在线注册考试考证类电子打印资料任你选。涵盖全国500余所院校半岛在线注册专业课、200多种职业资格考试、1100多种经典教材,产品类型包含电子书、题库、全套资料以及视频,无论您是半岛在线注册复习、考证刷题,还是考前冲刺等,不同类型的产品可满足您学习上的不同需求。 ...
    本站小编 Free壹佰分学习网 2022-09-19