51、 信度(南大98<名>;北大2004<名>):指测量数据(资料)与结论的可靠性程度,即观测工具能否稳定地测量到它要测量的事项的程度。也就是说信度是指测量的稳定性与一致性而言的。(1)信度系数:信度可以看作系统性变异在观测到的总变异中所占的比率,系统性变异越大,则信度系数越大,表明测量的信度越高;信度也可以看成是在观测到的总变异中,不是因随机误差所造成的变异所占的比率。(2)信度的检查(南开2000<名>):信度通常以相关系数表示。由于测量中误差变异的来源有所不同,故各种信度系数分别说明信度的不同层面而具有不同的意义。在实际应用中,信度系数有如下类型:<1>重测信度:用同一份问卷的问题,对同一群被测者前后调查两次,在根据调查的结果,计算其相关系数,就得到重测信度。这种信度能表示两次调查结果有无变动,反映了测量的稳定程度,故又称作稳定系数。它可以检查出被测者是否能正确理解所提的问题,并作出真实稳定的回答。这是一种测量信度的较好方法,但须注意两次调查相隔的时间要适当,如果时间太短,被测者还记得上次答案,所以测量的是他的记忆,而不是他此时的真实态度。如果间隔时间太长,可能会发生一些变故,影响到被调查者的态度。<2>复本信度:对一项调查的问题,让被调查者接受问卷测量,并同时接受这份问卷的复本的调查,然后根据调查结果计算其相关系数,就得到复本信度。使用复本求取信度可以避免重测信度的缺点,但使用的复本必须是真正的复本,即在题数、形式、内容、难度及鉴别度等方面都与原本一致,仅只在问法与用词方面与原本不同。复本调查可连续或相距一段时间进行,连续实施的复本信度又称等值系数;相聚一段时间实施的复本信度又称稳定与等值系数。<3>折半信度:将调查来的结果,按题目的单、双数分成两半记分,在根据各个人的这两部分的总分,计算其相关系数,就得到折半信度。<4>评分者信度(人大2001<名>):在测量工具标准化程度较低的情况下,不同评分者的判分标准也会影响到测量信度,要计算评分者信度,可计算一个评分者的一组评分与另一个评分者的同一组评分的相关系数。(3)影响信度的因素:在结构化标准化程度较高的测量中,信度主要受随机误差的影响,随机误差越大,信度越低。随机误差的来源主要有:<1>被调查者:如是否耐心、认真、专注、不受情绪波动影响。一般来说,调查时间越长,提出的问题越多、越复杂,信度越低。<2>调查者:是否按规定程序和标准,是否有意或无意的对被调查者施加影响,纪录的认真程度等。<3>测量内容:如提问的措辞含糊不清,不易理解,各种题目内部一致性低,题数少等。<4>测量环境和时间:如研究人员对被调查者有较大”干扰”,他人在场的影响,两次测量的时间间隔太长等等。
52、 效度(南大96、97、2000<名>:测量效度;浙大2000<名>:测量的效度):就是正确性程度,即测量工具确能测出其所要测量的特质的程度。效度越高,即表示测量结果越能显示其所要测量的对象的真正特征。测量的效度可以决定所建立的理论解释的正确程度。对效度的检验可以保证不同的研究人员对某一研究变量的意义与内涵有一致的理解。(1)效度的基本原理:从测量分数变异的观点来看,效度就是测量得分的总变异量中,由所要测量的特质所造成的变异量所占的百分比。(2)效度的检查(复旦96、97<简>:效度测定的三种类型是什么?内在联系如何?):<1>内容效度(表面效度)(北大97<名>):考察内容效度旨在系统的检查测量内容的适当性,并依据我们对所研究的概念(变量)的了解去鉴别测量内容是否反映了这一概念的基本内容。内容效度实质上是个判断问题。检查内容效度就是检查有概念到指标的经验推演是否符合逻辑,是否有效。在科学研究中,需要以大多数科学家所接受的概念定义为标准。
<2>准则效度(效标效度)(南大95<名>:标准效度):准则是被假设或被定义为有效的测量标准,符合这种标准的测量工具可以作为测量某一特定现象或概念的效标。对同一概念的测量可以使用各种测量工具,其中每种测量方式与效标的一致性称为准则效度。
(A)如果效标或准则是依据将来实际发生的情况而建立的,那么这种准则效度可称为预测效度。预测效度是将已经得到的测量结果与未来实际发生的情况进行比较,以检查两者的一致性。
(B)如果效标识于某种测量方式同时被证明为有效的,则称之为共变效度。共变效度是用来判断其他的测量工具是否可以取代作为效标的测量工具。 (C)如果效标是以实际经验判断为准的,则称为实用效度。实用效度通常用来检查测量工具的实际效果。由于对某些现象的测量过去并没有一定的标准,所以只能依据实际经验来检验测量工具的有效性。
实用效度与共变效度有些近似,如定量化的干部测评方法就是以组织部门传统的考察干部的方法为效标,当它具有较高的效标效度时,由于它省时间、简便易行,所以就能取代过去沿用的老方法。
准则效度的局限:有些作为效标的测量工具只是假定有效的,它本身是否真正有效并没有理论根据,这一缺陷是心理量度化方法所共有的<3>建构效度(南大99<名>;复旦97、98<名>):是要了解测量工具是否反映了概念和命题的内部结构。它通常在理论性研究中使用。由于它是通过与理论假设相比较来检查的,因此也称为理论效度。测量同一个概念可以用多个指标,当用X和Y的多个指标来测量两个概念之间的关系时,如果不同指标的测量都反映出理论所假设的关系,那么这些测量就具有建构效度。<4>内在效度与外在效度(北大2003<名>:内在无效度):测量都是在具体的时间、地点对具体的调查对象所作的观测。如果在一项具体研究中,对上述三种效度(内容效度、准则效度、建构效度)的检查都没有发现问题的话,就可以认为这一研究具有内在效度,它的资料和结论可以有效的解答所研究的问题。可以说,内在效度是指一项研究的资料和结论的有效性。而外在效度是指这种研究结论的普遍有效性。对外在效度的检查要考虑样本的代表性和特殊性,以及研究时间、地点、情境和研究内容的普遍意义。
53、 信度与效度的关系(北大93<名>;北大96<问>:说明测量的信度与效度及其相互关系):(1)信度低效度不可能高。如果收集的资料不可信、不可靠,那么它肯定不能有效地说明所研究的对象。(2)信度高,效度未必高(效度有可能很低)。(3)效度低,信度有可能很高。(4)效度高,信度必然也高。如果有效地说明了各种现象,那么它的资料和结论都必然是且必须是可信的。(5)测量的信度是效度的必要条件,但不是充分条件,无信度必然无效度,但有信度未必有效度。反之,效度是信度的充分条件但不是必要条件,有效度必然会有信度,但无效度却未必无信度。(6)效度=信度-,由此可知,效度系数等于信度系数减去。由于其他变量的影响是内含在测量工具之中,因此很难测出他们的变异量(),而信度系数则可由相关系数计算。所以在一些研究中,研究者常用信度系数来近似的说明效度,但这是有缺陷的,因为在社会研究中,其他无控制的变量对资料的效度有很大影响。所以还是应当通过对内容效度、准则效度和建构效度的检查来说明研究的有效程度。(7)由信度和效度的关系可知,所有影响信度的因素也必然影响效度。此外,除随机误差外,效度还受到系统偏差和其他变量的影响。对这些影响课主要考虑两个方面:<1>测量工具;<2>
样本的代表性。
抽样与抽样调查(北大2004:抽样调查的基本原理):抽样调查:从研究对象的整体中选出一部分代表加以调查研究,然后用所得结果推论和说明总体的特性。这种从总体中选出一部分的过程就是抽样,所选出的这部分代表称为样本(人大2000)。(1)与整体调查相比,抽样调查的优越性:调查费用较低;速度快;应用范围广;可获得内容丰富的资料;准确度高。(2)抽样成功的依据(假设):部分是包含于整体之中的;部分与整体有同样的特征、现象、关系及过程;部分能够为研究者提供一个有关群体生活、群体态度、价值和意见的更为清晰的脉络。
55、
抽样术语:(1)个体与抽样单位(人大97:抽样单元):个体是收集信息的基本单位,即分析单位。个体与抽样单位在有些研究中是相同的,但在实际抽样中,抽样单位往往是多层次的。(2)研究总体和调查总体(复旦97:研究圈;人大2000:总体):研究总体是在理论上明确界定的个体的集合体,它必须受几个方面的限定:内容、单位、范围、时间。实际上,样本式从调查总体而不是研究总体中抽取的。调查总体是研究者从中实际抽取调查样本的个体的集合体。它往往是对研究总体的进一步界定,即对时间、范围作更进一步规定。(3)抽样框(北大2002;复旦97;南开2000;南大99):又称抽样范畴,是从中抽取样本的抽样单位名单。在一次抽样中,抽样框的数目是与抽样单位的层次相对应的。(4)参数值与统计值(人大97:参数、估计量;):参数值是关于总体中某一变量的综合描述。统计值则是关于调查样本中某一变量的综合描述。抽样调查的重要内容之一就是通过样本的统计值推算总体的参数值,从而达到由部分认识总体的目的。(5)抽样误差(北大99;复旦96):总体的异质性和样本与总体范围的差异性,在用样本的统计值去推算总体的参数值时总会有偏差,这种偏差就是抽样误差。(6)置信水平与置信区间:置信水平是指总体参数值落在样本统计值某以正负区间内的概率。而置信区间是指在某以置信水平下,样本统计值与总体参数值的误差范围。
56、
抽样的基本程序:(1)界定研究总体和调查总体。对研究总体的界定过程也就是对他的基本构成单位,所包含的内容以及空间与时间的范围等作出规定的过程,同时也是确定调查对象,及它的内涵、外延及数量的过程。(2)确定抽样单位,编制抽样框。即将总体案抽样单位划分为各部分,这些部分必须互不重叠且能合成总体,然后毫无遗漏的编号排列成表,每个抽样单位唯一的与表上的一个号码相对应。抽样框是概率抽样一个最基本的要求,它的质量关系着抽样的质量。(3)设计和抽取样本。包括确定样本所包含个体的数目,选择抽样的具体方法。(4)评估样本于对总体进行估计。样本对于总体的代表性问题始终是抽样中关注的中心问题。