中文名 | 评价量表 | 别 名 | 评比量表 |
---|---|---|---|
形 式 | 图示评价量表等 | 优 点 | 省时、有趣、用途广 |
评比量表在市场调查方面应用很广。在问卷中,调查人员根据被调查者的可能态度,拟定有关问题的答案量表,量表的两端是极端答案,中点是中性答案,并且每个答案都事先给定一个分数。
例如:你喜欢上市场调研这一门课吗?(请在对应的数字上划钩)
按图所反映的评比量表的要求,分别进行统计,取得的平均分数值便可以代表被调查者的态度,并且还可以计算各个项目的百分率。
应用评价量表时必须注意两点:
应注意设计量表时的定量基础,并将调查得到的态度测量结果在定量基础上进行分析,判断其高低; 应注意量表所测定的数量,只说明态度的不同,并不说明其他。
评比量表的优点:省时、有趣、用途广、可以用来处理大量变量等。
这种方法可能会产生三种误差:
1、仁慈误差:有些人对客体评价时,倾向于给予较高的评价,这就产生所谓的仁慈误差;反之,则产生负向的仁慈误差。――如教师给学生打平时成绩。
2、中间倾向误差:有些人不原意给予被评价的客体很高或很低的评价,特别是不了解或难于用适当的方式表示出来时,往往倾向于给予中间性的评价。
防止中间倾向误差的方法:
调整叙述性形容词的强度; 增加中间的评价性语句在整个量表中的比例; 使靠近量表两端的各级在语意上的差别加大,使其大于中间各级间的主意差别; 增加测量量表的层次。 3、晕轮效果:如果受测者对被评价的对象有一种整体印象,可能会导致系统偏差。
预防晕轮效果的方法:
对所有要被评价的对象,每次只评价一个变量或特性; 问卷每一页只列一种特性。
评价量表用不同的数值来代表某种态度,目的是将非数量化的问题加以量化,而不是用抽象的数值随意排列。
评价量表根据量表的形式分为:
1、图示评价量表——要求应答者在一个有两个固定端点的图示连续体上进行选择;——三种图示评价量表。
2、列举评价量表——要求应答者在有限类别的表格标记中进行选择。
列举评价量表比图示评比量表容易构造和操作,在可靠性方面也比图示评价量表好,但是不能像图示评比那样衡量出客体的细微差别。
我们采用含有多个次目的量表来测量人们的意见、态度、看法等、这样得到的结果是否准确、可靠,是否有适用性。这就需要评价量表的信度和效度。在这之前,我们先要了解测量精度和测量误差的概念。
测量精度和测量误差
测量值是指反映一个对象某个特殊的数值。测量值不是所感兴趣的真点值,而是它们的一个观测。有许多因素都会引起测量误差,可将观测值O表示成如下的形式:O=T S R
观测值O和真点值T之间的差距称为误差,误差的大小反映了测量的精度的高低。误差包括两部分:系统误差S和系统误差R。S是一种偏差,代表着影响观测值的稳定性因素,每次都以相同的方式影响观测值。可能产生系统误差的原因很多。
随机误差不稳定。它代表看影响观测值的暂时性因素,次都以不同的形式出现,例如暂时性的人员因素或环境因素等。
系统误差和随机误差之间的区别对我们理解效度和信度的概念是很重要的。
从理论的观点来看,一个良好的测量工具(量表)应具有足够的效度和信度。效度是指量表测量的结果能够真正反映调研人员所要了解对象特征的程度。如果没有任何系统误差和随机误差(即O=T),则具有最高的效度。调研人员可以用内容效度、标准则效度和建构效度来评价量表。
内容效度是指量表涵盖研究主题的程度。调研人员必须检查量表中的项目能否是够地覆盖测量对象的主要方面。为了获得足够的内容效度,要特别注意设计量表时应遵循的程序和规则。
内容效度的主观性使其不能单独地用来衡量表的效度,但可以用来对观测结果作大致的评价。一个更好的评价量是下面介绍的准则效度。
准则效度是指量表所得到的数据和其他被选择的变量(准则变量)的值相比是否有意义。准则变量可以是人文学和心理学特好、态度和行为、以及从其他量表得到的数据。根据时间跨度的不同,准则效度可分为同时效度和预测效度。
当量表的测量数据和准则变量的值被同时收集时,使用同时效度。例如,如果一个测量消费者对彩电态度的量表能够正确估计出市场上高、中、低所得的家庭分别拥有彩电的数目和比例,它就具有同时效度。评价量表的同时效度涉及对这两者的比较。当量表的测量数据收集在先,过一段时间之后才收集准则变量值时,命名用预测效度。如上例中测量消费者对彩电态度的量表如能正确地预测出消费者明天彩电的行为,字就具有预测效度。调研人员可以在第二年收集有关实际购买的数据,和量表测量结果进行比较,用来评价量表的预测效度。
建构效度最关心的问题是:量表实际测量的是哪些特征?在评价建构效度时,调研人员要试图解释“量表为什么有效”这一理论问题以及考虑从这一理论问题中能得出什么推论。建构效度要求对每个特征的测量背后有足够的理论支持,并且这些被测量的特征之间应该有合理的关系。建构效度包括同质效度、异质效度和语意逻辑效度。
同质效度是指量表测量同一特征的其他测量方法相互关联的程度。异质效度是指量表和测不同特征的测量方法不同但理论上有关特征的测量方法之间相互关联的程度。在设计量表时,首先建立一个理论模型,然后从中导出一系列推论、测试,逐渐形成一个由几个特征系统地联系起来的语意逻辑网。从表面上看,就是含有多个有关测量对象测量项目的量表。评价建构效度就是要在这个量表的背景下进行。
信度指的是如果重复测量,量表所测结果的一致程度。系统误差对信度没什么影响,因为系统误差总是以相同的方式影响测量值的,因此不会造成不一致性。反之,随机误差可能导致不致性,从而降低信度。信度可以定义为随机误差R影响测量值的程度。如果R=0,就认为测量是完全可信的,信度最高。
一般通过使用同一量表进行不同测量,分析各测量结果之间联系的方法来评价信度。如果联系密切,各测量结果具有一致性,则认为量表是可信的。评价信度的方法主要有:再预测量、替换形式、内部一致性方法。
(1)再测信度
用同样的量表,对同一组访问对象在尽可量相同的情况下,在不同的时间进行两次测量。两次测量相距一般在两到四周之间。用两次测量结果间的相关分析或差异的显著性检验方法,可以评价量表信度的高低。结果越是相关,差异越不显著则信度越高。
用再次测量法评价信度存在一些问题。首先,结果与时间间隔关系密切。在其他方面都相同的情况下,时间间隔越长,信度越低。其次,最初的测量可能会改变被测特征。例如,测量人们对低脂肪食品的态度可能会使他们更为关心健康问题,从而对低脂食品持更为肯定的态度。第三,实施重复测量有时是不可能的,例如测量消费者对某种新产品的反应。第四,第一次测量的答案可能会对以后测量有影响。受访者可能会图回忆第一次受测时给出的答案。第五,在两次测量之间一个有利的信息可能会使受访者的态度更为有利。最后,再测信度的相关系数可能会由于被测项目自身之间的相关而偏高。两次测量中,同一项目自身之间的相关性要比不同项目间的相关性高。因此,即使不同项目之间的相关性很差,也可能得以很高的再测相关系数。
(2)替换形式信度
用两个形式不同的等价量表,对同一组受访者在不同的时间(通常间隔两到四周)进行测量。两次测量结果间的相关性被用来评价量表的信度。
这个方法存在两个主要问题。首先,构造等价的量表不但费时,而且花钱。其次,很难构造出完全等价的量表。两个量表在内容上应该等价。从严格的意义上说,两个量表的测量项目应具有相同的均值、方差和相关性,但即使这些条件都满足了,还是有可能出现内容不等价的情况。低相关可能是量表的信度不够造成的,也可能是由于量表形式不等价而造成的。
(3)内部一致信度
内部一致信度用于评价累加量表的信度。在这种量表中,各个测量项目的得分被累加以得到一个总分,每个项目都测量整个量表所要测量对象的某个方面,项目之间就它们各自的特征而言应该是一致的。内部一致信度强调的是组成量表的一组测量项目内部的一致性。
折半信度是测量内部一致性是简单的方法。量表中的项目被分成两半并计算测量结果的相关系数。这两半相关系数高,则说明量表内部一致性高。量表的项目可按序号的奇、性分为两半,也可以随机地合。问题在于划分两部分的方法可能会影响到评价结果。克服这一问题的常用方法是采用X系数。
"_blank" href="/item/平均值">平均值。X系数的值在0和1之间。如果X系数不超过0.6,一般认为内部一致信度不足。X系数的一个重要特性是它们值会随着量表项目的增加而增加。因此,X系数可能由于量表中包含多余的测量项目而被人为地、不适当地提高。还有一种可以和X系数同时使用的系数。系数能够帮助评价,在计算X系数的过程中,平均数的计算是否掩盖了某些不相关的测量项目。
有些具有多个项目的量表可能在结构上是多维的,那含有几组,每一组项目测量一个方面的特征。例如,商店的形象就是一种多维的结构,包括商品的、商品的花色种类、货与保修政策、人员服务、价格、商店位置、店面局等等。用于测量商店形象的量表就要包括测量以上每个维度(方面)的测量项目。这些维度之间是比较独立的,因此,在包含各个准度的整个表内部考察一致性是不适宜的。不过,如果每个准度是由几个测量项目组成,可以计算每个度的内部一致性。
效度和信度的关系
效度和信度的关系可以用前面讨论过的测量值的构成公式O=T S R来理解。如果测量是完全有效的,即0=T,S=0,R=0,此时测量必然是完全可信的,若量表的信度不足,它也不可能完全有效,因为有O=T R。如果量表是完全可信的,可以达到完全有效,也可能达不到,因为有可能存在导致误差,虽然缺管信度必然缺乏效度,但信度的大小并不能体现效度的大小。信度是效度的必要条件,但不是充分条件。从理论的角度来看,量应具有足够的效度和信度;从实践的观点来看,一个好的量表还应该具有实用性。实用性指量表的经济性、便利性和可解释性。
某地产集团下属子公司总经理绩效评价量表——包括汇总表、上级评价表、下级评价表、自我评价表以及能力指标和态度指标。全部是表格形式。 共9页Word
本文对传统的工程地质评价方法作了扩展,称之为工程地质评价的定量表格化。本文详细给出了定量表格化的一种实现方法。两个应用实例表明,该方法既定量又简便,具有良好的适用性和推广前景。
总加量表法指一种以量表形式对被试的态度中情感性内容进行测量的方法。由利科特于1932年创用,故该量表又称利科特量表。其测量的方法大致为:将事先设计和印制好的、由二十个以上的陈述(问题)所组成的量表分发给预先从一批待测的被试中随意选出来的少数审定者,进行试验性测量。实验者让他们在检查下述分成五等的选择时,指出对每条陈述的同意或不同意的程度。这五种等级是:非常赞成、赞成、不能决定(中立)、不同意、坚决不同意。只有那些产生广泛范围之态度的陈述才在正式测量中被采用,排除那些虽与主题有关但在反映态度时理论性太强、或许有不止一种解释的陈述。最后用被试回答的平均数作为基础去测量态度。
等距量表法又称“塞斯通法”。一般包括12~18个测验项目的陈述句。其中有赞成的,也有反对的。测试时,让受试者将上述句子分别放入11个空格里,依赞成的顺序排列,越赞成的越往前放;反之,往后放。每条意见在各栏里都有次数分布,该分布的中数就是该条意见所得的量表值。
测验量表法心理学中研究能力、兴趣、人格等个性因素的方法。测验量表即一种系统化了的程序,以及依据某些个体(或他们的行为)的特性所定出的一些规则,而使得一组符号或数量能够描述这些特性的拥有程度。一个测验里一定有一个或几个量表,用以描述受测者的反应,再通过这一描述,推论个体拥有该特性的情况。量表是测验不可缺少的一部分,二者总是结合在一起的,故此种研究心理学的方法称为测验量表法。应用科学的心理测验,要求具有刺激、量化、推论的客观性,有一定的对象行为,控制好各种影响测量对象行为的因素,如指导语与测验情境、测试焦虑、练习与应付技术、反应方式与反应心向等,才能保证测验量表用于科学研究的价值。 2100433B
也就是说,命名量表所得的数据或符号,只有区分性,而没有序列性、等距性和可加性。根据测量的不同水平以及测量中使用的不同单位和参照点,我们把测量量表分为命名量表、顺序量表、等距量表、比率量表(等比量表)四种类型,命名量表亦称类别量表。命名量表是测量中最简单粗糙、水平最低的量表。因此,运用命名量表时不能作常用的数量化分析,只适用于次数的统计。因此,有人认为运用命名量表进行的测量不能算作是真正意义上的测量。命名量表可细分为两种形式:一是名称量表,即用数字指代个别事物(如运动员的号码)。二是类别量表,即用数字指代事物的种类(如用0代表教师,用1代表学生)。
标准化量表
体育评价量表之一。指以统计标准差为单位划分评价等级的一种量表。它具有分数呈递增或递减的二种间距趋势。且要求评价资料数据分布呈正态分布或近似正态分布。该表能准确查出在某标准差区域内的样本数占总体数的百分比值.同时也能由样本占有的百分比数查出为某一标准差值。多应用于人体生长发育和生理机能的评价,也常用于身体素质和运动能力的评价,特别是用于计量单位不同而又具有多个指标的相对水平样本的综合性比较评价时.尤其能消除因测量单位不同而带来的麻烦,而只用对应指标的标7r化疽直接加以比较.就能分辨出样本间的价值高低。故该量表在体育评价中校广泛采用,较为科学合理、简便可行。2100433B