跳转到内容

标准化考试

维基百科,自由的百科全书
二戰期間,一名英國士兵正參加對機械零件進行分類的標準化考試,以測試他對機械的理解程度

标准化考试是一种對所有应试者以统一方式施测与评分的考试。这类考試的题目设计、成绩總分、扣分均遵循所有人一致性原则,考試流程与评分标准均以预先设定的规范执行。[1]任何以相同模式對所有人进行施测、采用统一标准评分的测试均属标准化测试。标准化测试可以以笔试、口试或实操等方式呈现。著名的标准化考试有SATGRE等。

形式

[编辑]

标准化考试对所有应试者进行统一评分。任何以相同方式对所有应试者进行相同测试,并以相同方式对每个人进行评分的测试,都是标准化测试。标准化考试不需要是高风险考试、限时考试、选择题考试、学术考试或针对大量应试者的考试。

标准化测试可以由选择题判断题、论文题、实操考试或几乎任何其他形式的考试组成。选择题和对错题通常被选择用于成千上万的人参加的测试,因为通过使用可由计算机读取的特殊答题卡,可以廉价、快速和可靠地给出评分。一些标准化测试有简答题或论文写作部分,由独立评估员给出分数,他们使用评分标准(规则或指南)和基准试卷(每个可能分数的试卷示例)来确定回答的评分。

下面举例说明不同形式,不同领域的标准化考试与非标准化考试的差异:

领域与主题 考试形式 标准化考试 非标准化考试
历史 口试 每个学生都会被提出相同的问题,他们的答案也以相同的方式评分。 老师问每个学生一个不同的问题。有些问题比其他问题更难。
数学 书面 每个学生都会被提出相同的问题,他们的答案也以相同的方式评分。 老师给不同的学生出不同的题目:对差学生出很简单的,对大多数学生是普通的,对最好的学生是困难的。
驾驶 实操 每个驾驶学生都被要求做同样的事情,并且他们都按照相同的标准进行评估。 一些驾驶学生必须在高速公路上行驶,但另一些学生只需要在街区周围缓慢行驶。一名考官因“态度不佳”而扣分,但其他考官则没有。
音乐 试演 所有音乐家都演奏同一首音乐。评委们事先商定了时间、表达和音乐性等因素的重要性。 每个音乐家都会选择不同的音乐来演奏。评委们选择他们最喜欢的音乐家。

主观和开放性题目(如简答题、论文题、实操考试)也可以进行标准化考试,下面是一个例子,关于开放性历史问题分别如何在标准化考试和非标准化考试中评分:

开放性历史问题:是什么导致了第二次世界大战
标准化考试中 非标准化考试中
评分标准:如果答案至少提到以下一项,则将其标记为正确:德国入侵波兰、日本入侵中国或经济问题。 没有明确标准。每位教师都会根据自己的意愿进行评分,同时考虑教师认可的任何因素,例如答案、努力量、学生的学术背景、语言能力或态度。
学生1:二战是由希特勒和德国于 1939 年入侵波兰引起的。 老师 1:这个答案提到了必填项之一,所以它是正确的。

老师 2:这个答案是正确的。

老师 1:我觉得这个答案已经足够好了,所以我会把它标记为正确。

老师 2:这个答案是正确的,但这个好学生应该能够做得比这更好,所以我只给予部分认可。

学生2:二战是由多种因素引起的,包括大萧条和总体经济形势、国家社会主义、法西斯主义和帝国主义扩张,以及与第一次世界大战有关的未解决的怨恨。欧洲战争始于德国入侵波兰。亚洲部分始于日本入侵中国。 老师 1:这个答案提到了必填项之一,所以它是正确的。

老师 2:这个答案是正确的。

老师 1:我觉得这个答案是正确和完整的,所以我会给予充分的认可。

老师2:这个答案是正确的,所以我会给满分。

学生3:二战是由 1914 年斐迪南大公被暗杀引起的。 老师 1:此答案没有提及任何必需的项目。没有分数。

老师 2:这个答案是错误的。没有分数。

老师 1:这个答案是错误的。没有分数。

老师2:这个答案是错误的,但这个学生努力了,句子语法正确,所以我给努力一分。

评价

[编辑]

优点

[编辑]

使用评分标准是为了在评估应试者的表现时增加公平性。当分数取决于评分者的个人喜好时,应试者的成绩很大程度上取决于谁对测试进行评分。

标准化考试还可以消除评估中的评分者偏差。研究表明,教师在对应试者的评估中创造了一种自我实现的预言,给他们预期会取得更高分数的人高分,而给那些他们预计不及格的人打较低的分数。在非标准化评估中,评分者拥有更多的个人自由裁量权,因此更有可能通过无意识偏见产生不公平的结果。

缺点

[编辑]

教师或学校因在标准化考试中表现更好而获得奖励时,就会鼓励教师“应试教学”,而不是提供丰富而广泛的课程。2007 年,Au Wayne 进行的一项定性研究表明,标准化考试缩小了课程范围,并鼓励以教师为中心的教学,而不是以学生为中心的学习。[2]除此之外,标准化测试往往不太关注道德或品格发展,而更多地关注学术技能,例如阅读理解和算术。

参考文献

[编辑]
  1. ^ Popham, W.J. Why standardized tests don't measure educational quality. Educational Leadership. 1999, 56 (6): 8–15. 
  2. ^ Au, Wayne. High-Stakes Testing and Curricular Control: A Qualitative Metasynthesis. Educational Researcher. 2007-06-01, 36 (5) [2025-10-31]. ISSN 0013-189X. doi:10.3102/0013189X07306523 (英语).