跳至內容

標準化考試

維基百科,自由的百科全書
二戰期間,一名英國士兵正參加對機械零件進行分類的標準化考試,以測試他對機械的理解程度

標準化考試是一種對所有應試者以統一方式施測與評分的考試。這類考試的題目設計、成績總分、扣分均遵循所有人一致性原則,考試流程與評分標準均以預先設定的規範執行。[1]任何以相同模式對所有人進行施測、採用統一標準評分的測試均屬標準化測試。標準化測試可以以筆試、口試或實操等方式呈現。著名的標準化考試有SATGRE等。

形式

[編輯]

標準化考試對所有應試者進行統一評分。任何以相同方式對所有應試者進行相同測試,並以相同方式對每個人進行評分的測試,都是標準化測試。標準化考試不需要是高風險考試、限時考試、選擇題考試、學術考試或針對大量應試者的考試。

標準化測試可以由選擇題判斷題、論文題、實操考試或幾乎任何其他形式的考試組成。選擇題和對錯題通常被選擇用於成千上萬的人參加的測試,因為通過使用可由計算機讀取的特殊答題卡,可以廉價、快速和可靠地給出評分。一些標準化測試有簡答題或論文寫作部分,由獨立評估員給出分數,他們使用評分標準(規則或指南)和基準試卷(每個可能分數的試卷示例)來確定回答的評分。

下面舉例說明不同形式,不同領域的標準化考試與非標準化考試的差異:

領域與主題 考試形式 標準化考試 非標準化考試
歷史 口試 每個學生都會被提出相同的問題,他們的答案也以相同的方式評分。 老師問每個學生一個不同的問題。有些問題比其他問題更難。
數學 書面 每個學生都會被提出相同的問題,他們的答案也以相同的方式評分。 老師給不同的學生出不同的題目:對差學生出很簡單的,對大多數學生是普通的,對最好的學生是困難的。
駕駛 實操 每個駕駛學生都被要求做同樣的事情,並且他們都按照相同的標準進行評估。 一些駕駛學生必須在高速公路上行駛,但另一些學生只需要在街區周圍緩慢行駛。一名考官因「態度不佳」而扣分,但其他考官則沒有。
音樂 試演 所有音樂家都演奏同一首音樂。評委們事先商定了時間、表達和音樂性等因素的重要性。 每個音樂家都會選擇不同的音樂來演奏。評委們選擇他們最喜歡的音樂家。

主觀和開放性題目(如簡答題、論文題、實操考試)也可以進行標準化考試,下面是一個例子,關於開放性歷史問題分別如何在標準化考試和非標準化考試中評分:

開放性歷史問題:是什麼導致了第二次世界大戰
標準化考試中 非標準化考試中
評分標準:如果答案至少提到以下一項,則將其標記為正確:德國入侵波蘭、日本入侵中國或經濟問題。 沒有明確標準。每位教師都會根據自己的意願進行評分,同時考慮教師認可的任何因素,例如答案、努力量、學生的學術背景、語言能力或態度。
學生1:二戰是由希特拉和德國於 1939 年入侵波蘭引起的。 老師 1:這個答案提到了必填項之一,所以它是正確的。

老師 2:這個答案是正確的。

老師 1:我覺得這個答案已經足夠好了,所以我會把它標記為正確。

老師 2:這個答案是正確的,但這個好學生應該能夠做得比這更好,所以我只給予部分認可。

學生2:二戰是由多種因素引起的,包括大蕭條和總體經濟形勢、國家社會主義、法西斯主義和帝國主義擴張,以及與第一次世界大戰有關的未解決的怨恨。歐洲戰爭始於德國入侵波蘭。亞洲部分始於日本入侵中國。 老師 1:這個答案提到了必填項之一,所以它是正確的。

老師 2:這個答案是正確的。

老師 1:我覺得這個答案是正確和完整的,所以我會給予充分的認可。

老師2:這個答案是正確的,所以我會給滿分。

學生3:二戰是由 1914 年斐迪南大公被暗殺引起的。 老師 1:此答案沒有提及任何必需的項目。沒有分數。

老師 2:這個答案是錯誤的。沒有分數。

老師 1:這個答案是錯誤的。沒有分數。

老師2:這個答案是錯誤的,但這個學生努力了,句子語法正確,所以我給努力一分。

評價

[編輯]

優點

[編輯]

使用評分標準是為了在評估應試者的表現時增加公平性。當分數取決於評分者的個人喜好時,應試者的成績很大程度上取決於誰對測試進行評分。

標準化考試還可以消除評估中的評分者偏差。研究表明,教師在對應試者的評估中創造了一種自我實現的預言,給他們預期會取得更高分數的人高分,而給那些他們預計不及格的人打較低的分數。在非標準化評估中,評分者擁有更多的個人自由裁量權,因此更有可能通過無意識偏見產生不公平的結果。

缺點

[編輯]

教師或學校因在標準化考試中表現更好而獲得獎勵時,就會鼓勵教師「應試教學」,而不是提供豐富而廣泛的課程。2007 年,Au Wayne 進行的一項定性研究表明,標準化考試縮小了課程範圍,並鼓勵以教師為中心的教學,而不是以學生為中心的學習。[2]除此之外,標準化測試往往不太關注道德或品格發展,而更多地關注學術技能,例如閱讀理解和算術。

參考文獻

[編輯]
  1. ^ Popham, W.J. Why standardized tests don't measure educational quality. Educational Leadership. 1999, 56 (6): 8–15. 
  2. ^ Au, Wayne. High-Stakes Testing and Curricular Control: A Qualitative Metasynthesis. Educational Researcher. 2007-06-01, 36 (5) [2025-10-31]. ISSN 0013-189X. doi:10.3102/0013189X07306523 (英語).