評價理念
報告中開頭列出的幾個“需要注意的問題”,體現出OCR認真嚴謹的工作態度及人性化的評價理念。比如:
(1)“評註”:要求教師在評分時在得分點說明得分的原因,以便OCR了解是否真正掌握了評分標準; (2)“評分標準”:要求學校必須嚴格遵照OCR制定的評分標準來判分,不許自擬標準,以免影響考生成績;
(3)“通信與交流”:強調教師評分時,一定要給考生一定的“通信與交流”方面的情感態度分,有的教師在這方面判分太過苛刻,這是不合適的。
而報告的核心內容則是以五大評估目標(Assessment Object,縮寫為AO)為依據對課程作業中逐個知識點得分情況的分析,這五項目標既是評判分數的準繩又是分析評估結果的依據。目標具體內容為: AO1:通過ICT的學習,適當運用所學知識、技能及理解能力處理某些事件。
AO2:分析、設計、完成、測試、評估、證明人們使用的信息通訊系統,加深對於廣泛套用ICT的影響的理解。
AO3:理性分析自身和他人使用ICT的過程和方法。
AO4:討論、評論ICT廣泛套用的影響。
AO5:在不斷使用ICT的過程中,考慮信息的社會、經濟、政治、法律、民族、道德的影響及其安全性。 現以Assesment Object 2 (AO2)為例:
表 1 考生 AO2 得分情況
AO2得分點 | 考生得分情況 |
分析 | 作為整個課程作業的關鍵,考生在這一步完成得非常出色,他們準確地把握住了任務的目的及設計的焦點問題 |
設計、完成、測試 | 此處分為兩個得分等級,較低等級的考生是僅能夠分析任務,並且完成一個ICT系統;而較高等級的考生在完成任務的過程中,還為自己的設計加以說明,譬如為何對設計作如此的改變,為何這部分設計保留而放棄另外一部分等等;同時OCR指出一些學校在此處給分過於慷慨,OCR會針對這部分給考生成績做出調整 |
評價、實施、效果 | 整個作業得分最少的點,考生沒有體現出ICT相對其他信息處理方式的獨特優勢,也沒有證明何時使用及為何使用ICT是完成任務的最佳方式 |
說明 | 要求考生有一個作業說明,即說明系統的使用對象、系統的主要功能等,目的在於督促學生養成良好的設計習慣 |
對於“課程作業”這種高度開放的評價模式,為了避免評分的主觀性和欠科學性,OCR在評分標準中從整體評價目的到具體各項評價指標的權重、分值等都作了嚴格的要求和詳細的闡述,力圖達到主觀題的客觀化,有力的加強了評價的可觀察性和可測量性。
那么,在評估報告中,再結合考試的實際情況給予更充分的說明和例證,將評分標準中抽象的數字及說明形象化,一方面可以幫助教師更加準確的把握評分標準的思想,從而提高以後判分的質量,保證考試的公平性;另一方面相當於提供了一份課程作業指導檔案,幫助師生進一步解讀課程作業所考察的主題和內容,以期閱讀報告後教師能夠在以後的教學中調整教學思路並給學生提供更有針對性的指導和訓練,學生能夠發現自己的長處與不足,以免在以後的作業中無所適從或放任自流。
在我國,信息技術課是一門基於活動和實踐的課程,“課程作業”這種質的評價方式對於全面考察信息素養水平也是極其重要的。但是在高考、會考這些高利害的考試中,由於社會文化背景,學校所面對的壓力,課程和試題發展的不成熟以及這種評價方式自身的特點,建議在總結性評價中對採用“課程作業”的方式仍然持謹慎態度。
答題分析
“筆試基礎卷報告”和“筆試高級卷報告”分別就試卷中每道題目考生的回答情況作了詳細分析,本文選取2007年基礎卷的第2題為例說明報告的內容,該題旨在考察考生如何思考並評論ICT對社會生活的影響(AO4)。 原題為:Wordsworth牙科診所通過e-mail和簡訊息的方式與病人進行交流。
(a) 什麼設備可以接受簡訊息?
(b) 說出一種對病人來說,這種簡訊息預約提醒的好處?
(c) 說出兩種對Wordsworth牙科診所來說,使用e-mail與病人交流的好處?
(d) 說出兩種在沒有e-mail和簡訊息的情況下,可以與病人溝通的方式。
表 2 第 2 題答題情況分析
題號 | 考生答題情況 |
2(a) | 很好,但是有些考生只是簡單的回答“電話”,而沒有準確的指出是“行動電話” |
2(b) | 尚可,許多考生僅是將問題換了一種表述的方式來作為回答,這是不能得分的 |
2(c) | 不太好,大多考生審題不清,是從病人的角度回答問題,而不是從牙科診所的角度;有的考生只用了“快速”、“簡單”等一個單詞就完成了回答,沒有陳述理由,顯得答案過於單薄,且缺乏說服力;還有的考生只是回答了使用e-mail的好處,而沒有與牙科診所相結合 |
2(d) | 尚可 |
報告結合試題,指出考生要么由於沒有使用正確的專業辭彙;要么因為曲解題意、審題不清,導致答題的角度錯誤;要么因為回答過於簡單而扣分或得不到滿分,所以提醒學校應在平時注意加強訓練考生答題的完整及專業用語的規範等。這種針對具體題目的分析,將考生存在的問題清晰地呈現給閱讀者,具有較強的說服力。
評分等級
表 3 各單元的等級分數門檻表
單元 | 滿分 | A* | A | B | C | D | E | F | G | U |
試卷1基礎 | Raw | 40 | - | - | - | 37 | 32 | 27 | 23 | 19 | 0 |
UMS | 55 | - | - | - | 48 | 40 | 32 | 24 | 16 | 0 |
試卷1高級 | Raw | 40 | 39 | 35 | 31 | 28 | 23 | 20 | - | - | 0 |
UMS | 80 | - | 64 | 56 | 48 | 40 | - | - | - | 0 |
課程作業 | Raw | 64 | 60 | 51 | 42 | 34 | 28 | 23 | 18 | 13 | 0 |
UMS | 120 | - | 96 | 84 | 72 | 60 | 48 | 36 | 24 | 0 |
擴充課程作業 | Raw | 64 | 60 | 51 | 42 | 34 | 28 | 23 | 18 | 13 | 0 |
UMS | 120 |
96 | 84 | 72 | 60 | 48 | 36 | 24 | 0 |
試卷2基礎 | Raw | 55 | - | - | - | 37 | 31 | 25 | 19 | 13 | 0 |
UMS | 55 | - | - | - | 48 | 40 | 32 | 24 | 16 | 0 |
試卷2高級 | Raw | 80 | 54 | 47 | 40 | 33 | 25 | 21 | - | - | 0 |
UMS | 80 |
64 | 56 | 48 | 40 | - | - | - | 0 |
這張表公布了每個單元的成績等級劃分標準,此門檻是依據每年學生各個單元的試捲成績整體情況計算、權衡得出的,因而每年的門檻成績都會略有改動。由於筆試試卷1與筆試試卷2的卷面原始分值不同,所以將試卷1的分數以試卷2的總分為標準折算成標準分,這樣方能確保考生所得分數是在同一個標準下得出的,從而保證了考試的公平與公正。
而OCR給學生打出的最終等級成績,是按照每個單元占總成績相對比重的不同為每個單元賦予一定的權重,然後根據各個單元的權重,利用科學的數據合併方法進行數據合併而得出的。
在新課程背景下,一直倡導改革傳統的量化評價方法,而注重質的評價,所以具有相對穩定內涵的等級評定法也是我國信息技術課比較推崇的評價方法。但是從幾個已經採用等級評定法的實驗區所公布的方案來看,主要有以下兩個問題:一是劃分的等級過於簡單,有的地區分為優秀、良好、及格和不及格,還有的地區分為A—D四個等級,這樣的劃分過於粗略,無法相對準確的表明學生的能力水平;二是各地區事先公布的等級門檻隨意性太大,更降低了它的權威性。英國的“等級分數門檻表”,是在了解了同年考生的考試整體情況以後再計算出門檻成績,這樣保證了每年考試成績的相對參考價值,使學生成績不會因為各年試題的難易程度的不同而出現大的波動,而我國的做法太過簡單,不具說服力。英國的報告讓我們看到了等級評定法規範、嚴謹的一面。
這篇“單元報告”對此次會考作了較透徹的評析, 沿襲了英國信息通信技術課總結性評價人文氣息濃厚的風格,語言中肯、易懂且以鼓勵為主,分析深入、到位並用實例佐證。它主要目的是通過總結和剖析考試的結果,發現問題,以期能幫助教師進一步理解教學大綱、改進教學,並為教師了解評估方案的實施、評分標準的套用等方面提供有針對性的指導。所以報告內容緊緊圍繞著五大評估目標逐步深入,從概括到具體多層次、多角度的呈現了考試中發現的問題。