,,

小學教育學（中等師范）全冊復習材料（十九）

來源：育路計算機考試頻道發布時間：2008-09-23

第十二章教育測驗與評價——第一節教育測驗

　　一、教育測驗的概念
　　(一)概念界說
　　測量是給事物的某種屬性給定數值的過程，回答了“有多少”的問題。教育測量包括了從身體身體素質到興趣態度等多個方面。
　　測驗是對于知識水平、情意狀態、運動技能等的數量化測定，有廣義和狹義之分。狹義的測驗僅指一份測驗卷子，而廣義的測驗指編制試題、施測、評分到報告成績的全過程。在教育領域，測驗只是測量的一種形式，主要用來測量學生的學業成績和心理特點。如果說測量回答了“有多少”的問題，只考察量的大小，測驗則回答了“某個人做的怎么樣”的問題，包含了對測驗結果的解釋和評判。
　　規范的考試是教師在教學過程中編制試題、評定學生學業成績的過程，如期中、期末考試。它與測驗的區別有兩種看法。第一種是從教育測量學中引出，認為測驗更為規范，從試題編制、實施測驗測驗到評分過程都有嚴格的程序，而考試則是教師可自行安排，相對靈活，技術要求不高的測驗形式。另一種觀點與第一種正好相反，認為測驗比較隨意，而考試則較為正式。本書主要采用第一種觀點。
　　評價是對某種教育活動的價值判斷。評價包含定性描述或價值判斷，更多的時候是兩者兼而有之。
　　(二)測驗的功能
　　測驗具有以下功能：(1)激勵功能；(2)診斷功能。診斷性測驗主要考察兩個方面，一個是看基礎打得好不好，可否滿足學習某種新知識的需要，另一個是看理解和掌握上有什么錯誤及其原因所在，它為教學提供了豐富的反饋信息，使教師能及時調整教學；(3)區分和選拔功能。升學考試就體現了測驗的選拔功能，如高考；(4)評定功能。
　　二、測驗的類型
　　從測驗目的上考慮，可以分成安置性測驗、形成性測驗、診斷性測驗和總結性測驗。從測驗內容上考慮，可以分成成就測驗和學能測驗。從規范程度上區分，可以分成標準化測驗和教師自編測驗。從結果解釋所參照的標準區分，又可以分成常模參照性測驗和標準參照性測驗。
　　(一)安置性測驗、形成性測驗、診斷性測驗和總結性測驗
　　安置性測驗的根本目的是分班、分組。安置性測驗涉及的范圍比較窄，難度也比較低。
　　形成性測驗針對某一教學單元而設計，在教學過程中進行，其目的不在于評定學生，而是為了調控教學。
　　診斷性測驗能夠反映學習中常見的錯誤，診斷學習困難，特別是找到困難的成因。診斷性測驗的目的是發現問題，評分不作為正式成績。
　　總結性測驗用于對學生學習情況的階段性總結分析。在一個段落或一門課結束后，教師會編制一套試題，全面考察學生的掌握情況。現行小學學科測驗多采用閉卷形式，有時候也要求學生完成實踐性課題。
　　(二)標準化測驗和教師自編測驗
　　標準化測驗在試題編制、施測和評分過程中有著嚴格的規范。標準化測驗是由測驗專家和教師共同編制的，試題質量較有保障。最典型的標準化測驗是智力測驗，如“比奈智力量表”。
　　教師自編測驗是教師自己編制的測驗，是在教學過程中針對教學實際引用現代測驗原理編制的。教師自編測驗針對性、靈活性強，能反映實際教學中遇到的特殊問題。
　　(三)成就測驗和學能測驗
　　成就測驗是對學生學業成績的檢查，常結合具體學科而設。學校平時的課堂測驗，期中、期末考試等，都是成就測驗。
　　學能測驗，又稱學能傾向測驗，它考察學生在課程學習中所獲得的能力，與學業成就有較大關系。學能測驗不局限于某門課程，關心各門課程都需要具有一般能力，主要包括文字推理測驗和數字推理能力測驗。學能測驗一般在小學畢業前進行，能在一定程度上預測學生的發展潛力。
　　學能測驗與成就測驗的區別在于，成就測驗針對具體的教學內容而定，著重考察知識的掌握情況；而學能測驗的測驗內容比較寬泛，側重于能力考察。
　　(四)常模參照性測驗和標準參照性測驗
　　常模參照性測驗是按照在特定群體中的相對位置決定成績的好壞。選拔性考試一般是典型的常模參照性測驗，如高考。常模參照性測驗要在所定教學內容中，選出一些能區分出學生水平的題目，它不一定要面面俱到，但應該能拉開分數距離。題目難度以中等為宜，特別難和特別簡單的題目要少一些。
　　標準參照性測驗是考察是否達到了預先規定的標準，類似于各種執照考試，如駕駛執照考試。這種測驗只關注考生是否達到了應該達到了應該達到的水平，而不去管別的考生怎么樣。確定“合格”或“掌握”的標準是標準參照性測驗能否取得成功的關鍵。標準參照測驗往往是針對某幾個特殊的知識點而設計，題目覆蓋面廣，并盡可能把所學的重要知識都反映出來。標準參照性測驗不去刻意拉開學生間的距離，題目該難就難，該易就易，完全隨知識點的要求而定。
　　常模參照性測驗和標準參照性測驗的區別是：前者著重同學間的比較，后者關心有沒有達到預定的學習目標。常模參照性測驗適用于選拔性考試和總結性評定；而標準參照性測驗適用于診斷和發現學生的不足，從而為改進教學提供反饋信息。　三、良好測驗的標準
　　好的測驗都應當符合一定的要求，通常用實用性、信度、效度、難度和區分度等指標衡量測驗質量。
　　1．實用性
　　實用性反映了試題的基本質量，其基本要求是便于組織，便于實施，節時省力。(便于組織。(2)測驗便于實施。(3)容易評分。(4)結果要容易解釋。
　　2．可信度
　　可信度又稱信度，指測驗結果的前后一致程度，表示了分數的穩定性和可靠性。具體要求是，先后兩次用同樣的試卷測查同一批學生，則兩次測驗的分數應該比較相近；對同樣的答卷組織兩次評分，評分結果相近。如果上述評分結果相差懸殊，就表示可信度很低。評分的客觀性常用評分者信度來說明。
　　3．有效性
　　有效性在測量學上也稱為測驗的效度，指一個測驗能測到預先想測的知識和能力的程度。估計測驗效度的方法主要有兩種：(1)內容效度，反映了題目對所考察內容的代表性問題。(2)效標關聯效度，反映了測驗分數和所選擇的效標分數之間的一致程度。和信度相比，測驗的效度更為重要。因為效度高的測驗信度一定高。
　　4．難度
　　難度即測驗的程度，提供了試題平均通過率的信息。一份試卷的難度取決于每一道題的難度。難度用全體被試在某題的得分率(P)表示。如果全部通過，難度為1；如果誰都沒有通過，難度為0。難度值在0到1之間，難度值越大，表示題目越容易。高分段人數少，低分段的人數多，表示難度較高。高分段的人數多，低分段的人數少，表示難度較低。難度中等時，最容易拉開考生間的檔次。不同的測驗對難度有不同的要求，如選拔性考試難度以中等為宜，否則很難篩選。一般來說，某一道試題答對的學生少于20%時便是過深，答對的多于80%時則是偏淺。
　　5．區分度
　　區分度是測驗能否拉開分數距離的指標。試題的區分度也稱為鑒別力，表示某道題目能夠將不同程度的學生鑒別開來的能力。試題難度直接影響區分度，特別難的題目大家都不會做，特別容易的題目大家都會做，這兩種題目區分度都很低。反之，中等難度的試題的區分度比較高，難度為0.5的題目，區分度最大。
　　四、測驗的編制和實施
　　(一)確定試題內容
　　在選擇試題內容時，應設計測驗藍圖。測驗藍圖包括確定測驗目的、測驗內容以及編制雙向細目表等內容。(1)確定知識點。(2)確定認知水平。(3)設計雙向細目表。雙向細目表是由教學內容和教學目標構成的的。
　　(二)選擇試題類型
　　課堂測驗的題型有客觀題和論文題兩種。客觀題包括填空、判斷正誤和多項選擇等題型。論文題包括簡答題和論述題。因為客觀題和論文題各具優缺點，所以搭配使用效果最佳。
　　(三)評分
　　計分方法可分為等級分和百分制兩類。等級分在中國隋唐一代就廣為使用，百分制則是20世紀初教育測量學的發展產物。等級制的計分方法除五分制和A、B、C、D、E外，還有許多變形。使用等級分的好處是避免了在同一分數等級上同學間的攀比，會減輕過分的分數競爭。但缺點在于，等級分比較粗略，不容易反映個體間細微的差別，評分尺度也較難把握。在評分時，教師要注意到自己對學生的看法可能會影響到評分過程。和百分制相比，等級制能避免“分分計較”的學習心理，減輕學生的考試負擔。
　　(四)測驗分數的解釋
　　分數只有經過解釋具有實際意義。解釋分數時，既可以和其他同學的學習表現相比較，也可以和考核標準相對照。分數的意義是在比較中獲得的。如同樣考85分的兩個同學，其分數值雖然相同，但反映出的水平和存在的問題并不完全相同。

【糾錯】

[an error occurred while processing this directive]

閱讀上一篇：小學教育學（中等師范）全冊復習材料（十八）
閱讀下一篇：小學教育學（中等師范）全冊復習材料（二十）

【我要收藏】【進入論壇】

分享到：: QQ空間新浪微博開心網人人網更多...

看了本文的網友還看了

2012年二級建造師考試建筑工程重要考點 2012年二級建造師考試時間

·[2011年二級建造師《機電工程》真題及答案匯總] ·[2012年二級建造師各省報名條件匯總]

育路版權與免責聲明

① 凡本網注明稿件來源為"原創"的所有文字、圖片和音視頻稿件，版權均屬本網所有。任何媒體、網站或個人轉載、鏈接轉貼或以其他方式復制發表時必須注明"稿件來源：育路網"，違者本網將依法追究責任；

② 本網部分稿件來源于網絡，任何單位或個人認為育路網發布的內容可能涉嫌侵犯其合法權益，應該及時向育路網書面反饋，并提供身份證明、權屬證明及詳細侵權情況證明，育路網在收到上述法律文件后，將會盡快移除被控侵權內容。

小學教育學（中等師范）全冊復習材料（十九）

看了本文的網友還看了

2012年二級建造師考試建筑工程重要考點 2012年二級建造師考試時間

育路版權與免責聲明

心理學

教育學

金牌網絡輔導課程