國立空中大學「書香園地」: 96下心理與教育測驗

心理與教育測驗

LOVE 2005-06-08標題

【第一章重點】
一、所謂測量，是指依據某種工具，用數字描述某項事物的歷程。
二、心理測量是測量人之心理特質的歷程，凡是運用心理測驗或量表，測量個人或團體的各
項心理特質，進而量化人之心理特質的整個歷程，就稱為心理測驗。
三、心理測量有下列幾個基本課題:
(1)、心理測量的客體是人的心理特質。
(2)、心理測量的工具有一定的編製程序。
(3)、心理測量的工具應具可靠性與正確性。
(4)、心理測量的結果以量化的數據來呈現。
四、心理測量的誤差種類：
(1) 依誤差的來源分：
● 時間取樣誤差：即在不同的時間測量，所產生的誤差而言。
● 內容取樣誤差：即測量結果的實得分數與個人本身所應具有的真實分數之間有了
顯著的差異所顯示出的誤差，是測量工具本身之題目或內容所造
成的，這種誤差在測量上，就是內容取樣誤差。
(2) 依誤差的變異性分：
● 系統性誤差：即一個人接受同一測量工具測量多次，這多次的測量結果彼此間有
差距，而這些差距的原因是某些規則性的變異因素所造成的，就稱
做是測量的系統誤差。
● 非系統性誤差：凡多次測量結果的得分變化情形，是因不規則的變異因素造成的，
就稱為是測量的非系統性誤差。
五、心理測驗是指，在標準化的情境下，測量個人心理特質的工具或歷程。
六、測驗可依不同的標準，而有許多種不同的分類:
(1)、依測量特質可將其分為認知測驗與情意測驗;
(2)、依內容的呈現方式可將其分為文字測驗與非文字測驗;
(3)、依一次施測人數了將其分為個人測驗與團體測驗;
(4)、依計分方式可將其分為客觀測驗與非客觀測驗;
(5)、依命題型式可將其分為選擇反應測驗與結構反應測驗;
(6)、依解釋模式可將其分為常模參照測驗與標準參照測驗。
七、認知測驗：旨在測量心智能力，所以又稱為能力測驗，此類測驗包括智力測驗、性向測
驗、成就測驗及創造思考測驗等。
八、情意測驗：則在測量個人心智能力以外的各類心理特質，易言之，即在測量各項人格特
質，所以情意測驗又稱為非能力測驗。
九、文字測驗的題目是以文字來呈現，其作答說明與答題反應亦都使用文字或語言。
非文字測驗的題目不用文字來呈現，而是以圖形或實物為測驗素材，然答題卻常以文字
來呈現。
十、個人測驗一次只能施測一個人，而團體測驗則一次可同時施測許多人。
十一、客觀測驗：是指計分有標準或有正確答案可資遵循的測驗，此種測驗的計分不會因計
分者的不同而有差異；如選擇題或是非題的測驗。
十二、非客觀測驗：是指計分無固定標準答案可資遵循的測驗；如論文測驗。
十三、凡是測驗題目以選擇題、配合題或是非題的型式來命題者。就屬於選擇反應測驗。
十四、結構反應測驗：則是以申論題或問答題的方式來命題，其答案大皆是一段文字或一篇論文。
十五、常模參照測驗：就是指測驗的結果，根據測驗分數在團體中的相對位置而加以解釋的一種測驗。
十六、標準參照測驗：則是指測驗的結果，根據事先訂定的標準而加以解釋的一種測驗。
十七、使用測驗時，必須遵循測驗的一些基本假定：
(1) 測驗中的每一個題目及每一個題目裡的全部文字，對不同的人具有相同或相似的
意義。
(2) 人們能夠正確地知覺與描述他們的自我觀念與人格特質。
(3) 人們將能夠誠實地說出他們的思想與感情。
(4) 個人的測驗行為(及真實行為)具有相當的一致性與穩定性。
(5) 測驗在測量它所想要測量的東西。
(6) 個人在測驗上的觀察分數，等於他的真分數。
十八、測驗的主要功能有:
(1) 了解個別差異
(2) 落實輔導與諮商效能
(3) 分類與安置人員
(4) 協助診斷與評鑑
(5) 促進研究與發展。
十九、測驗應具備的要素有:
(1) 信度：是指測驗的可靠性，包含測驗分數的穩定性與測驗內容的一致性。
(2) 效度：是指測驗的正確性，亦即指測驗能夠測量到它所欲測量之特質的程度，
或是指測驗能達到其目的程度。
(3) 常模：是指某特定團體在某一測驗上之得分的平均數。換言之，根據標準化樣
本施測結果，將所有受試者的分數，經統計分析，整理出一個系統性分
數分配表，按高低排列，所得平均數，就稱之為常模。
(4) 可使用性：包括易於取得所需的測驗、施測的方便性、及易於計分與解釋。
二十、評估信度高低的方法：
(1) 重測信度：即在計算同一群體前後兩次測驗分數的相關程度。
(2) 折半信度：即在計算同一次測驗中，單數題目之總分與偶數題目之總分的相關程度。
(3)複本信度：即在計算兩份互為複本之測驗的分數的相關程度。
二十一、評估效度的高低的方法：
(1)內容效度，是指測驗內容的代表性或取樣的適切性而言。
(2)效標關聯效度，是指某測驗所要測量的行為特質或量數。
(3)建構效度，則是指測驗能夠測量到理論之特質的程度。

心理與教育測驗【第二章重點】
一、在測驗上所得之未經處理或轉換的分數，我們稱為「原始分數」。
二、所謂衍生分數，是指將原始分數依照某個參照標準所轉換而來的分數。
三、在測驗學上，解釋測驗分數的依據，就稱之為常模。
四、常模有廣、狹二義：
●狹義的常模是指某特定團體在某一測驗上之得分的平均數
● 廣義的常模則是指經由統計處理，所形成的一組將測驗之原始分數轉換成衍生分數之
分數對照表，而此種衍生分數可說明個人所得之分數，在團體中所佔的相對地位。
五、常模有下述二種功能:
(1) 提供個人間測驗分數的比較依據
(2) 提供個人內測驗分數的比較依據
六、常模應具備的要件有:
(1) 建立時間要具最新性
(2) 抽樣對象要具代表性
(3) 使用目的要具適宜性
七、常模的類型：
(1)依常模的母群來分：
●全國常模：是指以整個國家為母群在測驗上之資料所建立的常模。
●地區常模：是指依某一特定地區之母群所建立的常模。
●特殊團體常模：是指以特定團體為母群所建立的常模。
(2)依常模的統計方法來分：
●百分等級常模
●標準分數常模
八、所謂次序變數是指可以就某一特質之多少或大小次序將團體中各份子加以排列的變數。
九、相對地位量數則是指與某一參照比較起來某人所佔的地位，亦即是就某一特質來描述一
個人在團體中所佔的地位的量數。
十、所謂百分等級是指低於某一特定分數以下，在某一類分數分配上所佔的百分比。
十一、百分位數與百分等級常被混淆或誤用，其實這是兩個不同的統計概念。
百分等級是指某個分數所對應的等級，百分位數則是指某百分等級所對應的分數。
十二、百分等級之優點：
(1) 百分等級容易計算，容易了解
(2) 百分等級適用於各種測驗
(3) 百分等級均適用於兒童與成人
(4) 不管原始分數的分配性質為何，使用百分等級都可正確解釋測驗分數
十三、百分等級之缺點：百分等級因是一種次序變數，所以它的等級單位並不相等。
十四、標準分數常模是指，運用標準分數所建立的原始分數轉換成衍生分數的對照表。
十五、標準分數依轉換方式不同：
●依直線轉換而來的直線標準分數
●依常態化轉換而來的常態化標準分數。
十六、常用的標準分數常模有Z分數、T分數、AGCT分數、CEEB分數、離差智商與標準九.
十七、建立常模可資遵循的步驟有：
(1) 抽取具代表性的樣本
(2) 對樣本實施測驗
(3) 檢閱答案紙與基本資料編碼
(4) 建立資料電腦檔
(5) 進行統計分析
(6) 編製常模表
十八、百分等級常模其具體的計算過程：
(1) 將測驗的原始分數從最高分至最低分加以排序。
(2) 計算出每個原始分數的次數分配。
(3) 計算每個原始分數的累積次數。
(4) 利用公式：cfmp=f/2+F，或cfmp=cf-f/2 計算每個原始分數之組中點的累積次數。
(5) 利用公式：cpmp=100(cfmp)/N計算各原始分數的累積百分比。
(6) 圓整每個cpmp的值，即依四捨五入法將其轉成整數，這個整數即為各個原始分數
的百分等級。
◎使用符號的意義：
X：原始分數
f：原始分數的次數
Cf：原始分數的累積次數
cfmp：原始分數累積至組中點的次數
cpmp：原始分數的累積百分比
PR：百分等級
F ：累積至原始分數下一組的次數
N ：原始分數的總次數
十九、所謂Z分數常模是指以Z分數來代表衍生分數的一種常模。
Z分數的公式：Z=(X-X )/SD
二十、所謂T分數常模是指以T分數來代表衍生分數的一種常模。
T分數的公式：T=10Z+50
二十一、所謂AGCT分數常模是指以AGCT分數來代表衍生分數的一種常模。
AGCT分數的公式：AGCT=20Z+100
二十二、所謂CEEB分數常模是指以CEEB分數來代表衍生分數的一種常模。
CEEB分數的公式：CEEB=100Z+500
二十三、所謂離差智商常模是指以離差智商分數來代表衍生分數的一種常模。
離差智商分數的公式：IQ=(MA/CA)*100
MA：心理年齡 CA：生理年齡
二十四、離差智商的其本原理也是來自於Z分數，不過它有兩種算法：
(1) 魏氏智慧量表的算法。【魏氏智慧量表的DIQ=15Z+100】
(2) 斯比量表的算法。【斯比量表的DIQ=16Z+100】
二十五、所謂標準九常模是指以九個等份來代表衍生分數的一種常模。

心理與教育測驗【第三章重點】
一、心理測驗分數表示成O=T+E；
二、 ●(O)是指一個受試者在心理測驗上所得到的一個實際的分數受試者的作答紙，對照標準答案並計算答對及答錯的題數後，所得到的分數。因此常被稱作是觀察分數或是
實得分數。
● 受試者在心理測驗的實得分數，或多或少會隱藏著有不可靠的成份，這個不可靠的
部份，可以簡稱為測量誤差分數(T)。
●(E)真分數是一個假設存在的分數，而實際上無法確知的分數。
三、信度是指測驗分數的可靠程度。最常用來解釋信度的理論，稱之為真分數理論的信度理論模式，該理論認為，測驗的實得分數等於真分數加上測量誤差分數;換言之，測驗分數的信度，關係著測量誤差分數的多寡。
四、估計信度的方法主要有三類:
第一類是重測信度法
第二類是複本信度法
第三類是內部一致性相關法，又可分為折半信度法、庫李信度法及Cronbach0法等。五、重測信度乃是指將同一個測驗以同樣方法但卻在不同時間重覆實施於同一樣本；即以
同一個測驗，對同一受試者施測二次。
六、複本信度法：即以一個測驗及其複本測驗對同一組受試者施測，再以原測驗分數與複本測驗分數，計算其積差相關係數，用以估計測驗分數的信度。
七、若將測驗均勻地分割成兩個部分測驗時，信度係數估計的方法稱為折半信度法。另一極端是將測驗中的每一試題均視為一個部份測驗時，信度係數估計的方法稱為庫李信
度法。
八、測量標準誤是指，測驗分數之誤差程度的量數，其信度之間成反比的關係。亦即信度愈高，測量標準誤愈小;反之，信度愈低，測量標準誤愈大。

心理與教育測驗【第四章重點】
一、效度是測驗的最重要要素。效度是指，測驗分數與測驗所欲測量之品質的一致性程度，測驗分數的正確性，測驗能夠測量到它所欲測量之特質的程度，或是指測驗能夠達成其目的的程度。
二、當在測驗或測量的情境中使用到效度時，必須注意到下列幾點事項：
(1) 效度是指測驗結果的適合性，而非指測驗本身。
(2) 效度是程度上的問題，而非「全有或全無」的存在。
(3) 效度對於某些特殊的用途或解釋都是獨特的，所以沒有一個測驗對於所有的目的都
是有效的。
(4) 效度是一種單一的概念。
三、影響效度的因素：
(1) 不清楚的指導語
(2) 詞彙或句子結構太難
(3) 測驗的題目難易度不適當
(4) 測驗題目粗製濫造
(5) 試題曖昧不明
(6) 試題無法測量真正的成果
(7) 不夠的時間限制
(8) 測驗太短
(9) 試題安排不妥當
(10) 答案項安排不當
四、內容效度是指，測量心理特質的行為樣本反映整體行為表現的程度。
五、評估內容效度的基本程序包括三個步驟：
(1) 描述欲測量特質的內容領域。
(2) 確定每道測驗試題所測量到的內容領域的範圍。
(3) 比較測驗的結構與內容領域的結構之間的異同。
六、雙向細目表主要包括測驗所要測驗之學科的教學內容與教學目標兩大部分。
七、效標關聯效度是指，測驗分數與測驗所欲測驗之特質的外在指標之間的相關程度。
八、效標關聯效度的種類有兩種：
(1) 同時效度：是指測驗分數與測驗施測同時取得之效標之間的相關程度，此種相關大
都是使用積差相關。
(2) 預測效度：是指測驗分數與測驗施測後一段時間所取得之效標之間的程度。
九、建構效度：是指一個測驗能夠測量到它所欲測量之建構的程度，易言之，一個測驗能夠測量符合其賴以編製之理論的程度，就稱之為建構效度。
十、所謂建構：是指一種理論上的構想或概念，它是看不見也模不著，甚且可說是存不存在都有待求證，但為了研究或實務上的需要，我們假設它是存在的，而且是可以加以探究的。
十一、所有建構都包含兩種必須的特質：
第一個特質是在本質上，它們是某些規則的抽象摘述。
第二個特質是，它們與具體的、可觀察的實體或事件有關或相關聯。
十二、闡釋建構的歷程有下述三個步驟：
(1) 確認與欲測量之建構有關的行為。
(2) 確認其它的建構，並檢視它們與欲測量建構是否有關或無關。
(3) 以建構之間的關係為基礎，確認與每一個其它建構有關的行為，並檢視每一個行為是否與欲測量的建構有關。
十三、驗證建構效度常用的統計方法：
(1) 相關檢定
(2) 差異檢定
(3) 因素分析
十四、效度與信度是評估測驗品質兩個最重要的要素。信度是效度的必要條件，而非充分條件。效度高，信度一定高;信度高，效度卻不一定高。
十五、效度係數的極大值等於測驗信度與效標信度之乘積的平方根。

心理與教育測驗【第五章重點】
一、試題分析的主要目的是，評估試題的適用性，具體說則可從兩方面來說明其目的。
(1) 從心理測量來看，試題分析可以幫助心理學家編製具有良好信度與效度的測驗工具，而且也可以協助心理學家了解測驗工具在計量學上的特性。
(2) 從教育測量來看，試題分析可以幫助教師了解，試題的難易度是否合宜，試題是否
可以區辨學生學習結果的差異;試題分析的結果也可以幫助教師了解學生學習的進展
及困難所在。
二、試題分析的方法是指一套用來分析試題心理計量特性的系統性方法。它並不是一組固定的步驟，它可以是任何有系統的方法，只要是能提供有用的資訊，引導形成良好的心理測驗分析的方法。
三、試題分析主要包括試題難度分析與試題鑑別度分析。
四、代表試題難度的量數是試題難度指數，用P來代表，其公式為:
P=R/N 或 P=(PH+PL)/2
【P為試題難度，N為全體受試者人數，R為答對該題的人數】
【P為試題難度，PH為高得分組答對試題的百分比，PL為低得分組答對試題的百分比】
五、試題鑑別度是試題分析用來描述試題鑑別能力的指數。它通常會是以受試者作答試題結果與整個測驗分數結果一致的程度的指數。
六、描述試題鑑別度的方法有三大類：
第一類是極端組群法。
第二類是內部一致性分析法。
第三類是刪題的方法。
七、試題鑑別指數，用D來代表，其公式為:D= PH-PL
【D為試題鑑別指數，PH為高得分組答對試題的百分比，PL為低得分組答對試題的百分比】
八、內部一致性分析的方法此即常見「諧度分析」的方法。其目的在分析個別試題得分與整個測驗分數作用的一致性。
九、試題鑑別度指數，常見的計算方法有：
(1) 計算試題分數與其測驗總分的關聯性指數，常見的關聯指數有：二系列相關或點二
系列相關係數，求得的相關係數，以表示內部一致性的高低，亦即試題鑑別度指數。
(2) 計算試題分數與其測驗總分之積差相關係數，對於測驗總分的處理有兩種不同的方
式，一是總分不扣除原本式題得分；另一則是總分扣除原本試題得分。

心理與教育測驗【第六章第一節重點】
一、智力的涵義共有四種界定方向：
(1) 智力是抽象思考的能力
(2) 智力是學習的能力
(3) 智力是適應環境的能力
(4) 智力是問題解決的能力
二、智力是指個體的抽象思考，學習、適應環境及問題解決的能力。
三、智力的結構理論：
(1) 因素分析理論：又分二因素說、群因素說和多因素說。
● 二因素說認為智力是由一般因素和特殊因素、或流體智力和結晶智力所構成。
● 群因素說認為智力是由一群主要能力因素所組成。
● 多因素說認為智力是由許多因素所組成，而每一因素代表一獨特能力。
(2) 非因素分析理論：分為發展論和認知論。
● 發展論認為智力是指個體對生存環境生物適應的能力。
● 認知論則認為智力是指個體的認知過程。
四、基魯福特的智力結構模型：
第一層為「內容」，包括圖形的、符號的、語意的和行為的等四種因素。
第二層為「運作」，包括評價、收歛思考、發散思考、記憶、認知等五種因素。
第三層為「成果」，包括單位、類別、關係、系統、轉換和涵義等六種因素。
五、個體在處理訊息和思考問題時的認知過程可分為兩種類型：
一類是同時性處理：是指個人在問題解決情境中，可以同時考慮多種刺激，並作出答案的能力。
另一類是序列性處理：是指個人在同樣情境中，將各種刺激作順序性的安排，再求出答的能力。

心理與教育測驗【第六章第二節~第四節重點】
一、智力測驗是用來測量個人潛在能力的一種測驗。其主要目的在鑑別個人智力的高低，以便作為輔導或工作分配之依據。
二、智力測驗結果的分數必須依據在標準化過程中，所建立的常模加以解釋，而比較常用的常模有智力商數、百分位數和百分等級。
三、依據智力商數的常態分配，人類的智慧可分為非常優異、優異、高於正常、正常或平均、低於正常、邊緣或臨界、智力不足等七個等級。
四、智力測驗的種類依施測時的人數，可分為個別智力測驗和團體智力測驗，除外另有以身心障礙的兒童或成人為對象而編製的特殊智力測驗。
五、個別測驗係指在同一時間以一個人為施測對象，而以可同時測量各種不同的能力，以了解受測者在各種能力上的高低或優劣，所以在診斷或安置方面的用途較多。
六、團體智力測驗則在同一時間或分類時所需的資料，作為決策之參考。
七、特殊智力測驗是在測量某一特殊兒童或成人的智慧之高低，如肢體殘障者、視覺或聽覺障礙者以智能障者的智力。
八、比率智商是代表一個人的智力發展速率之快慢。
比率智商它是以心理年齡與實足年齡的比率，乘以100，以消除小數，其計算方式：
智商(IQ)=【心理年齡(MA)/實足年齡(CA)】*100
九、離差智商是受測者在智力測驗上所獲得的一種標準分數，它是代表一個人在智力測驗上的相對的位置或程度，而非絕對性的數值。
十、離差智商計算時不像比率智商要涉及心理年齡，它僅是將原始分數直接轉換成標準分數即可，直言之，離差智商是一種標準分數，並非如比率智商是一種「商數」。
十一、比西量表的實施程序：
(1) 熟悉施測步驟
(2) 建立銀好關係
(3) 控制測驗情境
(4) 判斷開始測驗的年齡組
(5) 決定基本年齡組與最高年齡組
(6) 計算心理年齡
十二、心理年齡是基本年齡加上基本年齡組以後所通過的測驗題目為計算依據，自2歲到5歲間(每半歲為一年齡組)，每通過一題算心理年齡一個月；自6歲到14歲間的九個年齡組，每通過一題算心理年齡兩個月；普通成人組，每通過一題算心理年齡三
個月。
十三、魏氏成人智力量表分為：語文量表和作業量表。
十四、心理學家皮亞傑認為嬰幼兒在連續的發展中，有一序列的認知發展階段，而將其分為感覺動作時期、前運作時期、具體運作時期、形式運作時期等四個階段。
十五、麥卡錫兒童能力量表，適用於2歲半至8歲半，此量表可以有效地預測學前幼兒到學齡期兒童的學習能力，亦可做為發展障礙和學習障礙的診斷。
十六、常用的團體智力測驗：
(1) 奧迪斯智力測驗
(2) 普通分類測驗
(3) 中學智慧測驗
(4) 國民中學智力測驗
(5) 羅桑二氏語文智力測驗
(6) 加州心理成熟測驗
(7) 學校能力測驗
(8) 端文氏非文字推理測驗
(9) 學業性向測驗

心理與教育測驗【第七章一節重點】
一、性向與智力同具認知性特質，兩者不易區分，但若從其著重點之差異，大致可說智力是指一種一般的普通能力，偏重在抽象思考與理解或推理，為任何認知性活動所需的能力；而性向則指在某方面的或特殊性的能力，它與某些特定的學習或技能活動有關。
二、性向大致可分為學業性向、特殊性向和綜合性向三大類。
三、學業性向測驗在測量個體在學習活動上所需的能力。
四、特殊性向測驗在測量個體在某一方面的特殊能力，如音樂、美術、文書等方面的能力。
五、綜合性向測驗則在測量個體在多方面的能力，各有其測量的目標與功用，學校可用於升學或職業輔導，就業輔導機構可用於篩選人員予以訓練或輔導其就業，軍事單位可用於入伍新兵的軍種區分和任務編組，所以在學校、就業輔導機構、軍事單位擔任輔導工作人員必須了解各種性向測驗的功用，並善加運用。
六、所謂「內在效度」是指組成性向測驗的各分測驗應該不具顯著的相關，但各分測驗在其所測的性向因素須具有可觀的因素負荷是，以證明該分測驗之效度，亦即各分測驗有其測量上的獨特性質。
七、所謂「外在效度」是指各分測驗與其外在效標，如學業成績、訓練效果、工作表現等保持高度相關，才能建立測驗的效用或實用價值，以達到使用測驗者的需求，而想採用該測驗來鑑別受測者的性向。

期中重點--一章--七章一節
1.測量、心理測量的涵義、心理測量的誤差種類？

2.測驗的定義、種類、功能與要素？

3.常模的涵義、功能與具備的要件？

4.常模的類型與意義？

5.建立百分等級及T分數常模的方法？

6.各種常模分數的定義及轉換？

7.各種信度的估計方法 (如複本信度法如何估計信度)？

8.測量標準誤的意義及其與信度的關係？

9.何謂效度？影響效度的因素？

10.效度的種類及驗證方法？

11.效標關聯效度的種類及涵義？

12.試題之難度與鑑別度的分析方法？

【第七章2-4節重點】
八、常用的特殊性向測驗：
(1) 美術性向測驗：指為測量個人的美術鑑賞和美術創作能力而設計的測驗。
(2) 音樂性向測驗：指為測量個人的音樂聽覺和知覺方面的基本能力。
(3) 文書性向測驗：係在測量個人的處理一般行政或事務之能力，所以與個人的知覺速
度及準確性有密切的關係。
(4) 機械性向測驗：是在測量個人的機械理解、機械推理和機械資訊的能力。
(5) 心理動作能力測驗：是在測量個人手部靈活、手臂或腳部的大肌肉動作，這種測驗
在軍事上與工業上使用者頗多。
九、常用的綜合性向測驗：
(1) 區分性向測驗
(2) 普通性向測驗組合
(3) 多元性向測驗
(4) 佛氏性向測驗
(5) 羅氏職業性向測驗
十、基魯福特在其智力結構模型理論中，區分收歛性思考與發散性思考的不同，編製了發散思考測驗，而托浪斯則受此影響亦創造思考測驗，稱為托浪斯創造思考測驗。
十一、所謂收歛性思考是指思考是有方向、有範圍，可由已知的方法獲得結果，而且祗有一個正確的答案，一般智力測驗即在測量這種能力。
十二、發散性思考是指思考是無一定方向、無一定範圍，可標新立異，海闊天空，從已知去尋求各種各樣的答案，亦即有許多可能的答案。

心理與教育測驗【第八章重點】
一、所謂身心系統動力的組織是指個體的身體的身體心理各有其系統，而且不斷的變化中，不是處於靜止狀態。
二、人格是指個人身心特徵的動力組織，它不僅包含個人身體和心理各方面的特徵，還包括個人在人生舞台上所扮演的角色，以及他人對其思想與行為反應的評價。
三、人格的特性：
(1) 人格的一致性
(2) 人格的獨特性
(3) 人格的統整性
(4) 人格的發展性
(5) 人格的持續性
四、一種人格測驗的結果，可從不同的人格理論予以詮釋，亦即依據施測者所服膺的理論加以應用。
五、人格測驗的編製：
(1) 反應偏向問題
(2) 信度問題
(3) 效度問題
六、人格測驗的編製方法：
(1) 投射測驗
(2) 自陳量表法
(3) 行為鑑定法
七、所謂投射測驗就是給受測者一些刺激字詞、未完成語句、含糊不清楚的圖片，或設計一個挫折情境，要求他作個反應，藉此反應內容來分析一個人的內心理歷程或潛意識問題。
八、自陳量表是由受測者依據自己情況來回答已編製的人格描述項目是否符合作個選擇，再與常模作比較，以解釋其人格特質。
九、行為鑑定就是對個體行為作個觀察、檢核和評定，藉以了解其行為的「有」、「無」，或行為等級的「高」、「低」，來解釋其外顯性行為的特性。
十、人格測驗的分類：
(1) 投射測驗(2)自陳量表(3)行為鑑定法
十一、投射法測驗工具都由一組或一系列不明確的結構材料或作業所組成，它在含義上頗為曖昧，使受測者對於測驗的目的不易了解。
十二、投射結果分析著重在尋找受測者在反應上較為突出而一致的答案型態，然後對其人格特性加以解釋，使施測者了解受測者的人格特性。
十三、投射法人格測驗大致可分為：
(1) 聯想技術：是要求受測者以測驗刺激所引發的第一個字詞或墨漬作個反應。
(2) 構造技術：是要求受測者對某情況或圖片編造一個故事。
(3) 完成技術：是要求受測者將測驗剌激的未完成語句或其他作業加以完成。
(4) 表達技術：是要求受測者實地去進行一項活動。
十四、字詞聯想測驗此測驗包含三個步驟：
(1) 對受測者現第一個刺激字詞，要他以出現在腦海中的字立刻反應，施測者要記錄
受測者對每個字詞的反應時間長度。
(2) 將每個刺激字詞再給受測者，要他以第一次反應作答，再比較兩次反應間有何差
異，並將反應前的時間長度予以記錄。
(3) 施測者為進一步了解或澄清刺激字詞與反應語間的關係，再向受測者發問，使他
有說明或解的機會。
十五、語句完成測驗是將一系列的句根呈現或口述給受測者，再由他將其完成為完整的句子。
十六、薩克斯語句完成測驗就是以結構性的「句根」組來測量家庭、性、人際關係、自我觀念等四類特性。
十七、墨漬測驗此測驗的主要適用對象為成人，其施測過程可分為：
第一自由聯想階段
第二詢問階段
第三階段稱為極限測試(在詢問階段完成之後，得視情況的需要進行第三階段)
十八、麥克賽蘭所編製的「需求成就」評分系統是先將故事歸納為下列三類別之一種：
第一、不相關意像：指受測者所說的故事內容不涉及到「成就」的內容，其評分為-1
第二、可疑性成就意像：指受測者所說事涉及「成就」，但並非故事的主題，其評分為0
第三、成就意像：指受測者所說故事全部涉及「成就」，其評分為+1
十九、繪畫測驗是依據射原理，認為圖畫是一種非語言性的表達工具，尤其是對不善於言辭者或兒童來說，受測者所畫出的人形、事物或動物會反映其對人、事、物的感覺和想法。
二十、班達視覺動作格式塔測驗，它是一個廣泛應用於臨床或學校作為神經心理甄別的工具，
二十一、投射法測驗的發展係以心理分析理論為根據，而心理分析的基本主旨在將個體潛意識中的動機予以意識化、以便協助一個人在現實環境中，克服其內在的衝動。
二十二、行為評鑑的分類：
(1) 行為觀察法
(2) 行為問卷法
(3) 行為檢核與行為評定量表
二十三、行為檢核表：通常舉出一系列的行為描述語句，觀察者就依據該表比對，指出受觀察者是否有那些行為即可。
而評定量表：則比較精細，觀察者不僅指出在受測者身上是否有此行為，尚進一步
對該行為作高低的評定，其評定等級一般分為五級或七級，由評定者或觀察者選出適合評定者的等級。
二十四、運用觀察法對個體行為作直接觀察是行為鑑定中最常用的方法，這種方法可分為：
● 自然觀察：自然觀察即在一種自然場所、自然場所、自然情境中的觀察。
● 設計觀察：設計觀察即在一種經過特殊設計或控制情境中的觀察。
二十五、行為評鑑是對個體外顯性行為與內隱性行為(指內在的心理歷程或人格特質)運用觀察法、問卷法、檢核法和評等量表法等予以評鑑。
二十六、自陳量表在編製上依其特色和功能，而有四種不同的方法：
(1) 內容效度法：係由編製者先決定其所欲測的特質，再針對它依自己的判斷和理
念編製適當的敘述語句，作為量表的內容。
如：吳德沃斯個人事實表格、貝爾適應量表、拜魯特人格量表、孟尼行為困擾調查表、愛德華斯個人偏好量表。
(2) 效標基準法：係指編製者對其所依欲測特質的性質不作任何的假設，量表所含蓋項目的選擇完全依其所效用效標的實徵關係為基礎，故本法又稱為實徵法。
如：明尼蘇達多相人格量表、加利福尼亞心理量表、明尼蘇達諮商量表。
(3) 因素分析法：係指編製的測驗，其項目的選定不須外在的效標，而完全依據各項目間之共有關係而決定。如：基晉性格量表、塞斯頓性格量表、卡泰爾十六人格因素問卷、
柯氏性格量表、艾遜克人格量表。
(4) 序列系統法：在編製人格量表時，編製者首先應對其所測的人格特質在理論上
加以界定，再依據此定義設計測驗項目，然後為此項目實施於合適樣本，並檢定其內部的一致性，最後以效標基準法來鑑定其效度，三者缺一不可，才能編製一套完整的測驗。
如：人格研究表格、賈克遜人格量表、高爾登人格量表。

心理與教育測驗【第九章重點】
一、人格可從狹義與廣義兩方面予以界定：
狹義者是指個人的個性、性格或特質。
廣義者則應涵蓋個人的興趣、態度與價值觀。
二、興趣是指促使一個人參與活動的一種自發性的力量。
三、測量興趣的方法約有四種：
(1) 面談法，即指由主持者直接詢問一個人所喜好或不喜好的人或事物，以了解其興趣
所在。
(2) 觀察法，即指由主持者觀察一個人經常接觸的人和事，以及所參與的活動，來推測
其興趣所在。
(3) 判斷法，即指從一個人對各種活動或職業的知識之多寡，來判斷他對該種活動或職
業的興趣之高低。
(4) 量表法(測驗法)，即指使用專家編製的興趣量表或興趣測驗來測量一個人的興趣。
在這些方法中以第四種的量表法或測驗法最為客觀科學化，而且使用時最方便，該法
的優點為其他三種方法所不及，故被廣泛地採用。
四、興趣測驗的種類：
(1) 史闞興趣量表(SCII)
(2) 庫德興趣量表
(3) 白朗納德職業愛好量表(BOPI)
(4) 明尼蘇達職業興趣量表(MVII)
(5) 生涯評估量表(CAI)
(6) 奧亥俄職業興趣量表(OVIS)
(7) 賈克遜職業興趣量表(JVIS)
五、 Holland(荷蘭理論)的六種人格因素：
(1) 現實性：喜愛技術資料和戶外活動。
(2) 調查性：喜愛科學和研究歷程。
(3) 藝術性：喜好自我表現和戲劇。
(4) 社會性：喜愛幫助別人，及愛好涉及他人的活動。
(5) 企業性：喜愛權力和政治權勢。
(6) 傳統性：喜愛納人組織和文書興趣。
六、態度是指個體對其生活環境中的人、事或物所持有的一致性和組織性的內在心理傾向，所以它能對人、事或物作出評價性的反應。
七、態度測驗的種類：
(1) 塞斯頓態度量表
(2) 李凱特量表
(3) 父母管教態度測驗
(4) 學習態度測驗
(5) 語意差別量表
八、價值是指個體對人生的觀點和信念，它是人格的基本向度，也是個人的生活目標與生活哲學，對個人的興趣、態度、意見和行為具有相當的支配力。
九、價值量表的種類：
(1) 奧魯波特的價值究量表
(2) 高爾登價值量表
(3) 羅肯基價值量表
(4) 職業價值量表
十、價值與興趣及態度有密切關聯，但三者並不相同。價值是人格的基本向度，顯示個人的生活哲學，也是一種重要的生活目標、行為準則，更是個人態度與信念體系中極為重要的基本因素。價值與態度的不同在於價值不受情境的限制，比較能夠抗拒改變，和原始的經驗相結合。它影響個人的判斷與行為，遠超過直接的情境或特殊的目標。它提供一種抽象的參照架構，使個體組織其經驗，並選擇與決定所要採取的行為。

心理與教育測驗【第十章重點】
一、人的能力可分為先天天賦的能力與後天習得的能力兩大類，前者包括智力與性向，後者就是指成就。
二、所謂成就是指，個人所實際擁有的能力，是人們經過某種學習或訓練後所獲取的能力;所以凡是測量人們學得事物之程度的測驗，就稱之為成就測驗。
三、測量人們能力的測驗，主要可分成智力、性向及成就三種測驗。
四、成就測驗有各種不同的分類
● 依測驗編製程序：可分為標準化成就測驗與教師自編成就測驗。
● 依測量所涵括的學科：可分為綜合成就測驗與單科成就測驗。
五、凡是依據測驗的原理與原則所編製的成就測驗，就是標準化成就測驗。
六、凡是教師在教學情境中，為因應教學或評定的需要所編製的成就測驗，就稱之為教師自編成就測驗。
七、凡是一份成就測驗中包括許多門不同的學科內容者，就稱之為綜合成就測驗。
八、凡是一份成就測驗中僅含一種學科內容者，就稱之為單科成就測驗，它的主要目的在測量學生在某一學科上的學業成就水準。
九、各類能力測驗的主要特點(即其相異處)：
● 成就測驗：
(1) 評估一套已知或控制情境下之經驗的效應。
(2) 評估一個訓練課程的最後成果。
(3) 特別重視內容效度程序。
● 性向(智力)測驗：
(1) 評估一套未知或非控制情境下之經驗的效應。
(2) 評估從訓練課程所獲取的潛能。
(3) 特別重視預測效度程序。
十、托福測驗旨在測量英語之聽力理解、文法結構與寫作及字彙與閱讀理解等三種能力。
十一、教師自編成就測驗的主要步據有決定測量內容、撰擬題目及組合測驗題目。
十二、決定成就測驗之測量內容可依據雙向細目表或命題計畫表。
十三、教師自編成就測驗的常用題型有是非題、選擇題、配合題、填充題、簡答題、解釋名詞、問答題及申論題等多種。

心理與教育測驗【第十一章重點】
一、教學評量最常使用的工具之一是測驗，要落實教學評量的實施，就須先發揮測檢的功能。
二、教學須包括五個因素：
(1) 教者：主導教學的主體，即教師。
(2) 學習者：教學的客體，即學生。
(3) 一種歷程：教師之「教」與學生之「學」的互動過程。
(4) 經由某種媒介：教學的中介變項，如教材和教法等。
(5) 行為的改變：即教學的目的是在改變個人的行為。
三、教學是指，教者以適當的教材及教法，以改變學習者認知、情意及技能等行為的歷程。
四、教學的基本歷程，包括教學目標、起點行為、教學活動及教學評量等四個步驟，就中教學評量在教學歷程中，扮演著回饋與監督的角色。
五、所謂教學評量是指，對教師的教學活動與學生學習的活動從事價值判斷，價值判斷的依據則是，從教學活動中所蒐集來的量化數據與質化資料。
六、教學評量的目的為，依據價值判斷後的結果，衡鑑教師教學的效率與學生的學習成果。
七、教學評量的功能則有:
(1) 判所學生的努力程度
(2) 作為補救效學及個別輔導的依據
(3) 作為教師改進教材效法及調整教學步調的參考
(4) 激發學生的學習動機。
八、教學評量的種類：
● 依評量時機可分為：
(1) 預備性評量：是指教師在教學前所做的評量，以確知學生具備的基本能力與起點
行為。
(2) 形成性評量：是指在教學歷程當中所實施的評量。
(3) 診斷性評量：是指針對學習有特別困難的學豆所實施的評量。
(4) 總結性評量：是指在教學活動結束後所實施的評量。
● 依評量對象可分為：
(1) 教師的教學效率評量
(2) 學生的學習成就評量
(3) 課程的設計與實施評量
● 依評量結果解釋的方式可分為：
(1) 常模參照評量：是指在評量之後，依據學生個人的分數在體中所佔的相對位置，
加以解釋的評量。
(2) 標準參照評量：是指依據教學前所設定的標準，了解學生之學習結果的評量。
● 依教學目標則可分為：
(1) 認知評量：其主要的工具是成就測驗、智力測驗與性向測驗，前者用來評量學習
成就，後兩者則是用來評量先天的天賦能力。
(2) 情意評量：是指非能力之心理特質的評量，如人格、態度、興趣、性格等之評量。
(3) 技能評量：包括美術、勞作、工藝、體育等需實際操作之科目的評量。
九、教學評量的原則有:
(1) 以教學目標為依據
(2) 兼顧多重教學目標
(3) 方法應有彈性
(4) 兼顧歷程與結果
(5) 善用評量結果。
十、認知層面的教學目標包括知識、理解、應用、分析、綜合、及評鑑等六個由低至高的層次。

心理與教育測驗【第十二章重點】
一、編製測撿的基本共通步驟有:
(1) 決定測量內容
(2) 撰擬題目
(3) 審查題目
(4) 預試及試題分析
(5) 組合題目
(6) 信度及效度研究
(7) 建立常模
(8) 編寫指導手冊。
二、決定測量內容，包括從相關文獻中的理論，現有具代表性的測撿、諮詢學者專家或相關人員、教科書及教師手冊等層面裡找資料。
三、組合題目，其原則有依難易度組合、依題目類型組合、依題目性質組合、及混合式的組合等。
四、組合測驗題目的原則：
(1) 依難易度組合
(2) 依題目類型組合
(3) 依題目性組合
(4) 混合式的組合
五、編寫指導手冊通常包括的內容：
(1) 前言
(2) 編製過程
(3) 測驗的內容
(4) 實施方法
(5) 試題分析
(6) 信度與效度研究
(7) 常模
(8) 測驗結果的解釋與應用
六、撰擬測驗題目的一般原則:
(1) 決定題型
(2) 設計選項
(3) 擬題要領
(4) 選答心向
(5) 安排題目。
● 決定題型，最常見的題型有是非題、選擇題、評定量表題。
● 選答心向，包括默從性、社會期望性、胡亂反應性、及不決斷性。
七、選擇題此種題目包括兩部份：1. 題幹 2.選項。
八、題幹：是一個包含問題的敘述句或問句。
九、選項：一組可能的厲應(答案)，其中一個是正確的或最佳的厲應，其餘是誘答項。
十、所謂默從性是指受試者不考慮題目的內容，就認同題目的作答傾向。
十一、所謂社會期望性是指，受試者以符合社會期或可被社會接納的方式來選答的傾向。
十二、所謂胡亂反應性是指，受試者在缺乏動機或不了解題意下，隨便選答的傾向。
十三、所謂不決斷性是指，受試者都以選擇「不知道」或「不確定」的選項做為選答的傾向。
十四、自編情意測驗的過程：
(1) 測量內容
(2) 題數與題型
(3) 編製過程
(4) 信度研究
(5) 效度研究
(6) 施測方式
十五、自編成就測驗的過程：
(1) 決定測量內容
(2) 題型
(3) 計分方式
十六、在設計雙向細目表之前，首先要決定撰擬多少題目；第二是決定使用多少個教學目標的層次，第三是分析教學內容，列出各項重點所佔的比例。
十七、雙向細目表之所以可呈現成就測驗的測量內容，就是於它可以水定各部分教學內容的命題題數。

心理與教育測驗9-12章重點
第9章
◎ 興趣測驗的種類
一. 史闞興趣量表：
評分和解釋部份分成四個部分
1. 普通職業主題量表－現實性、調查性、藝術性、社會性、企業性、傳統性
2. 基本興趣量表
3. 職業量表
4. 行政指數與特別量表
史闞興趣量表所測量的職業興趣偏向於專業性的職位者較多，其計算方式採用T分數
二 .庫德興趣量表：
使用一種強迫選擇法先後編製了一種興趣量表，不同興趣範圍的3種活動編成一個題目，受測者必須再各種興趣中選擇一個。
驗證量表（V）適用來鑑別受測者是否以合作坦承的態度作答
＊庫德職業量表：
對高中及大學學生的職業輔導很有幫助，目前在大專院校頗為盛行
＊庫德普通興趣量表：
測量青少年（6-12級）的興趣為主，目的在幫助中學階段的青少年了解其興趣，並為輔導教師協助學生選擇課程與探索職業興趣之參考
三白朗納德職業愛好量表：
特殊興趣問卷共有4種形式
M用於男性成人 W用於女性成人 B用於男孩 G用於女孩
各項組合方式係參照美國職業名稱辭典之規範所擬定
四其他興趣量表
＊明尼蘇達職業興趣量表：
適用於進入大學的學生，評估技術、半技術、非技術的職業興趣
＊詹遜編製非專業興趣量表，稱為生涯評估量表
◎興趣與能力
能力包括實際能力和潛在能力
實際能力：個人經由學習或訓練而獲得的專長或智識與技能
潛在能力：個人所具有之尚未發揮的先天能量，需藉由教育力量才能變成實際能力
◎ 興趣與人格
一羅伊的理論：認為個人的生涯選擇和他在兒童其生長情形有密切關係
1.生長在溫暖而受接納的環境中之兒童，將來會變成「人員取向」的成人
喜歡尋找在娛樂或服務方面等與別人接觸的工作
2.生長在冷漠而被疏遠的環境中之兒童，將來會變成「非人員取向」的成人
喜歡科學研究或技術方面等，比較少與別人往來的工作
二何蘭的理論：解釋興趣與人格的關係
現實性、調查性、藝術性、社會性、企業性、傳統性
◎ 奧斯堪布認為態度應含有三種成分，存在著一種交互作用的關係
1. 認知性的：個人對事物的看法與了解
2. 情感性的：個人對主題（人、事物）的好惡程度
3. 行為性的：個人對主題或刺激發動某種反應的行為傾向
◎ 態度測量是社會心理學的研究範圍，也是最常用的評估方法，以自陳式量表最為客觀
◎態度測驗種類
最早的態度測驗量表示波加杜斯所編製的「社會距離量表」，用來測量人們對不同種族和宗教團體的接受程度。
一塞斯頓態度量表
運用他所創的「等距量表法」，態度分數越高表示受測者對該主題持正面的態度；
缺點：由評審員來評審量表雖以保持客觀態度，受測者的態度分數以中位數表示時，不一定表示相同的態度類型；且編製過程複雜。
二李凱特量表
採用總加量表法，不必由評審員對各項目作評定
優點：編製容易，作答較快，評分簡單，信度高
缺點：即以總分代表一個人的態度，無法了解態度的差異
三父母管教態度測驗
作為指導父母管教方式的輔導依據，分為6種型態
1. 拒絕型 2.嚴格型 3.溺愛型 4.期待型 5.矛盾型 6.分歧型
父母親的部分各60題，共有120題。效度高，適用於國中學生
四學習態度測驗
作為自我檢討，並提供教師指導學生養成正確的學習態度。適用於國中學生。分為8大項：
1.學習方法2.學習計劃3.學習習慣 4.學習環境5.學習慾望 6.學習過程7.準備考試 8.考試技巧
◎ 態度與行為是一種持續性的互動過程，兩者之間有其必然的密切關係
◎ 價值量表的種類
一奧魯波特的價值研究量表，分為6種
1. 理論的：注重真理的追求和對問題作理性的處理
2. 經濟的：強調有用的、實際的價值
3. 審美的：注重生活中的美學與藝術的價值
4. 社會的：以博愛無私的精神幫助別人
5. 政治的：喜愛支配別人，看中權利和名位
6. 宗教的：重視對存在和生命意義的探索與追求
二高爾登價值量表
於1960年編製了「人際價值量表」，適用於9-16年級學生及一般成人
三職業價值量表
舒柏工作價值量表：目的在測量與工作有關的各種價值，分為3部分
1.內在工作價值 2. 外在工作價值 3. 外在報酬
採總加量表法而編製
四羅肯基價值量表
將價值界定為是一種持久的信念，可分為2種
一為工具價值，另一為終點價值
A.工具價值－與行為模式有關
1. 道德價值－和行為的人際模式有關
2. 能力價值－和個人內在、自我實現的行為模式有關
B. 終點價值－與結局狀態有關
1. 個人價值－自我中心的
2. 社會價值－以社會為中心的
◎ 價值是人格的基本向度，顯示個人的生活哲學，亦是種重要的生活目標、行為準則，更是個人態度與信念體系中極為重要的基本因素。
價值不受情境的限制，比較能夠抗拒改變，和原始的經驗結合
◎ 興趣是依據個人的好惡，隨時會改變的心理傾向
第10章
◎能力分為2大類 1.先天賦予的能力 2.後天學習的能力
◎先天賦予的能力，即是潛能，又分為2種
1. 普通能力：即智力，學習事物所具備的能力
2. 特殊能力：即性向，未來學習事物所具備的能力
◎成就測驗類別：【成就測驗非常重視內容效度】
（一）依編製程序分
1. 標準化成就測驗
使用目的：（1）評量學生的基本學習技能及各科的一般成就水準
（2）評量學生學年期間的進步狀況
（3）評量學生成就以做為分班教學之用
（4）診斷學生的學習優點與困難
（5）比較學生的學業性向與一般成就水準
2. 教師自編成就測驗
使用目的：（1）評量特定的班級或學校在某學科上的學習成果
（2）評量學生日常的進步情形及各個教學單元的成就水準
（3）評量教師的教學效能與學生對某項學習的了解程度
（二）依涵括的學科分
1. 綜合成就測驗：看附圖表
2. 單科成就測驗
優點：（1）較能適合某一特別學科的教學目標
（2）有較多題目，可提供更適當的行為樣本和可靠分數，做為診斷
（3）比較容易適應班級教學
◎ 能力測驗的比較
各種能力測驗的主要特點：
一成就測驗：
1. 評估一套已知或控制情境之下經驗的效應
2. 評估一個訓練課程的最後成果
3. 特別重視內容效度
二性向（智力）測驗：
1. 評估一套未知或非控制情境之下經驗的效應
2. 評估從訓練課程所獲取的潛能
3. 特別重視預測效度程序
◎綜合成就測驗
一國民中學智育成就測驗
目的在評量國中三年級上學期學生的智育成就
二系列學業技能測驗
目的在測量受試者的學業成就與技能

◎單科成就測驗
一國中新生自然科學能力測驗
目的在測量國中新生目前具備的科學慨念及科學過程能力的能力
試題編擬原則：1.測驗內容包括物理、化學、生物、地球科學
2.測驗的取材範圍不限於教科書
3.試題的文句力求淺顯
二托福測驗
被公認為是當今世界上使用最廣、知名度最高的單科成就測驗之一
目的在測量非英語系國家受試者的英文學習成果
◎教師自編成就測驗三步驟：
1. 決定測量內容
決定標準化成就測驗之測量內容最便捷方式，是設計雙向細目表
特徵是其題目都是要選擇題型
三步驟：1.決定題目的題型及各類題型所佔的配分
2.決定各份教材內容所佔的配分
3.決定各類題型各個題目的分配，及各教材內容所涵括的題數
2. 撰擬題目
原則：1.決定題型 2.設計選項 3.擬提要領 4.選答心向 5.安排題目
題型有：是非題、選擇題、配合題、填充題、簡答題、解釋名詞題、問答題、申論題
3. 組合測驗題目
第11章
◎ 篩選性測驗
適用來挑選最合適的受教者，以提高教學效率，教學上比較容易事半功倍
＊種類及特徵
一入學準備度測驗
目的：協助判斷該新生是否液晶具備了學習的先決條件
特徵：1.多為個別實施，且大多由施策者以行為觀察法評分
2.測驗內容偏重於學習閱讀所需的視覺區辯能力與記憶力
二入學考試
特色：1.所測量的知識或能力是將來學習或工作上所必備的
2.命題取材範圍通常會事先公佈
3.受測人數較多
4.測驗難易度及錄取的標準常隨錄取率而變動
三特殊學生篩選
四就業甄試
特色：1.找出要能夠勝任該職位所需要的知識與能力
2.重視應徵者過去的工作相關經驗
3.甄試過程重視實作表現
4.甄試過程通常會包含面談或口試
5.通成要經過試用觀察階段才會正式錄用
＊篩選效果的評估
通常以預測效度來表示，可以用積差相關法求測驗分數與效標的相關

◎ 安置性測驗
＊安置性評量來進行能力分班、分組，可以將每個學生都分派到最適合他條件的課程方案中，可以提高教學效率，亦可以讓學生的學習更具挑戰性及成就感。
＊安置的必要性
目的是要確定學生的性向及其對新教材的熟悉程度，並依此將各個學生安置到適當的班級或組別中，採用不同的教材進度和方法，更能配合學生的個別差異。結果是提高了學生與教師間及學生與教材間的適配性，進而提升教學效率。
＊常用時機
1. 課程開始之前，且教師不了解學生能力時
2. 所預期的學習結果非常明確，且有明顯的層次時
3. 學生人數眾多，可以依照學生能力進行分班、分組時
＊安置性評量特徵
1. 測驗內容與課程內容密切配合，具有很高的內容效度和預測效度
2. 測驗內容與學習結束後的總結性測驗很類似
3. 安置性測驗的分數通常可以配合教材的層級作解釋
4. 可以做標準參照式的解釋
＊能力分組的利弊得失
優點：1.學習環境具有挑戰性和競爭性
2.可以統一教學進度
3.不同班組之間，可採用不同進度和教法，提升學校效率
缺點：1.學生間同質性太高，彼此之間競爭激烈，若為適當疏導，將不利於學生人格的發展
2.會對部分學生產生標籤作用使學生形成自傲或自卑的心理
3.大部分教師喜歡「得天下英才而教育之」，所以能力較差的班級常被忽略或放棄
4.教材、教法並未能配合學生的能力而調整，所以徒有能力分班之名，卻無法因材施教之實
◎ 診斷性測驗
＊只適用於低成就學生，以找出學習困難所在，好進行補救教學
＊診斷性測驗的種類與特徵
一　學科學習困難的診斷－學科診斷測驗---------可分為三階段
　　1.調查性測驗：學校對全體學生實施標準化綜合成就測驗或單科成就測驗，用以找出一些特定學科上學習成就低落的學生，可以用多次的定期評量（如月考）來取代
　　2.分析式測驗：針對被挑出來的少數成學生所實施的學科診斷測驗，可以進一步分析學生的學習困難所在
　　3.臨床診斷法：曾被皮亞傑用來研究兒童的認知發展，結合了晤談技巧和具體器材的操作來探討兒童內在的思考歷程
＊學科診斷測驗特徵
1. 能對該學科內的多種技能或概念，分別作解釋
2. 試題較多，難度較低，對低成就的學生學習困難提供更精確、更可告的測量
3. 先做常模參照式的解釋，相對位置偏低，再做進一步內容參照式的解釋，或對於答錯的題目作逐題分析式的解釋
4. 內容通常是以小學連續性的科目為主
5. 指導手冊上特別強調診斷結果與補救處置之間的連結
＊解釋診斷測驗結果時應注意的事項
1. 測驗結果分數高時，只表示沒有學習困難，並不表示該學科的學習成就高
2. 測驗結果可以指出學生所犯的典型錯誤，但無法確實告知造成錯誤的原因，需再進一步探就
3. 測驗結果只能得之學習困難的部分原因而已
4. 教師應該把所發現的困難當作線索，再進一步從作業或臨床診斷的觀察中去求證
二　基本學習技巧的診斷－學習習慣調查表
　　目的在了解學生的基本學習技巧和習慣
三　情意條件的診斷－學習態度量表
　　目的就是需要及早找出阻礙學習的消極情感因素，讓教師能據以提出適當的輔導措施，在測驗歸類上常被歸為人格測驗中的自陳量表
＊可採取以下措施來改進學生的學習態度
1. 以活潑趣味化的方式引起學習動機
2. 使學習活動與實際生活結合，讓學生了解教學內容的重要與意義
3. 充分利用視聽媒體或改變教學方式
4. 依學習狀況隨時調整教材難度及教學進度，讓學生有成就感
＊診斷測驗的運用
（一）一般教師職責--------協助學習困難的學生
1. 識別學生學習困難的徵兆
2. 轉介給專業人員進行診斷
3. 參與補救處理
4. 調整對於學生的期望
（二）先備知識與學習困難
　　　先備知識是指正式學習該課程之前，學生經由生活經驗相關的學習活動而已經建構起來的相關知識。
＊診斷測驗的限制
　1.生理因素　　2.情感因素　　3.環境因素
◎ 形成性測驗
內容少、時間短、次數多，主要是提供教學回饋，以便隨時調整教材和進度
＊形成性測驗的特徵
1. 試題取樣範圍小，細節較多，與各教學單元的行為目標密切配合
2. 每一教學單元有兩張形成性評量試卷，包含有平行編號的試題，在第二張試卷的內容上有一點不同，確定在第二次測驗時是真正的理解，而非機械性記憶的結果
3. 每一單元可實施兩次
＊形成性測驗的運用
（一）使用時機：通常是在教完一個單元或一章節之後實施
　　　是經熟學習特別強調1.測量該單元的所有教學目標
　　　　　　　　　　　　2.使用評量結果來改進教學，而非用來評定成績
（二）使用目的
1. 可立即校正學生個人學習上的錯誤，協助學生精熟各單元的內容
2. 從整班學生答案中可發現常見的錯誤，以改進教師的教學方法
3. 累積許多班級的測驗結果可作未來修訂課程、教材的參考
（三）實施方式
　　　每次測驗結果應作立即回饋，以避免錯誤觀念的累積
　　　1.採用輔助教材 2.進行小組討論 3.接受個別指導
◎ 總結性測驗
　＊總結性評量比較正式且範圍廣，是作為成績考核之用
＊總結性測驗的特徵
1. 內容取樣範圍廣，題數多，作答時間長
2. 強調不同內容重要性的加權
3. 重視測量工具的信度、效度，性質上比較接近標準化成就測驗
＊總結性測驗的運用
（一）使用時機：再教學結束後實施，而且通常是在教完一學期貨一學習階段之後實施，他可以是班級教師自編測驗，也可以是標準化成就測驗
　　　強調：1. 內容取樣範圍廣
　　　　　　2.評量適用來評定成績而不是用來改進教學
（二）使用目的
1. 評定學生的學習成績
2. 提供學生較大視野的回饋
3. 作為行政決策上的依據
4. 協助教師決定後續課程的教學起點
5. 決定教學方案或實驗計畫的有效性
◎ 常模參照式測驗
常模具有兩大功能：1.表明個人分數在常態化樣本中的相對位置
2.提供比較的量數，使不同的測驗分數可以直接比較
＊常模參照測驗：測驗分數本身並無意義，需要將個人的分數對照團體的平均表現，才能看出此人能力在團體中的相對位置
＊常模參照測驗的特徵
1. 試題需經過預試和試題分析，選題時特別重視試題的鑑別力
2. 建立多種不同的常模，以配合不同對象的需要
3. 都得將原始分數換算成百分等級或標準化分數，以解釋個人在團體中的相對地位
4. 大部分的標準化測驗都藉由常模來做解釋
＊常模的種類
（一）以做比較的對象來分
1. 發展性常模：適用於嬰幼兒的順序量表
2. 組內常模：將個人的測驗分數與相同年齡團體的表現相比較，以便知道此人在該團體中
的相對位置
（二）以取樣範圍大小來分
1.全國性常模 2.地區性常模 3.特殊團體常模
（三）以常模表的排列格式分
1. 簡單常模表：只有一欄原始分數和一欄衍生分數的常模表
2. 多組別共用的常模表：將依據不同組別建立的常模合併在一個表上來使用，有多欄不同組別的衍生分數
3. 多種分測驗共用的常模表：使用一張表就查出受測者在不同分測驗上的一種衍生分數
4. 多種衍生分數共用常模表：可以把同年齡組的不同衍生分數的常模表合併在一起
5. 簡略式常模表：只取部分原始分數來建立換算表
6. 濃縮式常模表：將衍生分數做等間隔的部分呈現

＊常模的介紹
1.取樣方法 2. 常模樣本的人數分配 3. 常模樣本特徵的描述
4.施策的標準條件與測驗動機的維持 5.測驗日期
＊常模的選擇
1. 常模樣本的代表性 2. 常模樣本的大小 3. 時間上的新進性
4.使用對象上的適切性
◎標準參照式測驗
用來判斷個人的表現是否能夠通過專家預先設定的標準，以便授與某種資格證明或是做成某種行政決定
應用在教學上的標準參照式測驗，通常兼具診斷與矯正建議，大部分是小學程度的閱讀與數學能力測驗
＊標準參照式測驗的主要用途
1.精熟學習 2.職業證照考試 3.基本學力測驗
＊標準參照式測驗的特徵
1. 符合目標管理模式，使教學評量過程更清晰明確
2. 編製測驗時重視內容效度及專家效度
3. 當需要伊學生能力劃分成兩個類別時，他比常模參照法有理論依據
4. 能減少學生之間的相互競爭
＊通過標準的設定方法
（一）判斷模式：以多位專家對試題內容難易的判斷為一據
（二）實證模式：以一群受測者的實測資料為依據
（三）混合模式：兼採題目內容判斷及實測資料兩種方式

第12章
◎ 電腦在教育上扮演的角色，可分為三種
1.教學者：以電腦進行電腦補助教學，以適應學生的個別差異並分擔教師的教學工作
2.被教者：學生可以學習設計電腦程式，以指揮、控制電腦的運作
3.工具：教育人員利用電腦設備及現有軟體來完成特定的工作
◎題庫系統應具備的特性
（一）完整性：試題相關資料越完整，輸入資料所需的人力、時間就越多；但教師在使用題庫挑選試題時就越能掌握試題的性能
（二）方便性：1.接觸的方便性 2.檢索的方便性 3.輸出的方便性
（三）自我維護性：題庫系統程式具有自我保護、自我調整的功能；
自我保護方面具有「限定使用」和「自動追蹤」的功能，目的在提升題庫內容的安全性與保密性
＊限定使用：利用通行碼來限定學生只可以看到練習用的題目，教師可以看到全部的題目及各種管理與統計屬性，而只有題庫管理者才可以開啟輸入與更改試題的功能
＊自動追蹤：電腦能自動紀錄各試題被輸入與更改的時間即進入者的代碼，或紀錄哪一位進入者在何時列印了哪些試題
＊自我整理：開題庫系統程式具有「自我檢查」及「自動排序」的功能，
目的在保持題庫內容的精簡與平衡，並提升檢索題目的效率
＊自我檢查：每次輸入或更改試題後，電腦會自動比對各個試題內容，把完全相同或幾乎相同的試題顯示出來，讓系統管理者判斷是否要刪除哪一道試題
＊自動排序：題庫系統能夠依據使用者定的幾種屬性，自動將試題從磁碟中取出來做分類與排次序，再存回磁碟中，經過這樣整理的題庫，再下回檢索時速度會更快
◎測驗的編輯排版，最常用的系統功能
1. 錯別字與文法的檢查 2.格式樣本 3.標示與搬動 4.繪製圖表 5.排版
6.巨集指令 7.預覽與列印
◎電腦施策的優點
1.多樣性與動態性的刺激 2.立即回饋與邏輯分枝 3.直接測量反應速度
4.教學與評量的統整 5.自動計分與分析結果
◎點腦施策的演變與展望
（一）電腦計分式測驗：只是利用電腦快速讀入資料及統計分析的能力，尚未利用到電腦能立即回饋的能力與學生做互動
（二）適應化測驗：「稱為CAT」將大量的試題以試題反應理論題庫中，再設計施策用的程式，使電腦能在學生做答後依據學生對題目的反應是對或錯，來選取不同的下一個題目。
優點：1.施策內容容能配合機構需要，能配合學生方便的時間，可很快獲得分數
2.不需要答案紙、題本、或受訓過的主試人員，施策成本低
3.能依學生能力給予不同難度試題的作答方式
4.能機動調整試題難度的功能
5.電腦的彩色繪圖能力及逐題計時能力，使題目的形式更加豐富
6.電腦施策情境的一致化和安排施策時間的彈性化，比紙筆測驗更具客觀性和公平性
限制：1.不適合所有的學科和技能，許多學科的內容異質性大
2.受試者的反應方式受限於鍵盤，許多需學生繪圖或寫長篇文字或數學、化學試題並不適合
3.電腦設備的缺乏及規格不統一，及普遍性及標準化程度受到限制
4.測驗機構需要有專用的電腦統維護人員，而受測者須具有基本的電腦素養
5.需做試題校對，需大量樣本，使得CAT只能再大規模且定期實施的測驗上才能發揮效益
（三）連續性測驗：是電腦輔助教學的擴展，內容是涵蓋整個學科，用他來決定下一步的教學內容，可說是電腦化的動態評量
（四）智慧型測驗：電腦扮演被諮詢者或指導教授的角色，兼具心理計量專家與學科專家的功能，並提供建議給學生和教師
◎測驗數據的處理
1.試題分析 2.計分與加權 3.篩選與分數的轉換 4.套印成績單
◎電腦解釋測驗結果的缺點
1. 不能顧及學生或家長的情感反應
2. 不能調整遣詞用字以配合學生或家長的認知水準
3. 只能依據有限的資料作解釋，不能合併其他相關資料做統整性說明
＊大多數專家學者認為電腦印出來的解釋只適宜作為專業人員的參考，不應該把他直接交給學生或家長

2008年3月22日星期六

96下心理與教育測驗

沒有留言:

網誌存檔

關於我自己

2008年3月22日 星期六

96下心理與教育測驗

沒有留言:

網誌存檔

關於我自己

2008年3月22日星期六