2005心理測量串講筆記(注釋)_第1頁
2005心理測量串講筆記(注釋)_第2頁
2005心理測量串講筆記(注釋)_第3頁
2005心理測量串講筆記(注釋)_第4頁
2005心理測量串講筆記(注釋)_第5頁
免費預覽已結束,剩余24頁可下載查看

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、 2005年4月心理測量-串講第一章總論 第一節(jié) 心理測驗的歷史回顧 1孔子把人分為中人、中人以上和中人以下三個類別,這實際上相當于現(xiàn)代測量學中的命名量表和次序量表。 2南朝人X勰在新論·專學篇中提到的實驗,可以算是世界上最早的“分心測驗”。 3南北朝學者顏之推對周歲試兒加以總結,可以說是格塞爾嬰兒發(fā)展量表的前導。 4七巧板在某些方面可以作為創(chuàng)造力測驗的一種方法。 5科舉考試中的帖經和對偶,類似于現(xiàn)代西方言語測驗中常見的填字和類比。 6中國古代心理測驗的思想,他們都是描述性的,沒有定量的標準;心理測驗往往將心理特點與道德觀念聯(lián)系起來。 7簡述科學心理測驗產生的原因。 對智力落后者分類

2、和訓練的早期關注。心理測驗產生的最初原因是對智力落后和精神病人治療的需要 馮特的實驗心理學。實驗心理學的誕生是心理測驗產生的另一個重要原因,它給心理測驗帶來了嚴格的標準化程序。 8英國生物學家和心理學家高爾頓是倡導測驗運動的主要人物,他是評定量表和問卷法應用的先驅,并經常使用自由聯(lián)想技術,他還為心理測驗奠定了統(tǒng)計學基礎,第一個提出相關的概念。 9美國心理學家卡特爾1890年在心理雜志上發(fā)表了“心理測驗與測量”一文,這是心理測驗第一次出現(xiàn)于心理學文獻中。 10比內-西蒙量表在1905年發(fā)表,它是世界上第一個正式的心理測驗。 11心理測驗的蓬勃發(fā)展 操作測驗的發(fā)展。由于理論上的缺陷和實際上的需要,

3、所以就有操作測驗的問世和發(fā)展。 團體智力測驗的發(fā)展。運用團體測驗可以在同一時間內測量許多被試,擴大了測驗的應用X圍。 能力傾向測驗的發(fā)展。能力傾向測驗為分析個人心理品質的內部結構提供了適用的工具,逐漸受到人們的重視。 人格測驗的發(fā)展。人格測驗的先驅是克雷佩林,它涉及人的情感或行為等非智力方面。 121922年廖世承和陳鶴琴出版的心理測驗法,是中國最早的心理測驗專著。 第二節(jié) 心理測驗的性質、種類和功能 1測量:就是根據一定的法則,用數字對事物加以確定。所謂“一定的法則”是指測量行為發(fā)生時采用的規(guī)則或方法。所謂“事物”是指我們要測量的感興趣的事物的屬性或特征。用數字對事物加以確定,就是確定一個事

4、物的屬性的量的多少。 2測量有兩個要素:一是參照點,二是單位。參照點可以分為兩種,一種是絕對的零點,表示什么也測不到;另一種是相對參照點,是人為確定的。心理測驗中所用的參照點都是相對的,因而測量結果不能以“倍數”的方式解釋。 3簡述測量量表的種類。 斯蒂文斯根據測量精度高低,將測量量表分為4個水平,由低到高依次為命名量表、順序量表、等距量表和比例量表。 命名量表:是水平最低的一種測量量表,只是用數字來代表事物或對事物進行分類,沒有任何意義,只是表明類別。 順序量表:不僅可以表明類別,還能表明不同類別的大小等級,或具有某種屬性的程度。 等距量表:不僅有大小關系,而且又有相等的單位,因此可以加減運

5、算,但沒有絕對零點,所以不能做乘除運算。 比例量表:是最精確的測量,既有相等的單位,又有絕對零點。不僅可以知道事物之間在某種特點上相差多少,還可以知道它們之間的倍數關系。 4心理學家喜歡把測驗成績(順序量表)轉換為等距量表,最常用的轉換方法是轉換為標準分數。 5所謂測驗,是對行為樣本進行測量的系統(tǒng)程序。它包括三個基本要素: 行為樣本:指有代表性的樣本,根據某些條件取得的標準樣本。 標準化:指測驗、實施、計分以及測驗分數解釋程序的一致性,需要建立有代表性的常模。 客觀性:在不受被試主觀判斷支配的X圍內,測驗的實施、評分、解釋應是客觀的,盡量減少主試和被試的隨意程度,且測題或整個測驗的難度水平的確

6、定要客觀。 6神經心理測驗客觀性最高,智力測驗也較高,人格問卷次之,而投射測驗的客觀性較低。 7心理測驗的性質。 心理測驗的間接性:心理測驗只能以測量個體對測驗題目的反應來推斷出他的心理特質。 心理測驗的相對性:心理測驗測得個體的結果,是與他所在團體或人群中大多數人的行為確定的標準相比較而言的。 心理測驗的客觀性:實際上就是測驗的標準化,包括:測驗的刺激是客觀的;評分計分原則和手續(xù)是客觀的;分數轉換和解釋是客觀的。 8心理測驗的種類: 按測驗的功能分類:智力測驗、特殊能力測驗和人格測驗。 按測驗材料的性質分類:文字測驗、操作測驗。 按測驗材料的嚴謹程度分類:客觀測驗、投射測驗。 按測驗的方式分

7、類:個別測驗、團體測驗。 9論述心理測驗的功能。 從實際應用角度看: 人才選拔,預測人們從事各種活動的適宜性,提高人才選拔和職業(yè)訓練的有效率。 崗位安置,借助心理測驗,做到人與工作較好匹配,做到人盡其才。 臨床診斷,借助心理測驗可以觀察病情程度,比較療效。 教育評價,幫助教師了解學生能力水平、性格特點等,有利于教師因材施教。 心理咨詢和治療,借助心理測驗可以使求助者了解問題所在,以便進行適當的指導、幫助和進行行為矯正訓練。 從理論研究角度看 搜集資料,心理測驗是收集個體差異資料最快捷的辦法。 提出和驗證假設,心理學中的許多理論是在測驗資料的基礎上提出來的,并且用測驗來驗證。 試驗分組,在心理學

8、研究中,可以根據心理測驗的結果對被試進行分類,以滿足實驗設計的要求。 第三節(jié) 正確對待和使用測驗 1錯誤的測驗觀: 測驗萬能論;測驗無用論,認為某些測驗侵犯了個人隱私,為宿命論和種族歧視提供了心理學依據;心理測驗即智力測驗。 2正確的測驗觀 它是重要的心理學研究方法和決策的輔助工具;它作為研究方法和測量工具尚不完善,最大的問題是理論基礎不夠堅實;科學地看待心理測驗,防止亂用測驗。 3為防止測驗的濫用,需要注意以下幾個問題: 測驗使用者必須具備一定的資格;慎重選擇測驗量表;與被試建立良好的協(xié)調關系;正確解釋測驗結果;注意測驗的某。 第二章心理測驗的編制 第一節(jié) 心理測驗的對象、目的及目標 1在編

9、制測驗前首先要明確測量的對象,其包括三個重要的維度,即年齡、教育水平和文化背景。 2測驗的目的可以分為兩類:顯示和預測。 3顯示性測驗是指測驗題目和所要測量的心理特征相似的測驗,如成就測驗。 4預測性測驗是指預測一些沒被測量的行為的測驗,主要是利用測驗分數使我們能夠預測一個人在不同情境下的行為。 5心理測驗的目標是指編制的測驗是測什么的,即用來測量什么樣的心理變量或行為特征。 6對心理測驗的目標分析以測驗不同,有3種情況: 工作分析。對于選拔和預測功用的預測性測驗,它的主要任務是要對所預測的行為活動作具體分析。 對特定概念下定義。測驗者為了測量某種特殊的心理品質或特點,就必須給所要測量的心理或

10、行為特質下定義。 確定測驗的具體內容。如果測驗是描述性的顯示測驗,它的目標分析的主要任務是確定顯示的內容和技能。 第二節(jié) 測題的編寫技術 1簡述編制測驗題目的來源。 已出版的標準測驗。最簡單、最直接的方法是從已經出版的各種標準測驗中選擇合適的題目。 理論和專家的經驗。理論和專家經驗可以作為測驗題目的來源之一,比如編制態(tài)度量表,就可以將理論上對態(tài)度的類型、性質維度、定義等描述轉換為測驗題目。 臨床觀察和記錄。各種觀察量表或檢核表很多都是來源于觀察到的行為表現(xiàn)。 2考慮測題的來源時應注意:資料來源要盡可能豐富;材料應該有普遍性。 3簡述測驗題目的命題原則。 內容方面。首先,要求題目的內容符合測驗的

11、目的;其次,內容取樣要有代表性;第三,題目間內容相互獨立,互不牽連。 文字方面。使用語言要準確,語句要簡明扼要,最好一句話說明一個概念,盡量少使用雙重否定句。 理解方面。題目應有確切的答案,題目的內容不要超出受測團體的知識水平和理解能力,題目格式要容易理解。 社會敏感性方面。應盡量避開社會敏感性問題,如涉及社會禁忌或個人隱私的題目不應使用。 4簡述涉及社會敏感性問題時,測驗命題的思路。 命題時假設被試具有某種行為,使他不得不在確實沒有該行為時才否定。 命題時假定規(guī)X不一致。 指出該行為是常見的,雖然是違規(guī)的。 5心理測驗的題目可以分為兩大類:提供型和選擇型題目。提供型題目包括:論文題、簡答題、

12、填充題等;選擇型題目包括:選擇題、是否題、匹配題等。 6選擇題包括兩部分:題干和選項。題干就是呈現(xiàn)一個問題的情境,一般由直接問句或不完全的陳述句構成。選項就是問題的多種可能答案,其中錯誤的答案叫“誘答”。 第三節(jié) 測驗的編排和組織 1測驗編排的一般原則。 測題的難度排列易逐步上升。對試題的總的編排原則是要由易到難,這樣可以避免受測者在難題上耽擱時間過多,而影響對后面問題的解答。 盡可能將同類型的測題組合在一起。這樣可以簡化記分工作和對測驗結果的統(tǒng)計分析。 注意各種類型測題本身的特點。是非題或選擇題中必須避免將選擇相同選項的測題安排在一起,以免引起被試的定勢反應。 2兩種常見的試題排列方式:并列

13、直進式(韋克斯勒智力量表)和混合螺旋式(比內西蒙智力量表)。 第三章測驗的信度 第一節(jié)信度的概念 1信度是指同一被試在不同時間內用同一測驗重復測量,所得結果的一致程度。信度只受隨機誤差的影響,隨機誤差越大,信度越低。 2傳統(tǒng)信度理論認為,每一個測驗的實得分數是由兩部分組成的,即 實得分數(X)=真實分數(T)+誤差(E) 3信度可定義為:一組測量分數的真分數方差與總方差的比率,或者是真分數方差占總方差的百分比。 4信度的指標有三種常見的表示方法,即 信度系數。它是一種相關系數,常常是同一被試樣本所得的兩組資料的相關,理論上就是真分數方差與實得分數的方差的比值, 。 信度指數。真分數標準差與實得

14、分數的標準差的比值,叫信度指數,測量標準誤。測量的標準誤與信度之間呈反比關系:標準誤越小,信度越;標準誤越大,信度越低。 5信度與測驗分數的解釋 解釋真實分數與實得分數的相關。信度系數可以解釋為總的方差中有多少比例是由真實分數的方差決定的,當 =0.90時,我們可以說實得分數中有90%的變異是真分數造成的,僅有10%是來自測驗的誤差。 比較信度可以接受的水平。一般原則是:當 <0.70時,測驗不能用于對個人作出評價或預測,而且不能作團體比較;當0.70<0.85時,可用于團體比較;當0.85時,才能用來鑒別或預測個人成績或作為。 解釋個人分數的意義。其一是估計真實分數的X圍;其二是

15、了解實得分數再測時可能的變化情形。 比較不同測驗分數的差異。可利用差異的標準誤。 第二節(jié) 信度的類型及估計方法 1重測信度:又稱穩(wěn)定性系數,它的計算方法是采用重測法,即使用同一測驗,在同樣條件下對同一組被試前后施測兩次測驗,求兩次得分間的相關系數。 2最適宜的時距隨測驗的目的、性質和被試的特點而異,一般是兩周到四周較宜,間隔時間最好不超過六個月。 3重測信度的前提假設是:所測量的特性必須是穩(wěn)定的;每個人對前一次反應的遺忘程度相同;在時間間隔中沒有學習另外的與測驗有關的東西。 4復本信度:又稱等值性系數,它是以兩個等值但題目不同的測驗(復本)來測量同一群體,然后求得被試在兩個測驗上得分的相關系數

16、,這個相關系數就代表了復本信度的高低。 5同重測信度一樣,復本信度也要考慮兩個復本實施的時間間隔。 6如果兩個復本的施測相隔一段時間,則稱穩(wěn)定與等值系數。 7內部一致性信度包括:分半信度和同質性信度。 8分半信度:指采用分半法估計所得的信度系數。這種方法估計信度系數只需一種測驗形式,實施一次測驗。通常是在測驗實施后將測驗按奇、偶數分為等值的兩半,并分別計算每位被試在兩半測驗上的得分,求出這兩半分數的相關系數。 9簡述分半信度在進行奇、偶分半時的前提。 測題是按某種特定順序排列的; 如果是隨機排列的題目,則必須是所有的題目平等的; 如果測驗有多個分量表,應該在分量表內部排好順序,再把各分量表分兩

17、半組合起來求相關。 10同質性指測驗內部所有題目間的一致性。當各個測題的得分有較高的正相關時,不論題目的內容和形式如何,測驗即為同質的。 11評分者信度:用于測量不同評分者之間所產生的誤差。為了衡量評分者之間的信度高低,可隨機抽取若干份測驗卷,由兩位評分者按評分標準分別給分,然后根據每份測驗卷的兩個分數計算相關,即得評分者信度。一般要求在成對的受過訓練的評分者之間平均一致性達0.90以上,才認為評分是客觀的。 12當多個評分者評定多個對象,并以等級法記分時,可采用肯德爾和諧系數作為評分者信度的估計。 各種信度系數相應誤差方差的來源 信度系數類型 誤差方差來源 重測信度 時間取樣 復本信度(連續(xù)

18、施測) 內容取樣 復本信度(間隔施測) 時間和內容取樣 分半信度 內容取樣 同質性信度 內容的異質性 評分者信度 評分者之間的差異第三節(jié) 影響信度的因素 1論述影響信度的因素。 影響信度的因素包括:樣本特征、測驗的長度、測驗的難度和測量的時間間隔。 樣本的特征。任何相關關系都要受到團體中分數分布的影響,當分布X圍增大時,其信度估計就較高;若取樣團體較為異質,往往會高估測驗的信度;對于不同水平的團體,題目具有不同的難度,每個題目在難度上的微小差異累計起來便會影響信度。 測驗的長度。在測驗中增加同質的題目,可以使信度提高,測驗越長,測驗的測題取樣或內容取樣越有代表性;測驗越長,被試的猜測因素影響越

19、小。 測驗的難度。只有難度水平為50%時,才能使測驗分數分布X圍最大,求得的信度也越高。 測驗的時間間隔。時間間隔只對重測信度和不同時測量時的復本信度有影響。間隔時間越長,信度系數越低。 第四節(jié) 信度的特殊問題 第四章 測驗的效度 第一節(jié) 效度的概念 1效度是指所測量的與所要測量的心理特點之間符合的程度,或者簡單地說是指一個心理測驗的準確性。 2效度被定義為在一組測量中,與測量目標有關的真實方差與總方差的比率,即 3簡述信度與效度之間的關系。 信度是效度的必要而非充分條件。從方差分配公式: 可以看出,增大,即效度高,信度的真方差()必然大,故信度必然高。當信度高時,即降低時,是否增加還要看是否

20、增減,因此效度不一定就高。 效度是受信度制約的。信度系數的平方根是效度系數的最高限度。 4效度的性質: 效度具有相對性。在評鑒測驗的效度時,必須考慮其目的與功能。只有所測的結果符合該測驗的目,才能認為它是個有效的測量工具。 效度具有連續(xù)性。測驗效度通常用相關系數表示,它只有程度上的不同,而沒有“全有”或“全無”的區(qū)別。 第二節(jié) 效度的類型與估計方法 1效度可以分為三大類:內容效度、構想效度和效標效度。 2內容效度:指的是測驗題目對有關內容或行為取樣的適用性,從而確定測驗是否是所欲測量的行為領域的代表性取樣。 3內容效度的評估方法: 專家判斷法:為了確定一個測驗是否有內容效度,最常用的方法是請有

21、關專家對測驗題目與原定內容的符合性作出判斷,看測驗的題目是否代表規(guī)定的內容,也可稱為“邏輯效度”。 統(tǒng)計分析法:計算兩個評分者之間評定的一致性;也可由一組被試在獨立取自同樣內容X圍的兩個測驗復本上得分之間相關來作數量的估計;或采用再測法。 經驗推測法:通過實踐來檢驗效度。 4簡述內容效度與表面效度的關系。 表面效度是由外行對測驗作表面上的檢查確定的,它不反映測驗實際測量的東西,只是指測驗表面上看來好像是所要測的東西;內容效度是由夠資格的判斷者(專家)詳盡地、系統(tǒng)地對測驗作評價建立的。雖然二者都是根據測驗內容作出的主觀判斷,但判斷的標準不同。前者只考慮題目與測量目的之間的明顯的、直接的關系,后者

22、則考慮到題目與測量目的和內容總體之間邏輯的微妙關系。 5最高作為的測驗通常要求有較高的表面效度,以使被試有較強的動機,盡最大努力去完成;典型行為測驗要求有較低的表面效度,如果被試很容易從測驗題目看出測驗的目的,就可能產生反應偏差。智力測驗表面效度高,人格測驗表面效度低。 6構想效度是指測驗能夠測量到理論上的構想或特質的程度,即測驗的結果是否能證實或解釋某一理論的假設、術語或構想,解釋的程度如何。 7構想效度的估計方法: 對測驗本身的分析:測驗的內容效度可以作為構思效度的證據;測驗的同質性指標可以推斷測驗是測量單一特質還是測量多種特質,從而為評估測驗構思效度提供證據;分析被試對題目的反應特點也可

23、以作為構思效度的證據。 測驗間的相互比較:相容效度是構思效度的一個證據,相容效度是兩組測驗分數所共同解釋的變異的大??;區(qū)分效度是構思效度的又一個證據,一個有效的測驗不僅應與其他測量同一構思的測驗有關,而且還必須與測量不同構思的測驗無相關;因素分析法也是建立構思效度的常用方法,通過對一組測驗進行因素分析,可以找到影響測驗分數的共同因素,這種因素可能就是我們要測量的心理特質。 效標效度的研究證明:一個測驗若效標度理想,那么該測驗所預測的效標的性質和種類就可以作為分析測驗構思效度的指標,也可用心理特質的發(fā)展變化來證實構思效度。 實驗法和觀察法證實:觀察實驗前和實驗后分數的差異是驗證構思效度的方法。

24、8效標效度:又稱實證效度,反映的是測驗預測個體在某種情境下行為表現(xiàn)的有效性程度。被預測的行為是檢驗效度的標準,簡稱效標。由于這種效度是看測驗對效標預測如何,所以叫效標效度。這種效度需在實踐中檢驗,所以又稱為實證效標。 9根據效標資料是否與測驗分數同時獲得,又可分為同時效度和預測效度兩類。同時效度即測驗所得分數可與效標同時驗證,通常與心理特征的評估及診斷有關;預測效度的效標資料需要一段時間才可搜集到,通常用于選拔、分組。 10同時效度和預測效度意義上的差異,不是來源于時間,而是來自測驗的目的。前者與用來診斷現(xiàn)狀的測驗有關,后者與預測將來結果的測驗有關。 11所謂效標,即衡量測驗有效性的參照標準,

25、指的是可以直接而且獨立測量的我們感興趣的行為。效標可以分為兩個層次,其一是理論水平的觀念效標,其二是操作定義水平的效標測量。 12企業(yè)家選拔工人時,技術水平就是觀念效標,而技術的具體等級如七級工、八級工就是效標測量。 13常用的效標包括:學業(yè)成就;實際工作表現(xiàn);特殊訓練成績;精神病診斷;等級評定;效標團體的比較;先前有效的測驗。 第三節(jié) 效度的表示方法及應用 1效度系數是最常用的效度指標,尤其是效標效度。它是以皮爾遜積差相關系數來表示的,主要反映測驗分數與效標測量的相關。 2當測驗成績是連續(xù)變量,而效標資料是二分變量時,計算效度系數可用點二列相關公式或二列相關公式;當測驗分數為連續(xù)變量,效標資

26、料為等級評定時,可用賈斯朋多系列相關公式計算。 3區(qū)分法是檢驗測驗分數能否有效地區(qū)分由效標所定義的團體的一種方法。若差異顯著,說明該測驗能夠有效地區(qū)分由效標定義的團體,否則,測驗是無效的。 4重疊百分比可以通過計算每一組內得分超過(或低于)另一組平均數的人數百分比得出;另外,還可以計算兩組分布的共同區(qū)的百分比。重疊量越大,說明兩組分數差異越小,即測驗的效度越差。 5命中率法是當測驗用來做取舍的依據時,用其正確決定的比例作為效度指標的一種方法。命中率的計算有兩種方法,一是計算總命中率,另一種是計算正命中率。 6預期表法:從左下至右上對角線上各百分數字越大,而其它的百分數字越小,表示測驗的效標效度

27、越高;反之,數字越分散,則效度越低。 7效度的應用包括:預測誤差;預測效標分數;預測效標指數。 第四節(jié) 影響效度的因素 1試述影響效度的因素有哪些。 測驗本身的因素。 測驗題目的質量。測驗的指導語和試題的答案說明要明確,試題編制符合測驗的目的,試題難度要適中。 測驗的長度。一般而言,增加測驗的長度通??梢蕴岣邷y驗的信度,而信度又制約著效度,因此增加測驗的長度也能提高測驗的效度。 測驗實施中的干擾因素。 主試的影響因素。主試是否遵從測驗使用手冊的各項規(guī)定進行標準化的實施,評分是否合理等,都可以影響測驗的效度。 被試的影響因素。被試在測驗時的興趣、動機、情緒、態(tài)度和身心狀況、健康狀態(tài)等都會影響測驗

28、的效度。被試的反應定勢也會降低測驗的效度。 樣本團體的性質。 樣本團體的異質性。如果其它條件相同,樣本團體越同質,分數分布X圍越小,測驗效度就越低;樣本團體越異質,分數分布X圍越大,測驗效度就越高。 干涉變量。樣本團體的特質包括:年齡、性別、教育水平、智力、動機等對測驗效度均有影響。 效標的性質。 效標與測驗分數之間的關系是否線性關系是一個很重要的因素;效標測量本身的可靠性如何亦是值得考慮的一個問題。 第五章 項目分析 第一節(jié) 難度分析 1難度是指項目的難易程度。在能力測驗中通常需要一個反映難度水平的指標,在非能力測驗(人格測驗)中,類似的指標是“通俗性”,即取自相同總體的樣本中,能在答案方向

29、上回答該題的人數。 2難度的指標通常以通過率表示,即以答對或通過該題的人數百分比來表示。 3難度的計算:二分法記分的項目;非二分記分的項目。 4由于選擇題允許猜測,所以通過率可能因機遇作用而變大,備選答案的數目越少,機遇的作用越大,越不能真正反映測驗的難度。 5試述項目難度水平的確定。 項目難度的確定。 進行難度分析的主要目的是為了篩選項目,項目的難度多高合適,取決于測驗的目的、性質以及項目的形式。為了使測驗具有更大的區(qū)別力,應選擇難度在0.50左右的試題比較合適。在選擇題目時,最好使試題的平均難度接近0.50,而各題難度在0.50 0.20之間。當測驗用于選拔或診斷時,應該比較多地選擇難度值

30、接近錄取率的項目。對于選擇題來說,P值一般應大于概率水平。P值等于概率水平,說明題目可能過難或題意不清,P值小于概率無意義,說明題目質量有問題。對于是非題而言,其難度值應該為0.75最合適,而對于四選一的題目,其難度值約為0.63時CP=(4+1)/2×4=0.63最為合適。 測驗難度的確定。 測驗的難度直接依賴于組成測驗的項目的難度。通過考察測驗分數的分布,可以對測驗的難度做出直觀檢驗。偏態(tài)分布又有“正偏態(tài)分布”和“負偏態(tài)分布”兩種。正偏態(tài)分布得分多集中于低端,因此必須增加足夠數量的較容易的題目;負偏態(tài)分布得分集中在高分端,說明測驗過易,必須增加足夠數量的有較高難度的項目。 第二節(jié)

31、 項目的區(qū)分度 1項目區(qū)分度:也叫鑒別力,是指測驗項目對被試的心理特性的區(qū)分能力。如果一個項目,實際水平高的被試能順利通過,而實際水平低的被試不能通過,那么我們就可以認為該項目有較高的區(qū)分度。它是評價項目質量和篩選項目的主要指標,也是影響測驗效度的重要因素。 2項目區(qū)分度的估計方法。 鑒別指數。首先分別計算高分組與低分組在該項目上的通過率,然后用高分組在該項目上的通過率減去低分組在該項目上的通過率。 項目鑒別指數與評價標準 鑒別指數 項目評價 0.40以上 很好 0.30-0.39 良好,修改后會更佳 0.20-0.29 尚可,但需修改 0.19以下 差,必須淘汰相關系數。 點二列相關法適用于

32、一類變量為二分稱名變量,另一類變量為連續(xù)變量的成對變量的相關計算。 二列相關適用于兩個連續(xù)變量,但其中一個變量被人為分成兩類。 相關適用于兩個變量均為二分稱名變量。若將測驗總分按及格、不及格或錄取、淘汰劃分,便可計算 相關系數。 3簡述項目區(qū)分度與難度的關系。 如果項目難度為0.5時,該題目的區(qū)分度可能最高。但如果每個項目的難度均處于0.5,有可能造成該項目同質性提高,會降低總分的區(qū)分能力。所以,測驗項目之間難度分布要廣一些,梯度多一些。 難度和區(qū)分度都是相對的,是針對一定團體而言的,絕對的難度和區(qū)分度是不存在的。 第三節(jié) 項目分析的特殊問題 1項目特征曲線:是項目特征函數或項目反應函數的圖解

33、形式,它反映了被試對某一測驗項目的正確反應概率與該項目所對應的能力或特質的水平之間的一種函數關系。這一方法不僅適用于項目分析,而且也適用于某些測驗量表的編制。 項目特征曲線可圖解測驗的鑒別力,主要在于其曲線的傾斜度,曲線坡度越陡,鑒別能力越好,預測的誤差越小。當坡度為0或90度時,題目出得有問題或定錯了答案。 項目特征曲線可以圖解項目難度。對難度高的項目,項目特征曲線在圖的右側開始上升,也就是對大多數被試來說,正確回答難度高的項目的概率是低的。 項目特征曲線還可以圖解選擇題的誘答反應。 第六章 測驗的實施、記分及其誤差 第一節(jié) 測驗的實施及其誤差的控制 1實施的程序及其要素: 標準化指導語。指

34、導語通常包括兩部分,一部分是對被試的指導語,另一部分是對主試的指導語。 標準時限。大多數典型行為測驗是不受時間限制的,例如人格測驗。但在最高作為測驗中,速度是需要考慮的重要因素之一。在速度測驗中,尤其要注意時間限制,不得隨意延長或縮短。 測驗的環(huán)境條件。主試必須對測驗時的光線、通風、溫度及噪音水平等物理條件做好安排,統(tǒng)一布置,使之對每一個被試都保持相同。心理測驗時,務必不能有外界干擾。 2試述主試誤差及控制方法。 做好測驗前的準備工作。 預告測驗。應當事先通知被試,保證被試確切知道試驗的時間和地點以及內容X圍、測題的類型等,使被試對測驗有充分準備,及時調整自己的情緒和生理狀態(tài)。 準備測驗材料。

35、 熟悉測驗指導語。 熟悉測驗的具體程序。 測驗中主試的職責。 按照指導語的要某施測驗,不帶任何暗示。 測驗前不講太多無關的話。 對被試的反應,主試不應做出點頭、皺眉、搖頭等暗示性反應。 對特殊問題要有心理準備,比如在測驗中出現(xiàn)突發(fā)事件,應沉著冷靜、靈活地應付。 與被試建立良好的協(xié)調關系。在心理測驗實施中,協(xié)調關系是指主試和被試之間一種友好的、合作的、能促使被試最大限度地做好測驗的一種關系,其必須是規(guī)X的。 3試述被試誤差及控制方法。 被試技巧與練習效應。盡量使每個被試對測驗材料的步驟和所需技巧有相同的熟悉程度,并提高標準化測驗題目編制水平。 被試的動機與焦慮因素。被試參加測驗的動機不同,會影響

36、其回答問題的態(tài)度、注意力、持久性以及反應速度等,從而影響測驗的成績;測驗焦慮是指被試在應試前和測試中出現(xiàn)的一種不愉快的、表現(xiàn)為焦慮、擔心、恐懼和緊X的情緒體驗。適度的焦慮會使人興奮型提高,注意力增強,提高反應速度,提高測驗的成績。 反應定勢。亦稱反應風格,是指獨立于測驗內容的反應傾向,即由于每個人回答問題的習慣不同,而使能力相同的被試得到不同的測驗分數。幾種常見的反應定勢是:求快與求精確的反應定勢;喜好正面敘述的反應定勢;喜好特殊位置的反應定勢;喜好較長選項的反應定勢;猜測的反應定勢。 第二節(jié) 測驗的記分及其誤差的校正 1對于測驗編制者而言,記分標準化應該包括選擇和設計合式的標準化記分程序,考

37、慮分數的分配、權數的分配、猜測的處理以及分數是由原始分數表示還是轉化成其他形式。 2對測驗使用者而言,記分標準化則是要求完全按照測驗手冊的規(guī)定和標準答案給予被試分數,有時還可以完全依據套板或計算機記分。 3記分的一般程序: 記錄被試反應。在心理測驗中,應對被試的反應給予及時而清楚、詳細的記錄,特別是對口試和操作測驗,此點尤為重要。 參考標準答案。主試應當熟悉掌握記分鍵,特別是非客觀題的記分要求,不得隨意記分。 計算最后得分并轉換原始分數。把所有分數匯總,計算出原始分數的總分。在心理測量中,一般原始分數本身很少有意義,只有將原始分數進行適當的轉換處理或與參照標準加以對照,即把原始分數轉換為導出分

38、數,測驗分數才有意義。 第七章 測驗分數的解釋 第一節(jié) 參照常模的分數解釋 1常模團體是由具有某種共同特征的人所組成的一個群體,或者是該群體的一個樣本。它用一個標準的、規(guī)X的分數表示出來,以提供比較的基礎。 2對測驗的編制者而言,常模的選擇主要是基于對測驗將要施測得總體的認識,常模團體必須能夠代表該總體。這種工作包括:確定一般總體、確定目標總體、確定樣本。 3對測驗的使用者來說,要考慮的問題是,現(xiàn)有的常模團體哪一個最合適。 4簡述常模團體的條件。 群體的構成必須明確界定。在制定常模時,必須清楚地說明所要測量的群體的性質與特征。 常模團體必須是所測群體的代表性樣本。在群體較大時,可以測量一部分人

39、作為總體的代表。 樣本的大小要適當??傮w數目小,只有幾十個人,需要100%的樣本;如果總體數目達,相應的樣本也大,一般最低不小于30或100個;全國性常模,一般應有2000-3000人為宜。 標準化樣組是一定時空的產物。在選擇合適常模時,注意選擇較為新近的常模。 5取樣的方法包括:簡單隨機抽樣、系統(tǒng)抽樣、分組抽樣和分層抽樣。 6常模分數就是施測常模樣本被試后,將被試者的原始分數按一定規(guī)則轉換出來的導出分數。 7常模分數構成的分布,就是通常所說的常模,它是解釋心理測驗分數的基礎。常模一般有一般常模與特殊常模之分。測驗手冊上所列的常模通常為一般常模,不一定適合使用者的具體情況;特殊常模是為非典型團

40、體建立的,一般比為小團體建立的常模X圍更窄。 8發(fā)展常模及解釋 人的許多心理特質如智力、技能等,是隨著時間以有規(guī)律的方式發(fā)展的,所以可將個人的成績與各種發(fā)展水平的人的平均表現(xiàn)相比較。根據這種平均表現(xiàn)所制成的量表就是發(fā)展常模,亦稱年齡量表。 發(fā)展順序量表。最早的一個X例是格塞爾發(fā)展程序表,其中按月份顯示兒童在運動水平、適應性、語言、社會性四個方面的大致發(fā)展水平。 智力年齡。比內-西蒙量表中首先使用智力年齡的概念。智力年齡的計算為6(歲)4×2(月)3×2(月)2×2(月)=6歲18月=7歲6個月。 年級當量。實際上就是年級量表,測驗結果說明被試屬哪一年級的水平,在教

41、育成就測驗中最常用。 9百分位常模及解釋 百分位常模包括百分等級和百分點、四分位數和十分位數。 百分等級。一個測驗分數的百分等級是指在常模樣本中低于這個分數的人的百分比。 百分點。百分點是計算處于某一百分比例的人對應的測驗分數是多少。 四分位數和十分位數是百分位數的兩個變式,其含義相似。 10標準分常模及解釋 標準分是將原始分數與平均數的距離以標準差為單位表示出來的量表。因為它的基本單位是標準差,所以叫標準分數。包括線性轉換的標準分數和非線性轉換的標準分數。 11智商及其意義 比率智商。斯坦福-比內量表在心理年齡的基礎上,以智商表示測驗結果,即以后所說的比率智商。 離差智商。是一種以年齡組為樣

42、本計算而得的標準分數,韋克斯勒將離差智商的平均數定為100,標準差定為15。 12常模分數的表示方法包括轉換表和剖析圖。 第二節(jié) 參照效標的分數解釋 1在效標參照測驗中,一種標準是對測驗所包括的材料熟練或掌握的程度,另一個比較標準是外在效標,即用預期的效標成績來解釋測驗分數。 2簡述效標參照測驗與常模參照測驗相比的優(yōu)點。 常模參照測驗可以使能力強者驕傲自滿,能力差者長期遭受挫折,效標參照測驗巧妙地避開了對得分、名次的過分糾纏,使各人都有自己的奮斗目標和希望。 常模參照測驗無法反映出被試的真正能力和水平,甚至對被試到底能做什么,不能做什么也不清楚。效標參照測驗既能發(fā)現(xiàn)個人特有的長處,也會找到問題

43、的癥結所在,而常模參照測驗就做不到這一點。 從常模參照測驗的得分不能得到被試在外在效標上的表現(xiàn),效標參照測驗則可直接作出解釋,有時測驗結果的本身可能就是效標。 效標參照測驗與教師在教學過程中的自編測驗關系更為密切,因而效標參照測驗的理論概念更易為教師接受和應用。 3內容參照又叫X圍參照,主要是依據被試對某個確定的材料內容或技能的掌握程度和熟悉程度來表示和解釋測驗結果。 4內容參照的表示方法有掌握分數和正確百分數。 5結果參照分數實際上是一個效標分數,即用效標行為的水準來表示測驗的結果,而且也是對被試未來作為的預測。 6結果參照分數表示法有期望結果的概率和預期的效標分數。 第三節(jié) 測驗分數的解釋

44、與報告 1測驗分數的綜合分析: 根據心理測量的特點進行分析。由于測驗誤差的影響,被試測驗分數會在一定X圍內波動,故應該永遠把測驗分數視為一個X圍而不是一個確定的點。 要考慮測驗前的經歷和測驗時的情景。個人在測驗前的經歷和測驗情境會影響被試的得分。 要考慮測驗的信度和效度。 對于來自不同測驗的分數不能直接加以比較。 2簡述報告分數的具體建議。 不應把測驗分數直接告訴被試本人或家長、學校班主任等有關人員,應告訴的是測驗分數的解釋和建議。 避免使用專業(yè)術語。 要保證當事人知道這個測驗測量或預測什么。 要使當事人知道他是和什么團體在進行比較。 要使當事人知道如何運用他的分數。 要考慮測驗分數將給當事人

45、帶來什么心理影響。 要讓當事人積極參與測驗分數的解釋。 測驗結果應向無關人員某。 第八章 智力測驗 第一節(jié) 智力的概念及智力分數 1對智力的四種看法:智力是抽象思維的能力;智力是學習的能力;智力是適應新環(huán)境的能力;智力是綜合的能力。 2智力結構理論: 斯皮爾曼的二因素理論。 斯皮爾曼認為智力主要是一種普遍而概括的能力,他稱這種因素為G因素(普通因素),另外,人的智力活動中還存在著S因素(特殊因素)。 瑟斯頓的群因素理論。 美國心理學家瑟斯頓認為,智力是由一群彼此無關的原始能力構成的,各種智力活動可以分成不同的組群,每一群中有一個基本因素是共同的。 簡述吉爾福特的三維結構理論。 美國心理學家吉爾

46、福特認為,智力結構應從內容、操作和產品三個維度去考慮。 所謂內容是引起心智活動的各種刺激,即智力測驗所包括的各類題目,包括圖形、符號、語義、行為等。 所謂操作是指由各種刺激引起的心智活動方式,即解決問題的心理過程,包括認知、記憶、發(fā)散思維、聚斂思維和評價等。 所謂產品是指心智活動的產物,即運用各種心智活動對各類問題處理的結果,包括單元、類別、關系、系統(tǒng)、轉換、蘊涵等。 簡述卡特爾的流體智力與晶體智力理論。 美國心理學家卡特爾等人認為智力由兩種成分構成,一種是流體智力,另一種是晶體智力。他認為流體智力是人的一種潛在智力,主要和神經生理的結構和功能有關;它可以轉換到一切要求智力的練習活動中,所以稱

47、為流體智力。晶體智力則主要是后天獲得的,受文化背景影響很大,與知識經驗的積累有關,是流體智力運用在不同文化環(huán)境中的產物。 3修訂后的比內-西蒙量表首先采用了心理年齡,或稱智力年齡的概念,心理年齡實際上是一種年齡量表,是用年齡來表示測驗分數。 4比率智商:最早由德國心理學家施太倫提出,是心理年齡除以生理年齡所得商數,即為智力商數,或比率商數。 5比率智商可使不同年齡者的智力水平相互比較,可以表示一個人的聰明程度,但不適用于20歲以上的成年人,現(xiàn)在很少使用。 6離差智商:韋克斯勒提出離差智商的概念,是采用統(tǒng)計學中的均數和標準差計算出來的,表示被試偏離他本人這個年齡組平均成績的量數,是依據測驗分數的

48、常態(tài)分布來確定的。 71960年推孟在修訂斯坦福-比內量表時,標準化樣本得到的數值,定IQ均值為100,標準差為16。 第二節(jié) 個體智力測驗 1比內-西蒙量表在1905年編制而成,1908年修訂后提出“智力年齡”概念,并建立了常模。 21916年斯坦福大學的教授推孟修訂的斯坦福-比內量表最負盛名,史稱1916量表,并首次引入了比率智商的概念,以IQ作為比較人聰明程度的相對指標。 3S- 的理論模型 斯坦福-比內量表第四版又稱為S- 。它用一個三個層次的認知能力結構模型作為編制量表的框架,最高層是一般智力G因子;第二層次采用改良過的卡特爾的流體智力與晶體智力,在此之外又增加了短時記憶能力;第三層

49、次是15個S- 分測驗。 4比內-西蒙測驗于1916年傳入中國。 5中國的修訂本WAIS-RC分城市和農村兩式 6韋氏智力量表的實施與記分: 進行測驗時,一般按先語言測驗后操作測驗的順序進行; 在每個分測驗中,題目都是按難度順序排列的; 一個分測驗中的各項目得分相加,稱分測驗的粗分。 7分別計算語言智商(VIQ)和操作智商(PIQ)是韋氏智力測驗的一個特點。如優(yōu)勢半球有損害,則VIQ明顯低于PIQ;非優(yōu)勢半球有損害,則PIQ明顯低于VIQ;若是彌漫性損害,其表現(xiàn)與非優(yōu)勢側損害時相似。 8分析韋氏智力量表的多個分測驗時,有三種主要的方法: 各言語分測驗的量表分與言語量表的平均分比較; 各操作分測

50、驗的量表分與操作量表的平均分比較; 各分測驗的量表分與全量表的平均分比較。 9WISC-CR有12個分測驗,其中有10個分測驗,2個備用測驗。備用測驗只能在某一同類測驗因故實效時使用。通常備用測驗的分數不用于計算智商。 10WISC-CR的實施程序是先做一個言語測驗,再做一個操作測驗,交替進行,以維持兒童的興趣,避免疲勞和厭倦。 11WISC-CR的每個分測驗的原始分在轉化為量表分時,是在兒童自己所屬的年齡組內進行的。 12對韋氏智力量表的評價: 韋氏智力量表的優(yōu)點有: 具有復雜的結構,不但有言語分測驗,還有操作分測驗,能較好地反映一個人智力的全貌和測量各種智力因素。 用離差智商代替比率智商,

51、既克服了計算成人智商的困難,又解決了在智商變異上長期困擾人們的問題。 韋氏智力量表臨床應用的多,積累了大量的資料,已成為臨床測驗中的重要工具。 韋氏智力量表的缺點有: 韋氏智力量表的三個獨立本的銜接欠佳。 測驗的起點有點偏難,有的分測驗對低智力者難以說明,故不便測量低智力者。 有的分測驗項目過多,增加了測驗時間,有的相反,項目過少,難以調整項目難度,且不便作分半相關信度檢驗。 第三節(jié) 團體實施的智力測驗 1簡述團體測驗與個體測驗的差異。 團體測驗采用多項選擇,而個體測驗多采用開放式問題。 團體測驗的記分較個別測驗的記分更為嚴格而客觀。 團體測驗為團體施測,對主試要求不高。個別測驗為個體施測,對

52、主試要求較高。 團體測驗多用于篩選,而個體測驗則多用于診斷及彌補工作。 團體測驗能較個體測驗更好地建立常模。 2簡述團體測驗的優(yōu)缺點。 團體測驗的優(yōu)點有:節(jié)省人力、物力和主試施測時間,測驗程序簡便、對主試要求低、記分客觀和更易建立常模。 團體測驗的缺點有: 無法對被試詳細觀察,不易發(fā)現(xiàn)疾病、疲勞、焦慮等可能影響測驗成績的特殊反應。 主試與被試之間無法建立和諧的協(xié)調關系。 題目類型受到限制,缺乏靈活性,不利于有獨創(chuàng)性的被試。 由于動機問題或不能看懂指導語,有些測驗者的成績會大大低于實際水平。 3瑞文漸進測驗是以智力的二因素理論為基礎的,主要測量了一般因素(G)中的推斷性能力。瑞文測驗分為兩型:標

53、準型是瑞文測驗的基本型,有5個黑白系列;彩色型分為三個系列。瑞文測驗既可以團體施測,也可以作為個別測驗。 第四節(jié) 嬰幼兒智力發(fā)展量表 1格塞爾是嬰幼兒智力發(fā)展量表的創(chuàng)始人,1940年發(fā)表了格塞爾發(fā)展量表,它適用于4周至3歲,包括四大行為領域:運動發(fā)展、適應行為、語言發(fā)展和個人-社會行為。如果各領域的DQ均低于6575分,說明發(fā)育嚴重落后。 2丹弗發(fā)育篩選測驗共提出105個要求或項目,分別測量四大行為領域的能力:應人能、應物能、言語能和動作能。 3考夫曼兒童成套評估測驗是智力和成就的綜合測量,適用于2.512.5歲的兒童,它有三個量表:同時性加工量表、繼時性加工量表和成就量表。 4貝利嬰兒發(fā)展量

54、表由心理量表、運動量表和嬰兒行為記錄表三部分組成。 第五節(jié) 創(chuàng)造力測驗 第六節(jié) 智力測驗相關的心理學問題 1智力發(fā)展的一般趨勢:智力在童年期迅速增長,在青春期增長緩慢,約在25歲達到頂峰,以后保持穩(wěn)定到中年后期,在老年期逐漸下降。 2智力的個別差異:在全人口中,智力分布曲線基本上呈常態(tài),其智力極高(IQ在130以上)與極低(IQ在70以下)者均占少數,智力屬于中?;蚪咏谐#↖Q在80120)之間者約占全體人群的80%,其中(IQ在90109)的人數約占50%。 3簡述如何正確理解和解釋智力測驗的結果。 不能以一次測驗來確定智力水平。首先,測驗是有誤差的;其次,人的一生中智商會產生許多變化。

55、測驗要為智力的開發(fā)服務。測驗的目的不是為每一個人貼上智力高低的標簽,而是為了更好地開發(fā)人類的智力服務。第九章 能力傾向測驗 第一節(jié) 能力傾向測驗概述 1能力傾向測驗一般是指測量從事某種職業(yè)或活動的潛在能力,或預測未來作為水平的評估工具。 2簡述能力傾向測驗產生的原因。 彌補智力測驗的局限。智力測驗只是涉及到智力的某些方面,特殊能力傾向測驗可以補充籠統(tǒng)的智力測驗。 個體能力傾向存在差異。個體在某一測驗的各部分上的作業(yè),常常表現(xiàn)出顯著的差異,智力測驗由于分測驗項目太少,不足以作出這種能力傾向差異的分析。 因素分析技術的發(fā)展。因素分析使我們能夠編制多重能力傾向測驗,從而為個體各種能力傾向的強弱提供比較。 來自實際的需要。隨著科學管理,尤其是人事選拔和測評的發(fā)展,對個體的能力傾向進行評估的工具越來越受重視。 3試述能力傾向測驗的特點。 能力傾向測驗預測失敗比預測成功更為正確。 能力傾向測驗只是測量某方面的潛在能力,并不保證他在該方面的必然成就,具有某種能力傾向的個體,不一定在某方面很成功,但缺乏這種能力,則必然沒有成功的機會。 必須審慎解釋各種特殊能力分數間的差異。 測驗分數間的差異只是標準化團體的差異,而不是能力上的不同;被試施測某種能力傾向測驗的結果應該與實際從事這種活動的團體相比較;特殊能力傾向測驗應重視特殊團體常模的建立。 能力傾向測驗在訓練計劃中應審慎應用。 有些

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論