自考心理測量-復(fù)習(xí)材料_第1頁
自考心理測量-復(fù)習(xí)材料_第2頁
自考心理測量-復(fù)習(xí)材料_第3頁
自考心理測量-復(fù)習(xí)材料_第4頁
自考心理測量-復(fù)習(xí)材料_第5頁
已閱讀5頁,還剩34頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

PAGEPAGE39北京自考心理學(xué)《心理測量》串講筆記心理測驗學(xué)第一章總論第1節(jié):心理測驗的歷史回顧:p11.我國始于漢代、興于隋唐的科舉取士制度,就被中外學(xué)者公認(rèn)為世界上最早的心理測驗的實踐。2.孔子:把人分為中人、中人以上、中人以下三個類別,“中人以上,可以語上也;中人以下,不可以語上也”。相當(dāng)于現(xiàn)代測量學(xué)中的命名量表和次序量表。3.孟子:“權(quán),然后知輕重;度,然后知長短。物皆然,心為甚?!泵鞔_指出了心理能力和心理特征與物理現(xiàn)象一樣,具有可測量的特性。4.南朝人劉勰:在《新論.專學(xué)篇》,他不僅觀察到左手畫方右手畫圓不易實現(xiàn)這種現(xiàn)象,而且認(rèn)為其原因是一心不能二用,這恐怕應(yīng)該算是世界上最早的“分心測驗”了。5.南北朝的顏之推:周歲試兒,其是1925年格塞爾嬰兒發(fā)展量表的前導(dǎo)。6.七巧板:中國民間廣泛流行的“七巧板”,又稱益智圖、唐圖,為當(dāng)代多數(shù)智力測驗和創(chuàng)造力測驗所使用。在某些方面可以作為創(chuàng)造力測驗的一種方法。7.隋煬帝科舉制度的開端:被認(rèn)為是世界上最早的心理測驗的實踐。當(dāng)時的考試方法:貼經(jīng)和對偶,類似于現(xiàn)代西方言語測驗中常見的填字和類比。8.中國古代心理測驗的思想,包含著典型的東方文化特點:1..他們都是描述性的,沒有定量的標(biāo)準(zhǔn);2..心理測驗往往將心理特點(能力、人格、智力等)與道德觀念聯(lián)系起來(局限性);9.科學(xué)心理測驗產(chǎn)生的原因:1..對智力落后者分類和訓(xùn)練的早期關(guān)注:a.心理測驗產(chǎn)生的最初原因是對智力落后和精神病人治療的需要。b.法國醫(yī)生埃斯克羅:1838年出版了兩卷本著作,第一次明確地對智力落后與精神病人作出了區(qū)分,他認(rèn)為精神病是以情緒障礙為標(biāo)志。c.另一位法國醫(yī)生塞國恩的貢獻(xiàn)也特別重要,他是訓(xùn)練智力落后者的先驅(qū)。2..馮特的實驗心理學(xué):實驗心理學(xué)的誕生是心理測驗產(chǎn)生的另一個重要原因。a.1879年馮特在德國萊比錫大學(xué)建立了心理學(xué)史上第一個實驗室,許多早期試驗心理學(xué)家都在這里接受訓(xùn)練。引發(fā)了個別差異的研究。b.實驗心理學(xué)的誕生和發(fā)展,還給心理測驗帶來了另一個副產(chǎn)品:嚴(yán)格的標(biāo)準(zhǔn)化程序。10.高爾頓:1..英國生物學(xué)家和心理學(xué)家高爾頓是倡導(dǎo)測驗運動的主要人物。2..他設(shè)計了測量差異的方法,雖不是正式的心理測驗,但可視為心理測驗的開端。3..1884年,在倫敦國際博覽會上,高爾頓專門設(shè)立了一個“人類測量實驗室”。這是心理實驗史上第一次大規(guī)模系統(tǒng)地測量個別差異的嘗試。4..他還是評定量表和問卷法應(yīng)用的先驅(qū);他也經(jīng)常用自由聯(lián)想技術(shù)。5..他的另一個重要貢獻(xiàn)是為心理測驗奠定了統(tǒng)計學(xué)基礎(chǔ),并第一個提出了相關(guān)的概念。11.卡特爾:美國心理學(xué)家,從師馮特。1890年,卡特爾在《心理》雜志上發(fā)表“心理測驗與測量”;這是心理測驗第一次出現(xiàn)于心理學(xué)文獻(xiàn)中。12.斯皮爾曼:1904年,英國心理學(xué)家斯皮爾曼發(fā)表了他著名的論文“普通能力”此文奠定了他的智力結(jié)構(gòu)二因素論的理論基礎(chǔ),為日后比內(nèi)智力測驗的編制提供了基礎(chǔ)。13.世界上第一個智力測驗:1..比內(nèi):比內(nèi)于1857年出生于法國尼斯,起初學(xué)習(xí)法律,繼而改學(xué)醫(yī)學(xué),以后致力于心理測驗的研究。1904年法國教育部委派許多教育家、醫(yī)學(xué)家和其他科學(xué)家組成一個委員會,專門研究公立學(xué)校中智力落后兒童的教育方法。比內(nèi)在1911年去世。2..比內(nèi)與助手西蒙1905年在《心理學(xué)年報》上發(fā)表了一篇文章,題為:“診斷異常兒童智力的新方法”,文章中他中介紹了一個包括30個項目的量表。這個量表很粗糙,尚不能準(zhǔn)確地測量智商,但它在心理測驗史上極其重要,是世界上第一個正式的心理測驗。3..比內(nèi)-西蒙量表自1905年發(fā)表后,比內(nèi)和西蒙親自主持過兩次修訂:a.在1908年修訂,1908年量表題目總數(shù)達(dá)到了59個,所有測題按年齡分組,組別從3-13歲;測驗的結(jié)果用“智力水平”表示,但其通常翻譯和提法為“智力年齡”。b.后又經(jīng)1911年修訂一次。14.心理測驗的蓬勃發(fā)展:縱觀心理測驗的發(fā)展,人們常說19世紀(jì)80年代時高爾頓的10年,90年代是卡特爾的10年,20世紀(jì)頭10年則是比內(nèi)的智力測驗的10年。1..操作測驗的發(fā)展:由于理論上的缺陷和實際上的需要,所以就有操作測驗的問世和發(fā)展。2..團體智力測驗的發(fā)展:運用團體測驗可以在同一時間內(nèi)測量許多被試,這是心理測驗方式的極大進步,擴大了測驗的應(yīng)用范圍。3..能力傾向測驗的發(fā)展:這些測驗為了分析個人心理品質(zhì)的內(nèi)部結(jié)構(gòu)提供了適用的工具,逐漸受到人們的重視。此外,普通能力傾向(智力)測驗也向多元化發(fā)展。韋克斯勒所編的學(xué)前兒童、學(xué)齡兒童、成人智力量表。4..人格測驗的發(fā)展:心理測驗的另一領(lǐng)域是涉及情感或行為等非智力方面的人格評估,通常包括對性格、氣質(zhì)、情緒狀態(tài)、人際關(guān)系、動機、興趣和態(tài)度的測量。5..現(xiàn)代西方心理學(xué)的發(fā)展:受到計算機的發(fā)生和發(fā)展,以及統(tǒng)計方法的改進的極大影響。而“因素分析”的理論從1904年斯皮爾曼提出智力二音素論開始,經(jīng)心理學(xué)家近一個世紀(jì)的爭論和研究,已日趨成熟和完善,給現(xiàn)代心理學(xué)測驗奠定了堅實的基礎(chǔ)。15.中華人民共和國成立前心理測驗的發(fā)展:1..1916年,樊炳清先生首先介紹了比內(nèi)-西蒙智力量表;2..1920年,廖世承和陳鶴琴在南京高等師范學(xué)校開設(shè)心理測驗課,并用心理測驗試測投考該校的學(xué)生,這便是中國正式開始的科學(xué)心理測驗;北京高等師范學(xué)校和南京高等師范學(xué)校建立了我國最早的兩所心理實驗式。3..1921年,廖世承和陳鶴琴正式出版《心理測驗法》一書,成為中國最早的心理測驗專著;4..1922年,中華教育改進社聘請美國教育心理測驗專家麥考爾來華講學(xué),并主持編制心理測驗事宜;5..1924年,陸志韋發(fā)表了《訂正比內(nèi)西蒙智力測驗說明書》,30年代又與吳天敏再次做了修訂;6..1931年,由艾偉、陸志韋、陳鶴琴、蕭孝嶸等倡議,組織并成立了中國測驗學(xué)會;7..1932年,《測驗》雜志創(chuàng)刊。16.中華人民共和國成立后心理測驗的發(fā)展:1..1979年,林傳鼎、張厚粲等以國外資料為參考,編制了少年兒童學(xué)習(xí)能力測驗;2..1989年,成立中國心理學(xué)會心理測驗專業(yè)委員會,標(biāo)志著中國心理測驗進入一個新的高速發(fā)展時期。第2節(jié):心理測驗的性質(zhì)、種類和功能:p1217.測量:就是根據(jù)一定的法則,用數(shù)字對事物加以確定。一定的法則:是指測量行為發(fā)生時采用的規(guī)則或方法。事物:是指我們要測量的感興趣的事物的屬性或特征。數(shù)字:可以表示數(shù)量,也可以不表示數(shù)量。一般來說,用數(shù)字對事物加以確定,就是確定一個事物的屬性的量的多少。通常人們所說的測量,指的是給事物確定出一種數(shù)量化的價值。18.測量有兩個要素:一是參照點,二是單位。1..對任何事物確定出一個量都要有一個計算的起始點,這個點就是參照點。參照點可以分為兩種,一種是絕對的零點,另一種是相對參照點。心理測驗中所用的參照點都是相對的,因而測量的結(jié)果常常不能以“倍數(shù)”的方式解釋。2..理想的單位的條件:有明確的意義和有相等的價值。3.量表就是有參照點和單位的連續(xù)體。19.測量的量表:量表就是有參照點和單位的連續(xù)體。斯蒂文斯將量表由低到高依次為:1..命名量表:是水平最低的一種測量量表,用數(shù)字來代替事物或?qū)κ挛镞M行分類;不能進行加減乘除。2..順序量表:不僅表明類別,還能表明不通類別的大小等級,或具有某種屬性的程度;不能進行乘除運算。3..等距量表:有大小關(guān)系,又有相等的單位,因此可以加減運算,但沒有絕對零點,不能做乘除運算;4..比例量表:是最精確的測量,既有相等的單位,又有絕對零點。20.心理量表的性質(zhì):1..一般來說,心理測量是在順序量表上進行的。因為對于人的智力、性格、氣質(zhì)、興趣、態(tài)度等來說,絕對零點時難以確定的。2..雖然心理現(xiàn)象適合在順序量表上進行測量,但大多數(shù)心理學(xué)家喜歡把測驗成績轉(zhuǎn)換為等距量表,最常用的轉(zhuǎn)換方法是轉(zhuǎn)換為標(biāo)準(zhǔn)分?jǐn)?shù),即把順序量表轉(zhuǎn)變成以標(biāo)準(zhǔn)差為單位的等距量表。21.心理測驗:即是依據(jù)一定的心理學(xué)理論,使用一定的操作程序,給人的行為確定出一種數(shù)量化的價值。心理測驗的要素:行為樣本:心理測驗在測量個別差異的時候,往往也只是對少數(shù)經(jīng)過慎重選擇的樣本進行觀察,來間接推知被試的心理特征。標(biāo)準(zhǔn)化:是指測驗編制、實施、記分以及測驗分?jǐn)?shù)解釋程序的一致性,標(biāo)準(zhǔn)化的量一個重要步驟是建立有代表性的常模??陀^性:心理測驗的客觀性的某些方面,總是與標(biāo)準(zhǔn)化的討論聯(lián)系在一起的,即對心理測驗的客觀性要求牽涉到標(biāo)準(zhǔn)化的問題,因此,在不受被試主觀判斷支配的范圍內(nèi),測驗的實施、評分、解釋應(yīng)是客觀的,要盡量減少主試和被試的隨意程度??陀^性另一個主要方面是測題或整個測驗的難度水平的確定必須客觀。22.心理測驗的性質(zhì):1..心理測驗的間接性:迄今為止,我們還無法直接測量人的心理,只能通過測量人的外顯行為,即測量人們對測驗題目的反應(yīng)來推斷出他的心理特質(zhì)。特質(zhì):是用來描述一組內(nèi)部相關(guān)或有內(nèi)在聯(lián)系的行為時所使用的術(shù)語,是個人對刺激作反應(yīng)的一種內(nèi)在傾向。特質(zhì)是個體特有的、穩(wěn)定的、可辨別的特征。但它又是一個抽象的產(chǎn)物,一個構(gòu)思,不是一個直接測量的有實體的個人特點。由于特質(zhì)是從行為模式中推論出來的,所以心理測驗永遠(yuǎn)是間接的。2..心理測驗的相對性:我們在比較不同人之間的行為或心理特征時,沒有絕對的標(biāo)準(zhǔn),也沒有絕對的標(biāo)準(zhǔn),也沒有絕對的零點,我們有的只是一個連續(xù)的行為序列。所以每一個被測得的結(jié)果,都是與他所在團體或人群的大多數(shù)人的行為,或某種人為確定的標(biāo)準(zhǔn)相比較而言的。3..心理測驗的客觀性:心理測驗標(biāo)準(zhǔn)化包括:a.測驗用的項目或作業(yè)、施測說明、施測者的言語態(tài)度及施測時的物理環(huán)境等,均經(jīng)過標(biāo)準(zhǔn)化,測驗的刺激是客觀的。b.評分計分原則和手續(xù)經(jīng)過了標(biāo)準(zhǔn)化,對反應(yīng)的量化是客觀的。c.分?jǐn)?shù)轉(zhuǎn)換和解釋經(jīng)過了標(biāo)準(zhǔn)化,對結(jié)果的推論是客觀的。23.心理測驗的種類:1..按測驗的功能分類:智力測驗:智力測驗的功能是測量人的一般智力水平。例如:比內(nèi)-西蒙智力測驗、韋克斯勒兒童和成人智力量表。特殊能力測驗:偏重測量個人特殊潛在能力,多用于升學(xué)、職業(yè)指導(dǎo)以及一些特殊工種人員的篩選。例如:音樂、繪畫、機械技巧,以及文書才能測驗。這類測驗在臨床上應(yīng)用較少。人格測驗:主要用于測量性格、氣質(zhì)、信念等方面的個性心理因素,亦即個性中除能力以外的部分。人格測驗包括問卷和投射測驗:問卷:如明尼蘇達(dá)多項人格調(diào)查表(MMPI)、16種人格因素問卷(16PF)、艾森克人格問卷(EPQ);投射測驗:如羅夏墨跡測驗、主題統(tǒng)覺測驗(TAT)。2..按測驗材料的性質(zhì)分類:文字測驗、操作測驗。文字測驗:所用的是文字材料,它以言語作為刺激。被試用言語做出反應(yīng)。例如:MMPI、EPQ、16PF及韋克斯勒兒童和成人智力量表中的言語量表部分。優(yōu)點:實施方便,團體測驗多用,有肢體殘疾而無言語困難的病人只能用此。缺點:受被試文化程度的影響。操作測驗:也稱非文字測驗。無需言語,不受文化因素限制;可用于兒童和文盲;例如:羅夏墨跡測驗、主題統(tǒng)覺測驗、瑞文測驗及韋克斯勒兒童和成人智力量表中的操作量表部分。優(yōu)點:不受文化因素的限制。缺點:大多不宜團體實施,在時間上不經(jīng)濟。3..按測驗材料的嚴(yán)謹(jǐn)程度分類:客觀測驗、投射測驗??陀^測驗:測驗中,所呈現(xiàn)的刺激詞句、圖形等意義明確,只需被試直接理解,無須發(fā)揮想象力來猜測和遐想,故稱客觀測驗。絕大多數(shù)心理測驗都屬于這類測驗。投射測驗:在此類測驗中,刺激沒有明確的意義,問題模糊,對被試的反應(yīng)也沒有明確規(guī)定。被試做出反應(yīng)時,一定要憑自己的想象力加以填補,使之成為有意義的。在這個過程中,恰好投射出被試的思想、感情和經(jīng)驗,所以稱為投射測驗。此種測驗種類較少,具有代表性的有:如羅夏墨跡測驗、主題統(tǒng)覺測驗(TAT)、自由聯(lián)想測驗、句子完成測驗。4..按測驗的方式分類:個別測驗、團體測驗。個別測驗:一對一,臨床常用法。例如:比內(nèi)-西蒙智力量表、韋克斯勒智力量表等;優(yōu)點:主試可以仔細(xì)觀察被試的言語情緒,并有充分的機會與被試合作,所以其結(jié)果正確可靠。缺點:時間不經(jīng)濟,不能在短時間呢您收集到大量的資料。團體測驗:一個多個主試對多個被試。例如:陸軍甲種和乙種測驗,教育上的成就測驗。優(yōu)點:時間經(jīng)濟,主試不必接受嚴(yán)格的專業(yè)訓(xùn)練即可擔(dān)任。缺點:主試對被試的行為不能作切實的控制,所得結(jié)果不及個別測驗正確可靠。24.論述心理測驗的功能:1..從實際應(yīng)用角度看:人才選拔;崗位安置;臨床診斷;教育評價;心理咨詢和治療;2..從理論研究角度看:a.搜集資料:心理測驗是收集個體差異資料最快捷的辦法。b.提出和驗證假設(shè);c.實驗分組;第3節(jié):正確對待和使用測驗:p2325.錯誤的測驗觀:1..測驗萬能論;2..測驗無用論:1...某些人格測驗侵犯了個人隱私;2...測驗為宿命論和種族歧視提供了心理學(xué)依據(jù)。3..心理測驗即智力測驗。26.正確的測驗觀:1..重要的心理學(xué)研究方法和決策的輔助工具:除實驗法以外,心理測驗法的出現(xiàn)是心理科學(xué)發(fā)展史上的一大進步,是心理學(xué)研究中不可缺少的研究方法之一。在進行升學(xué)、就業(yè)、招聘、晉級等工作時,若有相應(yīng)的心理測驗,就可以幫助有關(guān)部門作出科學(xué)的決策。2..作為研究方法和測量工具尚不完善:盡管心理測驗是心理學(xué)研究的必要手段,而且實際生活中也在廣泛應(yīng)用,但是心理測驗從理論到方法都還存在許多問題,尤其過分夸大心理測驗的科學(xué)性和準(zhǔn)確性是不對的。正確的態(tài)度應(yīng)該是既承認(rèn)心理測驗的不完善,又科學(xué)地自信地使用心理測驗,不應(yīng)該重犯倒洗澡水把孩子也潑掉的錯誤。3..科學(xué)地看待心理測驗,防止亂用測驗:為防止測驗的濫用,需注意的問題:1...測驗使用者必須具備一定的資格;2...慎重選擇測驗量表;3...與被試建立良好的協(xié)調(diào)關(guān)系;4...正確解釋測驗結(jié)果;5...注意測驗的保密。對測驗的保密主要有兩個方面:a.一是對測驗內(nèi)容的保密;b.二是對測驗結(jié)果幾個人隱私保密。第二章心理測驗的編制第1節(jié):心理測驗的對象、目的及目標(biāo):p271.在編制測驗前首先要明確測量的對象:也就是該測驗編成后要用于哪些團體。其包括三個重要的維度,即:1..年齡:測驗的年齡范圍是有明確規(guī)定的。2..教育水平:在編制兒童測驗時,要同時考慮教育水平和年齡的影響。在成人測驗中,一般只考慮教育水平的影響。3..文化背景:2.測驗的目的:一般來說可分為兩類;顯示和預(yù)測。由此我們可以分為兩類測驗:顯示性測驗和預(yù)測性測驗。1..顯示性測驗:是指測驗題目和所要測量的心理特征相似的測驗。有些觀察法、行為評估法也都是顯示性測驗;古德納夫在顯示性測驗內(nèi)部又加以區(qū)分,將其分為樣本測驗和標(biāo)記測驗。樣本測驗:題目取自一個很明確的總體的測驗即是樣本測驗;如學(xué)生的四則混合運算;標(biāo)記測驗:題目取自一個全開發(fā)的總體的測驗即是標(biāo)記測驗。如智力測驗2..預(yù)測性測驗:指預(yù)測一些沒被測量的行為的測驗。3..顯示性和預(yù)測性的測驗的區(qū)分并不是絕對的:如高考、題目源于高中,是樣本測驗;成績預(yù)測大學(xué),預(yù)測測驗。3.心理測驗的目標(biāo)是指編制的測驗是測什么的,即用來測量什么樣的心理變量或行為特征。目標(biāo)分析以測驗不同而異,一般分為三種情況:1..工作分析:對于選拔和預(yù)測功用的預(yù)測性測驗,主要任務(wù)是對所預(yù)測的行為活動作具體分析,我們稱之為任務(wù)分析或工作分析。一般分為兩個步驟:1...確定哪些心理特征或行為可以使要預(yù)測的活動達(dá)到成功;2...建立被試是否成功的衡量標(biāo)準(zhǔn);2..對特定概念下定義:如果測驗是為了測量某種特殊的心理品質(zhì)或特點,那么測驗編制者就必須給所要測量的心理或行為特質(zhì)下定義,然后必須發(fā)現(xiàn)該特質(zhì)所包含的維量將通過什么行為表現(xiàn)出來或怎樣進行測量。3..確定測驗的具體內(nèi)容:如果測驗是描述性的顯示測驗,它的目標(biāo)分析的主要任務(wù)則是確定顯示的內(nèi)容和技能,從中取樣。a.成就測驗是典型的描述性測驗,它的內(nèi)容分析過程主要體現(xiàn)在雙向細(xì)目標(biāo)的制作過程中。b.雙向細(xì)目標(biāo):由測量的內(nèi)容材料維度和行為目標(biāo)維度所構(gòu)成的表格,它能幫助成就測驗的編制者決定應(yīng)該選擇哪些方面的題目以及各題目所占的比例。c.雙向細(xì)目標(biāo)在編制其他非成就測驗時也適用,如精神心理測驗等,其中一個維度涉及有關(guān)的機能和特質(zhì),另一個維度則是這些品質(zhì)的行為描述。d.布魯姆把學(xué)習(xí)的心理活動分為認(rèn)知、精神活動、情感三個領(lǐng)域。第2節(jié):測題的編寫技術(shù):p314.編制測驗題目涉及到從編寫、編集、到預(yù)試、修改這樣一個循環(huán)過程。5.搜集有關(guān)資料:題目的有關(guān)來源:1..已出版的標(biāo)準(zhǔn)測驗;2..理論和專家的經(jīng)驗;3..臨床觀察和記錄。6.考慮測題的來源要注意2個問題:1..資料來源要盡可能豐富:2..材料應(yīng)該有普遍性。7.命題的原則及編寫要領(lǐng):1..命題的原則:1...內(nèi)容方面:首先,要求題目的內(nèi)容符合測驗的目的;其次,內(nèi)容取樣要有代表性;第三,題目間內(nèi)容相互獨立,互不牽連。2...文字方面:使用語言要準(zhǔn)確,語句要簡明扼要;最好一句話說明一個概念,盡量少使用雙重否定句。3...理解方面:題目應(yīng)有確切的答案;題目的內(nèi)容不要超出受測團體的知識水平和理解能力;題目格式要容易理解。4...社會敏感性方面:應(yīng)盡量避開社會敏感性問題,如涉及社會禁忌或個人隱私的題目不應(yīng)使用。菲利普對于涉及社會敏感性問題,怎樣鼓勵被試作出真實回答的策略:a.命題時假定被試具有某種行為,使他不得不在確實沒有該行為時才否定,可避免否定過多的傾向。b.命題時假定規(guī)范不一致;c.指出該行為是常見的,雖然是違規(guī)的。2..測題的編制要求:對心理測驗的題目進行分類的標(biāo)準(zhǔn)很多,常見的分類是根據(jù)對被試的要求不同來分;可以分為兩大類:提供型選擇型題目。1...提供型題目:要求被試給出正確答案,如論文題、簡答題、填充題等;2..選擇型題目:要求被試在有限的幾個答案中選擇正確的答案,如選擇題、是否題、匹配題等。選擇題我們比較熟悉,它由兩部分分構(gòu)成:提干和選擇。a.題干:就是呈現(xiàn)一個問題的情景,一般由直接問句或不完全的陳述問或不完全的陳述句構(gòu)成。b.選項:就是問題的多種可能答案,常常是包括一個正確答案,若干(一般是1—5個)錯誤答案,其中錯誤的答案叫“誘答”。8.對于選擇題,我們既要編好題干,也要編好選項,有幾點必須注意:1..題干所提的問題必須明確,盡量使用簡單而明晰的詞語;2..選項要簡明扼要;3..每題只給一個正確答案,其他屬于誘答;4..各選項長度相等,盡量不要有長有短;5..避免詞干用詞與選項用詞一致,否則成了選擇答案的線索;6..選項最好用同一形式。第3節(jié):測驗的編排和組織:p409.測驗編排的一般原則:1..測題的難度排列易逐步上升;2..盡可能將同類型的測題組合在一起;3..各種類型測題本身的特點。10.兩種常見的試題排列方式:1..并列直進式:整個測驗按試題材料的性質(zhì)歸為若干分測驗,在同一分測驗的試題依其難度由容易到難排列。2..混合螺旋式:先將各類試題依難度分成若干不同層次,再將不同性質(zhì)的試題加以組合,作交叉式排列,難度則漸次升進。第三章測驗的信度第1節(jié):信度的概念:p461.信度:是指同一被試在不同時間內(nèi)用同一測驗(或用另一套相等的測驗)重復(fù)測量,所得結(jié)果的一致程度。信度只受隨機誤差的影響,隨機誤差越大,信度越低。2.信度理論定義:傳統(tǒng)的信度理論認(rèn)為,每一個測驗的實得分?jǐn)?shù)(X)總是由真實分?jǐn)?shù)(T)和誤差(E),兩個部份構(gòu)成的,公式為:X=T+E3.討論一組測驗分?jǐn)?shù)的特性時,可用方差導(dǎo)標(biāo)具體分?jǐn)?shù),公式:(測驗實得分?jǐn)?shù)的方差)=(測驗真分?jǐn)?shù)的方差)+(測驗誤差的方差)4.信度操作定義:一組測量分?jǐn)?shù)的真分?jǐn)?shù)方差與總方差(實得分?jǐn)?shù)的方差)的比率,或者是真實分?jǐn)?shù)方差占總方差的的百分比。計算公式:由于真實分?jǐn)?shù)的方差是無法統(tǒng)計的,因此公式可轉(zhuǎn)化為:5.信度的指標(biāo)1..信度系數(shù):大部分情況下,信度是信度系數(shù)為指標(biāo),它是一種相關(guān)系數(shù)。理論上說就是真分?jǐn)?shù)方差與實得分?jǐn)?shù)的方差的比值,公式是:信度指數(shù):是真分?jǐn)?shù)標(biāo)準(zhǔn)差與實得分?jǐn)?shù)的標(biāo)準(zhǔn)差的比值,公式是:信度指數(shù)的平方就是信度系數(shù)。2..測量標(biāo)準(zhǔn)誤:信度系數(shù)表示一組測量的實得分?jǐn)?shù)與真分?jǐn)?shù)的符合程度,但并沒有直接支出個人測量分?jǐn)?shù)的變異量。用一組被試兩次測量結(jié)果來代替同一個人反復(fù)實測,有了信度的另一個指標(biāo):(公式3-7)測量的標(biāo)準(zhǔn)誤與信度之間呈反比關(guān)系:標(biāo)準(zhǔn)誤越小,信度越;標(biāo)準(zhǔn)誤越大,信度越低。6.信度與測驗分?jǐn)?shù)的解釋:1..解釋真實分?jǐn)?shù)與實得分?jǐn)?shù)的相關(guān):信度系數(shù)可以解釋為總的方差中有多少比例是由真實分?jǐn)?shù)的方差決定的,也就是測驗的總變異中真分?jǐn)?shù)造成的變異占百分之幾。2..比較信度可以接受的水平:一個測驗究竟信度多高才適合,才讓人滿意呢?當(dāng)然,最理想的情況是=1.00,但實際上辦不到。一般原則是:一般的能力測驗和成就測驗的信度系數(shù)都在0.90以上;人格測驗、興趣、態(tài)度、價值觀等測驗的信度一般在0.80-0.85。一般原則是:當(dāng)rxx<0.70時,測驗不能用于對個人作出評價或預(yù)測,而且不能作團體比較;當(dāng)0.70≤rxx<0.85時,可用于團體比較;當(dāng)rxx≥0.85時,才能用來鑒別或預(yù)測個人成績或作為。3..解釋個人分?jǐn)?shù)的意義:從信度可以解釋個人分?jǐn)?shù)的意義,這是測量標(biāo)準(zhǔn)誤的應(yīng)用。它有兩個作用:一是.估計真實分?jǐn)?shù)的范圍;二是.了解實得分?jǐn)?shù)再測時可能的變化情形。例題:假設(shè)在一個智力測驗中,某個被試的IQ為100,這是否反映了他的真實水平?如果再測一次他的分?jǐn)?shù)將改變多少?已知該智力測驗的標(biāo)準(zhǔn)差是15,信度系數(shù)為0.89,則其IQ的測量標(biāo)準(zhǔn)誤和可能范圍分別為:SE=15=5.0IQ=100±1.96x5=100±9.8≈90~110我們可以說這個被試的真實IQ有95%的可能性落在90與110之間。即若再測一次,他的智商低于90、高于110的可能性不超過5%。4..比較不同測驗分?jǐn)?shù)的差異:測量標(biāo)準(zhǔn)誤和測驗信度在評價兩個不同測驗的分?jǐn)?shù)是否有明顯差異時也非常重要。這種比較包括兩個人不同分?jǐn)?shù)的差別和同一被試在兩個測驗上的差別。例題:某被試在韋氏成人智力測驗中言語智商為102,操作智商為108。已知兩個分?jǐn)?shù)都是以100為平均數(shù),15為標(biāo)準(zhǔn)差的標(biāo)準(zhǔn)分?jǐn)?shù)。假設(shè)言語測驗和操作測驗的分半信度分別為0.97和0.93。問其操作智商是否顯著高于言語智商呢?首先計算出差異分?jǐn)?shù)的標(biāo)準(zhǔn)誤:在統(tǒng)計上,經(jīng)常要求兩個分?jǐn)?shù)的差異程度達(dá)到0.05的顯著水平,才能承認(rèn)不是誤差的影響。因此將差異標(biāo)準(zhǔn)誤(4.74)乘以1.96,結(jié)果為9.29,這表明個體在韋氏測驗兩半得分的差異高于大約10分,才能達(dá)到0.05顯著水平。上述被試的分?jǐn)?shù)差異(108-102=6)是不顯著的。第2節(jié):信度的類型及估計方法:p517.信度的類型:重測信度、復(fù)本信度、內(nèi)部一致性信度、評分者信度8.重測信度:又稱穩(wěn)定性系數(shù)。他的計算方法是采用重測法,即使用同一測驗,在同樣條件下對同一組被試前后施測兩次測驗,求兩次得分間的相關(guān)系數(shù)。1..用重測法估計信度的優(yōu)點:能提供有關(guān)測驗是否隨時間而變異的資料,可作為被試將來行為表現(xiàn)的依據(jù)。用重測法估計信度的缺點:易受練習(xí)和記憶的影響;2..最適宜的時距隨測驗的目的、性質(zhì)和被試的特點而異,一般是兩周到四周較宜,間隔時間最好不超過六個月。3..重測信度的前提假設(shè)是:1...所測量的特性必須是穩(wěn)定的;2...每個人對前一次反應(yīng)的遺忘程度相同;⑶在時間間隔中沒有學(xué)習(xí)另外的與測驗有關(guān)的東西。3…在時間間隔中沒有學(xué)習(xí)另外的與測驗有關(guān)的東西,即每人學(xué)習(xí)其他東西的程度都一樣。9.復(fù)本信度:又稱等值性系數(shù)。它是以兩個等值但題目不同的測驗(復(fù)本)來測量同一群體,然后求得被試在兩個測驗上得分的相關(guān)系數(shù),這個相關(guān)系數(shù)就代表了復(fù)本信度的高低。復(fù)本信度反映的是測驗在內(nèi)容上的等值性,故稱等值性系數(shù)。1..復(fù)本信度的高低關(guān)鍵取決于復(fù)本測驗的選擇,因而是題目取樣問題。2..同重測信度一樣,復(fù)本信度也要考慮兩個復(fù)本實施時間間隔。如果兩個復(fù)本幾乎是在同一時間內(nèi)施測的,相關(guān)系數(shù)反映的才是不同復(fù)本的關(guān)系,而不摻有時間的影響。如果兩個復(fù)本的施測相隔一段時間,則稱重測復(fù)本信度或穩(wěn)定與等值系數(shù)。穩(wěn)定與等值系數(shù)既考慮了測驗在時間上的穩(wěn)定性,也考慮了不同題目樣本反應(yīng)的一致性,因而是更為嚴(yán)格的信度考察方法,也是應(yīng)用較為廣泛的方法。在實際應(yīng)用時,為了抵消施測順序的效應(yīng),應(yīng)該有半數(shù)的被試先作A本再作B本,另一半被試先作B本再作A本。10.內(nèi)部一致性信度包括:分半信度和同質(zhì)性信度。1..分半信度:指采用分辦法估計所得的信度系數(shù)。這種方法估計信度系數(shù)只需一種測驗形式,實施一次測驗。通常是在測驗實施后將測驗按奇、偶數(shù)分為等值的兩半,并分別計算每位被試在兩半測驗上的得分,求出這兩半分?jǐn)?shù)的相關(guān)系數(shù)。1...常見的是將測題按其序列號的奇偶分半,這種分法的前提是:測題并非隨機排列,而是按某種順序(如難度)排列;如果隨機排列的題目,則必須是所有題目平等的(要么難度相等,要么性質(zhì)一樣);如果測驗有多個分量表,應(yīng)該在分量表內(nèi)部排好順序,再把各分量表分兩半組合起來求相關(guān)。2...常用的修正公式是:斯皮爾曼-布朗公式:例題:某測驗分為兩半后求得的相關(guān)系數(shù)為0.524,則測驗在原長度時的度估計值為:rxx=斯皮爾曼-布朗公式為經(jīng)驗公式,他的假設(shè)條件是兩半測驗分?jǐn)?shù)的變異數(shù)相等,但實際資料有時未必完全符合這一條件。當(dāng)假設(shè)不成立時,可采用:弗朗那根公式或盧倫公式中的任一一個。2..同質(zhì)性信度:指測驗內(nèi)部所有題目間的一致性。當(dāng)各個測題的得分有較高的正相關(guān)時,不論題目的內(nèi)容和形式如何,測驗即為同質(zhì)的;若所有題目看起來好像測量的是同一特質(zhì),但相關(guān)很低或為負(fù)相關(guān)時,測驗即為異質(zhì)的。此外,對于一些復(fù)雜的、異質(zhì)的心理學(xué)變量,采用單一的同質(zhì)性測驗是不行的,因而常常采用若干相對異質(zhì)的分測驗,并使每個分測驗內(nèi)容具有同質(zhì)性,這樣每個分測驗就能用來預(yù)測異質(zhì)效標(biāo)的某一方面。同質(zhì)性信度的公式主要有:庫德-理查遜公式:常用的是K-R20公式;在個各測題難度相同或近似的情況下,還可采用計算更為簡便的K-R21公式??藗惏秃咋料禂?shù):不適用于多重幾分的測題。11.評分者信度:用于測量不同評分者之間所產(chǎn)生的誤差。為了衡量評分者之間的信度高低,可隨機抽取若干份測驗卷,由兩位評分者按評分標(biāo)準(zhǔn)分別給分,然后再根據(jù)美分測驗卷的兩個分?jǐn)?shù)計算相關(guān),即得評分者信度。一般要求在成對的受過訓(xùn)練的評分者之間平均一致性達(dá)0.90以上,才認(rèn)為評分是客觀的。當(dāng)多個評分者評定多個對象,并以等級法記分時,可采用肯德爾和諧系數(shù)作為評分者信度的估計。信度估計方法及其與測量復(fù)本和施測次數(shù)的關(guān)系所需施測次數(shù)所需復(fù)本的數(shù)目一二一分半信度同質(zhì)性信度評分者信度復(fù)本信度(連續(xù)施測)二重測信度復(fù)本信度(間隔施測)各種信度系數(shù)相應(yīng)誤差方差的來源信度系數(shù)類型誤差方差來源重測信度時間取樣復(fù)本信度(連續(xù)施測)內(nèi)容取樣復(fù)本信度(間隔施測)時間和內(nèi)容取樣分半信度內(nèi)容取樣同質(zhì)性信度內(nèi)容的異質(zhì)性評分者信度評分者之間的差異第3節(jié):影響信度的因素:p5912.影響信度的因素:1..樣本的特征:信度常用信度系數(shù)來表示,信服系數(shù)就是相關(guān)系數(shù),相關(guān)系數(shù)受樣本團體得分分布、樣本是否異質(zhì)及樣本團體平均能力水平的影響。1...樣本團體分?jǐn)?shù)分布的影響:任何相關(guān)關(guān)系都是受到團體中分?jǐn)?shù)分布的影響,當(dāng)分布范圍增大時,其信度估計就較高;當(dāng)分布范圍減小時,相關(guān)系數(shù)隨之下降,信度值則較低。2...樣本團體異質(zhì)性的影響:若獲得信度的取樣團體較為異質(zhì)的話,往往會高估測驗的信度,相反則會低估測驗的信度。3…樣本團體平均能力水平的影響:對于不同水平的團體,題目具有不同的難度,每個題目在難度上的微小差異累計起來便會影響信度。2..測驗的長度:在一個測驗中增加同質(zhì)的題目,可以使信度提高。1...測驗越長,測驗的測題取樣或內(nèi)容取樣越有代表性;2...測驗越長,被試的猜測因素影響越小。3..測驗的難度:難度對信度的影響只存在于某些測驗中,如智力測驗、成就測驗、能力傾向測驗等。1...如果一個測驗對某團體而言太容易,會使所得分?jǐn)?shù)都集中在高分端;當(dāng)題目太困難時,得分就會集中在低分端。2...兩種情況均會使信度樣本的分?jǐn)?shù)范圍變窄,從而使測驗變得不夠可靠。從理論上說,只有難度水平為50%時,才能使測驗分?jǐn)?shù)分布范圍最大,求得的信度也最高。4..測驗的時間間隔:以再測法或復(fù)本法求信度,兩次測驗相隔時間越短,其信度系數(shù)越大;間隔時間越久,其它變因介入的可能性越大,受外界的影響越大,信度系數(shù)便越低。第4節(jié):信度的特殊問題:p64第四章測驗的效度第1節(jié):效度的概念:p691.效度:是指所測量的與所要測量的心理特點之間符合的程度,或者簡單地說是指一個心理測驗的準(zhǔn)確性。效度是科學(xué)測量工具最重要的必備條件。由于有效方差是一個理論值,無法測量,所以效度和信度一樣是一個理論上的概念。2.信度和效度的關(guān)系:1..信度是效度的必要而非充分條件:從方差分配公式:S2X=S2V+S2I+S2E可以看出,S2V增大,即效度高,信度的真方差(S2V+S2I)必然大,故信度必然高。當(dāng)信度高時,即S2E降低時,S2V是否增加還要看S2I是否增減,因此效度不一定就高。效度高必然信度高,而信度高并不一定保證效度高,說明信度高只是效度高的必然條件,并不是效度高的充分條件。2..效度是受信度制約的:信度系數(shù)的平方根是效度系數(shù)的最高限度,可見,一個測驗的效度總是受它的信度所制約。3.效度的性質(zhì):1..效度具有相對性:在評鑒測驗的效度時,必須考慮其目的與功能。只有所測的結(jié)果符合該測驗的目,才能認(rèn)為它是個有效的測量工具。2..效度具有連續(xù)性。測驗效度通常用相關(guān)系數(shù)表示,它只有程度上的不同,而沒有“全有”或“全無”的區(qū)別。因此,我們評價一個測驗時,不應(yīng)該說“有效”或“無效”,而應(yīng)該用效度較高或效度較低來評價。第2節(jié):效度的類型與估計方法:p724.效度分為三類:內(nèi)容效度、構(gòu)想效度、效標(biāo)效度5.內(nèi)容效度:指的是測驗題目對有關(guān)內(nèi)容或行為取樣的適用性,從而確定測驗是否是所欲測量的行為領(lǐng)域的代表性取樣。a.想編制有較高內(nèi)容效度的心理測驗:1..要對所測量的心理特性有個明確的概念,并劃定出哪些行為與這心理特性有關(guān),又比較密切。2..測驗題目應(yīng)是所界定的內(nèi)容范圍的代表性取樣。需要說明的是,要求內(nèi)容效度的測驗,并不一定要求測驗為同質(zhì)的。b.內(nèi)容效度的評估方法:1..專家判斷法:為了確定一個測驗是否有內(nèi)容效度,最常用的方法是請有關(guān)專家對測驗題目與原定內(nèi)容的符合性作出判斷,看測驗的題目是否代表規(guī)定的內(nèi)容。如果專家認(rèn)為測驗題目代表了所測內(nèi)容,測驗就是有內(nèi)容效度。由于這種估計效度的方法,是一個邏輯分析的過程,所以內(nèi)容效度有時也可稱為“邏輯效度”。2..統(tǒng)計分析法:計算兩個評分者之間評定的一致性,雖然考察的是評分者的判斷信度,但由于來自兩個獨立的評判者,因此符合程度越高越能反映測驗的內(nèi)容效度??藗惏秃仗岢?,內(nèi)容效度可由一組被試在獨立取得自同樣內(nèi)容范圍的兩個測驗復(fù)本上得分之相關(guān)來作數(shù)量的估計。再測法也可用于內(nèi)容效度的評估。3..經(jīng)驗推測法:通過實踐來檢驗效度。如果通過率是隨著年齡的增加而增加,就可以推測該測驗有內(nèi)容效度。c.內(nèi)容效度與表面效度的關(guān)系:經(jīng)常混淆。1..表面效度:是由外行對測驗作表面上的檢查確定的,它不反映測驗實際測量的東西,只是指測驗表面上看來好像是所要測的東西;只考慮題目與測量目的之間的明顯的、直接的關(guān)系;2..內(nèi)容效度:是由夠資格的判斷者(專家)詳盡地、系統(tǒng)地對測驗作評價建立的??紤]到題目與測量目的和內(nèi)容總體之間邏輯的微妙關(guān)系。3..雖然二者都是根據(jù)測驗內(nèi)容作出的主觀判斷,但判斷的標(biāo)準(zhǔn)不同。4..在編制測驗時:表面效度是一個必須考慮的特性,最高作為的測驗通常要求有較高的表面效度;典型行為測驗要求有較低的表面效度。如果被試很容易從測驗題目看出測驗的目的,就可能產(chǎn)生反應(yīng)偏差(如掩飾等)。6.構(gòu)想效度:構(gòu)想效度:1954年提出,有人翻譯為構(gòu)思效度,也有叫結(jié)構(gòu)效度。它是指測驗?zāi)軌驕y量到理論上的構(gòu)想和特質(zhì)的程度,即測驗的結(jié)果是否能證實或解釋某一理論的假設(shè)、術(shù)語或構(gòu)想,解釋的程度如何。a.構(gòu)想效度的估計方法:1..對測驗本身的分析:測驗的內(nèi)容效度可以作為構(gòu)思效度的證據(jù);測驗的同質(zhì)性指標(biāo)可以推斷測驗是測量單一特質(zhì)還是測量多種特質(zhì),從而為評估測驗構(gòu)思效度提供證據(jù);分析被試對題目的反應(yīng)特點也可以作為構(gòu)思效度的證據(jù)。2..測驗間的相互比較:通過分析幾個測驗間的相互關(guān)系,找出其共同之處,進而推斷這些測驗測量的特質(zhì)是什么,也可以確定這些測驗的構(gòu)思效度。最簡單的是計算兩種測驗之間得分的相關(guān):其中一個測驗是待研究效度的;另一個是已有效度證據(jù)的成熟的測驗;但兩者測量的是同一種心理特質(zhì)。相容效度:兩測驗的相關(guān)系數(shù)的平方即是兩組測驗分?jǐn)?shù)所共同解釋的變異大小,所以稱這一相關(guān)為相容效度,相容效度是構(gòu)思效度的一個證據(jù)。區(qū)分效度:是構(gòu)思效度的又一個證據(jù)。因素分析法:也是建立構(gòu)思效度的常用方法,通過對一組測驗進行因素分析,可以找到影響測驗分?jǐn)?shù)的共同因素,這種因素可能就是我們要測量的心理特質(zhì)(構(gòu)思)。3..效標(biāo)效度的研究證明:一個測驗若效標(biāo)度理想,那么該測驗所預(yù)測的效標(biāo)的性質(zhì)和種類就可以作為分析測驗構(gòu)思效度的指標(biāo);另一種證實構(gòu)思效度的方法是心理特質(zhì)的發(fā)展變化。4..實驗法和觀察法證實:觀察實驗前和實驗后分?jǐn)?shù)的差異是驗證構(gòu)思效度的方法。7.效標(biāo)效度:又稱實證效度,反映的是測驗預(yù)測個體在某種情境下行為表現(xiàn)的有效性程度。被預(yù)測的行為是檢驗效度的標(biāo)準(zhǔn),簡稱效標(biāo)。由于這種效度是看測驗對效標(biāo)預(yù)測如何,所以叫效標(biāo)效度。這種效度需在實踐中檢驗,所以又稱為實證效標(biāo)。a.分類:根據(jù)效標(biāo)資料是否與測驗分?jǐn)?shù)同時獲得,又可分為同時效度和預(yù)測效度兩類。1..同時效度:即測驗所得分?jǐn)?shù)可與效標(biāo)同時驗證,通常與心理特征的評估及診斷有關(guān)。2..預(yù)測效度:的效標(biāo)資料需要一段時間才可搜集到,通常用于選拔、分組。3..因為效標(biāo)資料在考試以后相隔一段時間才能獲得,所以高考的效標(biāo)是一種預(yù)測效標(biāo)。同時效標(biāo)和預(yù)測效標(biāo)意義上的差異,不是來源于時間,而是來自測驗的目的。前者與用來診斷現(xiàn)狀的測驗有關(guān),后者與預(yù)測將來結(jié)果的測驗有關(guān)。b.一個好的效標(biāo)必須具備以下條件:1..必須能最有效地反映測驗的目標(biāo),即效標(biāo)測量本身必須有效;2..效標(biāo)必須具有較高的信度,穩(wěn)定可靠,不隨時間等因素變化;3..效標(biāo)可以客觀地加以測量,可用數(shù)據(jù)或等級來表示;4..效標(biāo)的測量的方法很簡單,省時省力,經(jīng)濟實用。c.效標(biāo)和效標(biāo)測量:效標(biāo),即衡量測驗有效性的參照標(biāo)準(zhǔn),指的是可以直接而且獨立測量的我們感興趣的行為。我們感興趣的行為,就是要預(yù)測的行為,這是一個總的觀念,故必須以可操作的測量來確定才有實際意義。因此有必要把效標(biāo)細(xì)分為兩個層次,其一是理論水平的“觀念效標(biāo)”;其二是操作定義水平的“效標(biāo)測量”。一個好的效標(biāo)測量必須具備:有效性、可靠性、客觀性、實用性。d.常用的效標(biāo)包括:1..學(xué)業(yè)成就:如在校成績、學(xué)歷、有關(guān)的獎勵和榮譽、教師對學(xué)生智力的評定等,常作為智力測驗的效標(biāo),也可作為某些多重能力傾向測驗和人格測驗的效標(biāo)。2..實際工作表現(xiàn):是最滿意的效標(biāo)測量,為一般智力測驗、人格測驗和一些能力傾向測驗的效標(biāo);3..特殊訓(xùn)練成績4..精神病診斷;5..等級評定:是觀察者根據(jù)測驗欲測量的心理特質(zhì)在被試身上的表現(xiàn)而作出的一種個人判斷;6..效標(biāo)團體的比較:即找出兩個在效標(biāo)表現(xiàn)上有差別的團體,比較他們在測驗分?jǐn)?shù)上的差別;7..先前有效的測驗:一個新測驗與先前有效的測驗的相關(guān)也經(jīng)常作為效度檢驗的證據(jù)。第3節(jié):效度的表示方法及應(yīng)用:p828.效度的表示方法1..相關(guān)法:效度系數(shù)是最常用的效度指標(biāo),尤其是效標(biāo)效度。它是以皮爾遜積差相關(guān)系數(shù)來表示的,主要反映測驗分?jǐn)?shù)與效標(biāo)測量的相關(guān)。當(dāng)測驗成績是連續(xù)變量,而效標(biāo)資料是二分變量時,計算效度系數(shù)可用點二列相關(guān)公式或二列相關(guān)公式;當(dāng)測驗分?jǐn)?shù)為連續(xù)變量,效標(biāo)資料為等級評定時,可用賈斯朋多系列相關(guān)公式計算。2..區(qū)分法:是檢驗測驗分?jǐn)?shù)能否有效地區(qū)分由效標(biāo)所定義的團體的一種方法。算出t值后,便可知道分?jǐn)?shù)的差異是否顯著。若差異顯著,說明該測驗?zāi)軌蛴行У貐^(qū)分由效標(biāo)定義的團體,否則,測驗是無效的。重疊百分比可以通過計算每一組內(nèi)得分超過(或低于)另一組平均數(shù)的人數(shù)百分比得出;另外,還可以計算兩組分布的共同區(qū)的百分比。重疊量越大,說明兩組分?jǐn)?shù)差異越小,即測驗的效度越差。3..命中率法:是當(dāng)測驗用來做取舍的依據(jù)時,用其正確決定的比例作為效度指標(biāo)的一種方法。命中率的計算有兩種方法,一是計算總命中率;另一種是計算正命中率。4..預(yù)期表法:是一種雙向表格,預(yù)測分?jǐn)?shù)排在表的左邊,效標(biāo)排在表的頂端。從左下至右上對角線上各百分?jǐn)?shù)字越大,而其它的百分?jǐn)?shù)字越小,表示測驗的效標(biāo)效度越高;反之,數(shù)字越分散,則效度越低。9.效度的應(yīng)用:1..預(yù)測誤差:效度系數(shù)的平方,統(tǒng)計學(xué)上稱這種指標(biāo)為決定系數(shù),表示測驗正確預(yù)測或解釋的效標(biāo)的方差占總方差的比例。例如:當(dāng)某測驗的效度系數(shù)為0.80時,我們說效標(biāo)分?jǐn)?shù)中有64%的方差是測驗分?jǐn)?shù)的方差,即測驗分?jǐn)?shù)正確預(yù)測的比例是64%,其余的36%是無法確定預(yù)測的比例。另一種表達(dá)方式是估計的標(biāo)準(zhǔn)誤,簡寫為Sest,它是指所有具有某一測驗分?jǐn)?shù)的被試其效標(biāo)分?jǐn)?shù)(Y)分布的標(biāo)準(zhǔn)差,也即預(yù)測誤差大小的估計值,,估計的標(biāo)注誤可如同其他標(biāo)準(zhǔn)誤一樣解釋。真正效標(biāo)分?jǐn)?shù)落在預(yù)測效標(biāo)分?jǐn)?shù)±1Sest的范圍內(nèi),有68%的可能性;落在預(yù)測效標(biāo)分?jǐn)?shù)±1.96Sest的范圍內(nèi),有95%的可能性;落在預(yù)測效標(biāo)分?jǐn)?shù)±2.58Sest的范圍內(nèi),有99%的可能性。2..預(yù)測效標(biāo)分?jǐn)?shù):如果X與Y兩變量呈直線相關(guān),只要確定出二者間的回歸方程,就可以從一個變量推估出來另一個變量。在測驗工作中,人們感興趣的是從測驗分?jǐn)?shù)預(yù)測效標(biāo)成績。3..預(yù)測效標(biāo)指數(shù):公式,中的又稱作無關(guān)系數(shù),以K表示之,K值大小表明預(yù)測源分?jǐn)?shù)與效標(biāo)分?jǐn)?shù)無關(guān)的程度。(1-K)可作為預(yù)測效率的指數(shù),用E表示:E=100(1-K),E值大小表明使用測驗比盲目猜測能減少多少誤差。第4節(jié):影響效度的因素:p8810.影響效度的因素:1..測驗本身的因素:1...測驗題目的質(zhì)量:2...測驗的長度:一般而言,增加測驗的長度通??梢蕴岣邷y驗的信度,而信度又制約著效度,因此增加測驗的長度也能提高測驗的效度。2..測驗實施中的干擾因素:1...主試的影響因素:測驗實施過程中主試的因素會影響效度。對于效標(biāo)效度,測驗與效標(biāo)二者實施時間間隔時間越長,測驗與效標(biāo)越容易受到很多機遇因素的影響,因此所求的相關(guān)必然很低。測驗情鏡,如場地的布置、材料的準(zhǔn)備、測驗場所有無噪音和其他干擾因素等也會影響到測驗的效度。2...被試的影響因素:被試在測驗時的興趣、動機、情緒、態(tài)度和身心狀況、健康狀態(tài)等都會影響測驗的效度。(被試的反應(yīng)定勢也會降低測驗的效度。)3..樣本團體的性質(zhì):1…樣本團體的異質(zhì)性:與信度系數(shù)一樣,如果其它條件相同,樣本團體越同質(zhì),分?jǐn)?shù)分布范圍越小,測驗效度就越低;樣本團體越異質(zhì),分?jǐn)?shù)分布范圍越大測驗效度就越高。a.只以選拔上的被試為樣本團體參加效度研究,降低了測驗的效度。b。選拔標(biāo)準(zhǔn)太高,樣本團體的同質(zhì)性增高,降低了測驗的效度。2...干涉變量:樣本團體的性質(zhì)對效度的影響還表現(xiàn)在:對于同性質(zhì)的團體,同一測驗的效度會有很大的不同。這些樣本團體的特質(zhì)包括:年齡、性別、教育水平、智力、動機、職業(yè)和任何有關(guān)的特征。由于這寫特征的影響,使得測驗對于不同的團體具有不同的預(yù)測能力,故測量學(xué)上稱這些特征為干涉變量。3...吉賽利提出的如何找出干涉變量的一套方法:a.用回歸方程求得每個人的預(yù)測效標(biāo)分?jǐn)?shù),將該分?jǐn)?shù)與實際效標(biāo)分?jǐn)?shù)想比較,獲得差異分?jǐn)?shù)D.如果D的絕對值很大,說明測驗中可能存在干涉變量。b.根據(jù)樣本團體的組成分析,找出對照組,分別計算效度,從而象上述關(guān)于出租汽車司機的例子一樣,找出干涉變量。c.對于欲測團體,根據(jù)某些易見的干涉變量將其區(qū)分為預(yù)測性高和預(yù)測性低的兩個亞團體。對于預(yù)測性高的團體,獲得的測驗效度會有所提高。4..效標(biāo)的性質(zhì):效標(biāo)的效度是以測驗分?jǐn)?shù)與效標(biāo)測量的相關(guān)系數(shù)來表示的,因此效標(biāo)的性質(zhì)如何,在評價測驗的效標(biāo)時是值得考慮的。1...效標(biāo)與測驗分?jǐn)?shù)之間的關(guān)系是否線性關(guān)系是一個很重要的因素。皮爾遜劑差相關(guān)系數(shù)的前題是假設(shè)兩個變量的關(guān)系是線性的分布。2...效標(biāo)測量本身的可靠性如何亦是值得考慮的一個問題。第五章項目分析一般來說,測驗的項目分析包括定性分析和定量分析兩個方面。定性分析:主要是依靠測驗編制者豐富的經(jīng)驗所受的訓(xùn)練,對項目的內(nèi)容和形式是否恰當(dāng)進行分析。定量分析:主要是指對題目難度和區(qū)分度進行分析。通過項目分析,我們可以選擇和修改測驗題目,以提高測驗的信度和效度。第1節(jié):難度分析:p931.難度:是指項目的難易程度。在能力測驗中通常需要一個反映難度水平的指標(biāo),在非能力測驗(人格測驗)中,類似的指標(biāo)是“通俗性”,即取自相同總體的樣本中,能在答案方向上回答該題的人數(shù)。2.難度的指標(biāo):難度的指標(biāo)通常以通過率表示,即以答對或通過該題的人數(shù)百分比來表示?!?00%以通過率表示難度時,通過人數(shù)越多,即P值越大,難度就越低;P值越小,難度越高。因為P值大小與難度高低成反比,有人將其稱作易度。3.難度的計算:1..二分法記分的項目:心理測驗的項目大多為選擇題,通過記1分,不通過記0分。當(dāng)被試人數(shù)較多時,可根據(jù)測驗總成績將被試分為三組:分?jǐn)?shù)最高的27%被試為高分組,分?jǐn)?shù)最低的27%被試為低分組,中間46%的被試為中間組。分別計算高分組和低分組的通過率,以兩組通過率的平均值作為每一題的難度。P=P代表難度,PH和PL分別代表高分組和低分組通過率。由于選擇題允許猜測,所以通過率可能因機遇作用而變大。備選答案的數(shù)目越少,機遇的作用越大,越不能真正反映測驗的難度。為此,吉爾福特提出了一個P值校正公式:;例題:假定某題有75%的被試通過,若該題有5個備選答案,則校正后的通過率為:當(dāng)有4個備選答案時,CP=0.67;有3個,CP=0.63;有2個,CP=0.542..非二分記分的項目:如果人為地明確通過每一題的分?jǐn)?shù)線,也可以用公式P=計算難度。但此種方法的缺點在于,采用不同的分?jǐn)?shù)線會得到不同的難度值,因此不常用,對于此類題目,一般建議用下面的公式計算難度;4.難度水平的確定:1..項目難度的確定:進行難度分析的主要目的是為了篩選項目,項目的難度多高合適,取決于測驗的目的、性質(zhì)以及項目的形式。P值越接近0.5,區(qū)別力越高。為了使測驗具有更大的區(qū)別力,應(yīng)選擇難度在0.50左右的試題比較合適。但是在實際各種中并得非如此簡單。在選擇題目時,最好使試題的平均難度接近0.50,而各題難度在0.50±0.20之間。當(dāng)測驗用于選拔或診斷時,應(yīng)該比較多地選擇難度值接近錄取率的項目。對于選擇題來說,P值一般應(yīng)大于概率水平。2..測驗難度的確定:測驗的難度直接依賴于組成測驗的項目的難度。通過考察測驗分?jǐn)?shù)的分布,可以對測驗的難度做出直觀檢驗。偏態(tài)分布又有“正偏態(tài)分布”和“負(fù)偏態(tài)分布”兩種。正偏態(tài)分布得分多集中于低端,因此必須增加足夠數(shù)量的較容易的題目;負(fù)偏態(tài)分布得分集中在高分端,說明測驗過易,必須增加足夠數(shù)量的有較高難度的項目。第2節(jié):項目的區(qū)分度:p995.項目區(qū)分度的概念:也叫鑒別力,是指測驗項目對被試的心理特性的區(qū)分能力。如果一個項目,實際水平高的被試能順利通過,而實際水平低的被試不能通過,那么我們就可以認(rèn)為該項目有較高的區(qū)分度。6.項目區(qū)分度的估計方法:1..鑒別指數(shù):首先分別計算高分組與低分組在該項目上的通過率,然后用高分組在該項目上的通過率減去低分組在該項目上的通過率。項目鑒別指數(shù)與評價標(biāo)準(zhǔn)鑒別指數(shù)D項目評價0.40以上0.30~0.390.20~0.290.19以下很好良好,修改后會更佳尚可,但需修改差,必須淘汰2..相關(guān)系數(shù):計算區(qū)分度最常用的方法是相關(guān)系數(shù),即以某一項目分?jǐn)?shù)與效標(biāo)成績或測驗總分的相關(guān)作為該項目區(qū)分度的指標(biāo)。相關(guān)度越高,表明項目越具有區(qū)分的功能。1...點二列相關(guān):適用于一類變量為二分稱名變量;另一類變量為連續(xù)變量的成對變量的相關(guān)計算。2...二列相關(guān):適用于兩個連續(xù)變量,但其中一個變量被人為分成兩類。3...Φ相關(guān):適用于兩個變量均為二分稱名變量。3..區(qū)分度與難度的關(guān)系:1...假如樣本中通過某一項目的人數(shù)比率為1.00或0,說明高分組與低分組在通過率上不存在差異,因此D為0;假如項目的通過率為0.50,則可能是高分組的所有人都通過了,而低分組卻無人通過,這樣D的最大值可能達(dá)到1.00.2...為了使整個測驗項目的潛在區(qū)分度最大,似乎應(yīng)該使每個項目的難度處于0.50水平,但事實并非如此簡單。如果每一個項目的難度均處于0.50,由于項目難度相同,有可能大多趨向于有關(guān)的內(nèi)容或技能,結(jié)果造成項目同質(zhì)性提高。在極端情況下,有可能50%的被試全部通過各項目得滿分,另外50%的被試全部為0分,形成U形分布,這樣反而降低總分的區(qū)分能力。如果測驗的所有項目都是中等難度,只有項目的內(nèi)在相關(guān)為0時,整個測驗才能產(chǎn)生常態(tài)分布??紤]到一般測驗項目之間具有某種程度的相關(guān)難度的分布要廣一些,梯度多一些,是合乎需要的。第3節(jié):項目分析的特殊問題:p1067.項目特征曲線:是項目特征函數(shù)或項目反應(yīng)函數(shù)的圖解形式,它反映了被試對某一測驗項目的正確反應(yīng)概率與該項目所對應(yīng)的能力或特質(zhì)的水平之間的一種函數(shù)關(guān)系。這一方法不僅適用于項目分析,而且也適用于某些測驗量表的編制。1..項目特征曲線可圖解測驗的鑒別力,項目鑒別力的高低主要在于其曲線的傾斜度,曲線坡度越陡,鑒別能力越好,預(yù)測的誤差越小。2..項目特征曲線可以圖解項目難度。3..項目特征曲線還可以圖解選擇題的誘答反應(yīng)。第六章測驗的實施、記分及其誤差第1節(jié):測驗的實施及其誤差的控制:p1131.實施測驗的程序及其要素:1..標(biāo)準(zhǔn)化指導(dǎo)語:測驗標(biāo)準(zhǔn)化的第一步是指導(dǎo)語標(biāo)準(zhǔn)化,即在測驗實施過程中應(yīng)使用統(tǒng)一的指導(dǎo)語。指導(dǎo)語通常包括兩部分:一部分對被試的指導(dǎo)語;另一部分對主試的指導(dǎo)語。2..標(biāo)準(zhǔn)時限:時限也是測驗標(biāo)準(zhǔn)化的一項內(nèi)容。大多數(shù)典型行為測驗是不受時間限制的。例如人格測驗中被試的反應(yīng)速度就不很重要。但在最高作為測驗中,速度是需要考慮的重要因素之一。在速度測驗中,尤其要注意時間限制,不得隨意延長或縮短。測驗的時間安排,也是影響測驗結(jié)果的一個重要因素。3..測驗的環(huán)境條件:有許多研究表明,測驗環(huán)境會對測驗的結(jié)果造成影響。尤其需要強調(diào)的是,心理測驗進行之時,務(wù)必不能有外界干擾。為此,測驗室的房門上應(yīng)掛一個牌子,示意測驗正在進行,旁人不許進入。因此,對于測驗的環(huán)境條件:1...遵從測驗手冊的要求;2...下任何以外的測驗環(huán)境因素;3...測驗結(jié)果時也必須考慮這一因素。2.主試誤差及控制方法:1..測驗前的準(zhǔn)備工作:測驗前的準(zhǔn)備工作是保證測試順利進行和測驗實施標(biāo)準(zhǔn)化的必要環(huán)節(jié)。1...預(yù)告測驗:使被試對測驗有充分準(zhǔn)備。2...準(zhǔn)備測驗材料:保證良好的工作狀態(tài),避免忙中出錯。3...熟悉測驗指導(dǎo)語:這是最基本的要求,可以使被試在測試中感到放松,不緊張。4...熟悉測驗的具體程序:明確任務(wù)。2..測驗中主試的職責(zé):1...應(yīng)按照指導(dǎo)語的要求實施測驗,不帶任何暗示。2...測驗前不講太多無關(guān)的話。3...對于被試的反應(yīng),主試不應(yīng)作出點頭、皺眉、搖頭等暗示性反應(yīng);在個別施測時,主試不應(yīng)讓被試看見記分。4...對特殊問題要有心理準(zhǔn)備。3..建立協(xié)調(diào)關(guān)系:協(xié)調(diào)關(guān)系是一個專業(yè)術(shù)語,在臨床心理咨詢、心理治療中經(jīng)常用到。在心理測驗實施中,這種關(guān)系指的是主試和被試之間一種友好的、合作的、能促使被試最大限度地作好測驗的一種關(guān)系。3.被試誤差及控制方法:即使一個測驗經(jīng)過精心編制,題目取樣具有代表性,又有標(biāo)準(zhǔn)化的實施和積分程序,這種誤差是最難控制的。1..被試技巧與練習(xí)效應(yīng):被試對測驗的經(jīng)驗或應(yīng)試技巧會影響測驗成績,對測驗的程序和技能熟悉程度不同,所得分?jǐn)?shù)便不能直接比較。任何一個涉及認(rèn)知功能的成績,在第二次應(yīng)用或重復(fù)測量時,都會有練習(xí)效應(yīng)而使測驗成績提高。要控制應(yīng)試技巧和練習(xí)效應(yīng)的影響,可盡量設(shè)法使每個被試對測驗材料的步驟和所需技巧有相同的熟悉程度。2..被試的動機與焦慮因素:1...被試參加測驗的動機不同,會影響其回答問題的態(tài)度、注意力、持久性以及反應(yīng)速度等,從而影響測驗的成績;在成就、智力和能力傾向等變量時,只有被試動機強力才可能盡力回答,取得好成績。動機效應(yīng)在測量態(tài)度、興趣及人格等典型行為表現(xiàn)時也有影響。某些被試若欲給人以好印象,就會考慮主試的期望或社會贊許行為,而不按自己的真實情況回答,從而使測驗分?jǐn)?shù)降低。相反,為了某重動機若欲給人以壞影響,則會使測驗分?jǐn)?shù)升高。2...測驗焦慮是指被試在應(yīng)試前和測試中出現(xiàn)的一種不愉快的、表現(xiàn)為焦慮、擔(dān)心、恐懼和緊張的情緒體驗。適度的焦慮會使人興奮型提高,注意力增強,提高反應(yīng)速度,提高智力測驗、成就測驗和能力傾向測驗的成績。測驗焦慮會受到下列因素影響:a.能力高的人,測驗焦慮一般較低,而對自己能力沒有把握的人,測驗焦慮較高;b.抱負(fù)水平過高,求勝心切,測驗焦慮較高;c.具有某種人格特點,如缺乏自信、患得患失、情緒不穩(wěn)定的人易產(chǎn)生測驗焦慮;d.測驗成績與被試的關(guān)系重大,或被試受到的壓力過大,容易使其產(chǎn)生測驗焦慮;e.經(jīng)常接受測驗的人焦慮較低,而對測驗程序不熟悉,尤其是測驗中采取了新的題目形式或?qū)嵤┏淌綍黾訙y驗焦慮。通過教學(xué)或輔導(dǎo)可以降低測驗焦慮,而熟悉測驗程序也是降低焦慮的有效方法。3..反應(yīng)定勢:亦稱反應(yīng)風(fēng)格,是指獨立于測驗內(nèi)容的反應(yīng)傾向,即由于每個人回答問題的習(xí)慣不同,而使能力相同的被試得到不同的測驗分?jǐn)?shù)。幾種常見的反應(yīng)定勢是:1...求快與求精確的反應(yīng)定勢:一般來講,如果測驗有時間限制,或測驗本身屬于速度測驗,則求精確的反應(yīng)定勢必然降低測驗的成績;如果純粹是難度測驗,則求快的反應(yīng)定勢必然降低測驗成績。2...喜好正面敘述的反應(yīng)定勢:大量研究發(fā)現(xiàn),被試在無法確定“是非題”的正確答案時,選擇“是”的人往往多于選“否”的人,或者說選“是”的人多于實際上應(yīng)該選“是”的人。3...喜好特殊位置的反應(yīng)定勢:如果被試在測試中完全不知道答案,并不會按照隨機的方法選擇答案,而是偏好某一位置進行選取。4…喜好較長選項的反應(yīng)定勢:有些被試認(rèn)為,選項比較長的,內(nèi)容多的,一般是正確答案,在無法確定答案時,有偏好長選項的反應(yīng)定勢。5…猜測的反應(yīng)定勢:如果不對猜測進行修正的話,那么敢于猜的的被試比謹(jǐn)慎的被試更容易的高分。4.測驗中的社會心理學(xué)問題:1..被試對主試的的需要:1...現(xiàn)實需要;2...受人尊重與自尊需要;3...自我表現(xiàn)的需要;4...對主試權(quán)威性的需要;5...特殊需要;2..主試本身的特點:1...主試的特點:2...主試的動機:3...主試的期望:羅森塔爾效應(yīng),實驗者所獲得的資料受其本身期望的影響。第2節(jié):測驗的記分及其誤差的校正:1245.對測驗編制者而言:記分標(biāo)準(zhǔn)化應(yīng)該包括選擇和設(shè)計合式的標(biāo)準(zhǔn)化記分程序,考慮分?jǐn)?shù)的分配、權(quán)數(shù)的分配、猜測的處理以及分?jǐn)?shù)是由原始分?jǐn)?shù)表示還是轉(zhuǎn)化成其他形式。對測驗使用者而言:記分標(biāo)準(zhǔn)化則是要求完全按照測驗手冊的規(guī)定和標(biāo)準(zhǔn)答案給予被試分?jǐn)?shù),有時還可以完全依據(jù)套板或計算機記分。6.記分的基本步驟和要求:@首先是要獲得原始分?jǐn)?shù),其要求是:1..記錄被試反應(yīng):2..參考標(biāo)準(zhǔn)答案:主試應(yīng)當(dāng)熟悉掌握記分鍵,特別是非客觀題的記分要求,不得隨意記分。3..計算最后得分并轉(zhuǎn)換原始分?jǐn)?shù):把所有分?jǐn)?shù)匯總,計算出原始分?jǐn)?shù)的總分。@其次是轉(zhuǎn)換原始分?jǐn)?shù),其意義和方法是:1..在心理測量中,一般原始分?jǐn)?shù)本身很少有意義,只有將原始分?jǐn)?shù)進行適當(dāng)?shù)霓D(zhuǎn)換處理或與參照標(biāo)準(zhǔn)加以對照,即把原始分?jǐn)?shù)轉(zhuǎn)換為導(dǎo)出分?jǐn)?shù),測驗分?jǐn)?shù)才有意義。測驗編制者提供的常模表就是原始分?jǐn)?shù)的轉(zhuǎn)換表,它為測驗使用者提供了一種方便易行的由原始分?jǐn)?shù)向?qū)С龇謹(jǐn)?shù)轉(zhuǎn)化的方法。第七章測驗分?jǐn)?shù)的解釋對測驗分?jǐn)?shù)的解釋主要包括兩個方面的問題:1..如何使分?jǐn)?shù)具有意義,即我們必須合理的制度測驗量表以實現(xiàn)測驗結(jié)果的數(shù)量化。又能為不同的測驗導(dǎo)出可比較的量表;2..如果將有意義的信息傳達(dá)給當(dāng)事人,即把測驗分?jǐn)?shù)與常規(guī)比較,依照出個人在測驗量表上的相對等級,從而對個人測驗作業(yè)進行解釋。第1節(jié):參照常模的分?jǐn)?shù)解釋:p1311.常模的團體和常模樣本1..常模團體的性質(zhì):常模團體是由具有某種共同特征的人所組成的一個群體,或者是該群體的一個樣本。它用一個標(biāo)準(zhǔn)的、規(guī)范的分?jǐn)?shù)表示出來,以提供比較的基礎(chǔ)。1...對編制者而言:常模的選擇主要是基于對測驗將要施測的總體的認(rèn)識,常模團體必須能夠代表該總體。這種工作包括:確定一般總體、確定目標(biāo)總體、確定樣本。2...對測驗使用者:要考慮的問題是,現(xiàn)有的常模團體哪一個最合適。2..常模團體的條件:1...群體的構(gòu)成必須明確界定:在制定常模時,必須清楚地說明所要測量的群體的性質(zhì)與特征。依據(jù)不同的變量確定群體,便可得到不同的常規(guī)。2...常模團體必須是所測群體的代表性樣本:在搜集常模資料時,一般采用隨機取樣或分層取樣的方法,有時可以把兩種策略結(jié)合起來使用。3...樣本的大小要適當(dāng):總體數(shù)目小,只有幾十個人,需要100%的樣本;如果總體數(shù)目達(dá),相應(yīng)的樣本也大,一般最低不小于30或100個;全國性常模,一般應(yīng)有2000-3000人為宜。樣本大小適當(dāng)?shù)年P(guān)鍵是樣本要有代表性,從一個較小的但具有代表性的樣本所獲得的分?jǐn)?shù)通常比來自較大的但定義模糊的團體的一組分?jǐn)?shù)還要好。4...標(biāo)準(zhǔn)化樣組是一定時空的產(chǎn)物:我們在一定時間和空間中抽取的標(biāo)準(zhǔn)化樣組,它只能反映當(dāng)時當(dāng)?shù)氐那闆r。在選擇合適常模時,注意選擇較為新近的常模。3..取樣:從目標(biāo)人群中選擇有代表性的樣本。從統(tǒng)計學(xué)看取樣分為:隨機抽樣和非隨機抽樣。具體方法:1...簡單隨機抽樣:按照隨即表順序選擇被試構(gòu)成樣本,或者將抽樣范圍內(nèi)的每個人或者每個抽樣單位編號,再隨即選擇,可以避免由于標(biāo)記、姓名、性別或其它社會贊許性偏見而造成抽樣誤差。2...系統(tǒng)抽樣:有時在總體數(shù)目為N的情況下,若要選擇K分之一的被試作為樣本,則可以在抽樣范圍內(nèi)選擇每個第K個人來構(gòu)成樣本。3...分組抽樣:有時總體數(shù)目較大,無法進行編號,而且群體又有多樣性,這時可以先將群體進行分組,再在組內(nèi)進行隨機取樣。4...分層抽樣:在確定常模時,最常用的是分層抽樣方法。a.分層比例抽樣:b.分層非比例抽樣:4..常模分?jǐn)?shù)和常模:1...常模分?jǐn)?shù):就是施測常模樣本被試后,將被試者的原始分?jǐn)?shù)按一定規(guī)則轉(zhuǎn)換出來的導(dǎo)出分?jǐn)?shù)。2...常模分?jǐn)?shù)構(gòu)成的分布,就是通常所說的常模,它是解釋心理測驗分?jǐn)?shù)的基礎(chǔ)。常模一般有:一般常模與特殊常模之分。一般常模:測驗手冊上所列的常模通常為一般常模,不一定適合使用者的具體情況;特殊常模:是為非典型團體建立的,一般比為小團體建立的常模范圍更窄。優(yōu)點:可使被試的結(jié)果與最接近的人進行比較缺點:不容許分?jǐn)?shù)在較廣范圍內(nèi)作解釋,測驗使用者可將特殊常模與一般常模結(jié)合起來。2.常模的類型及解釋:Ⅰ.發(fā)展常模:人的許多心理特質(zhì)如智力、技能等,是隨著時間以有規(guī)律的方式發(fā)展的,所以可將個人的成績與各種發(fā)展水平的人的平均表現(xiàn)相比較。根據(jù)這種平均表現(xiàn)所制成的量表就是發(fā)展常模,亦稱年齡量表。1..發(fā)展順序量表:因為它告訴人民多大的兒童具備什么能力或行為就表明其發(fā)育正常,相應(yīng)能力或行為早于某年齡出現(xiàn),說明發(fā)育超前,否則即為發(fā)育滯后。最早的一個范例是格塞爾發(fā)展程序表,其中按月份顯示兒童在運動水平、適應(yīng)性、語言、社會性四個方面的大致發(fā)展水平。2..智力年齡:比內(nèi)-西蒙量表中首先使用智力年齡的概念。智齡是年齡量表上度量智力的單位。求智齡分方法很簡單,只要將兒童在測驗上的分?jǐn)?shù)與各年齡組的一般兒童比較,便可給予一個年齡分?jǐn)?shù)。1...如吳天敏修訂的比內(nèi)-西蒙量表中,每個年齡都有6個測題,答對每題則得智齡2個月。假如某兒童6歲組的題目全部通過,7歲組通過4題,8歲組通過3題,9歲組通過2題,其智力年齡的計算為:6(歲)+4×2(月)+3×2(月)+2×2(月)=6歲+18月=7歲6個月。2...智力年齡:如果為每個年齡水平都編制一些適當(dāng)?shù)念}目,便可得到一個評價兒童智力發(fā)展水平的年齡量表。一個兒童在年齡量表上所得的分?jǐn)?shù),就是最能代表他的智力水平的年齡。這種分?jǐn)?shù)叫做智力年齡,簡稱智齡。3...另外一種使用年齡量表的方法是不把題目分到各年齡組。首先根據(jù)被試在整個測驗中正確反應(yīng)的題數(shù)或反應(yīng)時間而得一原始分?jǐn)?shù),而將標(biāo)準(zhǔn)化樣本中每個年齡組的平均原始分?jǐn)?shù)作為年齡常模。通過將原始分?jǐn)?shù)與年齡常模對比,便可求得每個人的智齡。例如某個兒童的原始分?jǐn)?shù)等于8歲組的平均數(shù),則其智力年齡就是8歲。4...一個人的智齡并不一定和他的實齡相符,聰明的兒童,其智齡高于實齡;愚笨的兒童,其智齡低于實齡;只有普通兒童,其智齡與實際年齡相近似。3..年級當(dāng)量:實際上就是年級量表,測驗結(jié)果說明被試屬哪一年級的水平,在教育成就測驗中最常用。年紀(jì)量表的單位通常為10個月間隔。Ⅱ.百分位常模及解釋:百分位常模包括百分等級和百分點、四分位數(shù)和十分位數(shù)。1..百分等級:是應(yīng)用最廣的表示測驗分?jǐn)?shù)的方法。一個測驗分?jǐn)?shù)的百分等級是指在常模樣本中低于這個分?jǐn)?shù)的人的百分比。其計算分為:未分組資料的百分等級計算;分組資料的百分等級求法。2..百分點:也稱百分位數(shù),與百分等級的計算方法正好相反,百分等級是計算低于某測驗分?jǐn)?shù)的人數(shù)百分比,而百分點則是計算處于某一百分比例的人對應(yīng)的測驗分?jǐn)?shù)是多少。百分點的計算可根據(jù)直線內(nèi)插法進行。在實際應(yīng)用中,我們一般既可以由原始分?jǐn)?shù)計算百分等級,又可以由百分等級確定原始分?jǐn)?shù)。通過這樣的雙向方式編制的原始分?jǐn)?shù)與百分等級對照表,就是百分位常模。3..四分位數(shù)和十分位數(shù):此二者是百分位數(shù)的兩個變式,其含義相似。Ⅲ.標(biāo)準(zhǔn)分常模及解釋:1..標(biāo)準(zhǔn)分常模:標(biāo)準(zhǔn)分?jǐn)?shù)是將原始分?jǐn)?shù)與平均分?jǐn)?shù)的距離以標(biāo)準(zhǔn)差為單位表示出來的量表。它的基本單位是標(biāo)準(zhǔn)差。常見的標(biāo)準(zhǔn)分?jǐn)?shù)有:z分?jǐn)?shù)、Z分?jǐn)?shù)、T分?jǐn)?shù)、標(biāo)準(zhǔn)分?jǐn)?shù)、離差智商(IQ)2..線性轉(zhuǎn)換的標(biāo)準(zhǔn)分?jǐn)?shù):z分?jǐn)?shù)為最典型的線性轉(zhuǎn)換的標(biāo)準(zhǔn)分?jǐn)?shù)。3..非線性轉(zhuǎn)換的標(biāo)準(zhǔn)分?jǐn)?shù):當(dāng)原始分?jǐn)?shù)不是常態(tài)分布時,也可以使之常態(tài)化,這一轉(zhuǎn)化過程就是非線性的。與線性導(dǎo)出分?jǐn)?shù)一樣,常態(tài)化標(biāo)準(zhǔn)分?jǐn)?shù)也可以被轉(zhuǎn)化成任何方便的形式。當(dāng)以50為平均數(shù)(即加上一個常數(shù)50),以10為標(biāo)準(zhǔn)差(乘以一個常數(shù)10)來表示時,通常叫做T分?jǐn)?shù)。1...T分?jǐn)?shù):T=50+10z`;這一概念最早由麥克爾于1939年提出,含有紀(jì)念推孟和桑代克二氏。2...標(biāo)準(zhǔn)九分:是另一較知名的標(biāo)準(zhǔn)分?jǐn)?shù)系統(tǒng),其量表是個9級的分?jǐn)?shù)量表,它是以5為平均數(shù),以2為標(biāo)準(zhǔn)差的一個分?jǐn)?shù)量表。3...常態(tài)化的標(biāo)準(zhǔn)分?jǐn)?shù)還有標(biāo)準(zhǔn)十分:平均數(shù)5,標(biāo)準(zhǔn)差1.5;標(biāo)準(zhǔn)二十分:平均數(shù)10,標(biāo)準(zhǔn)差3;3.智商及其意義:1..比率智商:比內(nèi)-西蒙量表傳入美國后,斯坦福大學(xué)推孟教授于1916年對其修訂而成斯坦福-比內(nèi)量表。它在心理年齡的基礎(chǔ)上,以智商表示測驗結(jié)果,即以后所說的比率智商。2..比率智商定義:心理年齡(MA)與實足年齡(CA)之比,將商數(shù)乘以100,即IQ=MA/CAх1003..比率智商提出后,普遍被心理學(xué)界和醫(yī)學(xué)界所接受。但由于個體智力增長是一個由快到慢再到停止的過程,即心理年齡與實足年齡并不同步增長,所以比率智商并不適合于年齡較大的被試;另外,由于不同年齡組兒童的比率智商分布的情況是不一樣的,因而相同的比率智商分?jǐn)?shù)在不同年齡就具有不同意義?;谶@種考慮,心理學(xué)家韋克斯樂提出了離差智商的概念。4..離差智商:是一種以年齡組為樣本計算而得的標(biāo)準(zhǔn)分?jǐn)?shù),為使其與傳統(tǒng)的比率智商基本一致,韋克斯勒將離差智商的平均數(shù)定為100,標(biāo)準(zhǔn)差定為15.所以離差智商建立在統(tǒng)計學(xué)的基礎(chǔ)之上,它表示的是個體智力在年齡組中所處的位置,因而是表示智力高低的一種理想的指標(biāo)。由于離差智商的提出,過去曾使用比率智商的許多測驗在后來也使用了離差智商,如在1960年修訂的斯一比測驗中,就使用的是平均數(shù)為100,標(biāo)準(zhǔn)差為16的標(biāo)準(zhǔn)分?jǐn)?shù)量表。必須指出,從不同測驗獲得的離差智商只有當(dāng)標(biāo)準(zhǔn)差相同或接近時才可以比較,標(biāo)準(zhǔn)差不同,其分?jǐn)?shù)的意義便不同。5..百分位與標(biāo)準(zhǔn)分?jǐn)?shù)的共同之處:將被試的分?jǐn)?shù)在團體內(nèi)做橫向比較,而發(fā)展量表卻是與不同發(fā)展水平的人做縱向比較。4.常模分?jǐn)?shù)的表示方法:轉(zhuǎn)換表和剖析圖。1..轉(zhuǎn)換表:有時也稱常模表,它是最簡單而且最基本的表示常模的方法。2..剖析圖:第2節(jié):參照效標(biāo)的分?jǐn)?shù)解釋:p1525.內(nèi)容參照分?jǐn)?shù):在效標(biāo)參照測驗中,一種標(biāo)準(zhǔn)是對測驗所包括的材料熟練或掌握的程度,將分?jǐn)?shù)與此種標(biāo)準(zhǔn)比較可以搞清一個人知道什么和能做什么。因為涉及的主要是測驗的內(nèi)容,所以可以把這種分?jǐn)?shù)叫做內(nèi)容參照分?jǐn)?shù)。結(jié)果參照分?jǐn)?shù):另一個比較標(biāo)準(zhǔn)是外在效標(biāo),即用預(yù)期的效標(biāo)成績來解釋測驗分?jǐn)?shù),因為涉及的是最后來的結(jié)果,所以把這種分?jǐn)?shù)叫做結(jié)果參照分?jǐn)?shù)。6.參照效標(biāo)測驗是格拉賽提出的。7.效標(biāo)參照測驗優(yōu)點:1..不象常模參照測驗?zāi)菢樱鼓芰娬唑湴磷詽M,能力差者長期遭受挫折,效標(biāo)參照測驗巧妙地避開了對得分、名次的過分糾纏,使各人都有自己的奮斗目標(biāo)和希望。2..常模參照測驗無法反映出被試的真正能力和水平,甚至對被試到底能做什么,不能做什么也不清楚。效標(biāo)參照測驗既能發(fā)現(xiàn)個人特有的長處,也會找到問題的癥結(jié)所在,而常模參照測驗就做不到。3..從常模參照測驗的得分不能得到被試在外在效標(biāo)上的表現(xiàn),效標(biāo)參照測驗則可直接作出解釋,有時測驗結(jié)果的本身可能就是效標(biāo)。4..效標(biāo)參照測驗與教師在教學(xué)過程中的自編測驗關(guān)系更為密切,因而效標(biāo)參照測驗的理論概念更易為教師接受和應(yīng)用。8.內(nèi)容參照:又叫范圍參照,主要是依據(jù)被試對某個確定的材料內(nèi)容或技能的掌握程度和熟悉程度來表示和解釋測驗結(jié)果。9.內(nèi)容參照的表示方法:掌握分?jǐn)?shù)和正確百分?jǐn)?shù)。1..掌握分?jǐn)?shù):訂出一個判別被試是否通過或掌握的最低分?jǐn)?shù),即最低掌握水平,此分?jǐn)?shù)以

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論