自考心理測量-復(fù)習(xí)材料

上傳人：帶*** IP屬地：江西上傳時間：2022-12-21 格式：DOC 頁數(shù)：39 大?。?91KB 積分：12 舉報 版權(quán)申訴

已閱讀5頁，還剩34頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認(rèn)領(lǐng)

文檔簡介

PAGEPAGE39北京自考心理學(xué)《心理測量》串講筆記心理測驗學(xué)第一章總論第1節(jié):心理測驗的歷史回顧:p11.我國始于漢代、興于隋唐的科舉取士制度，就被中外學(xué)者公認(rèn)為世界上最早的心理測驗的實踐。2.孔子：把人分為中人、中人以上、中人以下三個類別，“中人以上，可以語上也；中人以下，不可以語上也”。相當(dāng)于現(xiàn)代測量學(xué)中的命名量表和次序量表。3.孟子：“權(quán)，然后知輕重；度，然后知長短。物皆然，心為甚?！泵鞔_指出了心理能力和心理特征與物理現(xiàn)象一樣，具有可測量的特性。4.南朝人劉勰：在《新論.專學(xué)篇》，他不僅觀察到左手畫方右手畫圓不易實現(xiàn)這種現(xiàn)象，而且認(rèn)為其原因是一心不能二用，這恐怕應(yīng)該算是世界上最早的“分心測驗”了。5.南北朝的顏之推：周歲試兒，其是1925年格塞爾嬰兒發(fā)展量表的前導(dǎo)。6.七巧板：中國民間廣泛流行的“七巧板”，又稱益智圖、唐圖，為當(dāng)代多數(shù)智力測驗和創(chuàng)造力測驗所使用。在某些方面可以作為創(chuàng)造力測驗的一種方法。7.隋煬帝科舉制度的開端：被認(rèn)為是世界上最早的心理測驗的實踐。當(dāng)時的考試方法：貼經(jīng)和對偶，類似于現(xiàn)代西方言語測驗中常見的填字和類比。8.中國古代心理測驗的思想，包含著典型的東方文化特點：1..他們都是描述性的，沒有定量的標(biāo)準(zhǔn)；2..心理測驗往往將心理特點（能力、人格、智力等）與道德觀念聯(lián)系起來（局限性）；9.科學(xué)心理測驗產(chǎn)生的原因：1..對智力落后者分類和訓(xùn)練的早期關(guān)注：a．心理測驗產(chǎn)生的最初原因是對智力落后和精神病人治療的需要。b．法國醫(yī)生埃斯克羅：1838年出版了兩卷本著作，第一次明確地對智力落后與精神病人作出了區(qū)分，他認(rèn)為精神病是以情緒障礙為標(biāo)志。c．另一位法國醫(yī)生塞國恩的貢獻(xiàn)也特別重要，他是訓(xùn)練智力落后者的先驅(qū)。2..馮特的實驗心理學(xué)：實驗心理學(xué)的誕生是心理測驗產(chǎn)生的另一個重要原因。a．1879年馮特在德國萊比錫大學(xué)建立了心理學(xué)史上第一個實驗室，許多早期試驗心理學(xué)家都在這里接受訓(xùn)練。引發(fā)了個別差異的研究。b．實驗心理學(xué)的誕生和發(fā)展，還給心理測驗帶來了另一個副產(chǎn)品：嚴(yán)格的標(biāo)準(zhǔn)化程序。10.高爾頓：1..英國生物學(xué)家和心理學(xué)家高爾頓是倡導(dǎo)測驗運動的主要人物。2..他設(shè)計了測量差異的方法，雖不是正式的心理測驗，但可視為心理測驗的開端。3..1884年，在倫敦國際博覽會上，高爾頓專門設(shè)立了一個“人類測量實驗室”。這是心理實驗史上第一次大規(guī)模系統(tǒng)地測量個別差異的嘗試。4..他還是評定量表和問卷法應(yīng)用的先驅(qū)；他也經(jīng)常用自由聯(lián)想技術(shù)。5..他的另一個重要貢獻(xiàn)是為心理測驗奠定了統(tǒng)計學(xué)基礎(chǔ)，并第一個提出了相關(guān)的概念。11.卡特爾：美國心理學(xué)家，從師馮特。1890年，卡特爾在《心理》雜志上發(fā)表“心理測驗與測量”；這是心理測驗第一次出現(xiàn)于心理學(xué)文獻(xiàn)中。12.斯皮爾曼：1904年，英國心理學(xué)家斯皮爾曼發(fā)表了他著名的論文“普通能力”此文奠定了他的智力結(jié)構(gòu)二因素論的理論基礎(chǔ)，為日后比內(nèi)智力測驗的編制提供了基礎(chǔ)。13.世界上第一個智力測驗：1..比內(nèi)：比內(nèi)于1857年出生于法國尼斯，起初學(xué)習(xí)法律，繼而改學(xué)醫(yī)學(xué)，以后致力于心理測驗的研究。1904年法國教育部委派許多教育家、醫(yī)學(xué)家和其他科學(xué)家組成一個委員會，專門研究公立學(xué)校中智力落后兒童的教育方法。比內(nèi)在1911年去世。2..比內(nèi)與助手西蒙1905年在《心理學(xué)年報》上發(fā)表了一篇文章，題為：“診斷異常兒童智力的新方法”，文章中他中介紹了一個包括30個項目的量表。這個量表很粗糙，尚不能準(zhǔn)確地測量智商，但它在心理測驗史上極其重要，是世界上第一個正式的心理測驗。3..比內(nèi)－西蒙量表自1905年發(fā)表后，比內(nèi)和西蒙親自主持過兩次修訂：a．在1908年修訂，1908年量表題目總數(shù)達(dá)到了59個，所有測題按年齡分組，組別從3-13歲；測驗的結(jié)果用“智力水平”表示，但其通常翻譯和提法為“智力年齡”。b．后又經(jīng)1911年修訂一次。14.心理測驗的蓬勃發(fā)展：縱觀心理測驗的發(fā)展，人們常說19世紀(jì)80年代時高爾頓的10年，90年代是卡特爾的10年，20世紀(jì)頭10年則是比內(nèi)的智力測驗的10年。1..操作測驗的發(fā)展：由于理論上的缺陷和實際上的需要，所以就有操作測驗的問世和發(fā)展。2..團體智力測驗的發(fā)展：運用團體測驗可以在同一時間內(nèi)測量許多被試，這是心理測驗方式的極大進步，擴大了測驗的應(yīng)用范圍。3..能力傾向測驗的發(fā)展：這些測驗為了分析個人心理品質(zhì)的內(nèi)部結(jié)構(gòu)提供了適用的工具，逐漸受到人們的重視。此外，普通能力傾向（智力）測驗也向多元化發(fā)展。韋克斯勒所編的學(xué)前兒童、學(xué)齡兒童、成人智力量表。4..人格測驗的發(fā)展：心理測驗的另一領(lǐng)域是涉及情感或行為等非智力方面的人格評估，通常包括對性格、氣質(zhì)、情緒狀態(tài)、人際關(guān)系、動機、興趣和態(tài)度的測量。5..現(xiàn)代西方心理學(xué)的發(fā)展：受到計算機的發(fā)生和發(fā)展，以及統(tǒng)計方法的改進的極大影響。而“因素分析”的理論從1904年斯皮爾曼提出智力二音素論開始，經(jīng)心理學(xué)家近一個世紀(jì)的爭論和研究，已日趨成熟和完善，給現(xiàn)代心理學(xué)測驗奠定了堅實的基礎(chǔ)。15.中華人民共和國成立前心理測驗的發(fā)展：1..1916年，樊炳清先生首先介紹了比內(nèi)－西蒙智力量表；2..1920年，廖世承和陳鶴琴在南京高等師范學(xué)校開設(shè)心理測驗課，并用心理測驗試測投考該校的學(xué)生，這便是中國正式開始的科學(xué)心理測驗；北京高等師范學(xué)校和南京高等師范學(xué)校建立了我國最早的兩所心理實驗式。3..1921年，廖世承和陳鶴琴正式出版《心理測驗法》一書，成為中國最早的心理測驗專著；4..1922年，中華教育改進社聘請美國教育心理測驗專家麥考爾來華講學(xué)，并主持編制心理測驗事宜；5..1924年，陸志韋發(fā)表了《訂正比內(nèi)西蒙智力測驗說明書》，30年代又與吳天敏再次做了修訂；6..1931年，由艾偉、陸志韋、陳鶴琴、蕭孝嶸等倡議，組織并成立了中國測驗學(xué)會；7..1932年，《測驗》雜志創(chuàng)刊。16.中華人民共和國成立后心理測驗的發(fā)展：1..1979年，林傳鼎、張厚粲等以國外資料為參考，編制了少年兒童學(xué)習(xí)能力測驗；2..1989年，成立中國心理學(xué)會心理測驗專業(yè)委員會，標(biāo)志著中國心理測驗進入一個新的高速發(fā)展時期。第2節(jié):心理測驗的性質(zhì)、種類和功能:p1217.測量：就是根據(jù)一定的法則，用數(shù)字對事物加以確定。一定的法則：是指測量行為發(fā)生時采用的規(guī)則或方法。事物：是指我們要測量的感興趣的事物的屬性或特征。數(shù)字：可以表示數(shù)量，也可以不表示數(shù)量。一般來說，用數(shù)字對事物加以確定，就是確定一個事物的屬性的量的多少。通常人們所說的測量，指的是給事物確定出一種數(shù)量化的價值。18.測量有兩個要素：一是參照點，二是單位。1..對任何事物確定出一個量都要有一個計算的起始點，這個點就是參照點。參照點可以分為兩種，一種是絕對的零點，另一種是相對參照點。心理測驗中所用的參照點都是相對的，因而測量的結(jié)果常常不能以“倍數(shù)”的方式解釋。2..理想的單位的條件：有明確的意義和有相等的價值。3.量表就是有參照點和單位的連續(xù)體。19.測量的量表：量表就是有參照點和單位的連續(xù)體。斯蒂文斯將量表由低到高依次為：1..命名量表：是水平最低的一種測量量表，用數(shù)字來代替事物或?qū)κ挛镞M行分類；不能進行加減乘除。2..順序量表：不僅表明類別，還能表明不通類別的大小等級，或具有某種屬性的程度；不能進行乘除運算。3..等距量表：有大小關(guān)系，又有相等的單位，因此可以加減運算，但沒有絕對零點，不能做乘除運算；4..比例量表：是最精確的測量，既有相等的單位，又有絕對零點。20.心理量表的性質(zhì)：1..一般來說，心理測量是在順序量表上進行的。因為對于人的智力、性格、氣質(zhì)、興趣、態(tài)度等來說，絕對零點時難以確定的。2..雖然心理現(xiàn)象適合在順序量表上進行測量，但大多數(shù)心理學(xué)家喜歡把測驗成績轉(zhuǎn)換為等距量表，最常用的轉(zhuǎn)換方法是轉(zhuǎn)換為標(biāo)準(zhǔn)分?jǐn)?shù)，即把順序量表轉(zhuǎn)變成以標(biāo)準(zhǔn)差為單位的等距量表。21.心理測驗：即是依據(jù)一定的心理學(xué)理論，使用一定的操作程序，給人的行為確定出一種數(shù)量化的價值。心理測驗的要素：行為樣本：心理測驗在測量個別差異的時候，往往也只是對少數(shù)經(jīng)過慎重選擇的樣本進行觀察，來間接推知被試的心理特征。標(biāo)準(zhǔn)化：是指測驗編制、實施、記分以及測驗分?jǐn)?shù)解釋程序的一致性，標(biāo)準(zhǔn)化的量一個重要步驟是建立有代表性的常模?？陀^性：心理測驗的客觀性的某些方面，總是與標(biāo)準(zhǔn)化的討論聯(lián)系在一起的，即對心理測驗的客觀性要求牽涉到標(biāo)準(zhǔn)化的問題，因此，在不受被試主觀判斷支配的范圍內(nèi)，測驗的實施、評分、解釋應(yīng)是客觀的，要盡量減少主試和被試的隨意程度?？陀^性另一個主要方面是測題或整個測驗的難度水平的確定必須客觀。22.心理測驗的性質(zhì)：1..心理測驗的間接性：迄今為止，我們還無法直接測量人的心理，只能通過測量人的外顯行為，即測量人們對測驗題目的反應(yīng)來推斷出他的心理特質(zhì)。特質(zhì)：是用來描述一組內(nèi)部相關(guān)或有內(nèi)在聯(lián)系的行為時所使用的術(shù)語，是個人對刺激作反應(yīng)的一種內(nèi)在傾向。特質(zhì)是個體特有的、穩(wěn)定的、可辨別的特征。但它又是一個抽象的產(chǎn)物，一個構(gòu)思，不是一個直接測量的有實體的個人特點。由于特質(zhì)是從行為模式中推論出來的，所以心理測驗永遠(yuǎn)是間接的。2..心理測驗的相對性：我們在比較不同人之間的行為或心理特征時，沒有絕對的標(biāo)準(zhǔn)，也沒有絕對的標(biāo)準(zhǔn)，也沒有絕對的零點，我們有的只是一個連續(xù)的行為序列。所以每一個被測得的結(jié)果，都是與他所在團體或人群的大多數(shù)人的行為，或某種人為確定的標(biāo)準(zhǔn)相比較而言的。3..心理測驗的客觀性：心理測驗標(biāo)準(zhǔn)化包括：a．測驗用的項目或作業(yè)、施測說明、施測者的言語態(tài)度及施測時的物理環(huán)境等，均經(jīng)過標(biāo)準(zhǔn)化，測驗的刺激是客觀的。b．評分計分原則和手續(xù)經(jīng)過了標(biāo)準(zhǔn)化，對反應(yīng)的量化是客觀的。c．分?jǐn)?shù)轉(zhuǎn)換和解釋經(jīng)過了標(biāo)準(zhǔn)化，對結(jié)果的推論是客觀的。23.心理測驗的種類：1..按測驗的功能分類：智力測驗：智力測驗的功能是測量人的一般智力水平。例如：比內(nèi)－西蒙智力測驗、韋克斯勒兒童和成人智力量表。特殊能力測驗：偏重測量個人特殊潛在能力，多用于升學(xué)、職業(yè)指導(dǎo)以及一些特殊工種人員的篩選。例如：音樂、繪畫、機械技巧，以及文書才能測驗。這類測驗在臨床上應(yīng)用較少。人格測驗：主要用于測量性格、氣質(zhì)、信念等方面的個性心理因素，亦即個性中除能力以外的部分。人格測驗包括問卷和投射測驗：問卷：如明尼蘇達(dá)多項人格調(diào)查表（MMPI）、16種人格因素問卷（16PF）、艾森克人格問卷（EPQ）；投射測驗：如羅夏墨跡測驗、主題統(tǒng)覺測驗（TAT）。2..按測驗材料的性質(zhì)分類：文字測驗、操作測驗。文字測驗：所用的是文字材料，它以言語作為刺激。被試用言語做出反應(yīng)。例如：MMPI、EPQ、16PF及韋克斯勒兒童和成人智力量表中的言語量表部分。優(yōu)點：實施方便，團體測驗多用，有肢體殘疾而無言語困難的病人只能用此。缺點：受被試文化程度的影響。操作測驗：也稱非文字測驗。無需言語，不受文化因素限制；可用于兒童和文盲；例如：羅夏墨跡測驗、主題統(tǒng)覺測驗、瑞文測驗及韋克斯勒兒童和成人智力量表中的操作量表部分。優(yōu)點：不受文化因素的限制。缺點：大多不宜團體實施，在時間上不經(jīng)濟。3..按測驗材料的嚴(yán)謹(jǐn)程度分類：客觀測驗、投射測驗?？陀^測驗：測驗中，所呈現(xiàn)的刺激詞句、圖形等意義明確，只需被試直接理解，無須發(fā)揮想象力來猜測和遐想，故稱客觀測驗。絕大多數(shù)心理測驗都屬于這類測驗。投射測驗：在此類測驗中，刺激沒有明確的意義，問題模糊，對被試的反應(yīng)也沒有明確規(guī)定。被試做出反應(yīng)時，一定要憑自己的想象力加以填補，使之成為有意義的。在這個過程中，恰好投射出被試的思想、感情和經(jīng)驗，所以稱為投射測驗。此種測驗種類較少，具有代表性的有：如羅夏墨跡測驗、主題統(tǒng)覺測驗（TAT）、自由聯(lián)想測驗、句子完成測驗。4..按測驗的方式分類：個別測驗、團體測驗。個別測驗：一對一，臨床常用法。例如：比內(nèi)-西蒙智力量表、韋克斯勒智力量表等；優(yōu)點：主試可以仔細(xì)觀察被試的言語情緒，并有充分的機會與被試合作，所以其結(jié)果正確可靠。缺點：時間不經(jīng)濟，不能在短時間呢您收集到大量的資料。團體測驗：一個多個主試對多個被試。例如：陸軍甲種和乙種測驗，教育上的成就測驗。優(yōu)點：時間經(jīng)濟，主試不必接受嚴(yán)格的專業(yè)訓(xùn)練即可擔(dān)任。缺點：主試對被試的行為不能作切實的控制，所得結(jié)果不及個別測驗正確可靠。24.論述心理測驗的功能：1..從實際應(yīng)用角度看：人才選拔；崗位安置；臨床診斷；教育評價；心理咨詢和治療；2..從理論研究角度看：a.搜集資料：心理測驗是收集個體差異資料最快捷的辦法。b.提出和驗證假設(shè)；c.實驗分組；第3節(jié):正確對待和使用測驗:p2325.錯誤的測驗觀：1..測驗萬能論；2..測驗無用論：1...某些人格測驗侵犯了個人隱私；2...測驗為宿命論和種族歧視提供了心理學(xué)依據(jù)。3..心理測驗即智力測驗。26.正確的測驗觀：1..重要的心理學(xué)研究方法和決策的輔助工具：除實驗法以外，心理測驗法的出現(xiàn)是心理科學(xué)發(fā)展史上的一大進步，是心理學(xué)研究中不可缺少的研究方法之一。在進行升學(xué)、就業(yè)、招聘、晉級等工作時，若有相應(yīng)的心理測驗，就可以幫助有關(guān)部門作出科學(xué)的決策。2..作為研究方法和測量工具尚不完善：盡管心理測驗是心理學(xué)研究的必要手段，而且實際生活中也在廣泛應(yīng)用，但是心理測驗從理論到方法都還存在許多問題，尤其過分夸大心理測驗的科學(xué)性和準(zhǔn)確性是不對的。正確的態(tài)度應(yīng)該是既承認(rèn)心理測驗的不完善，又科學(xué)地自信地使用心理測驗，不應(yīng)該重犯倒洗澡水把孩子也潑掉的錯誤。3..科學(xué)地看待心理測驗，防止亂用測驗：為防止測驗的濫用，需注意的問題：1...測驗使用者必須具備一定的資格；2...慎重選擇測驗量表；3...與被試建立良好的協(xié)調(diào)關(guān)系；4...正確解釋測驗結(jié)果；5...注意測驗的保密。對測驗的保密主要有兩個方面：a．一是對測驗內(nèi)容的保密；b．二是對測驗結(jié)果幾個人隱私保密。第二章心理測驗的編制第1節(jié):心理測驗的對象、目的及目標(biāo):p271.在編制測驗前首先要明確測量的對象：也就是該測驗編成后要用于哪些團體。其包括三個重要的維度，即：1..年齡：測驗的年齡范圍是有明確規(guī)定的。2..教育水平：在編制兒童測驗時，要同時考慮教育水平和年齡的影響。在成人測驗中，一般只考慮教育水平的影響。3..文化背景：2.測驗的目的：一般來說可分為兩類；顯示和預(yù)測。由此我們可以分為兩類測驗：顯示性測驗和預(yù)測性測驗。1..顯示性測驗：是指測驗題目和所要測量的心理特征相似的測驗。有些觀察法、行為評估法也都是顯示性測驗；古德納夫在顯示性測驗內(nèi)部又加以區(qū)分，將其分為樣本測驗和標(biāo)記測驗。樣本測驗：題目取自一個很明確的總體的測驗即是樣本測驗；如學(xué)生的四則混合運算；標(biāo)記測驗：題目取自一個全開發(fā)的總體的測驗即是標(biāo)記測驗。如智力測驗2..預(yù)測性測驗：指預(yù)測一些沒被測量的行為的測驗。3..顯示性和預(yù)測性的測驗的區(qū)分并不是絕對的：如高考、題目源于高中，是樣本測驗；成績預(yù)測大學(xué)，預(yù)測測驗。3.心理測驗的目標(biāo)是指編制的測驗是測什么的，即用來測量什么樣的心理變量或行為特征。目標(biāo)分析以測驗不同而異，一般分為三種情況：1..工作分析：對于選拔和預(yù)測功用的預(yù)測性測驗，主要任務(wù)是對所預(yù)測的行為活動作具體分析，我們稱之為任務(wù)分析或工作分析。一般分為兩個步驟：1...確定哪些心理特征或行為可以使要預(yù)測的活動達(dá)到成功；2...建立被試是否成功的衡量標(biāo)準(zhǔn)；2..對特定概念下定義：如果測驗是為了測量某種特殊的心理品質(zhì)或特點，那么測驗編制者就必須給所要測量的心理或行為特質(zhì)下定義，然后必須發(fā)現(xiàn)該特質(zhì)所包含的維量將通過什么行為表現(xiàn)出來或怎樣進行測量。3..確定測驗的具體內(nèi)容：如果測驗是描述性的顯示測驗，它的目標(biāo)分析的主要任務(wù)則是確定顯示的內(nèi)容和技能，從中取樣。a．成就測驗是典型的描述性測驗，它的內(nèi)容分析過程主要體現(xiàn)在雙向細(xì)目標(biāo)的制作過程中。b．雙向細(xì)目標(biāo)：由測量的內(nèi)容材料維度和行為目標(biāo)維度所構(gòu)成的表格，它能幫助成就測驗的編制者決定應(yīng)該選擇哪些方面的題目以及各題目所占的比例。c．雙向細(xì)目標(biāo)在編制其他非成就測驗時也適用，如精神心理測驗等，其中一個維度涉及有關(guān)的機能和特質(zhì)，另一個維度則是這些品質(zhì)的行為描述。d．布魯姆把學(xué)習(xí)的心理活動分為認(rèn)知、精神活動、情感三個領(lǐng)域。第2節(jié):測題的編寫技術(shù):p314.編制測驗題目涉及到從編寫、編集、到預(yù)試、修改這樣一個循環(huán)過程。5.搜集有關(guān)資料：題目的有關(guān)來源：1..已出版的標(biāo)準(zhǔn)測驗；2..理論和專家的經(jīng)驗；3..臨床觀察和記錄。6.考慮測題的來源要注意2個問題：1..資料來源要盡可能豐富：2..材料應(yīng)該有普遍性。7.命題的原則及編寫要領(lǐng)：1..命題的原則：1...內(nèi)容方面：首先，要求題目的內(nèi)容符合測驗的目的；其次，內(nèi)容取樣要有代表性；第三，題目間內(nèi)容相互獨立，互不牽連。2...文字方面：使用語言要準(zhǔn)確，語句要簡明扼要；最好一句話說明一個概念，盡量少使用雙重否定句。3...理解方面：題目應(yīng)有確切的答案；題目的內(nèi)容不要超出受測團體的知識水平和理解能力；題目格式要容易理解。4...社會敏感性方面：應(yīng)盡量避開社會敏感性問題，如涉及社會禁忌或個人隱私的題目不應(yīng)使用。菲利普對于涉及社會敏感性問題，怎樣鼓勵被試作出真實回答的策略：a．命題時假定被試具有某種行為，使他不得不在確實沒有該行為時才否定，可避免否定過多的傾向。b．命題時假定規(guī)范不一致；c．指出該行為是常見的，雖然是違規(guī)的。2..測題的編制要求：對心理測驗的題目進行分類的標(biāo)準(zhǔn)很多，常見的分類是根據(jù)對被試的要求不同來分；可以分為兩大類：提供型選擇型題目。1...提供型題目：要求被試給出正確答案，如論文題、簡答題、填充題等；2..選擇型題目：要求被試在有限的幾個答案中選擇正確的答案，如選擇題、是否題、匹配題等。選擇題我們比較熟悉，它由兩部分分構(gòu)成：提干和選擇。a.題干：就是呈現(xiàn)一個問題的情景，一般由直接問句或不完全的陳述問或不完全的陳述句構(gòu)成。b.選項：就是問題的多種可能答案，常常是包括一個正確答案，若干（一般是1—5個）錯誤答案，其中錯誤的答案叫“誘答”。8.對于選擇題，我們既要編好題干，也要編好選項，有幾點必須注意：1..題干所提的問題必須明確，盡量使用簡單而明晰的詞語；2..選項要簡明扼要；3..每題只給一個正確答案，其他屬于誘答；4..各選項長度相等，盡量不要有長有短；5..避免詞干用詞與選項用詞一致，否則成了選擇答案的線索；6..選項最好用同一形式。第3節(jié):測驗的編排和組織:p409.測驗編排的一般原則：1..測題的難度排列易逐步上升；2..盡可能將同類型的測題組合在一起；3..各種類型測題本身的特點。10.兩種常見的試題排列方式：1..并列直進式：整個測驗按試題材料的性質(zhì)歸為若干分測驗，在同一分測驗的試題依其難度由容易到難排列。2..混合螺旋式：先將各類試題依難度分成若干不同層次，再將不同性質(zhì)的試題加以組合，作交叉式排列，難度則漸次升進。第三章測驗的信度第1節(jié):信度的概念:p461.信度：是指同一被試在不同時間內(nèi)用同一測驗（或用另一套相等的測驗）重復(fù)測量，所得結(jié)果的一致程度。信度只受隨機誤差的影響，隨機誤差越大，信度越低。2.信度理論定義：傳統(tǒng)的信度理論認(rèn)為，每一個測驗的實得分?jǐn)?shù)（X）總是由真實分?jǐn)?shù)（T）和誤差（E），兩個部份構(gòu)成的，公式為：X=T+E3.討論一組測驗分?jǐn)?shù)的特性時，可用方差導(dǎo)標(biāo)具體分?jǐn)?shù)，公式：（測驗實得分?jǐn)?shù)的方差）＝（測驗真分?jǐn)?shù)的方差）＋（測驗誤差的方差）4.信度操作定義：一組測量分?jǐn)?shù)的真分?jǐn)?shù)方差與總方差（實得分?jǐn)?shù)的方差）的比率，或者是真實分?jǐn)?shù)方差占總方差的的百分比。計算公式：由于真實分?jǐn)?shù)的方差是無法統(tǒng)計的，因此公式可轉(zhuǎn)化為：5.信度的指標(biāo)1..信度系數(shù)：大部分情況下，信度是信度系數(shù)為指標(biāo)，它是一種相關(guān)系數(shù)。理論上說就是真分?jǐn)?shù)方差與實得分?jǐn)?shù)的方差的比值，公式是：信度指數(shù)：是真分?jǐn)?shù)標(biāo)準(zhǔn)差與實得分?jǐn)?shù)的標(biāo)準(zhǔn)差的比值，公式是：信度指數(shù)的平方就是信度系數(shù)。2..測量標(biāo)準(zhǔn)誤：信度系數(shù)表示一組測量的實得分?jǐn)?shù)與真分?jǐn)?shù)的符合程度，但并沒有直接支出個人測量分?jǐn)?shù)的變異量。用一組被試兩次測量結(jié)果來代替同一個人反復(fù)實測，有了信度的另一個指標(biāo)：（公式3-7）測量的標(biāo)準(zhǔn)誤與信度之間呈反比關(guān)系：標(biāo)準(zhǔn)誤越小，信度越；標(biāo)準(zhǔn)誤越大，信度越低。6.信度與測驗分?jǐn)?shù)的解釋：1..解釋真實分?jǐn)?shù)與實得分?jǐn)?shù)的相關(guān)：信度系數(shù)可以解釋為總的方差中有多少比例是由真實分?jǐn)?shù)的方差決定的，也就是測驗的總變異中真分?jǐn)?shù)造成的變異占百分之幾。2..比較信度可以接受的水平：一個測驗究竟信度多高才適合，才讓人滿意呢？當(dāng)然，最理想的情況是=1.00，但實際上辦不到。一般原則是：一般的能力測驗和成就測驗的信度系數(shù)都在0.90以上；人格測驗、興趣、態(tài)度、價值觀等測驗的信度一般在0.80-0.85。一般原則是：當(dāng)rxx<0.70時，測驗不能用于對個人作出評價或預(yù)測，而且不能作團體比較；當(dāng)0.70≤rxx<0.85時，可用于團體比較；當(dāng)rxx≥0.85時，才能用來鑒別或預(yù)測個人成績或作為。3..解釋個人分?jǐn)?shù)的意義：從信度可以解釋個人分?jǐn)?shù)的意義，這是測量標(biāo)準(zhǔn)誤的應(yīng)用。它有兩個作用：一是.估計真實分?jǐn)?shù)的范圍；二是.了解實得分?jǐn)?shù)再測時可能的變化情形。例題：假設(shè)在一個智力測驗中，某個被試的IQ為100，這是否反映了他的真實水平？如果再測一次他的分?jǐn)?shù)將改變多少？已知該智力測驗的標(biāo)準(zhǔn)差是15，信度系數(shù)為0.89，則其IQ的測量標(biāo)準(zhǔn)誤和可能范圍分別為：SE=15=5.0IQ＝100±1.96x5＝100±9.8≈90～110我們可以說這個被試的真實IQ有95％的可能性落在90與110之間。即若再測一次，他的智商低于90、高于110的可能性不超過5％。4..比較不同測驗分?jǐn)?shù)的差異：測量標(biāo)準(zhǔn)誤和測驗信度在評價兩個不同測驗的分?jǐn)?shù)是否有明顯差異時也非常重要。這種比較包括兩個人不同分?jǐn)?shù)的差別和同一被試在兩個測驗上的差別。例題：某被試在韋氏成人智力測驗中言語智商為102，操作智商為108。已知兩個分?jǐn)?shù)都是以100為平均數(shù)，15為標(biāo)準(zhǔn)差的標(biāo)準(zhǔn)分?jǐn)?shù)。假設(shè)言語測驗和操作測驗的分半信度分別為0.97和0.93。問其操作智商是否顯著高于言語智商呢？首先計算出差異分?jǐn)?shù)的標(biāo)準(zhǔn)誤：在統(tǒng)計上，經(jīng)常要求兩個分?jǐn)?shù)的差異程度達(dá)到0.05的顯著水平，才能承認(rèn)不是誤差的影響。因此將差異標(biāo)準(zhǔn)誤（4.74）乘以1.96，結(jié)果為9.29，這表明個體在韋氏測驗兩半得分的差異高于大約10分，才能達(dá)到0.05顯著水平。上述被試的分?jǐn)?shù)差異（108-102＝6）是不顯著的。第2節(jié):信度的類型及估計方法:p517.信度的類型：重測信度、復(fù)本信度、內(nèi)部一致性信度、評分者信度8.重測信度：又稱穩(wěn)定性系數(shù)。他的計算方法是采用重測法，即使用同一測驗，在同樣條件下對同一組被試前后施測兩次測驗，求兩次得分間的相關(guān)系數(shù)。1..用重測法估計信度的優(yōu)點：能提供有關(guān)測驗是否隨時間而變異的資料，可作為被試將來行為表現(xiàn)的依據(jù)。用重測法估計信度的缺點：易受練習(xí)和記憶的影響；2..最適宜的時距隨測驗的目的、性質(zhì)和被試的特點而異，一般是兩周到四周較宜，間隔時間最好不超過六個月。3..重測信度的前提假設(shè)是：1...所測量的特性必須是穩(wěn)定的；2...每個人對前一次反應(yīng)的遺忘程度相同；⑶在時間間隔中沒有學(xué)習(xí)另外的與測驗有關(guān)的東西。3…在時間間隔中沒有學(xué)習(xí)另外的與測驗有關(guān)的東西，即每人學(xué)習(xí)其他東西的程度都一樣。9.復(fù)本信度：又稱等值性系數(shù)。它是以兩個等值但題目不同的測驗（復(fù)本）來測量同一群體，然后求得被試在兩個測驗上得分的相關(guān)系數(shù)，這個相關(guān)系數(shù)就代表了復(fù)本信度的高低。復(fù)本信度反映的是測驗在內(nèi)容上的等值性，故稱等值性系數(shù)。1..復(fù)本信度的高低關(guān)鍵取決于復(fù)本測驗的選擇，因而是題目取樣問題。2..同重測信度一樣，復(fù)本信度也要考慮兩個復(fù)本實施時間間隔。如果兩個復(fù)本幾乎是在同一時間內(nèi)施測的，相關(guān)系數(shù)反映的才是不同復(fù)本的關(guān)系，而不摻有時間的影響。如果兩個復(fù)本的施測相隔一段時間，則稱重測復(fù)本信度或穩(wěn)定與等值系數(shù)。穩(wěn)定與等值系數(shù)既考慮了測驗在時間上的穩(wěn)定性，也考慮了不同題目樣本反應(yīng)的一致性，因而是更為嚴(yán)格的信度考察方法，也是應(yīng)用較為廣泛的方法。在實際應(yīng)用時，為了抵消施測順序的效應(yīng)，應(yīng)該有半數(shù)的被試先作A本再作B本，另一半被試先作B本再作A本。10.內(nèi)部一致性信度包括：分半信度和同質(zhì)性信度。1..分半信度：指采用分辦法估計所得的信度系數(shù)。這種方法估計信度系數(shù)只需一種測驗形式，實施一次測驗。通常是在測驗實施后將測驗按奇、偶數(shù)分為等值的兩半，并分別計算每位被試在兩半測驗上的得分，求出這兩半分?jǐn)?shù)的相關(guān)系數(shù)。1...常見的是將測題按其序列號的奇偶分半，這種分法的前提是：測題并非隨機排列，而是按某種順序（如難度）排列；如果隨機排列的題目，則必須是所有題目平等的（要么難度相等，要么性質(zhì)一樣）；如果測驗有多個分量表，應(yīng)該在分量表內(nèi)部排好順序，再把各分量表分兩半組合起來求相關(guān)。2...常用的修正公式是：斯皮爾曼－布朗公式：例題：某測驗分為兩半后求得的相關(guān)系數(shù)為0.524，則測驗在原長度時的度估計值為：rxx=斯皮爾曼－布朗公式為經(jīng)驗公式，他的假設(shè)條件是兩半測驗分?jǐn)?shù)的變異數(shù)相等，但實際資料有時未必完全符合這一條件。當(dāng)假設(shè)不成立時，可采用：弗朗那根公式或盧倫公式中的任一一個。2..同質(zhì)性信度：指測驗內(nèi)部所有題目間的一致性。當(dāng)各個測題的得分有較高的正相關(guān)時，不論題目的內(nèi)容和形式如何，測驗即為同質(zhì)的；若所有題目看起來好像測量的是同一特質(zhì)，但相關(guān)很低或為負(fù)相關(guān)時，測驗即為異質(zhì)的。此外，對于一些復(fù)雜的、異質(zhì)的心理學(xué)變量，采用單一的同質(zhì)性測驗是不行的，因而常常采用若干相對異質(zhì)的分測驗，并使每個分測驗內(nèi)容具有同質(zhì)性，這樣每個分測驗就能用來預(yù)測異質(zhì)效標(biāo)的某一方面。同質(zhì)性信度的公式主要有：庫德-理查遜公式：常用的是K-R20公式；在個各測題難度相同或近似的情況下，還可采用計算更為簡便的K-R21公式?？藗惏秃咋料禂?shù)：不適用于多重幾分的測題。11.評分者信度：用于測量不同評分者之間所產(chǎn)生的誤差。為了衡量評分者之間的信度高低，可隨機抽取若干份測驗卷，由兩位評分者按評分標(biāo)準(zhǔn)分別給分，然后再根據(jù)美分測驗卷的兩個分?jǐn)?shù)計算相關(guān)，即得評分者信度。一般要求在成對的受過訓(xùn)練的評分者之間平均一致性達(dá)0.90以上，才認(rèn)為評分是客觀的。當(dāng)多個評分者評定多個對象，并以等級法記分時，可采用肯德爾和諧系數(shù)作為評分者信度的估計。信度估計方法及其與測量復(fù)本和施測次數(shù)的關(guān)系所需施測次數(shù)所需復(fù)本的數(shù)目一二一分半信度同質(zhì)性信度評分者信度復(fù)本信度（連續(xù)施測）二重測信度復(fù)本信度（間隔施測）各種信度系數(shù)相應(yīng)誤差方差的來源信度系數(shù)類型誤差方差來源重測信度時間取樣復(fù)本信度（連續(xù)施測）內(nèi)容取樣復(fù)本信度（間隔施測）時間和內(nèi)容取樣分半信度內(nèi)容取樣同質(zhì)性信度內(nèi)容的異質(zhì)性評分者信度評分者之間的差異第3節(jié):影響信度的因素:p5912.影響信度的因素：1..樣本的特征：信度常用信度系數(shù)來表示，信服系數(shù)就是相關(guān)系數(shù)，相關(guān)系數(shù)受樣本團體得分分布、樣本是否異質(zhì)及樣本團體平均能力水平的影響。1...樣本團體分?jǐn)?shù)分布的影響：任何相關(guān)關(guān)系都是受到團體中分?jǐn)?shù)分布的影響，當(dāng)分布范圍增大時，其信度估計就較高；當(dāng)分布范圍減小時，相關(guān)系數(shù)隨之下降，信度值則較低。2...樣本團體異質(zhì)性的影響：若獲得信度的取樣團體較為異質(zhì)的話，往往會高估測驗的信度，相反則會低估測驗的信度。3…樣本團體平均能力水平的影響：對于不同水平的團體，題目具有不同的難度，每個題目在難度上的微小差異累計起來便會影響信度。2..測驗的長度：在一個測驗中增加同質(zhì)的題目，可以使信度提高。1...測驗越長，測驗的測題取樣或內(nèi)容取樣越有代表性；2...測驗越長，被試的猜測因素影響越小。3..測驗的難度：難度對信度的影響只存在于某些測驗中，如智力測驗、成就測驗、能力傾向測驗等。1...如果一個測驗對某團體而言太容易，會使所得分?jǐn)?shù)都集中在高分端；當(dāng)題目太困難時，得分就會集中在低分端。2...兩種情況均會使信度樣本的分?jǐn)?shù)范圍變窄，從而使測驗變得不夠可靠。從理論上說，只有難度水平為50％時，才能使測驗分?jǐn)?shù)分布范圍最大，求得的信度也最高。4..測驗的時間間隔：以再測法或復(fù)本法求信度，兩次測驗相隔時間越短，其信度系數(shù)越大；間隔時間越久，其它變因介入的可能性越大，受外界的影響越大，信度系數(shù)便越低。第4節(jié)：信度的特殊問題：p64第四章測驗的效度第1節(jié):效度的概念:p691.效度：是指所測量的與所要測量的心理特點之間符合的程度，或者簡單地說是指一個心理測驗的準(zhǔn)確性。效度是科學(xué)測量工具最重要的必備條件。由于有效方差是一個理論值，無法測量，所以效度和信度一樣是一個理論上的概念。2.信度和效度的關(guān)系：1..信度是效度的必要而非充分條件：從方差分配公式：S2X=S2V+S2I+S2E可以看出，S2V增大，即效度高，信度的真方差（S2V+S2I）必然大，故信度必然高。當(dāng)信度高時，即S2E降低時，S2V是否增加還要看S2I是否增減，因此效度不一定就高。效度高必然信度高，而信度高并不一定保證效度高，說明信度高只是效度高的必然條件，并不是效度高的充分條件。2..效度是受信度制約的：信度系數(shù)的平方根是效度系數(shù)的最高限度，可見，一個測驗的效度總是受它的信度所制約。3.效度的性質(zhì)：1..效度具有相對性：在評鑒測驗的效度時，必須考慮其目的與功能。只有所測的結(jié)果符合該測驗的目，才能認(rèn)為它是個有效的測量工具。2..效度具有連續(xù)性。測驗效度通常用相關(guān)系數(shù)表示，它只有程度上的不同，而沒有“全有”或“全無”的區(qū)別。因此，我們評價一個測驗時，不應(yīng)該說“有效”或“無效”，而應(yīng)該用效度較高或效度較低來評價。第2節(jié):效度的類型與估計方法:p724.效度分為三類：內(nèi)容效度、構(gòu)想效度、效標(biāo)效度5.內(nèi)容效度：指的是測驗題目對有關(guān)內(nèi)容或行為取樣的適用性，從而確定測驗是否是所欲測量的行為領(lǐng)域的代表性取樣。a．想編制有較高內(nèi)容效度的心理測驗：1..要對所測量的心理特性有個明確的概念，并劃定出哪些行為與這心理特性有關(guān)，又比較密切。2..測驗題目應(yīng)是所界定的內(nèi)容范圍的代表性取樣。需要說明的是，要求內(nèi)容效度的測驗，并不一定要求測驗為同質(zhì)的。b．內(nèi)容效度的評估方法：1..專家判斷法：為了確定一個測驗是否有內(nèi)容效度，最常用的方法是請有關(guān)專家對測驗題目與原定內(nèi)容的符合性作出判斷，看測驗的題目是否代表規(guī)定的內(nèi)容。如果專家認(rèn)為測驗題目代表了所測內(nèi)容，測驗就是有內(nèi)容效度。由于這種估計效度的方法，是一個邏輯分析的過程，所以內(nèi)容效度有時也可稱為“邏輯效度”。2..統(tǒng)計分析法：計算兩個評分者之間評定的一致性，雖然考察的是評分者的判斷信度，但由于來自兩個獨立的評判者，因此符合程度越高越能反映測驗的內(nèi)容效度?？藗惏秃仗岢?，內(nèi)容效度可由一組被試在獨立取得自同樣內(nèi)容范圍的兩個測驗復(fù)本上得分之相關(guān)來作數(shù)量的估計。再測法也可用于內(nèi)容效度的評估。3..經(jīng)驗推測法：通過實踐來檢驗效度。如果通過率是隨著年齡的增加而增加，就可以推測該測驗有內(nèi)容效度。c．內(nèi)容效度與表面效度的關(guān)系：經(jīng)常混淆。1..表面效度：是由外行對測驗作表面上的檢查確定的，它不反映測驗實際測量的東西，只是指測驗表面上看來好像是所要測的東西；只考慮題目與測量目的之間的明顯的、直接的關(guān)系；2..內(nèi)容效度：是由夠資格的判斷者（專家）詳盡地、系統(tǒng)地對測驗作評價建立的?？紤]到題目與測量目的和內(nèi)容總體之間邏輯的微妙關(guān)系。3..雖然二者都是根據(jù)測驗內(nèi)容作出的主觀判斷，但判斷的標(biāo)準(zhǔn)不同。4..在編制測驗時：表面效度是一個必須考慮的特性，最高作為的測驗通常要求有較高的表面效度；典型行為測驗要求有較低的表面效度。如果被試很容易從測驗題目看出測驗的目的，就可能產(chǎn)生反應(yīng)偏差（如掩飾等）。6.構(gòu)想效度：構(gòu)想效度：1954年提出，有人翻譯為構(gòu)思效度，也有叫結(jié)構(gòu)效度。它是指測驗?zāi)軌驕y量到理論上的構(gòu)想和特質(zhì)的程度，即測驗的結(jié)果是否能證實或解釋某一理論的假設(shè)、術(shù)語或構(gòu)想，解釋的程度如何。a．構(gòu)想效度的估計方法：1..對測驗本身的分析：測驗的內(nèi)容效度可以作為構(gòu)思效度的證據(jù)；測驗的同質(zhì)性指標(biāo)可以推斷測驗是測量單一特質(zhì)還是測量多種特質(zhì)，從而為評估測驗構(gòu)思效度提供證據(jù)；分析被試對題目的反應(yīng)特點也可以作為構(gòu)思效度的證據(jù)。2..測驗間的相互比較：通過分析幾個測驗間的相互關(guān)系，找出其共同之處，進而推斷這些測驗測量的特質(zhì)是什么，也可以確定這些測驗的構(gòu)思效度。最簡單的是計算兩種測驗之間得分的相關(guān)：其中一個測驗是待研究效度的；另一個是已有效度證據(jù)的成熟的測驗；但兩者測量的是同一種心理特質(zhì)。相容效度：兩測驗的相關(guān)系數(shù)的平方即是兩組測驗分?jǐn)?shù)所共同解釋的變異大小，所以稱這一相關(guān)為相容效度，相容效度是構(gòu)思效度的一個證據(jù)。區(qū)分效度：是構(gòu)思效度的又一個證據(jù)。因素分析法：也是建立構(gòu)思效度的常用方法，通過對一組測驗進行因素分析，可以找到影響測驗分?jǐn)?shù)的共同因素，這種因素可能就是我們要測量的心理特質(zhì)（構(gòu)思）。3..效標(biāo)效度的研究證明：一個測驗若效標(biāo)度理想，那么該測驗所預(yù)測的效標(biāo)的性質(zhì)和種類就可以作為分析測驗構(gòu)思效度的指標(biāo)；另一種證實構(gòu)思效度的方法是心理特質(zhì)的發(fā)展變化。4..實驗法和觀察法證實：觀察實驗前和實驗后分?jǐn)?shù)的差異是驗證構(gòu)思效度的方法。7.效標(biāo)效度：又稱實證效度，反映的是測驗預(yù)測個體在某種情境下行為表現(xiàn)的有效性程度。被預(yù)測的行為是檢驗效度的標(biāo)準(zhǔn)，簡稱效標(biāo)。由于這種效度是看測驗對效標(biāo)預(yù)測如何，所以叫效標(biāo)效度。這種效度需在實踐中檢驗，所以又稱為實證效標(biāo)。a．分類：根據(jù)效標(biāo)資料是否與測驗分?jǐn)?shù)同時獲得，又可分為同時效度和預(yù)測效度兩類。1..同時效度：即測驗所得分?jǐn)?shù)可與效標(biāo)同時驗證，通常與心理特征的評估及診斷有關(guān)。2..預(yù)測效度：的效標(biāo)資料需要一段時間才可搜集到，通常用于選拔、分組。3..因為效標(biāo)資料在考試以后相隔一段時間才能獲得，所以高考的效標(biāo)是一種預(yù)測效標(biāo)。同時效標(biāo)和預(yù)測效標(biāo)意義上的差異，不是來源于時間，而是來自測驗的目的。前者與用來診斷現(xiàn)狀的測驗有關(guān)，后者與預(yù)測將來結(jié)果的測驗有關(guān)。b．一個好的效標(biāo)必須具備以下條件：1..必須能最有效地反映測驗的目標(biāo)，即效標(biāo)測量本身必須有效；2..效標(biāo)必須具有較高的信度，穩(wěn)定可靠，不隨時間等因素變化；3..效標(biāo)可以客觀地加以測量，可用數(shù)據(jù)或等級來表示；4..效標(biāo)的測量的方法很簡單，省時省力，經(jīng)濟實用。c．效標(biāo)和效標(biāo)測量：效標(biāo)，即衡量測驗有效性的參照標(biāo)準(zhǔn)，指的是可以直接而且獨立測量的我們感興趣的行為。我們感興趣的行為，就是要預(yù)測的行為，這是一個總的觀念，故必須以可操作的測量來確定才有實際意義。因此有必要把效標(biāo)細(xì)分為兩個層次，其一是理論水平的“觀念效標(biāo)”；其二是操作定義水平的“效標(biāo)測量”。一個好的效標(biāo)測量必須具備：有效性、可靠性、客觀性、實用性。d．常用的效標(biāo)包括：1..學(xué)業(yè)成就：如在校成績、學(xué)歷、有關(guān)的獎勵和榮譽、教師對學(xué)生智力的評定等，常作為智力測驗的效標(biāo)，也可作為某些多重能力傾向測驗和人格測驗的效標(biāo)。2..實際工作表現(xiàn)：是最滿意的效標(biāo)測量，為一般智力測驗、人格測驗和一些能力傾向測驗的效標(biāo)；3..特殊訓(xùn)練成績4..精神病診斷；5..等級評定：是觀察者根據(jù)測驗欲測量的心理特質(zhì)在被試身上的表現(xiàn)而作出的一種個人判斷；6..效標(biāo)團體的比較：即找出兩個在效標(biāo)表現(xiàn)上有差別的團體，比較他們在測驗分?jǐn)?shù)上的差別；7..先前有效的測驗：一個新測驗與先前有效的測驗的相關(guān)也經(jīng)常作為效度檢驗的證據(jù)。第3節(jié):效度的表示方法及應(yīng)用:p828.效度的表示方法1..相關(guān)法：效度系數(shù)是最常用的效度指標(biāo)，尤其是效標(biāo)效度。它是以皮爾遜積差相關(guān)系數(shù)來表示的，主要反映測驗分?jǐn)?shù)與效標(biāo)測量的相關(guān)。當(dāng)測驗成績是連續(xù)變量，而效標(biāo)資料是二分變量時，計算效度系數(shù)可用點二列相關(guān)公式或二列相關(guān)公式；當(dāng)測驗分?jǐn)?shù)為連續(xù)變量，效標(biāo)資料為等級評定時，可用賈斯朋多系列相關(guān)公式計算。2..區(qū)分法：是檢驗測驗分?jǐn)?shù)能否有效地區(qū)分由效標(biāo)所定義的團體的一種方法。算出t值后，便可知道分?jǐn)?shù)的差異是否顯著。若差異顯著，說明該測驗?zāi)軌蛴行У貐^(qū)分由效標(biāo)定義的團體，否則，測驗是無效的。重疊百分比可以通過計算每一組內(nèi)得分超過（或低于）另一組平均數(shù)的人數(shù)百分比得出；另外，還可以計算兩組分布的共同區(qū)的百分比。重疊量越大，說明兩組分?jǐn)?shù)差異越小，即測驗的效度越差。3..命中率法：是當(dāng)測驗用來做取舍的依據(jù)時，用其正確決定的比例作為效度指標(biāo)的一種方法。命中率的計算有兩種方法，一是計算總命中率；另一種是計算正命中率。4..預(yù)期表法：是一種雙向表格，預(yù)測分?jǐn)?shù)排在表的左邊，效標(biāo)排在表的頂端。從左下至右上對角線上各百分?jǐn)?shù)字越大，而其它的百分?jǐn)?shù)字越小，表示測驗的效標(biāo)效度越高；反之，數(shù)字越分散，則效度越低。9.效度的應(yīng)用：1..預(yù)測誤差：效度系數(shù)的平方，統(tǒng)計學(xué)上稱這種指標(biāo)為決定系數(shù)，表示測驗正確預(yù)測或解釋的效標(biāo)的方差占總方差的比例。例如：當(dāng)某測驗的效度系數(shù)為0.80時，我們說效標(biāo)分?jǐn)?shù)中有64%的方差是測驗分?jǐn)?shù)的方差，即測驗分?jǐn)?shù)正確預(yù)測的比例是64%，其余的36%是無法確定預(yù)測的比例。另一種表達(dá)方式是估計的標(biāo)準(zhǔn)誤，簡寫為Sest，它是指所有具有某一測驗分?jǐn)?shù)的被試其效標(biāo)分?jǐn)?shù)（Y）分布的標(biāo)準(zhǔn)差，也即預(yù)測誤差大小的估計值，，估計的標(biāo)注誤可如同其他標(biāo)準(zhǔn)誤一樣解釋。真正效標(biāo)分?jǐn)?shù)落在預(yù)測效標(biāo)分?jǐn)?shù)±1Sest的范圍內(nèi)，有68％的可能性；落在預(yù)測效標(biāo)分?jǐn)?shù)±1.96Sest的范圍內(nèi)，有95％的可能性；落在預(yù)測效標(biāo)分?jǐn)?shù)±2.58Sest的范圍內(nèi)，有99％的可能性。2..預(yù)測效標(biāo)分?jǐn)?shù)：如果X與Y兩變量呈直線相關(guān)，只要確定出二者間的回歸方程，就可以從一個變量推估出來另一個變量。在測驗工作中，人們感興趣的是從測驗分?jǐn)?shù)預(yù)測效標(biāo)成績。3..預(yù)測效標(biāo)指數(shù)：公式，中的又稱作無關(guān)系數(shù)，以K表示之，K值大小表明預(yù)測源分?jǐn)?shù)與效標(biāo)分?jǐn)?shù)無關(guān)的程度。（1－K）可作為預(yù)測效率的指數(shù)，用E表示：E＝100（1－K），E值大小表明使用測驗比盲目猜測能減少多少誤差。第4節(jié):影響效度的因素:p8810.影響效度的因素：1..測驗本身的因素：1...測驗題目的質(zhì)量：2...測驗的長度：一般而言，增加測驗的長度通?？梢蕴岣邷y驗的信度，而信度又制約著效度，因此增加測驗的長度也能提高測驗的效度。2..測驗實施中的干擾因素：1...主試的影響因素：測驗實施過程中主試的因素會影響效度。對于效標(biāo)效度，測驗與效標(biāo)二者實施時間間隔時間越長，測驗與效標(biāo)越容易受到很多機遇因素的影響，因此所求的相關(guān)必然很低。測驗情鏡，如場地的布置、材料的準(zhǔn)備、測驗場所有無噪音和其他干擾因素等也會影響到測驗的效度。2...被試的影響因素：被試在測驗時的興趣、動機、情緒、態(tài)度和身心狀況、健康狀態(tài)等都會影響測驗的效度。（被試的反應(yīng)定勢也會降低測驗的效度。）3..樣本團體的性質(zhì)：1…樣本團體的異質(zhì)性：與信度系數(shù)一樣，如果其它條件相同，樣本團體越同質(zhì)，分?jǐn)?shù)分布范圍越小，測驗效度就越低；樣本團體越異質(zhì)，分?jǐn)?shù)分布范圍越大測驗效度就越高。a．只以選拔上的被試為樣本團體參加效度研究，降低了測驗的效度。b。選拔標(biāo)準(zhǔn)太高，樣本團體的同質(zhì)性增高，降低了測驗的效度。2...干涉變量：樣本團體的性質(zhì)對效度的影響還表現(xiàn)在：對于同性質(zhì)的團體，同一測驗的效度會有很大的不同。這些樣本團體的特質(zhì)包括：年齡、性別、教育水平、智力、動機、職業(yè)和任何有關(guān)的特征。由于這寫特征的影響，使得測驗對于不同的團體具有不同的預(yù)測能力，故測量學(xué)上稱這些特征為干涉變量。3...吉賽利提出的如何找出干涉變量的一套方法：a．用回歸方程求得每個人的預(yù)測效標(biāo)分?jǐn)?shù)，將該分?jǐn)?shù)與實際效標(biāo)分?jǐn)?shù)想比較，獲得差異分?jǐn)?shù)D.如果D的絕對值很大，說明測驗中可能存在干涉變量。b．根據(jù)樣本團體的組成分析，找出對照組，分別計算效度，從而象上述關(guān)于出租汽車司機的例子一樣，找出干涉變量。c．對于欲測團體，根據(jù)某些易見的干涉變量將其區(qū)分為預(yù)測性高和預(yù)測性低的兩個亞團體。對于預(yù)測性高的團體，獲得的測驗效度會有所提高。4..效標(biāo)的性質(zhì)：效標(biāo)的效度是以測驗分?jǐn)?shù)與效標(biāo)測量的相關(guān)系數(shù)來表示的，因此效標(biāo)的性質(zhì)如何，在評價測驗的效標(biāo)時是值得考慮的。1...效標(biāo)與測驗分?jǐn)?shù)之間的關(guān)系是否線性關(guān)系是一個很重要的因素。皮爾遜劑差相關(guān)系數(shù)的前題是假設(shè)兩個變量的關(guān)系是線性的分布。2...效標(biāo)測量本身的可靠性如何亦是值得考慮的一個問題。第五章項目分析一般來說，測驗的項目分析包括定性分析和定量分析兩個方面。定性分析：主要是依靠測驗編制者豐富的經(jīng)驗所受的訓(xùn)練，對項目的內(nèi)容和形式是否恰當(dāng)進行分析。定量分析：主要是指對題目難度和區(qū)分度進行分析。通過項目分析，我們可以選擇和修改測驗題目，以提高測驗的信度和效度。第1節(jié):難度分析:p931.難度：是指項目的難易程度。在能力測驗中通常需要一個反映難度水平的指標(biāo)，在非能力測驗（人格測驗）中，類似的指標(biāo)是“通俗性”，即取自相同總體的樣本中，能在答案方向上回答該題的人數(shù)。2.難度的指標(biāo)：難度的指標(biāo)通常以通過率表示，即以答對或通過該題的人數(shù)百分比來表示?！?00%以通過率表示難度時，通過人數(shù)越多，即P值越大，難度就越低；P值越小，難度越高。因為P值大小與難度高低成反比，有人將其稱作易度。3.難度的計算：1..二分法記分的項目：心理測驗的項目大多為選擇題，通過記1分，不通過記0分。當(dāng)被試人數(shù)較多時，可根據(jù)測驗總成績將被試分為三組：分?jǐn)?shù)最高的27%被試為高分組，分?jǐn)?shù)最低的27%被試為低分組，中間46%的被試為中間組。分別計算高分組和低分組的通過率，以兩組通過率的平均值作為每一題的難度。P=P代表難度，PH和PL分別代表高分組和低分組通過率。由于選擇題允許猜測，所以通過率可能因機遇作用而變大。備選答案的數(shù)目越少，機遇的作用越大，越不能真正反映測驗的難度。為此，吉爾福特提出了一個P值校正公式：；例題：假定某題有75％的被試通過，若該題有5個備選答案，則校正后的通過率為：當(dāng)有4個備選答案時，CP=0.67；有3個，CP＝0.63；有2個，CP＝0.542..非二分記分的項目：如果人為地明確通過每一題的分?jǐn)?shù)線，也可以用公式P=計算難度。但此種方法的缺點在于，采用不同的分?jǐn)?shù)線會得到不同的難度值，因此不常用，對于此類題目，一般建議用下面的公式計算難度；4.難度水平的確定：1..項目難度的確定：進行難度分析的主要目的是為了篩選項目，項目的難度多高合適，取決于測驗的目的、性質(zhì)以及項目的形式。P值越接近0.5，區(qū)別力越高。為了使測驗具有更大的區(qū)別力，應(yīng)選擇難度在0.50左右的試題比較合適。但是在實際各種中并得非如此簡單。在選擇題目時，最好使試題的平均難度接近0.50，而各題難度在0.50±0.20之間。當(dāng)測驗用于選拔或診斷時，應(yīng)該比較多地選擇難度值接近錄取率的項目。對于選擇題來說，P值一般應(yīng)大于概率水平。2..測驗難度的確定：測驗的難度直接依賴于組成測驗的項目的難度。通過考察測驗分?jǐn)?shù)的分布，可以對測驗的難度做出直觀檢驗。偏態(tài)分布又有“正偏態(tài)分布”和“負(fù)偏態(tài)分布”兩種。正偏態(tài)分布得分多集中于低端，因此必須增加足夠數(shù)量的較容易的題目；負(fù)偏態(tài)分布得分集中在高分端，說明測驗過易，必須增加足夠數(shù)量的有較高難度的項目。第2節(jié):項目的區(qū)分度:p995.項目區(qū)分度的概念：也叫鑒別力，是指測驗項目對被試的心理特性的區(qū)分能力。如果一個項目，實際水平高的被試能順利通過，而實際水平低的被試不能通過，那么我們就可以認(rèn)為該項目有較高的區(qū)分度。6.項目區(qū)分度的估計方法：1..鑒別指數(shù)：首先分別計算高分組與低分組在該項目上的通過率，然后用高分組在該項目上的通過率減去低分組在該項目上的通過率。項目鑒別指數(shù)與評價標(biāo)準(zhǔn)鑒別指數(shù)D項目評價0.40以上0.30~0.390.20~0.290.19以下很好良好，修改后會更佳尚可，但需修改差，必須淘汰2..相關(guān)系數(shù)：計算區(qū)分度最常用的方法是相關(guān)系數(shù)，即以某一項目分?jǐn)?shù)與效標(biāo)成績或測驗總分的相關(guān)作為該項目區(qū)分度的指標(biāo)。相關(guān)度越高，表明項目越具有區(qū)分的功能。1...點二列相關(guān)：適用于一類變量為二分稱名變量；另一類變量為連續(xù)變量的成對變量的相關(guān)計算。2...二列相關(guān)：適用于兩個連續(xù)變量，但其中一個變量被人為分成兩類。3...Φ相關(guān)：適用于兩個變量均為二分稱名變量。3..區(qū)分度與難度的關(guān)系：1...假如樣本中通過某一項目的人數(shù)比率為1.00或0，說明高分組與低分組在通過率上不存在差異，因此D為0；假如項目的通過率為0.50，則可能是高分組的所有人都通過了，而低分組卻無人通過，這樣D的最大值可能達(dá)到1.00.2...為了使整個測驗項目的潛在區(qū)分度最大，似乎應(yīng)該使每個項目的難度處于0.50水平，但事實并非如此簡單。如果每一個項目的難度均處于0.50，由于項目難度相同，有可能大多趨向于有關(guān)的內(nèi)容或技能，結(jié)果造成項目同質(zhì)性提高。在極端情況下，有可能50％的被試全部通過各項目得滿分，另外50％的被試全部為0分，形成U形分布，這樣反而降低總分的區(qū)分能力。如果測驗的所有項目都是中等難度，只有項目的內(nèi)在相關(guān)為0時，整個測驗才能產(chǎn)生常態(tài)分布?？紤]到一般測驗項目之間具有某種程度的相關(guān)難度的分布要廣一些，梯度多一些，是合乎需要的。第3節(jié):項目分析的特殊問題:p1067.項目特征曲線：是項目特征函數(shù)或項目反應(yīng)函數(shù)的圖解形式，它反映了被試對某一測驗項目的正確反應(yīng)概率與該項目所對應(yīng)的能力或特質(zhì)的水平之間的一種函數(shù)關(guān)系。這一方法不僅適用于項目分析，而且也適用于某些測驗量表的編制。1..項目特征曲線可圖解測驗的鑒別力，項目鑒別力的高低主要在于其曲線的傾斜度，曲線坡度越陡，鑒別能力越好，預(yù)測的誤差越小。2..項目特征曲線可以圖解項目難度。3..項目特征曲線還可以圖解選擇題的誘答反應(yīng)。第六章測驗的實施、記分及其誤差第1節(jié):測驗的實施及其誤差的控制:p1131.實施測驗的程序及其要素：1..標(biāo)準(zhǔn)化指導(dǎo)語：測驗標(biāo)準(zhǔn)化的第一步是指導(dǎo)語標(biāo)準(zhǔn)化，即在測驗實施過程中應(yīng)使用統(tǒng)一的指導(dǎo)語。指導(dǎo)語通常包括兩部分：一部分對被試的指導(dǎo)語；另一部分對主試的指導(dǎo)語。2..標(biāo)準(zhǔn)時限：時限也是測驗標(biāo)準(zhǔn)化的一項內(nèi)容。大多數(shù)典型行為測驗是不受時間限制的。例如人格測驗中被試的反應(yīng)速度就不很重要。但在最高作為測驗中，速度是需要考慮的重要因素之一。在速度測驗中，尤其要注意時間限制，不得隨意延長或縮短。測驗的時間安排，也是影響測驗結(jié)果的一個重要因素。3..測驗的環(huán)境條件：有許多研究表明，測驗環(huán)境會對測驗的結(jié)果造成影響。尤其需要強調(diào)的是，心理測驗進行之時，務(wù)必不能有外界干擾。為此，測驗室的房門上應(yīng)掛一個牌子，示意測驗正在進行，旁人不許進入。因此，對于測驗的環(huán)境條件：1...遵從測驗手冊的要求；2...下任何以外的測驗環(huán)境因素；3...測驗結(jié)果時也必須考慮這一因素。2.主試誤差及控制方法：1..測驗前的準(zhǔn)備工作：測驗前的準(zhǔn)備工作是保證測試順利進行和測驗實施標(biāo)準(zhǔn)化的必要環(huán)節(jié)。1...預(yù)告測驗：使被試對測驗有充分準(zhǔn)備。2...準(zhǔn)備測驗材料：保證良好的工作狀態(tài)，避免忙中出錯。3...熟悉測驗指導(dǎo)語：這是最基本的要求，可以使被試在測試中感到放松，不緊張。4...熟悉測驗的具體程序：明確任務(wù)。2..測驗中主試的職責(zé)：1...應(yīng)按照指導(dǎo)語的要求實施測驗，不帶任何暗示。2...測驗前不講太多無關(guān)的話。3...對于被試的反應(yīng)，主試不應(yīng)作出點頭、皺眉、搖頭等暗示性反應(yīng)；在個別施測時，主試不應(yīng)讓被試看見記分。4...對特殊問題要有心理準(zhǔn)備。3..建立協(xié)調(diào)關(guān)系：協(xié)調(diào)關(guān)系是一個專業(yè)術(shù)語，在臨床心理咨詢、心理治療中經(jīng)常用到。在心理測驗實施中，這種關(guān)系指的是主試和被試之間一種友好的、合作的、能促使被試最大限度地作好測驗的一種關(guān)系。3.被試誤差及控制方法：即使一個測驗經(jīng)過精心編制，題目取樣具有代表性，又有標(biāo)準(zhǔn)化的實施和積分程序，這種誤差是最難控制的。1..被試技巧與練習(xí)效應(yīng)：被試對測驗的經(jīng)驗或應(yīng)試技巧會影響測驗成績，對測驗的程序和技能熟悉程度不同，所得分?jǐn)?shù)便不能直接比較。任何一個涉及認(rèn)知功能的成績，在第二次應(yīng)用或重復(fù)測量時，都會有練習(xí)效應(yīng)而使測驗成績提高。要控制應(yīng)試技巧和練習(xí)效應(yīng)的影響，可盡量設(shè)法使每個被試對測驗材料的步驟和所需技巧有相同的熟悉程度。2..被試的動機與焦慮因素：1...被試參加測驗的動機不同，會影響其回答問題的態(tài)度、注意力、持久性以及反應(yīng)速度等，從而影響測驗的成績；在成就、智力和能力傾向等變量時，只有被試動機強力才可能盡力回答，取得好成績。動機效應(yīng)在測量態(tài)度、興趣及人格等典型行為表現(xiàn)時也有影響。某些被試若欲給人以好印象，就會考慮主試的期望或社會贊許行為，而不按自己的真實情況回答，從而使測驗分?jǐn)?shù)降低。相反，為了某重動機若欲給人以壞影響，則會使測驗分?jǐn)?shù)升高。2...測驗焦慮是指被試在應(yīng)試前和測試中出現(xiàn)的一種不愉快的、表現(xiàn)為焦慮、擔(dān)心、恐懼和緊張的情緒體驗。適度的焦慮會使人興奮型提高，注意力增強，提高反應(yīng)速度，提高智力測驗、成就測驗和能力傾向測驗的成績。測驗焦慮會受到下列因素影響：a.能力高的人，測驗焦慮一般較低，而對自己能力沒有把握的人，測驗焦慮較高；b.抱負(fù)水平過高，求勝心切，測驗焦慮較高；c.具有某種人格特點，如缺乏自信、患得患失、情緒不穩(wěn)定的人易產(chǎn)生測驗焦慮；d.測驗成績與被試的關(guān)系重大，或被試受到的壓力過大，容易使其產(chǎn)生測驗焦慮；e.經(jīng)常接受測驗的人焦慮較低，而對測驗程序不熟悉，尤其是測驗中采取了新的題目形式或?qū)嵤┏淌綍黾訙y驗焦慮。通過教學(xué)或輔導(dǎo)可以降低測驗焦慮，而熟悉測驗程序也是降低焦慮的有效方法。3..反應(yīng)定勢：亦稱反應(yīng)風(fēng)格，是指獨立于測驗內(nèi)容的反應(yīng)傾向，即由于每個人回答問題的習(xí)慣不同，而使能力相同的被試得到不同的測驗分?jǐn)?shù)。幾種常見的反應(yīng)定勢是：1...求快與求精確的反應(yīng)定勢：一般來講，如果測驗有時間限制，或測驗本身屬于速度測驗，則求精確的反應(yīng)定勢必然降低測驗的成績；如果純粹是難度測驗，則求快的反應(yīng)定勢必然降低測驗成績。2...喜好正面敘述的反應(yīng)定勢：大量研究發(fā)現(xiàn)，被試在無法確定“是非題”的正確答案時，選擇“是”的人往往多于選“否”的人，或者說選“是”的人多于實際上應(yīng)該選“是”的人。3...喜好特殊位置的反應(yīng)定勢：如果被試在測試中完全不知道答案，并不會按照隨機的方法選擇答案，而是偏好某一位置進行選取。4…喜好較長選項的反應(yīng)定勢：有些被試認(rèn)為，選項比較長的，內(nèi)容多的，一般是正確答案，在無法確定答案時，有偏好長選項的反應(yīng)定勢。5…猜測的反應(yīng)定勢：如果不對猜測進行修正的話，那么敢于猜的的被試比謹(jǐn)慎的被試更容易的高分。4.測驗中的社會心理學(xué)問題：1..被試對主試的的需要：1...現(xiàn)實需要；2...受人尊重與自尊需要；3...自我表現(xiàn)的需要；4...對主試權(quán)威性的需要；5...特殊需要；2..主試本身的特點：1...主試的特點：2...主試的動機：3...主試的期望：羅森塔爾效應(yīng)，實驗者所獲得的資料受其本身期望的影響。第2節(jié):測驗的記分及其誤差的校正:1245.對測驗編制者而言：記分標(biāo)準(zhǔn)化應(yīng)該包括選擇和設(shè)計合式的標(biāo)準(zhǔn)化記分程序，考慮分?jǐn)?shù)的分配、權(quán)數(shù)的分配、猜測的處理以及分?jǐn)?shù)是由原始分?jǐn)?shù)表示還是轉(zhuǎn)化成其他形式。對測驗使用者而言：記分標(biāo)準(zhǔn)化則是要求完全按照測驗手冊的規(guī)定和標(biāo)準(zhǔn)答案給予被試分?jǐn)?shù)，有時還可以完全依據(jù)套板或計算機記分。6.記分的基本步驟和要求：@首先是要獲得原始分?jǐn)?shù)，其要求是：1..記錄被試反應(yīng)：2..參考標(biāo)準(zhǔn)答案：主試應(yīng)當(dāng)熟悉掌握記分鍵，特別是非客觀題的記分要求，不得隨意記分。3..計算最后得分并轉(zhuǎn)換原始分?jǐn)?shù)：把所有分?jǐn)?shù)匯總，計算出原始分?jǐn)?shù)的總分。@其次是轉(zhuǎn)換原始分?jǐn)?shù)，其意義和方法是：1..在心理測量中，一般原始分?jǐn)?shù)本身很少有意義，只有將原始分?jǐn)?shù)進行適當(dāng)?shù)霓D(zhuǎn)換處理或與參照標(biāo)準(zhǔn)加以對照，即把原始分?jǐn)?shù)轉(zhuǎn)換為導(dǎo)出分?jǐn)?shù)，測驗分?jǐn)?shù)才有意義。測驗編制者提供的常模表就是原始分?jǐn)?shù)的轉(zhuǎn)換表，它為測驗使用者提供了一種方便易行的由原始分?jǐn)?shù)向?qū)С龇謹(jǐn)?shù)轉(zhuǎn)化的方法。第七章測驗分?jǐn)?shù)的解釋對測驗分?jǐn)?shù)的解釋主要包括兩個方面的問題：1..如何使分?jǐn)?shù)具有意義，即我們必須合理的制度測驗量表以實現(xiàn)測驗結(jié)果的數(shù)量化。又能為不同的測驗導(dǎo)出可比較的量表；2..如果將有意義的信息傳達(dá)給當(dāng)事人，即把測驗分?jǐn)?shù)與常規(guī)比較，依照出個人在測驗量表上的相對等級，從而對個人測驗作業(yè)進行解釋。第1節(jié):參照常模的分?jǐn)?shù)解釋:p1311.常模的團體和常模樣本1..常模團體的性質(zhì)：常模團體是由具有某種共同特征的人所組成的一個群體，或者是該群體的一個樣本。它用一個標(biāo)準(zhǔn)的、規(guī)范的分?jǐn)?shù)表示出來，以提供比較的基礎(chǔ)。1...對編制者而言：常模的選擇主要是基于對測驗將要施測的總體的認(rèn)識，常模團體必須能夠代表該總體。這種工作包括：確定一般總體、確定目標(biāo)總體、確定樣本。2...對測驗使用者：要考慮的問題是，現(xiàn)有的常模團體哪一個最合適。2..常模團體的條件：1...群體的構(gòu)成必須明確界定：在制定常模時，必須清楚地說明所要測量的群體的性質(zhì)與特征。依據(jù)不同的變量確定群體，便可得到不同的常規(guī)。2...常模團體必須是所測群體的代表性樣本：在搜集常模資料時，一般采用隨機取樣或分層取樣的方法，有時可以把兩種策略結(jié)合起來使用。3...樣本的大小要適當(dāng)：總體數(shù)目小，只有幾十個人，需要100%的樣本；如果總體數(shù)目達(dá)，相應(yīng)的樣本也大，一般最低不小于30或100個；全國性常模，一般應(yīng)有2000-3000人為宜。樣本大小適當(dāng)?shù)年P(guān)鍵是樣本要有代表性，從一個較小的但具有代表性的樣本所獲得的分?jǐn)?shù)通常比來自較大的但定義模糊的團體的一組分?jǐn)?shù)還要好。4...標(biāo)準(zhǔn)化樣組是一定時空的產(chǎn)物：我們在一定時間和空間中抽取的標(biāo)準(zhǔn)化樣組，它只能反映當(dāng)時當(dāng)?shù)氐那闆r。在選擇合適常模時，注意選擇較為新近的常模。3..取樣：從目標(biāo)人群中選擇有代表性的樣本。從統(tǒng)計學(xué)看取樣分為：隨機抽樣和非隨機抽樣。具體方法：1...簡單隨機抽樣：按照隨即表順序選擇被試構(gòu)成樣本，或者將抽樣范圍內(nèi)的每個人或者每個抽樣單位編號，再隨即選擇，可以避免由于標(biāo)記、姓名、性別或其它社會贊許性偏見而造成抽樣誤差。2...系統(tǒng)抽樣：有時在總體數(shù)目為N的情況下，若要選擇K分之一的被試作為樣本，則可以在抽樣范圍內(nèi)選擇每個第K個人來構(gòu)成樣本。3...分組抽樣：有時總體數(shù)目較大，無法進行編號，而且群體又有多樣性，這時可以先將群體進行分組，再在組內(nèi)進行隨機取樣。4...分層抽樣：在確定常模時，最常用的是分層抽樣方法。a.分層比例抽樣：b.分層非比例抽樣：4..常模分?jǐn)?shù)和常模：1...常模分?jǐn)?shù)：就是施測常模樣本被試后，將被試者的原始分?jǐn)?shù)按一定規(guī)則轉(zhuǎn)換出來的導(dǎo)出分?jǐn)?shù)。2...常模分?jǐn)?shù)構(gòu)成的分布，就是通常所說的常模，它是解釋心理測驗分?jǐn)?shù)的基礎(chǔ)。常模一般有：一般常模與特殊常模之分。一般常模：測驗手冊上所列的常模通常為一般常模，不一定適合使用者的具體情況；特殊常模：是為非典型團體建立的，一般比為小團體建立的常模范圍更窄。優(yōu)點：可使被試的結(jié)果與最接近的人進行比較缺點：不容許分?jǐn)?shù)在較廣范圍內(nèi)作解釋，測驗使用者可將特殊常模與一般常模結(jié)合起來。2.常模的類型及解釋：Ⅰ.發(fā)展常模：人的許多心理特質(zhì)如智力、技能等，是隨著時間以有規(guī)律的方式發(fā)展的，所以可將個人的成績與各種發(fā)展水平的人的平均表現(xiàn)相比較。根據(jù)這種平均表現(xiàn)所制成的量表就是發(fā)展常模，亦稱年齡量表。1..發(fā)展順序量表：因為它告訴人民多大的兒童具備什么能力或行為就表明其發(fā)育正常，相應(yīng)能力或行為早于某年齡出現(xiàn)，說明發(fā)育超前，否則即為發(fā)育滯后。最早的一個范例是格塞爾發(fā)展程序表，其中按月份顯示兒童在運動水平、適應(yīng)性、語言、社會性四個方面的大致發(fā)展水平。2..智力年齡：比內(nèi)-西蒙量表中首先使用智力年齡的概念。智齡是年齡量表上度量智力的單位。求智齡分方法很簡單，只要將兒童在測驗上的分?jǐn)?shù)與各年齡組的一般兒童比較，便可給予一個年齡分?jǐn)?shù)。1...如吳天敏修訂的比內(nèi)－西蒙量表中，每個年齡都有6個測題，答對每題則得智齡2個月。假如某兒童6歲組的題目全部通過，7歲組通過4題，8歲組通過3題，9歲組通過2題，其智力年齡的計算為：6（歲）＋4×2（月）＋3×2（月）＋2×2（月）=6歲＋18月=7歲6個月。2...智力年齡：如果為每個年齡水平都編制一些適當(dāng)?shù)念}目，便可得到一個評價兒童智力發(fā)展水平的年齡量表。一個兒童在年齡量表上所得的分?jǐn)?shù)，就是最能代表他的智力水平的年齡。這種分?jǐn)?shù)叫做智力年齡，簡稱智齡。3...另外一種使用年齡量表的方法是不把題目分到各年齡組。首先根據(jù)被試在整個測驗中正確反應(yīng)的題數(shù)或反應(yīng)時間而得一原始分?jǐn)?shù)，而將標(biāo)準(zhǔn)化樣本中每個年齡組的平均原始分?jǐn)?shù)作為年齡常模。通過將原始分?jǐn)?shù)與年齡常模對比，便可求得每個人的智齡。例如某個兒童的原始分?jǐn)?shù)等于8歲組的平均數(shù)，則其智力年齡就是8歲。4...一個人的智齡并不一定和他的實齡相符，聰明的兒童，其智齡高于實齡；愚笨的兒童，其智齡低于實齡；只有普通兒童，其智齡與實際年齡相近似。3..年級當(dāng)量：實際上就是年級量表，測驗結(jié)果說明被試屬哪一年級的水平，在教育成就測驗中最常用。年紀(jì)量表的單位通常為10個月間隔。Ⅱ.百分位常模及解釋：百分位常模包括百分等級和百分點、四分位數(shù)和十分位數(shù)。1..百分等級：是應(yīng)用最廣的表示測驗分?jǐn)?shù)的方法。一個測驗分?jǐn)?shù)的百分等級是指在常模樣本中低于這個分?jǐn)?shù)的人的百分比。其計算分為：未分組資料的百分等級計算；分組資料的百分等級求法。2..百分點：也稱百分位數(shù)，與百分等級的計算方法正好相反，百分等級是計算低于某測驗分?jǐn)?shù)的人數(shù)百分比，而百分點則是計算處于某一百分比例的人對應(yīng)的測驗分?jǐn)?shù)是多少。百分點的計算可根據(jù)直線內(nèi)插法進行。在實際應(yīng)用中，我們一般既可以由原始分?jǐn)?shù)計算百分等級，又可以由百分等級確定原始分?jǐn)?shù)。通過這樣的雙向方式編制的原始分?jǐn)?shù)與百分等級對照表，就是百分位常模。3..四分位數(shù)和十分位數(shù)：此二者是百分位數(shù)的兩個變式，其含義相似。Ⅲ.標(biāo)準(zhǔn)分常模及解釋：1..標(biāo)準(zhǔn)分常模：標(biāo)準(zhǔn)分?jǐn)?shù)是將原始分?jǐn)?shù)與平均分?jǐn)?shù)的距離以標(biāo)準(zhǔn)差為單位表示出來的量表。它的基本單位是標(biāo)準(zhǔn)差。常見的標(biāo)準(zhǔn)分?jǐn)?shù)有：z分?jǐn)?shù)、Z分?jǐn)?shù)、T分?jǐn)?shù)、標(biāo)準(zhǔn)分?jǐn)?shù)、離差智商（IQ）2..線性轉(zhuǎn)換的標(biāo)準(zhǔn)分?jǐn)?shù)：z分?jǐn)?shù)為最典型的線性轉(zhuǎn)換的標(biāo)準(zhǔn)分?jǐn)?shù)。3..非線性轉(zhuǎn)換的標(biāo)準(zhǔn)分?jǐn)?shù)：當(dāng)原始分?jǐn)?shù)不是常態(tài)分布時，也可以使之常態(tài)化，這一轉(zhuǎn)化過程就是非線性的。與線性導(dǎo)出分?jǐn)?shù)一樣，常態(tài)化標(biāo)準(zhǔn)分?jǐn)?shù)也可以被轉(zhuǎn)化成任何方便的形式。當(dāng)以50為平均數(shù)（即加上一個常數(shù)50），以10為標(biāo)準(zhǔn)差（乘以一個常數(shù)10）來表示時，通常叫做T分?jǐn)?shù)。1...T分?jǐn)?shù)：T＝50+10z`；這一概念最早由麥克爾于1939年提出，含有紀(jì)念推孟和桑代克二氏。2...標(biāo)準(zhǔn)九分：是另一較知名的標(biāo)準(zhǔn)分?jǐn)?shù)系統(tǒng)，其量表是個9級的分?jǐn)?shù)量表，它是以5為平均數(shù)，以2為標(biāo)準(zhǔn)差的一個分?jǐn)?shù)量表。3...常態(tài)化的標(biāo)準(zhǔn)分?jǐn)?shù)還有標(biāo)準(zhǔn)十分：平均數(shù)5，標(biāo)準(zhǔn)差1.5；標(biāo)準(zhǔn)二十分：平均數(shù)10，標(biāo)準(zhǔn)差3；3.智商及其意義：1..比率智商：比內(nèi)－西蒙量表傳入美國后，斯坦福大學(xué)推孟教授于1916年對其修訂而成斯坦福-比內(nèi)量表。它在心理年齡的基礎(chǔ)上，以智商表示測驗結(jié)果，即以后所說的比率智商。2..比率智商定義：心理年齡（MA）與實足年齡（CA）之比，將商數(shù)乘以100，即IQ=MA/CAх1003..比率智商提出后，普遍被心理學(xué)界和醫(yī)學(xué)界所接受。但由于個體智力增長是一個由快到慢再到停止的過程，即心理年齡與實足年齡并不同步增長，所以比率智商并不適合于年齡較大的被試；另外，由于不同年齡組兒童的比率智商分布的情況是不一樣的，因而相同的比率智商分?jǐn)?shù)在不同年齡就具有不同意義?；谶@種考慮，心理學(xué)家韋克斯樂提出了離差智商的概念。4..離差智商：是一種以年齡組為樣本計算而得的標(biāo)準(zhǔn)分?jǐn)?shù)，為使其與傳統(tǒng)的比率智商基本一致，韋克斯勒將離差智商的平均數(shù)定為100，標(biāo)準(zhǔn)差定為15.所以離差智商建立在統(tǒng)計學(xué)的基礎(chǔ)之上，它表示的是個體智力在年齡組中所處的位置，因而是表示智力高低的一種理想的指標(biāo)。由于離差智商的提出，過去曾使用比率智商的許多測驗在后來也使用了離差智商，如在1960年修訂的斯一比測驗中，就使用的是平均數(shù)為100，標(biāo)準(zhǔn)差為16的標(biāo)準(zhǔn)分?jǐn)?shù)量表。必須指出，從不同測驗獲得的離差智商只有當(dāng)標(biāo)準(zhǔn)差相同或接近時才可以比較，標(biāo)準(zhǔn)差不同，其分?jǐn)?shù)的意義便不同。5..百分位與標(biāo)準(zhǔn)分?jǐn)?shù)的共同之處：將被試的分?jǐn)?shù)在團體內(nèi)做橫向比較，而發(fā)展量表卻是與不同發(fā)展水平的人做縱向比較。4.常模分?jǐn)?shù)的表示方法：轉(zhuǎn)換表和剖析圖。1..轉(zhuǎn)換表：有時也稱常模表，它是最簡單而且最基本的表示常模的方法。2..剖析圖：第2節(jié):參照效標(biāo)的分?jǐn)?shù)解釋:p1525.內(nèi)容參照分?jǐn)?shù)：在效標(biāo)參照測驗中，一種標(biāo)準(zhǔn)是對測驗所包括的材料熟練或掌握的程度，將分?jǐn)?shù)與此種標(biāo)準(zhǔn)比較可以搞清一個人知道什么和能做什么。因為涉及的主要是測驗的內(nèi)容，所以可以把這種分?jǐn)?shù)叫做內(nèi)容參照分?jǐn)?shù)。結(jié)果參照分?jǐn)?shù)：另一個比較標(biāo)準(zhǔn)是外在效標(biāo)，即用預(yù)期的效標(biāo)成績來解釋測驗分?jǐn)?shù)，因為涉及的是最后來的結(jié)果，所以把這種分?jǐn)?shù)叫做結(jié)果參照分?jǐn)?shù)。6.參照效標(biāo)測驗是格拉賽提出的。7.效標(biāo)參照測驗優(yōu)點：1..不象常模參照測驗?zāi)菢樱鼓芰娬唑湴磷詽M，能力差者長期遭受挫折，效標(biāo)參照測驗巧妙地避開了對得分、名次的過分糾纏，使各人都有自己的奮斗目標(biāo)和希望。2..常模參照測驗無法反映出被試的真正能力和水平，甚至對被試到底能做什么，不能做什么也不清楚。效標(biāo)參照測驗既能發(fā)現(xiàn)個人特有的長處，也會找到問題的癥結(jié)所在，而常模參照測驗就做不到。3..從常模參照測驗的得分不能得到被試在外在效標(biāo)上的表現(xiàn)，效標(biāo)參照測驗則可直接作出解釋，有時測驗結(jié)果的本身可能就是效標(biāo)。4..效標(biāo)參照測驗與教師在教學(xué)過程中的自編測驗關(guān)系更為密切，因而效標(biāo)參照測驗的理論概念更易為教師接受和應(yīng)用。8.內(nèi)容參照：又叫范圍參照，主要是依據(jù)被試對某個確定的材料內(nèi)容或技能的掌握程度和熟悉程度來表示和解釋測驗結(jié)果。9.內(nèi)容參照的表示方法：掌握分?jǐn)?shù)和正確百分?jǐn)?shù)。1..掌握分?jǐn)?shù)：訂出一個判別被試是否通過或掌握的最低分?jǐn)?shù)，即最低掌握水平，此分?jǐn)?shù)以

人人文庫> 全部分類> 行業(yè)資料 > 管理策劃

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

自考心理測量-復(fù)習(xí)材料

文檔簡介

溫馨提示

最新文檔

評論

自考心理測量-復(fù)習(xí)材料

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔