心理統(tǒng)計學精髓學習知識重點_第1頁
心理統(tǒng)計學精髓學習知識重點_第2頁
心理統(tǒng)計學精髓學習知識重點_第3頁
已閱讀5頁,還剩5頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、第一節(jié)正態(tài)分布1正態(tài)分布的特點 首先,鐘形對稱分布其次,|X | 1.96 的概率是95%; |X |2.58 的概率是99%;將|X| 1.96稱為決策水平0.05上的小概率事件,將|X | 2.58稱為決策水平0.01上的小概率事件。其中,X是總體中的隨機抽取的一個數(shù)值;卩為總體 平均值,第三,曲線兩端無限靠近橫軸。2應(yīng)用(1) 某學校三年級學生的平均智商是100,其標準差為15.那么,從中隨機抽取 一個學生,其智商大于等于130的概率是多少?其智商小于等于 85的概率是多 少?(2) 某企業(yè)生產(chǎn)的產(chǎn)品重量均值為100,標準差為15。質(zhì)檢人員從市場上隨機 抽取一件,發(fā)現(xiàn)其重量為115,僅從

2、質(zhì)量上看,如何用統(tǒng)計學視角來判斷此產(chǎn)品 是否屬于這一企業(yè)(決策水平為 0.05)。(3) 在上題中,如果質(zhì)檢人員從市場上發(fā)現(xiàn)一個產(chǎn)品的重量為140,那么,僅從質(zhì)量上判斷,此產(chǎn)品是否屬于這一企業(yè)(決策水平為0.01)。3數(shù)據(jù)處理一讓學生報告自己的身高、體重以及自己的肥胖感知(我認為自己很肥胖) 、以及 自己的性別。數(shù)據(jù)處理任務(wù)包括:報告三個變量的莖葉圖,并大致判斷其分布形 態(tài);報告三個變量的平均值、中數(shù)以及中位數(shù)、標準差。第二節(jié)標準正態(tài)分布將總體的平均值記為卩,標準差記為c,將其中的數(shù)據(jù)或個案記為 X。那么,使用X公式z ,就可以將正態(tài)分布轉(zhuǎn)化為標準正態(tài)分布。標準正態(tài)分布是正態(tài)分布的一個特例,

3、因此,第一節(jié)的內(nèi)容皆可以標準正態(tài)分布 進行直譯。思考題:標準正態(tài)分布的標準差是多少?其平均值又是多少?對于標準正態(tài)分布而言,|z| 1.96為決策水平0.05上的小概率事件,將|z| 2.58 為決策水平0.01上的小概率事件思考題:某地三年級學生的身高是一個總體,并且是正態(tài)分布,均值為160厘米, 標準差為5厘米。研究者隨機抽取一個學生,其身高為170厘米。那么,此生在 標準正態(tài)分布中的身高數(shù)值應(yīng)該為多少?這次抽到他是一個小概率事件嗎?為 什么?練習:將“數(shù)據(jù)處理一”中三個變量轉(zhuǎn)化為標準正態(tài)分布,并報告其莖葉圖。第三節(jié)樣本均值的分布1存在一個非常數(shù)總體,無論其為何種分布。并且此總體平均值卩與

4、標準差C已 知。用(放回式)隨機抽樣,獲得無數(shù)個容量相等的樣本 ,當每一個樣本容量大 于30時,樣本均值的分布就是正態(tài)分布。2將樣本平均值記為X,標準差記為S,容量記為n,則此分布的標準誤 3樣本均值分布的特點:首先,是正態(tài)分布,第二,此分布的理論均值等于總體均值卩第三,其標準誤 X第四,X 1.96X的概率是95%將X1.96 X稱為決策水平為0.05上的小概率事件;|X |2.58 X的概率是99%將|X |2.58 X的事件稱為決策水平為0.01上的小概率事件;第五,用公式Zx仝一將其標準化,則得到標準正態(tài)分布。那么,IZx| 1.96X為決策水平0.05上的小概率事件,將| zX|2.

5、58為決策水平0.01上的小概率事件。第四節(jié)統(tǒng)計檢驗的邏輯如果一個樣本是從某一總體中隨機抽樣得來的,那么,這一個樣本必定能夠代表這一總體的特征,其含義有三。其一,兩者的分布形態(tài)是一致的;其二,兩者的 方差是一致的;其三,兩者的平均值是一致的?!耙恢隆钡慕y(tǒng)計含義是,在0.05或者0.01的決策水平上,是沒有差異的。當然,隨機樣本不能百分百地代表總體的特征, 當這樣的樣本不能代表總體特征 時,就說是小概率事件發(fā)生了。在科學研究中,總體往往是一個理論上的或者特定的描述,包括其分布形態(tài)、平 均值以及其標準差。而樣本往往來自于現(xiàn)實的抽取中, 通過比較三個方面,就可 以決斷這個樣本是不是屬于這個理論或者特

6、定的總體。比如,某地區(qū)90年代的14歲兒童的平均身高為卩厘米,標準差為c厘米,并且 為正態(tài)分布?,F(xiàn)在來考察這一地區(qū)14兒童的身高是否與90年代同齡兒童的身高 是否一致。在統(tǒng)計學上,只能這樣做:從現(xiàn)在的 14歲兒童中,隨機進行抽樣,比如,抽取 n個兒童構(gòu)成一個樣本,其平均值為 ,X標準差為So由于是真正的隨機抽樣,那么,決策者會檢驗三個方面。第一,看此樣本的分布 是否與(90年代的那個)特定總體的分布形態(tài)有一致性,如果兩者分布形態(tài)一 致,即樣本也是正態(tài)分布,那么第二,看此樣本的方差是否與特定總體的方差具 有一致性,如果兩者方差一致,那么第三,看此樣本的平均值是否與特定總體的 均值具有一致性,如果

7、一致,則可以認為此樣本依然屬于那個特定的總體,或者說,如今此地區(qū)14歲兒童的身高依然與90年代一樣。在上述中,“一致”是指在0.05或者0.01的水平上進行判斷,即沒有發(fā)生小概率事件。如果小概率事件發(fā)生,則說明“不一致”,或者說“具有顯著性差異”。 關(guān)于分布形態(tài)一致性檢驗與方差一致性檢驗在后面再學習。這里,我們先認為此樣本分布形態(tài)和方差皆與那個特定總體的一致,那么,就只剩下檢驗樣本均值是否與那個特定總體的一致。統(tǒng)計學上的檢驗過程表述如下。Ho:此樣本是從90年代的總體中隨機抽取的,那么,就有X x 1.96 x計算過程:因為XX 肩,所以只需要證明X1.96二是否成立,即n1.96是否成立。如

8、果成立,則認為Ho是正確的;反之,如果1.96,則說明小概率事件發(fā)生了; 一次隨機抽樣,就發(fā)生了小概率事件,那么我寧愿在0.05的水平上相信Ho是不正確的,也就是說,此樣本不是 從90年代的那個樣本中隨機抽取的,或者說,這個樣本不屬于這個特定的總體。 在上面的邏輯過程中,H0的表述非常重要,因為,只有先假定此樣本是能夠代表這個特定總體,才能套用公式|X X| 1.96 X,這是為什么?這是因為,從任 何非常數(shù)總體中,隨機抽取無數(shù)個容量相等的大樣本(通常指容量大于等于30), 那么樣本的均值(無數(shù)個X )形成正態(tài)分布(其理論均值X =,標準誤x f=)那么,X7n1.96 X的概率是95% 也即

9、,X1.96的概率是95%反之就是0.05水平上的小概率事件發(fā)生了。因此,理解H0與否,關(guān)系著統(tǒng)計檢驗的理解與否。練習:從“數(shù)據(jù)處理一”中隨機生產(chǎn)一個樣本,并且報告此樣本均值的標準分數(shù)。 看全班同學抽取到的平均值有幾個是小概率事件。第四節(jié)t分布存在一個非常數(shù)總體,無論其為何種分布。并且此總體平均值卩已知,但其標準 差c未知。用(放回式)隨機抽樣,獲得無數(shù)個容量相等的樣本,樣本均值X的分布就是t分布。t分布的特點如下表述。首先,t分布為對稱分布,并且左右對稱其次,t分布是一簇曲線,并且每個df (即自由度,df=n-1 )皆有自己的分布形 態(tài)。df越大,t分布越接近正態(tài)分布。,其中S是樣本的標準

10、差,s=J咅。,其理論均值 x等于總體均值。第三,在此情況下,樣本均值分布的標準誤sSX 第四,|x X t0.05水平上的臨界值SX的概率是95%,而X X t0.05水平上的臨界值SX則為 0.05水平上的小概率事件。X X t°.01水平上的臨界值Sx的概率是99%,而to.01水平上的臨界值Sx則為0.01水平上的小概率事件t檢驗練習某心理量表的常模均值是14分。100名被試經(jīng)過測試發(fā)現(xiàn)平均分為16.4 (標準 差為1.44)。請檢驗以上樣本是否與量表的常模均值有顯著差異(假設(shè)有關(guān)的分 布是正態(tài)分布)。決策過程壬上44 =0.144。 n J00首先,提出虛無假設(shè):H。:如果

11、此樣本是從(均值為14的)特定總體中隨機抽 取的,那么,在0.05的決策水平上,應(yīng)該有 X X t0.05水平上的臨界值sX 。第三步,計算。 X =14, X X =16.4-14=2.4。sX表,發(fā)現(xiàn)當df=100-1=99時t°.°5水平上的臨界值2.00,因此, to.o5水平上的臨界值 Sx =2.00 0.144=0.288 , 2.4f 0.288可見,在0.05的水平上,|XX| t0.05水平上的臨界值sX是不成立的,這樣,小概率事件發(fā)生了。決策結(jié)果是,此樣本(均值為 16.4 )不是從(均值為14的)特定 總體中隨機抽取也來的,而是從另一個均值顯著大于1

12、4的總體中隨機抽取出來的。進一步推斷,這100名學生代表著一個智商遠遠大于14的總體。第五節(jié)獨立樣本t檢驗存在一個非常數(shù)總體,無論其為何種分布。并且此總體平均值卩與標準差c皆未 知。用(放回式)隨機抽樣,得到兩個獨立的樣本,它們的平均值分別為X1與X2, 標準差分別為®與S2,樣本容量分別為 n1與壓X1的分布為t分布,自由度df= m-1; X2的分布為t分布,自由度df= n2-1;當n1與n2皆較大時,兩個樣本皆可以較好地代表這個總體,這意味著,兩個樣本的方差 致(或同質(zhì)),兩個樣本的平均值一致,即 X1與X2在統(tǒng)計學上是相等的。均值之差的分布具有自由度df= df1 df2=

13、山+ n2-2兩個樣本均值之差(X1 - X2 )也是t分布,與相關(guān)的結(jié)論表述如下: 首先,其次,均值之差分布的標準誤為sX1 X2 ,j2S聯(lián)合2,其中S聯(lián)合ss, SS2df1 df2 '第三.X1 X2t0.05水平上的臨界值SX1 X2的概率是95%X1 X2t0.05水平上的臨界值sx1 X2的概率是5%稱為0.05水平上的小概率事件。.X1X1 x2練習:X2t°.01水平上的臨界值 Sx X2的概率是99%,t0.01水平上的臨界值Sx x2的概率是1%稱為0.01水平上的小概率事件。一個研究者對雙性化心理特征感興趣。他在大學一 年級新生中選取了 10名雙性化和

14、20名非雙性化對其 施測雙性化量表。10名雙性化學生在量表上得到的 平均分是X125,S3670 ;0名非雙性化學生的平均分是X218,SS21010。這些數(shù)據(jù)能否表明兩組間存在差異? (=0.01)決策過程如下表述。首先,如果這兩個樣本為同一總體中隨機得來的獨立樣本,那么,兩個樣本的方差應(yīng)該一致或者同質(zhì)。關(guān)于樣本方差同質(zhì)性檢驗以后再學?,F(xiàn)在我們暫且認為兩個樣本方差同質(zhì)。其次,提出虛無假設(shè) H。:如果這兩個樣本為同一總體中隨機得來的獨立樣本,那么,在0.01的決策水平上,就應(yīng)該有X1 X2 t°.01水平上的臨界值Sx1 X 2計算過程。X1 X2 =17,在df 28時,t

15、6;.01水平上的臨界值=2.763S聯(lián)合SS1 S' (670 1010)/28 60,sXdf1 df21t0.05水平上的臨界值 sx1 乂2=2.7633=8.289X2可見X13X2X1率事件發(fā)生了。 一次實驗或抽樣就發(fā)生了小概率事件,因此, 是來自同一個總體,雙性化學生(總體)的均值要顯著高t0.01水平上的臨界值 Sx1 X2 是不成立的,t0.01水平上的臨界值我們寧可相信,于非雙性化學生(總體)的均值。sX1 X2,小概兩個樣本并不練習:在“數(shù)據(jù)處理一”中,有三個變量的數(shù)據(jù)。請比較男性與女性在三個變量 上是否有顯著的差異。要求寫出假設(shè),并且解釋處理結(jié)果的關(guān)鍵數(shù)據(jù)。第五

16、節(jié)獨立樣本t檢驗中的方差齊性檢驗 首先介紹F分布。從一個正態(tài)總體中,隨機抽取兩個樣本,它們的方差分別為s2與s2,F(xiàn)將較大者視為S2)是F分布。S2F0.05水平上臨界值的概率是95%此F0.05水平上臨界值,就認為在0.05的0.01水平上的情形類推。時,就認為兩個樣本方差同質(zhì)(或者相齊、一致) ;- 水平上,兩者方差不相齊,或者說它們來自不同的總體。在 練習:一個研究者對雙性化心理特征感興趣。他在大學一 年級新生中選取了 10名雙性化和20名非雙性化對其施測雙性化量表。10名雙性化學生在量表上得到的 平均分是X125,SSi 670 ;0名非雙性化學生的平均分是X218,SS21010。請

17、檢驗兩個樣本的方差是否同質(zhì)(=0.01 )。下面是決策過程。首先,提出虛無假設(shè) H0:如果兩個樣本是隨機來自于同一個總體,那么,就應(yīng)該有 笙FS2 F0.0i水平上臨界值。26702 SQ 1010S 74.4474.44, S2-53.158。一 =1.409df119S2 53158查表,在分子df1 9,分母df2 19的情況下,F(xiàn)0.01水平上臨界值=3.52。所以,在0.01的決策S2 水平上,篤S2樣本各自代表的總體具有一致的方差。計算過程。Si2 SS|df153.158。F0.0i水平上臨界值 是成立的,因此接受 H 0。所以,在0.01的決策水平上,兩個練習:在“數(shù)據(jù)處理一”

18、中,有三個變量的數(shù)據(jù)。請比較男性與女性在三個變量 上的方差是否具有一致性。要求寫出假設(shè),并且解釋關(guān)鍵結(jié)果的含義。第六節(jié)相關(guān)樣本t檢驗從某一人群中隨機抽取一個樣本(容量為n),然后測量其打字水平,對這一樣本培訓一段時間,再次測量其打字水平。計算出每個被試前后測量的差異D,根據(jù)D的情況來判斷培訓是否有效。以上情況應(yīng)該用相關(guān)樣本t檢驗。 檢驗過程:首先,確保差異數(shù)據(jù) D是正態(tài)分布(如果不符合正態(tài)分布,則用非參數(shù)檢驗) 其次,提出虛無假設(shè) H0:當培訓沒有效果時, D便是一個隨機樣本,它來自均值為 自由度為n-1的t分布,這樣,在0.01的決策水平上,應(yīng)該有|D2Dt0.01水平上的臨界值 昂,其中,D2 n df最后,根據(jù)計算結(jié)果進行決策。 如果小概率事件發(fā)生,就拒絕虛無假設(shè),做出與虛無假設(shè)相 反的結(jié)論。實驗:產(chǎn)生“數(shù)據(jù)處理二”。SDn,sD第七節(jié)方差分析1獨立樣本方差分析從一個正態(tài)總體中,隨機抽取K個樣本,如果這K個樣本皆能很好地代表同一個 總體,那么,必定有(1)K個方差一致(2)K個樣本分布一致,皆為正態(tài)分布;(3)K個樣本均值一致,此時,在F觀測值MS組內(nèi) F0.05水平(df組間,df組內(nèi))0.05的決策水平上,必有, 三個樣本均值相等其中MS組間SQi間/ df組間,MS組內(nèi)SQ且內(nèi)/ df組內(nèi)2重復

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論