版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、心理學(xué)統(tǒng)計(jì)第七部分非參數(shù)統(tǒng)計(jì) 第十九章 二項(xiàng)分布 心理學(xué)統(tǒng)計(jì)第七部分非參數(shù)統(tǒng)計(jì) A基本概念 二項(xiàng)分布的來源 二項(xiàng)分布的正態(tài)近似 比率z檢驗(yàn) 心理學(xué)統(tǒng)計(jì)第七部分非參數(shù)統(tǒng)計(jì) 本書前面的章節(jié)主要介紹了參數(shù)統(tǒng)計(jì)的方法,如 果變量為等距或等比數(shù)據(jù),且數(shù)據(jù)分布服從正態(tài) 分布(或t分布等),那么我們可以采用參數(shù)統(tǒng)計(jì) 方法進(jìn)行分析。 如果所有數(shù)據(jù)都是稱名或者順序數(shù)據(jù),或者等距/ 等比數(shù)據(jù)不滿足參數(shù)統(tǒng)計(jì)的分布假設(shè),就需要采 用非參數(shù)統(tǒng)計(jì)方法。 比如,期末考試6道判斷題,一個學(xué)生她答對多少 道題才算她考試通過呢? 心理學(xué)統(tǒng)計(jì)第七部分非參數(shù)統(tǒng)計(jì) 對于這樣的問題,即使這個學(xué)生完全不會,那她 也很可能蒙對3道題,那她蒙
2、對4道、5道、6道的 概率是多少呢? 根據(jù)概率的乘法原則,幾個獨(dú)立事件同時(shí)出現(xiàn)的 概率等于這些事件發(fā)生概率之積。 這樣做對X道題的概率為 這個公式代表的分布稱為二項(xiàng)分布。 XXX CXP 6 6 )5 . 01 (5 . 0)( 心理學(xué)統(tǒng)計(jì)第七部分非參數(shù)統(tǒng)計(jì) 當(dāng)一個事件或者觀察可以被分類到兩個具有一定 發(fā)生概率的類別中的一個且是唯一一個時(shí)(男女、 對錯等),就可能產(chǎn)生一個二項(xiàng)分布,也成為伯 努利分布;這樣的事件被稱為二分事件。 對應(yīng)的兩個類別的概率通常用P和Q表示,P+Q=1. 扔硬幣就是一個典型的二分事件,P=Q=0.5,隨 著試驗(yàn)次數(shù)(扔的次數(shù))N增加,二分事件所對 應(yīng)的發(fā)生概率P和Q不會
3、變化。 通常把第一類別(概率P的時(shí)間)的實(shí)驗(yàn)次數(shù)稱 為X,即二項(xiàng)分布的變量。 心理學(xué)統(tǒng)計(jì)第七部分非參數(shù)統(tǒng)計(jì) 上面的問題中,P=Q,做對X道判斷題的概率分 布如下圖所示。 隨著試驗(yàn)的總次數(shù)N增加,二項(xiàng)分布越來越接近 正態(tài)分布。 心理學(xué)統(tǒng)計(jì)第七部分非參數(shù)統(tǒng)計(jì) 如果考試題目為單選題(三選一),P不等于Q, 則二項(xiàng)分布不對稱。 即使P不等于Q,但只要N足夠大,二項(xiàng)分布也越 來越對稱,越來越接近正態(tài)分布。 心理學(xué)統(tǒng)計(jì)第七部分非參數(shù)統(tǒng)計(jì) N足夠大的標(biāo)準(zhǔn): 如果P=0.5,當(dāng)N大于25時(shí),二項(xiàng)分布近似于正態(tài) 分布; 如果P不接近0.5時(shí),NPQ最少是9時(shí)才可將二項(xiàng) 分布近似為正態(tài)分布。 心理學(xué)統(tǒng)計(jì)第七部分非
4、參數(shù)統(tǒng)計(jì) 總之,對于二分事件,只要N足夠大,二項(xiàng)分布 就接近于一個均值為NP,標(biāo)準(zhǔn)差為 的正 態(tài)分布。 如果期末考試題為判斷題,總題數(shù)50,該同學(xué)做 對多少道才算她通過呢? 一般來說,只要她做的題目數(shù)大于一半,且概率 足夠?。?.5或 P100時(shí) 可不做連續(xù)性校正。 NPQ NPX z 5 . 0 心理學(xué)統(tǒng)計(jì)第七部分非參數(shù)統(tǒng)計(jì) 做出統(tǒng)計(jì)推斷 Z分?jǐn)?shù)落在拒絕區(qū)域外,接受零假設(shè),即嬰 兒對面孔沒有注意偏好。 96. 164. 1 5 . 0*5 . 0*30 5 . 05 . 0*30205 . 0 NPQ NPX z 心理學(xué)統(tǒng)計(jì)第七部分非參數(shù)統(tǒng)計(jì) 符號檢驗(yàn)的前提假設(shè): 二分事件:每個簡單事件或者
5、試驗(yàn)只屬于兩個分 類中的一個或另一個,而不會同時(shí)在兩個分類或 第三個分類中,P+Q=1; 獨(dú)立事件:實(shí)驗(yàn)中的每次試驗(yàn)互不干擾; 固定過程:P和Q在實(shí)驗(yàn)的每輪試驗(yàn)中保持不變; 正態(tài)近似:如果N不夠大,需要查符號檢驗(yàn)對應(yīng) 的表格,不能用正態(tài)逼近; 任意分布檢驗(yàn):因變量分布可不是正態(tài)分布。 心理學(xué)統(tǒng)計(jì)第七部分非參數(shù)統(tǒng)計(jì) 在二分事件中,最常見的就是賭徒謬誤,即認(rèn)為 事件的概率會在一串某一分類的結(jié)果接連出現(xiàn)后 改變來彌補(bǔ)損失以保證分類間的平衡。 比如,我們知道扔硬幣很多次,正面朝上的次數(shù) 和背面朝上的次數(shù)將接近相等,所以當(dāng)連續(xù)幾次 都是正面朝上時(shí),我們會覺得下次背面朝上的概 率會變大,這就是賭徒謬誤。
6、實(shí)際上,由于每次拋硬幣都是與之前無關(guān)的獨(dú)立 事件,因此正面朝上的概率不會變。 心理學(xué)統(tǒng)計(jì)第七部分非參數(shù)統(tǒng)計(jì) 符號檢驗(yàn)的應(yīng)用 當(dāng)只知道配對觀測值的差異方向而不知道差異量 或者差異量遠(yuǎn)不能近似于正態(tài)分布時(shí),不能采用 配對t檢驗(yàn),應(yīng)該采用符號檢驗(yàn); 當(dāng)配對t檢驗(yàn)和符號檢驗(yàn)都可以應(yīng)用時(shí),符號檢驗(yàn) 比配對t檢驗(yàn)的統(tǒng)計(jì)檢驗(yàn)力要低。 之前講過的皮爾遜相關(guān)和斯皮爾曼等級相關(guān) 的關(guān)系與此類似。 心理學(xué)統(tǒng)計(jì)第七部分非參數(shù)統(tǒng)計(jì) 第二十章 卡方檢驗(yàn) 心理學(xué)統(tǒng)計(jì)第七部分非參數(shù)統(tǒng)計(jì) A基本概念 卡方分布 期望頻次和觀測頻次 卡方統(tǒng)計(jì)量 卡方臨界值 各種不同的單因素卡方檢驗(yàn) 心理學(xué)統(tǒng)計(jì)第七部分非參數(shù)統(tǒng)計(jì) 上一章中我們介紹了
7、二分事件的計(jì)數(shù)數(shù)據(jù)服從二 項(xiàng)分布,可以采用符號檢驗(yàn)對二者差異進(jìn)行檢驗(yàn)。 比如從我們心理學(xué)院的兩個專業(yè)中找30名同學(xué)去 參加義務(wù)勞動,師范類找了20個人,非師范類找 了10個人,非師范生認(rèn)為挑選不公平,剝奪了他 們?yōu)樯鐣鲐暙I(xiàn)的權(quán)利,那么這次挑選真的不公 平嗎? 心理學(xué)統(tǒng)計(jì)第七部分非參數(shù)統(tǒng)計(jì) 我們可以通過符號檢驗(yàn)來分析 零假設(shè):兩個專業(yè)同學(xué)被選的機(jī)會均等,即P=0.5 顯著水平選擇0.05雙側(cè) N=30,近似于正態(tài)分布,0.05顯著水平下,拒絕 區(qū)域?yàn)榇笥?.96或者小于-1.96 心理學(xué)統(tǒng)計(jì)第七部分非參數(shù)統(tǒng)計(jì) 采用連續(xù)性校正的公式 做出統(tǒng)計(jì)推斷 接受零假設(shè),兩個專業(yè)的學(xué)生被選的概率是 相等的。
8、 96. 164. 1 5 . 0*5 . 0*30 5 . 05 . 0*30205 . 0 NPQ NPX z 心理學(xué)統(tǒng)計(jì)第七部分非參數(shù)統(tǒng)計(jì) 如果上邊的問題變了,30志愿者不分專業(yè)從大一、大二、 大三三個年級中挑選,結(jié)果大一15人、大二10人、大三5 人,這樣的挑選平等嗎? 很顯然,上邊的事件也不再是二分事件,它涉及到了三個 類別,相應(yīng)的分布也不再是二項(xiàng)分布,而是多項(xiàng)分布。 在二項(xiàng)分布中,各個值對應(yīng)的概率我們可以輕松求得,但 是在處理二分事件時(shí),我們依然將它近似為正態(tài)分布; 對于多項(xiàng)分布,計(jì)算則比較復(fù)雜,這樣就更需要采用近似 的方法進(jìn)行分析。 心理學(xué)統(tǒng)計(jì)第七部分非參數(shù)統(tǒng)計(jì) 在參數(shù)統(tǒng)計(jì)中比較
9、一個變量兩個水平之間的差異 可以用兩樣本t檢驗(yàn)和方差分析,F(xiàn)值為t值的平方, 服從F分布,F(xiàn)檢驗(yàn)可用于處理多水平間的差異。 類似的,二項(xiàng)分布近似的正態(tài)分布可以處理二分 事件間的差異,對其平方得到的分布可以處理多 個類別間的差異。 NPQ NPX z 2 2 )( 心理學(xué)統(tǒng)計(jì)第七部分非參數(shù)統(tǒng)計(jì) 假設(shè)平方前的z分?jǐn)?shù)服從正態(tài)分布,那么z的平方 會服從另外一種不同的數(shù)學(xué)分布,即卡方分布。 2 心理學(xué)統(tǒng)計(jì)第七部分非參數(shù)統(tǒng)計(jì) 卡方分布的形狀是由它的自由度決定的??ǚ椒?布的自由度等于類別數(shù)減1,即k-1。 從上圖可以看出,除非自由度非常大,否則所有 的卡方分布會傾向于正偏態(tài)。 與F檢驗(yàn)類似,卡方檢驗(yàn)也是單
10、側(cè)的。 心理學(xué)統(tǒng)計(jì)第七部分非參數(shù)統(tǒng)計(jì) NPQ NPX 2 2 )( 對于二分事件 分子部分X-NP。NP代表的概率為P的情況下該 類別的期望頻次fe,而X代表實(shí)際或觀測到的頻 次fo。 對于k種類別的情況, k o oe f ff 2 2 )( 心理學(xué)統(tǒng)計(jì)第七部分非參數(shù)統(tǒng)計(jì) 卡方檢驗(yàn)的自由度為k-1,通過查表確定拒絕區(qū)域 心理學(xué)統(tǒng)計(jì)第七部分非參數(shù)統(tǒng)計(jì) 前邊的那個問題,零假設(shè):志愿者是隨機(jī)選的, 即三個年級的學(xué)生被選中的概率相等,均為1/3。 自由度為3-1=2,卡方臨界為5.99,計(jì)算統(tǒng)計(jì)量小 于臨界值,接受零假設(shè),志愿者的挑選各年級是 機(jī)會平等的。 5 10 )105( 10 )1010(
11、10 )1015( 222 2 心理學(xué)統(tǒng)計(jì)第七部分非參數(shù)統(tǒng)計(jì) 如果卡方計(jì)算值大于臨界值,也就是顯著的,意 味著在期望頻次和實(shí)際頻次之間存在不匹配。 但是要確切知道到底是那兩組存在差異,還需要 進(jìn)一步的分析(兩兩進(jìn)行符號檢驗(yàn)或卡方檢驗(yàn), 對進(jìn)行Bonferroni校正)。 心理學(xué)統(tǒng)計(jì)第七部分非參數(shù)統(tǒng)計(jì) 前邊我們講的是單因素卡方檢驗(yàn),也稱為擬合度 檢驗(yàn),經(jīng)常用于測量實(shí)際頻次和基于理論的或假 設(shè)的總體分布的期望頻次之間的擬合度。 實(shí)際應(yīng)用中存在以下幾種情況: 1、檢驗(yàn)無差假說:也就是假定期望頻次相等,如前 邊的挑選志愿者的例子; 心理學(xué)統(tǒng)計(jì)第七部分非參數(shù)統(tǒng)計(jì) 2、檢驗(yàn)假設(shè)分布的概率 卡方分布擬合度最
12、初的應(yīng)用就是基于某個連 續(xù)變量的樣本分布來檢驗(yàn)它的總體分布形態(tài)。 比如檢驗(yàn)期末考試成績是否服從正態(tài)分布。 選取100個學(xué)生,如果服從正態(tài)分布,那么將會 有34個人的z分?jǐn)?shù)在01之間,大約13個人落在 12之間,3個人落在2以上,負(fù)數(shù)區(qū)域有同樣的 人數(shù),這就是期望頻次。把100名同學(xué)的成績轉(zhuǎn) 化為z分?jǐn)?shù),統(tǒng)計(jì)出實(shí)際頻次。然后用卡方檢驗(yàn)來 分析。 如果顯著,則不服從正態(tài)分布;否則,服從。 心理學(xué)統(tǒng)計(jì)第七部分非參數(shù)統(tǒng)計(jì) B基本統(tǒng)計(jì)過程 二因素列聯(lián)表 關(guān)聯(lián)皮爾遜卡方檢驗(yàn) 卡方檢驗(yàn)的假設(shè) 心理學(xué)統(tǒng)計(jì)第七部分非參數(shù)統(tǒng)計(jì) A部分我們對單因素卡方檢驗(yàn)進(jìn)行了介紹,在實(shí) 際的心理學(xué)研究中往往會牽涉到兩個以上的變量
13、 之間的關(guān)系。所以二因素卡方檢驗(yàn)要比單因素卡 方檢驗(yàn)更為常用。 比如,我們想看一下學(xué)生對授課教師的性別是否 存在某種偏好。這樣就涉及到兩個兩個變量學(xué)生 的性別和老師的性別。 心理學(xué)統(tǒng)計(jì)第七部分非參數(shù)統(tǒng)計(jì) 兩個課堂的情況如下表所示,兩個課堂老師分別為 男和女,各30人,男老師班上5個男生25個女生, 女老師班上15個男生15個女生。 下表稱為列聯(lián)表或交叉分類表 男老師女老師行之和 男學(xué)生51520 女學(xué)生251540 列之和303060 心理學(xué)統(tǒng)計(jì)第七部分非參數(shù)統(tǒng)計(jì) 從上表可以看出,大多數(shù)男生選了女老師課堂, 大多數(shù)女生選了男老師課堂,這似乎體現(xiàn)了一種 相關(guān),即異性偏好。 但這是否是一種隨機(jī)產(chǎn)生
14、的巧合呢? 我們可以采用關(guān)聯(lián)皮爾遜卡方檢驗(yàn)來決定是否決 絕零假設(shè)。 在二因素卡方檢驗(yàn)中,零假設(shè)是兩個變量之間沒 有關(guān)系,即一個變量在不同類別中的分布不會隨 另一個變量不同水平的變化而變化。換句話說, 零假設(shè)認(rèn)為兩個變量相互獨(dú)立,互不影響。因此 關(guān)聯(lián)皮爾遜卡方檢驗(yàn)也被稱為獨(dú)立性卡方檢驗(yàn)。 心理學(xué)統(tǒng)計(jì)第七部分非參數(shù)統(tǒng)計(jì) 在獨(dú)立性卡方檢驗(yàn)中,自由度等于兩個變量自由 度之積,df=(R-1)(C-1),本例中等于1,在0.05顯 著水平下卡方檢驗(yàn)的拒絕區(qū)域?yàn)榇笥?.84。 統(tǒng)計(jì)量的計(jì)算依然采用公式 其中k為單元格數(shù)目,也就是類別數(shù)目,期望頻次 為 k o oe f ff 2 2 )( N fe 列之和
15、行之和 心理學(xué)統(tǒng)計(jì)第七部分非參數(shù)統(tǒng)計(jì) 男老師女老師行之和 男學(xué)生5(10)15(10)20 女學(xué)生25(20)15(20)40 列之和303060 括號內(nèi)計(jì)算得到的期望頻次,則 做出推斷,課堂上教師的性別與選課同學(xué)的性別 存在相關(guān),學(xué)生選課時(shí)對授課教師性別存在異性 偏好。 84. 35 . 7 20 )2015( 20 )2025( 10 )1015( 10 )105( 2222 2 心理學(xué)統(tǒng)計(jì)第七部分非參數(shù)統(tǒng)計(jì) 卡方檢驗(yàn)的前提假設(shè): 互斥互補(bǔ)的類別:每個觀測值都會落入一個而且 僅可以落入一個類別中; 觀測值相互獨(dú)立:可通過讓每個被試只代表一次 觀測值來滿足; 期望頻次的大小:比較保守的規(guī)則是
16、每個期望頻 次都大于5(df=1時(shí),都要大于10);相對寬松的 規(guī)則是每個期望頻次都大于1,并且不多于20%的 期望頻次小于5. 心理學(xué)統(tǒng)計(jì)第七部分非參數(shù)統(tǒng)計(jì) 第二十章 順序數(shù)據(jù)的統(tǒng)計(jì)檢驗(yàn) 心理學(xué)統(tǒng)計(jì)第七部分非參數(shù)統(tǒng)計(jì) 前兩章我們講了對于二分事件和N分事件,其數(shù) 據(jù)為計(jì)數(shù)數(shù)據(jù),這樣的情況不符合參數(shù)統(tǒng)計(jì)的假 設(shè),比較各個類別之間的差異我們可以采用符號 檢驗(yàn)和卡方檢驗(yàn)。 在教育心理學(xué)的很多研究中,其數(shù)據(jù)也不遵從等 距,或者其分布為較強(qiáng)的偏態(tài)分布,這時(shí)我們可 以這些數(shù)據(jù)用順序數(shù)據(jù)來表達(dá),采用非參數(shù)統(tǒng)計(jì) 的方法來分析。 五名男生期末考試成績?yōu)?8,96,94,90,80, 六名女生 成績?yōu)?7,95,
17、93,92,91,89,問 10名同學(xué)成績存在性別差異嗎? 心理學(xué)統(tǒng)計(jì)第七部分非參數(shù)統(tǒng)計(jì) 對于這樣一個問題,我們不能確定數(shù)據(jù)是否服從 正態(tài)分布,因此無法采用兩樣本t檢驗(yàn),這時(shí)可以 采用秩和檢驗(yàn)。 秩和即秩次之和或等級之和。秩次即按大小排序 后的序號,一般從大到小排序。 括號里就是每個數(shù)據(jù)對應(yīng)的秩次 男: 98(1),96(3),94(5),90(9),80(11) 女: 97(2),95(4),93(6),92(7),91(8),89(10) 心理學(xué)統(tǒng)計(jì)第七部分非參數(shù)統(tǒng)計(jì) 排序之后,將容量較小的樣本中各數(shù)據(jù)的等級相 加,用T表示。 T=1+3+5+9+11=19 查秩和檢驗(yàn)表,若T=T2,則表明兩樣本 具有統(tǒng)計(jì)學(xué)意義。 查下表可知,在雙側(cè)0.05顯著水平下, T=T1, 男女生期末考試成績存在差異。 在上邊的例子中,兩個樣本量均小于10. 心理學(xué)統(tǒng)計(jì)第七部分
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年消防設(shè)施檢測與評估服務(wù)合同5篇
- 2025年新能源項(xiàng)目承包借款合作協(xié)議書2篇
- 二零二五版門窗行業(yè)節(jié)能減排技術(shù)與產(chǎn)品研發(fā)合同4篇
- 長飛光纖光纜課程設(shè)計(jì)
- 銀行賬戶管理java課程設(shè)計(jì)
- 2025年度智慧安防個人工程承包合同范本4篇
- 二零二五年度智慧生活門面商鋪?zhàn)赓U合同2篇
- 2025年消防安全技術(shù)服務(wù)與消防設(shè)備采購安裝合同3篇
- 2024年煙花爆竹經(jīng)營單位主要負(fù)責(zé)人考試題庫附答案 (一)
- 2024年用電監(jiān)察員(中級)職業(yè)鑒定理論考試題庫(含答案)
- 獅子王影視鑒賞
- 一年級數(shù)學(xué)加減法口算題每日一練(25套打印版)
- 2024年甘肅省武威市、嘉峪關(guān)市、臨夏州中考英語真題
- DL-T573-2021電力變壓器檢修導(dǎo)則
- 繪本《圖書館獅子》原文
- 安全使用公共WiFi網(wǎng)絡(luò)的方法
- 2023年管理學(xué)原理考試題庫附答案
- 【可行性報(bào)告】2023年電動自行車相關(guān)項(xiàng)目可行性研究報(bào)告
- 歐洲食品與飲料行業(yè)數(shù)據(jù)與趨勢
- 放療科室規(guī)章制度(二篇)
- 中高職貫通培養(yǎng)三二分段(中職階段)新能源汽車檢測與維修專業(yè)課程體系
評論
0/150
提交評論