非參數(shù)檢驗(yàn)相關(guān)資料.ppt_第1頁(yè)
非參數(shù)檢驗(yàn)相關(guān)資料.ppt_第2頁(yè)
非參數(shù)檢驗(yàn)相關(guān)資料.ppt_第3頁(yè)
非參數(shù)檢驗(yàn)相關(guān)資料.ppt_第4頁(yè)
非參數(shù)檢驗(yàn)相關(guān)資料.ppt_第5頁(yè)
已閱讀5頁(yè),還剩55頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、8-1,本資料來(lái)源,8-2,統(tǒng)計(jì)學(xué)導(dǎo)論,曾五一 肖紅葉 主編,8-3,第八章 非參數(shù)檢驗(yàn),第一節(jié) 非參數(shù)檢驗(yàn)概述 第二節(jié) 符號(hào)檢驗(yàn)與符秩檢驗(yàn) 第三節(jié) 秩和檢驗(yàn)與 檢驗(yàn) 第四節(jié) 等級(jí)相關(guān)檢驗(yàn) 第五節(jié) EXCEL在非參數(shù)檢驗(yàn)中的應(yīng)用,8-4,第一節(jié) 非參數(shù)檢驗(yàn)概述,一、什么是非參數(shù)檢驗(yàn) 二、非參數(shù)檢驗(yàn)的優(yōu)缺點(diǎn),8-5,一、什么是非參數(shù)檢驗(yàn),所謂非參數(shù)檢驗(yàn),又被稱為自由分布檢驗(yàn),它是一種不需要事先對(duì)總體分布的形狀加以限制而進(jìn)行的假設(shè)檢驗(yàn)。 應(yīng)當(dāng)指出,這里所謂的“非參數(shù)”,只是指在檢驗(yàn)的過(guò)程中,未對(duì)檢驗(yàn)統(tǒng)計(jì)量服從的分布及參數(shù)做出限制,并不意味著在檢驗(yàn)中“不涉及參數(shù)”或“不對(duì)參數(shù)進(jìn)行檢驗(yàn)”。,8-6,二

2、、非參數(shù)檢驗(yàn)的優(yōu)缺點(diǎn),優(yōu)點(diǎn): 首先,檢驗(yàn)條件比較寬松,適應(yīng)性強(qiáng)。非參數(shù)檢驗(yàn)對(duì)資料的要求不像參數(shù)檢驗(yàn)?zāi)菢訃?yán)格,它適合于處理諸如非正態(tài)的、方差不等的或分布形狀未知的資料。 其次,自由分布檢驗(yàn)的方法比較靈活,用途廣泛。它不但可以應(yīng)用于處理測(cè)量層次較高的定距、定比數(shù)據(jù),也適用于處理層次較低的定類、定序數(shù)據(jù)。對(duì)于那些不能進(jìn)行加、減、乘、除運(yùn)算的定類數(shù)據(jù)與定序數(shù)據(jù),也可進(jìn)行檢驗(yàn)。 再次,自由分布檢驗(yàn)的計(jì)算相對(duì)簡(jiǎn)單。由于自由分布的檢驗(yàn)方法不用復(fù)雜計(jì)算,一般使用計(jì)數(shù)方法就可以了,它的計(jì)數(shù)過(guò)程與結(jié)果都比較簡(jiǎn)單、直觀與明顯。,8-7,缺點(diǎn): 它對(duì)原始數(shù)據(jù)中包含的信息利用得不夠充分,檢驗(yàn)的功效相對(duì)較弱。 結(jié)論:參數(shù)

3、檢驗(yàn)與非參數(shù)檢驗(yàn)是針對(duì)不同情況提出的兩種統(tǒng)計(jì)方法,它們各有優(yōu)缺點(diǎn),可互為補(bǔ)充。,8-8,第二節(jié) 符號(hào)檢驗(yàn)與符秩檢驗(yàn),一、單總體問(wèn)題的符號(hào)檢驗(yàn) 二、兩總體問(wèn)題的符號(hào)檢驗(yàn) 三、威爾科克森配對(duì)符號(hào)秩檢驗(yàn),8-9,一、單總體問(wèn)題的符號(hào)檢驗(yàn),單總體符號(hào)檢驗(yàn)適用于檢驗(yàn)總體中位數(shù)是否在某一指定位置。,8-10,8-11,二、兩總體問(wèn)題的符號(hào)檢驗(yàn),兩總體符號(hào)檢驗(yàn)適用于檢驗(yàn)配對(duì)樣本情形下,兩總體分布在位置特征上是否有差異。 所謂配對(duì)樣本,是指對(duì)每一個(gè)觀測(cè)單元(個(gè)體)作兩次觀測(cè)。,8-12,8-13,8-14,8-15,三、威爾科克森配對(duì)符號(hào)秩檢驗(yàn),以上所介紹的兩總體情形下符號(hào)檢驗(yàn)方法,僅僅用配對(duì)觀測(cè)之間差別的符

4、號(hào)進(jìn)行檢驗(yàn),而不注重差別的大小,因此對(duì)資料的利用不夠充分。當(dāng)配對(duì)觀測(cè)之間的差別可以從數(shù)量上來(lái)測(cè)定時(shí),威爾科克森(Wilcoxon)配對(duì)符號(hào)秩檢驗(yàn)比符號(hào)檢驗(yàn)更有效 。,8-16,8-17,8-18,8-19,第三節(jié) 秩和檢驗(yàn)與檢驗(yàn),一、秩和檢驗(yàn) 二、皮爾遜 統(tǒng)計(jì)量 三、分布擬合檢驗(yàn),8-20,一、秩和檢驗(yàn),秩和檢驗(yàn)可用于檢驗(yàn)兩個(gè)獨(dú)立樣本是否來(lái)自具有相同位置特征的總體。這里要求兩個(gè)總體具有相同的分布形狀(不論是何種分布形狀)。,8-21,8-22,8-23,8-24,8-25,二、皮爾遜 統(tǒng)計(jì)量,8-26,8-27,8-28,三、分布擬合檢驗(yàn),在理論研究和實(shí)際應(yīng)用中,常常根據(jù)所作隨機(jī)試驗(yàn)的特點(diǎn),認(rèn)

5、定無(wú)限總體的分布符合某種概率分布模型,這時(shí),說(shuō)該無(wú)限總體具有已知的分布。但是,有許多時(shí)候,無(wú)法根據(jù)所作隨機(jī)試驗(yàn)認(rèn)定無(wú)限總體符合何種概率分布模型。這時(shí),便需要根據(jù)統(tǒng)計(jì)數(shù)據(jù)提供的信息,為總體選配一個(gè)合適的概率分布模型。,8-29,一般作法是: 首先,對(duì)樣本數(shù)據(jù)作分組整理,計(jì)算各組的頻率,稱所得到的分布列為經(jīng)驗(yàn)分布; 其次,根據(jù)有關(guān)理論和實(shí)際知識(shí)以及經(jīng)驗(yàn)分布的特點(diǎn),猜測(cè)無(wú)限總體的分布符合某種概率模型,稱所選擇的概率模型為理論分布; 然后,用顯著性檢驗(yàn)的方法,將經(jīng)驗(yàn)分布與理論分布作比較,檢驗(yàn)觀察到的差異能否顯著地表明兩種分布的真實(shí)差異存在,如果表明真實(shí)差異存在的證據(jù)不足,則可以期望所選理論分布能較好地

6、描述所研究的無(wú)限總體的分布規(guī)律。 這類顯著性檢驗(yàn)稱作分布擬合檢驗(yàn)。分布擬合檢驗(yàn)的方法很多,我們只介紹分布擬合的皮爾遜 檢驗(yàn)。,8-30,8-31,8-32,表8-1鐘表走時(shí)誤差的經(jīng)驗(yàn)分布與理論分布的比較,8-33,8-34,8-35,第四節(jié) 等級(jí)相關(guān)檢驗(yàn),一、斯皮爾曼等級(jí)相關(guān)系數(shù) 二、斯皮爾曼等級(jí)相關(guān)系數(shù)的統(tǒng)計(jì)檢驗(yàn) 三、兩點(diǎn)說(shuō)明,8-36,一、斯皮爾曼等級(jí)相關(guān)系數(shù),第七章所討論的兩變量之間相關(guān)系數(shù)的前提是:兩隨機(jī)變量的聯(lián)合分布是二維正態(tài)分布。當(dāng)隨機(jī)變量的分布不能滿足正態(tài)性要求時(shí),或者所要研究的變量不是數(shù)量型變量時(shí),通常的相關(guān)分析方法不宜使用,而需要利用斯皮爾曼等級(jí)相關(guān)系數(shù)進(jìn)行考察。,8-37,

7、8-38,8-39,二、斯皮爾曼等級(jí)相關(guān)系數(shù)的統(tǒng)計(jì)檢驗(yàn),8-40,8-41,三、兩點(diǎn)說(shuō)明,(一)等級(jí)相關(guān)檢驗(yàn)適用于變量值表現(xiàn)為等級(jí)的變量。不過(guò),對(duì)于變量值表現(xiàn)為數(shù)值而不是等級(jí)的變量,有時(shí)也可以把它劃分為若干等級(jí),用等級(jí)相關(guān)的方法來(lái)研究。這樣做是出于下面的一些理由:(1)無(wú)法假定總體的分布; (2)其中有一個(gè)變量是只能用等級(jí)來(lái)反映的;(3)把測(cè)量值劃分為等級(jí)更能反映事物的本質(zhì)(例如,把年齡按生命過(guò)程階段劃分比用實(shí)際年齡更便于研究生命過(guò)程的統(tǒng)計(jì)規(guī)律)。把測(cè)量值轉(zhuǎn)換為等級(jí)的方法是:首先,按實(shí)際觀察值大小排序,并賦予每個(gè)觀察值秩次;其次,把測(cè)量值的取值范圍劃分為若干等級(jí)區(qū)間。,8-42,(二)斯皮爾曼

8、等級(jí)相關(guān)系數(shù)是以變量沒(méi)有相同等級(jí)為前提的。但有時(shí),觀察結(jié)果出現(xiàn)了相同的等級(jí),這時(shí),須計(jì)算這幾個(gè)觀察結(jié)果所在位置秩次的簡(jiǎn)單算術(shù)平均數(shù)作為它們相應(yīng)的等級(jí)。在這種情形下應(yīng)用斯皮爾曼等級(jí)相關(guān)系數(shù)計(jì)算公式所得之結(jié)果顯然只是近似的。若相同等級(jí)不是太多,可以近似應(yīng)用上述公式,否則應(yīng)加以修正 。,8-43,第五節(jié) EXCEL在非參數(shù)檢驗(yàn)中的應(yīng)用,一、符號(hào)檢驗(yàn) 二、威爾科克森配對(duì)符號(hào)秩檢驗(yàn) 三、分布擬合的皮爾遜卡方檢驗(yàn),8-44,一、符號(hào)檢驗(yàn),8-45,利用Excel求解步驟如下: (一)輸入數(shù)據(jù),見(jiàn)圖8-1。A、B列為原始輸入數(shù)據(jù),樣本數(shù)據(jù)存放在A2:A29單元格區(qū)域,圖中未完全顯示出來(lái),D、E列為計(jì)算得出的

9、結(jié)果。 (二)計(jì)算樣本觀察值大于中位數(shù)的個(gè)數(shù)(即正號(hào)的個(gè)數(shù))。在E1中輸入公式如下的公式 =COUNTIF(A2:A29,90) COUNTIF函數(shù)計(jì)算區(qū)域中滿足給定條件的單元格的個(gè)數(shù)。 (三)計(jì)算樣本容量n(不含0差數(shù))。在E2中輸入公式 =COUNT(A2:A29)-COUNTIF(A2:A29,=90),8-46,(四)使用公式8.1計(jì)算檢驗(yàn)統(tǒng)計(jì)量Z。在E3中輸入公式 =(E1-0.5*E2)/SQRT(0.25*E2) (五)計(jì)算臨界值Z/2。在E4中輸入公式“=ABS(NORMSINV(B2/2)”。 圖8-1 (六)結(jié)論。由于-4.54 -1.96,檢驗(yàn)統(tǒng)計(jì)量的樣本值落在拒絕域,故

10、否定原假設(shè)??傮w中位數(shù)不是90。,8-47,二、威爾科克森配對(duì)符號(hào)秩檢驗(yàn),【例8-4】從某專業(yè)學(xué)生中簡(jiǎn)單隨機(jī)抽取20人,先后兩次組織某種測(cè)驗(yàn)。兩次測(cè)驗(yàn)結(jié)果如下: 試用威爾科克森配對(duì)符號(hào)秩檢驗(yàn)法檢驗(yàn),該專業(yè)學(xué)生在兩次測(cè)驗(yàn)的時(shí)間上,該項(xiàng)成績(jī)水平有無(wú)改變。(顯著水平0.05),8-48,8-49,8-50,圖8-2,8-51,(二)計(jì)算|di|的秩。 1按|di|大小進(jìn)行升序排位(由于第20個(gè)學(xué)生的成績(jī)差為0,所以該同學(xué)的|di|不參加排位)。 在F2中輸入公式“=RANK(E2,E$2:E$20,1)”,再次公式復(fù)制到F3:F20區(qū)域即可。 RANK函數(shù)返回一個(gè)數(shù)字在數(shù)字列表中的排位,第2個(gè)參數(shù)指

11、定參與排位的所有數(shù)字,第1個(gè)參數(shù)則是數(shù)字列表中需要找到排位的某個(gè)數(shù)字,第3個(gè)參數(shù)指定數(shù)字列表排序的方式,1為升序,0為降序。 RANK函數(shù)對(duì)重復(fù)數(shù)的排位相同。但重復(fù)數(shù)的存在將影響后續(xù)數(shù)值的排位。例如,本例是升序排位,6出現(xiàn)兩次,其排位為3,則大于6的最小的數(shù)字7的排位是5(沒(méi)有排位為4的數(shù)字)。,8-52,2求重復(fù)數(shù)字的秩次。 此處需要考慮重復(fù)數(shù)字的排位次序。如本例,有兩個(gè)同學(xué)的|di|為6,其秩次應(yīng)是3.5。此時(shí),必須計(jì)算一個(gè)修正數(shù)。 在G2單元格中輸入如下公式: =(COUNT(F$2:F$20)+1-RANK(F2,F$2:F$20)-RANK(F2,F$2:F$20,1)/2 并將該公

12、式復(fù)制到G3:G20區(qū)域即可。從計(jì)算結(jié)果可以看出,如果某個(gè)數(shù)字是唯一的,則它的修正數(shù)為0。,8-53,3求秩。將F列與G列相加即可。在H2中輸入公式“=F2+G2”,并將公式復(fù)制到H3:H20區(qū)域。最終結(jié)果見(jiàn)圖8-2。,8-54,(三)計(jì)算正秩與負(fù)秩的和。在圖8-2所示的工作表上繼續(xù)這一工作,后續(xù)的工作表見(jiàn)圖 8-3。圖中L1、M1中的內(nèi)容就是D1的內(nèi)容(即成績(jī)差的字段名),只要在L1、M1中輸入公式“=D1”即可。 在J2和K2分別輸入如下公式,便可得到正秩和與負(fù)秩和。 =DSUM(D1:H20,秩,L1:L2) =DSUM(D1:H20,秩,M1:M2),8-55,DSUM是數(shù)據(jù)庫(kù)函數(shù),第一個(gè)函數(shù)指定數(shù)據(jù)庫(kù)區(qū)域,第二個(gè)參數(shù)指定是對(duì)哪一列數(shù)據(jù)進(jìn)行求和,最后一個(gè)參數(shù)指定求和的條件。具體用法請(qǐng)查閱Excel幫助。 圖8-3,8-56,(四)結(jié)論。檢驗(yàn)統(tǒng)計(jì)量T=74.5,查附表知,n=19,單側(cè)0.025顯著水平的臨界值為T0.025=46,由于74.5 46,檢驗(yàn)統(tǒng)計(jì)量的樣本值落在拒絕域,故否定原假設(shè)。所以說(shuō),該專業(yè)學(xué)生在兩次測(cè)驗(yàn)的時(shí)間上,該項(xiàng)成績(jī)水平有改變。,8-57,三、分布擬合的皮爾遜卡方檢驗(yàn),

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論