![SAS講義第二十八課Wilcoxon秩和檢驗_第1頁](http://file3.renrendoc.com/fileroot_temp3/2022-1/2/6e69ec81-c463-4ebf-ba14-3c031aa67606/6e69ec81-c463-4ebf-ba14-3c031aa676061.gif)
![SAS講義第二十八課Wilcoxon秩和檢驗_第2頁](http://file3.renrendoc.com/fileroot_temp3/2022-1/2/6e69ec81-c463-4ebf-ba14-3c031aa67606/6e69ec81-c463-4ebf-ba14-3c031aa676062.gif)
![SAS講義第二十八課Wilcoxon秩和檢驗_第3頁](http://file3.renrendoc.com/fileroot_temp3/2022-1/2/6e69ec81-c463-4ebf-ba14-3c031aa67606/6e69ec81-c463-4ebf-ba14-3c031aa676063.gif)
![SAS講義第二十八課Wilcoxon秩和檢驗_第4頁](http://file3.renrendoc.com/fileroot_temp3/2022-1/2/6e69ec81-c463-4ebf-ba14-3c031aa67606/6e69ec81-c463-4ebf-ba14-3c031aa676064.gif)
![SAS講義第二十八課Wilcoxon秩和檢驗_第5頁](http://file3.renrendoc.com/fileroot_temp3/2022-1/2/6e69ec81-c463-4ebf-ba14-3c031aa67606/6e69ec81-c463-4ebf-ba14-3c031aa676065.gif)
下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、第二十八課 Wilcoxon秩和檢驗兩樣本的Wilcoxon秩和檢驗由Mann, Whitney和 Wilcoxon三人共同設(shè)計的一種檢驗,有時也稱為Wilcoxon秩和檢驗,用來決定兩個獨立樣本是否來自相同的或相等的總體。如果這兩個獨立樣本來自正態(tài)分布和具有相同方差時,我們可以采用 t檢驗比較均值。但當這兩個條件都不能確定時,我們 常替換t檢驗法為Wilcoxon秩和檢驗。Wilcoxon秩和檢驗是基于樣本數(shù)據(jù)秩和。先將兩樣本看成是單一樣本(混合樣本)然后 由小到大排列觀察值統(tǒng)一編秩。如果原假設(shè)兩個獨立樣本來自相同的總體為真,那么秩將大 約均勻分布在兩個樣本中,即小的、中等的、大的秩值應(yīng)該大
2、約均勻被分在兩個樣本中。如 果備選假設(shè)兩個獨立樣本來自不相同的總體為真,那么其中一個樣本將會有更多的小秩值, 這樣就會得到一個較小的秩和;另一個樣本將會有更多的大秩值,因此就會得到一個較大的 秩和。設(shè)兩個獨立樣本為:第一個x的樣本容量為 n1,第二個y樣本容量為n2,在容量為n = R +”的混合樣本(第一個和第二個)中,x樣本的秩和為 Wx, y樣本的秩和為 Wy,且有Wx Wy =1 2 n = n(n 1) 2我們定義Wi "nW2 nWy-n2"2 Fy 2(28.1)(28.2)(28.3)以x樣本為例,若它們在混合樣本中享有最小的* ,n1 (n1 1)ni個秩
3、,于是 Wx一 ,也是 Wx可2能取的最小值;同樣Wy可能取的最小值為n2(n2 ")。那么,Wx的最大取值等于混合樣本 2n(n 1)n1(n11)22n(n 1)n1(n11)22的總秩和減去Wy的最小值,即n(n +1) n2(n2 +1) ;同樣,Wy的最大取值等于y22y(28.2)和(28.3)式中的 W,和 W2均為取值在0與n2(n2 +1)=門包2的變量。當原假設(shè)為真時,所有的xi和yi相當于從 2同一總體中抽得的獨立隨機樣本,xi和yi構(gòu)成可分辨的排列情況,可看成一排 n個球隨機地指定n1個為x球另n2個為y球,共有C:1種可能,而且它們是等可能的?;谶@樣分析,
4、在原假設(shè)為真的條件下不難求出 W1和W2的概率分布,顯然它們的分布還是相同的,這個分布稱為樣本大小為 n1和n2的Mann-Whitney-Wilcoxon 分布。一個具有實際價值的方法是,對于每個樣本中的觀察數(shù)大于等于8的大樣本來說,我們mn 可以米用標傕正態(tài)分布 z來近似檢驗。由于W的中心點為 ,根據(jù)(28.2)式,Wx中心點N2為二 0102ni(ni1)二,(必 1)一 22 一 2 2.一一、Wx的方差仃從數(shù)學上可推導出(28.4)2n1n2(n1n2 1)a =12如果樣本中存在結(jié),將影響到公式(28.5)中的方差,按結(jié)值調(diào)整方差的公式為3_2 _ n1n2(n1n2 1)n1n2
5、( j - j)-1212(n1 n2)(n1 n2 -1)(28.5)(28.6)其中第j個結(jié)值的個數(shù)。結(jié)值的存在將使原方差變小,這是一個顯然正確的事實。標準化后Wx為Wx - 1 -0.5 z 二Wx _ n1(n1 2n2 1)_ 0.5 n21) n1n2” ( 3 - )1212(n1n2)(n1n2 -1)N(Q1)(28.7)其中分子加0.5或減0.5是為了對離散變量進行連續(xù)性修正,對于Wx-N大于0減0.5修正,對于Wx-N小于0加0.5修正。例28.1某航空公司的CEO注意到飛離亞特蘭大的飛機放棄預定座位的旅客人數(shù)在增加, 他特別有興趣想知道,是否從亞特蘭大起飛的飛機比從芝加
6、哥起飛的飛機有更多的放棄預定 座位的旅客。獲得一個從亞特蘭大起飛的9次航班和從芝加哥起飛的8次航班上放棄預定座位的旅客人數(shù)樣本,見表 28.1中的第2列和第4列所示。表28.1放棄預定座位的旅客人數(shù)及統(tǒng)一秩值航班亞特蘭大(x組)芝加哥(y組)次數(shù)放棄人數(shù)統(tǒng)編秩放棄人數(shù)統(tǒng)編秩1115.513721591483103.5103.541812815115.51610620139272416171182215211492517秩和Wx96.5Wy56.5如果假定放棄預定座位旅客人數(shù)的總體是正態(tài)分布且有相等的方差,我們可以采用兩樣本比較的t檢驗。但航空公司的CEO認為這兩個假設(shè)條件不能滿足,因此采用非參
7、數(shù)的Wilcoxon秩和檢驗。將x組與y組看成是單一樣本進行編秩,見表 28.1中的第3列和第5列 所示。,最小值是8秩值為1,最大值是25秩值為17,有兩個結(jié)值10和11,兩個10平均分 享秩值3和4為3.5,兩個11平均分享秩值5和6為5.5。如果兩組放棄預定座位的旅客人數(shù)是相同的,那么我們期望的兩組秩和Wx和Wy大約是相同的;如果兩組放棄預定座位的旅客人數(shù)是不相同的,那么我們期望的兩組秩和Wx和Wy也是非常不相同的。注意到n1 =9, n2 =8, Wx=96.5, Wy =56.5, H0:兩組放棄預定座位旅客人數(shù)的分布是相同的。標準正態(tài)分布z值的計算結(jié)果為96.5 -9() -0.5
8、z 2=1.445159(8)(9 8 1)9(8)(8 -2 8 -2),1212(9 8)(9 8 -1)如果設(shè)定顯著水平 3=0.05,我們知道標準正態(tài)分布在0.05顯著水平時,上臨界值為1.645,下臨界值為1.645,由于1.445<1.645,所以不能拒絕原假設(shè)。在使用Wilcoxon秩和檢驗時,也可以采用第二個樣本的秩和Wy來計算標準正態(tài)分布 z值,但要注意公式中 n1和電的對換。z值的計算結(jié)果為8(9 8 1)56.5 -0.5z =2- -1.445159(8)(9 8 - 1) _ 9(8)(8 -2 8-2):1212(9 8)(9 8 -1)由于1.445>
9、1.645,所以得到是相同的結(jié)果,不能拒絕原假設(shè)。另外,要特別注意的是由于在連續(xù)型分布中隨機地抽出n個樣本,幾乎極少可能存在有些值相等的情況,但在社會經(jīng)濟中有很多離散變量,很可能存在數(shù)值相同的情況,即樣本中存在著“結(jié)”。我們處理“結(jié)”的方法采用分享平均秩,但當大量“結(jié)”存在時,將可能直接影響Wx的方差,因此需要把(28.5)式中的方差修正為(28.6)。但在手工計算和結(jié)值不多的情況下,常使用未修正方差來簡化計算,因為與修正方差的計算結(jié)果比較只存在一些小差異,大 多數(shù)情況下不影響最終的推斷結(jié)果。二、單因子非參數(shù)方差分析的nparlway過程單因子非參數(shù)方差分析的 nparlway過程是分析變量的
10、秩,并計算幾個基于經(jīng)驗分布的函數(shù)(EDF)和通過一個單因子分類變量的響應(yīng)變量確定的秩得分的統(tǒng)計量。秩的得分計算分成四種:Wilcoxon得分、中位數(shù)得分、Savage得分和Van der Waerden得分。然后再由秩得分計算簡單的線性秩統(tǒng)計量,由這個秩統(tǒng)計量可以檢驗一個變量的分布在不同組中是否具有相同的位置參數(shù),或者在 EDF檢驗下,檢驗這個變量分布在不同組中是否分布相同。秩得分的統(tǒng)計量也可以先用 proc rank過程計算秩得分,然后用proc anova過程分析這些秩得分而得到。1.四種不同的秩得分計算用以下公式定義的統(tǒng)計量nS = ' Cia(Ri)(28.8)1 4稱為線性秩
11、統(tǒng)計量。其中R是第i個觀察的秩,a(R)是秩得分,Ci 是一一個指示向量(由 0和1組成),它表示了第i個觀察所屬的類, n是觀察的總數(shù)。npar1way過程的四種不同的a(R)秩得分計算為:1) Wilcoxon 得分在Wilcoxon得分中a(R) = R(28.9)它對Logistic分布的位置移動是局部最優(yōu)的。在計算兩樣本情況下的 Wilcoxon秩和統(tǒng)計量時,過程對零假設(shè)下的漸進標準正態(tài)分布的z統(tǒng)計量進行一個連續(xù)的 +0.5和0.5校正。2) Median 得分Median得分又稱為中位數(shù)得分。當觀察的秩大于中位點時,中位數(shù)得分為1,否則為0,即a(R) =1 當R >(n+1
12、)/2(28.10) a(Ri) =0 當R E(n + 1)/2對于雙指數(shù)分布,中位數(shù)得分是局部最優(yōu)。3) Van der Waerden 得分Van der Waerden得分簡稱為 VW的得分。它是對正態(tài)分布的次序統(tǒng)計量的期望值的近似,a(Ri) = F1(R /(n +1)(28.11)其中F,(x)函數(shù)是標準正態(tài)的累積分布函數(shù)的反函數(shù),這個得分對正態(tài)分布是最優(yōu)的。4) Savage 得分Savage得分是指數(shù)分布的次序統(tǒng)計量的期望值。減去 1使得得分以0為中心,既Ra(R)6 1/(n -i 1) -1(28.12)i=1Savage得分在指數(shù)分布中比較尺度的不同性或在極值分布中的位
13、置移動上是最優(yōu)的。2. nparlway過程說明proc nparlway過程一般由下列語句控制:proc npar1way data=數(shù)據(jù)集 < 選項; class分類變量;var變量列表;by變量列表;run ;為了使用proc npar1way ,必須要proc和class語句。其余語句是供選擇的。1) proc npar1way語句的選項anova對原始數(shù)據(jù)執(zhí)行標準方差分析。edf計算基于經(jīng)驗分布函數(shù)( EDF )的統(tǒng)計量,如 Kolmogorov-Smirnov、Cramer-Von Meses、Kuiper 統(tǒng)計量。missing把class變量的缺失值看作一個有效的分類水平
14、。median執(zhí)行一個中位數(shù)得分分析。對于兩樣本產(chǎn)生一個中位數(shù)檢驗,對于更多樣本產(chǎn)生一個 Brown-Mood檢驗。savage-執(zhí)行一個Savage得分分析。該檢驗適用于數(shù)據(jù)服從指數(shù)分布的組間比較。vw執(zhí)行一個Van der Waerden得分分析。這是一個通過應(yīng)用反正態(tài)分布累積函數(shù)得到近似的正態(tài)得分。對于兩個水平情況,這是一個標準Van der Waerden檢驗。wilcoxon對數(shù)據(jù)或 Wilcoxon得分進行秩分布。對于兩個水平,它與 Wilcoxon秩和檢驗一樣;對于任何數(shù)量的水平,這是一個 Kruskal-Wallis檢驗。對于兩樣本情況, 該過程使用一個連續(xù)的校正。2) cla
15、ss 語句class語句是必需的,它指定一個且只能一個分類變量。該變量用來標識數(shù)據(jù)中的各個類。Class語句變量可以是字符型或數(shù)值型。3) var語句var語句命名要分析的響應(yīng)變量或自變量。如果省略var語句,過程分析數(shù)據(jù)集中除 class語句指定的數(shù)據(jù)變量外的所有數(shù)值型變量。4) by語句一個by語句能夠用來得到由by變量定義的幾個觀察組,并用proc npar1way過程分別進行分析。當一個by語句出現(xiàn)時,過程希望輸入的數(shù)據(jù)集已按by變量排序。三、實例分析例28.1的SAS程序如下:data study.noshows ;input n;do i=1 to n; input x ; out
16、put;end; end;cards;911 15 10 18 11 20 24 22 25 813 14 10 8 16 9 17 21;proc npar1way data=study.noshows wilcoxon;class group;var x;run;程序說明:建立輸入數(shù)據(jù)集 noshows,數(shù)據(jù)的輸入和成組 t檢驗相同,先輸入本組數(shù)據(jù)的 總數(shù),然后輸入組中每個數(shù)據(jù)。分組變量為group,共有兩組取值為1和2。輸入變量為x,存放每組中的數(shù)據(jù)。過程步調(diào)用npar1way過程,后面用選擇項 wilcoxon要求進行 wilcoxon秩和檢驗。要注意,如果兩組樣本是配對樣本,應(yīng)該使用
17、配對t檢驗或wilcoxon符號檢驗,因為使用wilcoxon秩和方法,將損失配對信息。class語句后給出分組變量名 group , var語句 后給出要分析的變量x。主要結(jié)果見表 28.2所示。表28.2 用nparlway過程進行 Wilcoxon秩和檢驗的輸出結(jié)果N P A R 1 W A Y P R O C E D U R EWilcoxon Scores (Rank Sums) for Variable X Classified by Variable GROUPSum of Expected Std Dev MeanGROUPNScoresUnder H0Under H0Scor
18、e1996.81.010.10.2856.72.010.7.Average Scores Were Used for TiesWilcoxon 2-Sample Test (Normal Approximation) (with Continuity Correction of .5)S = 56.5000 Z = -1.44515 Prob > |Z| = 0.1484結(jié)果說明:組1和組2的秩和(Sum of Scores)分別為96.50和56.50。原假設(shè)(組1和 組2的總體分布相同) 為真時,期望秩值(Expected)分別為(96.50+56.50) X 9/(9+8) =81.0 和( 96.50+56.50) X 8/ (9+8) =72.0,標準差(Std Dev)按公式(28.6)計算為
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年流動式空氣質(zhì)量監(jiān)測車合作協(xié)議書
- 2025年個人門面買賣合同格式版(2篇)
- 2025年個人貨車租賃合同常用版(2篇)
- 2025年九年級英語下學期教學工作總結(jié)(二篇)
- 2025年個人貨運汽車租賃合同(4篇)
- 2025年個人雇傭協(xié)議參考范文(三篇)
- 2025年九年級教學管理工作總結(jié)樣本(2篇)
- 2013-2022年北京市中考真題物理試題匯編:電功和電功率章節(jié)綜合
- 2025年中介行業(yè)保密協(xié)議(五篇)
- 2025年個人成交租賃合同模板(三篇)
- (正式版)JBT 14932-2024 機械式停車設(shè)備 停放客車通-用技術(shù)規(guī)范
- 2024年度-脛腓骨骨折
- 2024年職業(yè)衛(wèi)生技術(shù)人員評價方向考試題庫附答案
- 應(yīng)用密碼學課件
- 紅樓夢詩詞全集
- 礦井通風安全培訓課件
- 2024年中國國際投資促進中心限責任公司招聘高頻考題難、易錯點模擬試題(共500題)附帶答案詳解
- 苯胺合成靛紅工藝
- 質(zhì)量保證發(fā)展史和國外相關(guān)標準簡介
- 三年級上冊數(shù)學脫式計算大全600題及答案
- 魯教版(五四制)七年級數(shù)學上冊期末考試卷-附帶答案
評論
0/150
提交評論