系統(tǒng)和數(shù)據(jù)分析Wilcoon秩和檢驗_第1頁
系統(tǒng)和數(shù)據(jù)分析Wilcoon秩和檢驗_第2頁
系統(tǒng)和數(shù)據(jù)分析Wilcoon秩和檢驗_第3頁
已閱讀5頁,還剩16頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、第二十八課Wilcoxon秩和檢驗兩樣本的Wilcoxon秩和檢驗兩樣本的 Wilcox on秩和檢驗是由 Mann , Whit ney和Wilcox on三人共同設(shè)計的一種檢驗, 有時也稱為 Wilcoxon秩和檢驗,用來決定兩個獨立樣本是否來自相同的或相等的總體。如果 這兩個獨立樣本來自正態(tài)分布和具有相同方差時,我們可以采用t檢驗比較均值。但當(dāng)這兩個條件都不能確定時,我們常替換t檢驗法為 Wilcox on秩和檢驗。Wilcox on秩和檢驗是基于樣本數(shù)據(jù)秩和。先將兩樣本看成是單一樣本(混合樣本)然后 由小到大排列觀察值統(tǒng)一編秩。如果原假設(shè)兩個獨立樣本來自相同的總體為真,那么秩將大 約均

2、勻分布在兩個樣本中,即小的、中等的、大的秩值應(yīng)該大約被均勻分在兩個樣本中。如 果備選假設(shè)兩個獨立樣本來自不相同的總體為真,那么其中一個樣本將會有更多的小秩值, 這樣就會得到一個較小的秩和;另一個樣本將會有更多的大秩值,因此就會得到一個較大的 秩和。設(shè)兩個獨立樣本為:第一個的樣本容量為,第二個樣本容量為,在容量為n =nj n2的混合樣本(第一個和第二個)中,樣本的秩和為,樣本的秩和為,且有:Wx Wy =12 n =n(n 1)2(28.1)我們定義:(28.2)(28.3)n 1 (n1 +1)Wi =Wx _2n 2( n2 +1)W2 =Wy2 2以樣本為例,若它們在混合樣本中享有最小的

3、個秩,于是Wx二n1(n11,也是可能取去的最小值,即罟n2(n2 ;同樣,的最大取值等于2n(n 1)n1(n11)2 2所以,式(28.2)和式(28.3)中的和均為取值在0與n(n 1)25( n1 1)2nzg1)2=n1 n2的變量。的最小值;同樣可能取的最小值為(“21)。那么,的最大取值等于混合樣本的總秩和減2當(dāng)原假設(shè)為真時,所有的和相當(dāng)于從同一總體中抽得的獨立隨機(jī)樣本,和構(gòu)成可分辨的排列情況,可看成一排個球隨機(jī)地指定個為球,另個為球,共有C:2種可能,而且它們是等可能的?;谶@樣的分析,在原假設(shè)為真的條件下不難求出和的概率分布,顯然它們的分布還是相同的,這個分布稱為樣本大小為和

4、的Mann-Whit ney-Wilcoxo n 分布。一個具有實際價值的方法是,對于每個樣本中的觀察數(shù)大于等于8的大樣本來說,我們可以采用標(biāo)準(zhǔn)正態(tài)分布來近似檢驗。由于的中心點為nm,根據(jù)式(28.2),中心點為:2nin2nn 1)njn 1 + n2+1)R =2 2 2的方差從數(shù)學(xué)上可推導(dǎo)出:2nm 2 (n1 n2 1)a =12(28.4)(28.5)如果樣本中存在結(jié)值,將影響到公式(28.5)中的方差,按結(jié)值調(diào)整方差的公式為:2 n1n2(n1 n2 1)厲門八(j ”j)CT =1212(n_j + n2)(n + n2 -1)其中,為第j個結(jié)值的個數(shù)。結(jié)值的存在將使原方差變小,

5、這是一個顯然正確的事實。(28.6)Wx -_0.5 z =CTn (m + n2 +1)Wx _ X 121 -0.52qn2(ni n2 1) n1n2 ( j -)1212( n1 + n2)( n1 + n2 1) N(0,1)(28.7)標(biāo)準(zhǔn)化后為:其中,分子加0.5或減0.5是為了對離散變量進(jìn)行連續(xù)性修正,對于W I大于0減0.5修正,對于 Wx-小于0加0.5修正。例28.1某航空公司的CEO注意到飛離亞特蘭大的飛機(jī)放棄預(yù)訂座位的旅客人數(shù)在增加, 他特別有興趣想知道,是否從亞特蘭大起飛的飛機(jī)比從芝加哥起飛的飛機(jī)有更多的放棄預(yù)訂 座位的旅客。獲得一個從亞特蘭大起飛的9次航班和從芝加

6、哥起飛的8次航班上放棄預(yù)訂座位的旅客人數(shù)樣本,見表28.1中的第2列和第4列。表28.1 放棄預(yù)訂座位的旅客人數(shù)及統(tǒng)一秩值航班次數(shù)亞特蘭大(組)芝加哥(組)放棄人數(shù)統(tǒng)編秩放棄人數(shù)統(tǒng)編秩1115.513721591483103.5103.541812815115.51610620139272416171182215211492517秩和96.556.5如果假定放棄預(yù)訂座位旅客人數(shù)的總體是正態(tài)分布且有相等的方差,我們可以采用兩樣 本比較的t檢驗。但航空公司的CEO認(rèn)為這兩個假設(shè)條件不能滿足,因此采用非參數(shù)的Wilcox on秩和檢驗。將組與組看成是單一樣本進(jìn)行編秩,見表28.1中的第3列和第5列。

7、最小值是8,秩值為1,最大值是25,秩值為17,有兩個結(jié)值10和11,兩個10平均分享秩值 3和4為3.5,兩個11平均分享秩值5和6為5.5。如果兩組放棄預(yù)訂座位的旅客人數(shù)是相同 的,那么我們期望的兩組秩和和大約是相同的;如果兩組放棄預(yù)訂座位的旅客人數(shù)是不相同 的,那么我們期望的兩組秩和和也是非常不相同的。注意到n1 =9,n2 =8, =96.5,=56.5,H0 :兩組放棄預(yù)訂座位旅客人數(shù)的分布是相同的。標(biāo)準(zhǔn)正態(tài)分布值的計算結(jié)果為96.5,(9 80.5z: 2=1.445159(8)(9 8 1) _ 9(8)(8 -2 8 - 2) 彳 1212(9+8)(9+8 _1)如果設(shè)定顯著

8、水平=0.05,我們知道標(biāo)準(zhǔn)正態(tài)分布在0.05顯著水平時,上臨界值為1.645,下臨界值為1.645,由于1.445 1.645,因此得到的是相同的結(jié)果,不能拒絕原假設(shè)。另外,要特別注意的是由于在連續(xù)型分布中隨機(jī)地抽出個樣本,幾乎極少可能存在有些 值相等的情況,但在社會經(jīng)濟(jì)中有很多離散變量,很可能存在數(shù)值相同的情況,即樣本中存 在著“結(jié)”。我們處理“結(jié)”的方法采用分享平均秩,但當(dāng)大量“結(jié)”存在時,將可能直接影 響的方差,因此需要把式(28.5)中的方差修正為式(28.6)。但在手工計算和結(jié)值不多的情況下, 常使用未修正方差來簡化計算,因為與修正方差的計算結(jié)果比較只存在一些小差異,大多數(shù) 情況下

9、不影響最終的推斷結(jié)果。二、單因子非參數(shù)方差分析的 nparlway過程單因子非參數(shù)方差分析的 npar1way過程是分析變量的秩, 并計算幾個基于經(jīng)驗分布的函 數(shù)(EDF)和通過一個單因子分類變量的響應(yīng)變量確定的秩得分的統(tǒng)計量。秩的得分計算分 成四種:Wilcox on得分、中位數(shù)得分、Savage得分和Van der Waerde n得分。然后,再由秩得 分計算簡單的線性秩統(tǒng)計量,由這個秩統(tǒng)計量可以檢驗一個變量的分布在不同組中是否具有 相同的位置參數(shù),或者在 EDF檢驗下,檢驗這個變量分布在不同組中是否分布相同。秩得分 的統(tǒng)計量也可以先用 proc rank過程計算秩得分,然后用proc a

10、nova過程分析這些秩得分而得到。1. 四種不同的秩得分計算用以下公式定義的統(tǒng)計量:nS 二 Ga(Ri)(28.8)i 4稱為線性秩統(tǒng)計量。其中,是第個觀察的秩,a(R)是秩得分,是一個指示向量(由 0和1組成),它表示了第個觀察所屬的類,是觀察的總數(shù)。nparlway過程的四種不同的 a(Ri)秩得分計算為:(1) Wilcoxon 得分在Wilcox on得分中:a(R)=(28.9)它對Logistic分布的位置移動是局部最優(yōu)的。在計算兩樣本情況下的 Wilcox on秩和統(tǒng)計量時,過程對零假設(shè)下的漸進(jìn)標(biāo)準(zhǔn)正態(tài)分布的z統(tǒng)計量進(jìn)行一個連續(xù)的 +0.5和0.5校正。(2) Median 得

11、分Median得分又稱為中位數(shù)得分。當(dāng)觀察的秩大于中位點時,中位數(shù)得分為1,否則為0,即:a(Ri) =1當(dāng) Ri (n 1)/2(28.10)a(Rj =0當(dāng)R 蘭(n+1)/2對于雙指數(shù)分布,中位數(shù)得分是局部最優(yōu)。(3) Van der Waerden 得分Van der Waerden得分簡稱為 VW的得分。它是對正態(tài)分布的次序統(tǒng)計量的期望值的近似,即:a(Ri) = F lR/(n+1)(28.11)其中,F(xiàn) (x)函數(shù)是標(biāo)準(zhǔn)正態(tài)的累積分布函數(shù)的反函數(shù),這個得分對正態(tài)分布是最優(yōu)的。(4) Savage 得分Savage得分是指數(shù)分布的次序統(tǒng)計量的期望值。減去1使得得分以0為中心,即:R

12、a(R) =L 1/(n i +1) T(28.12)i=1Savage得分在指數(shù)分布中比較尺度的不同性或在極值分布中的位置移動上是最優(yōu)的。2. nparlway過程說明proc npprocnpar1waydata=數(shù)據(jù)集 ;class分類變量;var 變量列表;by變量列表;為了使用proc nparlway過程,必須調(diào)用 proc和class語句。其余語句是供選擇的。(1)proc nparlway 語句的選項anova對原始數(shù)據(jù)執(zhí)行標(biāo)準(zhǔn)方差分析。edf計算基于經(jīng)驗分布函數(shù)(EDF )的統(tǒng)計量,如Kolmogorov-Smirnov、Cramer-Von Meses、Kuiper 統(tǒng)計量

13、。missing把class變量的缺失值看作一個有效的分類水平。median執(zhí)行一個中位數(shù)得分分析。對于兩樣本產(chǎn)生一個中位數(shù)檢驗,對于更多 樣本產(chǎn)生一個 Brown-Mood檢驗。savage執(zhí)行一個Savage得分分析。該檢驗適用于數(shù)據(jù)服從指數(shù)分布的組間比較。vw執(zhí)行一個Van der Waerden得分分析。這是一個通過應(yīng)用反正態(tài)分布累積函數(shù)得到近似的正態(tài)得分。對于兩個水平情況,這是一個標(biāo)準(zhǔn)Van der Waerden檢驗。wilcoxo n對數(shù)據(jù)或 Wilcoxo n得分進(jìn)行秩分布。對于兩個水平,它與Wilcox on秩和檢驗一樣;對于任何數(shù)量的水平,這是一個Kruskal-Walli

14、s檢驗。對于兩樣本情況,該過程使用一個連續(xù)的校正。(2) class語句class語句是必需的,它指定一個且只能一個分類變量。該變量用來標(biāo)識數(shù)據(jù)中的各個類。Class語句變量可以是字符型或數(shù)值型。(3)var語句var語句命名要分析的響應(yīng)變量或自變量。如果省略var語句,過程分析數(shù)據(jù)集中除 class語句指定的數(shù)據(jù)變量外的所有數(shù)值型變量。(4)by語句一個by語句能夠用來得到由by變量定義的幾個觀察組,并用proc npar1way過程分別進(jìn)行分析。當(dāng)一個by語句出現(xiàn)時,過程希望輸入的數(shù)據(jù)集已按by變量排序。三、實例分析例28.1的SAS程序如下:data study.noshows ;do

15、group=1 to 2;input n;do i=1 to n;input x ;output;end;end;cards;11 15 10 18 11 20 24 22 25813 14 10 8 16 9 17 21proc npar1way data=study.noshows wilcoxon;class group;var x;run;程序說明:建立輸入數(shù)據(jù)集 noshows,數(shù)據(jù)的輸入和成組t檢驗相同,先輸入本組數(shù)據(jù)的總數(shù),然后輸入組中每個數(shù)據(jù)。分組變量為group,共有兩組取值為1和2。輸入變量為x,存放每組中的數(shù)據(jù)。過程步調(diào)用npar1way過程,后面用選擇項wilcoxon

16、要求進(jìn)行 wilcoxon秩和檢驗。要注意,如果兩組樣本是配對樣本,應(yīng)該使用配對t檢驗或wilcoxon符號檢驗,因為使用wilcoxon秩和方法,將損失配對信息。class語句后給出分組變量名group,var語句后給出要分析的變量X。主要結(jié)果如表 28.2所示。表28.2用nparlway過程進(jìn)行 Wilcoxon秩和檢驗的輸出結(jié)果N P A R 1 W A Y P R O C E D U R EWilcoxon Scores (Rank Sums) for Variable XClassified by Variable GROUPSum of Expected Std DevMeanG

17、ROUP N Scores Under HO Under HO Score1 996.500000081.010.379561410.72222222 856.500000072.010.37956147.0625000Average Scores Were Used for TiesWilcoxon 2-Sample Test (Normal Approximation)(with Continuity Correction of .5)S = 56.5000 Z = -1.44515 Prob |Z| = 0.1484第二十九課 結(jié)果說明:組1和組2的秩和 (Sum of Scores)分

18、別為 96.50 和 56.50。原假設(shè)(組1和組2的總體分布相同)為真時,期望秩值(Expected)分別為(96.50+56.50) X 9/ (9+8) =81.0 和(96.50+56.50) X 8/ (9+8) =72.0,標(biāo)準(zhǔn)差(Std Dev)按公式(28.6)計算為10.3795614。每組平均得分(MeanScore) 分別為 96.50/9=10.7222222 和 56.50/ 8=7.0625000。Wilcoxon兩樣本秩和統(tǒng)計 量(較小的秩和)S =56.5000,正態(tài)近似 檢驗統(tǒng)計量Z = 1.44515 (連續(xù)性修正因 子為0.5,加在分子上),正態(tài)分布的雙尾

19、 p值之和為0.1484,不能拒絕原假設(shè)。同 時,還給出了近似t檢驗和卡方檢驗的結(jié) 果:近似t檢驗的p=0.1677,近似卡方檢 驗統(tǒng)計量為2.2300,自由度為1,p=0.1354。 結(jié)果都是相同的,不能拒絕原假設(shè)。完全隨機(jī)設(shè)計Kruskal-Wallis秩和檢驗四、完全隨機(jī)設(shè)計的Kruskal-Wallis秩和檢驗方差分析過程關(guān)注三個或更多總體的均值是否相等的問題,數(shù)據(jù)是被假設(shè)成具有正態(tài)分 布和相等的方差,此時 F檢驗才能奏效。但有時采集的數(shù)據(jù)常常不能完全滿足這些條件。在 兩兩樣本比較時,我們不妨嘗試將數(shù)據(jù)轉(zhuǎn)換成秩統(tǒng)計量,因為秩統(tǒng)計量的分布與總體分布無 關(guān),可以擺脫總體分布的束縛。在比較兩

20、個以上的總體時,廣泛使用非參數(shù)的Kruskal-Wallis秩和檢驗,它是對兩個以上的秩樣本進(jìn)行比較,本質(zhì)上它是兩樣本時的Wilcoxon秩和檢驗方法在多于兩個樣本時的推廣。Kruskal-Wallis秩和檢驗,首先要求從總體中抽取的樣本必須是獨立的,然后將所有樣本 的值混合在一起看成是單一樣本,再把這個單一的混合樣本中的值從小到大排序,序列值替 換成秩值,最小的值給予秩值1,有結(jié)值時平分秩值。將數(shù)據(jù)樣本轉(zhuǎn)換成秩樣本后,再對這個秩樣本進(jìn)行方差分布,但此時我們構(gòu)造的統(tǒng)計量KW不是組間平均平方和除以組內(nèi)平均平方和,而是組間平方和除以全體樣本秩方差。這個KW統(tǒng)計量是我們判定各組之間是否存在差異的有力

21、依據(jù)。設(shè)有組樣本,是第組樣本中的觀察數(shù),是所有樣本中的觀察總數(shù),是第組樣本中的秩和, 是第組樣本中的第個觀察值的秩值。需要檢驗的原假設(shè)為各組之間不存在差異,或者說各組 的樣本來自的總體具有相同的中心或均值或中位數(shù)。在原假設(shè)為真時,各組樣本的秩平均應(yīng)1+2+ nn+1該與全體樣本的秩平均 二-一-比較接近。所以組間平方和為組間平方和八nii 4Rinin+1 22(29.1)恰好是刻畫這種接近程度的一個統(tǒng)計量,除以全體樣本秩方差,可以消除量綱的影響。樣本 方差的自由度為n 一1。所以,全體樣本的秩方差為全體樣本的秩方差=+JRn -1 i42n 1I21n -1n fZ i-i 二 I廠nl 2

22、Z i2n(n +1)2 4(29.2)1n -1n(n +1)(2n + 1)n(n +1)2、n(n 1)12因此,Kruskal-Wallis秩和統(tǒng)計量 KW 為:KW=組間平方和全體樣本的秩方差kZ ni n(n 1) y1212 k n(n 1) i mni2Ri 2 -3( n 1)(29.3)如果樣本中存在結(jié)值,需要調(diào)整公式(433)中的KW統(tǒng)計量,校正系數(shù) C為:C=1(3,)(29.4)3n - n其中,第j個結(jié)值的個數(shù)。調(diào)整后的 KWc統(tǒng)計量為:KWc = KW /C(29.5)如果每組樣本中的觀察數(shù)目至少有5個,那么樣本統(tǒng)計量 KWc非常接近自由度為 k - 1的卡方分布

23、。因此,我們將用卡方分布來決定KWc統(tǒng)計量的檢驗。例29.1某制造商雇用了來自三個本地大學(xué)的雇員作為管理人員。最近,公司的人事部門 已經(jīng)收集信息并考核了年度工作成績。從三個大學(xué)來的雇員中隨機(jī)地抽取了三個獨立樣本, 見表29.1中的第2、4、6列所示。制造商想知道來自這三個不同的大學(xué)的雇員在管理崗位上 的表現(xiàn)是否有所不同。表29.1來自三個不同大學(xué)的雇員得分及統(tǒng)一秩值雇員大學(xué)A統(tǒng)編秩大學(xué)B統(tǒng)編秩大學(xué)C 1統(tǒng)編秩12536095072701220270123609304609485171518015.5595204069018.569018.5355701278015.57514秩和組A秩和95組

24、B秩和27組C秩和88為了計算KW統(tǒng)計量,我們首先必須將來自三個大學(xué)的20名雇員統(tǒng)一按考核成績編排秩值,見表 29.1 中的第 3、5、7 列所示。本例中,n!=7,n2=6,n3=7,n = 20,Rj.=95,只2廠27,R3.=88,k =3,Ho :三個總體的考核成績分布是相同的。我們用(29.3)式計算KW統(tǒng)計量為:KW 1295- -3(20 1) =8.916320(21) 767 _用(29.4)式計算校正系數(shù) C,從表29.1中我們可以發(fā)現(xiàn),相等成績值和相等的個數(shù)分別為60分3個,70分3個,80分2個,90分2個。所以:3333203 -20C -(3 -3 3 -3 2

25、-22 -2) =0.9925調(diào)整后的KWc為:KWc 二 KW/C =8.9163/0.9925 = 8.9839查表可知道,自由度為k-1=2的卡方分布,在=0.05顯著水平下,分布的上尾臨界值為5.99,由于8.985.99,因此拒絕原假設(shè)。所以,秩和最低的B組至少與秩和最高的A組是不同的。五、freq頻數(shù)過程Freq頻數(shù)過程可以生成單向和 n向的頻率表和交叉表。對于雙向表(二維表),該過程計 算檢驗統(tǒng)計量和關(guān)聯(lián)度。對于n向表,該過程進(jìn)行分層分析,計算每一層和交叉層的統(tǒng)計量。這些頻數(shù)也能夠輸出到 SAS數(shù)據(jù)集里。1. freq過程說明proc freq 過程一般由下列語句控制:procf

26、reqdata=數(shù)據(jù)集 ;by變量列表;tables交叉表的表達(dá)式 ;weight 變量;output ;run ;該過程proc freq語句是必需的。其余語句是供選擇的。另外,該過程只能使用一個output語句。2. proc freq語句的選項order=freq/data/internal/formatted 規(guī)定變量水平的排列次序。 freq表示按頻數(shù)下 降的次序,data表示按輸入數(shù)據(jù)集中出現(xiàn)的次序,internal表示按非格式化值的次序(缺省值),formatted按格式化值的次序。formachar (1,2,7)=三個字符規(guī)定用來構(gòu)造列聯(lián)表的輪廓線和分隔線的字符。缺省值為fo

27、rmachar(1,2,7)= +,第一個字符用來表示垂直線,第二個字符用來表示水 平線,第三個字符用來表示水平與垂直的交叉線。page要求freq每頁只輸出一張表。否則,按每頁行數(shù)允許的空間輸出幾張表。 noprint禁止freq過程產(chǎn)生所有輸出。3. by語句一個by語句能夠用來得到由 by變量定義的分組觀察,并分別進(jìn)行分析。過程要求輸入 的數(shù)據(jù)集已按by變量排序。4. tables 語句可以包括多個tables語句。如果沒有tables語句,對數(shù)據(jù)集中的每個變量都生成一個單向 頻數(shù)表。如果tables語句沒有選項,則計算tables語句中規(guī)定變量每個水平的頻數(shù)、累計頻數(shù)、占總頻數(shù)的百分比

28、及累計百分比。Tables語句中的交叉表的表達(dá)式,請參見第二章第二節(jié)proc tabulate過程中的table語句的用法。Tables語句中的主要選項如下:all要求計算所有選項的檢驗和度量,包括chisq、measures和cmh。chisq 要求對每層是否齊性或獨立性進(jìn)行卡方檢驗,包括pearson卡方、似然比卡方和Mantel-Haenszel卡方。并計算依賴于卡方統(tǒng)計量的關(guān)聯(lián)度,包括phi系數(shù)、列聯(lián)系數(shù)和Cramer V。對于2X 2聯(lián)列表還自動計算 Fisher的精確檢驗。cmh要求Cochran-Mantel-Haenszel卡方統(tǒng)計量,用于 2維以上表時,檢驗行變量和列變量是否

29、有線性相關(guān)。exact要求對大于2X 2表計算Fisher的精確檢驗。Fisher的精確檢驗是假設(shè)行與列的邊緣頻數(shù)固定,并且在零假設(shè)為真時,各種可能的表的超幾何概率之和。measures要求計算若干個有關(guān)相關(guān)的統(tǒng)計量及它們的漸近標(biāo)準(zhǔn)誤差。alpha=p設(shè)定100 (1 p) %置信區(qū)間。缺省值為alpha= 0.05。scores=rank/table/ridit/modridit定義行/列得分的類型以便用于cmh統(tǒng)計量和pearson相關(guān)中。在非參數(shù)檢驗中,一般常用scores=rank,用于指定非參數(shù)分析的秩得分。cellchi2要求輸出每個單元對總卡方統(tǒng)計量的貢獻(xiàn)。cumcol要求在單元

30、中輸出累計列百分?jǐn)?shù)。expected在獨立性(或齊性)假設(shè)下,要求輸出單元頻數(shù)的期望值。deviation要求輸出單元頻數(shù)和期望值的偏差。misspri nt要求所有頻數(shù)表輸出缺失值的頻數(shù)。missing要求把缺失值當(dāng)作非缺失值看待,在計算百分?jǐn)?shù)及其他統(tǒng)計量時包括它們。sparse要求輸出在制表要求中變量水平的所有可能組合的信息。list以表格形式打印二維表。nocum/norow/nocol/nofreq/noprint分別不輸出累計頻率數(shù)、行百分率、列百分率、單元頻數(shù)、頻數(shù)表。5. weight 語句通常每個觀察對頻數(shù)計數(shù)的貢獻(xiàn)都是1。然而當(dāng)使用 weight語句時,每個觀察對頻數(shù)計數(shù)的貢

31、獻(xiàn)為這個觀察對應(yīng)的權(quán)數(shù)變量的值。6. output 語句該語句用于創(chuàng)建一個包含由 proc freq過程計算的統(tǒng)計量的 SAS數(shù)據(jù)集。由output語句創(chuàng) 建的數(shù)據(jù)集可以包括在 tables語句中要求的任意統(tǒng)計量。當(dāng)有多個tables語句時,output語句 創(chuàng)建的數(shù)據(jù)集的內(nèi)容相應(yīng)于最后要求的那個表。六、實例分析例29.1的SAS程序如下:data study.colleges ;do group=1 to 3;input n;do i=1 to n;input x ;output;end;end;cards;725 70 60 85 95 90 80660 20 30 15 40 35750 70 60 80 90 70 75proc npar1way data=study.colleges wilcoxon;class group;var x;run;程序說明:建立輸入數(shù)據(jù)集colleges,數(shù)據(jù)的輸入和完全隨機(jī)化方差分析的數(shù)據(jù)輸入完全相同,先輸入本組數(shù)據(jù)的總數(shù),然后輸入組中每個數(shù)據(jù)。分組變量為group,共有三組取值為1、2和3。輸入變量為x,存放每組中的數(shù)據(jù)。過程步調(diào)用npar1way過程,后面用選擇

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論