醫(yī)學(xué)統(tǒng)計學(xué)教學(xué)第十章-非參數(shù)檢驗課件_第1頁
醫(yī)學(xué)統(tǒng)計學(xué)教學(xué)第十章-非參數(shù)檢驗課件_第2頁
醫(yī)學(xué)統(tǒng)計學(xué)教學(xué)第十章-非參數(shù)檢驗課件_第3頁
醫(yī)學(xué)統(tǒng)計學(xué)教學(xué)第十章-非參數(shù)檢驗課件_第4頁
醫(yī)學(xué)統(tǒng)計學(xué)教學(xué)第十章-非參數(shù)檢驗課件_第5頁
已閱讀5頁,還剩71頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、第十章 非參數(shù)秩和檢驗吳 庫 生汕頭大學(xué)醫(yī)學(xué)院預(yù)防醫(yī)學(xué)教研室10/11/20221第十章 非參數(shù)秩和檢驗吳 庫 生10/10/20221參數(shù)統(tǒng)計與非參數(shù)統(tǒng)計1、參數(shù)統(tǒng)計(parametric statistics) 樣本所來自的總體分布具有某個已知的函數(shù)形式(如正態(tài)分布),而其中有的參數(shù)是未知的,統(tǒng)計分析的目的是對這些未知的參數(shù)進(jìn)行估計或檢驗。10/11/20222秩和檢驗參數(shù)統(tǒng)計與非參數(shù)統(tǒng)計1、參數(shù)統(tǒng)計(parametric st但實際上有些醫(yī)學(xué)研究資料并不符合上述條件,即使用變量變換的方法也難以達(dá)到應(yīng)用參數(shù)方法的要求。這就需要一種不依賴于總體分布的具體形式的統(tǒng)計方法來解決此類問題。由于這類

2、方法不受總體參數(shù)的影響,故稱非參數(shù)檢驗法。它檢驗的是分布,而非參數(shù)。10/11/20223秩和檢驗但實際上有些醫(yī)學(xué)研究資料并不符合上述條件,即使用變量變換的方2、非參數(shù)統(tǒng)計( non-parametric statistics ) 不考慮研究對象總體分布的具體形式,也不對總體參數(shù)進(jìn)行統(tǒng)計推斷,而是通過檢驗樣本所代表的總體分布形式是否一致來得出統(tǒng)計結(jié)論。由于這類方法不受總體參數(shù)的限制,故稱非參數(shù)統(tǒng)計法。有時也稱為任意分布檢驗(distribution-free statistics)。10/11/20224秩和檢驗2、非參數(shù)統(tǒng)計( non-parametric statis3、非參數(shù)統(tǒng)計的優(yōu)點

3、適用范圍廣,不論樣本所代表的總體分布形式如何,甚至是未知的,都可適用; 資料可用“等級”、“符號”表示,收集方便; 多數(shù)非參數(shù)檢驗方法簡便,易于理解和掌握。10/11/20225秩和檢驗3、非參數(shù)統(tǒng)計的優(yōu)點 適用范圍廣,不論樣本所代表的總體分布4、非參數(shù)統(tǒng)計的缺點 對符合用參數(shù)檢驗的資料,如用非參數(shù)統(tǒng)計,會丟失信息,導(dǎo)致檢驗效率下降,犯第II類錯誤的可能性比參數(shù)檢驗大,即值; 非參數(shù)檢驗的有些問題的計算仍顯繁冗。10/11/20226秩和檢驗4、非參數(shù)統(tǒng)計的缺點 對符合用參數(shù)檢驗的資料,如用非參數(shù)統(tǒng)何時使用非參數(shù)檢驗?等級資料(半定量資料) 當(dāng)指標(biāo)只能用嚴(yán)重程度(輕、中、重),優(yōu)劣等級(好、中

4、、差),治療轉(zhuǎn)歸(治愈、好轉(zhuǎn)、無效)等形式表達(dá)時,原始資料并非定量的,這些數(shù)據(jù)比“定量”粗,而比一般的“定性”細(xì),是相繼的若干階梯。但毗鄰的階梯之間并非等距離,亦不能度量。偏態(tài)分布資料10/11/20227秩和檢驗何時使用非參數(shù)檢驗?等級資料(半定量資料)10/10/202何時使用非參數(shù)檢驗?個別數(shù)據(jù)偏離過大資料 這里指的是隨機的偏離而不屬于“過失誤差”所致。還有一種情況就是數(shù)據(jù)的某一端無確定數(shù)值,如“50mg”等等,只給一個上限或下限,而沒有具體數(shù)值。各組離散程度相差懸殊(方差不齊)的資料 如經(jīng)變量變換達(dá)到方差齊性,則可用參數(shù)檢驗;否則的話就要用非參數(shù)法處理。10/11/20228秩和檢驗何

5、時使用非參數(shù)檢驗?個別數(shù)據(jù)偏離過大資料10/10/2022何時使用非參數(shù)檢驗?分布形態(tài)不明的資料 小樣本,但又不趨向于正態(tài)分布;不穩(wěn)定,例數(shù)少,分布不明確的資料。 符合參數(shù)檢驗條件首選參數(shù)檢驗 不符合條件非參數(shù)檢驗10/11/20229秩和檢驗何時使用非參數(shù)檢驗?分布形態(tài)不明的資料符合參數(shù)檢驗條件首選秩和檢驗秩次(rank):就是將觀察值按順序由小到大排列(排名次),并用序號(如1, 2, 3 )代替變量值本身,秩次即通常意義上的序號。秩和:即秩次的和。秩轉(zhuǎn)換:將數(shù)值變量轉(zhuǎn)換成秩次,再計算檢驗統(tǒng)計量的過程。秩和檢驗:就是通過秩次的排列求秩和進(jìn)行假設(shè)檢驗的方法。10/11/202210秩和檢驗秩

6、和檢驗秩次(rank):就是將觀察值按順序由小到大排列(排Contents第一節(jié) 配對資料的符號秩和檢驗(Wilcoxon配對法)第二節(jié) 兩獨立樣本比較的秩和檢驗(Wilcoxon兩樣本法)第三節(jié) 完全隨機設(shè)計多個樣本比較的秩和檢驗(Kruskal-allis檢驗)10/11/202211秩和檢驗Contents第一節(jié) 配對資料的符號秩和檢驗(Wilcox第一節(jié) 兩配對樣本差值的符號秩和檢驗(Wilcoxon signed rank test) 符號秩和檢驗由Wilcoxon于1945年提出,作為配對t檢驗的替代方法。檢驗配對資料的差值是否來自中位數(shù)為0的總體。 在數(shù)據(jù)滿足配對t檢驗的要求時,

7、符號秩和檢驗的功效是配對t檢驗效能的95%左右。10/11/202212秩和檢驗第一節(jié) 兩配對樣本差值的符號秩和檢驗(Wilcoxon si符號秩和檢驗的基本思想:在H0成立的條件下(兩配對處理效應(yīng)相同 ),兩配對樣本的差數(shù)的正負(fù)是隨機的,則正差數(shù)的秩和與負(fù)差數(shù)的秩和應(yīng)該相差不會太大,即總體中位數(shù)為0;反之,若兩秩和相差太懸殊,則認(rèn)為H0成立的可能性受到懷疑,從而拒絕H0,接受H1。10/11/202213秩和檢驗符號秩和檢驗的基本思想:在H0成立的條件下(兩配對處理效應(yīng)相例1:分別用氰化高鐵法與光電比色法測得10個血樣的血紅蛋白含量,問兩法測得結(jié)果有無差別?10/11/202214秩和檢驗例

8、1:分別用氰化高鐵法與光電比色法測得10個血樣的血紅蛋白含表1 兩種方法測定血清血紅蛋白含量血樣號 氰化高鐵法 光電比色法 1 15.0 12.5 2 12.8 12.9 3 13.5 13.0 4 11.3 12.8 5 12.3 15.4 6 12.1 12.9 7 13.7 13.0 8 12.9 14.1 9 12.9 12.1 10 13.0 12.9 配對差值經(jīng)檢驗不符合正態(tài)分布,不滿足t檢驗條件10/11/202215醫(yī)學(xué)統(tǒng)計學(xué)-秩和檢驗表1 兩種方法測定血清血紅蛋白含量配對差值經(jīng)檢驗不符合正態(tài)分符號秩和檢驗的基本步驟:建立檢驗假設(shè),確定檢驗水準(zhǔn) H0 :Md=0(兩處理效應(yīng)相同

9、) H1 :Md0(兩處理效應(yīng)不相同) =0.0510/11/202216秩和檢驗符號秩和檢驗的基本步驟:建立檢驗假設(shè),確定檢驗水準(zhǔn)10/102. 求兩組數(shù)據(jù)的差數(shù)d,對差數(shù)的絕對值編秩號 差數(shù)為0的數(shù)據(jù)忽略不計,對子數(shù)減1; 余下的n-i個差數(shù)按絕對值由小到大排秩號,但排好后的秩號要保持原差數(shù)的正負(fù)號; 差數(shù)絕對值相等時,則取其平均秩次。10/11/202217秩和檢驗2. 求兩組數(shù)據(jù)的差數(shù)d,對差數(shù)的絕對值編秩號 差表1 兩種方法測定血清血紅蛋白含量血樣號 氰化高 光電比 差值 負(fù)秩 正秩 鐵法 色法 (1) (2) (3) (4)=(2)-(3) (5) (6) 1 15.0 12.5

10、2.5 9 2 12.8 12.9 -0.1 -1.5 3 13.5 13.0 0.5 3 4 11.3 12.8 -1.5 -8 5 12.3 15.4 -3.1 -10 6 12.1 12.9 -0.8 -5.5 7 13.7 13.0 0.7 4 8 12.9 14.1 -1.2 -7 9 12.9 12.1 0.8 5.5 10 13.0 12.9 0.1 1.5 T-= -32 T+=23驗算:|T+ |+| T-| =n(n+1)/2=55統(tǒng)計量T對差數(shù)的絕對值編秩10/11/202218醫(yī)學(xué)統(tǒng)計學(xué)-秩和檢驗表1 兩種方法測定血清血紅蛋白含量統(tǒng)計量T對差10/10/23. 分別求正

11、、負(fù)差數(shù)的秩和,以絕對值較小者為T 驗算:T+T-=n(n+1)/24. 確定P值和作出推斷結(jié)論小樣本時(n50, n為d0的對子數(shù)),通過查p226附表8(T界值表)得到P值,原則是:若統(tǒng)計量T處于某T界值范圍之內(nèi),其P值大于或等于相應(yīng)概率;反之,則小于相應(yīng)概率。當(dāng)T值恰好等于附表中的界值時,其確切概率常小于相應(yīng)的概率水平。10/11/202219秩和檢驗3. 分別求正、負(fù)差數(shù)的秩和,以絕對值較小者為T10/10/本例中:T=23 對子數(shù)n=10,查p226附表8得2310 45 故 P0.10下結(jié)論:在=0.05水準(zhǔn)上不拒絕H0 ,故不能認(rèn)為兩法測得血紅蛋白含量有差別。10/11/2022

12、20秩和檢驗本例中:T=23 對子數(shù)n=10,查p226附表8得1 大樣本時( 對子數(shù)n50)通過公式進(jìn)行u轉(zhuǎn)化,采用正態(tài)近似檢驗: (式10-1) 式中0.5是連續(xù)性校正數(shù),因為T值是不連續(xù)的,而u分布是連續(xù)的。 秩和標(biāo)準(zhǔn)差平均秩和10/11/202221秩和檢驗 大樣本時( 對子數(shù)n50)通過公式進(jìn)行u轉(zhuǎn)化,采用正態(tài)當(dāng)存在同一秩較多時,按(式10-1)計算的u值要比實際的u值小,應(yīng)采用(公式10-2)對u加以校正:其中,tj是相同秩號的個數(shù)。校正系數(shù)10/11/202222秩和檢驗當(dāng)存在同一秩較多時,按(式10-1)計算的u值要比實際的u值符號秩和檢驗的SPSS實現(xiàn) SPSS(Statis

13、tical Package for Social Science,社會科學(xué)統(tǒng)計軟件包)一直是國際上最流行且最具權(quán)威性的統(tǒng)計分析軟件之一。SPSS最顯著的特點是菜單和對話框操作方式,無需編程,且圖形功能強大,易于掌握和操作。10/11/202223秩和檢驗符號秩和檢驗的SPSS實現(xiàn)10/10/202223秩和檢驗10/11/202224秩和檢驗10/10/202224秩和檢驗符號秩和檢驗的SPSS實現(xiàn)1 定義變量10/11/202225秩和檢驗符號秩和檢驗的SPSS實現(xiàn)1 定義變量10/10/20222符號秩和檢驗的SPSS實現(xiàn)2 輸入數(shù)據(jù)10/11/202226秩和檢驗符號秩和檢驗的SPSS實

14、現(xiàn)2 輸入數(shù)據(jù)10/10/210/11/202227秩和檢驗10/10/202227秩和檢驗符號秩和檢驗的SPSS實現(xiàn)10/11/202228秩和檢驗符號秩和檢驗的SPSS實現(xiàn)10/10/202228秩和檢驗符號秩和檢驗的SPSS實現(xiàn)10/11/202229秩和檢驗符號秩和檢驗的SPSS實現(xiàn)10/10/202229秩和檢驗Wilcoxon Signed Ranks Test結(jié)果10/11/202230秩和檢驗Wilcoxon Signed Ranks Test結(jié)果10第二節(jié) 兩獨立樣本秩和檢驗(Wilcoxon兩樣本比較法) 觀測值X A 7 14 22 36 40 48 63 98 41.0

15、029.81B 3 5 6 10 17 18 20 39 14.7511.73方差齊性檢驗: P0.05兩樣本方差不齊,不能應(yīng)用t檢驗10/11/202231醫(yī)學(xué)統(tǒng)計學(xué)-秩和檢驗第二節(jié) 兩獨立樣本秩和檢驗(Wilcoxon兩樣本比較法) 采用Wilcoxon兩獨立樣本秩和檢驗基本思想:假定原假設(shè)H0成立(樣本來自兩個相同總體),合并兩樣本,將觀察值由小到大排列,編寫秩次。在H0成立的條件下,T值應(yīng)接近平均秩和n0(1+N)/2,其中N=n1+n2, n0=min(n1, n2)。如果T值嚴(yán)重偏離平均秩和,則提示H0可能是不正確的。(1+2+3+ +16)/2=68n0(1+N)/2=8*(1+

16、16)=6810/11/202232醫(yī)學(xué)統(tǒng)計學(xué)-秩和檢驗采用Wilcoxon兩獨立樣本秩和檢驗基本思想:假定原假設(shè)H采用Wilcoxon秩和檢驗一、建立檢驗假設(shè),確定檢驗水準(zhǔn) H0 :樣本來自兩個相同總體 (樣本的每個觀察值來自兩總體的概率均為0.5) H1 :樣本來自兩個不同總體 (樣本的每個觀察值來自兩總體的概率不等) =0.0510/11/202233醫(yī)學(xué)統(tǒng)計學(xué)-秩和檢驗采用Wilcoxon秩和檢驗一、建立檢驗假設(shè),確定檢驗水準(zhǔn)1二、編秩 將兩組數(shù)據(jù)由小到大統(tǒng)一編秩,如遇相同原始數(shù)據(jù),若在同一組,仍按數(shù)據(jù)出現(xiàn)順序編秩;若在不同組,則取其平均秩次。本例編秩結(jié)果見表210/11/202234

17、秩和檢驗二、編秩10/10/202234秩和檢驗表2 兩種療法的退熱時間 新療法 舊療法退熱時間 秩號 退熱時間 秩號 25 1 36 5 30 2 40 9 32 3 44 11 35 4 48 13.5 37 6 50 15 39 7.5 56 16 39 7.5 59 17 42 10 60 18 46 12 64 19 48 13.5 195 20 240 21 n1=10 T1=66.5 n2=11 T2=164.5兩樣本混合后統(tǒng)一編秩求得秩號分別求秩和10/11/202235醫(yī)學(xué)統(tǒng)計學(xué)-秩和檢驗表2 兩種療法的退熱時間兩樣本混分別求秩和10/10/20三、分組求秩和并確定檢驗統(tǒng)計量

18、當(dāng)樣本例數(shù)不等時,取較小例數(shù)組的秩和為統(tǒng)計量T;如n1=n2,則取任一組秩和為統(tǒng)計量T。本例中: n1=10 ,不拒絕H0;如果T值恰好等于界值,P;如果T位于檢驗界值區(qū)間外,P,拒絕H0 ,接受H1 。 10/11/202237醫(yī)學(xué)統(tǒng)計學(xué)-秩和檢驗四、查p227附表9( n1,n2均較小 )確定檢驗界值的區(qū)在本例中,T=66.5,取=0.05,根據(jù)附表9雙側(cè)檢驗界值0.01區(qū)間為(73,147),T位于區(qū)間外,所以P0.01。Pn2=50 T=例數(shù)較少組對應(yīng)的秩和=T2=4338.5(T)10/11/202253醫(yī)學(xué)統(tǒng)計學(xué)-秩和檢驗 計算檢驗統(tǒng)計量,確定P值10/10/202253醫(yī)學(xué)統(tǒng)計根據(jù)公式(10-3)計算u根據(jù)C根據(jù)t界值表,PH,則P;大樣本情況:若k 3或ni 5時,理論上,H近似服從自由度為k1的 分布,可查附表7( 界值表)得出P值,最后按P值作出推斷結(jié)論。10/11/202272秩和檢驗確定P值,作出推斷結(jié)論10/10/202272秩和檢驗 本例處理數(shù)k=3,各組樣本含量均

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論