生物統(tǒng)計-非參數(shù)檢驗課件_第1頁
生物統(tǒng)計-非參數(shù)檢驗課件_第2頁
生物統(tǒng)計-非參數(shù)檢驗課件_第3頁
生物統(tǒng)計-非參數(shù)檢驗課件_第4頁
生物統(tǒng)計-非參數(shù)檢驗課件_第5頁
已閱讀5頁,還剩91頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

CharlesEdwardSpearman(1863-1945),anEnglishpsychologistknownforSpearman’srankcorrelationcoefficient.CharlesEdwardSpearman(1863-FrankWilcoxon(1892–1965),chemistandstatistician,inventoroftwonon-parametrictestsforstatisticalsignificance:TheWilcoxonsigned-ranktest;TheWilcoxonrank-sumtest(alsoknownastheMann-WhitneyUtest).Instatistics,theMann–WhitneyUtest(alsocalledtheMann–Whitney–Wilcoxon(MWW),Wilcoxonrank-sumtest,orWilcoxon–Mann–Whitneytest)isanon-parametrictestforassessingwhethertwoindependentsamplesofobservationscomefromthesamedistribution.Itisoneofthebest-knownnon-parametricsignificancetests.ItwasproposedinitiallybyFrankWilcoxonin1945,forequalsamplesizes,andextendedtoarbitrarysamplesizesandinotherwaysbyMannandWhitney(1947).MWWisvirtuallyidenticaltoperforminganordinaryparametrictwo-samplettestonthedataafterrankingoverthecombinedsamples.FrankWilcoxon(1892–1965),chAndreyNikolaevichKolmogorov(1903

–1987)wasaSoviet

Russian

mathematician,preeminentinthe20thcenturywhoadvancedvariousscientificfields(amongthemprobabilitytheory,topology,intuitionisticlogic,turbulence,classicalmechanicsandcomputationalcomplexity).Kolmogorovworksonhistalk(Tallinn,EstonianSSR,1973)Instatistics,theKolmogorov–Smirnovtest(K–Stest)isaformofminimumdistanceestimationusedasanonparametrictestofequalityofone-dimensionalprobabilitydistributionsusedtocompareasamplewithareferenceprobabilitydistribution(one-sampleK–Stest),ortocomparetwosamples(two-sampleK–Stest).AndreyNikolaevichKolmogorov問題的提出總體分布假設(shè)檢驗方法正態(tài)分布t檢驗,F(xiàn)檢驗…總體不服從正態(tài)分布或分布未知,但若為大樣本,則根據(jù)中心極限定理,認(rèn)為近似服從正態(tài)分布t檢驗,F(xiàn)檢驗…總體不服從正態(tài)分布或分布未知,若為小樣本??問題的提出總體分布假設(shè)檢驗方法正態(tài)分布t檢驗,F(xiàn)檢驗…總體第十四章非參數(shù)檢驗(nonparametrictest)

總體分布假設(shè)檢驗方法正態(tài)分布t檢驗,F(xiàn)檢驗…總體不服從正態(tài)分布或分布未知,但若為大樣本,則根據(jù)中心極限定理,認(rèn)為近似服從正態(tài)分布t檢驗,F(xiàn)檢驗…總體不服從正態(tài)分布或分布未知,若為小樣本非參數(shù)檢驗第十四章非參數(shù)檢驗總體分布假設(shè)檢驗方法正態(tài)分布t檢驗,F(xiàn)14.1、非參數(shù)檢驗(nonparametrictest,distribution-freetest

)

參數(shù)檢驗非參數(shù)檢驗需要利用總體分布信息的檢驗方法被稱為參數(shù)檢驗法

不需要利用總體參數(shù)(如平均數(shù)、標(biāo)準(zhǔn)差等)的信息

如t檢驗,F(xiàn)檢驗…如χ2檢驗,符號檢驗,秩和檢驗等14.1、非參數(shù)檢驗參數(shù)檢驗非參數(shù)檢驗需要利用總體分布信息的14.1符號檢驗法(signtest)用于配對資料差異顯著性檢驗的一種方法它只根據(jù)樣本各對數(shù)據(jù)大小之差的正負(fù)符號來檢驗兩個樣本所屬總體分布的異同,而不考慮其差值的大小檢驗的基本思想與原理為,假定二個樣本所屬總體服從相同的分布,則正號或負(fù)號出現(xiàn)的頻率應(yīng)該相等,或至少相差不應(yīng)過大,當(dāng)其相差超過一定的臨界值時,就認(rèn)為二個樣本所屬總體有顯著差異,它們不服從相同的分布

14.1符號檢驗法(signtest)用于配對資料差【例14.1】用甲乙二種方法檢測20個奶樣的脂肪含量(%),其數(shù)據(jù)如表14-1,問二種方法的檢測結(jié)果有無顯著差異?表14-1用甲乙二種方法檢測20個奶樣的脂肪含量(%)數(shù)據(jù)奶樣序號12345678910甲方法4.343.783.803.933.943.834.564.404.423.99乙方法4.393.823.794.043.963.984.444.424.384.12符號--+----+-奶樣序號11121314151617181920甲方法3.863.744.634.043.623.563.914.493.533.67乙方法3.763.744.584.273.843.633.954.483.563.87符號0+---+--【例14.1】用甲乙二種方法檢測20個奶樣的脂肪含量(%表14-1用甲乙二種方法檢測20個奶樣的脂肪含量(%)數(shù)據(jù)奶樣序號12345678910甲方法4.343.783.803.933.943.834.564.404.423.99乙方法4.393.823.794.043.963.984.444.424.384.12符號--+----+-奶樣序號11121314151617181920甲方法3.863.744.634.043.623.563.914.493.533.67乙方法3.763.744.584.273.843.633.954.483.563.87符號0+---+--檢驗的基本思想與原理為,假定二個樣本所屬總體服從相同的分布,則正號或負(fù)號出現(xiàn)的頻率應(yīng)該相等,或至少相差不應(yīng)過大,當(dāng)其相差超過一定的臨界值時,就認(rèn)為二個樣本所屬總體有顯著差異,它們不服從相同的分布

表14-1用甲乙二種方法檢測20個奶樣的脂肪含量(%)數(shù)表14-1用甲乙二種方法檢測20個奶樣的脂肪含量(%)數(shù)據(jù)奶樣序號12345678910甲方法4.343.783.803.933.943.834.564.404.423.99乙方法4.393.823.794.043.963.984.444.424.384.12符號--+----+-奶樣序號11121314151617181920甲方法3.863.744.634.043.623.563.914.493.533.67乙方法3.763.744.584.273.843.633.954.483.563.87符號0+---+--假設(shè)是:HO:甲乙二種方法的分析結(jié)果相同;HA:甲乙二種方法的分析結(jié)果不相同表14-1用甲乙二種方法檢測20個奶樣的脂肪含量(%)數(shù)表14-1用甲乙二種方法檢測20個奶樣的脂肪含量(%)數(shù)據(jù)奶樣序號12345678910甲方法4.343.783.803.933.943.834.564.404.423.99乙方法4.393.823.794.043.963.984.444.424.384.12符號--+----+-奶樣序號11121314151617181920甲方法3.863.744.634.043.623.563.914.493.633.67乙方法3.763.744.584.273.843.633.954.483.563.87符號0+---++-假設(shè)是:HO:甲乙二種方法的分析結(jié)果相同;HA:甲乙二種方法的分析結(jié)果不相同n=7,n=12,n0=1r=min(n,n)=min(7,12)=7N=n

n=712=19表14-1用甲乙二種方法檢測20個奶樣的脂肪含量(%)數(shù)表14-1用甲乙二種方法檢測20個奶樣的脂肪含量(%)數(shù)據(jù)奶樣序號12345678910甲方法4.343.783.803.933.943.834.564.404.423.99乙方法4.393.823.794.043.963.984.444.424.384.12符號--+----+-奶樣序號11121314151617181920甲方法3.863.744.634.043.623.563.914.493.533.67乙方法3.763.744.584.273.843.633.954.483.563.87符號0+---+--假設(shè)是:HO:甲乙二種方法的分析結(jié)果相同;HA:甲乙二種方法的分析結(jié)果不相同n=7,n=12,n0=1r=min(n,n)=min(7,12)=7N=n

n=712=19N是樣本中的有效對子數(shù),因為差值等于0的對子不提供任何信息,所以在N中不包含差值等于0的對子數(shù)。如果原假設(shè)成立,r值應(yīng)接近2/N,否則就會顯著偏離2/N

表14-1用甲乙二種方法檢測20個奶樣的脂肪含量(%)數(shù)n=7,n=12,n0=1r=min(n,n)=min(7,12)=7N=n

n=712=19如果原假設(shè)成立,r值應(yīng)接近2/N,否則就會顯著偏離2/N

附表11(符號檢驗表)給出了判斷r值在顯著性水平為0.05和0.01時是否顯著偏離2/N的臨界值,將由樣本得到的r值與這二個臨界值比較若rr0.05(N),則甲乙二種方法分析結(jié)果差異不顯著(P

0.05);若r0.01(N)

r

r0.05(N),則甲乙二種方法分析結(jié)果差異顯著(0.01

P

0.05);若r

r0.01(N),則甲乙二種方法分析結(jié)果差異極顯著(P

0.01)。n=7,n=12,n0=1如果原假設(shè)成立,r表14-1用甲乙二種方法檢測20個奶樣的脂肪含量(%)數(shù)據(jù)奶樣序號12345678910甲方法4.343.783.803.933.943.834.564.404.423.99乙方法4.393.823.794.043.963.984.444.424.384.12符號--+----+-奶樣序號11121314151617181920甲方法3.863.744.634.043.623.563.914.493.533.67乙方法3.763.744.584.273.843.633.954.483.563.87符號0+---+--假設(shè)是:HO:甲乙二種方法的分析結(jié)果相同;HA:甲乙二種方法的分析結(jié)果不相同n=7,n=12,n0=1r=min(n,n)=min(7,12)=7N=n

n=712=19查符號檢驗表得r0.05(19)=4r=7

r0.05(19)表明甲乙二種方法的檢測結(jié)果差異不顯著。

表14-1用甲乙二種方法檢測20個奶樣的脂肪含量(%)數(shù)表14-1用甲乙二種方法檢測20個奶樣的脂肪含量(%)數(shù)據(jù)奶樣序號12345678910甲方法4.343.783.803.933.943.834.564.404.423.99乙方法4.393.823.794.043.963.984.444.424.384.12符號--+----+-奶樣序號11121314151617181920甲方法3.863.744.634.043.623.563.914.493.633.67乙方法3.763.744.584.273.843.633.954.483.563.87符號0+---++-假設(shè)是:HO:甲乙二種方法的分析結(jié)果相同;HA:甲乙二種方法的分析結(jié)果不相同符號檢驗也可以采用2求解

n=7,n=12,n0=1r=min(n,n)=min(7,12)=7N=n

n=712=19表14-1用甲乙二種方法檢測20個奶樣的脂肪含量(%)數(shù)表14-1用甲乙二種方法檢測20個奶樣的脂肪含量(%)數(shù)據(jù)奶樣序號12345678910甲方法4.343.783.803.933.943.834.564.404.423.99乙方法4.393.823.794.043.963.984.444.424.384.12符號--+----+-奶樣序號11121314151617181920甲方法3.863.744.634.043.623.563.914.493.533.67乙方法3.763.744.584.273.843.633.954.483.563.87符號0+---+--假設(shè)是:HO:甲乙二種方法的分析結(jié)果相同;HA:甲乙二種方法的分析結(jié)果不相同符號檢驗也可以采用2求解

n=7,n=12,n0=1r=min(n,n)=min(7,12)=7N=n

n=712=192值小于5%的臨界2值3.84,所以甲乙二種方法分析結(jié)果差異不顯著(P

0.05)表14-1用甲乙二種方法檢測20個奶樣的脂肪含量(%)數(shù)14.3符號秩和檢驗法(signranksumtest)也稱為Wilcoxon配對檢驗法與符號檢驗法相比,符號秩和檢驗的改進之處在于考慮了差值的大小14.3符號秩和檢驗法(signranksumte14.3符號秩和檢驗法(signranksumtest)也稱為Wilcoxon配對檢驗法奶樣序號12345678910甲方法4.343.783.803.933.943.834.564.404.423.99乙方法4.393.823.794.043.963.984.444.424.384.12差值-0.05-0.040.01-0.11-0.02-0.150.12-0.020.04-0.13秩次-10.5-82.5-14-4.5-1715-4.58-16奶樣序號11121314151617181920甲方法3.863.744.634.043.623.563.914.493.533.67乙方法3.763.744.584.273.843.633.954.483.563.87差值0.1000.05-0.23-0.22-0.07-0.040.01-0.03-0.20秩次130.5-0.510.520-19-12-82.5-6-18【例14.2】用甲乙二種方法檢測20個奶樣的脂肪含量(%),其數(shù)據(jù)如表,問二種方法的檢測結(jié)果有無顯著差異?14.3符號秩和檢驗法(signranksumte14.3符號秩和檢驗法(signranksumtest)奶樣序號12345678910差值-0.05-0.040.01-0.11-0.02-0.150.12-0.020.04-0.13秩次-10.5-82.5-14-4.5-1715-4.58-16奶樣序號11121314151617181920差值0.1000.05-0.23-0.22-0.07-0.040.01-0.03-0.20秩次130.5-0.510.520-19-12-82.5-6-18表14-2符號秩和檢驗法列表符號秩和檢驗的步驟是:(1)求差值,甲方法減乙方法的差值,并標(biāo)上符號。14.3符號秩和檢驗法(signranksumte奶樣序號12345678910差值-0.05-0.040.01-0.11-0.02-0.150.12-0.020.04-0.13秩次-10.5-82.5-14-4.5-1715-4.58-16奶樣序號11121314151617181920差值0.1000.05-0.23-0.22-0.07-0.040.01-0.03-0.20秩次130.5-0.510.520-19-12-82.5-6-18表14-2符號秩和檢驗法列表符號秩和檢驗的步驟是:(2)確定秩次,將差值按絕對值的大小順序從小至大排列,每一差值對應(yīng)的順序號就為該差值的秩次,并標(biāo)上原差值的符號。遇到相同差值求平均秩次,依次類推。本例的差值最小的為0,其秩次為1,由于該差值沒有符號,因而將它折分為2個0.5,一正一負(fù);奶樣序號12345678910差值-0.05-0.040.0奶樣序號12345678910差值-0.05-0.040.01-0.11-0.02-0.150.12-0.020.04-0.13秩次-10.5-82.5-14-4.5-1715-4.58-16奶樣序號11121314151617181920差值0.1000.05-0.23-0.22-0.07-0.040.01-0.03-0.20秩次130.5-0.510.520-19-12-82.5-6-18表14-2符號秩和檢驗法列表符號秩和檢驗的步驟是:(3)求秩和,將正負(fù)秩次分別相加,用T+表示正秩次之和,用T–表示負(fù)秩次之和取秩和絕對值小者T=min(T+,T–)作為檢驗統(tǒng)計量,本例,T+為52,T–-為158,T為52。奶樣序號12345678910差值-0.05-0.040.0奶樣序號12345678910差值-0.05-0.040.01-0.11-0.02-0.150.12-0.020.04-0.13秩次-10.5-82.5-14-4.5-1715-4.58-16奶樣序號11121314151617181920差值0.1000.05-0.23-0.22-0.07-0.040.01-0.03-0.20秩次130.5-0.510.520-19-12-82.5-6-18表14-2符號秩和檢驗法列表符號秩和檢驗的步驟是:(4)統(tǒng)計推斷,根據(jù)樣本含量對子數(shù)n查附表12(符號秩和檢驗表),得顯著性水平為5%與1%的臨界值分別為T0.05(n)

=52及T0.01(n)

=38,用T=52與臨界值比較,當(dāng)小于某一水平的臨界值時,就表明在這一顯著水平下顯著。本例剛好等于52,表明甲乙二種方法分析結(jié)果剛好在5%水平上達到顯著。奶樣序號12345678910差值-0.05-0.040.014.4二組非配對資料的秩和檢驗法

又稱為曼-惠特尼(Mann-Whitney)秩和檢驗14.5多組資料的秩和檢驗

又稱為Kruskal-Wallis檢驗法

14.4二組非配對資料的秩和檢驗法14.5多組資料的14.6

秩相關(guān)(rankcorrelation)

也稱為等級相關(guān)

對普通的相關(guān)系數(shù)來說,樣本抽自正態(tài)總體是非常重要的,否則很可能得到錯誤的結(jié)論。如果已知總體非正態(tài),又沒有適當(dāng)?shù)淖儞Q方法使它變換為正態(tài),則可計算秩相關(guān)檢驗。14.6秩相關(guān)(rankcorrelation)14.6

秩相關(guān)(rankcorrelation)

也稱為等級相關(guān)

如果已知總體非正態(tài),又沒有適當(dāng)?shù)淖儞Q方法使它變換為正態(tài),則可計算秩相關(guān)檢驗。常用的度量指標(biāo)是Spearman秩相關(guān)系數(shù),rs

14.6秩相關(guān)(rankcorrelation)如果已方法:先將兩指標(biāo)X與Y分別從小到大排序,對每一個體得到它的兩個指標(biāo)的秩值令方法:先將兩指標(biāo)X與Y分別從小到大排序,對每一個體得到它的兩例3.34調(diào)查得到某幾個地區(qū)的大氣污染綜合指數(shù)(PI)與肺癌發(fā)病率如下表所示,試作秩相關(guān)檢驗。地區(qū)號1234567PI肺癌發(fā)病率2.954.352.250.462.143.182.640.501.730.301.210.001.49.00例3.34調(diào)查得到某幾個地區(qū)的大氣污染綜合指數(shù)(PI)與地區(qū)號1234567PI肺癌發(fā)病率2.954.352.250.462.143.182.640.501.730.301.210.001.49.00解:先將表中的數(shù)據(jù)轉(zhuǎn)化為相應(yīng)的秩,得到地區(qū)號1234567PI秩肺癌發(fā)病率秩77564564331221地區(qū)號1234567PI2.92.22.12.61.71.2對Spearman秩相關(guān)系數(shù)的顯著性檢驗:當(dāng)n

15時,可查Spearman秩相關(guān)系數(shù)顯著性檢驗表(附表10)進行統(tǒng)計推斷r0.05(7)=0.786,r0.01(7)=0.929,因為

r0.05(7)<rs<r0.01(7)

,所以要拒絕H0,認(rèn)為有顯著的差異,即大氣污染綜合指數(shù)(PI)與肺癌發(fā)病率有關(guān)。對Spearman秩相關(guān)系數(shù)的顯著性檢驗:對Spearman秩相關(guān)系數(shù)的顯著性檢驗:當(dāng)n

15時,可查Spearman秩相關(guān)系數(shù)顯著性檢驗表(附表10)進行統(tǒng)計推斷當(dāng)n15時,由于rs與r的抽樣分布開始接近,故可根據(jù)df=n-2,查簡單相關(guān)系數(shù)的顯著性檢驗表(附表9)進行統(tǒng)計推斷

當(dāng)n充分大時rs近似服從正態(tài)分布,這時可對rs作Z檢驗

對Spearman秩相關(guān)系數(shù)的顯著性檢驗:公式區(qū)別(推導(dǎo))公式區(qū)別(推導(dǎo))地區(qū)號1234567PI秩Xi肺癌發(fā)病率秩Yi77564564331221地區(qū)號1234567PI秩Xi7546312生物統(tǒng)計-非參數(shù)檢驗課件公牛號12345678910方法1X31562487910方法2Y32610159748等級差d0-1–1-41-1–1052d的平方011161110254例9-2公牛號123456生物統(tǒng)計-非參數(shù)檢驗課件生物統(tǒng)計-非參數(shù)檢驗課件生物統(tǒng)計-非參數(shù)檢驗課件

豬號12345678肉色評分22233334秩次11144448平均2225.55.55.55.58PH值5.505.515.606.336.105.806.076.22秩次12386457等級差d10-1-2.5-0.51.50.51d的平方1016.250.252.250.251例9-3豬號12

豬號12345678肉色評分22233334秩次11144448平均2225.55.55.55.58PH值5.505.515.606.336.105.806.076.22秩次12386457等級差d10-1-2.5-0.51.50.51d的平方1016.250.252.250.251例9-3豬號12生物統(tǒng)計-非參數(shù)檢驗課件某豬場從10窩大白豬的仔豬中,每窩選取性別相同、體重相近的仔豬2頭,隨機地分配到兩個飼料組,進行飼料對比試驗,試驗30天后,各仔豬的增重結(jié)果見下表,試檢驗兩種飼料飼喂的仔豬平均增重差異是否顯著。

窩號12345678910飼料I10.011.212.110.511.19.810.812.512.09.9飼料II10.510.511.89.512.08.89.711.211.09.0di-0.50.70.31.0-0.91.01.11.31.00.9某豬場從10窩大白豬的仔豬中,每窩選取性別相同、體重相近的仔某豬場從10窩大白豬的仔豬中,每窩選取性別相同、體重相近的仔豬2頭,隨機地分配到兩個飼料組,進行飼料對比試驗,試驗30天后,各仔豬的增重結(jié)果見下表,試檢驗兩種飼料飼喂的仔豬平均增重差異是否顯著。用配對資料的檢驗方法:t檢驗:用非配對資料的檢驗方法:t檢驗:某豬場從10窩大白豬的仔豬中,每窩選取性別相同、體重相近的仔如果用符號檢驗法(signtest)的檢驗結(jié)果會如何?窩號12345678910飼料I10.011.212.110.511.19.810.812.512.09.9飼料II10.510.511.89.512.08.89.711.211.09.0符號-+++-+++++n=8,n=2,n0=0r=min(n,n)=min(8,2)=2N=n

n=82=10查符號檢驗表得r0.05(10)=1r=2

r0.05(10)表明兩種飼料的效果差異不顯著。

如果用符號檢驗法(signtest)的檢驗結(jié)果會如何?窩號用配對資料的檢驗方法:t檢驗:用非配對資料的檢驗方法:t檢驗:用符號檢驗法(signtest)r=2

r0.05(10),表明兩種飼料的效果差異不顯著。

用配對資料的檢驗方法:t檢驗:用非配對資料的檢驗方法:t檢驗非參數(shù)檢驗(nonparametrictest,distribution-freetest

)

參數(shù)檢驗非參數(shù)檢驗需要利用總體分布信息的檢驗方法被稱為參數(shù)檢驗法

不需要利用總體參數(shù)(如平均數(shù)、標(biāo)準(zhǔn)差等)的信息

如t檢驗,F(xiàn)檢驗…如χ2檢驗,符號檢驗,秩和檢驗等非參數(shù)檢驗參數(shù)檢驗非參數(shù)檢驗需要利用總體分布信息的檢驗方法被非參數(shù)檢驗(nonparametrictest,distribution-freetest

)

參數(shù)檢驗非參數(shù)檢驗需要利用總體分布信息的檢驗方法被稱為參數(shù)檢驗法

不需要利用總體參數(shù)(如平均數(shù)、標(biāo)準(zhǔn)差等)的信息

如t檢驗,F(xiàn)檢驗…如χ2檢驗,符號檢驗,秩和檢驗等當(dāng)資料符合參數(shù)檢驗條件時,非參數(shù)檢驗法的效率始終低于參數(shù)檢驗法非參數(shù)檢驗參數(shù)檢驗非參數(shù)檢驗需要利用總體分布信息的檢驗方法被非參數(shù)檢驗(nonparametrictest,distribution-freetest

)

參數(shù)檢驗非參數(shù)檢驗需要利用總體分布信息的檢驗方法被稱為參數(shù)檢驗法

不需要利用總體參數(shù)(如平均數(shù)、標(biāo)準(zhǔn)差等)的信息

如t檢驗,F(xiàn)檢驗…如χ2檢驗,符號檢驗,秩和檢驗等非參數(shù)檢驗法沒有利用已知的總體分布信息,也沒有充分利用樣本提供的信息,因而檢驗功效較低,犯II型錯誤的可能性較大

非參數(shù)檢驗參數(shù)檢驗非參數(shù)檢驗需要利用總體分布信息的檢驗方法被結(jié)論參數(shù)檢驗非參數(shù)檢驗需要利用總體分布信息的檢驗方法被稱為參數(shù)檢驗法

不需要利用總體參數(shù)(如平均數(shù)、標(biāo)準(zhǔn)差等)的信息

如t檢驗,F(xiàn)檢驗…如χ2檢驗,符號檢驗,秩和檢驗等

當(dāng)資料符合參數(shù)檢驗條件時,宜選用參數(shù)檢驗法進行假設(shè)檢驗

結(jié)論參數(shù)檢驗非參數(shù)檢驗需要利用總體分布信息的檢驗方法CharlesEdwardSpearman(1863-1945),anEnglishpsychologistknownforSpearman’srankcorrelationcoefficient.CharlesEdwardSpearman(1863-FrankWilcoxon(1892–1965),chemistandstatistician,inventoroftwonon-parametrictestsforstatisticalsignificance:TheWilcoxonsigned-ranktest;TheWilcoxonrank-sumtest(alsoknownastheMann-WhitneyUtest).Instatistics,theMann–WhitneyUtest(alsocalledtheMann–Whitney–Wilcoxon(MWW),Wilcoxonrank-sumtest,orWilcoxon–Mann–Whitneytest)isanon-parametrictestforassessingwhethertwoindependentsamplesofobservationscomefromthesamedistribution.Itisoneofthebest-knownnon-parametricsignificancetests.ItwasproposedinitiallybyFrankWilcoxonin1945,forequalsamplesizes,andextendedtoarbitrarysamplesizesandinotherwaysbyMannandWhitney(1947).MWWisvirtuallyidenticaltoperforminganordinaryparametrictwo-samplettestonthedataafterrankingoverthecombinedsamples.FrankWilcoxon(1892–1965),chAndreyNikolaevichKolmogorov(1903

–1987)wasaSoviet

Russian

mathematician,preeminentinthe20thcenturywhoadvancedvariousscientificfields(amongthemprobabilitytheory,topology,intuitionisticlogic,turbulence,classicalmechanicsandcomputationalcomplexity).Kolmogorovworksonhistalk(Tallinn,EstonianSSR,1973)Instatistics,theKolmogorov–Smirnovtest(K–Stest)isaformofminimumdistanceestimationusedasanonparametrictestofequalityofone-dimensionalprobabilitydistributionsusedtocompareasamplewithareferenceprobabilitydistribution(one-sampleK–Stest),ortocomparetwosamples(two-sampleK–Stest).AndreyNikolaevichKolmogorov問題的提出總體分布假設(shè)檢驗方法正態(tài)分布t檢驗,F(xiàn)檢驗…總體不服從正態(tài)分布或分布未知,但若為大樣本,則根據(jù)中心極限定理,認(rèn)為近似服從正態(tài)分布t檢驗,F(xiàn)檢驗…總體不服從正態(tài)分布或分布未知,若為小樣本??問題的提出總體分布假設(shè)檢驗方法正態(tài)分布t檢驗,F(xiàn)檢驗…總體第十四章非參數(shù)檢驗(nonparametrictest)

總體分布假設(shè)檢驗方法正態(tài)分布t檢驗,F(xiàn)檢驗…總體不服從正態(tài)分布或分布未知,但若為大樣本,則根據(jù)中心極限定理,認(rèn)為近似服從正態(tài)分布t檢驗,F(xiàn)檢驗…總體不服從正態(tài)分布或分布未知,若為小樣本非參數(shù)檢驗第十四章非參數(shù)檢驗總體分布假設(shè)檢驗方法正態(tài)分布t檢驗,F(xiàn)14.1、非參數(shù)檢驗(nonparametrictest,distribution-freetest

)

參數(shù)檢驗非參數(shù)檢驗需要利用總體分布信息的檢驗方法被稱為參數(shù)檢驗法

不需要利用總體參數(shù)(如平均數(shù)、標(biāo)準(zhǔn)差等)的信息

如t檢驗,F(xiàn)檢驗…如χ2檢驗,符號檢驗,秩和檢驗等14.1、非參數(shù)檢驗參數(shù)檢驗非參數(shù)檢驗需要利用總體分布信息的14.1符號檢驗法(signtest)用于配對資料差異顯著性檢驗的一種方法它只根據(jù)樣本各對數(shù)據(jù)大小之差的正負(fù)符號來檢驗兩個樣本所屬總體分布的異同,而不考慮其差值的大小檢驗的基本思想與原理為,假定二個樣本所屬總體服從相同的分布,則正號或負(fù)號出現(xiàn)的頻率應(yīng)該相等,或至少相差不應(yīng)過大,當(dāng)其相差超過一定的臨界值時,就認(rèn)為二個樣本所屬總體有顯著差異,它們不服從相同的分布

14.1符號檢驗法(signtest)用于配對資料差【例14.1】用甲乙二種方法檢測20個奶樣的脂肪含量(%),其數(shù)據(jù)如表14-1,問二種方法的檢測結(jié)果有無顯著差異?表14-1用甲乙二種方法檢測20個奶樣的脂肪含量(%)數(shù)據(jù)奶樣序號12345678910甲方法4.343.783.803.933.943.834.564.404.423.99乙方法4.393.823.794.043.963.984.444.424.384.12符號--+----+-奶樣序號11121314151617181920甲方法3.863.744.634.043.623.563.914.493.533.67乙方法3.763.744.584.273.843.633.954.483.563.87符號0+---+--【例14.1】用甲乙二種方法檢測20個奶樣的脂肪含量(%表14-1用甲乙二種方法檢測20個奶樣的脂肪含量(%)數(shù)據(jù)奶樣序號12345678910甲方法4.343.783.803.933.943.834.564.404.423.99乙方法4.393.823.794.043.963.984.444.424.384.12符號--+----+-奶樣序號11121314151617181920甲方法3.863.744.634.043.623.563.914.493.533.67乙方法3.763.744.584.273.843.633.954.483.563.87符號0+---+--檢驗的基本思想與原理為,假定二個樣本所屬總體服從相同的分布,則正號或負(fù)號出現(xiàn)的頻率應(yīng)該相等,或至少相差不應(yīng)過大,當(dāng)其相差超過一定的臨界值時,就認(rèn)為二個樣本所屬總體有顯著差異,它們不服從相同的分布

表14-1用甲乙二種方法檢測20個奶樣的脂肪含量(%)數(shù)表14-1用甲乙二種方法檢測20個奶樣的脂肪含量(%)數(shù)據(jù)奶樣序號12345678910甲方法4.343.783.803.933.943.834.564.404.423.99乙方法4.393.823.794.043.963.984.444.424.384.12符號--+----+-奶樣序號11121314151617181920甲方法3.863.744.634.043.623.563.914.493.533.67乙方法3.763.744.584.273.843.633.954.483.563.87符號0+---+--假設(shè)是:HO:甲乙二種方法的分析結(jié)果相同;HA:甲乙二種方法的分析結(jié)果不相同表14-1用甲乙二種方法檢測20個奶樣的脂肪含量(%)數(shù)表14-1用甲乙二種方法檢測20個奶樣的脂肪含量(%)數(shù)據(jù)奶樣序號12345678910甲方法4.343.783.803.933.943.834.564.404.423.99乙方法4.393.823.794.043.963.984.444.424.384.12符號--+----+-奶樣序號11121314151617181920甲方法3.863.744.634.043.623.563.914.493.633.67乙方法3.763.744.584.273.843.633.954.483.563.87符號0+---++-假設(shè)是:HO:甲乙二種方法的分析結(jié)果相同;HA:甲乙二種方法的分析結(jié)果不相同n=7,n=12,n0=1r=min(n,n)=min(7,12)=7N=n

n=712=19表14-1用甲乙二種方法檢測20個奶樣的脂肪含量(%)數(shù)表14-1用甲乙二種方法檢測20個奶樣的脂肪含量(%)數(shù)據(jù)奶樣序號12345678910甲方法4.343.783.803.933.943.834.564.404.423.99乙方法4.393.823.794.043.963.984.444.424.384.12符號--+----+-奶樣序號11121314151617181920甲方法3.863.744.634.043.623.563.914.493.533.67乙方法3.763.744.584.273.843.633.954.483.563.87符號0+---+--假設(shè)是:HO:甲乙二種方法的分析結(jié)果相同;HA:甲乙二種方法的分析結(jié)果不相同n=7,n=12,n0=1r=min(n,n)=min(7,12)=7N=n

n=712=19N是樣本中的有效對子數(shù),因為差值等于0的對子不提供任何信息,所以在N中不包含差值等于0的對子數(shù)。如果原假設(shè)成立,r值應(yīng)接近2/N,否則就會顯著偏離2/N

表14-1用甲乙二種方法檢測20個奶樣的脂肪含量(%)數(shù)n=7,n=12,n0=1r=min(n,n)=min(7,12)=7N=n

n=712=19如果原假設(shè)成立,r值應(yīng)接近2/N,否則就會顯著偏離2/N

附表11(符號檢驗表)給出了判斷r值在顯著性水平為0.05和0.01時是否顯著偏離2/N的臨界值,將由樣本得到的r值與這二個臨界值比較若rr0.05(N),則甲乙二種方法分析結(jié)果差異不顯著(P

0.05);若r0.01(N)

r

r0.05(N),則甲乙二種方法分析結(jié)果差異顯著(0.01

P

0.05);若r

r0.01(N),則甲乙二種方法分析結(jié)果差異極顯著(P

0.01)。n=7,n=12,n0=1如果原假設(shè)成立,r表14-1用甲乙二種方法檢測20個奶樣的脂肪含量(%)數(shù)據(jù)奶樣序號12345678910甲方法4.343.783.803.933.943.834.564.404.423.99乙方法4.393.823.794.043.963.984.444.424.384.12符號--+----+-奶樣序號11121314151617181920甲方法3.863.744.634.043.623.563.914.493.533.67乙方法3.763.744.584.273.843.633.954.483.563.87符號0+---+--假設(shè)是:HO:甲乙二種方法的分析結(jié)果相同;HA:甲乙二種方法的分析結(jié)果不相同n=7,n=12,n0=1r=min(n,n)=min(7,12)=7N=n

n=712=19查符號檢驗表得r0.05(19)=4r=7

r0.05(19)表明甲乙二種方法的檢測結(jié)果差異不顯著。

表14-1用甲乙二種方法檢測20個奶樣的脂肪含量(%)數(shù)表14-1用甲乙二種方法檢測20個奶樣的脂肪含量(%)數(shù)據(jù)奶樣序號12345678910甲方法4.343.783.803.933.943.834.564.404.423.99乙方法4.393.823.794.043.963.984.444.424.384.12符號--+----+-奶樣序號11121314151617181920甲方法3.863.744.634.043.623.563.914.493.633.67乙方法3.763.744.584.273.843.633.954.483.563.87符號0+---++-假設(shè)是:HO:甲乙二種方法的分析結(jié)果相同;HA:甲乙二種方法的分析結(jié)果不相同符號檢驗也可以采用2求解

n=7,n=12,n0=1r=min(n,n)=min(7,12)=7N=n

n=712=19表14-1用甲乙二種方法檢測20個奶樣的脂肪含量(%)數(shù)表14-1用甲乙二種方法檢測20個奶樣的脂肪含量(%)數(shù)據(jù)奶樣序號12345678910甲方法4.343.783.803.933.943.834.564.404.423.99乙方法4.393.823.794.043.963.984.444.424.384.12符號--+----+-奶樣序號11121314151617181920甲方法3.863.744.634.043.623.563.914.493.533.67乙方法3.763.744.584.273.843.633.954.483.563.87符號0+---+--假設(shè)是:HO:甲乙二種方法的分析結(jié)果相同;HA:甲乙二種方法的分析結(jié)果不相同符號檢驗也可以采用2求解

n=7,n=12,n0=1r=min(n,n)=min(7,12)=7N=n

n=712=192值小于5%的臨界2值3.84,所以甲乙二種方法分析結(jié)果差異不顯著(P

0.05)表14-1用甲乙二種方法檢測20個奶樣的脂肪含量(%)數(shù)14.3符號秩和檢驗法(signranksumtest)也稱為Wilcoxon配對檢驗法與符號檢驗法相比,符號秩和檢驗的改進之處在于考慮了差值的大小14.3符號秩和檢驗法(signranksumte14.3符號秩和檢驗法(signranksumtest)也稱為Wilcoxon配對檢驗法奶樣序號12345678910甲方法4.343.783.803.933.943.834.564.404.423.99乙方法4.393.823.794.043.963.984.444.424.384.12差值-0.05-0.040.01-0.11-0.02-0.150.12-0.020.04-0.13秩次-10.5-82.5-14-4.5-1715-4.58-16奶樣序號11121314151617181920甲方法3.863.744.634.043.623.563.914.493.533.67乙方法3.763.744.584.273.843.633.954.483.563.87差值0.1000.05-0.23-0.22-0.07-0.040.01-0.03-0.20秩次130.5-0.510.520-19-12-82.5-6-18【例14.2】用甲乙二種方法檢測20個奶樣的脂肪含量(%),其數(shù)據(jù)如表,問二種方法的檢測結(jié)果有無顯著差異?14.3符號秩和檢驗法(signranksumte14.3符號秩和檢驗法(signranksumtest)奶樣序號12345678910差值-0.05-0.040.01-0.11-0.02-0.150.12-0.020.04-0.13秩次-10.5-82.5-14-4.5-1715-4.58-16奶樣序號11121314151617181920差值0.1000.05-0.23-0.22-0.07-0.040.01-0.03-0.20秩次130.5-0.510.520-19-12-82.5-6-18表14-2符號秩和檢驗法列表符號秩和檢驗的步驟是:(1)求差值,甲方法減乙方法的差值,并標(biāo)上符號。14.3符號秩和檢驗法(signranksumte奶樣序號12345678910差值-0.05-0.040.01-0.11-0.02-0.150.12-0.020.04-0.13秩次-10.5-82.5-14-4.5-1715-4.58-16奶樣序號11121314151617181920差值0.1000.05-0.23-0.22-0.07-0.040.01-0.03-0.20秩次130.5-0.510.520-19-12-82.5-6-18表14-2符號秩和檢驗法列表符號秩和檢驗的步驟是:(2)確定秩次,將差值按絕對值的大小順序從小至大排列,每一差值對應(yīng)的順序號就為該差值的秩次,并標(biāo)上原差值的符號。遇到相同差值求平均秩次,依次類推。本例的差值最小的為0,其秩次為1,由于該差值沒有符號,因而將它折分為2個0.5,一正一負(fù);奶樣序號12345678910差值-0.05-0.040.0奶樣序號12345678910差值-0.05-0.040.01-0.11-0.02-0.150.12-0.020.04-0.13秩次-10.5-82.5-14-4.5-1715-4.58-16奶樣序號11121314151617181920差值0.1000.05-0.23-0.22-0.07-0.040.01-0.03-0.20秩次130.5-0.510.520-19-12-82.5-6-18表14-2符號秩和檢驗法列表符號秩和檢驗的步驟是:(3)求秩和,將正負(fù)秩次分別相加,用T+表示正秩次之和,用T–表示負(fù)秩次之和取秩和絕對值小者T=min(T+,T–)作為檢驗統(tǒng)計量,本例,T+為52,T–-為158,T為52。奶樣序號12345678910差值-0.05-0.040.0奶樣序號12345678910差值-0.05-0.040.01-0.11-0.02-0.150.12-0.020.04-0.13秩次-10.5-82.5-14-4.5-1715-4.58-16奶樣序號11121314151617181920差值0.1000.05-0.23-0.22-0.07-0.040.01-0.03-0.20秩次130.5-0.510.520-19-12-82.5-6-18表14-2符號秩和檢驗法列表符號秩和檢驗的步驟是:(4)統(tǒng)計推斷,根據(jù)樣本含量對子數(shù)n查附表12(符號秩和檢驗表),得顯著性水平為5%與1%的臨界值分別為T0.05(n)

=52及T0.01(n)

=38,用T=52與臨界值比較,當(dāng)小于某一水平的臨界值時,就表明在這一顯著水平下顯著。本例剛好等于52,表明甲乙二種方法分析結(jié)果剛好在5%水平上達到顯著。奶樣序號12345678910差值-0.05-0.040.014.4二組非配對資料的秩和檢驗法

又稱為曼-惠特尼(Mann-Whitney)秩和檢驗14.5多組資料的秩和檢驗

又稱為Kruskal-Wallis檢驗法

14.4二組非配對資料的秩和檢驗法14.5多組資料的14.6

秩相關(guān)(rankcorrelation)

也稱為等級相關(guān)

對普通的相關(guān)系數(shù)來說,樣本抽自正態(tài)總體是非常重要的,否則很可能得到錯誤的結(jié)論。如果已知總體非正態(tài),又沒有適當(dāng)?shù)淖儞Q方法使它變換為正態(tài),則可計算秩相關(guān)檢驗。14.6秩相關(guān)(rankcorrelation)14.6

秩相關(guān)(rankcorrelation)

也稱為等級相關(guān)

如果已知總體非正態(tài),又沒有適當(dāng)?shù)淖儞Q方法使它變換為正態(tài),則可計算秩相關(guān)檢驗。常用的度量指標(biāo)是Spearman秩相關(guān)系數(shù),rs

14.6秩相關(guān)(rankcorrelation)如果已方法:先將兩指標(biāo)X與Y分別從小到大排序,對每一個體得到它的兩個指標(biāo)的秩值令方法:先將兩指標(biāo)X與Y分別從小到大排序,對每一個體得到它的兩例3.34調(diào)查得到某幾個地區(qū)的大氣污染綜合指數(shù)(PI)與肺癌發(fā)病率如下表所示,試作秩相關(guān)檢驗。地區(qū)號1234567PI肺癌發(fā)病率2.954.352.250.462.143.182.640.501.730.301.210.001.49.00例3.34調(diào)查得到某幾個地區(qū)的大氣污染綜合指數(shù)(PI)與地區(qū)號1234567PI肺癌發(fā)病率2.954.352.250.462.143.182.640.501.730.301.210.001.49.00解:先將表中的數(shù)據(jù)轉(zhuǎn)化為相應(yīng)的秩,得到地區(qū)號1234567PI秩肺癌發(fā)病率秩77564564331221地區(qū)號1234567PI2.92.22.12.61.71.2對Spearman秩相關(guān)系數(shù)的顯著性檢驗:當(dāng)n

15時,可查Spearman秩相關(guān)系數(shù)顯著性檢驗表(附表10)進行統(tǒng)計推斷r0.05(7)=0.786,r0.01(7)=0.929,因為

r0.05(7)<rs<r0.01(7)

,所以要拒絕H0,認(rèn)為有顯著的差異,即大氣污染綜合指數(shù)(PI)與肺癌發(fā)病率有關(guān)。對Spearman秩相關(guān)系數(shù)的顯著性檢驗:對Spearman秩相關(guān)系數(shù)的顯著性檢驗:當(dāng)n

15時,可查Spearman秩相關(guān)系數(shù)顯著性檢驗表(附表10)進行統(tǒng)計推斷當(dāng)n15時,由于rs與r的抽樣分布開始接近,故可根據(jù)df=n-2,查簡單相關(guān)系數(shù)的顯著性檢驗表(附表9)進行統(tǒng)計推斷

當(dāng)n充分大時rs近似服從正態(tài)分布,這時可對rs作Z檢驗

對Spearman秩相關(guān)系數(shù)的顯著性檢驗:公式區(qū)別(推導(dǎo))公式區(qū)別(推導(dǎo))地區(qū)號1234567PI秩Xi肺癌發(fā)病率秩Yi77564564331221地區(qū)號1234567PI秩Xi7546312生物統(tǒng)計-非參數(shù)檢驗課件公牛號12345678910方法1X31562487910方法2Y32610159748等級差d0-1–1-41-1–1052d的平方011161110254例9-2公牛號12345

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論