食品實(shí)驗(yàn)設(shè)計(jì)

上傳人：卓*** IP屬地：廣東上傳時(shí)間：2023-06-14 格式：PPT 頁(yè)數(shù)：75 大小：4.97MB 積分：18 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩70頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

食品實(shí)驗(yàn)設(shè)計(jì)第一頁(yè)，共七十五頁(yè)，編輯于2023年，星期四非參數(shù)檢驗(yàn)的概念是指在總體不服從正態(tài)分布且分布情況不明時(shí)，用來(lái)檢驗(yàn)數(shù)據(jù)資料是否來(lái)自同一個(gè)總體假設(shè)的一類檢驗(yàn)方法。由于這些方法一般不涉及總體參數(shù)故得名。這類方法的假定前提比參數(shù)性假設(shè)檢驗(yàn)方法少的多，也容易滿足，適用于計(jì)量信息較弱的資料且計(jì)算方法也簡(jiǎn)單易行，所以在實(shí)際中有廣泛的應(yīng)用。第二頁(yè)，共七十五頁(yè)，編輯于2023年，星期四非參數(shù)檢驗(yàn)的過(guò)程1.Chi-Squaretest卡方檢驗(yàn)2.Binomialtest二項(xiàng)分布檢驗(yàn)3.Runstest游程檢驗(yàn)4.1-SampleKolmogorov-Smirnovtest一個(gè)樣本柯?tīng)柲缏宸?斯米諾夫檢驗(yàn)5.2independentSamplesTest兩個(gè)獨(dú)立樣本檢驗(yàn)6.KindependentSamplesTestK個(gè)獨(dú)立樣本檢驗(yàn)7.2relatedSamplesTest兩個(gè)相關(guān)樣本檢驗(yàn)8.KrelatedSamplesTest兩個(gè)相關(guān)樣本檢驗(yàn)第三頁(yè)，共七十五頁(yè)，編輯于2023年，星期四12.1卡方檢驗(yàn)Chi-Squaretest

這里介紹的卡方檢驗(yàn)可以檢驗(yàn)列聯(lián)表中某一個(gè)變量的各個(gè)水平是否有同樣比例或者等于你所想象的比例(如5:4:1)實(shí)例1：擲骰子300次，變量LMT，1、2、3、4、5、6分別代表六面的六個(gè)點(diǎn)，試問(wèn)這骰子是否均勻。數(shù)據(jù)data12-01（300個(gè)cases）。Analyze－>NonparametricTests－>ChiSquareTestVariable:lmt想要檢驗(yàn)的變量由于這是一個(gè)均勻分布檢測(cè)，使用默認(rèn)選擇（ExpectedValues：Allcategoriesequal作為零假設(shè)）；比較有用的結(jié)果：sig=.111>0.5，不能拒絕零假設(shè)，認(rèn)為均勻。實(shí)例1的數(shù)據(jù)可以組織成：兩個(gè)變量（side面和number次數(shù)），6個(gè)cases。但在卡方檢驗(yàn)前要求用number加權(quán)。結(jié)果同。第四頁(yè)，共七十五頁(yè)，編輯于2023年，星期四補(bǔ)充：卡方檢驗(yàn)實(shí)例實(shí)例：心臟病人猝死人數(shù)與日期的關(guān)系，收集168個(gè)觀測(cè)數(shù)據(jù)。其中用1、2、3、4、5、6、7表示是星期幾死的。而人數(shù)分別為55、23、18、11、26、20、15。推斷心臟病人猝死人數(shù)與日期的關(guān)系是否為2.8:1:1:1:1:1:1。（變量2個(gè)：死亡日期和死亡人數(shù)，Cases7個(gè)）加權(quán)：Data－>WeightCases：死亡人數(shù)Analyze－>NonparametricTests－>ChiSquareTestVariable:死亡日期ExpectedValues：2.8:1:1:1:1:1:1

比較有用的結(jié)果：sig=.256>0.5，不能拒絕零假設(shè)，認(rèn)為心臟病人猝死人數(shù)與日期的關(guān)系為2.8:1:1:1:1:1:1。第五頁(yè)，共七十五頁(yè)，編輯于2023年，星期四12.2二項(xiàng)分布檢驗(yàn)Binomialtest

二項(xiàng)分布：在現(xiàn)實(shí)生活中有很多的取值是兩類的，如人群的男和女、產(chǎn)品的合格和不合格、學(xué)生的三好學(xué)生和非三好學(xué)生、投擲硬幣的正面和反面。這時(shí)如果某一類出現(xiàn)的概率是P，則另一類出現(xiàn)的概率就是1-P。這種分布稱為二項(xiàng)分布。實(shí)例1：擲一枚比賽用的挑邊器31次，變量tbh，1為出現(xiàn)A面、2為出現(xiàn)A面，試問(wèn)這挑邊器是否均勻。數(shù)據(jù)data12-03（31個(gè)cases）。Analyze－>NonparametricTests－>BinomialTestVariable:tbh由于這是一個(gè)均勻分布檢測(cè)，使用默認(rèn)選擇（TestProportion：0.5）；比較有用的結(jié)果：兩組個(gè)數(shù)和sig=1.00>0.5，不能拒絕零假設(shè)，認(rèn)為挑邊器是均勻。實(shí)例1的數(shù)據(jù)可以組織成：兩個(gè)變量（side面和number次數(shù)），2個(gè)cases。但在二項(xiàng)分布檢驗(yàn)前要求用number加權(quán)。結(jié)果同。第六頁(yè)，共七十五頁(yè)，編輯于2023年，星期四補(bǔ)充：二項(xiàng)分布檢驗(yàn)實(shí)例實(shí)例：為驗(yàn)證某批產(chǎn)品的一等品率是否達(dá)到90％，現(xiàn)從該批產(chǎn)品中隨機(jī)抽取23個(gè)樣品進(jìn)行檢測(cè)，結(jié)果有19個(gè)一等品（1－一等品，0－非一等品）。（變量2個(gè)：一等品和個(gè)數(shù)，Cases2個(gè)：119和04）加權(quán)：Data－>WeightCases：個(gè)數(shù)Analyze－>NonparametricTests－>BinomialTestVariable:一等品TestProportion：0.9比較有用的結(jié)果：兩組個(gè)數(shù)和sig=.193>0.5，不能拒絕零假設(shè)，認(rèn)為該批產(chǎn)品的一等品率達(dá)到了90％。第七頁(yè)，共七十五頁(yè)，編輯于2023年，星期四12.3游程檢驗(yàn)Runstest單樣本變量隨機(jī)性檢驗(yàn)是對(duì)某變量值出現(xiàn)是否隨機(jī)進(jìn)行檢驗(yàn)。實(shí)例1（同二項(xiàng)分布檢驗(yàn)）

：擲一枚比賽用的挑邊器31次，變量tbh，1為出現(xiàn)A面、2為出現(xiàn)A面，試問(wèn)這挑邊器出現(xiàn)AB面是否隨機(jī)。數(shù)據(jù)data12-03（31個(gè)cases）。Analyze－>NonparametricTests－>Runs

TestVariable:tbhCutPoint：Custom：2比較有用的結(jié)果：總case數(shù)（31）、游程Run數(shù)（21）、sig=.142>0.5，不能拒絕零假設(shè)，認(rèn)為挑邊器出現(xiàn)AB面是隨機(jī)的。第八頁(yè)，共七十五頁(yè)，編輯于2023年，星期四12.4一個(gè)樣本柯?tīng)柲缏宸?斯米諾夫檢驗(yàn)

1-SampleKolmogorov-Smirnovtest單樣本K－S檢驗(yàn)是利用樣本數(shù)據(jù)推斷總體是否服從某一理論分布，適用于探索連續(xù)型隨機(jī)變量的分布形態(tài)（判斷定距變量的分布情況）：Normal正態(tài)分布、Uniform均勻分布、Poisson泊松分布、Exponential指數(shù)分布。實(shí)例

：盧瑟福和蓋革作了一個(gè)著名的實(shí)驗(yàn)，他們觀察了長(zhǎng)為7.5秒的時(shí)間間隔里到達(dá)某個(gè)計(jì)數(shù)器的由某塊放射物資放出的alfa粒子質(zhì)點(diǎn)數(shù)，共觀察了2608次。數(shù)據(jù)data12-05（1個(gè)變量zd，2608個(gè)cases，按0－10排序）。試問(wèn)這種分布規(guī)律是否服從泊松分布Analyze－>NonparametricTests－>1-SampleK-STestVariable:zdTestDistribution：Poisson比較有用的結(jié)果：均值（3.8673）、sig=.850>0.5，不能拒絕零假設(shè)，認(rèn)為服從泊松分布。第九頁(yè)，共七十五頁(yè)，編輯于2023年，星期四12.5兩個(gè)獨(dú)立樣本檢驗(yàn)

2independentSamplesTest通過(guò)分析兩個(gè)樣本數(shù)據(jù)，推斷它們的分布是否存在顯著性差異。方法有四種：Mann-WhitneyU:是通過(guò)對(duì)平均秩的研究來(lái)實(shí)現(xiàn)推斷的K－SZ：是通過(guò)對(duì)分布的研究來(lái)實(shí)現(xiàn)推斷的Mosesextremereactions：一個(gè)作為控制樣本，另一個(gè)作為實(shí)驗(yàn)樣本W(wǎng)aldWolfwitzRuns:是通過(guò)對(duì)游程的研究來(lái)實(shí)現(xiàn)推斷的實(shí)例

：甲乙兩種安眠藥服用后的效果。數(shù)據(jù)data12-06（2個(gè)變量：組別zb和延長(zhǎng)時(shí)間ycss，20個(gè)cases）。試問(wèn)這兩種藥物的療效是否有顯著性差異。Analyze－>NonparametricTests－>2independentSamples

TestVariable:ycssGrouping：zb（1，2）Testtype：四種均選比較有用的結(jié)果：比較四個(gè)sig值，有三個(gè)sig>.5，不能拒絕零假設(shè)認(rèn)為療效無(wú)顯著性差異。第十頁(yè)，共七十五頁(yè)，編輯于2023年，星期四12.6多個(gè)獨(dú)立樣本檢驗(yàn)

KindependentSamplesTest通過(guò)分析多個(gè)樣本數(shù)據(jù)，推斷它們的分布是否存在顯著性差異。方法有三種：Median：是通過(guò)對(duì)中位數(shù)的研究來(lái)實(shí)現(xiàn)推斷的K－W：是通過(guò)對(duì)推廣的平均秩的研究來(lái)實(shí)現(xiàn)推斷的J－T：與兩個(gè)獨(dú)立樣本檢驗(yàn)的Mann-WhitneyU類似實(shí)例

：某車間用四種不同的操作方法檢測(cè)產(chǎn)品優(yōu)等品率的實(shí)驗(yàn)數(shù)據(jù)。數(shù)據(jù)data12-07（2個(gè)變量：方法ff和優(yōu)等品率ydpl，21個(gè)cases）。試問(wèn)這四種不同的操作方法對(duì)產(chǎn)品優(yōu)等品率是否有顯著性差異。Analyze－>NonparametricTests－>KindependentSamples

TestVariable:ydpl

Grouping：ff（1，4）Testtype：三種均選比較有用的結(jié)果：比較三個(gè)sig值，K-W方法的sig＝.009<.05,拒絕零假設(shè),認(rèn)為這四種不同的操作方法對(duì)產(chǎn)品優(yōu)等品率是有顯著性差異。其他二個(gè)方法的sig>.5，但不用，原因是觀測(cè)量太少。第十一頁(yè)，共七十五頁(yè)，編輯于2023年，星期四12.7兩個(gè)相關(guān)樣本檢驗(yàn)

2relatedSamplesTest同一個(gè)被測(cè)試者，前后測(cè)兩次，彼此相關(guān)。方法有四種。實(shí)例

：某校15名男生的長(zhǎng)跑鍛煉后晨脈變化數(shù)據(jù)。數(shù)據(jù)data12-08（2個(gè)變量：鍛煉前dlq和鍛煉后dlh優(yōu)，21個(gè)cases）。試問(wèn)鍛煉前后的晨脈有無(wú)顯著性差異。Analyze－>NonparametricTests－>2relatedSamples

TestPairs:dlq－dlhTesttype：選一種或多種比較有用的結(jié)果：看sig值，sig<.05,拒絕零假設(shè),認(rèn)為鍛煉前后的晨脈有顯著性的差異。第十二頁(yè)，共七十五頁(yè)，編輯于2023年，星期四12.8多個(gè)相關(guān)樣本檢驗(yàn)

KrelatedSamplesTest對(duì)多個(gè)被測(cè)試者，多個(gè)打分，看打分是否有顯著性差異。方法有三種：CochranQ：要求樣本數(shù)據(jù)為二值的（1－滿意0－不滿意）Friedman：利用秩實(shí)現(xiàn)Kendall協(xié)同系數(shù)檢驗(yàn)：H0：協(xié)同系數(shù)為0(評(píng)分標(biāo)準(zhǔn)不相關(guān)的或者是隨機(jī)的)實(shí)例

：9個(gè)顧客對(duì)三種款式襯衫的喜愛(ài)程度（1－最喜愛(ài)2－其次3－不喜愛(ài)）。數(shù)據(jù)data12-09（3個(gè)變量：款式A，款式B,款式C，27個(gè)cases）。試問(wèn)顧客對(duì)三種款式襯衫的喜愛(ài)程度是否相同。Analyze－>NonparametricTests－>krelatedSamples

TestVariables:abcTesttype：選一種或多種比較有用的結(jié)果：看sig值，sig<.05,拒絕零假設(shè),認(rèn)為顧客對(duì)三種款式襯衫的喜愛(ài)程度是不相同的。第十三頁(yè)，共七十五頁(yè)，編輯于2023年，星期四補(bǔ)充：非參數(shù)檢驗(yàn)以下的講義是吳喜之教授有關(guān)非參數(shù)檢驗(yàn)的講義，我覺(jué)得比書(shū)上講得清楚。第十四頁(yè)，共七十五頁(yè)，編輯于2023年，星期四非參數(shù)檢驗(yàn)第十五頁(yè)，共七十五頁(yè)，編輯于2023年，星期四為什么用非參數(shù)方法？

經(jīng)典統(tǒng)計(jì)的多數(shù)檢驗(yàn)都假定了總體的背景分布。但也有些沒(méi)有假定總體分布的具體形式，僅僅依賴于數(shù)據(jù)觀測(cè)值的相對(duì)大小（秩）或零假設(shè)下等可能的概率等和數(shù)據(jù)本身的具體總體分布無(wú)關(guān)的性質(zhì)進(jìn)行檢驗(yàn)。這都稱為非參數(shù)檢驗(yàn)。第十六頁(yè)，共七十五頁(yè)，編輯于2023年，星期四為什么用非參數(shù)方法？

這些非參數(shù)檢驗(yàn)在總體分布未知時(shí)有很大的優(yōu)越性。這時(shí)如果利用傳統(tǒng)的假定分布已知的檢驗(yàn)，就會(huì)產(chǎn)生錯(cuò)誤甚至災(zāi)難。非參數(shù)檢驗(yàn)總是比傳統(tǒng)檢驗(yàn)安全。但是在總體分布形式已知時(shí)，非參數(shù)檢驗(yàn)就不如傳統(tǒng)方法效率高。這是因?yàn)榉菂?shù)方法利用的信息要少些。往往在傳統(tǒng)方法可以拒絕零假設(shè)的情況，非參數(shù)檢驗(yàn)無(wú)法拒絕。但非參數(shù)統(tǒng)計(jì)在總體未知時(shí)效率要比傳統(tǒng)方法要高，有時(shí)要高很多。是否用非參數(shù)統(tǒng)計(jì)方法，要根據(jù)對(duì)總體分布的了解程度來(lái)確定。

第十七頁(yè)，共七十五頁(yè)，編輯于2023年，星期四非參數(shù)方法這里介紹一些非參數(shù)檢驗(yàn)。關(guān)于非參數(shù)方法的確切定義并不很明確。我們就其最廣泛的意義來(lái)理解。在計(jì)算中，諸如列聯(lián)表分析中的許多問(wèn)題都有精確方法，MonteCarlo抽樣方法和用于大樣本的漸近方法等選擇。精確方法比較費(fèi)時(shí)間，后兩種要粗糙一些，但要快些。

第十八頁(yè)，共七十五頁(yè)，編輯于2023年，星期四秩（rank）

非參數(shù)檢驗(yàn)中秩是最常使用的概念。什么是一個(gè)數(shù)據(jù)的秩呢？一般來(lái)說(shuō)，秩就是該數(shù)據(jù)按照升序排列之后，每個(gè)觀測(cè)值的位置。例如我們有下面數(shù)據(jù)Xi159183178513719Ri75918426310這下面一行（記為Ri）就是上面一行數(shù)據(jù)Xi的秩。

第十九頁(yè)，共七十五頁(yè)，編輯于2023年，星期四秩（rank）

利用秩的大小進(jìn)行推斷就避免了不知道背景分布的困難。這也是大多數(shù)非參數(shù)檢驗(yàn)的優(yōu)點(diǎn)。多數(shù)非參數(shù)檢驗(yàn)明顯地或隱含地利用了秩的性質(zhì)；但也有一些非參數(shù)方法沒(méi)有涉及秩的性質(zhì)。

第二十頁(yè)，共七十五頁(yè)，編輯于2023年，星期四列聯(lián)表問(wèn)題

我們講過(guò)列聯(lián)表的c2檢驗(yàn)問(wèn)題（第七章）。這里介紹的檢驗(yàn)可以檢驗(yàn)列聯(lián)表中某一個(gè)變量的各個(gè)水平是否有同樣比例或者等于你所想象的比例。每個(gè)檢驗(yàn)都可以選擇使用精確方法，MonteCarlo抽樣方法或用于大樣本的漸近方法。利用數(shù)據(jù)table7.sav，假定你想知道收入的比例是否是5比4比1（零假設(shè)）。而且選擇精確檢驗(yàn)，你可以得到各種檢驗(yàn)結(jié)果如下：第二十一頁(yè)，共七十五頁(yè)，編輯于2023年，星期四列聯(lián)表問(wèn)題

利用數(shù)據(jù)table7.sav，假定你想知道收入的比例是否是5比4比1（零假設(shè)）。而且選擇精確檢驗(yàn)，你可以得到各種檢驗(yàn)結(jié)果如下：第二十二頁(yè)，共七十五頁(yè)，編輯于2023年，星期四列聯(lián)表問(wèn)題

該結(jié)果除了給出了精確檢驗(yàn)的p值，表明無(wú)論還給出漸近檢驗(yàn)的p值；兩個(gè)都是0.000；這表明零假設(shè)的比例欠妥。輸出還給出了Pearson統(tǒng)計(jì)量中的Oi和Ei（分別為下表中的ObservedN和ExpectedN）：第二十三頁(yè)，共七十五頁(yè)，編輯于2023年，星期四列聯(lián)表問(wèn)題

如果要檢驗(yàn)變量的各水平是否都相等，從SPSS可以得到對(duì)這三個(gè)變量的檢驗(yàn)（對(duì)每個(gè)變量的零假設(shè)是各水平影響相同）結(jié)果：

SPSS還分別給出對(duì)每個(gè)變量的Pearson統(tǒng)計(jì)量中的Oi和Ei。第二十四頁(yè)，共七十五頁(yè)，編輯于2023年，星期四SPSS軟件使用說(shuō)明

用table7.sav數(shù)據(jù)。假定已經(jīng)加權(quán)了(number:權(quán))Analyze－NonparametricTests－ChiSquare。然后選擇想要檢驗(yàn)的變量(如income），如要檢驗(yàn)其水平是否相等，則在ExpectedValues選Allcategoriesequal作為零假設(shè)（默認(rèn)選擇）；如要檢驗(yàn)其水平是否為某比例，則在下面Values輸入你的比例（我們是5比4比1，逐個(gè)輸入）作為零假設(shè)。點(diǎn)Exact時(shí)打開(kāi)的對(duì)話框中可以選擇精確方法(Exact)，MonteCarlo抽樣方法（MonteCarlo）或用于大樣本的漸近方法（Asymptoticonly）。如果選入的變量多于一個(gè)，則檢驗(yàn)的都是水平相等的零假設(shè)。最后OK即可。第二十五頁(yè)，共七十五頁(yè)，編輯于2023年，星期四

單樣本Kolmogorov-Smirnov檢驗(yàn)

單樣本的Kolmogorov-Smirnov檢驗(yàn)（K-S檢驗(yàn)）是用來(lái)檢驗(yàn)一個(gè)數(shù)據(jù)的觀測(cè)累積分布是否是已知的理論分布。這些作為零假設(shè)的理論分布在SPSS的選項(xiàng)中有正態(tài)分布(Normal)，泊松分布(Poisson)，均勻分布(Uniform)和指數(shù)分布(Exponential)。在SPSS軟件中對(duì)于是否是正態(tài)分布或均勻分布的檢驗(yàn)統(tǒng)計(jì)量為第二十六頁(yè)，共七十五頁(yè)，編輯于2023年，星期四數(shù)據(jù)ksdata.sav的K-S檢驗(yàn)

我們檢驗(yàn)它是否是正態(tài)分布、均勻分布和指數(shù)分布。輸出結(jié)果分別顯示在下面三個(gè)表中：由于sig=.074>.05，不能拒絕正態(tài)分布(Normal)零假設(shè)。第二十七頁(yè)，共七十五頁(yè)，編輯于2023年，星期四由于sig=.000<.05，拒絕均勻分布(Uniform)零假設(shè)第二十八頁(yè)，共七十五頁(yè)，編輯于2023年，星期四由于sig=.664>.05，不能拒絕指數(shù)分布(Exponential)零假設(shè)比較三種分布檢驗(yàn)，認(rèn)為是該數(shù)據(jù)服從指數(shù)分布第二十九頁(yè)，共七十五頁(yè)，編輯于2023年，星期四SPSS軟件使用說(shuō)明

使用我們的ksdata.sav數(shù)據(jù)。選項(xiàng)為Analyze－NonparametricTests－1SampleK-S。然后把變量（這里是x）選入VariableList。再在下面TestDistribution選中零假設(shè)的分布（Normal、Poisson、Uniform和Exponential）作為零假設(shè)。在點(diǎn)Exact時(shí)打開(kāi)的對(duì)話框中可以選擇精確方法（Exact），MonteCarlo抽樣方法（MonteCarlo）或用于大樣本的漸近方法（Asymptoticonly）。最后OK即可。

第三十頁(yè)，共七十五頁(yè)，編輯于2023年，星期四關(guān)于隨機(jī)性的游程檢驗(yàn)（runtest）

游程檢驗(yàn)方法是檢驗(yàn)一個(gè)取兩個(gè)值的變量的這兩個(gè)值的出現(xiàn)是否是隨機(jī)的。假定下面是由0和1組成的一個(gè)這種變量的樣本（數(shù)據(jù)run1.sav）：0000111111001011100000000其中相同的0（或相同的1）在一起稱為一個(gè)游程（單獨(dú)的0或1也算）。這個(gè)數(shù)據(jù)中有4個(gè)0組成的游程和3個(gè)1組成的游程。一共是R=7個(gè)游程。其中0的個(gè)數(shù)為m=15，而1的個(gè)數(shù)為n=10。

第三十一頁(yè)，共七十五頁(yè)，編輯于2023年，星期四關(guān)于隨機(jī)性的游程檢驗(yàn)（runtest）

出現(xiàn)0和1的的這樣一個(gè)過(guò)程可以看成是參數(shù)為某未知p的Bernoulli試驗(yàn)。但在給定了m和n之后，在0和1的出現(xiàn)是隨機(jī)的零假設(shè)之下，R的條件分布就和這個(gè)參數(shù)無(wú)關(guān)了。根據(jù)初等概率論，R的分布可以寫(xiě)成（令N=m+n）第三十二頁(yè)，共七十五頁(yè)，編輯于2023年，星期四關(guān)于隨機(jī)性的游程檢驗(yàn)（runtest）

于是就可以算出在零假設(shè)下有關(guān)R的概率，以及進(jìn)行有關(guān)的檢驗(yàn)了。利用上面公式可進(jìn)行精確檢驗(yàn)；也可以利用大樣本的漸近分布和利用MonteCarlo方法進(jìn)行檢驗(yàn)。利用上面數(shù)據(jù)的結(jié)果是:第三十三頁(yè)，共七十五頁(yè)，編輯于2023年，星期四關(guān)于隨機(jī)性的游程檢驗(yàn)（runtest）

當(dāng)然，游程檢驗(yàn)并不僅僅用于只取兩個(gè)值的變量，它還可以用于某個(gè)連續(xù)變量的取值小于某個(gè)值及大于該值的個(gè)數(shù)（類似于0和1的個(gè)數(shù)）是否隨機(jī)的問(wèn)題?？聪旅胬?。例(run2.sav):從某裝瓶機(jī)出來(lái)的30盒化妝品的重量如下（單位克）71.671.071.870.370.572.971.071.070.171.871.970.370.969.371.267.367.667.767.668.168.067.569.867.569.770.069.170.471.069.9為了看該裝瓶機(jī)是否工作正常，首先需要驗(yàn)證是否大于和小于中位數(shù)的個(gè)數(shù)是否是隨機(jī)的（零假設(shè)為這種個(gè)數(shù)的出現(xiàn)是隨機(jī)的）。

第三十四頁(yè)，共七十五頁(yè)，編輯于2023年，星期四關(guān)于隨機(jī)性的游程檢驗(yàn)（runtest）

如果把小于中位數(shù)的記為0，否則記為1，上面數(shù)據(jù)變成下面的0－1序列111111110111101000000000000110這就歸為上面的問(wèn)題。當(dāng)然這里進(jìn)行這種變換只是為了易于理解。實(shí)際計(jì)算時(shí)，用不著這種變換，計(jì)算機(jī)會(huì)自動(dòng)處理這個(gè)問(wèn)題的。直接利用這個(gè)數(shù)據(jù)，通過(guò)SPSS，得到下面游程檢驗(yàn)結(jié)果的輸出。

第三十五頁(yè)，共七十五頁(yè)，編輯于2023年，星期四第三十六頁(yè)，共七十五頁(yè)，編輯于2023年，星期四SPSS軟件使用說(shuō)明

用run2.sav數(shù)據(jù)。選項(xiàng)為Analyze－NonparametricTests－Runs。然后把變量（這里是length）選入VariableList。再在下面CutPoint選中位數(shù)（Median）。當(dāng)然，也可以選其他值，如均值（Mean），眾數(shù)（Mode）或任何你愿意的數(shù)目（放在Custom）。注意在對(duì)前面的由0和1組成的序列（run1.sav進(jìn)行隨機(jī)性檢驗(yàn)時(shí)，要選均值(為什么？）。在點(diǎn)Exact時(shí)打開(kāi)的對(duì)話框中可以選擇精確方法（Exact），MonteCarlo抽樣方法（MonteCarlo）或用于大樣本的漸近方法（Asymptoticonly）。最后OK即可。第三十七頁(yè)，共七十五頁(yè)，編輯于2023年，星期四Wilcoxon(Mann-Whitney)秩和檢驗(yàn)這里介紹常用的Wilcoxon(或稱Mann-Whitney)秩和檢驗(yàn)。它的原理很簡(jiǎn)單，假定第一個(gè)樣本有m個(gè)觀測(cè)值，第二個(gè)有n個(gè)觀測(cè)值。把兩個(gè)樣本混合之后把這m+n個(gè)觀測(cè)值升冪排序，記下每個(gè)觀測(cè)值在混合排序下面的秩。之后分別把兩個(gè)樣本所得到的秩相加。記第一個(gè)樣本觀測(cè)值的秩的和為WX而第二個(gè)樣本秩的和為WY。這兩個(gè)值可以互相推算，稱為Wilcoxon統(tǒng)計(jì)量。該統(tǒng)計(jì)量的分布和兩個(gè)總體分布無(wú)關(guān)。由此分布可以得到p-值。直觀上看，如果WX與WY之中有一個(gè)顯著地大，則可以選擇拒絕零假設(shè)。該檢驗(yàn)需要的唯一假定就是兩個(gè)總體的分布有類似的形狀（不一定對(duì)稱）。第三十八頁(yè)，共七十五頁(yè)，編輯于2023年，星期四Wilcoxon(Mann-Whitney)秩和檢驗(yàn)下面數(shù)據(jù)（GDP.sav）是地區(qū)1的十個(gè)城市和地區(qū)2的15個(gè)城市的人均GDP（元）?，F(xiàn)在要想以此作為兩個(gè)樣本來(lái)檢驗(yàn)兩個(gè)地區(qū)的人均GDP的中位數(shù)m1和m2是否一樣，即雙尾檢驗(yàn)H0:m1=m2對(duì)Ha:m1≠m2。由于地區(qū)2的人均GDP的中位數(shù)大于地區(qū)1的中位數(shù)，因此也可以做單尾檢驗(yàn)H0:m1=m2對(duì)Ha:m1<m2。地區(qū)1：3223 4526 3836 2781 5982 3216 4710 5628 2303 4618地區(qū)2：5391 3983 4076 5941 4748 4600 6325 4534 5526 5699 7008 5403 6678 5537 5257由SPSS的輸出可以得到下面結(jié)果：

第三十九頁(yè)，共七十五頁(yè)，編輯于2023年，星期四第四十頁(yè)，共七十五頁(yè)，編輯于2023年，星期四Wilcoxon(Mann-Whitney)秩和檢驗(yàn)該結(jié)果頭兩行顯示了Mann-Whitney和Wilcoxon統(tǒng)計(jì)量的值。另外和我們需要結(jié)果的相關(guān)部分為：對(duì)于雙尾檢驗(yàn)H0:m1=m2對(duì)Ha:m1≠m2，p-值為0.016（見(jiàn)“ExactSig.(2-tailed)”）；而對(duì)于單尾檢驗(yàn)H0:m1=m2對(duì)Ha:m1<m2（見(jiàn)“ExactSig.(1-tailed)”），p-值為0.008。這兩個(gè)結(jié)果是精確計(jì)算的。通常在樣本量大的時(shí)候利用近似方法得到漸近分布的p-值（見(jiàn)“Asymp.Sig.(2-tailed)”），它只給了雙尾檢驗(yàn)的近似p-值0.017，和精確值差別不大。注意單尾檢驗(yàn)的p-值是雙尾檢驗(yàn)的p-值的一半。這個(gè)例子的結(jié)果表明，可以拒絕原假設(shè)，即有理由認(rèn)為地區(qū)2的人均GDP的中位數(shù)要高一些。第四十一頁(yè)，共七十五頁(yè)，編輯于2023年，星期四SPSS軟件使用說(shuō)明

使用GDP.sav數(shù)據(jù)。選項(xiàng)為Analyze－NonparametricTests－2IndependentSamples。把變量（gdp）選入TestVariable

List；再把用1和2分類的變量area輸入進(jìn)GroupingVariable，在DefineGroups輸入1和2。在TestType選中Mann－Whitney。在點(diǎn)Exact時(shí)打開(kāi)的對(duì)話框中可以選擇精確方法（Exact），MonteCarlo抽樣方法（MonteCarlo）或用于大樣本的漸近方法（Asymptoticonly）。最后OK即可第四十二頁(yè)，共七十五頁(yè)，編輯于2023年，星期四兩樣本分布的Kolmogorov-Smirnov檢驗(yàn)

假定有分別來(lái)自兩個(gè)獨(dú)立總體的兩個(gè)樣本。要想檢驗(yàn)它們背后的總體分布相同的零假設(shè)，可以進(jìn)行兩獨(dú)立樣本的Kolmogorov-Smirnov檢驗(yàn)。原理完全和單樣本情況一樣。只不過(guò)把檢驗(yàn)統(tǒng)計(jì)量中零假設(shè)的分布換成另一個(gè)樣本的經(jīng)驗(yàn)分布即可。假定兩個(gè)樣本的樣本量分別為n1和n2，用S1(X)和S2(X)分別表示兩個(gè)樣本的累積經(jīng)驗(yàn)分布函數(shù)。再記Dj＝S1(Xj)-S2(Xj)。近似正態(tài)分布的檢驗(yàn)統(tǒng)計(jì)量為

第四十三頁(yè)，共七十五頁(yè)，編輯于2023年，星期四計(jì)算結(jié)果

twonp.sav：兩種破壞性試驗(yàn)的持續(xù)時(shí)間。根據(jù)這個(gè)數(shù)據(jù)，n1=30，n2=25。由SPSS輸出，得到

第四十四頁(yè)，共七十五頁(yè)，編輯于2023年，星期四SPSS軟件使用說(shuō)明

使用twonp.sav數(shù)據(jù)。選項(xiàng)為Analyze－NonparametricTests－2IndependentSamples。把變量（duration）選入TestVariableList；再把用1和2分類的變量type輸入到GroupingVariable，在DefineGroups輸入1和2。在TestType選中Kolmogorov-SmirnovZ。在點(diǎn)Exact時(shí)打開(kāi)的對(duì)話框中可以選擇精確方法（Exact），MonteCarlo抽樣方法（MonteCarlo）或用于大樣本的漸近方法（Asymptoticonly）。最后OK即可第四十五頁(yè)，共七十五頁(yè)，編輯于2023年，星期四兩樣本W(wǎng)ald-Wolfowitz游程檢驗(yàn)

Wald-Wolfowitz游程檢驗(yàn)（Wald-Wolfowitzrunstest）和Kolmogorov-Smirnov檢驗(yàn)都是看兩個(gè)樣本所代表的總體是否分布類似。但是所采取的方法不一樣。Wald-Wolfowitz游程檢驗(yàn)把兩個(gè)樣本混合之后，按照大小次序排列，一個(gè)樣本的觀測(cè)值在一起的為一個(gè)游程。和單樣本的游程問(wèn)題類似?？梢杂捎纬虃€(gè)數(shù)R看出兩個(gè)樣本在排序中是否隨機(jī)出現(xiàn)。由twonp.sav數(shù)據(jù)，可以得到下面SPSS關(guān)于Wald-Wolfowitz游程檢驗(yàn)的輸出：

第四十六頁(yè)，共七十五頁(yè)，編輯于2023年，星期四軟件使用：數(shù)據(jù)和前面一樣，只在TestType選Wald-Wolfowitzruns。

第四十七頁(yè)，共七十五頁(yè)，編輯于2023年，星期四Kruskal-Wallis關(guān)于多個(gè)樣本的秩和檢驗(yàn)

這個(gè)檢驗(yàn)的目的是看多個(gè)總體的位置參數(shù)是否一樣。方法和Wilcoxon-Mann-Whitney檢驗(yàn)的思想類似。假定有k個(gè)總體。先把從這個(gè)k個(gè)總體來(lái)的樣本混合起來(lái)排序，記各個(gè)總體觀測(cè)值的秩之和為Ri，i=1,…,k。顯然如果這些Ri很不相同，就可以認(rèn)為它們位置參數(shù)相同的零假設(shè)不妥（備選假設(shè)為各個(gè)位置參數(shù)不全相等）。第四十八頁(yè)，共七十五頁(yè)，編輯于2023年，星期四Kruskal-Wallis關(guān)于多個(gè)樣本的秩和檢驗(yàn)

注意這里所說(shuō)的位置參數(shù)是在下面意義上的qi；由于它在分布函數(shù)Fi(x)中可以和變?cè)獂相加成為F(x+qi)的樣子，所以稱qi為位置參數(shù)。形式上，假定這些樣本有連續(xù)分布F1,…,Fk，零假設(shè)為H0：F1=…=Fk，備選假設(shè)為Ha：Fi(x)=F(x+qi)，i=1,…,k，這里F為某連續(xù)分布函數(shù)，而且這些參數(shù)qi并不相等。Kruskal-Wallis檢驗(yàn)統(tǒng)計(jì)量為

第四十九頁(yè)，共七十五頁(yè)，編輯于2023年，星期四Kruskal-Wallis關(guān)于多個(gè)樣本的秩和檢驗(yàn)

公式中ni為第i個(gè)樣本量，而N為各個(gè)樣本量之和（總樣本量）。如果觀測(cè)值中有大小一樣的數(shù)值，這個(gè)公式會(huì)有稍微的變化。這個(gè)統(tǒng)計(jì)量在位置參數(shù)相同的零假設(shè)下有漸近的自由度為k-1的c2分布。Kruskal-Wallis檢驗(yàn)僅僅要求各個(gè)總體變量有相似形狀的連續(xù)分布。第五十頁(yè)，共七十五頁(yè)，編輯于2023年，星期四數(shù)據(jù)house.sav：三個(gè)區(qū)域房?jī)r(jià)的數(shù)據(jù)

為了調(diào)查三個(gè)地區(qū)的房?jī)r(jià)是否類似，在每個(gè)地區(qū)抽樣，得到三個(gè)樣本量分別為20、30、25的房?jī)r(jià)樣本。利用SPSS軟件，很容易得到下面的檢驗(yàn)結(jié)果：第五十一頁(yè)，共七十五頁(yè)，編輯于2023年，星期四SPSS軟件使用說(shuō)明

使用house.sav數(shù)據(jù)。選項(xiàng)為Analyze－NonparametricTests－KIndependentSamples。把變量（這里是price）選入TestVariable

List；再把數(shù)據(jù)中用1、2、3來(lái)分類的變量group輸入GroupingVariable，在DefineGroups輸入1、2、3。在下面TestType選中Kruskal-WallisH。點(diǎn)Exact時(shí)打開(kāi)的對(duì)話框中可以選擇精確方法（Exact），MonteCarlo抽樣方法（MonteCarlo）或用于大樣本的漸近方法（Asymptoticonly）。最后OK即可第五十二頁(yè)，共七十五頁(yè)，編輯于2023年，星期四Jonckheere-Terpstra多樣本的秩檢驗(yàn)

這個(gè)檢驗(yàn)處理的問(wèn)題和Kruskal-Wallis檢驗(yàn)類似，零假設(shè)都是各個(gè)總體的位置參數(shù)相同，但這里的備選假設(shè)為各個(gè)總體的位置參數(shù)按升冪排列（如為降冪排列，可把總體編號(hào)顛倒順序即為升冪排列）。注意這里所說(shuō)的位置參數(shù)和前面的Kruskal-Wallis檢驗(yàn)中的位置參數(shù)意義一樣。Jonckheere-Terpstra檢驗(yàn)先在每?jī)蓚€(gè)樣本所有觀測(cè)值對(duì)之間比較，計(jì)算第i個(gè)樣本觀測(cè)值中小于第j個(gè)樣本觀測(cè)值的對(duì)子數(shù)：第五十三頁(yè)，共七十五頁(yè)，編輯于2023年，星期四數(shù)據(jù)house.sav：三個(gè)區(qū)域房?jī)r(jià)的數(shù)據(jù)

很容易得到SPSS的Jonckheere-Terpstra檢驗(yàn)結(jié)果輸出：

第五十四頁(yè)，共七十五頁(yè)，編輯于2023年，星期四SPSS軟件使用說(shuō)明

使用house.sav數(shù)據(jù)。選項(xiàng)為Analyze－NonparametricTests－KIndependentSamples。把變量（這里是price）選入TestVariableList；再把數(shù)據(jù)中用1、2、3來(lái)分類的變量group輸入GroupingVariable，在DefineGroups輸入1、2、3。在下面TestType選中Jonckheere-Terpstra。在點(diǎn)Exact時(shí)打開(kāi)的對(duì)話框中可以選擇精確方法（Exact），MonteCarlo抽樣方法（MonteCarlo）或用于大樣本的漸近方法（Asymptoticonly）。最后OK即可

第五十五頁(yè)，共七十五頁(yè)，編輯于2023年，星期四Brown-Mood中位數(shù)檢驗(yàn)

在有數(shù)個(gè)獨(dú)立樣本的情況，希望知道它們的中位數(shù)是否相等。零假設(shè)是這些樣本所代表的總體的中位數(shù)相等。備選假設(shè)是這些中位數(shù)不全相等。假定有k個(gè)總體，ni為第i個(gè)樣本量；把所有樣本量之和記為N。先把從這個(gè)k個(gè)總體來(lái)的樣本混合起來(lái)排序，找出它們的中位數(shù)。再計(jì)算每個(gè)總體中小于該中位數(shù)的觀測(cè)值個(gè)數(shù)O1i，i=1,…,k，和每個(gè)總體中大于該中位數(shù)的觀測(cè)值個(gè)數(shù)O2i，i=1,…,k。這樣就形成了一個(gè)由元素Oij組成的2×k表。其列總和為ni，i=1,…,k；而兩個(gè)行總和為各樣本小于總中位數(shù)的觀測(cè)值總和：R1＝O11+O12+…+O1k及各樣本大于總中位數(shù)的觀測(cè)值總和R2＝O21+O22+…+O2k。這顯然是一個(gè)列聯(lián)表，可以用Pearsonc2統(tǒng)計(jì)量，即第五十六頁(yè)，共七十五頁(yè)，編輯于2023年，星期四house.sav數(shù)據(jù)這里第五十七頁(yè)，共七十五頁(yè)，編輯于2023年，星期四第五十八頁(yè)，共七十五頁(yè)，編輯于2023年，星期四SPSS軟件使用說(shuō)明

使用house.sav數(shù)據(jù)。選項(xiàng)為Analyze－NonparametricTests－KIndependentSamples。把變量（這里是price）選入TestVariableList；再把數(shù)據(jù)中用1、2、3來(lái)分類的變量group輸入GroupingVariable，在DefineGroups輸入1、2、3。在下面TestType選中Median。在點(diǎn)Exact時(shí)打開(kāi)的對(duì)話框中可以選擇精確方法（Exact），MonteCarlo抽樣方法（MonteCarlo）或用于大樣本的漸近方法（Asymptoticonly）。最后OK即可

第五十九頁(yè)，共七十五頁(yè)，編輯于2023年，星期四Friedman秩和檢驗(yàn)

前面討論了兩因子試驗(yàn)設(shè)計(jì)數(shù)據(jù)的方差分析，那里所用的F檢驗(yàn)需要假定總體的分布為正態(tài)分布。有一種非參數(shù)方差分析方法，稱為Friedman（兩因子）秩和檢驗(yàn)，或Friedman方差分析。它適用于兩個(gè)因子的各種水平的組合都有一個(gè)觀測(cè)值的情況。第六十頁(yè)，共七十五頁(yè)，編輯于2023年，星期四Friedman秩和檢驗(yàn)

假定第一個(gè)因子有k個(gè)水平（稱為處理，treatment），第二個(gè)因子有b個(gè)水平（稱為區(qū)組）；因此一共有k×b＝kb個(gè)觀測(cè)值。這里之所以稱一個(gè)因子為處理，是因?yàn)檫@是我們想要看該因子各水平是否對(duì)試驗(yàn)結(jié)果有顯著的不同（它的各個(gè)水平的觀測(cè)值也就是本小節(jié)的多個(gè)相關(guān)樣本）。而另一個(gè)因子稱為區(qū)組，不同的區(qū)組也可能對(duì)結(jié)果有影響。下面是一個(gè)例子。第六十一頁(yè)，共七十五頁(yè)，編輯于2023年，星期四數(shù)據(jù)fert.sav這里有三種肥料作為第一個(gè)因子（肥料因子）的三個(gè)水平；而四種土壤為第二個(gè)因子（土壤因子）的四個(gè)水平。感興趣于是否這三種肥料對(duì)于某作物的產(chǎn)量有區(qū)別。稱肥料因子為處理，而土壤因子為區(qū)組。數(shù)據(jù)在下表中（表中數(shù)字為相應(yīng)組合的產(chǎn)量，單位公斤）。

肥料種類肥料A肥料B肥料C土壤類型土壤1224668土壤2253648土壤3182120土壤4111319第六十二頁(yè)，共七十五頁(yè)，編輯于2023年，星期四Friedman秩和檢驗(yàn)

Friedman秩和檢驗(yàn)是關(guān)于位置的，和Kruskal-Wallis檢驗(yàn)類似，形式上，假定這些樣本有連續(xù)分布F1,…,Fk，零假設(shè)為H0：F1=…=Fk，備選假設(shè)為Ha：Fi(x)=F(x+qi)，i=1,…,k，這里F為某連續(xù)分布函數(shù)，而且這些參數(shù)qi并不相等。雖然這和以前的Kruskal-Wallis檢驗(yàn)一樣，但是由于區(qū)組的影響,要首先在每一個(gè)區(qū)組中計(jì)算各個(gè)處理的秩；再把每一個(gè)處理在各區(qū)組中的秩相加.如果Rij表示在j個(gè)區(qū)組中第i個(gè)處理的秩。則秩按照處理而求得的和為

第六十三頁(yè)，共七十五頁(yè)，編輯于2023年，星期四Friedman秩和檢驗(yàn)

這樣做的目的是在每個(gè)區(qū)組內(nèi)比較處理。例如,同個(gè)年齡段中比較藥品的療效比不分年齡來(lái)比較療效要合理；在同一個(gè)部位比較不同的材料要比混合起來(lái)比較要合理等等。這里要引進(jìn)的Friedman統(tǒng)計(jì)量定義為第一個(gè)式子表明，如果各個(gè)處理很不一樣，和的平方就會(huì)很大，結(jié)果就顯著。第二個(gè)公式是為了計(jì)算方便而導(dǎo)出的。它有近似的（有k-1個(gè)自由度的）c2分布。

第六十四頁(yè)，共七十五頁(yè)，編輯于2023年，星期四fert.sav數(shù)據(jù)第六十五頁(yè)，共七十五頁(yè)，編輯于2023年，星期四SPSS軟件使用說(shuō)明

使用fert.sav數(shù)據(jù)。選項(xiàng)為Analyze－NonparametricTests－KRelatedSamples。然后把變量（這里是a、b、c）選入TestVariableList。在下面TestType選中Friedman。在點(diǎn)Exact時(shí)打開(kāi)的對(duì)話框中可以選擇精確方法（Exact），MonteCarlo抽樣方法（MonteCarlo）或用于大樣本的漸近方法（Asymptoticonly）。最后OK即可第六十六頁(yè)，共七十五頁(yè)，編輯于2023年，星期四Kendall協(xié)同系數(shù)檢驗(yàn)在實(shí)踐中，常需要按照某些特別的性質(zhì)來(lái)多次對(duì)一些個(gè)體進(jìn)行評(píng)估或排序；比如幾個(gè)（m個(gè)）評(píng)估機(jī)構(gòu)對(duì)一些（n個(gè)）學(xué)校進(jìn)行排序。人們想要知道，這些機(jī)構(gòu)的不同結(jié)果是否一致。如果很不一致，則該評(píng)估多少有些隨機(jī)，意義不大。換句話說(shuō)，這里想要檢驗(yàn)的零假設(shè)是：這些對(duì)于不同學(xué)校的排序是不相關(guān)的或者是隨機(jī)的；而備選假設(shè)為：這些對(duì)不同學(xué)校的排序是正相關(guān)的或者是

人人文庫(kù)> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

食品實(shí)驗(yàn)設(shè)計(jì)

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

食品實(shí)驗(yàn)設(shè)計(jì)

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔