統(tǒng)計(jì)學(xué)之總體參數(shù)的假設(shè)檢驗(yàn)_第1頁
統(tǒng)計(jì)學(xué)之總體參數(shù)的假設(shè)檢驗(yàn)_第2頁
統(tǒng)計(jì)學(xué)之總體參數(shù)的假設(shè)檢驗(yàn)_第3頁
統(tǒng)計(jì)學(xué)之總體參數(shù)的假設(shè)檢驗(yàn)_第4頁
統(tǒng)計(jì)學(xué)之總體參數(shù)的假設(shè)檢驗(yàn)_第5頁
已閱讀5頁,還剩64頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

統(tǒng)計(jì)學(xué)─從數(shù)據(jù)到結(jié)論第六章總體參數(shù)的假設(shè)檢驗(yàn)如果一個(gè)人說他從來沒有罵過人。他能夠證明嗎?要證明他沒有罵過人,他必須出示他從小到大每一時(shí)刻的錄音錄像,所有書寫的東西等等,還要證明這些物證是完全的、真實(shí)的、沒有間斷的。這簡(jiǎn)直是不可能的。即使他找到一些證人,比如他的同學(xué)、家人和同事,那也只能夠證明在那些證人在場(chǎng)的某些片刻,他沒有被聽到罵人。反過來,如果要證明這個(gè)人罵過人很容易,只要有一次被抓住就足夠了。看來,企圖肯定什么事物很難,而否定卻要相對(duì)容易得多。這就是假設(shè)檢驗(yàn)背后的哲學(xué)??茖W(xué)總往往是在否定中發(fā)展在假設(shè)檢驗(yàn)中,一般要設(shè)立一個(gè)原假設(shè)(上面的“從來沒罵過人”就是一個(gè)例子);而設(shè)立該假設(shè)的動(dòng)機(jī)主要是企圖利用人們掌握的反映現(xiàn)實(shí)世界的數(shù)據(jù)來找出假設(shè)與現(xiàn)實(shí)之間的矛盾,從而否定這個(gè)假設(shè)。在多數(shù)統(tǒng)計(jì)教科書中(除理論探討外)假設(shè)檢驗(yàn)都是以否定原假設(shè)為目標(biāo)。如否定不了,說明證據(jù)不足,無法否定原假設(shè)。但不能說明原假設(shè)正確。就像一兩次沒有聽過他罵人還遠(yuǎn)不能證明他從來沒有罵過人。§6.1假設(shè)檢驗(yàn)的過程和邏輯先要提出個(gè)原假設(shè),比如某正態(tài)總體的均值等于5(m=5)。這種原假設(shè)也稱為零假設(shè)(nullhypothesis),記為H0。與此同時(shí)必須提出備選假設(shè)(或稱為備擇假設(shè),alternativehypothesis),比如總體均值大于5(m>5)。備選假設(shè)記為H1或Ha。形式上,這個(gè)關(guān)于總體均值的H0相對(duì)于H1的檢驗(yàn)記為§6.1假設(shè)檢驗(yàn)的過程和邏輯備選假設(shè)應(yīng)該按照實(shí)際世界所代表的方向來確定,即它通常是被認(rèn)為可能比零假設(shè)更符合數(shù)據(jù)所代表的現(xiàn)實(shí)。比如上面的H1為m>5;這意味著,至少樣本均值應(yīng)該大于5;至于是否顯著,依檢驗(yàn)結(jié)果而定。檢驗(yàn)結(jié)果顯著(significant)意味著有理由拒絕零假設(shè)。因此,假設(shè)檢驗(yàn)也被稱為顯著性檢驗(yàn)(significanttest)?!?.1假設(shè)檢驗(yàn)的過程和邏輯有了兩個(gè)假設(shè),就要根據(jù)數(shù)據(jù)來對(duì)它們進(jìn)行判斷。數(shù)據(jù)的代表是作為其函數(shù)的統(tǒng)計(jì)量;它在檢驗(yàn)中被稱為檢驗(yàn)統(tǒng)計(jì)量(teststatistic)。根據(jù)零假設(shè)(不是備選假設(shè)!),可得到該檢驗(yàn)統(tǒng)計(jì)量的分布;再看這個(gè)統(tǒng)計(jì)量的數(shù)據(jù)實(shí)現(xiàn)值(realization)屬不屬于小概率事件?!?.1假設(shè)檢驗(yàn)的過程和邏輯也就是說把數(shù)據(jù)代入檢驗(yàn)統(tǒng)計(jì)量,看其值是否落入零假設(shè)下的小概率范疇;如果的確是小概率事件,那么就有可能拒絕零假設(shè),或者說“該檢驗(yàn)顯著,”否則說“沒有足夠證據(jù)拒絕零假設(shè)”,或者“該檢驗(yàn)不顯著?!薄?.1假假設(shè)設(shè)檢驗(yàn)驗(yàn)的過過程和和邏輯輯注意::在我們們所涉涉及的的問題題中,,零假假設(shè)和和備選選假設(shè)設(shè)在假假設(shè)檢檢驗(yàn)中中并不不對(duì)稱稱。因檢驗(yàn)驗(yàn)統(tǒng)計(jì)計(jì)量的的分布布是從從零假假設(shè)導(dǎo)導(dǎo)出的的,因因此,,如果果發(fā)生生矛盾盾,就就對(duì)零零假設(shè)設(shè)不利利了。。不發(fā)生生矛盾盾也不不能說說明零零假設(shè)設(shè)沒有有問題題?!?.1假假設(shè)設(shè)檢驗(yàn)驗(yàn)的過過程和和邏輯輯在零假假設(shè)下下,檢檢驗(yàn)統(tǒng)統(tǒng)計(jì)量量取其其實(shí)現(xiàn)現(xiàn)值及及(沿沿著備備選假假設(shè)的的方向向)更更加極極端值值的概概率稱稱為p-值((p-value))。如果得得到很很小的的p-值,,就意意味著著在零零假設(shè)設(shè)下小小概率率事件件發(fā)生生了。。如果小小概率率事件件發(fā)生生,是是相信信零假假設(shè),,還是是相信信數(shù)據(jù)據(jù)呢??當(dāng)然多多半是是相信信數(shù)據(jù)據(jù),拒拒絕零零假設(shè)設(shè)?!?.1假假設(shè)設(shè)檢驗(yàn)驗(yàn)的過過程和和邏輯輯但小概概率并并不能能說明明不會(huì)會(huì)發(fā)生生,僅僅僅發(fā)發(fā)生的的概率率很小小罷了了。拒拒絕正正確零零假設(shè)設(shè)的錯(cuò)錯(cuò)誤常常被稱稱為第一類類錯(cuò)誤誤(typeIerror))。在備選選假設(shè)設(shè)正確確時(shí)反反而說說零假假設(shè)正正確的的錯(cuò)誤誤,稱稱為第二類類錯(cuò)誤誤(typeIIerror)。在本本書的的假設(shè)設(shè)檢驗(yàn)驗(yàn)問題題中,,由于于備選選假設(shè)設(shè)不是是一個(gè)個(gè)點(diǎn),,所以以無法法算出出犯第第二類類錯(cuò)誤誤的概概率。?!?.1假假設(shè)設(shè)檢驗(yàn)驗(yàn)的過過程和和邏輯輯零假設(shè)設(shè)和備備選假假設(shè)哪哪一個(gè)個(gè)正確確,是是確定定性的的,沒沒有概概率可可言。。而可可能犯犯錯(cuò)誤誤的是是人。。涉及假假設(shè)檢檢驗(yàn)的的犯錯(cuò)錯(cuò)誤的的概率率就是是犯第第一類類錯(cuò)誤誤的概概率和和犯第第二類類錯(cuò)誤誤的概概率。。負(fù)責(zé)任任的態(tài)態(tài)度是是無論論做出出什么么決策策,都都應(yīng)該該給出出該決決策可可能犯犯錯(cuò)誤誤的概概率。。§6.1假假設(shè)設(shè)檢驗(yàn)驗(yàn)的過過程和和邏輯輯到底p-值是是多小小時(shí)才才能夠夠拒絕絕零假假設(shè)呢呢?也也就是是說,,需要要有什什么是是小概概率的的標(biāo)準(zhǔn)準(zhǔn)。這要看看具體體應(yīng)用用的需需要。。但在在一般般的統(tǒng)統(tǒng)計(jì)書書和軟軟件中中,使使用最最多的的標(biāo)準(zhǔn)準(zhǔn)是在在零假假設(shè)下下(或或零假假設(shè)正正確時(shí)時(shí))根根據(jù)樣樣本所所得的的數(shù)據(jù)據(jù)來拒拒絕零零假設(shè)設(shè)的概概率應(yīng)應(yīng)小于于0.05,當(dāng)當(dāng)然也也可能能是0.01,,0.005,,0.001等等等。。這種事事先規(guī)規(guī)定的的概率率稱為為顯著性性水平平(significantlevel),用字母a來表示。§6.1假假設(shè)檢驗(yàn)驗(yàn)的過程和和邏輯a并不一定越越小越好,,因?yàn)檫@很很可能導(dǎo)致致不容易拒拒絕零假設(shè)設(shè),使得犯犯第二類錯(cuò)錯(cuò)誤的概率率增大。當(dāng)p-值小于或等等于a時(shí),就拒絕絕零假設(shè)。。所以,a是所允許的的犯第一類類錯(cuò)誤概率率的最大值值。當(dāng)p-值小于或等等于a時(shí),就說這這個(gè)檢驗(yàn)是是顯著的。。無論統(tǒng)計(jì)學(xué)學(xué)家用多大大的a作為顯著性性水平都不不能脫離實(shí)實(shí)際問題的的背景。統(tǒng)統(tǒng)計(jì)顯著不不一定等價(jià)價(jià)于實(shí)際顯顯著。反過過來也一樣樣?!?.1假假設(shè)檢驗(yàn)驗(yàn)的過程和和邏輯歸納起來,,假設(shè)檢驗(yàn)驗(yàn)的邏輯步步驟為:1.寫出出零假設(shè)和和備選假設(shè)設(shè);2.確定定檢驗(yàn)統(tǒng)計(jì)計(jì)量;3.確定定顯著性水水平a;4.根據(jù)據(jù)數(shù)據(jù)計(jì)算算檢驗(yàn)統(tǒng)計(jì)計(jì)量的實(shí)現(xiàn)現(xiàn)值;5.根據(jù)據(jù)這個(gè)實(shí)現(xiàn)現(xiàn)值計(jì)算p-值;6.進(jìn)行行判斷:如如果p-值小于或等等于a,就拒絕零零假設(shè),這這時(shí)犯(第第一類)錯(cuò)錯(cuò)誤的概率率最多為a;如果p-值大于a,就不拒絕絕零假設(shè),,因?yàn)樽C據(jù)據(jù)不足?!?.1假假設(shè)檢驗(yàn)驗(yàn)的過程和和邏輯實(shí)際上,多多數(shù)計(jì)算機(jī)機(jī)軟件僅僅僅給出p-值,而不給給出a。這有很多多方便之處處。比如a=0.05,而假定定所得到的的p-值等于0.001。。這時(shí)如果果采用p-值作為新的的顯著性水水平,即新新的a=0.001,于是是就可以說說,在顯著著性水平為為0.001時(shí),拒拒絕零假設(shè)設(shè)。這樣,拒絕絕零假設(shè)時(shí)時(shí)犯錯(cuò)誤的的概率實(shí)際際只是千分分之一而不不是舊的a所表明的百百分之五。。在這個(gè)意意義上,p-值又稱為觀測(cè)的顯著著性水平((observedsignificantlevel)?!?.1假假設(shè)檢驗(yàn)驗(yàn)的過程和和邏輯在統(tǒng)計(jì)軟件件輸出p-值的位置,,有的用““p-value”,有的的用significant的縮寫““Sig””就是這個(gè)個(gè)道理。根據(jù)數(shù)據(jù)產(chǎn)產(chǎn)生的p-值來減少a的值以展示示結(jié)果的精精確性總是是沒有害處處的。這好比一個(gè)個(gè)身高180厘米的的男生,可可能愿意被被認(rèn)為高于于或等于180厘米米,而不愿愿意說他高高于或等于于155厘厘米,雖然然這第二種種說法數(shù)學(xué)學(xué)上沒有絲絲毫錯(cuò)誤。?!?.1假假設(shè)檢驗(yàn)驗(yàn)的過程和和邏輯關(guān)于“臨界界值”的注注:作為概率的的顯著性水水平a實(shí)際上相應(yīng)應(yīng)于一個(gè)檢檢驗(yàn)統(tǒng)計(jì)量量取值范圍圍的一個(gè)臨界值(criticalvalue),它定義為為,統(tǒng)計(jì)量量取該值或更更極端的值值的概率等于于a。也就是說說,“統(tǒng)計(jì)量的的實(shí)現(xiàn)值比比臨界值更更極端”等等價(jià)于“p-值小于a”。使用臨臨界值的概概念進(jìn)行的的檢驗(yàn)不計(jì)計(jì)算p-值。只比較較統(tǒng)計(jì)量的的取值和臨臨界值的大大小。§6.1假假設(shè)檢驗(yàn)驗(yàn)的過程和和邏輯使用臨界值值而不是p-值來判斷拒拒絕與否是是前計(jì)算機(jī)時(shí)時(shí)代的產(chǎn)物物。當(dāng)時(shí)計(jì)算算p-值不易,只只采用臨界界值的概念念。但從給給定的a求臨界值同同樣也不容容易,好在在習(xí)慣上僅僅僅在教科科書中列出出相應(yīng)于特特定分布的的幾個(gè)有限限的a臨界值(比比如a=0.05,a=0.025,a=0.01,a=0.005,a=0.001等等)),或者根根據(jù)分布表表反過來查查臨界值((很不方便便也很粗糙糙)?,F(xiàn)在計(jì)算機(jī)機(jī)軟件大都都不給出a和臨界值,,但都給出出p-值和統(tǒng)計(jì)量量的實(shí)現(xiàn)值值,讓用戶戶自己決定定顯著性水水平是多少少?!?.1假假設(shè)檢驗(yàn)驗(yàn)的過程和和邏輯在一些統(tǒng)計(jì)計(jì)教科書中中會(huì)有不能能拒絕零假假設(shè)就“接接受零假設(shè)設(shè)”的說法法。這種說說法是不嚴(yán)嚴(yán)格的。首先,如果果你說“接接受零假設(shè)設(shè)”,那么么就應(yīng)該負(fù)負(fù)責(zé)任地提提供接受零零假設(shè)時(shí)可可能犯第二二類錯(cuò)誤的的概率。這這就要算出出在備選假假設(shè)正確的的情況下錯(cuò)錯(cuò)誤接受零零假設(shè)的概概率。但是是,這只有有在備選假假設(shè)僅僅是是一個(gè)與零零假設(shè)不同同的確定值值(而不是是范圍)時(shí)時(shí)才有可能能。多數(shù)基本統(tǒng)統(tǒng)計(jì)教科書書的備選假假設(shè)是一個(gè)個(gè)范圍而根根本無法確確定犯第二二類錯(cuò)誤的的概率?!?.1假假設(shè)檢驗(yàn)驗(yàn)的過程和和邏輯在許多統(tǒng)計(jì)計(jì)教科書中中,往往把把一系列不不能拒絕零零假設(shè)的檢檢驗(yàn)當(dāng)成接接受這些假假設(shè)的通行行證。比如不能拒拒絕某樣本本的正態(tài)性性就變成了了證明了該該樣本是正正態(tài)的等等等。不能拒絕這這些零假設(shè)設(shè),僅僅說說明根據(jù)所所使用的檢檢驗(yàn)方法((或檢驗(yàn)統(tǒng)統(tǒng)計(jì)量)和和當(dāng)前的數(shù)數(shù)據(jù)沒有足足夠證據(jù)拒拒絕這些假假設(shè)而已。?!?.1假假設(shè)檢驗(yàn)驗(yàn)的過程和和邏輯對(duì)于同一個(gè)個(gè)假設(shè)檢驗(yàn)驗(yàn)問題,往往往都有多多個(gè)檢驗(yàn)統(tǒng)統(tǒng)計(jì)量;而而且人們還還在構(gòu)造更更優(yōu)良的檢檢驗(yàn)統(tǒng)計(jì)量量。人們不可能能把所有的的目前存在在的和將來來可能存在在的檢驗(yàn)都都實(shí)施。因此,只只能夠說說,按照照目前的的證據(jù),,不足以以拒絕零零假設(shè)而而已。后后面將會(huì)會(huì)用例子子說明““接受零零假設(shè)””的說法法是不妥妥當(dāng)?shù)?。?!?.2對(duì)于于正態(tài)總總體均值值的檢驗(yàn)驗(yàn)§6.2.1根根據(jù)一一個(gè)樣本本對(duì)其總總體均值值大小進(jìn)進(jìn)行檢驗(yàn)驗(yàn)例6.1一個(gè)顧顧客買了了一包標(biāo)標(biāo)有500g重重的一包包紅糖,,覺得份份量不足足,于是是找到監(jiān)監(jiān)督部門門;當(dāng)然然他們會(huì)會(huì)覺得一一包份量量不夠可可能是隨隨機(jī)的。。于是監(jiān)監(jiān)督部門門就去商商店稱了了50包包紅糖((數(shù)據(jù)在在sugar.txt);其其中均值值(平均均重量))是498.35g;;這的確確比500g少少,但這這是否能能夠說明明廠家生生產(chǎn)的這這批紅糖糖平均起起來不夠夠份量呢呢?于于是需要要統(tǒng)計(jì)檢檢驗(yàn)??煽梢援嫵龀鲞@些重重量的直直方圖50包紅紅糖重量量的直方方圖§6.2.1根根據(jù)一一個(gè)樣本本對(duì)其總總體均值值大小進(jìn)進(jìn)行檢驗(yàn)驗(yàn)這個(gè)直方方圖看上上去象是是正態(tài)分分布的樣樣本。不不妨假定定這一批批袋裝紅紅糖有正正態(tài)分布布。由于廠家家聲稱每每袋500g((標(biāo)明重重量),,因此零零假設(shè)為為總體均均值等于于500g(被被懷疑對(duì)對(duì)象總是是放在零零假設(shè)));而且由于于樣本均均值少于于500g(這這是懷疑疑的根據(jù)據(jù)),把把備選假假設(shè)定為為總體均均值少于于500g(備備選假設(shè)設(shè)為單向向不等式式的檢驗(yàn)驗(yàn)稱為單單尾檢驗(yàn)驗(yàn),為不不等號(hào)““≠”的的稱為雙雙尾檢驗(yàn)驗(yàn))§6.2.1根根據(jù)一一個(gè)樣本本對(duì)其總總體均值值大小進(jìn)進(jìn)行檢驗(yàn)驗(yàn)檢驗(yàn)統(tǒng)計(jì)計(jì)量就是是第四章章引進(jìn)的的作為對(duì)對(duì)均值的的某種標(biāo)標(biāo)準(zhǔn)化的的符號(hào)中的的m0通常表示示為零假假設(shè)中的的均值((這里是是500)。在在零假設(shè)設(shè)之下,,它有自自由度為為n-1=49的t分布。。當(dāng)然實(shí)實(shí)際上不不必代入入這個(gè)公公式去手手工計(jì)算算了,讓讓計(jì)算機(jī)機(jī)去代勞勞好了。。§6.2.1根根據(jù)一一個(gè)樣本本對(duì)其總總體均值值大小進(jìn)進(jìn)行檢驗(yàn)驗(yàn)計(jì)算結(jié)果果是t=-2.696(也稱為為t值),同時(shí)時(shí)得到p-值為0.005(由于計(jì)計(jì)算機(jī)輸出的的為雙尾檢驗(yàn)驗(yàn)的p-值,比單尾的的大一倍,應(yīng)應(yīng)該除以2))。看來可以以選擇顯著性性水平為0.005,并并宣稱拒絕零零假設(shè),而錯(cuò)錯(cuò)誤拒絕的概概率為0.005。統(tǒng)計(jì)量t=-2.696相應(yīng)于左邊邊尾概率(p-值)0.005§6.2.1根據(jù)一個(gè)個(gè)樣本對(duì)其總總體均值大小小進(jìn)行檢驗(yàn)上面例子的備備選假設(shè)為小小于(“<””)某個(gè)值。。同樣也可能能有備選假設(shè)設(shè)為均值大于于(“>”))某個(gè)值的情情況。取備選假設(shè)為為均值大于或或小于某個(gè)值值的檢驗(yàn)稱為為單尾檢驗(yàn)(one-tailedtest,也稱為單側(cè)檢驗(yàn)或單單邊檢驗(yàn))。。下面舉一個(gè)選選假設(shè)為均值值大于(“>”)某個(gè)值值的例子。§6.2.1根據(jù)一個(gè)個(gè)樣本對(duì)其總總體均值大小小進(jìn)行檢驗(yàn)例6.2(exh.txt)汽車廠廠商聲稱其發(fā)發(fā)動(dòng)機(jī)排放標(biāo)標(biāo)準(zhǔn)的一個(gè)指指標(biāo)平均低于于20個(gè)單位位。在抽查了了10臺(tái)發(fā)動(dòng)動(dòng)機(jī)之后,得得到下面的排排放數(shù)據(jù):17.0、21.7、17.9、22.9、20.7、22.4、17.3、21.8、24.2、25.4。該該樣本均值為為21.13。究竟能否否由此認(rèn)為該該指標(biāo)均值超超過20?這這次的假設(shè)檢檢驗(yàn)問題就是是§6.2.1根據(jù)一個(gè)個(gè)樣本對(duì)其總總體均值大小小進(jìn)行檢驗(yàn)和前面的例子子的方法類似似,可以發(fā)現(xiàn)現(xiàn)p-值為0.1243(計(jì)算算機(jī)輸出的雙雙尾檢驗(yàn)的p-值除以2),,因此,沒有有證據(jù)否定零零假設(shè)。這時(shí)時(shí)的檢驗(yàn)統(tǒng)計(jì)計(jì)量t=1.2336。也可以以畫出類似于于圖6.2的的圖(圖6.3)這時(shí)的的t分布的自自由度為9。。下面是結(jié)果果的計(jì)算機(jī)輸輸出:統(tǒng)計(jì)量t=1.2336相應(yīng)于右邊邊尾概率(p-值)0.1243§6.2.1根據(jù)一個(gè)個(gè)樣本對(duì)其總總體均值大小小進(jìn)行檢驗(yàn)注意:在假設(shè)設(shè)檢驗(yàn)中往往往也用帶等號(hào)號(hào)的不等式來來表示零假設(shè)設(shè),比如上述述的檢驗(yàn)記為為但這里用于計(jì)計(jì)算p-值的零假設(shè)設(shè)還是m=20;但如如果能夠拒絕絕零假設(shè)m=20,那么么對(duì)于任何m小于20的零零假設(shè)就更有有理由拒絕了了。這和以拒拒絕零假設(shè)為為初衷的假設(shè)設(shè)檢驗(yàn)思維方方式是一致的的。§6.2.1根據(jù)一個(gè)個(gè)樣本對(duì)其總總體均值大小小進(jìn)行檢驗(yàn)還有所謂的雙尾檢驗(yàn)(twotailedtest,也稱為雙側(cè)檢驗(yàn)或雙邊檢驗(yàn))問題,即在這種情況下下,尾概率不不僅是左邊或或右邊的一個(gè)個(gè)尾概率,而而是兩邊尾概概率之和。因因此如果是一一個(gè)單尾檢驗(yàn)驗(yàn)問題,用了了雙尾檢驗(yàn)的的模式,p-值就比用單尾尾檢驗(yàn)時(shí)大了了一倍?!?.2.1根據(jù)一個(gè)個(gè)樣本對(duì)其總總體均值大小小進(jìn)行檢驗(yàn)如果上面發(fā)動(dòng)動(dòng)機(jī)排放指標(biāo)標(biāo)例子的檢驗(yàn)驗(yàn)問題改為是是否該發(fā)動(dòng)機(jī)機(jī)的排放指標(biāo)標(biāo)均值等于20。即這時(shí)t統(tǒng)計(jì)量量還是取原來來的值1.2336,但但p-值為0.1243×2=0.2486。圖6.3就變成圖圖6.4的樣樣子統(tǒng)計(jì)量t=1.2336,而p-值等于左右尾尾概率之和,,即0.2486§6.2.2根據(jù)來自自兩個(gè)總體的的獨(dú)立樣本對(duì)對(duì)其總體均值值的檢驗(yàn)例6.3(數(shù)據(jù):drug.txt)為檢測(cè)測(cè)某種藥物對(duì)對(duì)攻擊性情緒緒的影響,對(duì)對(duì)處理組的100名服藥藥者和對(duì)照組組的150名名非服藥者進(jìn)進(jìn)行心理測(cè)試試,得到相應(yīng)應(yīng)的某指標(biāo)。。要檢驗(yàn)處理理組指標(biāo)的總總體均值m1是否等于對(duì)照照組指標(biāo)的總總體均值m2。相應(yīng)的假設(shè)設(shè)檢驗(yàn)問題為為:或§6.2.2根據(jù)來自自兩個(gè)總體的的獨(dú)立樣本對(duì)對(duì)其總體均值值的檢驗(yàn)通過計(jì)算,t統(tǒng)計(jì)量等于0.942,,p-值為0.1735(輸出出中的雙尾檢檢驗(yàn)p-值的一半)。。因此無法拒拒絕零假設(shè),,即不能得出出處理組的平平均指標(biāo)大于于對(duì)照組的結(jié)結(jié)論。計(jì)算機(jī)機(jī)輸出的相應(yīng)應(yīng)表格(部分分,刪除了置置信區(qū)間部分分)為:§6.2.2根據(jù)來自自兩個(gè)總體的的獨(dú)立樣本對(duì)對(duì)其總體均值值的檢驗(yàn)注意:這個(gè)輸輸出的前面三三列用Levene的F-檢驗(yàn)來看看這兩個(gè)樣本本所代表的總總體之方差是是否相等(零零假設(shè)為相等等)。第一行行是該檢驗(yàn)的的零假設(shè):兩兩個(gè)總體方差差相等,而第第二行為備選選假設(shè):兩個(gè)個(gè)總體方差不不等。如果該該檢驗(yàn)顯著,,即在Sig列中的該Levene檢驗(yàn)p-值很?。ㄟ@里里是0.008),就應(yīng)應(yīng)該看第二行行備選假設(shè)的的t檢驗(yàn)輸出出,這里是0.347;;由于是單邊邊檢驗(yàn),p-值=0.347/2=0.1735;如果Levene檢檢驗(yàn)的p-值較大(本例例并不大),,則看第一行行原假設(shè)下的的結(jié)果。之所所以要檢驗(yàn)總總體方差,是是因?yàn)榭傮w方方差相同時(shí)使使用的檢驗(yàn)統(tǒng)統(tǒng)計(jì)量與方差差不同時(shí)使用用的不同?!?.2.3成對(duì)樣本本的問題例6.4減肥肥數(shù)據(jù)(diet.txt)。這里里有50對(duì)數(shù)數(shù)據(jù)。為50人是減肥前前后的重量要比較50個(gè)個(gè)人在減肥前前后的重量。。不能用前面的的獨(dú)立樣本均均值差的檢驗(yàn)驗(yàn);這是因?yàn)闉閮蓚€(gè)樣本并并不獨(dú)立。每每一個(gè)人減肥肥后的重量都都和自己減肥肥前的重量有有關(guān)。但不同同人之間卻是是獨(dú)立的。令所有個(gè)體減減肥前后重量量差(減肥前前重量減去減減肥后重量))的均值為mD;這樣所要進(jìn)進(jìn)行的檢驗(yàn)為為§6.2.3成對(duì)樣本本的問題我們可以把兩兩個(gè)樣本中配配對(duì)的觀測(cè)值值逐個(gè)相減,,形成一個(gè)由由獨(dú)立觀測(cè)值值組成的樣本本;然后用單單樣本檢驗(yàn)方方法,看其均均值是否為零零。在相減之后公公式和單樣本本均值檢驗(yàn)無無異。當(dāng)然,,如果直接選選用軟件中成成對(duì)樣本均值值的檢驗(yàn),就就不用事先逐逐個(gè)相減了。。這里也有單單尾和雙尾檢檢驗(yàn)。這里介紹的是是假定總體分分布為正態(tài)分分布時(shí)的t檢檢驗(yàn)??傮w分分布未知時(shí),,應(yīng)該利用第第十六章的非非參數(shù)檢驗(yàn)方方法?!?.2.3成對(duì)樣本本的問題再接著看例6.4。計(jì)算算機(jī)輸出了雙雙尾p-值0.002,這里的單單尾p-值于是為0.001。因因此在顯著性性水平為0.001時(shí),,可以拒絕零零假設(shè)。也就就是說,減肥肥后和減肥前前相比,平均均重量顯著要要輕。下面是是這個(gè)檢驗(yàn)的的SPSS的的部分計(jì)算機(jī)機(jī)輸出為(刪刪去了置信區(qū)區(qū)間):§6.3對(duì)對(duì)于比例的檢檢驗(yàn)§6.3.1對(duì)于離散散變量總體比比例的檢驗(yàn)例6.5(two.txt)為評(píng)價(jià)價(jià)電視的收視視率,電話調(diào)調(diào)查,在某一一節(jié)目播出的的時(shí)候,被訪訪的正在觀看看電視的人中中有23%的的正在觀看這這個(gè)節(jié)目?,F(xiàn)現(xiàn)在想知道,,這是否和該該節(jié)目的制作作人所期望的的p0=25%有顯顯著不足。這顯然是一個(gè)個(gè)參數(shù)為p的二項(xiàng)分布問問題。形式上上的假設(shè)檢驗(yàn)驗(yàn)問題是§6.3.1對(duì)于離散散變量總體比比例的檢驗(yàn)如果n為訪問的正在在看電視的人人數(shù),x為其中觀看該該節(jié)目的人數(shù)數(shù),那么樣本本中的觀看比比例為檢驗(yàn)統(tǒng)計(jì)量則則是在零假設(shè)設(shè)下當(dāng)大樣本本時(shí)近似有標(biāo)標(biāo)準(zhǔn)正態(tài)分布布的統(tǒng)計(jì)量§6.3.1對(duì)于離散散變量總體比比例的檢驗(yàn)這個(gè)數(shù)值用手手算也不費(fèi)力力氣。請(qǐng)注意意,前面第五章提提起過,即使使被訪者的百百分比一樣,,但樣本少的的信息就少。。對(duì)于假設(shè)檢檢驗(yàn)也是一樣樣。樣本量對(duì)對(duì)于假設(shè)檢驗(yàn)驗(yàn)的結(jié)果就十十分重要。對(duì)于本例,現(xiàn)現(xiàn)在還未給出出樣本量n呢!下面看看看不同的樣本本量會(huì)得到什什么結(jié)果(假假定x/n=0.23不不變)§6.3.1對(duì)于離散散變量總體比比例的檢驗(yàn)如樣本量為n=1500((和數(shù)據(jù)給的的一樣),那那么,上面的的檢驗(yàn)得到的的p-值為0.0368。因此此,可以認(rèn)為為(如果選顯顯著性水平為為0.05的的話)說收視視率有25%%是過分了。。即拒絕零假假設(shè)。如樣樣本本量量為為n=100,,那那么么,,上上面面的的檢檢驗(yàn)驗(yàn)得得到到的的p-值為為0.3221。。因因此此,,沒沒有有足足夠夠的的理理由由拒拒絕絕收收視視率率有有25%%的的零零假假設(shè)設(shè)((如如果果選選顯顯著著性性水水平平為為0.05的的話話))注意意,,利利用用軟軟件件時(shí)時(shí),,上上面面的的p-值計(jì)計(jì)算算往往往往在在公公式式中中加加上上用用連連續(xù)續(xù)變變量量近近似似離離散散變變量量分分布布時(shí)時(shí)常常用用的的連連續(xù)續(xù)性性糾糾正正,,因因此此結(jié)結(jié)果果和和用用上上面面公公式式直直接接手手算算的的稍稍有有不不同同。?!?.3.1對(duì)對(duì)于于離離散散變變量量總總體體比比例例的的檢檢驗(yàn)驗(yàn)下面面是是對(duì)對(duì)于于n=1500時(shí)時(shí),,例例6.5的的SPSS輸輸出出。。這這里里正正在在觀觀看看該該節(jié)節(jié)目目的的人人數(shù)數(shù)為為n1=345,,而而1500人人中中觀觀看看其其他他節(jié)節(jié)目目的的人人數(shù)數(shù)為為n2=1155。。樣樣本本中中收收視視比比例例為為n1/n=345/1500==0.23。?!?.3.1對(duì)對(duì)于于離離散散變變量量總總體體比比例例的的檢檢驗(yàn)驗(yàn)前面面對(duì)對(duì)總總體體比比例例的的檢檢驗(yàn)驗(yàn)所所用用的的公公式式利利用用了了二二項(xiàng)項(xiàng)分分布布的的大大樣樣本本正正態(tài)態(tài)近近似似;;怎怎樣樣才才是是大大樣樣本本呢呢??這這和和第第五五章章求求比比例例的的置置信信區(qū)區(qū)間間時(shí)時(shí)大大樣樣本本的的近近似似標(biāo)標(biāo)準(zhǔn)準(zhǔn)類類似似,,即即當(dāng)當(dāng)區(qū)區(qū)間間完全全包包含含在在((0,,1))區(qū)區(qū)間間內(nèi)內(nèi)部部時(shí)時(shí),,可可以以認(rèn)認(rèn)為為樣樣本本足足夠夠大大,,能能夠夠用用正正態(tài)態(tài)近近似似。?!?.3.1對(duì)對(duì)于于離離散散變變量量總總體體比比例例的的檢檢驗(yàn)驗(yàn)對(duì)于于兩兩個(gè)個(gè)樣樣本本,,也也有有關(guān)關(guān)于于兩兩個(gè)個(gè)總總體體比比例例之之差差p1-p2的檢檢驗(yàn)驗(yàn)。。還還拿拿收收視視率率為為例例。。節(jié)節(jié)目目甲甲的的樣樣本本收收視視率率為為20%%,,節(jié)節(jié)目目乙乙為為21%%,,是是不不是是節(jié)節(jié)目目甲甲的的總總體體收收視視率率就就真真的的低低于于節(jié)節(jié)目目乙乙??即即檢檢驗(yàn)驗(yàn)這里的的零假假設(shè)意意味著著節(jié)目目甲和和節(jié)目目乙收收視率率相等等?!?.3.1對(duì)對(duì)于于離散散變量量總體體比例例的檢檢驗(yàn)假定n1=1200,n2=1300,檢檢驗(yàn)驗(yàn)統(tǒng)計(jì)計(jì)量則則是在在零假假設(shè)下下當(dāng)大大樣本本時(shí)有有近似似標(biāo)準(zhǔn)準(zhǔn)正態(tài)態(tài)分布布的統(tǒng)統(tǒng)計(jì)量量得到p-值等于于0.2679。因因此,,在顯顯著性性水平平即使使是0.1時(shí),,也沒沒有足足夠證證據(jù)可可以拒拒絕““節(jié)目目甲和和節(jié)目目乙收收視率率相等等”的的零假假設(shè)。?!?.3.2對(duì)對(duì)于于連續(xù)續(xù)變量量比例例的檢檢驗(yàn)有時(shí)需需要檢檢驗(yàn)收收入低低于某某個(gè)水水平的的人占占有的的比例例p是否和和預(yù)期期的p0一樣。。和6.3.1節(jié)一一樣,,只要要把大大于某某水平平的觀觀測(cè)值值看作作Bernoulli試試驗(yàn)的的“成成功””,而而把小小于某某水平平的觀觀測(cè)值值看成成“失失敗””,就就回到到二項(xiàng)項(xiàng)分布布的問問題了了。當(dāng)當(dāng)然,,用不不著把把這些些連續(xù)續(xù)變量量的觀觀測(cè)值值都變變成““成功功”和和“失失敗””之后后,再再數(shù)各各有多多少。。統(tǒng)計(jì)計(jì)軟件件會(huì)替替我們們做所所有的的事情情。下面通通過一一個(gè)例例子來來說明明?!?.3.2對(duì)對(duì)于于連續(xù)續(xù)變量量比例例的檢檢驗(yàn)例6.6某某微微生物物的壽壽命問問題(數(shù)據(jù)據(jù)life.txt)。。這里里有某某微生生物在在一種種污染染環(huán)境境下生生存的的壽命命數(shù)據(jù)據(jù)(單單位::小時(shí)時(shí))§6.3.2對(duì)對(duì)于于連續(xù)續(xù)變量量比例例的檢檢驗(yàn)問題是是存活活時(shí)間間低于于2小小時(shí)的的是否否少于于70%((存活活時(shí)間間多于于2小小時(shí)的的是否否多于于30%))?零零假設(shè)設(shè)為存存活時(shí)時(shí)間低低于2小時(shí)時(shí)的少少于或或等于于70%,,備選選假設(shè)設(shè)為存存活時(shí)時(shí)間低低于2小時(shí)時(shí)的多多于70%。該該檢驗(yàn)驗(yàn)用符符號(hào)表表示,,對(duì)于于p0=0.7,,§6.3.2對(duì)對(duì)于于連續(xù)續(xù)變量量比例例的檢檢驗(yàn)由計(jì)算算機(jī)很很容易易得到到檢驗(yàn)驗(yàn)結(jié)果果這說明明,活活不過過2小小時(shí)的的有52個(gè)個(gè)觀測(cè)測(cè)值,,所占占的比比例為為90%。。檢驗(yàn)驗(yàn)的精精確p-值和和大樣樣本近近似的的p-值均為為0.002。。因此此,可可以拒拒絕““存活活時(shí)間間低于于2小小時(shí)的的少于于70%””的零零假設(shè)設(shè)?!?.3.2對(duì)對(duì)于于連續(xù)續(xù)變量量比例例的檢檢驗(yàn)這個(gè)檢檢驗(yàn)的的假設(shè)設(shè)還可可以有有另一一種等等價(jià)形形式。。前面面第三三、四四章介介紹過過樣本本和總總體的的a-分位位數(shù)的的概念念。例例6.6的的檢驗(yàn)驗(yàn)問題題等價(jià)價(jià)于檢檢驗(yàn)0.7分位位數(shù)q是等于于2((q0=2))還是是小于于2;;即::該例的的結(jié)論論是實(shí)實(shí)際存存活時(shí)時(shí)間的的0.7分分位數(shù)數(shù)q小于2小時(shí)時(shí)?!?.3.2對(duì)對(duì)于于連續(xù)續(xù)變量量比例例的檢檢驗(yàn)上面的的檢驗(yàn)驗(yàn)又稱稱為((推廣廣的))符號(hào)號(hào)檢驗(yàn)驗(yàn)(signtest)。。它用用不著著對(duì)總總體分分布進(jìn)進(jìn)行任任何假假定。。而狹狹義的的符號(hào)號(hào)檢驗(yàn)驗(yàn)是指指上面面的p0=0.5或或者((等價(jià)價(jià)地))q0等于中中位數(shù)數(shù)的情情況。。通常常把符符號(hào)檢檢驗(yàn)歸歸于非非參數(shù)數(shù)檢驗(yàn)驗(yàn)范疇疇(參參見后后面介介紹非非參數(shù)數(shù)檢驗(yàn)驗(yàn)的一一章))?!?.4從從一一個(gè)例例子說說明““接受受零假假設(shè)””的說說法不不妥雖然前前面已已經(jīng)有有了一一些例例子說說明““接受受零假假設(shè)””說法法的不不妥,,但還還可能能會(huì)有有些人人對(duì)于于在檢檢驗(yàn)結(jié)結(jié)果不不顯著著時(shí)只只能說說“不不能拒拒絕零零假設(shè)設(shè)”而而不能能說““接受受零假假設(shè)””感到到不解解。下下面用用一個(gè)個(gè)個(gè)描描述性性例子子來說說明。?!?.4從從一個(gè)例例子說明““接受零假假設(shè)”的說說法不妥例6.7((數(shù)據(jù)rice.txt)一個(gè)大大米加工廠廠賣給一個(gè)個(gè)超市一批批標(biāo)明10kg重的的大米。而而該超市懷懷疑該廠家家缺斤短兩兩,對(duì)10包大米進(jìn)進(jìn)行了稱重重,得到下下面結(jié)果((單位:千千克)這里里假定打包包的大米重重量服從正正態(tài)分布。?!?.4從從一個(gè)例例子說明““接受零假假設(shè)”的說說法不妥由于發(fā)生分分歧,于是是各方同意意用這個(gè)數(shù)數(shù)據(jù)進(jìn)行關(guān)關(guān)于大米重重量均值m的t檢驗(yàn);;以廠家所所說的平均均重量為10kg作作為零假設(shè)設(shè),而以超超市懷疑的的份量不足足10kg作為備選選假設(shè):于是,超市市、加工廠廠老板和該該老板的律律師都進(jìn)行行了檢驗(yàn)。。結(jié)果是::§6.4從從一個(gè)例例子說明““接受零假假設(shè)”的說說法不妥1.超市用用全部數(shù)據(jù)據(jù)進(jìn)行t檢檢驗(yàn),得到到拒絕零假假設(shè)的結(jié)論論。他們根根據(jù)計(jì)算得得到:樣本本均值為9.92kg,而p-值為0.0106。因此超超市認(rèn)為,,對(duì)于顯著著性水平a=0.05,應(yīng)該拒拒絕零假設(shè)設(shè)。§6.4從從一個(gè)例例子說明““接受零假假設(shè)”的說說法不妥2.大米加加工廠老板板只用2個(gè)個(gè)數(shù)據(jù),得得到“接受受零假設(shè)””的結(jié)論。。大米加工工廠老板也也懂些統(tǒng)計(jì)計(jì),他只取取了上面樣樣本的頭兩兩個(gè)個(gè)數(shù)目目9.93和9.83進(jìn)行同同樣的t檢檢驗(yàn)。通過過對(duì)這兩個(gè)個(gè)數(shù)進(jìn)行計(jì)計(jì)算得到::樣本均值值為9.88kg,,而p-值為0.1257。雖然樣樣本均值不不如超市檢檢驗(yàn)的大,,但p-值大大增增加。加工工廠老板于于是下了結(jié)結(jié)論:

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論