版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
……正如一個法庭宣告某一判決為“無罪(notguilty)”而不為“清白(innocent)”,統(tǒng)計檢驗(yàn)的結(jié)論也應(yīng)為“不拒絕”而不為“接受”。
——JanKmenta統(tǒng)計名言第一頁,共98頁。案例辛普森殺妻案第二頁,共98頁。辛普森案(英語:O.J.Simpsonmurdercase,又稱加利福尼亞人民訴辛普森案,英語:Peoplev.Simpson)是美國加利福尼亞州最高法院對前美式橄欖球明星、演員O?J?辛普森進(jìn)行的刑事訴訟,在該案中,辛普森被指控于1994年犯下兩宗謀殺罪,受害人為其前妻妮克爾?布朗?辛普森及其好友羅納德?高曼。該案被稱為是美國歷史上最受公眾關(guān)注的刑事審判案件。第三頁,共98頁。案發(fā)時間,1994年6月12日深夜案發(fā)后凌晨,辛普森門外有血跡現(xiàn)場滴落的血痕中有辛普森的血,辛普森家中血手套和辛普森的臟衣服都有被害人的血第四頁,共98頁。法庭戰(zhàn)爭
檢方的“鐵證如山”與“夢幻律師團(tuán)”在檢方看來,本案可謂是“鐵證如山”,本案中無論是證據(jù)數(shù)量,還是證據(jù)的可信程度,在檢方看來,都達(dá)到了很高的標(biāo)準(zhǔn)。第五頁,共98頁??剞q雙方幾個關(guān)鍵的地方
控方:檢方在審判的最初幾周出示證據(jù),證明辛普森曾有對妮可爾的家庭暴力史。辯方:時遭受丈夫家庭暴力中,遭受丈夫傷害的概率為1%第六頁,共98頁。控方:鞋碼與辛普森的相似,辛普森手上有劃痕辯方:世界上與辛普森鞋碼一樣的人數(shù)不勝數(shù),在左手有傷痕的人也不盡其數(shù),所以這樣的證據(jù)對案件的判斷是沒有任何價值的。第七頁,共98頁??胤剑涸诜缸铿F(xiàn)場發(fā)現(xiàn)的血液,DNA鑒定發(fā)現(xiàn)與辛普森是完全一致的,而DNA鑒定兩個人一致的可能性只有萬分之。辯方:在洛杉磯300萬人口中,就有300個人DAN一致,辛普森是洛杉磯人口的1人,所以,辛普森是殺人兇手的概率只有0.03%。如果認(rèn)為新浦森有罪的話,那么誤判的概率將高達(dá)99.97%.最終無罪釋放。第八頁,共98頁??胤剑浩綍r遭受丈夫家庭暴力中,非正常死亡的,其兇手為丈夫的概率為80%??胤剑嚎赡軙泻芏嗯c辛普森鞋碼一樣的人,但也會有很多左手有劃痕的人,但辛普森是一個嫌疑犯,不能把他放在所有的人當(dāng)中去進(jìn)行歸類,于是只能放在嫌疑犯中,在嫌疑犯中,跟辛普森鞋碼吻合的人的概率非常之小第九頁,共98頁。法庭宣判過程法官假定辛普森無罪——控方搜集證據(jù)證明他有罪,只有當(dāng)證據(jù)充足的時候才能宣判有罪,否則要接受法官的假定。第十頁,共98頁。辛浦森(Simpson'sParadox)悖論案例1:是否存在種族歧視被告種族受害者種族死刑判決是否白人白人19132
黑人09黑人白人1152
黑人697160166
36290326第十一頁,共98頁??偟目?白人有19/160=12%的被告被判處死刑,與之對應(yīng),黑人只有17/166=10%的被告被判死刑,白人死刑率要高一些.但如果考慮受害者的種族,結(jié)論就相反了.當(dāng)受害者是白人時,有11/63=17.5%的黑人被告被判死刑,而只有19/151=12.6%的白人被告被判死刑.當(dāng)受害者是黑人時,白人被告沒一個人(0%)被判死刑,而黑人被告確有6/103=5.8%的被判死刑.第十二頁,共98頁??胤剑篋NA鑒定辯方:把辛普森至于300萬人群當(dāng)中,但新浦是是嫌疑犯,所以應(yīng)把他放在嫌疑犯這個人群中,那么樣本與他一致的也就他一個人第十三頁,共98頁。綜上,只有辛普森一個人符合三個條件第十四頁,共98頁。第7章假設(shè)檢驗(yàn)7.1假設(shè)檢驗(yàn)的基本問題7.2一個總體參數(shù)的檢驗(yàn)第十五頁,共98頁。學(xué)習(xí)目標(biāo)
1.理解假設(shè)檢驗(yàn)的基本思想和基本步驟;2.理解假設(shè)檢驗(yàn)的兩類錯誤及其關(guān)系;3.熟練掌握一個總體平均數(shù)、總體成數(shù)各種假設(shè)檢驗(yàn)方法;4.利用P-值進(jìn)行假設(shè)檢驗(yàn)。用Excel進(jìn)行檢驗(yàn)第十六頁,共98頁。假設(shè)檢驗(yàn)知識結(jié)構(gòu)總體參數(shù)檢驗(yàn)一個總體兩個總體均值比例方差均值差比例差方差比獨(dú)立樣本匹配樣本大樣本F檢驗(yàn)Z檢驗(yàn)大樣本小樣本Z檢驗(yàn)1222已知1222未知Z檢驗(yàn)t檢驗(yàn)大樣本小樣本Z檢驗(yàn)2已知Z檢驗(yàn)2未知t檢驗(yàn)Z檢驗(yàn)卡方檢驗(yàn)第十七頁,共98頁。7.1假設(shè)檢驗(yàn)的基本原理
7.1.1怎樣提出假設(shè)?
7.1.2怎樣做出決策?
7.1.3怎樣表述決策結(jié)果?第7章假設(shè)檢驗(yàn)第十八頁,共98頁。7.1.1怎樣提出假設(shè)?7.1假設(shè)檢驗(yàn)的基本原理第十九頁,共98頁。1.什么是假設(shè)?假設(shè):定義為一個調(diào)研者或管理者對被調(diào)查總體的某些特征所做的一種假定或猜想。是對總體參數(shù)的一種假設(shè)。常見的是對總體均值或比例和方差的檢驗(yàn);在分析之前,被檢驗(yàn)的參數(shù)將被假定取一確定值。我認(rèn)為到KFC消費(fèi)的人平均花費(fèi)2.5美元!第二十頁,共98頁。2、市場調(diào)研中常見的假設(shè)檢驗(yàn)問題一項(xiàng)跟蹤調(diào)查的結(jié)果表明,顧客對產(chǎn)品的了解程度比6個月前所做的類似調(diào)查中的顯示要低。結(jié)果是否明顯降低?是否低到需要改變廣告策略的程度?一位產(chǎn)品經(jīng)理認(rèn)為其產(chǎn)品購買者的平均年齡為35歲。為檢驗(yàn)其假設(shè),他進(jìn)行了一項(xiàng)調(diào)查,調(diào)查表明購買者平均年齡為38.5歲。調(diào)查結(jié)果與其觀點(diǎn)的差別是夠足以說明此經(jīng)理里的觀點(diǎn)是不正確的?第二十一頁,共98頁。3、問題在哪里?
某廣告商宣稱其代理的A產(chǎn)品的合格率達(dá)到99%,質(zhì)檢人員為了驗(yàn)證,隨機(jī)抽取了一件產(chǎn)品,發(fā)現(xiàn)是一件次品。質(zhì)檢人員會是什么反應(yīng)呢?第二十二頁,共98頁。什么是假設(shè)檢驗(yàn)?
(hypothesistest)先對總體的參數(shù)(或分布形式)提出某種假設(shè),然后利用樣本信息判斷假設(shè)是否成立的統(tǒng)計方法有參數(shù)檢驗(yàn)和非參數(shù)檢驗(yàn)邏輯上運(yùn)用反證法,統(tǒng)計上依據(jù)小概率原理小概率是在一次試驗(yàn)中,一個幾乎不可能發(fā)生的事件發(fā)生的概率在一次試驗(yàn)中小概率事件一旦發(fā)生,我們就有理由拒絕原假設(shè)第二十三頁,共98頁。原假設(shè)
(nullhypothesis)又稱“0假設(shè)”,研究者想收集證據(jù)予以反對的假設(shè),用H0表示所表達(dá)的含義總是指參數(shù)沒有變化或變量之間沒有關(guān)系最初被假設(shè)是成立的,之后根據(jù)樣本數(shù)據(jù)確定是否有足夠的證據(jù)拒絕它總是有符號,或H0:
=某一數(shù)值H0:
某一數(shù)值H0:
某一數(shù)值例如,H0:
10cmnull第二十四頁,共98頁。也稱“研究假設(shè)”,研究者想收集證據(jù)予以支持的假設(shè),用H1或Ha表示所表達(dá)的含義是總體參數(shù)發(fā)生了變化或變量之間有某種關(guān)系備擇假設(shè)通常用于表達(dá)研究者自己傾向于支持的看法,然后就是想辦法收集證據(jù)拒絕原假設(shè),以支持備擇假設(shè)
總是有符號,
或H1:
某一數(shù)值H1:
某一數(shù)值H1:<某一數(shù)值備擇假設(shè)(alternativehypothesis)第二十五頁,共98頁?!纠恳环N零件的生產(chǎn)標(biāo)準(zhǔn)是直徑應(yīng)為10cm,為對生產(chǎn)過程進(jìn)行控制,質(zhì)量監(jiān)測人員定期對一臺加工機(jī)床檢查,確定這臺機(jī)床生產(chǎn)的零件是否符合標(biāo)準(zhǔn)要求。如果零件的平均直徑大于或小于10cm,則表明生產(chǎn)過程不正常,必須進(jìn)行調(diào)整。試陳述用來檢驗(yàn)生產(chǎn)過程是否正常的原假設(shè)和被擇假設(shè)提出假設(shè)(例題分析)解:研究者想收集證據(jù)予以證明的假設(shè)應(yīng)該是“生產(chǎn)過程不正?!?。建立的原假設(shè)和備擇假設(shè)為
H0:
10cmH1:
10cm第二十六頁,共98頁?!纠磕称放葡礈靹┰谒漠a(chǎn)品說明書中聲稱:平均凈含量不少于500克。從消費(fèi)者的利益出發(fā),有關(guān)研究人員要通過抽檢其中的一批產(chǎn)品來驗(yàn)證該產(chǎn)品制造商的說明是否屬實(shí)。試陳述用于檢驗(yàn)的原假設(shè)與備擇假設(shè)提出假設(shè)(例題分析)解:研究者抽檢的意圖是傾向于證實(shí)這種洗滌劑的平均凈含量并不符合說明書中的陳述。建立的原假設(shè)和備擇假設(shè)為
H0:
500H1:
<500第二十七頁,共98頁?!纠恳患已芯繖C(jī)構(gòu)估計,某城市中家庭擁有汽車的比例超過30%。為驗(yàn)證這一估計是否正確,該研究機(jī)構(gòu)隨機(jī)抽取了一個樣本進(jìn)行檢驗(yàn)。試陳述用于檢驗(yàn)的原假設(shè)與備擇假設(shè)提出假設(shè)(例題分析)解:研究者想收集證據(jù)予以支持的假設(shè)是“該城市中家庭擁有汽車的比例超過30%”。建立的原假設(shè)和備擇假設(shè)為
H0:
30%H1:
30%第二十八頁,共98頁。提出假設(shè)總結(jié)H0:通常是將研究者不愿相信的、不認(rèn)可的、想拒絕的結(jié)論H0:
=某一數(shù)值H0:
某一數(shù)值H0:
某一數(shù)值H1:與原假設(shè)是對立的,通常是研究者想要支持的、愿意相信的結(jié)果H1:
某一數(shù)值H1:
某一數(shù)值H1:<某一數(shù)值先確定備擇假設(shè),再確定原假設(shè)原假設(shè)和備擇假設(shè)必有一個成立,而且只有一個成立
等號只能出現(xiàn)在原假設(shè)里因研究目的不同,對同一問題可能提出不同的假設(shè)(也可能得出不同的結(jié)論)第二十九頁,共98頁。備擇假設(shè)沒有特定的方向性,并含有符號“”的假設(shè)檢驗(yàn),稱為雙側(cè)檢驗(yàn)或雙尾檢驗(yàn)(two-tailedtest)備擇假設(shè)具有特定的方向性,并含有符號“>”或“<”的假設(shè)檢驗(yàn),稱為單側(cè)檢驗(yàn)或單尾檢驗(yàn)(one-tailedtest)備擇假設(shè)的方向?yàn)椤?lt;”,稱為左側(cè)檢驗(yàn)
備擇假設(shè)的方向?yàn)椤?gt;”,稱為右側(cè)檢驗(yàn)
雙側(cè)檢驗(yàn)與單側(cè)檢驗(yàn)第三十頁,共98頁。雙側(cè)檢驗(yàn)與單側(cè)檢驗(yàn)
(假設(shè)的形式)假設(shè)雙側(cè)檢驗(yàn)單側(cè)檢驗(yàn)左側(cè)檢驗(yàn)右側(cè)檢驗(yàn)原假設(shè)H0:m
=m0H0:m
m0H0:m
m0備擇假設(shè)H1:m
≠m0H1:m
<m0H1:m
>m0以總體均值的檢驗(yàn)為例第三十一頁,共98頁。7.1.2怎樣做出決策?7.1假設(shè)檢驗(yàn)的基本原理第三十二頁,共98頁。假設(shè)檢驗(yàn)的步驟1.提出原假設(shè)H0和備擇假設(shè)H12.構(gòu)造適當(dāng)?shù)臋z驗(yàn)統(tǒng)計量3.給定顯著性水平
0.01,0.05,0.104.計算檢驗(yàn)統(tǒng)計量的值5.做出判斷第三十三頁,共98頁。假設(shè)檢驗(yàn)的基本思想...
因此我們拒絕假設(shè)
=50...
如果這是總體的假設(shè)均值樣本均值m
=50抽樣分布H0這個值不像我們應(yīng)該得到的樣本均值...20第三十四頁,共98頁。兩類錯誤與顯著性水平(了解)研究者總是希望能做出正確的決策,但由于決策是建立在樣本信息的基礎(chǔ)之上,而樣本又是隨機(jī)的,因而就有可能犯錯誤原假設(shè)和備擇假設(shè)不能同時成立,決策的結(jié)果要么拒絕H0,要么不拒絕H0。決策時總是希望當(dāng)原假設(shè)正確時沒有拒絕它,當(dāng)原假設(shè)不正確時拒絕它,但實(shí)際上很難保證不犯錯誤第Ⅰ類錯誤(錯誤)原假設(shè)為正確時拒絕原假設(shè)第Ⅰ類錯誤的概率記為,被稱為顯著性水平2. 第Ⅱ類錯誤(錯誤)原假設(shè)為錯誤時未拒絕原假設(shè)第Ⅱ類錯誤的概率記為(Beta)第三十五頁,共98頁。顯著性水平
(significantlevel)事先確定的用于拒絕原假設(shè)H0時所必須的證據(jù)能夠容忍的犯第Ⅰ類錯誤的最大概率(上限值)2. 原假設(shè)為真時,拒絕原假設(shè)的概率抽樣分布的拒絕域3. 表示為(alpha)
常用的值有0.01,0.05,0.104. 由研究者事先確定第三十六頁,共98頁。錯誤和錯誤的關(guān)系你不能同時減少兩類錯誤!和的關(guān)系就像翹翹板,小就大,大就小第三十七頁,共98頁。依據(jù)什么做出決策?若假設(shè)為H0=500,H1<500。樣本均值為495,拒絕H0嗎?樣本均值為502,拒絕H0嗎?做出拒絕或不拒絕原假設(shè)的依據(jù)是什么?傳統(tǒng)上,做出決策所依據(jù)的是樣本統(tǒng)計量,現(xiàn)代檢驗(yàn)中人們直接使用由統(tǒng)計量算出的犯第Ⅰ類錯誤的概率,即所謂的P值第三十八頁,共98頁。根據(jù)樣本觀測結(jié)果計算出對原假設(shè)和備擇假設(shè)做出決策某個樣本統(tǒng)計量對樣本估計量的標(biāo)準(zhǔn)化結(jié)果原假設(shè)H0為真點(diǎn)估計量的抽樣分布
檢驗(yàn)統(tǒng)計量(teststatistic)標(biāo)準(zhǔn)化的檢驗(yàn)統(tǒng)計量第三十九頁,共98頁。用統(tǒng)計量決策
(雙側(cè)檢驗(yàn))H1:m
≠m0,I統(tǒng)計量I>臨界值,拒絕H0
抽樣分布H0臨界值臨界值a/2a/2拒絕H0拒絕H01-置信水平RegionofRejectionRegionofNonrejectionRegionofRejection第四十頁,共98頁。用統(tǒng)計量決策
(左側(cè)檢驗(yàn))H1:m
<m0,統(tǒng)計量<-臨界值,拒絕H0抽樣分布H0臨界值a拒絕H01-置信水平RegionofRejectionRegionofNonrejection第四十一頁,共98頁。用統(tǒng)計量決策
(右側(cè)檢驗(yàn))H1:m
>m0,統(tǒng)計量>臨界值,拒絕H0
抽樣分布H0臨界值
拒絕H01-置信水平RegionofNonrejectionRegionofRejectiona第四十二頁,共98頁。統(tǒng)計量決策規(guī)則給定顯著性水平,查表得出相應(yīng)的臨界值z或z/2,t或t/2將檢驗(yàn)統(tǒng)計量的值與水平的臨界值進(jìn)行比較作出決策雙側(cè)檢驗(yàn):H1:m
≠m0,I統(tǒng)計量I>臨界值,拒絕H0,3>1.96,拒絕左側(cè)檢驗(yàn):H1:m
<m0,統(tǒng)計量<-臨界值,拒絕H0,-3<-1.96,拒絕右側(cè)檢驗(yàn):H1:m
>m0,統(tǒng)計量>臨界值,拒絕H0,3>1.96,拒絕當(dāng)單側(cè)檢驗(yàn)時,只要統(tǒng)計量與z或
t大小比較方向與備擇假設(shè)符合一致時,拒絕不過,總而言之,無論是哪一種檢驗(yàn)形式,只要I統(tǒng)計量I>臨界值,拒絕H0第四十三頁,共98頁。用P值決策軟件操作中的sig.即為P值
(P-value)如果原假設(shè)為真,所得到的樣本結(jié)果會像實(shí)際觀測結(jié)果那么極端或更極端的概率,也就是我們拒絕原假設(shè)面臨的風(fēng)險P值告訴我們:如果原假設(shè)是正確的話,我們得到得到目前這個樣本數(shù)據(jù)的可能性有多大,如果這個可能性很小,就應(yīng)該拒絕原假設(shè)被稱為觀察到的(或?qū)崪y的)顯著性水平?jīng)Q策規(guī)則:若p值<,拒絕H0,即是說,拒絕原假設(shè)犯棄真錯誤的風(fēng)險比事先假定的風(fēng)險還小,所以拒絕原假設(shè)也無妨。第四十四頁,共98頁。雙側(cè)檢驗(yàn)的P值/
2/
2Z拒絕H0拒絕H00臨界值計算出的樣本統(tǒng)計量計算出的樣本統(tǒng)計量臨界值1/2P值1/2P值第四十五頁,共98頁。左側(cè)檢驗(yàn)的P值Z拒絕H00臨界值計算出的樣本統(tǒng)計量1/2P值第四十六頁,共98頁。右側(cè)檢驗(yàn)的P值Z拒絕H00計算出的樣本統(tǒng)計量臨界值1/2P值第四十七頁,共98頁。用P值進(jìn)行檢驗(yàn)比根據(jù)統(tǒng)計量檢驗(yàn)提供更多的信息統(tǒng)計量檢驗(yàn)是我們事先給出的一個顯著性水平,以此為標(biāo)準(zhǔn)進(jìn)行決策,無法知道實(shí)際的顯著性水平究竟是多少比如,根據(jù)統(tǒng)計量進(jìn)行檢驗(yàn)時,只要統(tǒng)計量的值落在拒絕域,我們拒絕原假設(shè)得出的結(jié)論都是一樣的,即結(jié)果顯著。但實(shí)際上,統(tǒng)計量落在拒絕域不同的地方,實(shí)際的顯著性是不同的。比如,統(tǒng)計量落在臨界值附近與落在遠(yuǎn)離臨界值的地方,實(shí)際的顯著性就有較大差異。而P值給出的是實(shí)際算出的顯著水平,它告訴我們實(shí)際的顯著性水平是多少P值決策與統(tǒng)計量的比較第四十八頁,共98頁。拒絕H0P值決策與統(tǒng)計量的比較拒絕H0的兩個統(tǒng)計量的不同顯著性Z拒絕H00統(tǒng)計量1
P1
值統(tǒng)計量2
P2
值拒絕H0臨界值第四十九頁,共98頁。7.1.3怎樣表述決策結(jié)果?7.1假設(shè)檢驗(yàn)的基本原理第五十頁,共98頁。假設(shè)檢驗(yàn)不能證明原假設(shè)正確假設(shè)檢驗(yàn)的目的主要是收集證據(jù)拒絕原假設(shè),而支持你所傾向的備擇假設(shè)假設(shè)檢驗(yàn)只提供不利于原假設(shè)的證據(jù)。因此,當(dāng)拒絕原假設(shè)時,表明樣本提供的證據(jù)證明它是錯誤的,當(dāng)沒有拒絕原假設(shè)時,我們也沒法證明它是正確的,因?yàn)榧僭O(shè)檢驗(yàn)的程序沒有提供它正確的證據(jù)這與法庭上對被告的定罪類似:先假定被告是無罪的,直到你有足夠的證據(jù)證明他是有罪的,否則法庭就不能認(rèn)定被告有罪。當(dāng)證據(jù)不足時,法庭的裁決是“被告無罪”,但這里也沒有證明被告就是清白的第五十一頁,共98頁。假設(shè)檢驗(yàn)不能證明原假設(shè)正確假設(shè)檢驗(yàn)得出的結(jié)論都是根據(jù)原假設(shè)進(jìn)行闡述的我們要么拒絕原假設(shè),要么不拒絕原假設(shè)當(dāng)不能拒絕原假設(shè)時,我們也從來不說“接受原假設(shè)”,因?yàn)闆]有證明原假設(shè)是真的采用“接受”原假設(shè)的說法,則意味著你證明了原假設(shè)是正確的沒有足夠的證據(jù)拒絕原假設(shè)并不等于你已經(jīng)“證明”了原假設(shè)是真的,它僅僅意為著目前還沒有足夠的證據(jù)拒絕原假設(shè),只表示手頭上這個樣本提供的證據(jù)還不足以拒絕原假設(shè)比如,在例6.2中,如果拒絕原假設(shè),表明樣本提供的證據(jù)證明該品牌洗滌劑的凈含量與說明書所標(biāo)識的不相符。如果不拒絕原假設(shè),只能說這個樣本提供的證據(jù)還不足證明凈含量不是500克或500克以上,并不等于證明了凈含量就超過了500克“不拒絕”的表述方式實(shí)際上意味著沒有得出明確的結(jié)論第五十二頁,共98頁。假設(shè)檢驗(yàn)不能證明原假設(shè)正確“接受”的說法有時會產(chǎn)生誤導(dǎo)這種說法似乎暗示著原假設(shè)已經(jīng)被證明是正確的了實(shí)事上,H0的真實(shí)值我們永遠(yuǎn)也無法知道,不知道真實(shí)值是什么,又怎么能證明它是什么?H0只是對總體真實(shí)值的一個假定值,由樣本提供的信息也就自然無法證明它是否正確采用“不拒絕”的表述方法更合理一些,因?yàn)檫@種表述意味著樣本提供的證據(jù)不夠強(qiáng)大,因而沒有足夠的理由拒絕,這不等于已經(jīng)證明原假設(shè)正確第五十三頁,共98頁。假設(shè)檢驗(yàn)不能證明原假設(shè)正確【例】比如原假設(shè)為H0:=10,從該總體中抽出一個隨機(jī)樣本,得到x=9.8,在=0.05的水平上,樣本提供的證據(jù)沒有推翻這一假設(shè),我們說“接受”原假設(shè),這意為著樣本提供的證據(jù)已經(jīng)證明=10是正確的。如果我們將原假設(shè)改為H0:=10.5,同樣,在=0.05的水平上,樣本提供的證據(jù)也沒有推翻這一假設(shè),我們又說“接受”原假設(shè)。但這兩個原假設(shè)究竟哪一個是“真實(shí)的”呢?其人弗能應(yīng)也第五十四頁,共98頁。假設(shè)檢驗(yàn)不能證明原假設(shè)正確假設(shè)檢驗(yàn)中通常是先確定顯著性水平,這就等于控制了第Ι類錯誤的概率,但犯第Ⅱ類錯誤的概率卻是不確定的在拒絕H0時,犯第Ⅰ類錯誤的概率不超過給定的顯著性水平,當(dāng)樣本結(jié)果顯示沒有充分理由拒絕原假設(shè)時,也難以確切知道第Ⅱ類錯誤發(fā)生的概率采用“不拒絕”而不采用“接受”的表述方式,在多數(shù)場合下便避免了錯誤發(fā)生的風(fēng)險因?yàn)椤敖邮堋彼媒Y(jié)論可靠性將由第Ⅱ類錯誤的概率來測量,而的控制又相對復(fù)雜,有時甚至根本無法知道的值,除非你能確切給出,否則就不宜表述成“接受”原假設(shè)第五十五頁,共98頁。假設(shè)檢驗(yàn)不能證明原假設(shè)正確在實(shí)際檢驗(yàn)中,針對一個具體的問題,將檢驗(yàn)結(jié)果表述為“不拒絕”原假設(shè),這似乎讓人感到無所是從比如,你想購買一批產(chǎn)品,檢驗(yàn)的結(jié)果沒有拒絕原假設(shè),即達(dá)到合同規(guī)定的標(biāo)準(zhǔn)要求,你是否購買這批產(chǎn)品呢?這時,你可以對檢驗(yàn)的結(jié)果采取某種默認(rèn)態(tài)度,退一步說,你可以將檢驗(yàn)結(jié)果表述為“可以接受”原假設(shè),你但這并不等于說你“確實(shí)接受”它第五十六頁,共98頁。統(tǒng)計上顯著不一定有實(shí)際意義當(dāng)拒絕原假設(shè)時,我們稱樣本結(jié)果是統(tǒng)計上顯著的(statisticallySignificant)當(dāng)不拒絕原假設(shè)時,我們稱樣本結(jié)果是統(tǒng)計上不顯著的在“顯著”和“不顯著”之間沒有清除的界限,只是在P值越來越小時,我們就有越來越強(qiáng)的證據(jù),檢驗(yàn)的結(jié)果也就越來越顯著第五十七頁,共98頁?!帮@著的”(Significant)一詞的意義在這里并不是“重要的”,而是指“非偶然的”一項(xiàng)檢驗(yàn)在統(tǒng)計上是“顯著的”,意思是指:這樣的(樣本)結(jié)果不是偶然得到的,或者說,不是靠機(jī)遇能夠得到的如果得到這樣的樣本概率(P)很小,則拒絕原假設(shè)在這么小的概率下竟然得到了這樣的一個樣本,表明這樣的樣本經(jīng)常出現(xiàn),所以,樣本結(jié)果是顯著的統(tǒng)計上顯著不一定有實(shí)際意義第五十八頁,共98頁。統(tǒng)計上顯著不一定有實(shí)際意義在進(jìn)行決策時,我們只能說P值越小,拒絕原假設(shè)的證據(jù)就越強(qiáng),檢驗(yàn)的結(jié)果也就越顯著但P值很小而拒絕原假設(shè)時,并不一定意味著檢驗(yàn)的結(jié)果就有實(shí)際意義因?yàn)榧僭O(shè)檢驗(yàn)中所說的“顯著”僅僅是“統(tǒng)計意義上的顯著”一個在統(tǒng)計上顯著的結(jié)論在實(shí)際中卻不見得就很重要,也不意味著就有實(shí)際意義因?yàn)橹蹬c樣本的大小密切相關(guān),樣本量越大,檢驗(yàn)統(tǒng)計量的P值也就越大,P值就越小,就越有可能拒絕原假設(shè)第五十九頁,共98頁。統(tǒng)計上顯著不一定有實(shí)際意義如果你主觀上要想拒絕原假設(shè)那就一定能拒絕它這類似于我們通常所說的“欲加之罪,何患無詞”只要你無限制擴(kuò)大樣本量,幾乎總能拒絕原假設(shè)當(dāng)樣本量很大時,解釋假設(shè)檢驗(yàn)的結(jié)果需要小心在大樣本情況下,總能把與假設(shè)值的任何細(xì)微差別都能查出來,即使這種差別幾乎沒有任何實(shí)際意義在實(shí)際檢驗(yàn)中,不要刻意追求“統(tǒng)計上的”顯著性,也不要把統(tǒng)計上的顯著性與實(shí)際意義上的顯著性混同起來一個在統(tǒng)計上顯著的結(jié)論在實(shí)際中卻不見得很重要,也不意為著就有實(shí)際意義第六十頁,共98頁。7.2.1總體均值的檢驗(yàn)
(大樣本)7.2一個總體參數(shù)的檢驗(yàn)第六十一頁,共98頁??傮w均值的檢驗(yàn)
(大樣本)1. 假定條件大樣本(n30)使用z檢驗(yàn)統(tǒng)計量2
已知:2
未知:第六十二頁,共98頁??傮w均值的檢驗(yàn)(2已知),P164第1題相似
(例題分析—大樣本)【例】一種罐裝飲料采用自動生產(chǎn)線生產(chǎn),每罐的容量是255ml,標(biāo)準(zhǔn)差為5ml。為檢驗(yàn)每罐容量是否符合要求,質(zhì)檢人員在某天生產(chǎn)的飲料中隨機(jī)抽取了40罐進(jìn)行檢驗(yàn),測得每罐平均容量為255.8ml。取顯著性水平=0.05,檢驗(yàn)該天生產(chǎn)的飲料容量是否符合標(biāo)準(zhǔn)要求?雙側(cè)檢驗(yàn)第六十三頁,共98頁。假設(shè)檢驗(yàn)的步驟1.提出原假設(shè)H0和備擇假設(shè)H12.給定顯著性水平
0.01,0.05,0.10,查表求臨界值3.構(gòu)造適當(dāng)?shù)臋z驗(yàn)統(tǒng)計量4.計算檢驗(yàn)統(tǒng)計量的值并于臨界值進(jìn)行比較5.做出判斷|統(tǒng)計兩|>臨界值,拒絕原假設(shè),說明在統(tǒng)計上是顯著的第六十四頁,共98頁??傮w均值的檢驗(yàn)(2
已知)
(例題分析-大樣本)H0
:
=255H1
:
255
=
0.05n
=40臨界值(c):檢驗(yàn)統(tǒng)計量:決策:結(jié)論:不拒絕原假設(shè)
用Excel中的【NORMSDIST】函數(shù)得到的雙尾檢驗(yàn)P=0.312945不拒絕H0沒有證據(jù)表明該天生產(chǎn)的飲料不符合標(biāo)準(zhǔn)要求
z01.96-1.960.005拒絕
H0拒絕H00.005第六十五頁,共98頁??傮w均值的檢驗(yàn)(z檢驗(yàn))
(P值的計算與應(yīng)用)第1步:進(jìn)入Excel表格界面,直接點(diǎn)擊【fx】第2步:在函數(shù)分類中點(diǎn)擊【統(tǒng)計】,并在函數(shù)名菜單下選擇【NORMSDIST】,然后【確定】第3步:將z的絕對值1.01錄入,得到的函數(shù)值為
0.843752345
P值=2(1-0.843752345)=0.312495
P值遠(yuǎn)遠(yuǎn)大于,故不拒絕H0第六十六頁,共98頁??傮w均值的檢驗(yàn)(2
未知)
(例題分析—大樣本)【例】一種機(jī)床加工的零件尺寸絕對平均誤差為1.35mm。生產(chǎn)廠家現(xiàn)采用一種新的機(jī)床進(jìn)行加工以期進(jìn)一步降低誤差。為檢驗(yàn)新機(jī)床加工的零件平均誤差與舊機(jī)床相比是否有顯著降低,從某天生產(chǎn)的零件中隨機(jī)抽取50個進(jìn)行檢驗(yàn)。利用這些樣本數(shù)據(jù),檢驗(yàn)新機(jī)床加工的零件尺寸的平均誤差與舊機(jī)床相比是否有顯著降低?(=0.01)樣本均值為1.3152左側(cè)檢驗(yàn)50個零件尺寸的誤差數(shù)據(jù)(mm)1.261.191.310.971.811.130.961.061.000.940.981.101.121.031.161.121.120.951.021.131.230.741.500.500.590.991.451.241.012.031.981.970.911.221.061.111.541.081.101.641.702.371.381.601.261.171.121.230.820.86第六十七頁,共98頁??傮w均值的檢驗(yàn)
(例題分析—大樣本)H0
:
1.35H1
:
<1.35=0.01n
=50臨界值(c):檢驗(yàn)統(tǒng)計量:-2.6061<-1.96,于是拒絕H0新機(jī)床加工的零件尺寸的平均誤差與舊機(jī)床相比有顯著降低決策:結(jié)論:-2.33z0拒絕H00.01第六十八頁,共98頁??傮w均值的檢驗(yàn)
(P值的計算與應(yīng)用—大樣本)第1步:進(jìn)入Excel表格界面,直接點(diǎn)擊【f(x)】第2步:在函數(shù)分類中點(diǎn)擊【統(tǒng)計】,并在函數(shù)名的菜單下選擇【ZTEST】,然后【確定】第3步:在所出現(xiàn)的對話框【Array】框中,輸入原始數(shù)據(jù)所
在區(qū)域;在【X】后輸入?yún)?shù)的某一假定值(這里為
1.35);在【Sigma】后輸入已知的總體標(biāo)準(zhǔn)差(若總體標(biāo)準(zhǔn)差未知則可忽略不填,系統(tǒng)將自動使用樣本標(biāo)準(zhǔn)差代替)第4步:用1減去得到的函數(shù)值0.995421023
即為P值
P值=1-0.995421023=0.004579
P值<=0.01,拒絕H0用Excel計算P值第六十九頁,共98頁??傮w均值的檢驗(yàn)
(P值的圖示)計算出的樣本統(tǒng)計量=2.6061P=0.004579
Z拒絕H00臨界值P值第七十頁,共98頁??傮w均值的檢驗(yàn)(2
未知)
(例題分析)【例】某一小麥品種的平均產(chǎn)量為5200kg/hm2
。一家研究機(jī)構(gòu)對小麥品種進(jìn)行了改良以期提高產(chǎn)量。為檢驗(yàn)改良后的新品種產(chǎn)量是否有顯著提高,隨機(jī)抽取了36個地塊進(jìn)行試種,得到的樣本平均產(chǎn)量為5275kg/hm2,標(biāo)準(zhǔn)差為120/hm2
。試檢驗(yàn)改良后的新品種產(chǎn)量是否有顯著提高?(=0.05)
右側(cè)檢驗(yàn)第七十一頁,共98頁??傮w均值的檢驗(yàn)(2
未知)
(例題分析)H0
:
5200H1
:
>5200=0.05n
=36臨界值(c):檢驗(yàn)統(tǒng)計量:拒絕H0因?yàn)?.75>1.65,或者(P=0.000088<
=0.05)改良后的新品種產(chǎn)量有顯著提高決策:結(jié)論:z0拒絕H00.051.645第七十二頁,共98頁??傮w均值的檢驗(yàn)(z檢驗(yàn))
(P值的圖示)抽樣分布P=0.000088
01.645a=0.05拒絕H01-計算出的樣本統(tǒng)計量=3.75P值第七十三頁,共98頁。總體均值的檢驗(yàn)
(小樣本)1. 假定條件總體服從正態(tài)分布小樣本(n<
30)檢驗(yàn)統(tǒng)計量2
已知:2
未知:第七十四頁,共98頁。[例7-2]某市歷年來對7歲男孩的統(tǒng)計資料表明,他們的身高服從均值為1.32米、標(biāo)準(zhǔn)差為0.12米的正態(tài)分布?,F(xiàn)從各個學(xué)校隨機(jī)抽取25個7歲男學(xué)生,測得他們平均身高1.36米,若已知今年全市7歲男孩身高的標(biāo)準(zhǔn)差仍為0.12米,問與歷年7歲男孩的身高相比是否有顯著差異(取=0.05)。
解:從題意可知,=1.36米,=1.32米,=0.12米。
(1)建立假設(shè):H0:=1.32,
H1:1.32
(2)確定統(tǒng)計量:
方差已知第七十五頁,共98頁。
(3)Z的分布:Z~N(0,1)
(4)對給定的=0.05確定臨界值。因?yàn)槭请p側(cè)備擇假設(shè)所以查表時要注意。因概率表是按雙側(cè)排列的,所以應(yīng)查1-0.05=0.95的值,查得臨界值=1.96。
(5)檢驗(yàn)準(zhǔn)則。|Z|<1.96,接受H0,反之,拒絕H0。
(6)決策:因Z=1.67<1.96;落在了接受域,因此認(rèn)為今年7歲男孩平均身高與歷年7歲男孩平均身高無顯著差異,即不能拒絕零假設(shè)。
第七十六頁,共98頁。總體均值的檢驗(yàn)
(例題分析—小樣本)【例】一種汽車配件的平均長度要求為12cm,高于或低于該標(biāo)準(zhǔn)均被認(rèn)為是不合格的。汽車生產(chǎn)企業(yè)在購進(jìn)配件時,通常是經(jīng)過招標(biāo),然后對中標(biāo)的配件提供商提供的樣品進(jìn)行檢驗(yàn),以決定是否購進(jìn)。現(xiàn)對一個配件提供商提供的10個樣本進(jìn)行了檢驗(yàn)。假定該供貨商生產(chǎn)的配件長度服從正態(tài)分布,在0.05的顯著性水平下,檢驗(yàn)該供貨商提供的配件是否符合要求?
10個零件尺寸的長度(cm)12.210.812.011.811.912.411.312.212.012.3第七十七頁,共98頁。總體均值的檢驗(yàn)
(例題分析—小樣本)H0
:
=12H1
:
12
=0.05df=10-1=9臨界值(c):檢驗(yàn)統(tǒng)計量:不拒絕H0沒有證據(jù)表明該供貨商提供的零件不符合要求
決策:結(jié)論:t02.262-2.2620.025拒絕
H0拒絕H00.025第七十八頁,共98頁??傮w均值的檢驗(yàn)
(P值的計算與應(yīng)用-t
檢驗(yàn))第1步:進(jìn)入Excel表格界面,直接點(diǎn)擊【fx】第2步:在函數(shù)分類中點(diǎn)擊【統(tǒng)計】,并在函數(shù)名的菜單下選擇【TDIST】,然后【確定】第3步:在出現(xiàn)對話框的【X】欄中輸入計算出的t的絕對值0.7035,在【Deg-freedom】(自由度)欄中輸入本例的自由度9,在【Tails】欄中輸入2(表明是雙側(cè)檢驗(yàn),如果是單測檢驗(yàn)則在該欄輸入1)第4步:P值=0.499537958
P值>=0.05,故不拒絕H0
第七十九頁,共98頁。一個總體均值的檢驗(yàn)
(作出判斷)是否已知小樣本量n大是否已知否
t檢驗(yàn)否z檢驗(yàn)是z檢驗(yàn)
是z檢驗(yàn)第八十頁,共98頁。7.2.1總體比例的檢驗(yàn)7.3一個總體參數(shù)的檢驗(yàn)第八十一頁,共98頁??傮w比例檢驗(yàn)假定條件總體服從二項(xiàng)分布可用正態(tài)分布來近似(大樣本)檢驗(yàn)的z統(tǒng)計量0為假設(shè)的總體比例第八十二頁,共98頁??傮w比例的檢驗(yàn)
(例題分析)【例】一種以休閑和娛樂為主題的雜志,聲稱其讀者群中有80%為女性。為驗(yàn)證這一說法是否屬實(shí),某研究部門抽取了由200人組成的一個隨機(jī)樣本,發(fā)現(xiàn)有146個女性經(jīng)常閱讀該雜志。分別取顯著性水平
=0.05和=0.01
,檢驗(yàn)該雜志讀者群中女性的比例是否為80%?它們的P值各是多少?第八十三頁,共98頁??傮w比例的檢驗(yàn)
(例題分析)H0
:
=80%H1
:
80%
=0.05n
=200臨界值(c):檢驗(yàn)統(tǒng)計量:拒絕H0(P=0.013328<
=0.05)該雜志的說法并不屬實(shí)
決策:結(jié)論:z01.96-1.960.025拒絕
H0拒絕
H00.025第八十四頁,共98頁??傮w比例的檢驗(yàn)
(例題分析)H0
:
=80%H1
:
80%=0.01n
=200臨界值(c):檢驗(yàn)統(tǒng)計量:不拒絕H0(P=0.013328>=0.01)沒有證據(jù)表明“該雜志聲稱讀者群中有80%為女性”的看法不正確
決策:結(jié)論:z02.58-2.580.005拒絕H0拒絕H00.005第八十五頁,共98頁。
[例7-7]某企業(yè)的產(chǎn)品暢銷國內(nèi)市場。據(jù)以往調(diào)查,購買該產(chǎn)品的顧客有50%是30歲以上的男子。該企業(yè)負(fù)責(zé)人關(guān)心這個比例是否發(fā)生了變化,而無論是增加還是減少。于是,該企業(yè)委托了一家咨詢機(jī)構(gòu)進(jìn)行調(diào)查,這家咨詢機(jī)構(gòu)從眾多的購買者中隨機(jī)抽選了400名進(jìn)行調(diào)查,結(jié)果有210名為30歲以上的男子。該廠負(fù)責(zé)人希望在顯著性水平0.05下檢驗(yàn)“50%的顧客是30歲以上的男子”這個假設(shè)。
解:(1)建立假設(shè)
由題意可知,這是雙側(cè)檢驗(yàn),故建立假設(shè)H0:=50%.
H1:50%
第八十六頁,共98頁。(2)計算統(tǒng)計量
由于樣本容量=400>30,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年版人防工程施工合作合同版B版
- 2025年度企業(yè)健康管理與職工福利合同3篇
- 2024年簡約室內(nèi)裝潢協(xié)議
- 2024年標(biāo)準(zhǔn)企業(yè)車輛租賃合同模板一
- 2024年長途客運(yùn)與貨運(yùn)聯(lián)運(yùn)合同3篇
- 企業(yè)信息安全5篇范例
- 2024年車位買賣與租賃的綜合合同
- 2024薪資保密制度與員工職業(yè)發(fā)展及培訓(xùn)計劃合同3篇
- 榆林職業(yè)技術(shù)學(xué)院《JavaEE編程技術(shù)》2023-2024學(xué)年第一學(xué)期期末試卷
- 華南理工大學(xué)《機(jī)器人傳感器及其信息融合技術(shù)》2023-2024學(xué)年第一學(xué)期期末試卷
- 水閘閘門運(yùn)行方案
- 消費(fèi)型股東招募計劃書
- 二年級上冊豎式計算200題附答案
- 統(tǒng)編版三年級語文下冊 第五單元 大單元教學(xué)設(shè)計
- 申請拘留被執(zhí)行人的文件
- 國網(wǎng)企業(yè)文化
- 鋼結(jié)構(gòu)加固教學(xué)課件
- 防止交叉感染的護(hù)理措施和策略
- 皮帶輸送機(jī)安全培訓(xùn)
- 食品進(jìn)駐超市的談判計劃書
- 物資到貨驗(yàn)收流程與規(guī)范培訓(xùn)課件
評論
0/150
提交評論