第三講假設(shè)檢驗(yàn)_第1頁(yè)
第三講假設(shè)檢驗(yàn)_第2頁(yè)
第三講假設(shè)檢驗(yàn)_第3頁(yè)
第三講假設(shè)檢驗(yàn)_第4頁(yè)
第三講假設(shè)檢驗(yàn)_第5頁(yè)
已閱讀5頁(yè),還剩137頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第三講假設(shè)檢驗(yàn)第1頁(yè),共142頁(yè),2023年,2月20日,星期三統(tǒng)計(jì)應(yīng)用

藥物篩選中的假設(shè)檢驗(yàn)

制藥公司開(kāi)發(fā)研制新的藥物時(shí),藥物篩選成為需面臨的一個(gè)極其重要的決策問(wèn)題統(tǒng)計(jì)學(xué)是對(duì)藥物篩選技術(shù)做出了巨大貢獻(xiàn)的學(xué)科之一。藥物篩選過(guò)程中有兩種可能的行為“拒絕”開(kāi)發(fā)的新藥,這意味著所檢驗(yàn)的藥物無(wú)效或只有微弱的效果。此時(shí)采取的行動(dòng)就是將該藥物廢棄暫時(shí)”接受”開(kāi)發(fā)的新藥,此時(shí)需要采取的行動(dòng)是對(duì)該藥物進(jìn)行進(jìn)一步的細(xì)致試驗(yàn)根據(jù)兩種可能出現(xiàn)的研究結(jié)果,人們提出了如下相應(yīng)的假設(shè)形式H0:新藥對(duì)治療某種特定疾病無(wú)效(或效果微弱)H1:新藥對(duì)治療某種特定疾病有效第2頁(yè),共142頁(yè),2023年,2月20日,星期三第三講假設(shè)檢驗(yàn)3.1

假設(shè)檢驗(yàn)的基本問(wèn)題3.2

一個(gè)總體參數(shù)的檢驗(yàn)3.3

兩個(gè)總體參數(shù)的檢驗(yàn)第3頁(yè),共142頁(yè),2023年,2月20日,星期三假設(shè)檢驗(yàn)在統(tǒng)計(jì)方法中的地位統(tǒng)計(jì)方法描述統(tǒng)計(jì)推斷統(tǒng)計(jì)參數(shù)估計(jì)假設(shè)檢驗(yàn)第4頁(yè),共142頁(yè),2023年,2月20日,星期三學(xué)習(xí)目標(biāo)假設(shè)檢驗(yàn)的基本思想和原理假設(shè)檢驗(yàn)的步驟一個(gè)總體參數(shù)的檢驗(yàn)兩個(gè)總體參數(shù)的檢驗(yàn)P值的計(jì)算與應(yīng)用用Excel進(jìn)行檢驗(yàn)第5頁(yè),共142頁(yè),2023年,2月20日,星期三3.1假設(shè)檢驗(yàn)的基本問(wèn)題3.1.1假設(shè)的陳述3.1.2兩類錯(cuò)誤與顯著性水平3.1.3統(tǒng)計(jì)量與拒絕域3.1.4利用P值進(jìn)行決策3.1.5統(tǒng)計(jì)顯著性與實(shí)際顯著性第6頁(yè),共142頁(yè),2023年,2月20日,星期三假設(shè)的陳述第7頁(yè),共142頁(yè),2023年,2月20日,星期三什么是假設(shè)?

(hypothesis)對(duì)總體參數(shù)的具體數(shù)值所作的陳述總體參數(shù)包括總體均值、比例、方差等分析之前必須陳述我認(rèn)為這種新藥的療效比原有的藥物更有效!第8頁(yè),共142頁(yè),2023年,2月20日,星期三什么是假設(shè)檢驗(yàn)?

(hypothesistest)先對(duì)總體的參數(shù)(或分布形式)提出某種假設(shè),然后利用樣本信息判斷假設(shè)是否成立的過(guò)程有參數(shù)檢驗(yàn)和非參數(shù)檢驗(yàn)邏輯上運(yùn)用反證法,統(tǒng)計(jì)上依據(jù)小概率原理第9頁(yè),共142頁(yè),2023年,2月20日,星期三假設(shè)檢驗(yàn)的基本思想...因此我們拒絕假設(shè)

=50...如果這是總體的假設(shè)均值樣本均值m

=50抽樣分布H0這個(gè)值不像我們應(yīng)該得到的樣本均值...20第10頁(yè),共142頁(yè),2023年,2月20日,星期三總體假設(shè)檢驗(yàn)的過(guò)程抽取隨機(jī)樣本均值

x

=20我認(rèn)為人口的平均年齡是50歲提出假設(shè)拒絕假設(shè)別無(wú)選擇!作出決策第11頁(yè),共142頁(yè),2023年,2月20日,星期三原假設(shè)與備擇假設(shè)第12頁(yè),共142頁(yè),2023年,2月20日,星期三原假設(shè)

(nullhypothesis)研究者想收集證據(jù)予以反對(duì)的假設(shè)又稱“0假設(shè)”總是有符號(hào),或4. 表示為H0H0:

=某一數(shù)值指定為符號(hào)=,或例如,H0:

10cmnull第13頁(yè),共142頁(yè),2023年,2月20日,星期三為什么叫0假設(shè)?之所以用零來(lái)修飾原假設(shè),其原因是原假設(shè)的內(nèi)容總是表示沒(méi)有差異或沒(méi)有改變,或變量間沒(méi)有關(guān)系等等零假設(shè)總是一個(gè)與總體參數(shù)有關(guān)的問(wèn)題,所以總是用希臘字母表示。關(guān)于樣本統(tǒng)計(jì)量如樣本均值或樣本均值之差的零假設(shè)是沒(méi)有意義的,因?yàn)闃颖窘y(tǒng)計(jì)量是已知的,當(dāng)然能說(shuō)出它們等于幾或是否相等第14頁(yè),共142頁(yè),2023年,2月20日,星期三研究者想收集證據(jù)予以支持的假設(shè)也稱“研究假設(shè)”總是有符號(hào)

,

或表示為H1H1:

<某一數(shù)值,或某一數(shù)值例如,H1:

<10cm,或

10cm備擇假設(shè)(alternativehypothesis)第15頁(yè),共142頁(yè),2023年,2月20日,星期三【例】一種零件的生產(chǎn)標(biāo)準(zhǔn)是直徑應(yīng)為10cm,為對(duì)生產(chǎn)過(guò)程進(jìn)行控制,質(zhì)量監(jiān)測(cè)人員定期對(duì)一臺(tái)加工機(jī)床檢查,確定這臺(tái)機(jī)床生產(chǎn)的零件是否符合標(biāo)準(zhǔn)要求。如果零件的平均直徑大于或小于10cm,則表明生產(chǎn)過(guò)程不正常,必須進(jìn)行調(diào)整。試陳述用來(lái)檢驗(yàn)生產(chǎn)過(guò)程是否正常的原假設(shè)和備擇假設(shè)提出假設(shè)(例題分析)解:研究者想收集證據(jù)予以證明的假設(shè)應(yīng)該是“生產(chǎn)過(guò)程不正?!薄=⒌脑僭O(shè)和備擇假設(shè)為

H0:

10cmH1:

10cm

第16頁(yè),共142頁(yè),2023年,2月20日,星期三【例】某品牌洗滌劑在它的產(chǎn)品說(shuō)明書(shū)中聲稱:平均凈含量不少于500g。從消費(fèi)者的利益出發(fā),有關(guān)研究人員要通過(guò)抽檢其中的一批產(chǎn)品來(lái)驗(yàn)證該產(chǎn)品制造商的說(shuō)明是否屬實(shí)。試陳述用于檢驗(yàn)的原假設(shè)與備擇假設(shè)提出假設(shè)(例題分析)解:研究者抽檢的意圖是傾向于證實(shí)這種洗滌劑的平均凈含量并不符合說(shuō)明書(shū)中的陳述。建立的原假設(shè)和備擇假設(shè)為

H0:

500H1:

<500500g綠葉洗滌劑第17頁(yè),共142頁(yè),2023年,2月20日,星期三【例】一家研究機(jī)構(gòu)估計(jì),某城市中家庭擁有汽車(chē)的比例超過(guò)30%。為驗(yàn)證這一估計(jì)是否正確,該研究機(jī)構(gòu)隨機(jī)抽取了一個(gè)樣本進(jìn)行檢驗(yàn)。試陳述用于檢驗(yàn)的原假設(shè)與備擇假設(shè)提出假設(shè)(例題分析)解:研究者想收集證據(jù)予以支持的假設(shè)是“該城市中家庭擁有汽車(chē)的比例超過(guò)30%”。建立的原假設(shè)和備擇假設(shè)為

H0:

30%H1:

30%第18頁(yè),共142頁(yè),2023年,2月20日,星期三原假設(shè)和備擇假設(shè)是一個(gè)完備事件組,而且相互對(duì)立在一項(xiàng)假設(shè)檢驗(yàn)中,原假設(shè)和備擇假設(shè)必有一個(gè)成立,而且只有一個(gè)成立先確定備擇假設(shè),再確定原假設(shè)等號(hào)“=”總是放在原假設(shè)上因研究目的不同,對(duì)同一問(wèn)題可能提出不同的假設(shè)(也可能得出不同的結(jié)論)提出假設(shè)(結(jié)論與建議)第19頁(yè),共142頁(yè),2023年,2月20日,星期三雙側(cè)檢驗(yàn)與單側(cè)檢驗(yàn)第20頁(yè),共142頁(yè),2023年,2月20日,星期三備擇假設(shè)沒(méi)有特定的方向性,并含有符號(hào)“”的假設(shè)檢驗(yàn),稱為雙側(cè)檢驗(yàn)或雙尾檢驗(yàn)(two-tailedtest)

備擇假設(shè)具有特定的方向性,并含有符號(hào)“>”或“<”的假設(shè)檢驗(yàn),稱為單側(cè)檢驗(yàn)或單尾檢驗(yàn)(one-tailedtest)備擇假設(shè)的方向?yàn)椤?lt;”,稱為左側(cè)檢驗(yàn)

備擇假設(shè)的方向?yàn)椤?gt;”,稱為右側(cè)檢驗(yàn)

雙側(cè)檢驗(yàn)與單側(cè)檢驗(yàn)第21頁(yè),共142頁(yè),2023年,2月20日,星期三雙側(cè)檢驗(yàn)與單側(cè)檢驗(yàn)

(假設(shè)的形式)假設(shè)雙側(cè)檢驗(yàn)單側(cè)檢驗(yàn)左側(cè)檢驗(yàn)右側(cè)檢驗(yàn)原假設(shè)H0:m

=m0H0:m

m0H0:m

m0備擇假設(shè)H1:m

≠m0H1:m

<m0H1:m

>m0以總體均值的檢驗(yàn)為例第22頁(yè),共142頁(yè),2023年,2月20日,星期三兩類錯(cuò)誤與顯著性水平第23頁(yè),共142頁(yè),2023年,2月20日,星期三假設(shè)檢驗(yàn)中的兩類錯(cuò)誤1. 第Ⅰ類錯(cuò)誤(棄真錯(cuò)誤)原假設(shè)為正確時(shí)拒絕原假設(shè)第Ⅰ類錯(cuò)誤的概率記為被稱為顯著性水平2. 第Ⅱ類錯(cuò)誤(取偽錯(cuò)誤)原假設(shè)為錯(cuò)誤時(shí)未拒絕原假設(shè)第Ⅱ類錯(cuò)誤的概率記為(Beta)第24頁(yè),共142頁(yè),2023年,2月20日,星期三H0:無(wú)罪假設(shè)檢驗(yàn)中的兩類錯(cuò)誤(決策結(jié)果)陪審團(tuán)審判裁決實(shí)際情況無(wú)罪有罪無(wú)罪正確錯(cuò)誤有罪錯(cuò)誤正確H0檢驗(yàn)決策實(shí)際情況H0為真H0為假未拒絕H0正確決策(1–a)第Ⅱ類錯(cuò)誤(b)拒絕H0第Ⅰ類錯(cuò)誤(a)正確決策(1-b)假設(shè)檢驗(yàn)就好像一場(chǎng)審判過(guò)程統(tǒng)計(jì)檢驗(yàn)過(guò)程第25頁(yè),共142頁(yè),2023年,2月20日,星期三假設(shè)檢驗(yàn)中的兩類錯(cuò)誤(決策結(jié)果)問(wèn):如何才能同時(shí)減少犯兩類錯(cuò)誤的概率?答:增加樣本容量(多次試探)。第26頁(yè),共142頁(yè),2023年,2月20日,星期三顯著性水平

(significantlevel)1. 是一個(gè)概率值2. 原假設(shè)為真時(shí),拒絕原假設(shè)的概率抽樣分布的拒絕域3. 表示為(alpha)常用的

值有0.01,0.05,0.104. 由研究者事先確定第27頁(yè),共142頁(yè),2023年,2月20日,星期三我們可以在事先確定用于拒絕原假設(shè)H0的證據(jù)必須強(qiáng)到何種程度。這等于說(shuō)我們要求多小的P值。而這個(gè)P值就叫顯著性水平,用表示顯著性水平表示總體中某一類數(shù)據(jù)出現(xiàn)的經(jīng)常程度假如我們選擇=0.05,樣本數(shù)據(jù)能拒絕原假設(shè)的證據(jù)要強(qiáng)到:當(dāng)H0正確時(shí),這種樣本結(jié)果發(fā)生的頻率不超過(guò)5%;如果我們選擇=0.01,就是要求拒絕H0的證據(jù)要更強(qiáng),這種樣本結(jié)果發(fā)生的頻率只有1%如果P值小于或等于,我們稱該組數(shù)據(jù)不利于原假設(shè)的證據(jù)有的顯著性水平顯著性水平

(significantlevel)第28頁(yè),共142頁(yè),2023年,2月20日,星期三significant(顯著的)一詞的意義在這里并不是“重要的”,而是指“非偶然的”一項(xiàng)檢驗(yàn)在統(tǒng)計(jì)上是“顯著的”,意思是指:這樣的(樣本)結(jié)果不是偶然得到的,或者說(shuō),不是靠機(jī)遇能夠得到的。統(tǒng)計(jì)顯著性

(significant)第29頁(yè),共142頁(yè),2023年,2月20日,星期三假設(shè)檢驗(yàn)中的小概率原理什么小概率?1. 在一次試驗(yàn)中,一個(gè)幾乎不可能發(fā)生的事件發(fā)生的概率2. 在一次試驗(yàn)中小概率事件一旦發(fā)生,我們就有理由拒絕原假設(shè)3. 小概率由研究者事先確定第30頁(yè),共142頁(yè),2023年,2月20日,星期三統(tǒng)計(jì)量與拒絕域第31頁(yè),共142頁(yè),2023年,2月20日,星期三根據(jù)樣本觀測(cè)結(jié)果計(jì)算得到的,并據(jù)以對(duì)原假設(shè)和備擇假設(shè)作出決策的某個(gè)樣本統(tǒng)計(jì)量對(duì)樣本估計(jì)量的標(biāo)準(zhǔn)化結(jié)果原假設(shè)H0為真點(diǎn)估計(jì)量的抽樣分布檢驗(yàn)統(tǒng)計(jì)量(teststatistic)標(biāo)準(zhǔn)化的檢驗(yàn)統(tǒng)計(jì)量第32頁(yè),共142頁(yè),2023年,2月20日,星期三顯著性水平和拒絕域

(雙側(cè)檢驗(yàn))抽樣分布H0臨界值臨界值a/2a/2

拒絕H0拒絕H01-置信水平拒絕域非拒絕域拒絕域第33頁(yè),共142頁(yè),2023年,2月20日,星期三顯著性水平和拒絕域

(雙側(cè)檢驗(yàn))H0臨界值臨界值a/2

a/2

樣本統(tǒng)計(jì)量拒絕H0拒絕H0抽樣分布1-置信水平第34頁(yè),共142頁(yè),2023年,2月20日,星期三顯著性水平和拒絕域

(雙側(cè)檢驗(yàn))H0臨界值臨界值

a/2a/2

樣本統(tǒng)計(jì)量拒絕H0拒絕H0抽樣分布1-置信水平第35頁(yè),共142頁(yè),2023年,2月20日,星期三顯著性水平和拒絕域

(雙側(cè)檢驗(yàn))H0臨界值臨界值a/2

a/2

樣本統(tǒng)計(jì)量拒絕H0拒絕H0抽樣分布1-置信水平第36頁(yè),共142頁(yè),2023年,2月20日,星期三顯著性水平和拒絕域

(單側(cè)檢驗(yàn))H0臨界值a拒絕H0抽樣分布1-置信水平RegionofRejectionRegionofNonrejection第37頁(yè),共142頁(yè),2023年,2月20日,星期三顯著性水平和拒絕域

(左側(cè)檢驗(yàn))H0臨界值a拒絕H0抽樣分布1-置信水平樣本統(tǒng)計(jì)量第38頁(yè),共142頁(yè),2023年,2月20日,星期三顯著性水平和拒絕域

(左側(cè)檢驗(yàn))H0臨界值a樣本統(tǒng)計(jì)量拒絕H0抽樣分布1-置信水平第39頁(yè),共142頁(yè),2023年,2月20日,星期三顯著性水平和拒絕域

(右側(cè)檢驗(yàn))H0臨界值a樣本統(tǒng)計(jì)量拒絕H0抽樣分布1-置信水平第40頁(yè),共142頁(yè),2023年,2月20日,星期三顯著性水平和拒絕域

(右側(cè)檢驗(yàn))H0臨界值a樣本統(tǒng)計(jì)量抽樣分布1-置信水平拒絕H0第41頁(yè),共142頁(yè),2023年,2月20日,星期三決策規(guī)則給定顯著性水平,查表得出相應(yīng)的臨界值z(mì)或z/2,t或t/2將檢驗(yàn)統(tǒng)計(jì)量的值與水平的臨界值進(jìn)行比較作出決策雙側(cè)檢驗(yàn):I統(tǒng)計(jì)量I>臨界值,拒絕H0左側(cè)檢驗(yàn):統(tǒng)計(jì)量<-臨界值,拒絕H0右側(cè)檢驗(yàn):統(tǒng)計(jì)量>臨界值,拒絕H0第42頁(yè),共142頁(yè),2023年,2月20日,星期三利用

P值進(jìn)行決策第43頁(yè),共142頁(yè),2023年,2月20日,星期三什么是P值?

(P-value)如果原假設(shè)為真,所得到的樣本結(jié)果會(huì)像實(shí)際觀測(cè)結(jié)果那么極端或更極端的概率P值告訴我們:如果原假設(shè)是正確的話,我們得到目前這個(gè)樣本數(shù)據(jù)的可能性有多大,如果這個(gè)可能性很小,就應(yīng)該拒絕原假設(shè)被稱為觀察到的(或?qū)崪y(cè)的)顯著性水平?jīng)Q策規(guī)則:若p值<,拒絕H0第44頁(yè),共142頁(yè),2023年,2月20日,星期三雙側(cè)檢驗(yàn)的P值/

2/

2Z拒絕H0拒絕H00臨界值計(jì)算出的樣本統(tǒng)計(jì)量計(jì)算出的樣本統(tǒng)計(jì)量臨界值1/2P值1/2P值第45頁(yè),共142頁(yè),2023年,2月20日,星期三左側(cè)檢驗(yàn)的P值0臨界值a樣本統(tǒng)計(jì)量拒絕H0抽樣分布1-置信水平計(jì)算出的樣本統(tǒng)計(jì)量P值第46頁(yè),共142頁(yè),2023年,2月20日,星期三右側(cè)檢驗(yàn)的P值0臨界值a拒絕H0抽樣分布1-置信水平計(jì)算出的樣本統(tǒng)計(jì)量P值第47頁(yè),共142頁(yè),2023年,2月20日,星期三原假設(shè)的可信度有多高?如果H0所代表的假設(shè)是人們多年來(lái)一直相信的,就需要很強(qiáng)的證據(jù)(小的P值)才能說(shuō)服他們拒絕的結(jié)論是什么?如果拒絕H0而肯定H1

,就需要有很強(qiáng)的證據(jù)顯示要支持H1。比如,H1代表要花很多錢(qián)把產(chǎn)品包裝改換成另一種包裝,你就要有很強(qiáng)的證據(jù)顯示新包裝一定會(huì)增加銷售量(因?yàn)榫芙^H0要花很高的成本)多大的P值合適?顯著性檢驗(yàn)的目的是要描述樣本所提供不利于原假設(shè)的證據(jù)有多強(qiáng)。P值就在做這件事。但是,要證明原假設(shè)不正確,P值要多小,才能令人信服呢?這要根據(jù)兩種情況來(lái)確定第48頁(yè),共142頁(yè),2023年,2月20日,星期三傳統(tǒng)的顯著性水平,如1%、5%、10%等等,已經(jīng)被人們普遍接受為“拒絕原假設(shè)足夠證據(jù)”的標(biāo)準(zhǔn),我們大概可以說(shuō):10%代表有“一些證據(jù)”不利于原假設(shè);5%代表有“適度證據(jù)”不利于原假設(shè);1%代表有“很強(qiáng)證據(jù)”不利于原假設(shè)固定顯著性水平是否有意義第49頁(yè),共142頁(yè),2023年,2月20日,星期三拒絕H0P值決策與統(tǒng)計(jì)量的比較拒絕H0的兩個(gè)統(tǒng)計(jì)量的不同顯著性Z拒絕H00統(tǒng)計(jì)量1

P1

值統(tǒng)計(jì)量2

P2

值拒絕H0臨界值第50頁(yè),共142頁(yè),2023年,2月20日,星期三與其人為地把顯著性水平固定按某一水平上,不如干脆選取檢驗(yàn)統(tǒng)計(jì)量的P值與其大致知道犯第Ⅰ錯(cuò)誤的概率,不如干脆知道一個(gè)確切的犯第Ⅰ類錯(cuò)誤的概率(P值)與其為選取“適當(dāng)?shù)摹钡亩鄲?,不如干脆把真正?P值)算出來(lái)P值決策與統(tǒng)計(jì)量的比較(結(jié)論)第51頁(yè),共142頁(yè),2023年,2月20日,星期三假設(shè)檢驗(yàn)結(jié)論的表述第52頁(yè),共142頁(yè),2023年,2月20日,星期三假設(shè)檢驗(yàn)結(jié)論的表述

(“顯著”與“不顯著”)當(dāng)拒絕原假設(shè)時(shí),我們稱樣本結(jié)果是統(tǒng)計(jì)上顯著的拒絕原假設(shè)時(shí)結(jié)論是清楚的當(dāng)不拒絕原假設(shè)時(shí),我們稱樣本結(jié)果是統(tǒng)計(jì)上不顯著的不拒絕原假設(shè)時(shí),并未給出明確的結(jié)論,不能說(shuō)原假設(shè)是正確的,也不能說(shuō)它不是正確的第53頁(yè),共142頁(yè),2023年,2月20日,星期三假設(shè)檢驗(yàn)結(jié)論的表述

(“接受”與“不拒絕”)假設(shè)檢驗(yàn)的目的在于試圖找到證據(jù)拒絕原假設(shè),而不在于證明什么是正確的當(dāng)沒(méi)有足夠證據(jù)拒絕原假設(shè)時(shí),不采用“接受原假設(shè)”的表述,而采用“不拒絕原假設(shè)”的表述。“不拒絕”的表述實(shí)際上意味著并未給出明確的結(jié)論,我們沒(méi)有說(shuō)原假設(shè)正確,也沒(méi)有說(shuō)它不正確“接受”的說(shuō)法有時(shí)會(huì)產(chǎn)生誤導(dǎo),因?yàn)檫@種說(shuō)法似乎暗示著原假設(shè)已經(jīng)被證明是正確的了。但事實(shí)上,H0的真實(shí)值我們永遠(yuǎn)也無(wú)法知道,H0只是對(duì)總體真實(shí)值的一個(gè)假定值,由樣本提供的信息也就自然無(wú)法證明它是否正確第54頁(yè),共142頁(yè),2023年,2月20日,星期三假設(shè)檢驗(yàn)結(jié)論的表述

(為什么不說(shuō)“接受”)【例】比如原假設(shè)為H0:=10,從該總體中抽出一個(gè)隨機(jī)樣本,得到x=9.8,在=0.05的水平上,樣本提供的證據(jù)沒(méi)有推翻這一假設(shè),我們說(shuō)“接受”原假設(shè),這意味著樣本提供的證據(jù)已經(jīng)證明=10是正確的。如果我們將原假設(shè)改為H0:=10.5,同樣,在=0.05的水平上,樣本提供的證據(jù)也沒(méi)有推翻這一假設(shè),我們又說(shuō)“接受”原假設(shè)。但這兩個(gè)原假設(shè)究竟哪一個(gè)是“真實(shí)的”呢?我們不知道第55頁(yè),共142頁(yè),2023年,2月20日,星期三假設(shè)檢驗(yàn)步驟的總結(jié)陳述原假設(shè)和備擇假設(shè)從所研究的總體中抽出一個(gè)隨機(jī)樣本確定一個(gè)適當(dāng)?shù)臋z驗(yàn)統(tǒng)計(jì)量,并利用樣本數(shù)據(jù)算出其具體數(shù)值確定一個(gè)適當(dāng)?shù)娘@著性水平,并計(jì)算出其臨界值,指定拒絕域?qū)⒔y(tǒng)計(jì)量的值與臨界值進(jìn)行比較,作出決策統(tǒng)計(jì)量的值落在拒絕域,拒絕H0,否則不拒絕H0也可以直接利用P值作出決策第56頁(yè),共142頁(yè),2023年,2月20日,星期三3.2一個(gè)總體參數(shù)的檢驗(yàn)3.2.1總體均值的檢驗(yàn)3.2.2總體比例的檢驗(yàn)3.2.3總體方差的檢驗(yàn)第57頁(yè),共142頁(yè),2023年,2月20日,星期三一個(gè)總體參數(shù)的檢驗(yàn)z檢驗(yàn)(單尾和雙尾)

t檢驗(yàn)(單尾和雙尾)z

檢驗(yàn)(單尾和雙尾)

2檢驗(yàn)(單尾和雙尾)均值總體參數(shù)比例方差第58頁(yè),共142頁(yè),2023年,2月20日,星期三總體均值的檢驗(yàn)第59頁(yè),共142頁(yè),2023年,2月20日,星期三總體均值的檢驗(yàn)

(作出判斷)是否已知小樣本容量n大是否已知否

t檢驗(yàn)否z檢驗(yàn)是z檢驗(yàn)

是z檢驗(yàn)第60頁(yè),共142頁(yè),2023年,2月20日,星期三總體均值的檢驗(yàn)

(大樣本)第61頁(yè),共142頁(yè),2023年,2月20日,星期三總體均值的檢驗(yàn)

(大樣本)1. 假定條件正態(tài)總體或非正態(tài)總體大樣本(n30)使用z檢驗(yàn)統(tǒng)計(jì)量2

已知:2

未知:第62頁(yè),共142頁(yè),2023年,2月20日,星期三總體均值的檢驗(yàn)(2

已知)

(例題分析)【例】一種罐裝飲料采用自動(dòng)生產(chǎn)線生產(chǎn),每罐的容量是255ml,標(biāo)準(zhǔn)差為5ml。為檢驗(yàn)每罐容量是否符合要求,質(zhì)檢人員在某天生產(chǎn)的飲料中隨機(jī)抽取了40罐進(jìn)行檢驗(yàn),測(cè)得每罐平均容量為255.8ml。取顯著性水平=0.05

,檢驗(yàn)該天生產(chǎn)的飲料容量是否符合標(biāo)準(zhǔn)要求?雙側(cè)檢驗(yàn)綠色健康飲品綠色健康飲品255255第63頁(yè),共142頁(yè),2023年,2月20日,星期三總體均值的檢驗(yàn)(2

已知)

(例題分析)H0

=255H1

255

=

0.05n

=

40臨界值(c):檢驗(yàn)統(tǒng)計(jì)量:z01.96-1.960.025拒絕H0拒絕H00.025決策:結(jié)論:

不拒絕H0樣本提供的證據(jù)還不足以推翻“該天生產(chǎn)的飲料符合標(biāo)準(zhǔn)要求”的看法第64頁(yè),共142頁(yè),2023年,2月20日,星期三總體均值的檢驗(yàn)(z檢驗(yàn))

(P值的計(jì)算與應(yīng)用)第1步:進(jìn)入Excel表格界面,直接點(diǎn)擊【f(x)】第2步:在函數(shù)分類中點(diǎn)擊【統(tǒng)計(jì)】,并在函數(shù)名菜單下選擇【NORMSDIST】,然后【確定】第3步:將z的絕對(duì)值1.01錄入,得到的函數(shù)值為

0.843752345

P值=2(1-0.843752345)=0.312495

P值遠(yuǎn)遠(yuǎn)大于,故不拒絕H0第65頁(yè),共142頁(yè),2023年,2月20日,星期三總體均值的檢驗(yàn)(2

未知)

(例題分析)【例】一種機(jī)床加工的零件尺寸絕對(duì)平均誤差為1.35mm。生產(chǎn)廠家現(xiàn)采用一種新的機(jī)床進(jìn)行加工以期進(jìn)一步降低誤差。為檢驗(yàn)新機(jī)床加工的零件平均誤差與舊機(jī)床相比是否有顯著降低,從某天生產(chǎn)的零件中隨機(jī)抽取50個(gè)進(jìn)行檢驗(yàn)。利用這些樣本數(shù)據(jù),檢驗(yàn)新機(jī)床加工的零件尺寸的平均誤差與舊機(jī)床相比是否有顯著降低?(=0.01)

左側(cè)檢驗(yàn)50個(gè)零件尺寸的誤差數(shù)據(jù)(mm)1.261.191.310.971.811.130.961.061.000.940.981.101.121.031.161.121.120.951.021.131.230.741.500.500.590.991.451.241.012.031.981.970.911.221.061.111.541.081.101.641.702.371.381.601.261.171.121.230.820.86第66頁(yè),共142頁(yè),2023年,2月20日,星期三總體均值的檢驗(yàn)(2

未知)

(例題分析)H0

1.35H1

<1.35

=

0.01n

=

50臨界值(c):檢驗(yàn)統(tǒng)計(jì)量:拒絕H0新機(jī)床加工的零件尺寸的平均誤差與舊機(jī)床相比有顯著降低決策:結(jié)論:-2.33z0拒絕H00.01第67頁(yè),共142頁(yè),2023年,2月20日,星期三總體均值的檢驗(yàn)(z檢驗(yàn))

(P值的計(jì)算與應(yīng)用)第1步:進(jìn)入Excel表格界面,直接點(diǎn)擊【f(x)】第2步:在函數(shù)分類中點(diǎn)擊【統(tǒng)計(jì)】,并在函數(shù)名的菜單下選擇【ZTEST】,然后【確定】第3步:在所出現(xiàn)的對(duì)話框【Array】框中,輸入原始數(shù)據(jù)所在區(qū)域;在【X】后輸入?yún)?shù)的某一假定值(這里為

1.35);在【Sigma】后輸入已知的總體標(biāo)準(zhǔn)差(若總體標(biāo)準(zhǔn)差未知?jiǎng)t可忽略不填,系統(tǒng)將自動(dòng)使用樣本標(biāo)準(zhǔn)差代替)第4步:用1減去得到的函數(shù)值0.995421023

即為P值

P值=1-0.995421023=0.004579

P值<=0.01,拒絕H0用Excel計(jì)算P值第68頁(yè),共142頁(yè),2023年,2月20日,星期三總體均值的檢驗(yàn)(z檢驗(yàn))

(P值的圖示)0-2.33a=0.01z拒絕H0抽樣分布1-計(jì)算出的樣本統(tǒng)計(jì)量=2.6061P值P=0.004579

第69頁(yè),共142頁(yè),2023年,2月20日,星期三總體均值的檢驗(yàn)(2

未知)

(例題分析)【例】某一小麥品種的平均產(chǎn)量為5200kg/hm2

。一家研究機(jī)構(gòu)對(duì)小麥品種進(jìn)行了改良以期提高產(chǎn)量。為檢驗(yàn)改良后的新品種產(chǎn)量是否有顯著提高,隨機(jī)抽取了36個(gè)地塊進(jìn)行試種,得到的樣本平均產(chǎn)量為5275kg/hm2,標(biāo)準(zhǔn)差為120/hm2

。試檢驗(yàn)改良后的新品種產(chǎn)量是否有顯著提高?(=0.05)

右側(cè)檢驗(yàn)第70頁(yè),共142頁(yè),2023年,2月20日,星期三總體均值的檢驗(yàn)(2

未知)

(例題分析)H0

5200H1

>5200

=

0.05n

=

36臨界值(c):檢驗(yàn)統(tǒng)計(jì)量:拒絕H0(P=0.000088<

=0.05)改良后的新品種產(chǎn)量有顯著提高決策:結(jié)論:z0拒絕H00.051.645第71頁(yè),共142頁(yè),2023年,2月20日,星期三總體均值的檢驗(yàn)(z檢驗(yàn))

(P值的圖示)抽樣分布P=0.00008801.645a=0.05拒絕H01-計(jì)算出的樣本統(tǒng)計(jì)量=3.75P值第72頁(yè),共142頁(yè),2023年,2月20日,星期三總體均值的檢驗(yàn)

(大樣本檢驗(yàn)方法的總結(jié))假設(shè)雙側(cè)檢驗(yàn)左側(cè)檢驗(yàn)右側(cè)檢驗(yàn)假設(shè)形式H0

:m=m0H1:mm0H0:mm0H1:m<m0H0:m

m0H1:m>m0統(tǒng)計(jì)量已知未知拒絕域P值決策拒絕H0第73頁(yè),共142頁(yè),2023年,2月20日,星期三總體均值的檢驗(yàn)

(小樣本)第74頁(yè),共142頁(yè),2023年,2月20日,星期三總體均值的檢驗(yàn)

(小樣本)1. 假定條件總體服從正態(tài)分布小樣本(n<

30)檢驗(yàn)統(tǒng)計(jì)量2

已知:2

未知:第75頁(yè),共142頁(yè),2023年,2月20日,星期三總體均值的檢驗(yàn)

(小樣本檢驗(yàn)方法的總結(jié))假設(shè)雙側(cè)檢驗(yàn)左側(cè)檢驗(yàn)右側(cè)檢驗(yàn)假設(shè)形式H0

:m=m0H1:mm0H0

:mm0H1:m<m0H0:mm0H1:m>m0統(tǒng)計(jì)量已知未知拒絕域P值決策拒絕H0注:

已知的拒絕域同大樣本第76頁(yè),共142頁(yè),2023年,2月20日,星期三總體均值的檢驗(yàn)

(例題分析)【例】一種汽車(chē)配件的平均長(zhǎng)度要求為12cm,高于或低于該標(biāo)準(zhǔn)均被認(rèn)為是不合格的。汽車(chē)生產(chǎn)企業(yè)在購(gòu)進(jìn)配件時(shí),通常是經(jīng)過(guò)招標(biāo),然后對(duì)中標(biāo)的配件提供商提供的樣品進(jìn)行檢驗(yàn),以決定是否購(gòu)進(jìn)?,F(xiàn)對(duì)一個(gè)配件提供商提供的10個(gè)樣本進(jìn)行了檢驗(yàn)。假定該供貨商生產(chǎn)的配件長(zhǎng)度服從正態(tài)分布,在0.05的顯著性水平下,檢驗(yàn)該供貨商提供的配件是否符合要求?10個(gè)零件尺寸的長(zhǎng)度(cm)12.210.812.011.811.912.411.312.212.012.3第77頁(yè),共142頁(yè),2023年,2月20日,星期三總體均值的檢驗(yàn)

(例題分析—正態(tài)性檢驗(yàn))汽車(chē)配件的正態(tài)概率圖

第78頁(yè),共142頁(yè),2023年,2月20日,星期三總體均值的檢驗(yàn)

(例題分析)H0

=12H1

12

=0.05df=10-1=9臨界值(c):檢驗(yàn)統(tǒng)計(jì)量:不拒絕H0樣本提供的證據(jù)還不足以推翻“該供貨商提供的零件符合要求”的看法決策:結(jié)論:t02.262-2.2620.025拒絕

H0拒絕H00.025第79頁(yè),共142頁(yè),2023年,2月20日,星期三總體均值的檢驗(yàn)(t檢驗(yàn))

(P值的計(jì)算與應(yīng)用)第1步:進(jìn)入Excel表格界面,直接點(diǎn)擊【f(x】第2步:在函數(shù)分類中點(diǎn)擊【統(tǒng)計(jì)】,并在函數(shù)名的菜單下選擇【TDIST】,然后【確定】第3步:在出現(xiàn)對(duì)話框的【X】欄中輸入計(jì)算出的t的絕對(duì)值0.7035,在【Deg-freedom】(自由度)欄中輸入本例的自由度9,在【Tails】欄中輸入2(表明是雙側(cè)檢驗(yàn),如果是單測(cè)檢驗(yàn)則在該欄輸入1)第4步:P值=0.499537958

P值>=0.05,故不拒絕H0

第80頁(yè),共142頁(yè),2023年,2月20日,星期三用置信區(qū)間進(jìn)行檢驗(yàn)第81頁(yè),共142頁(yè),2023年,2月20日,星期三置信區(qū)間和假設(shè)檢驗(yàn)作一項(xiàng)統(tǒng)計(jì)檢驗(yàn),不能只去看是否有統(tǒng)計(jì)上的顯著性,置信區(qū)間會(huì)更有用置信區(qū)間的寬度會(huì)幫助我們把真正的總體參數(shù)定位得更準(zhǔn)確置信區(qū)間比假設(shè)檢驗(yàn)更有用第82頁(yè),共142頁(yè),2023年,2月20日,星期三置信區(qū)間和假設(shè)檢驗(yàn)

(例題分析)投擲一枚均勻的硬幣,在樣本容量分別為n=1000、n=4040和n=10000時(shí),樣本比例為p=0.507,出現(xiàn)正面的比例95%的置信區(qū)間如下投擲1000次和投擲4040次所得到的區(qū)間都包含了0.5這個(gè)數(shù)字(總體參數(shù)),所以我們不會(huì)懷疑硬幣是否均勻??墒峭稊S10000次時(shí),我們卻有信心真正的總體參數(shù)落在(0.504,0.510)之間。因此我們有信心p值(總體參數(shù))不是0.5投擲次數(shù)95%的置信區(qū)間n=10000.507±0.031(0.476,0.538)n=40400.507±0.015(0.492,0.522)n=100000.507±0.003(0.504,0.510)第83頁(yè),共142頁(yè),2023年,2月20日,星期三用置信區(qū)間進(jìn)行檢驗(yàn)

(雙側(cè)檢驗(yàn))求出雙側(cè)檢驗(yàn)均值的置信區(qū)間2已知時(shí):2未知時(shí):若總體的假設(shè)值0在置信區(qū)間外,拒絕H0第84頁(yè),共142頁(yè),2023年,2月20日,星期三用置信區(qū)間進(jìn)行檢驗(yàn)

(單側(cè)檢驗(yàn))左側(cè)檢驗(yàn):求出單邊置信下限若總體的假設(shè)值0小于單邊置信下限,拒絕H0右側(cè)檢驗(yàn):求出單邊置信上限若總體的假設(shè)值0大于單邊置信上限,拒絕H0第85頁(yè),共142頁(yè),2023年,2月20日,星期三用置信區(qū)間進(jìn)行檢驗(yàn)

(例題分析)【例】一種袋裝食品每包的標(biāo)準(zhǔn)重量應(yīng)為1000g。現(xiàn)從生產(chǎn)的一批產(chǎn)品中隨機(jī)抽取16袋,測(cè)得其平均重量為991g。已知這種產(chǎn)品重量服從標(biāo)準(zhǔn)差為50g的正態(tài)分布。試確定這批產(chǎn)品的包裝重量是否合格?(=0.05)雙側(cè)檢驗(yàn)!第86頁(yè),共142頁(yè),2023年,2月20日,星期三用置信區(qū)間進(jìn)行檢驗(yàn)

(例題分析)H0:

=1000H1:

1000

=

0.05n

=49臨界值(s):置信區(qū)間為決策:結(jié)論:

假設(shè)的0=1000在置信區(qū)間內(nèi),不拒絕H0沒(méi)有證據(jù)表明這批產(chǎn)品的包裝重量不合格Z01.96-1.96.025拒絕H0拒絕H0.025第87頁(yè),共142頁(yè),2023年,2月20日,星期三總體比例的檢驗(yàn)第88頁(yè),共142頁(yè),2023年,2月20日,星期三適用的數(shù)據(jù)類型離散數(shù)據(jù)

連續(xù)數(shù)據(jù)數(shù)值型數(shù)據(jù)數(shù)據(jù)品質(zhì)數(shù)據(jù)第89頁(yè),共142頁(yè),2023年,2月20日,星期三總體比例檢驗(yàn)假定條件總體服從二項(xiàng)分布可用正態(tài)分布來(lái)近似(大樣本)檢驗(yàn)的z統(tǒng)計(jì)量0為假設(shè)的總體比例第90頁(yè),共142頁(yè),2023年,2月20日,星期三總體比例的檢驗(yàn)

(檢驗(yàn)方法的總結(jié))假設(shè)雙側(cè)檢驗(yàn)左側(cè)檢驗(yàn)右側(cè)檢驗(yàn)假設(shè)形式H0:=0H1:0H0

:0H1:<0H0

:0H1:>0統(tǒng)計(jì)量拒絕域P值決策拒絕H0第91頁(yè),共142頁(yè),2023年,2月20日,星期三總體比例的檢驗(yàn)

(例題分析)【例】一種以休閑和娛樂(lè)為主題的雜志,聲稱其讀者群中有80%為女性。為驗(yàn)證這一說(shuō)法是否屬實(shí),某研究部門(mén)抽取了由200人組成的一個(gè)隨機(jī)樣本,發(fā)現(xiàn)有146個(gè)女性經(jīng)常閱讀該雜志。分別取顯著性水平

=0.05和=0.01

,檢驗(yàn)該雜志讀者群中女性的比例是否為80%?它們的P值各是多少?雙側(cè)檢驗(yàn)第92頁(yè),共142頁(yè),2023年,2月20日,星期三總體比例的檢驗(yàn)

(例題分析)H0

=80%H1

80%

=0.05n

=200臨界值(c):檢驗(yàn)統(tǒng)計(jì)量:拒絕H0(P=0.013328<

=0.05)該雜志的說(shuō)法并不屬實(shí)

決策:結(jié)論:z01.96-1.960.025拒絕

H0拒絕

H00.025第93頁(yè),共142頁(yè),2023年,2月20日,星期三總體比例的檢驗(yàn)

(例題分析)H0

=80%H1

80%

=0.01n

=200臨界值(c):檢驗(yàn)統(tǒng)計(jì)量:不拒絕H0(P=0.013328>=0.01)樣本提供的證據(jù)還不足以推翻“該雜志聲稱讀者群中有80%為女性”的看法

決策:結(jié)論:z02.58-2.580.025拒絕H0拒絕H00.025第94頁(yè),共142頁(yè),2023年,2月20日,星期三總體方差的檢驗(yàn)

(2檢驗(yàn))第95頁(yè),共142頁(yè),2023年,2月20日,星期三總體方差的檢驗(yàn)

(2檢驗(yàn))

檢驗(yàn)一個(gè)總體的方差或標(biāo)準(zhǔn)差假設(shè)總體近似服從正態(tài)分布使用2分布檢驗(yàn)統(tǒng)計(jì)量樣本方差假設(shè)的總體方差第96頁(yè),共142頁(yè),2023年,2月20日,星期三總體方差的檢驗(yàn)

(檢驗(yàn)方法的總結(jié))假設(shè)雙側(cè)檢驗(yàn)左側(cè)檢驗(yàn)右側(cè)檢驗(yàn)假設(shè)形式H0

:2=02H1:2

0H0

:2

02H1:2

<

02H0:2

02H1:2

>02統(tǒng)計(jì)量拒絕域P值決策拒絕H0第97頁(yè),共142頁(yè),2023年,2月20日,星期三總體方差的檢驗(yàn)

(例題分析)【例】啤酒生產(chǎn)企業(yè)采用自動(dòng)生產(chǎn)線灌裝啤酒,每瓶的裝填量為640ml,但由于受某些不可控因素的影響,每瓶的裝填量會(huì)有差異。此時(shí),不僅每瓶的平均裝填量很重要,裝填量的方差同樣很重要。如果方差很大,會(huì)出現(xiàn)裝填量太多或太少的情況,這樣要么生產(chǎn)企業(yè)不劃算,要么消費(fèi)者不滿意。假定生產(chǎn)標(biāo)準(zhǔn)規(guī)定每瓶裝填量的標(biāo)準(zhǔn)差不應(yīng)超過(guò)和不應(yīng)低于4ml。企業(yè)質(zhì)檢部門(mén)抽取了10瓶啤酒進(jìn)行檢驗(yàn),得到的樣本標(biāo)準(zhǔn)差為s=3.8ml。試以0.10的顯著性水平檢驗(yàn)裝填量的標(biāo)準(zhǔn)差是否符合要求?朝日BEER朝日BEER朝日BEER朝日第98頁(yè),共142頁(yè),2023年,2月20日,星期三總體方差的檢驗(yàn)

(例題分析)H0

:2=42H1

:2

42

=0.10df=

10-1=9臨界值(s):統(tǒng)計(jì)量:不拒絕H0樣本提供的證據(jù)還不足以推翻“裝填量的標(biāo)準(zhǔn)差不符合要求”的看法

2016.91903.32511

/2=0.05決策:結(jié)論:第99頁(yè),共142頁(yè),2023年,2月20日,星期三3.3兩個(gè)總體參數(shù)的檢驗(yàn)3.3.1兩個(gè)總體均值之差的檢驗(yàn)3.3.2兩個(gè)總體比例之差的檢驗(yàn)3.3.3兩個(gè)總體方差比的檢驗(yàn)第100頁(yè),共142頁(yè),2023年,2月20日,星期三兩個(gè)總體參數(shù)的檢驗(yàn)總體參數(shù)獨(dú)立樣本配對(duì)樣本均值差比例差方差比z

檢驗(yàn)(大樣本)t

檢驗(yàn)(小樣本)t

檢驗(yàn)(小樣本)z檢驗(yàn)F

檢驗(yàn)第101頁(yè),共142頁(yè),2023年,2月20日,星期三兩個(gè)總體均值之差的檢驗(yàn)

(獨(dú)立大樣本)第102頁(yè),共142頁(yè),2023年,2月20日,星期三兩個(gè)總體均值之差的檢驗(yàn)

(獨(dú)立大樣本)1. 假定條件兩個(gè)樣本是獨(dú)立的隨機(jī)樣本正態(tài)總體或非正態(tài)總體大樣本(n130和n230)檢驗(yàn)統(tǒng)計(jì)量12

,22

已知:12

,22

未知:第103頁(yè),共142頁(yè),2023年,2月20日,星期三兩個(gè)總體均值之差的檢驗(yàn)

(大樣本檢驗(yàn)方法的總結(jié))假設(shè)雙側(cè)檢驗(yàn)左側(cè)檢驗(yàn)右側(cè)檢驗(yàn)假設(shè)形式H0

:m1-m2=0H1:m1-m20

H0

:m1-m20H1:m1-m2<0H0:m1-m20

H1:m1-m2>0統(tǒng)計(jì)量12

,

22

已知12

,

22

未知拒絕域P值決策拒絕H0第104頁(yè),共142頁(yè),2023年,2月20日,星期三兩個(gè)總體均值之差的檢驗(yàn)

(例題分析)

【例】某公司對(duì)男女職員的平均小時(shí)工資進(jìn)行了調(diào)查,獨(dú)立抽取了具有同類工作經(jīng)驗(yàn)的男女職員的兩個(gè)隨機(jī)樣本,并記錄下兩個(gè)樣本的均值、方差等資料如右表。在顯著性水平為0.05的條件下,能否認(rèn)為男性職員與女性職員的平均小時(shí)工資存在顯著差異?

兩個(gè)樣本的有關(guān)數(shù)據(jù)

男性職員女性職員n1=44n1=32

=75

=70S12=64

S22=42.25第105頁(yè),共142頁(yè),2023年,2月20日,星期三兩個(gè)總體均值之差的檢驗(yàn)

(例題分析)H0

:1-2=0H1

:1-2

0

=

0.05n1

=44,n2

=32臨界值(c):檢驗(yàn)統(tǒng)計(jì)量:決策:結(jié)論:

拒絕H0該公司男女職員的平均小時(shí)工資之間存在顯著差異

z01.96-1.960.025拒絕H0拒絕H00.025第106頁(yè),共142頁(yè),2023年,2月20日,星期三兩個(gè)總體均值之差的檢驗(yàn)

(獨(dú)立小樣本)第107頁(yè),共142頁(yè),2023年,2月20日,星期三兩個(gè)總體均值之差的檢驗(yàn)

(12,

22

已知)假定條件兩個(gè)獨(dú)立的小樣本兩個(gè)總體都是正態(tài)分布12,22已知檢驗(yàn)統(tǒng)計(jì)量第108頁(yè),共142頁(yè),2023年,2月20日,星期三兩個(gè)總體均值之差的檢驗(yàn)

(12,22

未知但12=22)假定條件兩個(gè)獨(dú)立的小樣本兩個(gè)總體都是正態(tài)分布12、22未知但相等,即12=22檢驗(yàn)統(tǒng)計(jì)量其中:自由度:第109頁(yè),共142頁(yè),2023年,2月20日,星期三兩個(gè)總體均值之差的檢驗(yàn)

(12,

22

未知且不相等1222)假定條件兩個(gè)總體都是正態(tài)分布12,22未知且不相等,即1222樣本容量相等,即n1=n2=n檢驗(yàn)統(tǒng)計(jì)量自由度:第110頁(yè),共142頁(yè),2023年,2月20日,星期三兩個(gè)總體均值之差的檢驗(yàn)

(12,

22

未知且不相等1222)假定條件兩個(gè)總體都是正態(tài)分布12,22未知且不相等,即1222樣本容量不相等,即n1n2檢驗(yàn)統(tǒng)計(jì)量自由度:第111頁(yè),共142頁(yè),2023年,2月20日,星期三兩個(gè)總體均值之差的檢驗(yàn)

(例題分析)

【例】甲、乙兩臺(tái)機(jī)床同時(shí)加工某種同類型的零件,已知兩臺(tái)機(jī)床加工的零件直徑(單位:cm)分別服從正態(tài)分布,并且有12=22

。為比較兩臺(tái)機(jī)床的加工精度有無(wú)顯著差異,分別獨(dú)立抽取了甲機(jī)床加工的8個(gè)零件和乙機(jī)床加工的7個(gè)零件,通過(guò)測(cè)量得到如下數(shù)據(jù)。在=0.05的顯著性水平下,樣本數(shù)據(jù)是否提供證據(jù)支持

“兩臺(tái)機(jī)床加工的零件直徑不一致”的看法??jī)膳_(tái)機(jī)床加工零件的樣本數(shù)據(jù)

(cm)甲20.519.819.720.420.120.019.019.9乙20.719.819.520.820.419.620.2第112頁(yè),共142頁(yè),2023年,2月20日,星期三兩個(gè)總體均值之差的檢驗(yàn)

(例題分析—正態(tài)性評(píng)估)兩臺(tái)機(jī)床加工零件直徑的正態(tài)概率圖第113頁(yè),共142頁(yè),2023年,2月20日,星期三兩個(gè)總體均值之差的檢驗(yàn)

(例題分析)H0

:1-2

=0H1

:1-2

0

=0.05n1

=8,n2

=

7臨界值(c):檢驗(yàn)統(tǒng)計(jì)量:決策:結(jié)論:

不拒絕H0樣本提供的證據(jù)還不足以推翻“兩臺(tái)機(jī)床加工的零件直徑不一致”的看法t02.160-2.1600.025拒絕H0拒絕H00.025第114頁(yè),共142頁(yè),2023年,2月20日,星期三兩個(gè)總體均值之差的檢驗(yàn)

(例題分析—箱線圖比較)兩臺(tái)機(jī)床加工零件尺寸的Mean/SD/1.96*SD箱線圖

第115頁(yè),共142頁(yè),2023年,2月20日,星期三兩個(gè)總體均值之差的檢驗(yàn)

(用Excel進(jìn)行檢驗(yàn))第1步:將原始數(shù)據(jù)輸入到Excel工作表格中第2步:選擇【工具】下拉菜單并選擇【數(shù)據(jù)分析】選項(xiàng)第3步:在【數(shù)據(jù)分析】對(duì)話框中選擇

【t-檢驗(yàn):雙樣本等方差假設(shè)】第4步:當(dāng)對(duì)話框出現(xiàn)后在【變量1的區(qū)域】方框中輸入第1個(gè)樣本的數(shù)據(jù)區(qū)域在【變量2的區(qū)域】方框中輸入第2個(gè)樣本的數(shù)據(jù)區(qū)域在【假設(shè)平均差】方框中輸入假定的總體均值之差在【】方框中輸入給定的顯著性水平(本例為0.05)

在【輸出選項(xiàng)】選擇計(jì)算結(jié)果的輸出位置,然后【確定】用Excel進(jìn)行檢驗(yàn)第116頁(yè),共142頁(yè),2023年,2月20日,星期三兩個(gè)總體均值之差的檢驗(yàn)

(例題分析)【例】為檢驗(yàn)兩種方法組裝產(chǎn)品所需時(shí)間的差異,分別對(duì)兩種不同的組裝方法各隨機(jī)安排12個(gè)工人,每個(gè)工人組裝一件產(chǎn)品所需的時(shí)間(單位:min)下如表。假定兩種方法組裝產(chǎn)品的時(shí)間服從正態(tài)分布,但方差未知且不相等。取顯著性水平0.05,能否認(rèn)為方法1組裝產(chǎn)品的平均時(shí)間明顯地高于方法2??jī)蓚€(gè)方法組裝產(chǎn)品所需的時(shí)間方法1方法228.336.027.631.730.137.222.226.029.038.531.032.037.634.433.831.232.128.020.033.428.830.030.226.521第117頁(yè),共142頁(yè),2023年,2月20日,星期三兩個(gè)總體均值之差的檢驗(yàn)

(用Excel進(jìn)行檢驗(yàn))第1步:將原始數(shù)據(jù)輸入到Excel工作表格中第2步:選擇“工具”下拉菜單并選擇【數(shù)據(jù)分析】選項(xiàng)第3步:在【數(shù)據(jù)分析】對(duì)話框中選擇

【t-檢驗(yàn):雙樣本異方差假設(shè)】第4步:當(dāng)對(duì)話框出現(xiàn)后在【變量1的區(qū)域】方框中輸入第1個(gè)樣本的數(shù)據(jù)區(qū)域在【變量2的區(qū)域】方框中輸入第2個(gè)樣本的數(shù)據(jù)區(qū)域在【假設(shè)平均差】方框中輸入假定的總體均值之差在【】方框中輸入給定的顯著性水平(本例為0.05)

在【輸出選項(xiàng)】選擇計(jì)算結(jié)果的輸出位置,然后【確定】用Excel進(jìn)行檢驗(yàn)第118頁(yè),共142頁(yè),2023年,2月20日,星期三兩個(gè)總體均值之差的檢驗(yàn)

(例題分析—箱線圖比較)兩種方法組裝產(chǎn)品所需時(shí)間的Mean/SD/1.96*SD箱線圖第119頁(yè),共142頁(yè),2023年,2月20日,星期三兩個(gè)總體均值之差的檢驗(yàn)

(匹配樣本)第120頁(yè),共142頁(yè),2023年,2月20日,星期三兩個(gè)總體均值之差的檢驗(yàn)

(匹配樣本)假定條件兩個(gè)總體配對(duì)差值構(gòu)成的總體服從正態(tài)分布配對(duì)差是由差值總體中隨機(jī)抽取的

數(shù)據(jù)配對(duì)或匹配(重復(fù)測(cè)量(前/后))檢驗(yàn)統(tǒng)計(jì)量樣本差值均值樣本差值標(biāo)準(zhǔn)差第121頁(yè),共142頁(yè),2023年,2月20日,星期三匹配樣本

(數(shù)據(jù)形式)

觀察序號(hào)樣本1樣本2差值1x11x21d1=x11-x212x12x22d2=x12-x22MMMMix1ix2idi

=x1i

-x2iMMMMnx1nx2ndn

=x1n-x2n第122頁(yè),共142頁(yè),2023年,2月20日,星期三兩個(gè)總體均值之差的檢驗(yàn)

(匹配樣本檢驗(yàn)方法的總結(jié))假設(shè)雙側(cè)檢驗(yàn)左側(cè)檢驗(yàn)右側(cè)檢驗(yàn)假設(shè)形式H0

:d=0H1:d0H0

:d0H1:d<0H0:d0

H1:d>0統(tǒng)計(jì)量拒絕域P值決策拒絕H0第123頁(yè),共142頁(yè),2023年,2月20日,星期三兩個(gè)總體均值之差的檢驗(yàn)

(例題分析)

【例】某飲料公司開(kāi)發(fā)研制出一新產(chǎn)品,為比較消費(fèi)者對(duì)新老產(chǎn)品口感的滿意程度,該公司隨機(jī)抽選一組消費(fèi)者(8人),每個(gè)消費(fèi)者先品嘗一種飲料,然后再品嘗另一種飲料,兩種飲料的品嘗順序是隨機(jī)的,而后每個(gè)消費(fèi)者要對(duì)兩種飲料分別進(jìn)行評(píng)分(0分~10分),評(píng)分結(jié)果如下表。取顯著性水平=0.05,該公司是否有證據(jù)認(rèn)為消費(fèi)者對(duì)兩種飲料的評(píng)分存在顯著差異??jī)煞N飲料平均等級(jí)的樣本數(shù)據(jù)舊飲料54735856新飲料66743976第124頁(yè),共142頁(yè),2023年,2月20日,星期三兩個(gè)總體均值之差的檢驗(yàn)

(用Excel進(jìn)行檢驗(yàn))第1步:選擇“工具”下拉菜單,并選擇【數(shù)據(jù)分析】選項(xiàng)第3步:在分析工具中選擇【t檢驗(yàn):平均值成對(duì)二樣本分析】第4步:當(dāng)出現(xiàn)對(duì)話框后

在【變量1的區(qū)域】方框內(nèi)輸入變量1的數(shù)據(jù)區(qū)域

在【變量2的區(qū)域】方框內(nèi)輸入變量2的數(shù)據(jù)區(qū)域

在【假設(shè)平均差】方框內(nèi)輸入假設(shè)的差值(這里為0)

在【】框內(nèi)輸入給定的顯著性水平,然后【確定】

用Excel進(jìn)行檢驗(yàn)第125頁(yè),共142頁(yè),2023年,2月20日,星期三兩個(gè)總體均值檢驗(yàn)方法總結(jié)均值差檢驗(yàn)獨(dú)立樣本匹配樣本大樣本小樣本小樣本12、22已知12、22未知12、22已知12、22未知Z檢驗(yàn)Z

檢驗(yàn)Z檢驗(yàn)t檢驗(yàn)12=2212≠22t檢驗(yàn)n1=n2n1≠n2t

檢驗(yàn)t

檢驗(yàn)第126頁(yè),共142頁(yè),2023年,2月20日,星期三兩個(gè)總體比例之差的檢驗(yàn)第127頁(yè),共142頁(yè),2023年,2月20日,星期三1. 假定條件兩個(gè)總體都服從二項(xiàng)分布可以用正態(tài)分布來(lái)近似檢驗(yàn)統(tǒng)計(jì)量檢驗(yàn)H0:1-2=0檢驗(yàn)H0:1-2=d0兩個(gè)總體比例之差的檢驗(yàn)第128頁(yè),共142頁(yè),2023年,2月20日,星期三兩個(gè)總體比例之差的檢驗(yàn)

(檢驗(yàn)方法的總結(jié))假設(shè)雙側(cè)檢驗(yàn)左側(cè)檢驗(yàn)右側(cè)檢驗(yàn)假設(shè)形式H0

:1-2=0H1:1-20H0

:1-20

H1:1-2<0

H0:1-20

H1:1-2>0

統(tǒng)計(jì)量拒絕域P值決策拒絕H0第129頁(yè),共142頁(yè),2023年,2月20日,星期三兩個(gè)總體比例之差的檢驗(yàn)

(例題分析)

【例】一所大學(xué)準(zhǔn)備采取一項(xiàng)學(xué)生在宿舍上網(wǎng)收費(fèi)的措施,為了解男女學(xué)生對(duì)這一措施的看法是否存在差異,分別抽取了200名男學(xué)生和200名女學(xué)生進(jìn)行調(diào)查,其中的一個(gè)問(wèn)題是:“你是否贊成采取上網(wǎng)收費(fèi)的措施?”其中男學(xué)生表示贊成的比例為27%,女學(xué)生表示贊成的比例為35%。調(diào)查者認(rèn)為,男學(xué)生中表示贊成的比例顯著低于女學(xué)生。取顯著性水平=0.05,樣本提供的證據(jù)是否支持調(diào)查者的看法?21netnet第130頁(yè),共142頁(yè),2023年,2月20日,星期三兩個(gè)總體比例之差

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論