




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第七章假設(shè)檢驗(yàn)假設(shè)檢驗(yàn)的基本思想和概念參數(shù)假設(shè)檢驗(yàn)正態(tài)母體參數(shù)的置信區(qū)間非參數(shù)假設(shè)檢驗(yàn)了解檢驗(yàn)的基本思想,掌握假設(shè)檢驗(yàn)的基本步驟,了解假設(shè)檢驗(yàn)可能產(chǎn)生的兩種錯(cuò)誤。了解單個(gè)與兩個(gè)正態(tài)總體的均值與方差的假設(shè)檢驗(yàn)了解總體分布假設(shè)的檢驗(yàn)法,-檢驗(yàn)法,-檢驗(yàn)法學(xué)習(xí)目的重點(diǎn)假設(shè)檢驗(yàn)的基本步驟,檢驗(yàn)法單個(gè)正態(tài)總體的均值與方差的假設(shè)檢驗(yàn)難點(diǎn)非參數(shù)的假設(shè)檢驗(yàn)正態(tài)母體總數(shù)的置信區(qū)間??聽柲杪宸驍M合檢驗(yàn)假設(shè)檢驗(yàn)參數(shù)假設(shè)檢驗(yàn)總體分布已知,檢驗(yàn)關(guān)于未知參數(shù)的某個(gè)假設(shè)非參數(shù)假設(shè)檢驗(yàn)總體分布未知時(shí)的假設(shè)檢驗(yàn)問題這類問題稱作假設(shè)檢驗(yàn)問題.在本講中,我們將討論不同于參數(shù)估計(jì)的另一類重要的統(tǒng)計(jì)推斷問題.這就是根據(jù)樣本的信息檢驗(yàn)關(guān)于總體的某個(gè)假設(shè)是否正確.把每一罐都打開倒入量杯,看看容量是否合于標(biāo)準(zhǔn).這樣做顯然不行!生產(chǎn)流水線上罐裝可樂不斷地封裝,然后裝箱外運(yùn).怎么知道這批罐裝可樂的容量是否合格呢?例1罐裝可樂的容量按標(biāo)準(zhǔn)應(yīng)在350毫升和360毫升之間.7.1假設(shè)檢驗(yàn)的基本思想和概念如每隔1小時(shí),抽查5罐,得5個(gè)容量的值x1,…,x5,根據(jù)這些值來判斷生產(chǎn)是否正常.每隔一定時(shí)間,抽查若干罐.如發(fā)現(xiàn)不正常,就應(yīng)停產(chǎn),找出原因,排除故障,然后再生產(chǎn);如沒有問題,就繼續(xù)按規(guī)定時(shí)間再抽樣,以此監(jiān)督生產(chǎn),保證質(zhì)量.通常的辦法是進(jìn)行抽樣檢查.很明顯,不能由5罐容量的數(shù)據(jù),在把握不大的情況下就判斷生產(chǎn)不正常,因?yàn)橥.a(chǎn)的損失是很大的.當(dāng)然也不能總認(rèn)為正常,有了問題不能及時(shí)發(fā)現(xiàn),這也要造成損失.如何處理這兩者的關(guān)系,假設(shè)檢驗(yàn)面對(duì)的就是這種矛盾.在正常生產(chǎn)條件下,由于種種隨機(jī)因素的影響,每罐可樂的容量應(yīng)在355毫升上下波動(dòng).這些因素中沒有哪一個(gè)占有特殊重要的地位.因此,根據(jù)中心極限定理,假定每罐容量服從正態(tài)分布是合理的.罐裝可樂的容量按標(biāo)準(zhǔn)應(yīng)在350毫升和360毫升之間.稱H0為原假設(shè)(或零假設(shè),解消假設(shè));稱H1為備選假設(shè)(或?qū)α⒓僭O(shè)).在實(shí)際工作中,往往把不輕易否定的命題作為原假設(shè).它的對(duì)立假設(shè)是:H1:這樣,我們可以認(rèn)為
是取自正態(tài)總體的樣本,當(dāng)生產(chǎn)比較穩(wěn)定時(shí),是一個(gè)常數(shù).現(xiàn)在要檢驗(yàn)的假設(shè)是:較大、較小是一個(gè)相對(duì)的概念,合理的界限在何處?應(yīng)由什么原則來確定?那么,如何判斷原假設(shè)H0是否成立呢?由于是正態(tài)分布的期望值,它的估計(jì)量是樣本均值,因此可以根據(jù)與的差距來判斷H0是否成立.較小時(shí),可以認(rèn)為H0是成立的;當(dāng)生產(chǎn)已不正常.當(dāng)較大時(shí),應(yīng)認(rèn)為H0不成立,即問題歸結(jié)為對(duì)差異作定量的分析,以確定其性質(zhì).差異可能是由抽樣的隨機(jī)性引起的,稱為“抽樣誤差”或隨機(jī)誤差.這種誤差反映偶然、非本質(zhì)的因素所引起的隨機(jī)波動(dòng).然而,這種隨機(jī)性的波動(dòng)是有一定限度的,如果差異超過了這個(gè)限度,則我們就不能用抽樣的隨機(jī)性來解釋了.必須認(rèn)為這個(gè)差異反映了事物的本質(zhì)差別,即反映了生產(chǎn)已不正常.這種差異稱作“系統(tǒng)誤差”.問題是,根據(jù)所觀察到的差異,如何判斷它究竟是由于偶然性在起作用,還是生產(chǎn)確實(shí)不正常?即差異是“抽樣誤差”還是“系統(tǒng)誤差”所引起的?這里需要給出一個(gè)量的界限.問題是:如何給出這個(gè)量的界限?這里用到人們?cè)趯?shí)踐中普遍采用的一個(gè)原則:小概率事件在一次試驗(yàn)中基本上不會(huì)發(fā)生.小概率事件在一次試驗(yàn)中基本上不會(huì)發(fā)生.下面我們用一例說明這個(gè)原則.這里有兩個(gè)盒子,各裝有100個(gè)球.99個(gè)白球一個(gè)紅球…99個(gè)…99個(gè)99個(gè)紅球一個(gè)白球現(xiàn)從兩盒中隨機(jī)取出一個(gè)盒子,問這個(gè)盒子里是白球99個(gè)還是紅球99個(gè)?小概率事件在一次試驗(yàn)中基本上不會(huì)發(fā)生.現(xiàn)在我們從中隨機(jī)摸出一個(gè)球,發(fā)現(xiàn)是此時(shí)你如何判斷這個(gè)假設(shè)是否成立呢?小概率事件在一次試驗(yàn)中基本上不會(huì)發(fā)生.我們不妨先假設(shè):這個(gè)盒子里有99個(gè)白球.…99個(gè)假設(shè)其中真有99個(gè)白球,摸出紅球的概率只有1/100,這是小概率事件.這個(gè)例子中所使用的推理方法,可以稱為小概率事件在一次試驗(yàn)中竟然發(fā)生了,不能不使人懷疑所作的假設(shè).帶概率性質(zhì)的反證法不妨稱為概率反證法.小概率事件在一次試驗(yàn)中基本上不會(huì)發(fā)生.…99個(gè)概率反證法它不同于一般的反證法概率反證法的邏輯是:如果小概率事件在一次試驗(yàn)中居然發(fā)生,我們就以很大的把握否定原假設(shè).一般的反證法要求在原假設(shè)成立的條件下導(dǎo)出的結(jié)論是絕對(duì)成立的,如果事實(shí)與之矛盾,則完全絕對(duì)地否定原假設(shè).現(xiàn)在回到我們前面罐裝可樂的例中:在提出原假設(shè)H0后,如何作出接受和拒絕H0的結(jié)論呢?在假設(shè)檢驗(yàn)中,我們稱這個(gè)小概率為顯著性水平,用表示.的選擇要根據(jù)實(shí)際情況而定.常取罐裝可樂的容量按標(biāo)準(zhǔn)應(yīng)在350毫升和360毫升之間.一批可樂出廠前應(yīng)進(jìn)行抽樣檢查,現(xiàn)抽查了n罐,測(cè)得容量為x1,…,xn,問這一批可樂的容量是否合格?提出假設(shè)H0:
=355H1:≠355由于已知,選檢驗(yàn)統(tǒng)計(jì)量它能衡量差異大小且分布已知.如果由樣本值算得該統(tǒng)計(jì)量的實(shí)測(cè)值落入?yún)^(qū)域W,則拒絕H0;否則,不能拒絕H0.對(duì)給定的顯著性水平
,可以在N(0,1)表中查到分位點(diǎn)的值,使故我們可以取拒絕域?yàn)椋阂簿褪钦f,是一個(gè)小概率事件.W:這里所依據(jù)的邏輯是:如果H0是對(duì)的,那么衡量差異大小的某個(gè)統(tǒng)計(jì)量落入?yún)^(qū)域W(拒絕域)是個(gè)小概率事件.如果該統(tǒng)計(jì)量的實(shí)測(cè)值落入W,也就是說,H0成立下的小概率事件發(fā)生了,那么就認(rèn)為H0不可信而否定它.否則我們就不能否定H0(只好接受它).
不否定H0并不是肯定H0一定對(duì),而只是說差異還不夠顯著,還沒有達(dá)到足以否定H0的程度.所以假設(shè)檢驗(yàn)又叫“顯著性檢驗(yàn)”如果顯著性水平
取得很小,則拒絕域也會(huì)比較小.其產(chǎn)生的后果是:
H0難于被拒絕.如果在很小的情況下H0仍被拒絕了,則說明實(shí)際情況很可能與之有顯著差異.基于這個(gè)理由,人們常把時(shí)拒絕H0稱為是顯著的,而把在時(shí)拒絕H0稱為是高度顯著的.參數(shù)假設(shè)檢驗(yàn)①原假設(shè):第一個(gè)假設(shè)(陳述的否定)②備擇假設(shè):第二個(gè)假設(shè)(陳述本身)非參數(shù)假設(shè)檢驗(yàn)統(tǒng)計(jì)假設(shè)
例2某工廠生產(chǎn)的一種螺釘,標(biāo)準(zhǔn)要求長度是32.5毫米.實(shí)際生產(chǎn)的產(chǎn)品,其長度X假定服從正態(tài)分布未知,現(xiàn)從該廠生產(chǎn)的一批產(chǎn)品中抽取6件,得尺寸數(shù)據(jù)如下:32.56,29.66,31.64,30.00,31.87,31.03問這批產(chǎn)品是否合格?…下面,我們結(jié)合另一個(gè)例子,進(jìn)一步說明假設(shè)檢驗(yàn)的一般步驟.提出原假設(shè)和備擇假設(shè)第一步:第二步:能衡量差異大小且分布已知取一檢驗(yàn)統(tǒng)計(jì)量,在H0成立下求出它的分布已知未知分析:這批產(chǎn)品(螺釘長度)的全體組成問題的總體
.現(xiàn)在要檢驗(yàn)
是否為32.5.第三步:對(duì)給定的顯著性水平,查表確定臨界值即
是一個(gè)小概率事件.,使得否定域(拒絕域)W:|t|>4.0322故不能拒絕H0.第四步:將樣本值代入,算出統(tǒng)計(jì)量t的實(shí)測(cè)值,|t|=2.997<4.0322沒有落入拒絕域假設(shè)檢驗(yàn)會(huì)不會(huì)犯錯(cuò)誤呢?由于作出結(jié)論的依據(jù)是小概率原理:小概率事件在一次試驗(yàn)中基本上不會(huì)發(fā)生.不是一定不發(fā)生如果H0成立,但統(tǒng)計(jì)量的實(shí)測(cè)值落入否定域,從而作出否定H0的結(jié)論,那就犯了“以真為假”的錯(cuò)誤.如果H0不成立,但統(tǒng)計(jì)量的實(shí)測(cè)值未落入否定域,從而沒有作出否定H0的結(jié)論,即接受了錯(cuò)誤的H0,那就犯了“以假為真”的錯(cuò)誤.假設(shè)檢驗(yàn)的兩類錯(cuò)誤H0為真實(shí)際情況決定拒絕H0接受H0H0不真第一類錯(cuò)誤正確正確第二類錯(cuò)誤P{拒絕H0|H0為真}=,P{接受H0|H0不真}=.犯兩類錯(cuò)誤的概率:顯著性水平為犯第一類錯(cuò)誤的概率.兩類錯(cuò)誤是互相關(guān)聯(lián)的,當(dāng)樣本容量固定時(shí),一類錯(cuò)誤概率的減少導(dǎo)致另一類錯(cuò)誤概率的增加.要同時(shí)降低兩類錯(cuò)誤的概率,或者要在不變的條件下降低,或者需要增加樣本容量.7.2參數(shù)假設(shè)檢驗(yàn)7.2.1U-檢驗(yàn)設(shè)取自正態(tài)母體的一個(gè)樣本,為已知常數(shù)雙邊檢驗(yàn)(1)檢驗(yàn)假設(shè)(2)構(gòu)造U統(tǒng)計(jì)量(3)給定顯著性水平,查正態(tài)分布表,使即記成則尋找上側(cè)分位點(diǎn),使確定拒絕域(4)計(jì)算子樣的值,判斷其是否落入拒絕域.設(shè)取自正態(tài)母體的一個(gè)樣本,為已知常數(shù)單邊檢驗(yàn)(1)檢驗(yàn)假設(shè)為小概率事件查正態(tài)分布表,拒絕域即確定拒絕域,分兩種情況:(2)假設(shè)檢驗(yàn)(a)拒絕域(b)對(duì)于任何樣本觀測(cè)有:即因此,在給定條件下,使由于事件對(duì)假設(shè)H0而言,拒絕域仍為W所以(3)檢驗(yàn)假設(shè)拒絕域(4)檢驗(yàn)假設(shè)拒絕域解:提出假設(shè):例3某織物強(qiáng)力指標(biāo)
的均值公斤.改進(jìn)工藝后生產(chǎn)一批織物,今從中取30件,測(cè)得公斤.假設(shè)強(qiáng)力指標(biāo)服從正態(tài)分布且已知公斤,問在顯著性水平下,新生產(chǎn)織物比過去的織物強(qiáng)力是否有提高?代入,并由樣本值計(jì)算得統(tǒng)計(jì)量U的實(shí)測(cè)值U=2.51>2.33故拒絕原假設(shè)H0.落入否定域此時(shí)可能犯第一類錯(cuò)誤,犯錯(cuò)誤的概率不超過0.01.取統(tǒng)計(jì)量否定域?yàn)閃:
是一小概率事件雙正態(tài)總體U-檢驗(yàn)(1)檢驗(yàn)假設(shè)(2)構(gòu)造U統(tǒng)計(jì)量設(shè)和分別為取自正態(tài)母體和的樣本,在方差已知的條件下查正態(tài)分布表,拒絕域
(3)給定顯著性水平,確定拒絕域(4)求子樣觀測(cè)值的u-值,判斷與否7.2.2t-檢驗(yàn)設(shè)取自正態(tài)母體的一個(gè)樣本,為未知數(shù)雙邊檢驗(yàn)(1)檢驗(yàn)假設(shè)(2)構(gòu)造t統(tǒng)計(jì)量其中(3)給定顯著性水平,確定拒絕域由查t-分布表,自由度取n-1,確定分位點(diǎn)拒絕域單邊檢驗(yàn)(1)檢驗(yàn)假設(shè)拒絕域(2)檢驗(yàn)假設(shè)拒絕域(3)檢驗(yàn)假設(shè)拒絕域(4)檢驗(yàn)假設(shè)拒絕域雙正態(tài)總體t-檢驗(yàn)(1)檢驗(yàn)假設(shè)(2)構(gòu)造t統(tǒng)計(jì)量設(shè)和分別為取自正態(tài)母體和的樣本,在方差的條件下其中特別時(shí),可以推廣至檢驗(yàn)此時(shí)將t統(tǒng)計(jì)量分子換成查t-分布表拒絕域
(3)給定顯著性水平,確定拒絕域(4)求子樣觀測(cè)值的t-值,判斷與否7.2.3單個(gè)正態(tài)總體方差假設(shè)檢驗(yàn)-檢驗(yàn)(1)檢驗(yàn)假設(shè)(2)構(gòu)造統(tǒng)計(jì)量設(shè)取自正態(tài)母體的一個(gè)樣本,為已知常數(shù)雙邊檢驗(yàn)(3)給定顯著性水平,確定拒絕域,使拒絕域?yàn)榱擞?jì)算方便,取查-分布表知,上側(cè)分位點(diǎn)使分位點(diǎn)使單邊檢驗(yàn)(1)檢驗(yàn)假設(shè)拒絕域(2)檢驗(yàn)假設(shè)拒絕域7.2.3'單個(gè)正態(tài)總體方差假設(shè)檢驗(yàn)-檢驗(yàn)(1)檢驗(yàn)假設(shè)(2)構(gòu)造統(tǒng)計(jì)量設(shè)取自正態(tài)母體的一個(gè)樣本,未知雙邊檢驗(yàn)(3)給定顯著性水平,確定拒絕域,使拒絕域?yàn)榱擞?jì)算方便,取查-分布表知,上側(cè)分位點(diǎn)使分位點(diǎn)使單邊檢驗(yàn)(1)檢驗(yàn)假設(shè)拒絕域(2)檢驗(yàn)假設(shè)拒絕域7.2.4兩個(gè)正態(tài)總體方差假設(shè)檢驗(yàn)-檢驗(yàn)(1)檢驗(yàn)假設(shè)(2)構(gòu)造F統(tǒng)計(jì)量設(shè)和分別為取自正態(tài)母體和的樣本,在方差
已知的條件下(3)給定顯著性水平,確定拒絕域注意:7.2.4'兩個(gè)正態(tài)總體方差假設(shè)檢驗(yàn)-檢驗(yàn)(1)檢驗(yàn)假設(shè)(2)構(gòu)造F統(tǒng)計(jì)量設(shè)和分別為取自正態(tài)母體和的樣本,在方差
未知的條件下(3)給定顯著性水平,確定拒絕域例4為比較兩臺(tái)自動(dòng)機(jī)床的精度,分別取容量為10和8的兩個(gè)樣本,測(cè)量某個(gè)指標(biāo)的尺寸(假定服從正態(tài)分布),得到下列結(jié)果:在時(shí),問這兩臺(tái)機(jī)床是否有同樣的精度?車床甲:1.08,1.10,1.12,1.14,1.15,1.25,1.36,1.38,1.40,1.42車床乙:1.11,1.12,1.18,1.22,1.33,1.35,1.36,1.38解:設(shè)兩臺(tái)自動(dòng)機(jī)床的方差分別為在下檢驗(yàn)假設(shè):取統(tǒng)計(jì)量否定域?yàn)閃:或由樣本值可計(jì)算得F的實(shí)測(cè)值為:F=1.51查表得由于0.304<1.51<3.68,故接受H0.這時(shí)可能犯第二類錯(cuò)誤.
提出假設(shè)根據(jù)統(tǒng)計(jì)調(diào)查的目的,提出原假設(shè)H0和備選假設(shè)H1作出決策抽取樣本檢驗(yàn)假設(shè)對(duì)差異進(jìn)行定量的分析,確定其性質(zhì)(是隨機(jī)誤差還是系統(tǒng)誤差.為給出兩者界限,找一檢驗(yàn)統(tǒng)計(jì)量T,在H0成立下其分布已知.)拒絕還是不能拒絕H0顯著性水平-----犯第一類錯(cuò)誤的概率,W為拒絕域總結(jié)F檢驗(yàn)用F分布一般說來,按照檢驗(yàn)所用的統(tǒng)計(jì)量的分布,分為U檢驗(yàn)——用正態(tài)分布t檢驗(yàn)用t分布檢驗(yàn)用分布在大樣本的條件下,若能求得檢驗(yàn)統(tǒng)計(jì)量的極限分布,依據(jù)它去決定臨界值C.按照對(duì)立假設(shè)的提法,分為單側(cè)檢驗(yàn),它的拒絕域取在左側(cè)或右側(cè).雙側(cè)檢驗(yàn),它的拒絕域取在兩側(cè);第六章,我們討論了參數(shù)點(diǎn)估計(jì).它是用樣本算得的一個(gè)值去估計(jì)未知參數(shù).但是,點(diǎn)估計(jì)值僅僅是未知參數(shù)的一個(gè)近似值,它沒有反映出這個(gè)近似值的誤差范圍,使用起來把握不大.區(qū)間估計(jì)正好彌補(bǔ)了點(diǎn)估計(jì)的這個(gè)缺陷.7.3正態(tài)總體參數(shù)的置信區(qū)間
譬如,在估計(jì)湖中魚數(shù)的問題中,若我們根據(jù)一個(gè)實(shí)際樣本,得到魚數(shù)N的極大似然估計(jì)為1000條.若我們能給出一個(gè)區(qū)間,在此區(qū)間內(nèi)我們合理地相信N的真值位于其中.這樣對(duì)魚數(shù)的估計(jì)就有把握多了.實(shí)際上,N的真值可能大于1000條,也可能小于1000條.也就是說,我們希望確定一個(gè)區(qū)間,使我們能以比較高的可靠程度相信它包含真參數(shù)值.湖中魚數(shù)的真值[]這里所說的“可靠程度”是用概率來度量的,稱為置信概率,置信度或置信水平.習(xí)慣上把置信水平記作,這里是一個(gè)很小的正數(shù).置信水平的大小是根據(jù)實(shí)際需要選定的.例如,通??扇≈眯潘降?根據(jù)一個(gè)實(shí)際樣本,由給定的置信水平,我們求出一個(gè)盡可能小的區(qū)間,使稱區(qū)間為的置信水平為的置信區(qū)間.尋找置信區(qū)間的方法,一般是從確定誤差限入手.使得稱
為與
之間的誤差限.我們選取未知參數(shù)的某個(gè)估計(jì)量,根據(jù)置信水平,可以找到一個(gè)正數(shù)
,只要知道的概率分布,確定誤差限并不難.由不等式可以解出:這個(gè)不等式就是我們所求的置信區(qū)間.在求置信區(qū)間時(shí),要查表求分位數(shù).設(shè),對(duì)隨機(jī)變量X,稱滿足的點(diǎn)為X的概率分布的上分位數(shù).例如:設(shè),對(duì)隨機(jī)變量X,稱滿足的點(diǎn)為X的概率分布的上分位數(shù).標(biāo)準(zhǔn)正態(tài)分布的上分位數(shù)例如:分布的上分位數(shù)自由度為n的F分布的上分位數(shù)自由度為n1,n2的置信區(qū)間定義設(shè)總體具有概率函數(shù)為未知參數(shù),為取自的該總體的樣本,若對(duì)于,存在兩個(gè)統(tǒng)計(jì)量使則稱區(qū)間為參數(shù)的置信度為的置信區(qū)間,稱為置信下限,稱為置信上限.注:①置信區(qū)間是一個(gè)隨機(jī)區(qū)間,它的兩端點(diǎn)是不依賴于的統(tǒng)計(jì)量.②其意義指在重復(fù)抽樣下,許多不同的置信區(qū)間中大約的區(qū)間包含未知參數(shù)即包含的區(qū)間類的置信度,不能認(rèn)為不等式成立的概率為
置信區(qū)間的求法選的點(diǎn)估計(jì)為解:尋找未知參數(shù)的一個(gè)良好估計(jì).尋找一個(gè)待估參數(shù)和估計(jì)量的函數(shù),要求其分布為已知.有了分布,就可以求出U取值于任意區(qū)間的概率.求參數(shù)的置信度為的置信區(qū)間.
例5設(shè)
是取自的樣本,對(duì)給定的置信水平查正態(tài)分布表得對(duì)于給定的置信水平(大概率),根據(jù)U的分布,確定一個(gè)區(qū)間,使得U取值于該區(qū)間的概率為置信水平.使為什么這樣???對(duì)給定的置信水平查正態(tài)分布表得使也可簡記為于是所求的置信區(qū)間為從上例解題的過程,我們歸納出求置信區(qū)間的一般步驟如下:1.明確問題,是求什么參數(shù)的置信區(qū)間?置信水平
是多少?稱
為樞軸量.3.尋找一個(gè)待估參數(shù)和估計(jì)量T的函數(shù)且其分布為已知.2.尋找參數(shù)的一個(gè)良好的點(diǎn)估計(jì)
4.對(duì)于給定的置信水平
,根據(jù)
的分布,確定常數(shù)a,b,使得
5.對(duì)“
”作等價(jià)變形,得到如下形式:則就是的的置信區(qū)間.這里,我們主要討論總體分布為正態(tài)的情形.若樣本容量很大,即使總體分布未知,應(yīng)用中心極限定理,可得總體的近似分布,于是也可以近似求得參數(shù)的區(qū)間估計(jì).可見,確定區(qū)間估計(jì)很關(guān)鍵的是要尋找一個(gè)待估參數(shù)和估計(jì)量T的函數(shù)
,且
的分布為已知,不依賴于任何未知參數(shù)而這與總體分布有關(guān),所以,總體分布的形式是否已知,是怎樣的類型,至關(guān)重要.正態(tài)總體均值的區(qū)間估計(jì)(1)已知,則的置信水平的置信區(qū)間是正態(tài)總體均值的區(qū)間估計(jì)(2)未知,則的置信水平的置信區(qū)間是正態(tài)總體方差的區(qū)間估計(jì)(1)已知,則的置信水平的置信區(qū)間是正態(tài)總體方差的區(qū)間估計(jì)(2)未知,則的置信水平的置信區(qū)間是例6已知某地區(qū)新生嬰兒的體重隨機(jī)抽查100個(gè)嬰兒…得100個(gè)體重?cái)?shù)據(jù)的區(qū)間估計(jì)求和(置信水平為
).解:這是單總體均值和方差的估計(jì)已知先求均值的區(qū)間估計(jì).因方差未知,取對(duì)給定的置信度
,確定分位數(shù)使即即為均值的置信水平為的區(qū)間估計(jì).從中解得取樞軸量再求方差的置信水平為的區(qū)間估計(jì).從中解得于是即為所求.需要指出的是,給定樣本,給定置信水平,置信區(qū)間也不是唯一的.對(duì)同一個(gè)參數(shù),我們可以構(gòu)造許多置信區(qū)間.取樞軸量
例7設(shè)
是取自的樣本,求參數(shù)的置信水平為的置信區(qū)間.由標(biāo)準(zhǔn)正態(tài)分布表,對(duì)任意a、b,我們可以求得P(a<U<b).例如,由P(-1.96≤U≤1.96)=0.95我們得到均值的置信水平為的置信區(qū)間由P(-1.75≤U≤2.33)=0.95這個(gè)區(qū)間比前面一個(gè)要長一些.我們得到均值的置信水平為的置信區(qū)間在概率密度為單峰且對(duì)稱的情形,當(dāng)a=-b時(shí)求得的置信區(qū)間的長度為最短.
類似地,對(duì)任意兩個(gè)數(shù)a和b,只要它們的縱標(biāo)包含f(u)下95%的面積,就確定一個(gè)95%的置信區(qū)間.a=-b即使在概率密度不對(duì)稱的情形,如分布,F(xiàn)分布,習(xí)慣上仍取對(duì)稱的百分位點(diǎn)來計(jì)算未知參數(shù)的置信區(qū)間.我們可以得到未知參數(shù)的的任何置信水平小于1的置信區(qū)間,并且置信水平越高,相應(yīng)的置信區(qū)間平均長度越長.雙正態(tài)總體均值差的區(qū)間估計(jì)已知,則的置信水平的置信區(qū)間是雙正態(tài)總體方差比的區(qū)間估計(jì)已知,則的置信水平的置信區(qū)間是假設(shè)檢驗(yàn)和置信區(qū)間的關(guān)系雙側(cè)檢驗(yàn)問題的接受域可以定出正態(tài)均值
的置信區(qū)間單側(cè)檢驗(yàn)問題的接受域可以定出正態(tài)均值的置信上限單側(cè)檢驗(yàn)問題的接受域可以定出正態(tài)均值的置信上限問該廠生產(chǎn)的鐘的誤差是否服從正態(tài)分布?例某鐘表廠對(duì)生產(chǎn)的鐘進(jìn)行精確性檢查,抽取100個(gè)鐘作試驗(yàn),撥準(zhǔn)后隔24小時(shí)以后進(jìn)行檢查,將每個(gè)鐘的誤差(快或慢)按秒記錄下來.7.4非參數(shù)假設(shè)檢驗(yàn)為檢驗(yàn)骰子是否均勻,要把骰子實(shí)地投擲若干次,統(tǒng)計(jì)各點(diǎn)出現(xiàn)的頻率與1/6的差距.再如,某工廠制造一批骰子,聲稱它是均勻的.也就是說,在投擲中,出現(xiàn)1點(diǎn),2點(diǎn),…,6點(diǎn)的概率都應(yīng)是1/6.問題是:得到的數(shù)據(jù)能否說明“骰子均勻”的假設(shè)是可信的?非參數(shù)假設(shè)檢驗(yàn)研究的檢驗(yàn)是如何用子樣去擬合總體分布,所以又稱分布擬合優(yōu)度檢驗(yàn).包括擬合總體的分布函數(shù)和擬合總體分布的概率函數(shù).
檢驗(yàn)方法有:概率圖紙法、擬合優(yōu)度檢驗(yàn)、柯爾莫戈洛夫-斯米爾洛夫檢驗(yàn).7.4.1概率圖紙法使用概率紙可以很快判斷總體分布的類型又能粗略地估計(jì)總體的參數(shù),是檢驗(yàn)總體分布的一種簡單工具.正態(tài)概率紙是一張刻有直角坐標(biāo)的圖紙,它的橫坐標(biāo)軸的刻度是均勻的,表示觀察值,縱坐標(biāo)軸的刻度是不均勻的,表示概率,具體的刻度是通過函數(shù)換算出來的,即在普通的直角坐標(biāo)xot的縱坐標(biāo)軸(t軸)上原坐標(biāo)為t的點(diǎn)刻度為正態(tài)概率紙是一張刻有直角坐標(biāo)的圖紙,它的橫坐標(biāo)軸的刻度是均勻的,表示觀察值,縱坐標(biāo)軸的刻度是不均勻的,表示概率,具體的刻度是通過函數(shù)換算出來的,即在普通的直角坐標(biāo)xot的縱坐標(biāo)軸(t軸)上原坐標(biāo)為t的點(diǎn)刻度為例如縱軸上,原坐標(biāo)為1處的刻度為,原坐標(biāo)為2處的刻度為,原坐標(biāo)為-1處的刻度為但習(xí)慣上,在正態(tài)概率紙上的縱坐標(biāo)軸上標(biāo)明的數(shù)字是換算出的刻度的100倍,又由于是在取值,概率不可能為0,也不可能為1,故一般概率紙的縱軸的刻度都是從0.01~99.99.下面我們以正態(tài)概率圖紙為例介紹,其步驟如下:1.首先把樣本觀察值按從小到大的次序排列2.對(duì)每一個(gè)
,計(jì)算修正的頻率3.將點(diǎn)逐一點(diǎn)在正態(tài)概率紙上4.判斷若諸點(diǎn)在一條直線附近,則認(rèn)為該樣本來自正態(tài)總體;若諸點(diǎn)明顯不在一條直線附近,則認(rèn)為該樣本不是來自正態(tài)分布總體.7.4.2擬合優(yōu)度檢驗(yàn)
檢驗(yàn)法是在總體的分布未知時(shí),根據(jù)來自總體的樣本,檢驗(yàn)關(guān)于總體分布的假設(shè)的一種檢驗(yàn)方法.然后根據(jù)樣本的經(jīng)驗(yàn)分布和所假設(shè)的理論分布之間的吻合程度來決定是否接受原假設(shè).使用
檢驗(yàn)法對(duì)總體分布進(jìn)行檢驗(yàn)時(shí),我們先提出原假設(shè):
H0:總體
的分布函數(shù)為F(x)在用
檢驗(yàn)假設(shè)H0時(shí),若在H0下分布類型已知,但其參數(shù)未知,這時(shí)需要先用極大似然估計(jì)法估計(jì)參數(shù),然后作檢驗(yàn).分布擬合的的基本原理和步驟如下:1.將總體的取值范圍分成k個(gè)互不重迭的小區(qū)間,記作A1,A2,…,Ak.2.把落入第i個(gè)小區(qū)間Ai的樣本值的個(gè)數(shù)記作fi,稱為實(shí)測(cè)頻數(shù).所有實(shí)測(cè)頻數(shù)之和f1+f2+…+fk等于樣本容量n.3.根據(jù)所假設(shè)的理論分布,可以算出總體的值落入每個(gè)Ai的概率pi,于是npi就是落入Ai的樣本值的理論頻數(shù).標(biāo)志著經(jīng)驗(yàn)分布與理論分布之間的差異的大小.皮爾遜引進(jìn)如下統(tǒng)計(jì)量表示經(jīng)驗(yàn)分布與理論分布之間的差異:統(tǒng)計(jì)量的分布是什么?在理論分布已知的條件下,npi是常量實(shí)測(cè)頻數(shù)理論頻數(shù)皮爾遜證明了如下定理:若原假設(shè)中的理論分布F(x)已經(jīng)完全給定,那么當(dāng)時(shí),統(tǒng)計(jì)量的分布漸近(k-1)個(gè)自由度的分布.如果理論分布F(x)中有r個(gè)未知參數(shù)需用相應(yīng)的估計(jì)量來代替,那么當(dāng)時(shí),統(tǒng)計(jì)量的分布漸近(k-r-1)個(gè)自由度的分布.這些變量之間存在著一個(gè)制約關(guān)系:故統(tǒng)計(jì)量漸近(k-1)個(gè)自由度的分布.在理論分布F(x)完全給定的情況下,每個(gè)pi
都是確定的常數(shù).由棣莫佛-拉普拉斯中心極限定理,當(dāng)n充分大時(shí),實(shí)測(cè)頻數(shù)fi
漸近正態(tài),是k個(gè)近似正態(tài)的變量的平方和.因此在F(x)尚未完全給定的情況下,每個(gè)未知參數(shù)用相應(yīng)的估計(jì)量代替,就相當(dāng)于增加一個(gè)制約條件,因此,自由度也隨之減少一個(gè).若有r個(gè)未知參數(shù)需用相應(yīng)的估計(jì)量來代替,自由度就減少r個(gè).此時(shí)統(tǒng)計(jì)量漸近(k-r-1)個(gè)自由度的分布.查分布表可得臨界值,使得根據(jù)這個(gè)定理,對(duì)給定的顯著性水平,得拒絕域:(不需估計(jì)參數(shù))(估計(jì)r個(gè)參數(shù))皮爾遜定理是在n無限增大時(shí)推導(dǎo)出來的,因而在使用時(shí)要注意n要足夠大,以及npi
不太小這兩個(gè)條件.根據(jù)計(jì)算實(shí)踐,要求n不小于50,以及npi都不小于5.否則應(yīng)適當(dāng)合并區(qū)間,使npi滿足這個(gè)要求.如果根據(jù)所給的樣本值算得統(tǒng)計(jì)量的實(shí)測(cè)值落入拒絕域,則拒絕原假設(shè),否則就認(rèn)為差異不顯著而接受原假設(shè).從以上卡方分布擬合檢驗(yàn)的思想及步驟我們可知泊松分布,指數(shù)分布,正態(tài)分布等都可以進(jìn)行擬合檢驗(yàn),下面我們舉一個(gè)例子
例在數(shù)的前800位小數(shù)中,數(shù)字0,1,…9出現(xiàn)的次數(shù)如下:數(shù)字0
1
2
3
4
5
6
7
8
9頻數(shù)
74
92837980737775
76
91 利用卡方檢驗(yàn)法,檢驗(yàn)這些數(shù)字是否服從均勻分布()解此均勻是離散型的均勻分布,討論的共十個(gè)數(shù),各個(gè)數(shù)落在同一位置上的概率為0.1,共計(jì)800個(gè)位置,理論頻數(shù)為,沒有未知參數(shù).0123456789749283798073777576910.10.10.10.10.10.10.10.10.10.180808080808080808080-6123-10-7-3
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 石家莊市第四十中學(xué)2025年高一下化學(xué)期末檢測(cè)模擬試題含解析
- 2025屆山東省新泰第一中學(xué)北?;瘜W(xué)高一下期末學(xué)業(yè)質(zhì)量監(jiān)測(cè)試題含解析
- 2025屆浙江省浙南聯(lián)盟化學(xué)高一下期末教學(xué)質(zhì)量檢測(cè)試題含解析
- 校園讀物日常管理辦法
- 民工衣服庫存管理辦法
- 晚會(huì)捐贈(zèng)收入管理辦法
- 冬季水管防護(hù)管理辦法
- 合肥苗木采伐管理辦法
- 現(xiàn)代語文教育數(shù)字化資源整合平臺(tái)建設(shè)研究
- 小企業(yè)會(huì)計(jì)準(zhǔn)則的實(shí)務(wù)操作與案例分析
- 2024年遼寧沈陽水務(wù)集團(tuán)有限公司招聘筆試真題
- 濰坊交通發(fā)展集團(tuán)有限公司招聘筆試題庫2025
- 胸痛中心質(zhì)控管理
- 2025時(shí)政試題及答案(100題)
- 第七章城市軌道交通屏蔽門設(shè)備接口68課件
- 國家開放大學(xué)漢語言文學(xué)本科《中國現(xiàn)代文學(xué)專題》期末紙質(zhì)考試第三大題分析題庫2025春期版
- 成都大學(xué)附屬中學(xué)英語新初一分班試卷含答案
- 新22J01 工程做法圖集
- 創(chuàng)新創(chuàng)業(yè)大賽項(xiàng)目商業(yè)計(jì)劃書模板
- 2025年1月國家開放大學(xué)漢語言文學(xué)本科《心理學(xué)》期末紙質(zhì)考試試題及答案
- 糖尿病酮癥酸中毒疑難病例護(hù)理
評(píng)論
0/150
提交評(píng)論