六、旅游抽樣調(diào)查_第1頁
六、旅游抽樣調(diào)查_第2頁
六、旅游抽樣調(diào)查_第3頁
六、旅游抽樣調(diào)查_第4頁
六、旅游抽樣調(diào)查_第5頁
已閱讀5頁,還剩104頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、 第一節(jié)第一節(jié) 抽樣調(diào)查的意義抽樣調(diào)查的意義 第二節(jié)第二節(jié) 抽樣調(diào)查的基本概念及理論依據(jù)抽樣調(diào)查的基本概念及理論依據(jù) 第三節(jié)第三節(jié) 抽樣平均誤差抽樣平均誤差 第四節(jié)第四節(jié) 全及指標的推斷全及指標的推斷 第五節(jié)第五節(jié) 假設(shè)檢驗假設(shè)檢驗為什么要抽樣為什么要抽樣?為了收集必要的資料,對所研究對象(總體)的為了收集必要的資料,對所研究對象(總體)的全部元素逐一進行觀測,往往不很現(xiàn)實。全部元素逐一進行觀測,往往不很現(xiàn)實。抽抽樣樣原原因因元素多,搜集數(shù)據(jù)費元素多,搜集數(shù)據(jù)費時、費用大,不及時而時、費用大,不及時而使所得的數(shù)據(jù)無意義使所得的數(shù)據(jù)無意義總體龐大總體龐大, ,難以對難以對總體的全部元素總體的全部

2、元素進行研究進行研究檢查具有破壞性檢查具有破壞性炮彈、燈管、磚等炮彈、燈管、磚等第一節(jié)第一節(jié) 抽樣調(diào)查的意義抽樣調(diào)查的意義一、抽樣調(diào)查的概念一、抽樣調(diào)查的概念廣義:凡是抽取一部分單位進行觀察,并根據(jù)觀廣義:凡是抽取一部分單位進行觀察,并根據(jù)觀察結(jié)果來推斷全體的都是抽樣調(diào)查。察結(jié)果來推斷全體的都是抽樣調(diào)查。 可分為可分為非隨機抽樣非隨機抽樣和和隨機抽樣隨機抽樣兩種。兩種。狹義狹義:隨機抽樣。按照隨機原則從總體中抽取一:隨機抽樣。按照隨機原則從總體中抽取一部分單位進行觀察,并運用數(shù)理統(tǒng)計的原理,部分單位進行觀察,并運用數(shù)理統(tǒng)計的原理,以被抽取的那部分單位的數(shù)量特征為代表,對以被抽取的那部分單位的數(shù)

3、量特征為代表,對總體作出數(shù)量上的推斷分析。總體作出數(shù)量上的推斷分析。我國的抽樣調(diào)查應(yīng)用主要有:我國的抽樣調(diào)查應(yīng)用主要有: 國家和地方統(tǒng)計部門國家和地方統(tǒng)計部門 一系列抽樣調(diào)查制度:一系列抽樣調(diào)查制度:1%1%人口抽樣調(diào)查、城市人口抽樣調(diào)查、城市和農(nóng)村住戶調(diào)查、農(nóng)產(chǎn)量抽樣調(diào)查等。和農(nóng)村住戶調(diào)查、農(nóng)產(chǎn)量抽樣調(diào)查等。 三支調(diào)查隊:城市社會經(jīng)濟調(diào)查總隊、農(nóng)村社會三支調(diào)查隊:城市社會經(jīng)濟調(diào)查總隊、農(nóng)村社會經(jīng)濟調(diào)查總隊、企業(yè)調(diào)查總隊。經(jīng)濟調(diào)查總隊、企業(yè)調(diào)查總隊。 其他政府部門、社會團體和學(xué)術(shù)團體其他政府部門、社會團體和學(xué)術(shù)團體 婦女生育力調(diào)查(國家計劃生育委員會)婦女生育力調(diào)查(國家計劃生育委員會) 公眾

4、科學(xué)素養(yǎng)調(diào)查(全國科協(xié))公眾科學(xué)素養(yǎng)調(diào)查(全國科協(xié)) 語言與文字使用情況調(diào)查(教育部與國家語委)語言與文字使用情況調(diào)查(教育部與國家語委) 專業(yè)調(diào)查咨詢機構(gòu)專業(yè)調(diào)查咨詢機構(gòu) 央視調(diào)查咨詢中心、北京華通現(xiàn)代信息咨詢有限央視調(diào)查咨詢中心、北京華通現(xiàn)代信息咨詢有限公司、北京零點市場調(diào)查與分析公司等。公司、北京零點市場調(diào)查與分析公司等。二、抽樣調(diào)查的特點二、抽樣調(diào)查的特點(一)只抽取總體中的一部分單位進行調(diào)查(一)只抽取總體中的一部分單位進行調(diào)查(二)用一部分單位的指標數(shù)值去推斷總體的指標(二)用一部分單位的指標數(shù)值去推斷總體的指標數(shù)值數(shù)值(三)抽選部分單位時要遵循隨機原則(三)抽選部分單位時要遵循隨

5、機原則(四)抽樣調(diào)查會產(chǎn)生抽樣誤差,抽樣誤差可以計(四)抽樣調(diào)查會產(chǎn)生抽樣誤差,抽樣誤差可以計算,并且可以加以控制算,并且可以加以控制三三、抽樣調(diào)查的抽樣調(diào)查的范圍范圍有破壞性、不可能進行全面調(diào)查的事物可進行抽有破壞性、不可能進行全面調(diào)查的事物可進行抽樣調(diào)查樣調(diào)查全面調(diào)查實際辦不到的事物可進行抽樣調(diào)查全面調(diào)查實際辦不到的事物可進行抽樣調(diào)查節(jié)省人力、費用和時間,方式靈活節(jié)省人力、費用和時間,方式靈活在有些情況下,抽樣調(diào)查的結(jié)果比全面調(diào)查要準在有些情況下,抽樣調(diào)查的結(jié)果比全面調(diào)查要準確確5.5.用抽樣調(diào)查的資料修正和補充全面調(diào)查資料用抽樣調(diào)查的資料修正和補充全面調(diào)查資料6.6.抽樣調(diào)查方法可以用于

6、工業(yè)生產(chǎn)過程中的質(zhì)量控抽樣調(diào)查方法可以用于工業(yè)生產(chǎn)過程中的質(zhì)量控制制7.7.利用抽樣推斷的方法,可以對于某種總體的假設(shè)利用抽樣推斷的方法,可以對于某種總體的假設(shè)進行檢驗,來判斷這種假設(shè)的真?zhèn)危詻Q定取舍進行檢驗,來判斷這種假設(shè)的真?zhèn)?,以決定取舍第二節(jié)第二節(jié) 抽樣調(diào)查的基本概念及理論依抽樣調(diào)查的基本概念及理論依據(jù)據(jù)一、一、全及總體和抽樣總體全及總體和抽樣總體(1 1)全及總體,簡稱總體)全及總體,簡稱總體 全及總體是指所要認識對象的全體,全及總體是指所要認識對象的全體,總體是由具有總體是由具有某種共同性質(zhì)的許多單位組成,某種共同性質(zhì)的許多單位組成,是具有同一性質(zhì)是具有同一性質(zhì)的許多單位的集合體。

7、的許多單位的集合體。按其各單位標志性質(zhì)不同,可分為按其各單位標志性質(zhì)不同,可分為變量總體變量總體和和屬性總體屬性總體兩類。兩類。變量總體:各單位可用數(shù)量標志計量,變量總體是從研究數(shù)量標志的角度而言的;屬性總體:各單位用品質(zhì)標志描述,屬性總體是從研究是非品質(zhì)標志的角度而言的。 對于變量總體可分為對于變量總體可分為無限總體無限總體和和有限總體有限總體兩類。兩類。 可列的無限變量和不可列的無限變量??闪械臒o限變量和不可列的無限變量。 全及總體通常用大寫字母全及總體通常用大寫字母N N來表示。來表示。(2 2)抽樣總體,簡稱樣本)抽樣總體,簡稱樣本 是指從總體中按照隨機原則抽取的一部分是指從總體中按照

8、隨機原則抽取的一部分單位所構(gòu)成的集合體。樣本中的各個單位單位所構(gòu)成的集合體。樣本中的各個單位稱樣本單位。稱樣本單位。通常用小寫字母通常用小寫字母n n來表示。來表示。 樣本的大?。簶颖镜拇笮。?根據(jù)樣本容量的大小,可將樣本劃分為大樣本和根據(jù)樣本容量的大小,可將樣本劃分為大樣本和小樣本。小樣本。一般來說,當一般來說,當3030時,稱為大樣本;當時,稱為大樣本;當3030時稱為小樣本。時稱為小樣本。二、二、全及指標和抽樣指標全及指標和抽樣指標(1 1)全及指標)全及指標 根據(jù)全及總體各個單位的標志值或標志特征計算根據(jù)全及總體各個單位的標志值或標志特征計算的、反映總體某種屬性的綜合指標。唯一確定的、

9、反映總體某種屬性的綜合指標。唯一確定 變量總體變量總體 總體平均數(shù)總體平均數(shù) 屬性總體屬性總體 總體成數(shù)總體成數(shù)NXXNNP1PNNNNNQ110 總體標準差總體標準差和總體方差和總體方差2 2NXX22)(NXX2)(nxxi22)(nxxi2)(nxxnnp1pnnnnnq110(2 2)抽樣指標)抽樣指標由抽樣總體各個標志值或標志特征計算的綜合指標。由抽樣總體各個標志值或標志特征計算的綜合指標。 抽樣平均數(shù)抽樣平均數(shù) 抽樣成數(shù)抽樣成數(shù) 樣本標準差樣本標準差 樣本方差樣本方差FXFNXX或FFXXNXX22)()(或NNP1)(PPPp1Qffxxnxxs22)()(或fxfnxx或)1

10、(pppqpsnnp1是唯一確定的是唯一確定的是隨機變量,它會隨著樣是隨機變量,它會隨著樣本的不同而有不同的取值本的不同而有不同的取值px,PX,標指樣抽算計標指量總斷推(3 3)統(tǒng)計抽樣過程)統(tǒng)計抽樣過程 總體總體N N 樣本樣本n n (抽樣方式方法)(抽樣方式方法) (抽樣估計)(抽樣估計) (計算抽樣誤差)(計算抽樣誤差) 三三、抽樣方法和樣本可能數(shù)目、抽樣方法和樣本可能數(shù)目根據(jù)取樣的方式不同,抽樣方式可分為根據(jù)取樣的方式不同,抽樣方式可分為重復(fù)抽樣重復(fù)抽樣和和不重復(fù)抽樣不重復(fù)抽樣兩種。兩種。 重復(fù)抽樣的樣本是由重復(fù)抽樣的樣本是由n n次相互獨立的連續(xù)試驗所組次相互獨立的連續(xù)試驗所組成

11、的。每次試驗實在完全相同的條件下進行的。成的。每次試驗實在完全相同的條件下進行的。每個單位中選或不中選機會在每次都完全一樣。每個單位中選或不中選機會在每次都完全一樣。可見重置抽樣時:可見重置抽樣時:總體單位數(shù)在抽選過程中始終不變;總體單位數(shù)在抽選過程中始終不變;總體中各單位被抽中的可能性前后相同;總體中各單位被抽中的可能性前后相同;總體中各單位有被重復(fù)抽中的可能。總體中各單位有被重復(fù)抽中的可能。 不重復(fù)抽樣的樣本是由不重復(fù)抽樣的樣本是由n n次連續(xù)抽選的結(jié)果次連續(xù)抽選的結(jié)果組成組成, ,實質(zhì)上等于一次同時從總體中抽實質(zhì)上等于一次同時從總體中抽n n個個組成抽樣樣本。連續(xù)組成抽樣樣本。連續(xù)n n

12、次抽選的結(jié)果不是相次抽選的結(jié)果不是相互獨立的。每個單位的中選或不中選機會互獨立的。每個單位的中選或不中選機會在各次是不同的。在各次是不同的。可見可見,不重置抽樣時:不重置抽樣時:總體單位數(shù)在抽選過程中逐漸減少;總體單位數(shù)在抽選過程中逐漸減少;總體中各單位被抽中的可能性前后不斷變總體中各單位被抽中的可能性前后不斷變化;化;總體中各單位沒有被重復(fù)抽中的可能。總體中各單位沒有被重復(fù)抽中的可能。重復(fù)抽樣:又稱有放回抽樣。重復(fù)抽樣:又稱有放回抽樣。,例例如如:500015000150001 不重復(fù)抽樣:又稱不放回抽樣。不重復(fù)抽樣:又稱不放回抽樣。,例例如如:499814999150001 根據(jù)對樣本的要

13、求不同,抽樣方式又有根據(jù)對樣本的要求不同,抽樣方式又有考慮順序考慮順序抽樣抽樣和和不考慮順序抽樣不考慮順序抽樣兩種。兩種。 以上抽樣方法兩種分類還存在交叉情況,因而有:以上抽樣方法兩種分類還存在交叉情況,因而有:考慮順序的不重復(fù)抽樣、考慮順序的重復(fù)抽樣、考慮順序的不重復(fù)抽樣、考慮順序的重復(fù)抽樣、不考慮順序的不重復(fù)抽樣和不考慮順序的重復(fù)抽不考慮順序的不重復(fù)抽樣和不考慮順序的重復(fù)抽樣等四種。樣等四種。)!/(!nNNpnNnNnNC考慮順序的不重復(fù)抽樣考慮順序的不重復(fù)抽樣不考慮順序的不重復(fù)抽樣不考慮順序的不重復(fù)抽樣考慮順序的重復(fù)抽樣考慮順序的重復(fù)抽樣不考慮順序的重復(fù)抽樣不考慮順序的重復(fù)抽樣nnNC

14、1四、抽樣調(diào)查的理論依據(jù)四、抽樣調(diào)查的理論依據(jù) 1 1、大數(shù)、大數(shù)定律定律:隨著抽樣單位數(shù)的增加,抽樣平:隨著抽樣單位數(shù)的增加,抽樣平均數(shù)均數(shù) 有接近總體平均數(shù)有接近總體平均數(shù) 的趨勢。的趨勢。 2 2、中心極限定理:如果總體變量存在有限的平、中心極限定理:如果總體變量存在有限的平均數(shù)和方差,則不論這個總體變量的分布如何,均數(shù)和方差,則不論這個總體變量的分布如何,隨著抽樣單位數(shù)隨著抽樣單位數(shù)n n的增加,抽樣平均數(shù)的分布便的增加,抽樣平均數(shù)的分布便趨于正態(tài)分布。趨于正態(tài)分布。xX1 1、大數(shù)定律、大數(shù)定律(1 1)獨立同分布大數(shù)定律)獨立同分布大數(shù)定律 獨立的隨機變量獨立的隨機變量x x1 1

15、,x,x2 2,具有相同分布,且存在具有相同分布,且存在有限的數(shù)學(xué)期望有限的數(shù)學(xué)期望E(xE(xi i)=X)=X和方差和方差D(xD(xi i)=)=2 2,則對任,則對任意小的正數(shù)意小的正數(shù),有,有 該定律表明,當該定律表明,當n n足夠大時,獨立同分布的一系列足夠大時,獨立同分布的一系列隨機變量的算術(shù)平均數(shù)接近數(shù)學(xué)期望,即平均數(shù)隨機變量的算術(shù)平均數(shù)接近數(shù)學(xué)期望,即平均數(shù)具有穩(wěn)定性。具有穩(wěn)定性。1|1|lim1Xxnpniin(2 2)伯伯努力大數(shù)定律努力大數(shù)定律 設(shè)設(shè)m m是是n n次獨立隨機試驗中事件次獨立隨機試驗中事件A A發(fā)生的次數(shù),發(fā)生的次數(shù),p p是是事件事件A A在每次試驗中

16、發(fā)生的概率,則對于任意小的在每次試驗中發(fā)生的概率,則對于任意小的正數(shù)正數(shù),有,有 該定律表明,當該定律表明,當n n足夠大時,事件足夠大時,事件A A發(fā)生的頻率接發(fā)生的頻率接近事件近事件A A發(fā)生的概率,即頻率具有穩(wěn)定性。發(fā)生的概率,即頻率具有穩(wěn)定性。1|limpnmpn2 2、中心極限定理、中心極限定理(1 1)獨立同分布中心極限定理)獨立同分布中心極限定理 隨機變量隨機變量x x1 1,x,x2 2,獨立且服從同一分布,若存在獨立且服從同一分布,若存在有限的數(shù)學(xué)期望有限的數(shù)學(xué)期望E(xE(xi i)=X)=X和方差和方差D(xD(xi i)=)=2 2,當,當nn時,隨機變量的總和時,隨機

17、變量的總和 趨于均值為趨于均值為nxnx、方差為、方差為nn2 2的正態(tài)分布。即的正態(tài)分布。即nn時時 或或 結(jié)論:不論總體服從何種分布,只要它的數(shù)學(xué)期望結(jié)論:不論總體服從何種分布,只要它的數(shù)學(xué)期望和方差存在,從中抽取容量為和方差存在,從中抽取容量為n n的樣本,則這個樣的樣本,則這個樣本的總和或平均數(shù)是個隨機變量,當本的總和或平均數(shù)是個隨機變量,當n n充分大時,充分大時,趨于正態(tài)分布。趨于正態(tài)分布。),(2nnxNxi),(2nXNx),(npqnpNX(2 2)德莫)德莫夫夫- -拉普拉斯中心極限定理拉普拉斯中心極限定理 如果用如果用X X表示表示n n次獨立試驗中事件次獨立試驗中事件A

18、 A發(fā)生的次數(shù),發(fā)生的次數(shù),p p是事件是事件A A在每次試驗中發(fā)生的概率,則在每次試驗中發(fā)生的概率,則X X服從二項服從二項分布分布B(n,p)B(n,p),當,當nn時,時,X X趨于均值為趨于均值為npnp、方差、方差為為npqnpq的正態(tài)分布,即的正態(tài)分布,即 在現(xiàn)實生活中,一個隨機變量服從于正態(tài)分布未在現(xiàn)實生活中,一個隨機變量服從于正態(tài)分布未必很多,但多個隨機變量和的分布趨近于正態(tài)分必很多,但多個隨機變量和的分布趨近于正態(tài)分布則是普遍存在的。布則是普遍存在的。樣本均值的抽樣分布 一般的,當總體服從一般的,當總體服從 N N( (, ,2 2 ) )時,來自該總體時,來自該總體的容量為

19、的容量為n n的樣本的均值的樣本的均值 X X也服從正態(tài)分布,也服從正態(tài)分布, X X 的的期望為期望為,方差為,方差為2 2/ /n n。即。即 X XN N( (, ,2 2/ /n n) )??傮w分布總體分布n = 4抽樣分布抽樣分布X5x50 xn =165 . 2x第三節(jié)第三節(jié) 抽樣平均誤差抽樣平均誤差一、抽樣誤差的概念一、抽樣誤差的概念 抽樣誤差是指樣本指標和總體指標之間數(shù)量上抽樣誤差是指樣本指標和總體指標之間數(shù)量上的差別。的差別。 以數(shù)學(xué)符號表示以數(shù)學(xué)符號表示:| | |、|p-P|p-P|Xx統(tǒng)計調(diào)查誤差種類統(tǒng)計調(diào)查誤差種類按產(chǎn)生的原因分,統(tǒng)計調(diào)查誤差可分為登記性誤差和代表性按

20、產(chǎn)生的原因分,統(tǒng)計調(diào)查誤差可分為登記性誤差和代表性誤差。誤差。 1 1、登記性誤差、登記性誤差 是指統(tǒng)計調(diào)查時,由于主觀原因在登記、匯總、計算、是指統(tǒng)計調(diào)查時,由于主觀原因在登記、匯總、計算、過錄中所產(chǎn)生的誤差。登記性誤差不論全面調(diào)查或非全面過錄中所產(chǎn)生的誤差。登記性誤差不論全面調(diào)查或非全面調(diào)查都可能產(chǎn)生調(diào)查都可能產(chǎn)生。 2 2、代表性誤差又可分為兩種:系統(tǒng)性誤差和隨機誤差。、代表性誤差又可分為兩種:系統(tǒng)性誤差和隨機誤差。 系統(tǒng)性誤差又稱偏差,它是由于抽樣調(diào)查沒有遵循隨機原系統(tǒng)性誤差又稱偏差,它是由于抽樣調(diào)查沒有遵循隨機原則而產(chǎn)生的誤差。只要遵循隨機原則就可以避免。則而產(chǎn)生的誤差。只要遵循隨機

21、原則就可以避免。 隨機誤差又稱偶然的代表性誤差,它是指沒有登記性誤差隨機誤差又稱偶然的代表性誤差,它是指沒有登記性誤差的前提下,又遵循了隨機原則所產(chǎn)生的誤差。隨機誤差是的前提下,又遵循了隨機原則所產(chǎn)生的誤差。隨機誤差是抽樣調(diào)查固有的誤差。抽樣誤差是指這種隨機誤差。抽樣調(diào)查固有的誤差。抽樣誤差是指這種隨機誤差。 抽樣平均誤差抽樣實際誤差抽樣誤差偶然的代表性誤差隨機誤差偏差系統(tǒng)性誤差代表性誤差登記性誤差統(tǒng)計調(diào)查誤差二、影響抽樣平均誤差的因素二、影響抽樣平均誤差的因素(一)全及總體標志的變動程度(一)全及總體標志的變動程度 全及總體標志變動程度與抽樣平均誤差成正比關(guān)全及總體標志變動程度與抽樣平均誤差

22、成正比關(guān)系。系。(二)抽樣單位數(shù)的多少(二)抽樣單位數(shù)的多少 樣本單位數(shù)與抽樣平均誤差的大小成反比關(guān)系。樣本單位數(shù)與抽樣平均誤差的大小成反比關(guān)系。(三)抽樣組織的方式(三)抽樣組織的方式三、抽樣平均誤差的意義三、抽樣平均誤差的意義 抽樣平均誤差是一系列抽樣指標(平均指標或抽樣平均誤差是一系列抽樣指標(平均指標或成數(shù))的標準差。成數(shù))的標準差。 抽樣平均誤差既是實際可以運用于衡量抽樣抽樣平均誤差既是實際可以運用于衡量抽樣指標對于全及指標代表性程度的一個尺度;也是指標對于全及指標代表性程度的一個尺度;也是計算抽樣指標與全及指標之間變異范圍的一個根計算抽樣指標與全及指標之間變異范圍的一個根據(jù);同時,

23、在組織抽樣調(diào)查中,也是確定抽樣單據(jù);同時,在組織抽樣調(diào)查中,也是確定抽樣單位數(shù)多少的計算依據(jù)之一。位數(shù)多少的計算依據(jù)之一。四、抽樣平均誤差的計算四、抽樣平均誤差的計算(一)抽樣平均數(shù)的抽樣平均誤差(一)抽樣平均數(shù)的抽樣平均誤差 抽樣平均誤差就是一系列抽樣指標的標準差,通抽樣平均誤差就是一系列抽樣指標的標準差,通常用符號常用符號來表示。用來表示。用 表示抽樣平均誤差。表示抽樣平均誤差。 - -抽樣平均數(shù)抽樣平均數(shù) - -全及平均數(shù)全及平均數(shù) K-K-抽樣平均數(shù)或抽樣成數(shù)的個數(shù)抽樣平均數(shù)或抽樣成數(shù)的個數(shù)上述公式一般不用于實際計算。上述公式一般不用于實際計算。KxXx2)(xXx(1 1)重復(fù)抽樣抽

24、樣平均數(shù)的抽樣平均誤差)重復(fù)抽樣抽樣平均數(shù)的抽樣平均誤差 在重復(fù)抽樣條件下,抽樣平均誤差與全及總體的在重復(fù)抽樣條件下,抽樣平均誤差與全及總體的標準差成正比關(guān)系;與抽樣總體單位數(shù)平方根成標準差成正比關(guān)系;與抽樣總體單位數(shù)平方根成反比關(guān)系。反比關(guān)系。 上式表明抽樣平均數(shù)的平均誤差僅為全及總體標上式表明抽樣平均數(shù)的平均誤差僅為全及總體標準差的準差的 。 上式還表明抽樣平均誤差華總體標志變動度的大上式還表明抽樣平均誤差華總體標志變動度的大小成正比,而和樣本單位的平方根成反比。小成正比,而和樣本單位的平方根成反比。nnx2n1例:從例:從4040、5050、7070、8080中抽取中抽取3 3個組成樣本

25、,個組成樣本,在重復(fù)抽樣下,求抽樣平均誤差。在重復(fù)抽樣下,求抽樣平均誤差。求總體標準差,直接用計算器統(tǒng)計功能鍵可求總體標準差,直接用計算器統(tǒng)計功能鍵可以求出以求出:13. 9381.15nx81.152NXX求抽樣平均誤差(2 2)不重復(fù)抽樣抽樣平均數(shù)的抽樣平均誤差)不重復(fù)抽樣抽樣平均數(shù)的抽樣平均誤差 在不重復(fù)抽樣的情況下,在不重復(fù)抽樣的情況下, 在總體單位數(shù)在總體單位數(shù)N N很大的情況下,可以近似地表示為很大的情況下,可以近似地表示為 即不重復(fù)抽樣平均方差等于重復(fù)抽樣平均方差乘即不重復(fù)抽樣平均方差等于重復(fù)抽樣平均方差乘以校正因子以校正因子1-n/N1-n/N。實際中,兩者很接近。實際中,兩者

26、很接近。)1(2NnNnx)1 (2Nnnx例:從從4040、5050、7070、8080中抽取中抽取3 3個組成樣本,個組成樣本,在不重復(fù)抽樣下,求抽樣平均誤差。在不重復(fù)抽樣下,求抽樣平均誤差。求總體標準差,直接用計算器統(tǒng)計功能鍵可求總體標準差,直接用計算器統(tǒng)計功能鍵可以求出:以求出:27. 514343181.1522NnNnx81.152NXX求抽樣平均誤差(二)抽樣成數(shù)的抽樣平均誤差(二)抽樣成數(shù)的抽樣平均誤差 全及成數(shù)標準差平方,也稱為全及成數(shù)標準差平方,也稱為“交替標志的方差交替標志的方差”。 為計算交替標志的方差,必須將交替變異的標志過渡為計算交替標志的方差,必須將交替變異的標志

27、過渡到數(shù)量標志。用到數(shù)量標志。用x=1x=1表示單位具有這一標志,用表示單位具有這一標志,用x=0 x=0表表示單位不具有這一標志。示單位不具有這一標志。具有這一標志的單位數(shù)占全及總體的比重具有這一標志的單位數(shù)占全及總體的比重不具有這一標志的單位數(shù)占全及總體的比重不具有這一標志的單位數(shù)占全及總體的比重 這兩個成數(shù)之和等于這兩個成數(shù)之和等于1,1,即即 。nnp1nnq0pqnnnnqp1, 101交替標志的平均數(shù)和標準差計算表交替標志的平均數(shù)和標準差計算表 交替標志交替標志 單位數(shù)單位數(shù) 變量變量x x成數(shù)成數(shù) 離差離差 離差平方離差平方 離差平方離差平方 (變量)(成數(shù))(變量)(成數(shù)) 乘

28、權(quán)數(shù)乘權(quán)數(shù) x f xf x f xf 合格品合格品 1 1 p p 1-p (1-p)p p 1-p (1-p)2 2 (1-p) (1-p)2 2p p不合格品不合格品 0 q 0 0-p (0-p) 0 q 0 0-p (0-p)2 2 (0-p) (0-p)2 2q q 合計合計 - p+q=1 p - q - p+q=1 p - q2 2p+pp+p2 2q=qpq=qppqpqpfxfx01 交替標志的標準差為交替標志的標準差為因為因為q+p=1 q=1-pq+p=1 q=1-p所以所以 可見,成數(shù)的平均數(shù)就是成數(shù)本身;成數(shù)的方差可見,成數(shù)的平均數(shù)就是成數(shù)本身;成數(shù)的方差就是就是p

29、(1-p)p(1-p)。qpqpqpppffxxp222)0()1 ()()1 (ppqpp)1 (2ppp 重復(fù)抽樣抽樣成數(shù)的平均誤差重復(fù)抽樣抽樣成數(shù)的平均誤差 不重復(fù)抽樣抽樣成數(shù)的平均誤差不重復(fù)抽樣抽樣成數(shù)的平均誤差nppp)1 ( )1 ()1 (Nnnppp取得取得的途徑有:的途徑有: 1. 1. 用過去全面調(diào)查或抽樣調(diào)查的資料,用過去全面調(diào)查或抽樣調(diào)查的資料,若同時有若同時有n n個個的資料,應(yīng)選用數(shù)值較的資料,應(yīng)選用數(shù)值較大的那個;大的那個;2. 2. 用樣本標準差用樣本標準差S S代替全及標準差代替全及標準差;3. 3. 在大規(guī)模調(diào)查前,先搞個小規(guī)模的試在大規(guī)模調(diào)查前,先搞個小規(guī)

30、模的試驗性的調(diào)查來確定驗性的調(diào)查來確定S S,代替,代替;4. 4. 用估計的方法。用估計的方法。使用時間( 小時)抽查燈泡個數(shù)(個)組中值900以下2875900950492595010001197510001050711025105011008410751100115018112511501200711751200以上31225合計200燈泡使用壽命資料求樣本平均數(shù)和樣本成數(shù)的抽樣平均誤差求樣本平均數(shù)和樣本成數(shù)的抽樣平均誤差。求燈泡平均使用時間、標準差和燈泡合格率(樣本)求燈泡平均使用時間、標準差和燈泡合格率(樣本)63.532nxx1057fxfx%5 .91200183p求燈泡使用時間

31、抽樣平均誤差:求燈泡使用時間抽樣平均誤差:小時79. 320063.53nx在不重復(fù)抽樣下抽樣平均誤差:小時75. 311000020010000200163.5322NnNnx在重復(fù)抽樣下抽樣平均誤差:求燈泡合格率的抽樣平均誤差求燈泡合格率的抽樣平均誤差:%97. 1200085. 0915. 01nppp在不重復(fù)抽樣下抽樣平均誤差:%95. 111000020010000200085. 0915. 011NnNnppx在重復(fù)抽樣下抽樣平均誤差:第四節(jié)第四節(jié) 全及指標的推斷全及指標的推斷抽樣推斷要求抽樣推斷要求 抽樣推斷是指按已經(jīng)抽定的樣本指標(樣本平均抽樣推斷是指按已經(jīng)抽定的樣本指標(樣本

32、平均數(shù)或樣本成數(shù))來估計總體指標(總體平均數(shù)或數(shù)或樣本成數(shù))來估計總體指標(總體平均數(shù)或總體成數(shù)),或其所在的區(qū)間范圍??傮w成數(shù)),或其所在的區(qū)間范圍。一、一、抽樣極限誤差抽樣極限誤差 抽樣誤差范圍就是指變動的抽樣指標與確抽樣誤差范圍就是指變動的抽樣指標與確定的全及指標之間離差的可能范圍。定的全及指標之間離差的可能范圍。 統(tǒng)計上把這個給定的抽樣誤差范圍叫做抽統(tǒng)計上把這個給定的抽樣誤差范圍叫做抽樣極限誤差,也稱置信區(qū)間。樣極限誤差,也稱置信區(qū)間。 用用 與與 表示抽樣平均數(shù)與抽樣成數(shù)的表示抽樣平均數(shù)與抽樣成數(shù)的抽樣極限誤差,則有抽樣極限誤差,則有xp|Xxx|PppXXxxXxXppPpPxxx

33、XxpppPpxxXppPX 抽樣誤差范圍是以抽樣誤差范圍是以 或或P P為中心的兩個為中心的兩個的距離,的距離,這抽樣誤差范圍的原意。這抽樣誤差范圍的原意。 但由于全及指標是個未知的數(shù)值,而抽樣指標通但由于全及指標是個未知的數(shù)值,而抽樣指標通過實測是可以求得的。過實測是可以求得的。 因此,抽樣誤差范圍的實際意義是要求被估計的因此,抽樣誤差范圍的實際意義是要求被估計的全及指標全及指標 或或P P,落在抽樣指標一定范圍內(nèi)。,落在抽樣指標一定范圍內(nèi)。 即全及指標即全及指標 、P P的區(qū)間估計為的區(qū)間估計為X二、二、可信程度可信程度 抽樣平均誤差抽樣平均誤差是表明抽樣估計的準確度,抽樣是表明抽樣估計

34、的準確度,抽樣極限誤差極限誤差是表明抽樣估計準確程度的范圍。是表明抽樣估計準確程度的范圍。在在給定的準確程度范圍內(nèi)的抽樣估計,還要研究其給定的準確程度范圍內(nèi)的抽樣估計,還要研究其估計的可靠程度,即可信程度。估計的可靠程度,即可信程度。 是用一定倍數(shù)的是用一定倍數(shù)的表示的抽樣指標與全及指標表示的抽樣指標與全及指標之間的絕對離差。這里的倍數(shù)用之間的絕對離差。這里的倍數(shù)用t t來表示,稱概率來表示,稱概率度,也稱置信度。度,也稱置信度。xxtXx|pptPp|nXxtxx| nPPPptpp)1 (| 上述公式的意義在于,在一定上述公式的意義在于,在一定的條件下,的條件下,當概率度當概率度t t越大

35、,則抽樣誤差范圍越大,可越大,則抽樣誤差范圍越大,可能樣本落在誤差范圍內(nèi)的概率越大,從而能樣本落在誤差范圍內(nèi)的概率越大,從而抽樣估計的可信程度也就越高;反之,當抽樣估計的可信程度也就越高;反之,當t t越小,則越小,則越小,可能樣本落在誤差范圍越小,可能樣本落在誤差范圍內(nèi)的概率越小,從而抽樣估計的可信程度內(nèi)的概率越小,從而抽樣估計的可信程度也就越低。也就越低。 概率度和概率之間保持一定的函數(shù)關(guān)系,即概率概率度和概率之間保持一定的函數(shù)關(guān)系,即概率是概率度的函數(shù)。用是概率度的函數(shù)。用P P表示概率以說明抽樣估計的表示概率以說明抽樣估計的可靠程度,其函數(shù)關(guān)系可表示為可靠程度,其函數(shù)關(guān)系可表示為 P=

36、F(t) P=F(t) 在正態(tài)分布的情況下,從總體中隨機抽取一個樣在正態(tài)分布的情況下,從總體中隨機抽取一個樣本加以觀察,則該樣本抽樣指標落在某一范圍本加以觀察,則該樣本抽樣指標落在某一范圍 內(nèi)的概率,是用占正態(tài)曲線面積內(nèi)的概率,是用占正態(tài)曲線面積的大小表示的。即的大小表示的。即tttxxdtetxXtxPtF2221)()(xxtxtx 例如,樣本平均數(shù)落在總體平均數(shù)左右例如,樣本平均數(shù)落在總體平均數(shù)左右1個個的范圍的范圍內(nèi)(內(nèi)(t t=1=1)的概率是)的概率是68.27%; 2個個的范圍內(nèi)(的范圍內(nèi)(t t=2=2)的)的概率是概率是95.45% 正態(tài)分布曲線與橫軸圍成的面積等于正態(tài)分布曲

37、線與橫軸圍成的面積等于1.置信度置信度F(t)是概是概率度率度t的函數(shù),兩者是一一對應(yīng)的正比例關(guān)系。兩者常用的的函數(shù),兩者是一一對應(yīng)的正比例關(guān)系。兩者常用的數(shù)值主要有:數(shù)值主要有: t=1 F(t)=68.27% t=1.96 F(t)=95% t=2 F(t)=95.45% t=3 F(t)=99.73%68.27%95.45%99.73%抽樣極限誤差抽樣極限誤差),(2nXNxXxx2x3x2xx3x第五節(jié) 假設(shè)檢驗 一、假設(shè)檢驗的概念 二、假設(shè)檢驗的一般方法 三、正態(tài)總體參數(shù)的檢驗 四、總體成數(shù)的假設(shè)檢驗例例1 設(shè)某廠生產(chǎn)一種燈泡,其壽命服從正態(tài)設(shè)某廠生產(chǎn)一種燈泡,其壽命服從正態(tài)分布,從

38、過去較長一段時間的生產(chǎn)情況看,分布,從過去較長一段時間的生產(chǎn)情況看,燈泡的平均壽命為燈泡的平均壽命為1500小時。標準差為小時。標準差為100小時,現(xiàn)從新批量生產(chǎn)的燈泡中隨機抽小時,現(xiàn)從新批量生產(chǎn)的燈泡中隨機抽取取100只作試驗,測得平均壽命為只作試驗,測得平均壽命為1530小小時。時。 問:新批量生產(chǎn)燈泡的平均壽命與以往的問:新批量生產(chǎn)燈泡的平均壽命與以往的燈泡使用壽命是否有顯著差異?燈泡使用壽命是否有顯著差異? 分析分析:從抽樣的結(jié)果上看,新批量生產(chǎn)的燈泡中從抽樣的結(jié)果上看,新批量生產(chǎn)的燈泡中100只燈只燈泡平均壽命為泡平均壽命為1530小時,比以往的燈泡使用的平均壽命小時,比以往的燈泡使

39、用的平均壽命1500小時增加了小時增加了30小時。這小時。這30小時的差異產(chǎn)生有二種情小時的差異產(chǎn)生有二種情況。況。 A.新批量生產(chǎn)燈泡的平均壽命與以往的燈泡使用壽命無新批量生產(chǎn)燈泡的平均壽命與以往的燈泡使用壽命無顯著差異,顯著差異,30小時的差異是抽樣的隨機性造成的。小時的差異是抽樣的隨機性造成的。 B.抽樣的隨機性不可能造成抽樣的隨機性不可能造成30小時這么大的差異,新批小時這么大的差異,新批量生產(chǎn)燈泡的平均壽命確實增加了。量生產(chǎn)燈泡的平均壽命確實增加了。 可先假設(shè)新批量生產(chǎn)燈泡的平均壽命與以往的燈可先假設(shè)新批量生產(chǎn)燈泡的平均壽命與以往的燈泡使用壽命無顯著差異。然后利用抽樣泡使用壽命無顯著

40、差異。然后利用抽樣100只燈只燈泡的信息來檢驗我們的假設(shè)是否正確。泡的信息來檢驗我們的假設(shè)是否正確。 如果假設(shè)成立,說明新批量生產(chǎn)燈泡的平均壽命如果假設(shè)成立,說明新批量生產(chǎn)燈泡的平均壽命與以往的燈泡使用壽命無顯著差異。與以往的燈泡使用壽命無顯著差異。 如果假設(shè)不成立,說明新批量生產(chǎn)燈泡的平均壽如果假設(shè)不成立,說明新批量生產(chǎn)燈泡的平均壽命與以往的燈泡使用壽命有否顯著的差異。命與以往的燈泡使用壽命有否顯著的差異。一、假設(shè)檢驗的概念 1.概念: 根據(jù)一定隨機樣本所提供的信息,用它來判斷總體位置參數(shù)事先的假設(shè)是否可信的統(tǒng)計分析方法。2.基本思想: 為了判斷總體的某個特征,先根據(jù)決策要求,對總體特征做出

41、一個原假設(shè),然后從總體中抽取一定容量的隨機樣本,計算和分析樣本數(shù)據(jù),對總體的原假設(shè)做假設(shè)檢驗,進而作出接受或拒絕原假設(shè)的決策。假設(shè)檢驗的基本思想假設(shè)檢驗的基本思想. 因此我們因此我們拒絕假設(shè)拒絕假設(shè) = 20. 如果這是如果這是總體的真實總體的真實均值均值 = 50H0這個值不像這個值不像我們應(yīng)該得我們應(yīng)該得到的樣本均到的樣本均值值 .二、假設(shè)檢驗的一般方法 小概率原理是假設(shè)檢驗的基本依據(jù),即認為小概率事件在一次試驗中幾乎是不可能發(fā)生的。當進行假設(shè)檢驗時,先假設(shè)H0正確,在此假設(shè)下,若小概率事件A出現(xiàn)的概率很小,例如P(A)=0.01,經(jīng)過取樣試驗后,A出現(xiàn)了,則違反了上述原理,我們認為這是一

42、個不合理的結(jié)果。 這時,我們只能懷疑作為小概率事件A的前提假設(shè)H0的正確性,于是否定H0。反之,如果試驗中A沒有出現(xiàn),我們就沒有理由否定假設(shè)H0,從而做出接受H0的結(jié)論。下面我們通過實例來說明假設(shè)檢驗的基本思想及推理方法。原假設(shè)原假設(shè) 是關(guān)于總體均值而非樣本統(tǒng)計量的假設(shè)是關(guān)于總體均值而非樣本統(tǒng)計量的假設(shè) 總是假設(shè)原假設(shè)是正確的總是假設(shè)原假設(shè)是正確的原假設(shè)可能被接受也可能被拒絕原假設(shè)可能被接受也可能被拒絕替代替代假設(shè)假設(shè) 是原假設(shè)的對立是原假設(shè)的對立替代替代假設(shè)可能被接受也可能被拒絕假設(shè)可能被接受也可能被拒絕 替代替代假設(shè)是試圖要建立的檢驗假設(shè)是試圖要建立的檢驗提出原假設(shè)和提出原假設(shè)和替代替代假

43、設(shè)假設(shè) 什么是原假設(shè)?什么是原假設(shè)?(Null Hypothesis)1. 待檢驗的假設(shè),又稱待檢驗的假設(shè),又稱“0假設(shè)假設(shè)”2. 如果錯誤地作出決策會導(dǎo)致一系列后果如果錯誤地作出決策會導(dǎo)致一系列后果3. 總是有等號總是有等號 , 或或 4. 表示為表示為 H0H0: 某一數(shù)值某一數(shù)值 指定為指定為 = 號,即號,即 或或 例如例如, H0: 3190(克)(克)什么是什么是替代替代假設(shè)?假設(shè)?(Alternative Hypothesis)1. 與原假設(shè)對立的假設(shè)與原假設(shè)對立的假設(shè)2. 總是有不等號總是有不等號: , 或或 3. 表示為表示為 H1H1: 某一數(shù)值,或某一數(shù)值,或 某一數(shù)值某

44、一數(shù)值例如例如, H1: 3910(克克),或,或 39103910克克 假設(shè)檢驗分為雙側(cè)檢驗和單側(cè)檢驗1. 雙側(cè)檢驗 如果提出的原假設(shè)是總體的參數(shù)等于某一數(shù)值。如果提出的原假設(shè)是總體的參數(shù)等于某一數(shù)值。如果樣本的統(tǒng)計量明顯大于或明顯小于總體參數(shù)如果樣本的統(tǒng)計量明顯大于或明顯小于總體參數(shù)的這一數(shù)值,就可以拒絕原假設(shè),則稱這種檢驗的這一數(shù)值,就可以拒絕原假設(shè),則稱這種檢驗為雙側(cè)檢驗。為雙側(cè)檢驗。 如原假設(shè)為如原假設(shè)為H0 : , 那么只要那么只要 或或 二者之一成立,就可二者之一成立,就可以否定原假設(shè)以否定原假設(shè)H0 ,這種假設(shè)檢驗就是雙側(cè)檢驗。,這種假設(shè)檢驗就是雙側(cè)檢驗。 當我們所關(guān)心的問題是

45、要檢驗樣本均值與總體均當我們所關(guān)心的問題是要檢驗樣本均值與總體均值或樣本比率與總體比率有沒有顯著性差異性,值或樣本比率與總體比率有沒有顯著性差異性,而不問差異的方向是正差或是負差時,可采用雙而不問差異的方向是正差或是負差時,可采用雙側(cè)檢驗。側(cè)檢驗。 0XX 0XX 0XX 總體均值的雙側(cè)檢驗的原假設(shè)和總體均值的雙側(cè)檢驗的原假設(shè)和替代替代假設(shè)為:假設(shè)為: 原假設(shè)為:原假設(shè)為: H0 : 替代替代假設(shè)為:假設(shè)為: H1 : 總體比率的雙側(cè)檢驗的原假設(shè)和總體比率的雙側(cè)檢驗的原假設(shè)和替代替代假設(shè)為:假設(shè)為: 原假設(shè)為:原假設(shè)為: H0 : 替代替代假設(shè)為:假設(shè)為: H1 : 0XX 0XX 0PP 0

46、PP 2. 單側(cè)檢驗單側(cè)檢驗 (1)左側(cè)檢驗)左側(cè)檢驗 如果提出的原假設(shè)是總體的參數(shù)不少于某一數(shù)如果提出的原假設(shè)是總體的參數(shù)不少于某一數(shù)值。值。 如果樣本的統(tǒng)計量明顯小于總體參數(shù)的這一數(shù)值,如果樣本的統(tǒng)計量明顯小于總體參數(shù)的這一數(shù)值,就可以拒絕原假設(shè),則稱這種檢驗為左單側(cè)檢驗。就可以拒絕原假設(shè),則稱這種檢驗為左單側(cè)檢驗。 例例3 某外貿(mào)企業(yè)生產(chǎn)茶葉用于出口,其重量服從正態(tài)分某外貿(mào)企業(yè)生產(chǎn)茶葉用于出口,其重量服從正態(tài)分布,根據(jù)以前的資料已知總體標準差是布,根據(jù)以前的資料已知總體標準差是1克,按規(guī)定平均克,按規(guī)定平均重量不低于重量不低于150克,現(xiàn)從一批即將出口的茶葉從中抽取克,現(xiàn)從一批即將出口的

47、茶葉從中抽取25包進行檢驗,測得其平均重量包進行檢驗,測得其平均重量149.35克,現(xiàn)問這一批茶克,現(xiàn)問這一批茶葉是否符合規(guī)定?葉是否符合規(guī)定? 這是一個左側(cè)檢驗問題。應(yīng)建立的原假設(shè)和備擇假設(shè)為:這是一個左側(cè)檢驗問題。應(yīng)建立的原假設(shè)和備擇假設(shè)為: 原假設(shè):原假設(shè): H0 :這批茶葉每包平均重量不低于:這批茶葉每包平均重量不低于150克;克; 替代替代假設(shè)為假設(shè)為H1 :這批茶葉每包平均重量少于:這批茶葉每包平均重量少于150克;克; 原假設(shè):原假設(shè): H0 : 替代替代假設(shè)為假設(shè)為:H1 : )(150 克X)(150 克X 當我們所關(guān)心的問題是要檢驗總體均值與總體比當我們所關(guān)心的問題是要檢驗

48、總體均值與總體比率是否低于預(yù)先的數(shù)值,此時應(yīng)采用左側(cè)檢驗。率是否低于預(yù)先的數(shù)值,此時應(yīng)采用左側(cè)檢驗??傮w均值的左側(cè)檢驗的原假設(shè)和總體均值的左側(cè)檢驗的原假設(shè)和替代替代假設(shè)為:假設(shè)為: 原假設(shè)為:原假設(shè)為: H0 : 替代替代假設(shè)為:假設(shè)為: H1 : 總體比率的總體比率的左側(cè)左側(cè)檢驗的原假設(shè)和檢驗的原假設(shè)和替代替代假設(shè)為:假設(shè)為: 原假設(shè)為:原假設(shè)為: H0 : 替代替代假設(shè)為:假設(shè)為: H1 : 0XX 0XX 0PP 0PP (2)右側(cè)檢驗)右側(cè)檢驗 如果提出的原假設(shè)是總體的參數(shù)不大于某如果提出的原假設(shè)是總體的參數(shù)不大于某一數(shù)值。一數(shù)值。 如果樣本的統(tǒng)計量明顯大于總體參數(shù)的這如果樣本的統(tǒng)計量

49、明顯大于總體參數(shù)的這一數(shù)值,就可以拒絕原假設(shè),則稱這種檢一數(shù)值,就可以拒絕原假設(shè),則稱這種檢驗為右單側(cè)檢驗。驗為右單側(cè)檢驗。例例4 某企業(yè)大量生產(chǎn)袋裝食品,按規(guī)定每袋重量不得少于某企業(yè)大量生產(chǎn)袋裝食品,按規(guī)定每袋重量不得少于250克。今從一批該種食品中隨機抽取克。今從一批該種食品中隨機抽取50袋,發(fā)現(xiàn)有袋,發(fā)現(xiàn)有5袋袋低于低于250克。若規(guī)定不符合標準的比例超過克。若規(guī)定不符合標準的比例超過5%就不得出就不得出廠,問這批食品能否出廠?廠,問這批食品能否出廠?這是一個右單側(cè)檢驗問題。應(yīng)建立的原假設(shè)和備擇假設(shè)為:這是一個右單側(cè)檢驗問題。應(yīng)建立的原假設(shè)和備擇假設(shè)為: 原假設(shè):原假設(shè): H0 :這批食

50、品不符合標準的比例不超過:這批食品不符合標準的比例不超過5% 備擇假設(shè)為備擇假設(shè)為H1 :這批食品不符合標準的比例超過:這批食品不符合標準的比例超過5% 即即: H0: H1:%5P%5P 當我們所關(guān)心的問題是要檢驗總體均值與總體比當我們所關(guān)心的問題是要檢驗總體均值與總體比率是否超過預(yù)先的數(shù)值,此時應(yīng)采用右單側(cè)檢驗。率是否超過預(yù)先的數(shù)值,此時應(yīng)采用右單側(cè)檢驗。 總體均值的右側(cè)檢驗的原假設(shè)和總體均值的右側(cè)檢驗的原假設(shè)和替代替代假設(shè)為:假設(shè)為: 原假設(shè)為:原假設(shè)為: H0 : 替代替代假設(shè)為:假設(shè)為: H1 : 總體比率的右側(cè)檢驗的原假設(shè)和總體比率的右側(cè)檢驗的原假設(shè)和替代替代假設(shè)為:假設(shè)為: 原假

51、設(shè)為:原假設(shè)為: H0 : 替代替代假設(shè)為:假設(shè)為: H1 : 0XX 0XX 0PP 0PP 雙側(cè)檢驗與單側(cè)檢驗雙側(cè)檢驗與單側(cè)檢驗 (假設(shè)的形式)什么檢驗統(tǒng)計量?什么檢驗統(tǒng)計量?u 用于假設(shè)檢驗問題的統(tǒng)計量用于假設(shè)檢驗問題的統(tǒng)計量u 選擇統(tǒng)計量的方法與參數(shù)估計相同,需考慮選擇統(tǒng)計量的方法與參數(shù)估計相同,需考慮是大樣本還是小樣本是大樣本還是小樣本總體方差已知還是未知總體方差已知還是未知檢驗統(tǒng)計量的基本形式為檢驗統(tǒng)計量的基本形式為nxz0規(guī)定顯著性水平規(guī)定顯著性水平 什么是顯著性水平?什么是顯著性水平?1. 是一個概率值是一個概率值2. 原假設(shè)為真時,拒絕原假設(shè)的概率原假設(shè)為真時,拒絕原假設(shè)的概

52、率 被稱為抽樣分布的拒絕域被稱為抽樣分布的拒絕域3. 表示為表示為 (alpha) 常用的常用的 值有值有0.01, 0.05, 0.104. 由研究者事先確定由研究者事先確定作出統(tǒng)計決策作出統(tǒng)計決策計算檢驗的統(tǒng)計量計算檢驗的統(tǒng)計量根據(jù)給定的顯著性水平根據(jù)給定的顯著性水平 ,查表得出相應(yīng),查表得出相應(yīng)的臨界值的臨界值Z Z 或或Z Z /2 /2將檢驗統(tǒng)計量的值與將檢驗統(tǒng)計量的值與 水平的臨界值進水平的臨界值進行比較行比較得出接受或拒絕原假設(shè)的結(jié)論得出接受或拒絕原假設(shè)的結(jié)論兩類錯誤分析 小概率原理是假設(shè)檢驗的基本依據(jù),然而,對于小概率事件,無論其概率多么小,還是可能發(fā)生的,所以,利用小概率原理

53、為基礎(chǔ)的假設(shè)檢驗方法進行檢驗,可能會做出錯誤的判斷,主要有兩種形式 (1)原假設(shè)H0實際是正確的,但卻錯誤地拒絕了H0,這樣就犯了“棄真”的錯誤,通常稱為第一類錯誤。由于僅當所考慮的小概率事件A發(fā)生時才拒絕H0,所以犯第一類錯誤的概率就是條件概率:(2)原假設(shè)H0實際是不正確的,但是卻錯誤地接受了H0,這樣就犯了“取偽”的錯誤,通常稱為第二類錯誤。犯第二類錯誤的概率記為。)|(00真拒HHP 我們自然希望犯這兩類錯誤的概率越小越好。但當樣本容量n確定后,犯這兩類錯誤的概率不可能同時被控制,通常在我們根據(jù)歷史經(jīng)驗選取恰當?shù)娘@著性水平后,通過擴大樣本容量n的方式來使第二類錯誤的概率減小。 錯誤和錯

54、誤和 錯誤的關(guān)系錯誤的關(guān)系你不能同時減你不能同時減少兩類錯誤少兩類錯誤!三、正態(tài)總體參數(shù)的檢驗1)方差已知時對一個正態(tài)總體均值的檢驗 正態(tài)總體的方差已知,要檢驗總體的均值,其原假設(shè)為:H1:X=X0。與之相對應(yīng)的替代假設(shè)可能有三種:X X0,X XO, X XO 1雙側(cè)檢驗雙側(cè)檢驗 雙側(cè)檢驗中的決策規(guī)則為:雙側(cè)檢驗中的決策規(guī)則為: 當當 ,就拒絕原假設(shè),就拒絕原假設(shè)H0 ,接受備擇假設(shè),接受備擇假設(shè)H1 ; 當當 ,就不能拒絕原假設(shè),就不能拒絕原假設(shè)H0 ,即接受原假設(shè),即接受原假設(shè)H0 我們把這種根據(jù)計算我們把這種根據(jù)計算Z值的大小而作出決策的假設(shè)檢驗,稱值的大小而作出決策的假設(shè)檢驗,稱為為

55、Z檢驗法。雙側(cè)檢驗決策如圖檢驗法。雙側(cè)檢驗決策如圖81所示。所示。 ) 1 , 0(/0NnXxZ2/|ZZ 2/|ZZ 以下以例以下以例1為例,(假定顯著水平為例,(假定顯著水平 =0.05)說明)說明假設(shè)檢驗的過程。假設(shè)檢驗的過程。1.建立原假設(shè)和備擇假設(shè);建立原假設(shè)和備擇假設(shè); 原假設(shè)原假設(shè)H0: 備擇假設(shè)備擇假設(shè)H1 :2.確定檢驗統(tǒng)計量為:確定檢驗統(tǒng)計量為: 3. 規(guī)定顯著性水平規(guī)定顯著性水平 =0.05,由于這是雙側(cè)檢驗,由于這是雙側(cè)檢驗,查標準正態(tài)分布表可以得臨界值;查標準正態(tài)分布表可以得臨界值; )(1500 小時X)(1500 小時XnXxZ/096. 12/05. 02/

56、ZZ4.根據(jù)樣本的數(shù)據(jù)計算檢驗統(tǒng)計量的實際值為:根據(jù)樣本的數(shù)據(jù)計算檢驗統(tǒng)計量的實際值為: 5.作用統(tǒng)計決策并加以解釋。作用統(tǒng)計決策并加以解釋。 由于由于 ,所以拒絕原假設(shè),所以拒絕原假設(shè)H0 ,選擇備擇,選擇備擇假設(shè)假設(shè)H1 ,即新批量生產(chǎn)燈泡的平均壽命與以往使,即新批量生產(chǎn)燈泡的平均壽命與以往使用燈泡的平均壽命有顯著的差異。用燈泡的平均壽命有顯著的差異。3100/10015001530/0nXxZ96. 13025. 0ZZ 2左單側(cè)檢驗左單側(cè)檢驗 左單側(cè)檢驗中的決策規(guī)則為:左單側(cè)檢驗中的決策規(guī)則為: 當當 ,就拒絕原假設(shè),就拒絕原假設(shè)H0 ,接受備擇假設(shè),接受備擇假設(shè)H1 ; 當當 ,就不

57、能拒絕原假設(shè),就不能拒絕原假設(shè)H0 ,即接受原假設(shè),即接受原假設(shè)H0 ) 1 , 0(/0NnXxZZZZZ 3右側(cè)檢驗右側(cè)檢驗 右側(cè)檢驗中的決策規(guī)則為:右側(cè)檢驗中的決策規(guī)則為: 當當 ,就拒絕原假設(shè),就拒絕原假設(shè)H0 ,接受備擇假設(shè),接受備擇假設(shè)H1 ; 當當 ,就不能拒絕原假設(shè),就不能拒絕原假設(shè)H0 ,即,即接受接受原假設(shè)原假設(shè)H0 右單側(cè)檢驗決策如圖右單側(cè)檢驗決策如圖93所示。所示。 ) 1 , 0(/0NnXxZZZ ZZ 1. 2已知,關(guān)于的檢驗(z檢驗) z檢驗法 在上一節(jié)例1中,已討論過正態(tài)總體 , 當2已知時,關(guān)于=0的檢驗問題。在這些問題中,我們都是利用H0為真時服從N(0,

58、1)分布的統(tǒng)計量 來確定拒絕域的,這種檢驗法常稱為z檢驗法。(利用服從正態(tài)分布的統(tǒng)計量z 進行的假設(shè)檢驗稱為z檢驗法) z檢驗的步驟(同前)),(2Nnxz/0 z檢驗的決策準則如下(1)雙側(cè)檢驗:當 時,拒絕原假設(shè)H0;否則接受原假設(shè)H0。 (2)左側(cè)檢驗:當 時,拒絕原假設(shè)H0;否則接受原假設(shè)H0。 (3)右側(cè)檢驗:當 時,拒絕原假設(shè)H0;否則接受原假設(shè)H0。0100:HH2/zz 0100:HH0100:HHzz zz某機床廠加工一種零件,根據(jù)經(jīng)驗知道,該廠加某機床廠加工一種零件,根據(jù)經(jīng)驗知道,該廠加工零件的橢圓度近似服從正態(tài)分布,其總體均值工零件的橢圓度近似服從正態(tài)分布,其總體均值為為 0=0.081mm,總體標準差為,總體標準差為 = 0.025 0.025 。今換。今換一種新機床進行加工,抽取一種新機床進行加工,抽取n=200個零件進行檢個零件進行檢驗,得到的橢圓度為驗,得到的橢圓度為0.076mm。試問新機床加工。試問新機床加工零件的橢圓度的均值與以前有無顯著差異?(零件的橢圓度的均值與以前有無顯著差異?( 0.05)均值的雙尾均值的雙尾 Z 檢驗檢驗(計算結(jié)果)H0: = 0.081H1: 0.081 = 0.0

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論