第七章統(tǒng)計抽樣_第1頁
第七章統(tǒng)計抽樣_第2頁
第七章統(tǒng)計抽樣_第3頁
第七章統(tǒng)計抽樣_第4頁
第七章統(tǒng)計抽樣_第5頁
已閱讀5頁,還剩62頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、l1、抽樣調(diào)查的概念l抽樣調(diào)查是按照隨機性原則,從研究總體中抽取一部分單位進行調(diào)查(或觀察),用這一部分單位的數(shù)量特征(值)去推斷研究總體的特征(值),從而達到認識總體的目的,也稱為隨機抽樣調(diào)查或概率抽樣調(diào)查。l1、 抽樣調(diào)查是一種非全面調(diào)查l2、 按隨機原則抽取單位l3、 從數(shù)量上推斷總體l4、抽樣調(diào)查會產(chǎn)生調(diào)查誤差,但這種誤差可以預(yù)防和控制。(1)不能作全面調(diào)查的時候使用(如破壞性實驗)。(2) 理論上可以全面調(diào)查,但實際很難實現(xiàn)。(3)節(jié)省人力、費用和時間的考慮。(4)與全面調(diào)查相比可以調(diào)查更多的項目。(5)提高調(diào)查質(zhì)量和數(shù)字的準確性,修正和補充全面調(diào)查資料。 調(diào)查誤差(抽樣誤差和工作誤

2、差)l1、幾個基本概念l(1)全及總體和抽樣總體l總體:研究對象的全體??傮w單位數(shù)N。l樣本:從總體中抽取部分單位的集合體。l樣本容量:樣本中所包含的單位數(shù)n。l樣本個數(shù):從總體中可能抽取的樣本的數(shù)量。l抽樣比:樣本容量與總體單位數(shù)之比。l全及指標:是根據(jù)總體各單位標志值計算的反映總體特征的指標。它是個確定值,在抽樣中也稱為參數(shù)(即總體的數(shù)量特征)。l主要有:全及平均數(shù)X,全及成數(shù)PN1/N;全及方差2及標準差 。l抽樣(樣本)指標,是按樣本中各單位的標志值計算的反映樣本特征的指標。它是一個隨機變量,在抽樣中也稱為統(tǒng)計量,在進行統(tǒng)計推算的時候它又是總體參數(shù)的估計量。l主要有:樣本平均數(shù)x,樣本

3、成數(shù):pn1/n,樣本方差s2及標準差s:l重復(fù)抽樣:每次都從N個總體單位中抽取樣本(始終有N個候選單位),同一單位有多次重復(fù)中選的可能。(放回抽樣)l樣本數(shù)目:l考慮順序:l不考慮順序:nnNNBnnNnNCD1l不重復(fù)抽樣:每個單位只能被抽中一次。即它的候選單位是遞減的:N,N1,N2,Nn1。l樣本數(shù)目:l考慮順序:l不考慮順序:!(?。ǎǎ?n-NNnN)n-N3-N2-N1-NNA1)!nN( !n!Nn1)n-N- - -2-N1-NNnNC?。ǎ╨例有4名工人,每人每月產(chǎn)量分別是40,50,70,80,現(xiàn)隨機從其中抽取兩人,l測算考慮順序的樣本個數(shù)。重復(fù)抽樣考慮順序樣本數(shù):

4、42=16,不重復(fù)抽樣考慮順序樣本數(shù):43=12。l抽樣方案設(shè)計的基本原則l1、隨機性原則l2、實現(xiàn)最大抽樣效果原則精度費用1009050100簡單隨機抽樣簡單隨機抽樣和系統(tǒng)抽樣和系統(tǒng)抽樣l分層抽樣和整群抽樣分層抽樣和整群抽樣l 多階段抽樣多階段抽樣l l簡單隨機抽樣:l在總體各單位都有同等被抽取可能性的假設(shè)條件下進行的在總體各單位都有同等被抽取可能性的假設(shè)條件下進行的抽樣。抽樣。l抽樣方法又分為直接抽選法、抽簽法、隨機數(shù)碼表法,抽樣方法又分為直接抽選法、抽簽法、隨機數(shù)碼表法,l系統(tǒng)抽樣,也稱機械抽樣、等距抽樣l 是將總體各單位按某種標志排序,按相等的間隔抽取樣本是將總體各單位按某種標志排序,

5、按相等的間隔抽取樣本 單位的抽樣單位的抽樣l有關(guān)標志排隊 隨機起點等距抽樣l無關(guān)標志排隊 半距起點等距抽樣l 對稱等距抽樣l分層抽樣,也稱類型抽樣l是將總體按某種標志分成若干層(類型組),之后在每是將總體按某種標志分成若干層(類型組),之后在每層中按隨機原則抽取樣本單位。層中按隨機原則抽取樣本單位。l類型比例抽樣:l類型適宜抽樣:l整群抽樣:l將總體分成若干群,再按隨機原則抽取部分群,所抽取將總體分成若干群,再按隨機原則抽取部分群,所抽取的群內(nèi)所有單位作為樣本單位的抽樣方法。的群內(nèi)所有單位作為樣本單位的抽樣方法。 群內(nèi)方差 群間方差nnNNiinniiiiNNinRNRNiiiiinl多階段抽

6、樣是指在抽選樣本時,并不是一次直接從總體中抽取,而是分兩個或兩個以上的階段來進行。l l適用條件:l1、調(diào)查范圍廣泛,沒有合適的抽樣框或者范圍太大。l2、相對節(jié)約人力和物力。l3、可以利用現(xiàn)成的行政區(qū)劃、組織系統(tǒng)作為劃分階段的依據(jù)。 l抽樣(實際)誤差是指樣本指標與總體指標之間數(shù)量上的差別。l抽樣平均誤差是指所有可能出現(xiàn)的樣本指標的標準差,所有可能出現(xiàn)的樣本指標與總體指標的平均離差。l影響抽樣平均誤差的因素21)(Xxikxl1.全及總體標志的變異程度與抽樣誤差成正比.l2.樣本容量與抽樣誤差成反比.l3.抽樣的組織方式與抽樣方法對誤差的影響。l重復(fù)抽樣比不重復(fù)抽樣的抽樣平均誤差大;l簡單隨機

7、抽樣、整群抽樣比類型抽樣、機械抽樣的抽樣平均誤差大。 )(不重復(fù)抽樣:重復(fù)抽樣:抽樣平均數(shù)的平均誤差Nnnxnx12)()(不重復(fù)抽樣:)(重復(fù)抽樣:抽樣成數(shù)的平均誤差:NnnPppnPpp111l1、用過去調(diào)查取得的資料。l2、用樣本方差資料代替總體方差資料。l3、利用小規(guī)模調(diào)查的資料。l4、用估計的資料。l1、簡單隨機抽樣)(不重復(fù)抽樣:重復(fù)抽樣:抽樣平均數(shù)的平均誤差Nnnxnx12)()(不重復(fù)抽樣:)(重復(fù)抽樣:抽樣成數(shù)的平均誤差:NnnPppnPpp111l例:從2500件電子元件中隨機抽取4%的元件做樣本,抽出的樣本里有件耐用時間不合格,計算該電子產(chǎn)品的不合格率的抽樣平均誤差。l解

8、:首先確定樣本元件的不合格率,即抽樣成數(shù)。樣本容量樣本元件中的不合格數(shù)P%5%425005%.)().(.2.18%1005%)(15%NnnPppnPpp142250010011000501050111)(不重復(fù)抽樣:重復(fù)抽樣:抽樣成數(shù)的平均誤差:)()(kiiiiNnn)p(ppn)p(ppn)p(pn)p(p1111111)(不重復(fù)抽樣:重復(fù)抽樣:抽樣成數(shù)的平均誤差:,1,2222)(不重復(fù)抽樣:重復(fù)抽樣:抽樣平均數(shù)的平均誤差Nnnxnninxiiiil例:某鄉(xiāng)共有農(nóng)戶4000戶,用類型抽樣的方法按10%抽取樣本, 情況資料見表:推斷全鄉(xiāng)抽樣平均每戶收入和抽樣方差。農(nóng)戶總數(shù)樣本數(shù)樣本平均

9、收入抽樣標準差糧食作物區(qū)技術(shù)作物區(qū)250015002501503600540052754000400l解:根據(jù)資料,,2.92-1,3.08x3799.37540004004003799.375Nnnx4003799.375nxnnx4001507525052nniiiii22ii)()(不重復(fù)抽樣重復(fù)抽樣:抽樣平均數(shù)的平均誤差14275222400150540025036002l一般認為,無關(guān)標志排隊等距抽樣近似于簡單隨機抽樣,因此一般按簡單隨機抽樣方法計算抽樣誤差。l有關(guān)標志排隊等距抽樣可以看作類型抽樣,因此按類型抽樣方法計算抽樣平均誤差。l整群抽樣采用的都是不重復(fù)抽樣,l計算時要使用修正

10、系數(shù)l平均數(shù)抽樣平均誤差:l成數(shù)抽樣平均誤差:22(1)(),bxibbsrrRxxSSr為群間方差。r)pp(S)Rr(rsnippp221)RrR(1l例:某工廠生產(chǎn)某種燈泡,在連續(xù)生產(chǎn)720小時中,每隔24小時抽取1小時的全部產(chǎn)品加以檢查。根據(jù)抽樣資料計算,燈泡平均使用壽命為1200小時,群間方差為60小時,計算樣本平均數(shù)的抽樣誤差。l 3841113072060120072030306022.)()(r ,R,S,xRrrSxbb解:根據(jù)資料l應(yīng)用樣本統(tǒng)計量作為估計量去估計總體參數(shù),稱為參數(shù)估計。l如果在估計中,直接用估計量作為固定的數(shù)值對參數(shù)作出估計即為點估計。l如果在估計中要對參數(shù)

11、做出帶有某種可靠性的估計并給出對應(yīng)于這一可靠性或置信度的區(qū)間,即為區(qū)間估計。ppxxppxxpxpPpxXxPpPXxXPpXx經(jīng)過變換,有,l抽樣誤差范圍與抽樣平均誤差之間的關(guān)系是:n)P(PppnxxPpXxppxxt,tttPptXx1圍,度來衡量的相對誤差范是以抽樣平均誤差為尺計上稱為置信度。稱為概率度,在數(shù)理統(tǒng)l正態(tài)分布曲線由正態(tài)概率密度函數(shù)給出:l當=0,=1時,正態(tài)分布稱為標準正態(tài)分布,N(0,1)。dtetxXtxPtFtttxx2221)(xx+3x-3x+2x+x-x-268.27%95.45%99.73%x頻率l1)確定概率保證和概率度t。l2)抽取一個樣本容量為n的樣本

12、。l3)計算樣本平均數(shù)和標準差。在有限總體不重復(fù)抽樣時,標準差修正為:l4)構(gòu)造置信區(qū)間:Nn1nppxxpPpxXxl也就是說:l如果從正態(tài)總體抽取一個容量為n的簡單隨機樣本,并構(gòu)造區(qū)間: l我們有F(t) 的把握說,這個區(qū)間包含總體平均數(shù)X。l ppxxpPpxXxl1)對于樣本取自總體方差已知的非正態(tài)分布,當樣本容量足夠大時,仍然用上述區(qū)間作為總體平均數(shù)的置信區(qū)間。l2)當總體方差2未知時,用樣本方差s2代替。l例題:l某工業(yè)企業(yè)報告期生產(chǎn)某種橡膠輪胎10000個,從中抽取05%進行耐磨性能檢驗,結(jié)果得到樣本的平均磨損量為5775毫克,平均磨損量的樣本方差為50000,根據(jù)有關(guān)規(guī)定,在規(guī)

13、定時間內(nèi)的磨損量低于6000毫克為正品。試以95%的概率保證估計全部產(chǎn)品的平均磨損率。l已知毫克之間。毫克至在胎的平均磨損量的概率保證推斷該批輪即:以總體平均磨損量為抽樣的極限誤差平均磨損量的平均誤差查正態(tài)分布概率表得為大樣本,樣本容量985836025713959861577598616231961623196195500005775305050100002.%.xX.t.t%,)t (F,S,x,%.nxxxnxl確定原則:保證預(yù)期精確程度和可靠程度,確定恰當?shù)谋匾獦颖緮?shù)目。 l依據(jù):l1、可靠程度和精確程度。l2、總體標志變異程度。l3、抽樣組織方法。l1、簡單隨機抽樣22222212p

14、x2)p(pttn2xnxxnnttt位:抽樣成數(shù)的必要抽樣單兩端平方移項:樣單位:抽樣平均指標的必要抽重復(fù)抽樣:)p(ptN)p(pNttNNtNnnxxpx2nn)-1tt1122222222位:抽樣成數(shù)的必要抽樣單兩端平方移項:(樣單位:抽樣平均指標的必要抽不重復(fù)抽樣:l2、類型抽樣l3、整群抽樣)p(ptNN)p(pttNNt)p(pttp2x22px22nnnn11122222222位:抽樣成數(shù)的必要抽樣單樣單位:抽樣平均指標的必要抽不重復(fù)抽樣:位:抽樣成數(shù)的必要抽樣單樣單位:抽樣平均指標的必要抽重復(fù)抽樣:22222222bp2bbx2bStRRStStRRStrr數(shù):不重復(fù)抽樣必要

15、抽樣群l例:某車間加工螺桿10000件,為確定其直徑是否合格,決定從中抽取部分進行測量。為使直徑的測量誤差不超過0.1(可靠度取99%),按過去經(jīng)驗生產(chǎn)該螺桿的標準差為0.8,問至少應(yīng)抽取多少件測量才可滿足上述要求?l解:這里已知N=10000件, =0.1,s=0.8lF(t)=0.99,查正態(tài)概率表可得t=2.58。l按重復(fù)抽樣計算時l同時,以前加工螺桿的合格品率為98%,今要檢驗該批螺桿的合格率,為使合格率的測量誤差不超過1%(可靠度95%),問抽取多少件檢驗才能滿足要求?lF(t)=0.95, t=1.96 , =0.01,p=0.98,l按重復(fù)抽樣計算時x4261.08.058.22

16、22222xxtnp753010980198096112222.).(.)P(Ptnppl假設(shè)檢驗:根據(jù)一定的隨機樣本信息,判斷總體未知參數(shù)作出的假設(shè)是否可信 的統(tǒng)計分析方法。l基本思想:為了判斷總體的某個特征,先對總體特征作出一定的假設(shè),在從總體中抽取一定容量的樣本,計算和分析樣本數(shù)居,對原假設(shè)作出接受或拒絕的決策。;XXH,XXXXH)(;XXH,XXXXH (2);XXH,XXH (1):0:0:0010001000103)(:)(:l假設(shè)檢驗決策結(jié)果決策 假設(shè)真實不真實不否定正確犯第二類錯誤(取偽錯誤)否定犯第一類錯誤(棄真錯誤)正確 l第一步:建立假設(shè)。l要求:原假設(shè)必須包含等號在內(nèi)

17、,備擇假設(shè)可在不等、大于、小于三者任選。l檢驗結(jié)果只有兩種可能:接受原假設(shè)就必須拒絕備擇假設(shè);拒絕原假設(shè),就必須接受備擇假設(shè)(發(fā)生錯誤的概率 )。l第二步:選擇顯著水平 。l第三步:尋找檢驗H0的統(tǒng)計量,確定其分布,計算統(tǒng)計量。l第四步:用檢驗統(tǒng)計量值與臨界值比較,若統(tǒng)計量值落在否定域內(nèi),說明原假設(shè)與樣本描述的情況有顯著差異,則拒絕原假設(shè),(犯錯誤的概率為 );如果統(tǒng)計量落在接受域,則接受原假設(shè)。l第五步:做出決策。l(一)、方差已知時,對一個正態(tài)總體均值的檢驗。l(1)l檢驗統(tǒng)計量為,:010XX:HXXH 022l1-l ),(10NnXxZ0接受域拒絕域拒絕域l例:某公司出口魚罐頭,標準

18、規(guī)格是每罐250克,根據(jù)以往經(jīng)驗,標準差為3克?,F(xiàn)從一批產(chǎn)品中抽取100罐檢驗,其平均重量為251克,假定重量服從正態(tài)分布,規(guī)定顯著水平為0.05,問該批產(chǎn)品是否合乎出口標準。l1)建立假設(shè): lH0:X =X0=250 ,H1:X X0 =250l2)計算統(tǒng)計量3331003250251103250.nXxZ),(NnXxZ),(NX00l確定顯著水平。 =0.05,l雙側(cè)檢驗臨界值:l現(xiàn)z=3.33,遠遠大于臨界值1.96,故否定原假設(shè)。即該批罐頭重量不符合標準。96.12Zl也可以通過求X的置信區(qū)間來檢驗假設(shè),如果求出的區(qū)間包含X ,就接受原假設(shè),否則就拒絕。l如上題的置信區(qū)間為:l由于

19、X =250未包含在區(qū)間內(nèi),否定原假設(shè)。).,.(xn.5825142250961正態(tài)分布010010XX:HXXXX:HXXH 0;或,;:lZll接受域l拒絕域l例:某廠生產(chǎn)一種產(chǎn)品,原月產(chǎn)量服從平均值X=75,方差 =14的正態(tài)分布,設(shè)備更新后,為了考察產(chǎn)量是否提高,抽查了6個月產(chǎn)量,求得平均產(chǎn)量為78,假設(shè)方差不變,在顯著性水平=0.05的情況下,月產(chǎn)量是否有顯著提高?l解:假設(shè)275X:H75XXH 010;:明顯提高。則設(shè)備更新后月產(chǎn)量有,故否定原假設(shè)因為,臨界值顯著性水平檢驗統(tǒng)計量:,00.056/147578H1.645Z1.645Z0.051.964Z010010XX:HXX

20、XX:HXXH 0;或,;:l-Zll接受域l拒絕域l如果檢驗統(tǒng)計量來自大樣本,則按照中心極限定理,不論總體分布是否已知,是否正態(tài),均可用Z統(tǒng)計量來近似。l檢驗統(tǒng)計量n/SXx0t。,則拒絕域為(分布表可得臨界值,查)若()。,則拒絕域為分布表可得臨界值,查)若()。,則拒絕域為(分布表可得臨界值,查)若(:tttXXH3t,ttXXH2tt-,ttXXH1010101222l例:某食品廠每罐罐頭標準重量為500克?,F(xiàn)隨機抽10罐來檢查機器工作情況,10罐的重量為(單位:克):l495、510、505、498、503、492、502、512、497、506l假定重量服從近似正態(tài)分布,試問這段時

21、間機器工作是否正常(給定顯著水平5%)。l建立假設(shè): H0:=500 ,H1:500,l由樣本計算:l查表l計算檢驗統(tǒng)計量:l由于t=0.972.26,因此,不能拒絕原假設(shè),即機器沒有發(fā)生異常。50. 6,502sx2621102.)(t97. 01050. 6|500502|500|nsxtl對總體成數(shù)的假設(shè)檢驗必須在大樣本條件下進行,所以應(yīng)當進行Z檢驗。l檢驗統(tǒng)計量為樣本成數(shù))(P(Zn/P1PPP0受原假設(shè),拒絕原假設(shè),否則接,則當若受原假設(shè)。,拒絕原假設(shè),否則接,則當若受原假設(shè)。,拒絕原假設(shè),否則接,則當若,:-ZZHZZHZZH0020PP1PP1PP1l不同的樣本容量有不同的t分布,即:對每一個可能

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論