抽樣推斷PPT參考課件.ppt_第1頁
抽樣推斷PPT參考課件.ppt_第2頁
抽樣推斷PPT參考課件.ppt_第3頁
抽樣推斷PPT參考課件.ppt_第4頁
抽樣推斷PPT參考課件.ppt_第5頁
已閱讀5頁,還剩120頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、抽樣估計的現(xiàn)實應(yīng)用,例1 一汽車輪胎制造商生產(chǎn)一種被認為壽命更長的新型輪胎。,120個 樣本,測試,平均里程: 36,500公里,推斷,新輪胎 平均壽命: 36,500公里,400個 樣本,支持人數(shù): 160,推斷,支持該候選人的選民 占全部選民的比例: 160/400=40%,例2:某黨派想支持某一候選人參選美國某州議員,為了決定是否支持該候選人,該黨派領(lǐng)導(dǎo)需要估計支持該候選人的民眾占全部登記投票人總數(shù)的比例。由于時間及財力的限制:,1,第七章 抽樣推斷,第一節(jié) 抽樣推斷的基礎(chǔ)理論 第二節(jié) 抽樣誤差 第三節(jié) 抽樣估計 第四節(jié) 樣本容量的確定,2,第一節(jié) 抽樣估計的意義,一、抽樣估計的定義 二

2、、抽樣估計的特點 三、抽樣估計的運用 四、抽樣估計的一般步驟,3,指樣本單位的抽取不受主觀因素及其他系統(tǒng)性因素的影響,每個總體單位都有均等的被抽中機會,抽樣估計,按照隨機原則 從調(diào)查對象中抽取一部分單位進行調(diào)查,并以調(diào)查結(jié)果對總體數(shù)量特征作出具有一定可靠程度的估計與推斷,從而認識總體的一種統(tǒng)計方法,4,統(tǒng)計推斷,全及總體指標:參數(shù)(未知量),樣本總體指標:統(tǒng)計量(已知量),抽樣估計,5,并非所有的抽樣估計都按隨機原 則抽取樣本,也有非隨機抽樣,總體,隨機樣本,非隨機樣本,與總體分布特征相同,與總體分布特征不同,6,按隨機原則抽取樣本單位 目的是推斷總體的數(shù)量特征 抽樣推斷的結(jié)果具有一定的可靠程

3、度,抽樣誤差可以事先計算并控制,抽樣估計的特點,7,不可能進行全面調(diào)查時 不必要進行全面調(diào)查時 來不及進行全面調(diào)查時 對全面調(diào)查資料進行補充修正時,抽樣估計的適用范圍,8,設(shè) 計 抽 樣 方 案,抽 取 樣 本 單 位,收 集 樣 本 數(shù) 據(jù),計 算 樣 本 統(tǒng) 計 量,推 斷 總 體 參 數(shù),抽樣估計的一般步驟,9,第二節(jié) 抽樣調(diào)查的基本概念及理論依據(jù),一、全及總體和抽樣總體 二、全及指標和抽樣指標 三、抽樣方法和樣本的可能數(shù)目 四、 抽樣調(diào)查的理論依據(jù),10,全及總體,研究對象的全體,即第一章中學過的總體。,抽樣總體,按隨機原則從全及總體中抽取一部分單位組成的集合體,又叫抽樣總體。,樣本總

4、體中所包括的單位數(shù)叫樣本容量,一般用n表示 1、大樣本(n30 2、小樣本(n30),全及總體中所包括的單位數(shù)一般用N表示。 1、有限總體 2、無限總體,11,設(shè)總體中 個總體單位某項標志的標志值分別 為 ,其中具有某種屬性的有 個 單位,不具有某種屬性的有 個單位,則, 總體平均數(shù)(又叫總體均值):,12, 總體標準差:, 總體方差:,13, 總體成數(shù):, 總體是非標志的標準差:, 總體是非標志的方差:,14,設(shè)樣本中 個樣本單位某項標志的標志值 分別為 ,其中具有和不具有某 種屬性的樣本單位數(shù)目分別為 和 個,則, 樣本平均數(shù)(又叫樣本均值):,15, 樣本單位標志值的標準差:, 樣本單位

5、標志值的方差:,為 的無偏估計,為 的無偏估計,16, 樣本成數(shù):, 樣本單位是非標志的標準差:, 樣本單位是非標志的方差:,為 的 無偏估計,為 的 無偏估計,17,當樣本容量很大時,1/n,與1/(n-1)相差不大,樣本方差的分式,可以直接除以n,與總本的方差計算分式保持一致。,18,例3:某大公司人事部經(jīng)理整理其2500個中層干部的檔案。其中一項內(nèi)容是考察這些中層干部的平均年薪及參加過公司培訓(xùn)計劃的比例。 總體:2500名中層干部 如果:上述情況可由每個人的個人檔案中得知,可容易地測出這2500名中層干部的平均年薪及標準差。,假如:1:已經(jīng)得到了如下的結(jié)果: 總體均值: =51800 總

6、體標準差: =4000,19,參數(shù)是總體的數(shù)值特征,上述總體均值、總體標準差、比例均稱為總體的參數(shù),2、同時,有1500人參加了公司培訓(xùn),則 參加公司培訓(xùn)計劃的比例為: P =1500/2500=0.60,如:例3中的中層干部平均年薪,年薪標準差及受培訓(xùn)人數(shù)所占比例均為該公司中層干部這一總體的參數(shù)。 抽樣估計就是要通過樣本而非總體來估計總體參數(shù)。,20,假如隨機抽取了一個容量為30的樣本: 工資 是否參加培訓(xùn) 49094.3 Yes 53263.9 Yes 49643.5 Yes ,假如根據(jù)該樣本求得的年薪樣本平均數(shù)、標準差及參加過培訓(xùn)計劃人數(shù)的比例分別為:,21,抽樣方法,重復(fù)抽樣,又被稱作

7、重置抽樣、有放回抽樣,繼續(xù) 抽取,特點,同一總體單位有可能被重復(fù)抽中,而且每次抽取都是獨立進行,22,不重復(fù)抽樣,又被稱作不重置抽樣、不放回抽樣,抽出 個體,登記 特征,繼續(xù) 抽取,特點,同一總體中每個單位被抽中的機會并不均等,在連續(xù)抽取時,每次抽取都不是獨立進行,是最為常用的抽樣方法,用于無限總 體和許多有限總體樣本單位的抽樣。,抽樣方法,23,對樣本的要求不同,考慮順序的抽樣 ABBA,不考慮順序的抽樣 AB=BA,兩種分類交叉,考慮順序的重復(fù)抽樣,考慮順序的不重復(fù)抽樣,不考慮順序的重復(fù)抽樣,不考慮順序的不重復(fù)抽樣,24,例:從A、B、C、D四個工人中隨機抽取二人組成一樣本,可能的樣本是:

8、,考慮順序的重復(fù)抽樣 考慮順序的不重復(fù)抽樣 AA AB AC AD AA AB AC AD BA BB BC BD BA BB BC BD CA CB CC CD CA CB CC CD DA DB DC DD DA DB DC DD 不考慮順序的重復(fù)抽樣 不考慮順序的不重復(fù)抽樣 AA AB AC AD AA AB AC AD BA BB BC BD BA BB BC BD CA CB CC CD CA CB CC CD DA DB DC DD DA DB DC DD,25,第八章 抽樣推斷,1.1 抽樣方案的設(shè)計 1.2 簡單隨機抽樣的抽樣誤差的測定 1.3 簡單隨機抽樣的抽樣估計,26,一

9、、抽樣誤差的概念 二、抽樣平均誤差 三、抽樣極限誤差,第三節(jié) 抽樣平均誤差,27,28,某個樣本容量的抽樣分布,更大樣本容量的抽樣分布,29,抽樣平均 誤差,根據(jù)所有可能樣本的樣平均數(shù)或樣本成數(shù)計算的標準差,即每一次抽樣的樣本指標和總體指標之間的平均差異程度。即樣本估計量的標準差,式中: 為樣本平均數(shù)的抽樣平均誤差; 為可能的樣本數(shù)目; 為第 個可能樣本的平均數(shù); 為總體平均數(shù),注意:不要混淆抽樣 平均誤差與樣本標準差!,30,例:有4個工人,月產(chǎn)量分別為40,50,70,80,這一總體平均數(shù)和標準差為:,總體平均數(shù),標準差,31,現(xiàn)用重復(fù)抽樣的方法從4人中抽取2人構(gòu)成樣本,求樣本的平均數(shù),用

10、以代表4人總體的平均水平,所有可能的樣本及樣本的平均工資列表如下:,32,樣本平均數(shù)的平均數(shù): 抽樣平均誤差,33,抽樣平均誤差的計算公式, 樣本平均數(shù)的抽樣平均誤差,當N500時,有,重復(fù)抽樣時:,不重復(fù)抽樣時:,34, 樣本成數(shù)的抽樣平均誤差,重復(fù)抽樣時:,不重復(fù)抽樣時:,當N500時,有,抽樣平均誤差的計算公式,35,關(guān)于總體方差的估計方法,用過去同類問題全面調(diào)查或抽樣調(diào)查的經(jīng)驗數(shù)據(jù)代替; 用樣本標準差 代替總體標準差 ,用 代替 。,抽樣平均誤差的計算公式,36,影響抽樣誤差的因素,總體各單位的差異程度(即標準差的大?。?越大,抽樣誤差越大; 樣本單位數(shù)的多少: 越大,抽樣誤差越小;

11、 抽樣方法:不重復(fù)抽樣的抽樣誤差比重復(fù)抽樣的抽樣誤差??; 抽樣組織方式:簡單隨機抽樣的誤差最大。,37,練習,1、對某鄉(xiāng)進行簡單重復(fù)抽樣調(diào)查,抽出100個農(nóng)戶,戶均年收入2000元,年收入標準差100元,求抽樣平均誤差。若抽取的是200戶,則抽樣平均誤差以是多少。若要使抽樣平均誤差降低為原來的一半,則應(yīng)抽多少戶。 2、對某縣人口用不重復(fù)抽樣方法按1/10比例抽出1萬人進行調(diào)查,得知樣本平均年齡40歲,年齡標準差20歲,求抽樣平均誤差。 3、某縣人口10萬人,用簡單隨機不重復(fù)抽樣方法抽取1/10的人口進行調(diào)查,得知男性人口比重為51%,求男性人口比重的抽樣平均誤差。 4、對某鄉(xiāng)進行簡單隨機重復(fù)抽

12、樣調(diào)查,抽出100個農(nóng)戶進行調(diào)查,得知年收入在1800元以上的占95%,求農(nóng)戶年收入在1800元以上比重的抽樣平均誤差。,38,抽樣極限 誤差,指在一定的概率保證程度下,抽樣誤差不允許超過的某一給定范圍,也稱作允許誤差、誤差范圍、誤差置信限等,注意: 1、統(tǒng)計學上往往用抽樣極限誤差來測度抽樣誤差的大小或者說測度點估計的精度。 原因:總體參數(shù)值往往并不知道,因此,實際抽樣誤差與抽樣平均誤差也往往無法求出,但在抽樣分布大體知道的情況下,抽樣極限誤差是可以估計出來的。,39,2、抽樣極限誤差的估計總是要和一定的概率保證程度聯(lián)系在一起的。,原因:樣本統(tǒng)計量往往是一隨機變量,它與總體參數(shù)真值之差也是一個

13、隨機變量,因此就不能期望某次抽樣的樣本估計值落在一定區(qū)間內(nèi)是一個必然事件,而只能給予一定的概率保證。 因此,在進行抽樣估計時,既需要考慮抽樣誤差的可能范圍,同時還需考慮落到這一范圍的概率大小。 前者是估計的準確度問題,后者是估計的可靠性問題,兩者緊密聯(lián)系不可分開。這也正是區(qū)間估計所關(guān)心的主要問題。,40,平均產(chǎn)量的分布如下:,41,實際計算中一般不直接計算概率保證程度, 由于 ,,所以抽樣極限誤差是概率度t的函數(shù),t為概率度,是給定概率保證程度下樣本均值 偏離總體均值的抽樣平均誤差的倍數(shù)。,42,據(jù)中心極限定理,當總體為正態(tài)或總體非正態(tài)但n30時,樣本均值的分布趨近于正態(tài)分布;當n足夠大時,樣

14、本成數(shù)的分布近似為正態(tài)分布。,令,43,平均數(shù)的抽樣分布,全部可能樣本平均數(shù)的均值等于總體均值,即: 從非正態(tài)總體中抽取的樣本平均數(shù)當n足夠大時其分布接近正態(tài)分布。 從正態(tài)總體中抽取的樣本平均數(shù)不論容量大小其分布均為正態(tài)分布。 樣本均值的標準差為總體標準差的,44,成數(shù)的抽樣分布,全部可能樣本成數(shù)的均值等于總體比率,即: 從非正態(tài)總體中抽取的樣本成數(shù),當n足夠大時其分布接近正態(tài)分布。 從正態(tài)總體中抽取的樣本成數(shù),不論容量大小其分布均為正態(tài)分布。 樣本成數(shù)的標準差為總體標準差的,45,樣本抽樣分布,原總體分布,46,47,t與相應(yīng)的概率保證程度存在一一對應(yīng)關(guān)系,常用t值及相應(yīng)的概率保證程度為:,

15、t值 概率保證程度 1.00 0.6827 1.65 0.9000 1.96 0.9500 2.00 0.9545 2.58 0.9900 3.00 0.9973,在實際中,一般將這種對應(yīng)函數(shù)關(guān)系編成正態(tài)概率表供直接查用,(大樣本條件下),48,68.27%,95.45%,99.73%,49,估計的準確度和估計的可靠性問題,由于提高把握程度,會增大允許誤差,使估計精度降低,而縮小允許誤差,提高估計的精度,又會降低估計的把握程度,所以在實際中應(yīng)根據(jù)具體情況,先確定一個合理的把握程度再求相應(yīng)的允許誤差或先確定一個允許誤差范圍再求相應(yīng)的把握程度。,50,抽樣估計量的優(yōu)良標準,設(shè)為待估計的總體參數(shù),

16、為樣本統(tǒng)計量,則的優(yōu)良標準為:,若,則稱為的無偏估計量,第四節(jié) 全及指標的推斷,51,若,則稱為比更有效的估計量,抽樣估計量的優(yōu)良標準,若對于任意0,有,52,為的無偏、有效、一致估計量; 為的無偏、有效、一致估計量; 為的無偏、有效、一致估計量。,數(shù)理統(tǒng)計證明:,抽樣估計量的優(yōu)良標準,53,54,區(qū)間估計,指根據(jù)樣本指標和抽樣極限誤差以一定的可靠程度推斷總體指標的可能范圍;其中,被推斷的總體指標的下限與上限所包括的區(qū)間稱為置信區(qū)間,估計的可靠程度也稱為置信度。,(這里只討論常用的大樣本的情況),55,區(qū)間估計原理,0.6827,落在范圍內(nèi)的概率為68.27%,56,區(qū)間估計原理,0.9545

17、,落在范圍內(nèi)的概率為95.45%,樣本抽樣分布曲線,原總體分布曲線,57,區(qū)間估計原理,0.9973,落在范圍內(nèi)的概率為99.73%,樣本抽樣分布曲線,總體分布曲線,58,總體平均數(shù)的區(qū)間估計,表 達 式,其中, 為極限誤差,59,步 驟, 計算樣本平均數(shù) ;, 搜集總體方差的經(jīng)驗數(shù)據(jù) ;或計算樣本標準差 ,,總體平均數(shù)的區(qū)間估計, 計算抽樣平均誤差:,重復(fù)抽樣時,不重復(fù)抽樣時:,60,步 驟, 計算抽樣極限誤差:, 確定總體平均數(shù)的置信區(qū)間:,總體平均數(shù)的區(qū)間估計,61,總體成數(shù)的區(qū)間估計,表 達 式,其中, 為極限誤差,62,步 驟, 計算樣本成數(shù) ;, 搜集總體方差的經(jīng)驗數(shù)據(jù) ;, 計算

18、抽樣平均誤差:,重復(fù)抽樣條件下,不重復(fù)抽樣條件下,總體成數(shù)的區(qū)間估計,63,步 驟, 計算抽樣極限誤差:, 確定總體成數(shù)的置信區(qū)間:,總體成數(shù)的區(qū)間估計,64,1、按照質(zhì)量要求,燈泡使用壽命在1000小時以上為合格品試,以95.45%的概率保證度估計該批燈泡的耐用時數(shù)和合格率;2、試以99%的概率保證程度估計計該批燈泡的而用時數(shù)和合格率。,例:某燈泡廠對10000個產(chǎn)品進行使用壽命檢驗,隨機不重復(fù)抽取2%的樣本進行測試。所得資料如下:,65,66,67,因此,該批燈泡的使用壽命在1049.49-1064.51之間,其概率保證度為95.45%,68,69,因此,該批燈泡的合格率在87.6%-95

19、.4%之間,其概率保證度為95.45%,70,1、若允許的誤差范圍為10小時,試估計該批燈泡的耐用時數(shù);2、按照質(zhì)量要求,燈泡使用壽命在1000小時以上為合格品,要求合格率誤差不超過3%,試估計該批燈泡的合格率。,例:某燈泡廠對10000個產(chǎn)品進行使用壽命檢驗,隨機重復(fù)抽取2%的樣本進行測試。所得資料如下:,71,72,73,因此,該批燈泡的使用壽命在1047-1067之間,其概率保證度為99.17%,74,75,因此,該批燈泡的合格率在88.5%-94.5%之間,其概率保證度為87.15%,76,作業(yè):某企業(yè)生產(chǎn)某種產(chǎn)品的工人有1000人,某日采用不重復(fù)抽樣從中隨機抽取100人調(diào)查他們的當日

20、產(chǎn)量,要求: 1、在95的概率保證程度下,估計該廠全部工人的日平均產(chǎn)量和日總產(chǎn)量。 2、若工人日產(chǎn)量在118件以上者為完成生產(chǎn)定額任務(wù),要求在95的概率保證程度下,估計該廠全部工人中完成定額的工人比重及完成定額的工人總數(shù)。,77,100名工人的日產(chǎn)量分組資料,78,100名工人的日產(chǎn)量分組資料,79,解:,80,則該企業(yè)工人人均產(chǎn)量 及日總產(chǎn)量 的置信區(qū)間為:,即該企業(yè)工人人均產(chǎn)量在124.797至127.203件之間,其日總產(chǎn)量在124797至127303件之間,估計的可靠程度為95。,81,100名工人的日產(chǎn)量分組資料,完成定額的人數(shù),82,解:,83,則該企業(yè)全部工人中完成定額的工人比重

21、 及完成定額的工人總數(shù) 的置信區(qū)間為:,即該企業(yè)工人中完成定額的工人比重在0.8432至0.9568之間,完成定額的工人總數(shù)在843.2至956.8人之間,估計的可靠程度為95。,84,樣本容量,調(diào)查誤差,調(diào)查費用,小樣本容量節(jié)省費用但調(diào)查誤差大,大樣本容量調(diào)查精度高但費用較大,找出在規(guī)定誤差范圍內(nèi)的最小樣本容量,確定樣本容量的意義,找出在限定費用范圍內(nèi)的最大樣本容量,85,確 定 方 法,推斷總體平均數(shù)所需的樣本容量, 重復(fù)抽樣條件下:,通常的做法是先確定置信度,然后限定抽樣極限誤差。, 或 S通常未知。一般按以下方法確定其估計值:過去的經(jīng)驗數(shù)據(jù);試驗調(diào)查樣本的S。,計算結(jié)果通常向上進位,8

22、6, 不重復(fù)抽樣條件下:,確 定 方 法,推斷總體平均數(shù)所需的樣本容量,87,【例A】某食品廠要檢驗本月生產(chǎn)的10000袋某產(chǎn)品的重量,根據(jù)上月資料,這種產(chǎn)品每袋重量的標準差為25克。要求在95.45的概率保證程度下,平均每袋重量的誤差范圍不超過5克,應(yīng)抽查多少袋產(chǎn)品?,88,89,確 定 方 法,推斷總體成數(shù)所需的樣本容量, 重復(fù)抽樣條件下:,90, 不重復(fù)抽樣條件下:,確 定 方 法,推斷總體成數(shù)所需的樣本容量,91,【例B】某企業(yè)對一批總數(shù)為5000件的產(chǎn)品進行質(zhì)量檢查,過去幾次同類調(diào)查所得的產(chǎn)品合格率為93、95、96,為了使合格率的允許誤差不超過3,在99.73的概率保證程度下,應(yīng)抽

23、查多少件產(chǎn)品?,【分析】因為共有三個過去的合格率的 資料,為保證推斷的把握程度,應(yīng)選其 中方差最大者,即P=93。,92,93,必要樣本容量的影響因素,總體方差的大?。?允許誤差范圍的大?。?概率保證程度; 抽樣方法; 抽樣的組織方式。,94,抽樣復(fù)查的方法,修正系數(shù)為,則:,該企業(yè)集團所擁有的固定資產(chǎn)原值應(yīng)為 16.8510.9507=16.020(億元),95,第五節(jié) 抽樣方案的設(shè)計,一、抽樣方案設(shè)計的基本準則 二、抽樣方案設(shè)計的主要內(nèi)容,96, 隨機原則,抽取樣本單位時,應(yīng)確保每個總體單位都有被抽取的可能;在對樣本單位的資料進行搜集和整理時,不能隨意遺漏或更換樣本單位, 抽樣誤差最小,在

24、其他條件相同的情況下,選抽樣誤差最小的方案, 費用最少,在其他條件相同的情況下,選費用最少的方案,設(shè)計抽樣方案時,通常是 在誤差達到一定要求的條 件下,選擇費用最少的方案,抽樣方案設(shè)計的基本準則,97,第五節(jié) 抽樣方案的設(shè)計,一、抽樣方案設(shè)計的基本準則 二、抽樣方案設(shè)計的主要內(nèi)容,98,編制抽樣框,99,確定抽樣方法,重復(fù)抽樣,又被稱作重置抽樣、有放回抽樣,不重復(fù)抽樣,又被稱作不重置抽樣、不放回抽樣,100,確定抽樣組織方式,是最簡單、最基本、最符合隨機原則, 但同時也是抽樣誤差最大的抽樣組織形式,101,總體 N,樣本 n,等額抽取,等比例抽取,能使樣本結(jié)構(gòu)更接近于總體結(jié)構(gòu),提高樣本的 代表性;能同時推斷總體指標和各子總體的指標,確定抽樣組織方式,102,類型抽樣的抽樣平均誤差,103,104,某農(nóng)場種小麥12000公頃,其中平原3600公頃,丘陵6000公頃,山地2400公頃,現(xiàn)用類型抽樣法調(diào)查1200公頃,以各種麥田占全農(nóng)場面積的比重分配抽樣面積數(shù)量。 麥田類型抽樣的平均誤差計算表,105,106,高產(chǎn)麥田比重的平均誤差計算表,107,隨機起點,半距起點,對稱起點,(總體單位按某一標志排序),按無關(guān)標志排隊,其抽樣效

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論