抽樣推斷課件_第1頁(yè)
抽樣推斷課件_第2頁(yè)
抽樣推斷課件_第3頁(yè)
抽樣推斷課件_第4頁(yè)
抽樣推斷課件_第5頁(yè)
已閱讀5頁(yè),還剩94頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第八章 抽樣推斷第一節(jié) 抽樣方案的設(shè)計(jì)第二節(jié) 簡(jiǎn)單隨機(jī)抽樣的抽樣誤差的測(cè)定第三節(jié) 簡(jiǎn)單隨機(jī)抽樣的抽樣估計(jì)第一節(jié) 抽樣方案的設(shè)計(jì)一、抽樣估計(jì)的意義和一般步驟二、抽樣方案設(shè)計(jì)的基本準(zhǔn)則三、抽樣方案設(shè)計(jì)的主要內(nèi)容一、抽樣估計(jì)的意義和一般步驟 抽樣估計(jì)的定義 抽樣估計(jì)的特點(diǎn) 抽樣估計(jì)的運(yùn)用 抽樣估計(jì)的一般步驟 總體參數(shù)與樣本指標(biāo)指樣本單位的抽取不受主觀因素及其他系統(tǒng)性因素的影響,每個(gè)總體單位都有均等的被抽中機(jī)會(huì)抽樣估計(jì)按照隨機(jī)原則 從調(diào)查對(duì)象中抽取一部分單位進(jìn)行調(diào)查,并以調(diào)查結(jié)果對(duì)總體數(shù)量特征作出具有一定可靠程度的估計(jì)與推斷,從而認(rèn)識(shí)總體的一種統(tǒng)計(jì)方法統(tǒng)計(jì)推斷全及總體指標(biāo):參數(shù)(未知量)樣本總體指標(biāo):

2、統(tǒng)計(jì)量(已知量)抽樣估計(jì)并非所有的抽樣估計(jì)都按隨機(jī)原則抽取樣本,也有非隨機(jī)抽樣總體隨機(jī)樣本非隨機(jī)樣本與總體分布特征相同與總體分布特征不同按隨機(jī)原則抽取樣本單位目的是推斷總體的數(shù)量特征抽樣推斷的結(jié)果具有一定的可靠程度,抽樣誤差可以事先計(jì)算并控制抽樣估計(jì)的特點(diǎn)不可能進(jìn)行全面調(diào)查時(shí)不必要進(jìn)行全面調(diào)查時(shí)來(lái)不及進(jìn)行全面調(diào)查時(shí)對(duì)全面調(diào)查資料進(jìn)行補(bǔ)充修正時(shí)抽樣估計(jì)的應(yīng)用抽樣調(diào)查研究Sampling Study為什么要抽樣? 1. 涉及破壞受試對(duì)象質(zhì)量控制2. 取得精確可靠的結(jié)果3. 實(shí)際情況的約束時(shí)間,成本等設(shè)計(jì)抽樣方案抽取樣本單位收集樣本數(shù)據(jù)計(jì)算樣本統(tǒng)計(jì)量推斷總體參數(shù)抽樣估計(jì)的一般步驟設(shè)總體中 個(gè)總體單位

3、某項(xiàng)標(biāo)志的標(biāo)志值分別為 ,其中具有某種屬性的有 個(gè)單位,不具有某種屬性的有 個(gè)單位,則 總體平均數(shù)(又叫總體均值):指被估計(jì)的總體指標(biāo),又被稱為全及指標(biāo)總體參數(shù) 總體單位標(biāo)志值的標(biāo)準(zhǔn)差: 總體單位標(biāo)志值的方差: 總體成數(shù): 總體是非標(biāo)志的標(biāo)準(zhǔn)差: 總體是非標(biāo)志的方差:設(shè)樣本中 個(gè)樣本單位某項(xiàng)標(biāo)志的標(biāo)志值分別為 ,其中具有和不具有某種屬性的樣本單位數(shù)目分別為 和 個(gè),則 樣本平均數(shù)(又叫樣本均值):指根據(jù)樣本單位的標(biāo)志值計(jì)算的用以估計(jì)和推斷相應(yīng)總體指標(biāo)的綜合指標(biāo),又被稱為估計(jì)量或統(tǒng)計(jì)量樣本指標(biāo) 樣本單位標(biāo)志值的標(biāo)準(zhǔn)差: 樣本單位標(biāo)志值的方差:為自由度為 的無(wú)偏估計(jì)為 的無(wú)偏估計(jì) 樣本成數(shù): 樣本

4、單位是非標(biāo)志的標(biāo)準(zhǔn)差: 樣本單位是非標(biāo)志的方差:為 的無(wú)偏估計(jì)為 的無(wú)偏估計(jì)第一節(jié) 抽樣方案的設(shè)計(jì)一、抽樣估計(jì)的意義和一般步驟二、抽樣方案設(shè)計(jì)的基本準(zhǔn)則三、抽樣方案設(shè)計(jì)的主要內(nèi)容 隨機(jī)原則抽取樣本單位時(shí),應(yīng)確保每個(gè)總體單位都有被抽取的可能;在對(duì)樣本單位的資料進(jìn)行搜集和整理時(shí),不能隨意遺漏或更換樣本單位 抽樣誤差最小在其他條件相同的情況下,選抽樣誤差最小的方案 費(fèi)用最少在其他條件相同的情況下,選費(fèi)用最少的方案設(shè)計(jì)抽樣方案時(shí),通常是在誤差達(dá)到一定要求的條件下,選擇費(fèi)用最少的方案抽樣方案設(shè)計(jì)的基本準(zhǔn)則第一節(jié) 抽樣方案的設(shè)計(jì)一、抽樣估計(jì)的意義和一般步驟二、抽樣方案設(shè)計(jì)的基本準(zhǔn)則三、抽樣方案設(shè)計(jì)的主要內(nèi)

5、容 編制抽樣框 確定抽樣方法 確定抽樣組織方式 確定樣本容量三、抽樣方案設(shè)計(jì)的主要內(nèi)容抽樣框指包括全部抽樣單位的名單框架,僅對(duì)有限總體而言主要形式名單抽樣框區(qū)域抽樣框時(shí)間表抽樣框編制抽樣框區(qū)域抽樣框在商場(chǎng)的大門口在微波爐柜臺(tái)前在市區(qū)街道旁邊在某個(gè)住宅小區(qū)包河區(qū)瑤海區(qū)蜀山區(qū)廬陽(yáng)區(qū)政務(wù)區(qū)技術(shù)開(kāi)發(fā)區(qū)某外國(guó)公司在合肥進(jìn)行微波爐市場(chǎng)調(diào)查:時(shí)間表抽樣框連續(xù)出產(chǎn)的產(chǎn)品總體可以編制抽樣框:均勻的出產(chǎn)時(shí)間、可以預(yù)見(jiàn)到的產(chǎn)品總量。連續(xù)到加油站加油的汽車總體無(wú)法編制抽樣框:時(shí)間不定、總量也無(wú)法確定。確定抽樣方法重復(fù)抽樣又被稱作重置抽樣、有放回抽樣抽出個(gè)體登記特征放回總體繼續(xù)抽取特點(diǎn)同一總體單位有可能被重復(fù)抽中,而且

6、每次抽取都是獨(dú)立進(jìn)行不重復(fù)抽樣又被稱作不重置抽樣、不放回抽樣抽出個(gè)體登記特征繼續(xù)抽取特點(diǎn)同一總體中每個(gè)單位被抽中的機(jī)會(huì)并不均等,在連續(xù)抽取時(shí),每次抽取都不是獨(dú)立進(jìn)行是最為常用的抽樣方法,用于無(wú)限總體和許多有限總體樣本單位的抽樣。確定抽樣方法確定抽樣組織方式1 簡(jiǎn)單隨機(jī)抽樣(純隨機(jī)抽樣)對(duì)總體單位逐一編號(hào),然后按隨機(jī)原則直接從總體中抽出若干單位構(gòu)成樣本應(yīng)用僅適用于規(guī)模不大、內(nèi)部各單位標(biāo)志值差異較小的總體 是最簡(jiǎn)單、最基本、最符合隨機(jī)原則,但同時(shí)也是抽樣誤差最大的抽樣組織形式2 類型抽樣(分層抽樣)將總體全部單位分類,形成若干個(gè)類型組,然后從各類型中分別抽取樣本單位組成樣本。總體N樣本n等額抽取等

7、比例抽取 能使樣本結(jié)構(gòu)更接近于總體結(jié)構(gòu),提高樣本的代表性;能同時(shí)推斷總體指標(biāo)和各子總體的指標(biāo)確定抽樣組織方式3 等距抽樣(機(jī)械抽樣或系統(tǒng)抽樣)將總體單位按某一標(biāo)志排序,而后按一定的間隔抽取樣本單位。隨機(jī)起點(diǎn)半距起點(diǎn)對(duì)稱起點(diǎn)(總體單位按某一標(biāo)志排序)按無(wú)關(guān)標(biāo)志排隊(duì),其抽樣效果相當(dāng)于簡(jiǎn)單隨機(jī)抽樣;按有關(guān)標(biāo)志排隊(duì),其抽樣效果相當(dāng)于類型抽樣。確定抽樣組織方式4 整群抽樣(集團(tuán)抽樣) 將總體全部單位分為若干“群”,然后隨機(jī)抽取一部分“群”,被抽中群體的所有單位構(gòu)成樣本例:總體群數(shù)R=16 樣本群數(shù)r=4ABCDEFGHIJKLMNOPLHPD樣本容量簡(jiǎn)單、方便,能節(jié)省人力、物力、財(cái)力和時(shí)間,但其樣本代表

8、性可能較差確定抽樣組織方式5多階段抽樣 指分兩個(gè)或兩個(gè)以上的階段來(lái)完成抽取樣本單位的過(guò)程例:在某省100多萬(wàn)農(nóng)戶抽取1000戶調(diào)查農(nóng)戶生產(chǎn)性投資情況。 第一階段:從該省所有縣中抽取5個(gè)縣第二階段:從被抽中的5個(gè)縣中各抽4個(gè)鄉(xiāng) 第三階段:從被抽中的20個(gè)鄉(xiāng)中各抽5個(gè)村 第四階段:從被抽中的100個(gè)村中各抽10戶樣本n=10010=1000(戶)確定抽樣組織方式 調(diào)查對(duì)象的性質(zhì)特點(diǎn) 對(duì)調(diào)查對(duì)象的了解程度(抽樣框的特點(diǎn)) 抽樣誤差的大小 人力、財(cái)力和物力等條件的限制 在實(shí)際工作中,選擇適當(dāng)?shù)某闃咏M織方式主要應(yīng)考慮:確定抽樣組織方式確定樣本容量n30,為大樣本;n 0,有 為的無(wú)偏、有效、一致估計(jì)量;

9、 為的無(wú)偏、有效、一致估計(jì)量; 為的無(wú)偏、有效、一致估計(jì)量。數(shù)理統(tǒng)計(jì)證明:抽樣估計(jì)量的優(yōu)良標(biāo)準(zhǔn)一、抽樣分布二、抽樣估計(jì)量的優(yōu)良標(biāo)準(zhǔn)三、抽樣誤差的概念四、抽樣平均誤差五、抽樣極限誤差第二節(jié) 簡(jiǎn)單隨機(jī)抽樣的抽樣誤差的測(cè)定說(shuō)明對(duì)于任何一個(gè)樣本,其抽樣誤差都不可能測(cè)量出來(lái)抽樣誤差的大小可以依據(jù)概率分布理論加以說(shuō)明指樣本估計(jì)量與總體參數(shù)之間數(shù)量上的差異,僅指由于按照隨機(jī)原則抽取樣本而產(chǎn)生的代表性誤差,不包括登記性誤差和系統(tǒng)偏差。抽樣誤差某個(gè)樣本容量的抽樣分布更大樣本容量的抽樣分布一、抽樣分布二、抽樣估計(jì)量的優(yōu)良標(biāo)準(zhǔn)三、抽樣誤差的概念四、抽樣平均誤差五、抽樣極限誤差第二節(jié) 簡(jiǎn)單隨機(jī)抽樣的抽樣誤差的測(cè)定抽樣

10、平均誤差指每一個(gè)可能樣本的估計(jì)值與總體指標(biāo)值之間離差的平均數(shù),即樣本估計(jì)量的標(biāo)準(zhǔn)差式中: 為樣本平均數(shù)的抽樣平均誤差; 為可能的樣本數(shù)目; 為第 組可能樣本的平均數(shù); 為總體平均數(shù)注意:不要混淆抽樣平均差與樣本標(biāo)準(zhǔn)差!抽樣平均誤差的計(jì)算公式 樣本平均數(shù)的抽樣平均誤差當(dāng)N500時(shí),有重復(fù)抽樣時(shí):不重復(fù)抽樣時(shí): 樣本成數(shù)的抽樣平均誤差重復(fù)抽樣時(shí):不重復(fù)抽樣時(shí):當(dāng)N500時(shí),有抽樣平均誤差的計(jì)算公式關(guān)于總體方差的估計(jì)方法用過(guò)去同類問(wèn)題全面調(diào)查或抽樣調(diào)查的經(jīng)驗(yàn)數(shù)據(jù)代替;用樣本標(biāo)準(zhǔn)差 代替總體標(biāo)準(zhǔn)差 ,用 代替 。抽樣平均誤差的計(jì)算公式影響抽樣誤差的因素總體各單位的差異程度(即標(biāo)準(zhǔn)差的大小): 越大,抽

11、樣誤差越大;樣本單位數(shù)的多少: 越大,抽樣誤差越小;抽樣方法:不重復(fù)抽樣的抽樣誤差比重復(fù)抽樣的抽樣誤差??;抽樣組織方式:簡(jiǎn)單隨機(jī)抽樣的誤差最大。一、抽樣分布二、抽樣估計(jì)量的優(yōu)良標(biāo)準(zhǔn)三、抽樣誤差的概念四、抽樣平均誤差五、抽樣極限誤差第二節(jié) 簡(jiǎn)單隨機(jī)抽樣的抽樣誤差的測(cè)定68.27%95.45%99.73%抽樣極限誤差抽樣極限誤差指在一定的概率保證程度下,抽樣誤差不允許超過(guò)的某一給定范圍,也稱作允許誤差、誤差范圍、誤差置信限等 由于提高把握程度,會(huì)增大允許誤差,使估計(jì)精度降低,而縮小允許誤差,提高估計(jì)的精度,又會(huì)降低估計(jì)的把握程度,所以在實(shí)際中應(yīng)根據(jù)具體情況,先確定一個(gè)合理的把握程度再求相應(yīng)的允許誤

12、差或先確定一個(gè)允許誤差范圍再求相應(yīng)的把握程度。抽樣極限誤差的計(jì)算公式(大樣本條件下)樣本平均數(shù)的極限誤差:樣本成數(shù)的極限誤差:Z為概率度,是給定概率保證程度下樣本均值偏離總體均值的抽樣平均誤差的倍數(shù)。Z與相應(yīng)的概率保證程度存在一一對(duì)應(yīng)關(guān)系,常用Z值及相應(yīng)的概率保證程度為: z值 概率保證程度1.00 0.6827 1.65 0.9000 1.96 0.9500 2.00 0.9545 2.58 0.9900 3.00 0.9973抽樣極限誤差的計(jì)算公式(大樣本條件下)標(biāo)準(zhǔn)正態(tài)分布函數(shù)值表第四章 抽樣推斷第一節(jié) 抽樣方案的設(shè)計(jì)第二節(jié) 簡(jiǎn)單隨機(jī)抽樣的抽樣誤差的測(cè)定第三節(jié) 簡(jiǎn)單隨機(jī)抽樣的抽樣估計(jì)一、

13、點(diǎn)估計(jì)二、區(qū)間估計(jì)三、樣本數(shù)目的確定第三節(jié) 簡(jiǎn)單隨機(jī)抽樣的抽樣估計(jì)點(diǎn)估計(jì)指直接以樣本指標(biāo)來(lái)估計(jì)總體指標(biāo),也叫定值估計(jì)。簡(jiǎn)單,具體明確優(yōu)點(diǎn)缺點(diǎn)無(wú)法控制誤差,僅適用于對(duì)推斷的準(zhǔn)確程度與可靠程度要求不高的情況一、點(diǎn)估計(jì)二、區(qū)間估計(jì)三、樣本數(shù)目的確定第三節(jié) 簡(jiǎn)單隨機(jī)抽樣的抽樣估計(jì)二、區(qū)間估計(jì) 區(qū)間估計(jì)的定義和原理 總體平均數(shù)的區(qū)間估計(jì)總體成數(shù)的區(qū)間估計(jì)區(qū)間估計(jì) 指根據(jù)樣本指標(biāo)和抽樣極限誤差以一定的可靠程度推斷總體指標(biāo)的可能范圍;其中,被推斷的總體指標(biāo)的下限與上限所包括的區(qū)間稱為置信區(qū)間,估計(jì)的可靠程度也稱為置信度。(這里只討論常用的大樣本的情況)區(qū)間估計(jì)原理0.6827落在范圍內(nèi)的概率為68.27%樣

14、本抽樣分布曲線原總體分布曲線區(qū)間估計(jì)原理0.9545落在范圍內(nèi)的概率為95.45%樣本抽樣分布曲線原總體分布曲線區(qū)間估計(jì)原理 0.9973落在范圍內(nèi)的概率為99.73%樣本抽樣分布曲線總體分布曲線總體平均數(shù)的區(qū)間估計(jì)表達(dá)式其中, 為極限誤差步驟 計(jì)算樣本平均數(shù) ; 搜集總體方差的經(jīng)驗(yàn)數(shù)據(jù) ;或計(jì)算樣本標(biāo)準(zhǔn)差 ,即總體平均數(shù)的區(qū)間估計(jì)步驟 計(jì)算抽樣平均誤差:重復(fù)抽樣時(shí): 不重復(fù)抽樣時(shí):總體平均數(shù)的區(qū)間估計(jì)步驟 計(jì)算抽樣極限誤差: 確定總體平均數(shù)的置信區(qū)間:總體平均數(shù)的區(qū)間估計(jì)【例1】某企業(yè)生產(chǎn)某種產(chǎn)品的工人有1000人,某日采用不重復(fù)抽樣從中隨機(jī)抽取100人調(diào)查他們的當(dāng)日產(chǎn)量,要求在95的概率保

15、證程度下,估計(jì)該廠全部工人的日平均產(chǎn)量和日總產(chǎn)量。總體平均數(shù)的區(qū)間估計(jì)按 日產(chǎn)量分組(件)組中值(件)工人數(shù)(人)11011411411811812212212612613013013413413813814211211612012412813213614037182321186433681221602852268823768165605887006489284648600784合計(jì)100126004144100名工人的日產(chǎn)量分組資料解:則該企業(yè)工人人均產(chǎn)量 及日總產(chǎn)量 的置信區(qū)間為:即該企業(yè)工人人均產(chǎn)量在124.797至127.203件之間,其日總產(chǎn)量在124797至127303件之間,估計(jì)

16、的可靠程度為95??傮w成數(shù)的區(qū)間估計(jì)表達(dá)式其中, 為極限誤差步驟 計(jì)算樣本成數(shù) ; 搜集總體方差的經(jīng)驗(yàn)數(shù)據(jù) ; 計(jì)算抽樣平均誤差:重復(fù)抽樣條件下不重復(fù)抽樣條件下總體成數(shù)的區(qū)間估計(jì)步驟 計(jì)算抽樣極限誤差: 確定總體成數(shù)的置信區(qū)間:總體成數(shù)的區(qū)間估計(jì)【例2】若例A中工人日產(chǎn)量在118件以上者為完成生產(chǎn)定額任務(wù),要求在95的概率保證程度下,估計(jì)該廠全部工人中完成定額的工人比重及完成定額的工人總數(shù)??傮w成數(shù)的區(qū)間估計(jì)按 日產(chǎn)量分組(件)組中值(件)工人數(shù)(人)110114114118118122122126126130130134134138138142112116120124128132136140

17、371823211864合計(jì)100100名工人的日產(chǎn)量分組資料完成定額的人數(shù)解:則該企業(yè)全部工人中完成定額的工人比重 及完成定額的工人總數(shù) 的置信區(qū)間為:即該企業(yè)工人中完成定額的工人比重在0.8432至0.9568之間,完成定額的工人總數(shù)在843.2至956.8人之間,估計(jì)的可靠程度為95。一、點(diǎn)估計(jì)二、區(qū)間估計(jì)三、樣本數(shù)目的確定第三節(jié) 簡(jiǎn)單隨機(jī)抽樣的抽樣估計(jì)三、樣本容量的確定 確定樣本容量的意義 推斷總體平均數(shù)所需的樣本容量 推斷總體成數(shù)所需的樣本容量 必要樣本容量的影響因素樣本容量調(diào)查誤差調(diào)查費(fèi)用小樣本容量節(jié)省費(fèi)用但調(diào)查誤差大大樣本容量調(diào)查精度高但費(fèi)用較大找出在規(guī)定誤差范圍內(nèi)的最小樣本容量

18、確定樣本容量的意義找出在限定費(fèi)用范圍內(nèi)的最大樣本容量確定方法推斷總體平均數(shù)所需的樣本容量 重復(fù)抽樣條件下:通常的做法是先確定置信度,然后限定抽樣極限誤差。 或 S通常未知。一般按以下方法確定其估計(jì)值:過(guò)去的經(jīng)驗(yàn)數(shù)據(jù);試驗(yàn)調(diào)查樣本的S。計(jì)算結(jié)果通常向上進(jìn)位 不重復(fù)抽樣條件下:確定方法推斷總體平均數(shù)所需的樣本容量三、給定和d時(shí)樣本容量大小的確定 在區(qū)間估計(jì)中,置信度和精確度是一對(duì)矛盾,如果在保證置信度的前提下同時(shí)滿足精確度的要求,則只能增加樣本的容量的大小?!纠?】設(shè)燈泡壽命(小時(shí))服從正態(tài)分布,方差2 =1225,為估計(jì)其平均壽命,需要抽取多少燈泡才能有95%的把握使誤差不超過(guò)20小時(shí)?【例8】設(shè)燈泡壽命(小時(shí))服從正態(tài)分布,方差2 =1225,為估計(jì)其平均壽命,需要抽取多少燈泡才能有95%的把握使誤

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論