統(tǒng)計(jì)學(xué)課件第七章抽樣推斷_第1頁
統(tǒng)計(jì)學(xué)課件第七章抽樣推斷_第2頁
統(tǒng)計(jì)學(xué)課件第七章抽樣推斷_第3頁
統(tǒng)計(jì)學(xué)課件第七章抽樣推斷_第4頁
統(tǒng)計(jì)學(xué)課件第七章抽樣推斷_第5頁
已閱讀5頁,還剩102頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

統(tǒng)計(jì)學(xué)概論內(nèi)容第一章統(tǒng)計(jì)總論第二章統(tǒng)計(jì)調(diào)查第三章統(tǒng)計(jì)數(shù)據(jù)的整理與顯示第四章統(tǒng)計(jì)指標(biāo)第五章指數(shù)的因素分析第六章時(shí)間序列分析第七章抽樣推斷第八章相關(guān)與回歸分析第九章統(tǒng)計(jì)預(yù)測第十章統(tǒng)計(jì)的綜合評價(jià)第十一章統(tǒng)計(jì)分析報(bào)告統(tǒng)計(jì)學(xué)概論內(nèi)容第一章統(tǒng)計(jì)總論1第一節(jié)抽樣推斷概述第三節(jié)參數(shù)估計(jì)第二節(jié)隨機(jī)抽樣的概率分布第四節(jié)抽樣設(shè)計(jì)第七章抽樣推斷第一節(jié)抽樣推斷概述第三節(jié)參數(shù)估計(jì)第二節(jié)隨機(jī)抽樣的2第一節(jié)抽樣推斷概述

指樣本單位的抽取不受主觀因素及其他系統(tǒng)性因素的影響,每個總體單位都有均等的被抽中機(jī)會按照隨機(jī)原則

從全部研究對象中抽取一部分單位進(jìn)行調(diào)查,并以調(diào)查結(jié)果對總體數(shù)量特征作出具有一定可靠程度的估計(jì)與推斷,從而認(rèn)識總體的一種統(tǒng)計(jì)方法。抽樣推斷第一節(jié)抽樣推斷概述指樣本單位的抽取不受主觀因素及其他3統(tǒng)計(jì)推斷全及總體指標(biāo):參數(shù)(未知量)樣本總體指標(biāo):統(tǒng)計(jì)量(已知量)抽樣推斷統(tǒng)計(jì)推斷全及總體指標(biāo):參數(shù)(未知量)樣本總體指標(biāo):統(tǒng)計(jì)量(已4隨機(jī)原則的實(shí)現(xiàn)抽簽法是將總體中每個單位的編號寫在外形完全一致的簽上,將其攪拌均勻,從中任意抽選,簽上的號碼所對應(yīng)的單位就是樣本單位。隨機(jī)數(shù)表法將總體中每個單位編上號碼,然后使用隨機(jī)數(shù)表,查出所要抽取的調(diào)查單位。計(jì)算機(jī)模擬法是將隨機(jī)數(shù)字編制為程序存儲在計(jì)算機(jī)中,需要時(shí)將總體中各單位編上號碼,啟用隨機(jī)數(shù)字發(fā)生器輸出隨機(jī)數(shù)字,然后從總體中找到相應(yīng)總體單位形成樣本。隨機(jī)原則的實(shí)現(xiàn)抽簽法是將總體中每個單位的編號寫在外形完全一致5并非所有的抽樣估計(jì)都按隨機(jī)原則抽取樣本,也有非隨機(jī)抽樣總體隨機(jī)樣本非隨機(jī)樣本與總體分布特征相同與總體分布特征不同并非所有的抽樣估計(jì)都按隨機(jī)原總體隨機(jī)樣本非隨機(jī)樣本與總體分布6按隨機(jī)原則抽取樣本單位以樣本的數(shù)量特征推斷總體的數(shù)量特征抽樣推斷產(chǎn)生抽樣誤差,但抽樣誤差可以事先計(jì)算并控制抽樣推斷的特點(diǎn)與全面調(diào)查相比,抽樣調(diào)查既節(jié)省了人力、物力、財(cái)力和時(shí)間,又達(dá)到了認(rèn)識總體數(shù)量特征的目的。我國在1994年確立了以周期性普查為基礎(chǔ),以經(jīng)常性抽樣調(diào)整為主體,同時(shí)輔之以重點(diǎn)調(diào)查、科學(xué)核算等綜合運(yùn)用的統(tǒng)計(jì)調(diào)查方法體系。

按隨機(jī)原則抽取樣本單位抽樣推斷的特點(diǎn)與全面調(diào)查相比,7

不可能進(jìn)行全面調(diào)查時(shí)

不必要進(jìn)行全面調(diào)查時(shí)

來不及進(jìn)行全面調(diào)查時(shí)對全面調(diào)查資料進(jìn)行補(bǔ)充修正時(shí)抽樣推斷的應(yīng)用不可能進(jìn)行全面調(diào)查時(shí)抽樣推斷的應(yīng)用8抽樣推斷理論基礎(chǔ)大數(shù)定律中心極限定律表明大量隨機(jī)觀象平均結(jié)果具有穩(wěn)定性的性質(zhì)。大數(shù)定律論證了如果獨(dú)立隨機(jī)變量總體存在有限的平均數(shù)和方差,則對于充分大的樣本可以近乎100%的概率,期望樣本平均數(shù)與總體平均數(shù)的絕對離差為任意小。

如果變量總體存在有限的平均數(shù)和方差,那么不論這個總體的分布如何,隨著樣本容量的增加,樣本平均數(shù)的分布,便趨近于正態(tài)分布。

抽樣推斷理論基礎(chǔ)大數(shù)定律中心極限定律表明大量隨機(jī)觀象平均結(jié)果9抽樣推斷理論基礎(chǔ)大數(shù)定律中心極限定律表明大量隨機(jī)觀象平均結(jié)果具有穩(wěn)定性的性質(zhì)。大數(shù)定律論證了如果獨(dú)立隨機(jī)變量總體存在有限的平均數(shù)和方差,則對于充分大的樣本可以近乎100%的概率,期望樣本平均數(shù)與總體平均數(shù)的絕對離差為任意小。

如果變量總體存在有限的平均數(shù)和方差,那么不論這個總體的分布如何,隨著樣本容量的增加,樣本平均數(shù)的分布,便趨近于正態(tài)分布。

抽樣推斷理論基礎(chǔ)大數(shù)定律中心極限定律表明大量隨機(jī)觀象平均結(jié)果10抽樣推斷的基本概念全及總體抽樣總體又稱總體或母體,是所要認(rèn)識研究對象的全體,它由具有某種共同性質(zhì)或特征的單位所組成。常用N表示全及總體的單位數(shù)目。又稱樣本或子樣,是指從全及總體中按照隨機(jī)原則抽取的那部分個體的組合。抽樣總體的單位數(shù)稱為樣本容量,通常用n表示。1<n<N。抽樣推斷的基本概念全及總體抽樣總體又稱總體或母體,是所要認(rèn)識11抽樣推斷的基本概念例如:在100萬戶居民中,隨機(jī)抽取1000戶居民進(jìn)行家庭收支情況調(diào)查,其中的100萬戶居

民就是全及總體,而被抽中的1000戶居民則構(gòu)成抽樣總體。n≥30稱為大樣本,n

<30稱為小樣本.n/N稱為抽樣比.抽樣推斷的基本概念例如:在100萬戶居民中,隨機(jī)抽取100012設(shè)總體中個總體單位某項(xiàng)標(biāo)志的標(biāo)志值分別為,其中具有某種屬性的有

個單位,不具有某種屬性的有

個單位,則根據(jù)全及總體各個單位的標(biāo)志值或標(biāo)志特征所計(jì)算的反映總體某種屬性的綜合指標(biāo),又稱總體參數(shù)。全及指標(biāo)設(shè)總體中個總體單位某項(xiàng)標(biāo)志的標(biāo)志值分別為13⒈總體平均數(shù)(又叫總體均值):全及指標(biāo)⒉總體單位標(biāo)志值的標(biāo)準(zhǔn)差:⒈總體平均數(shù)(又叫總體均值):全及指標(biāo)⒉總體單位標(biāo)志值的14⒊總體單位標(biāo)志值的方差:⒋總體成數(shù):⒊總體單位標(biāo)志值的方差:⒋總體成數(shù):15⒌總體是非標(biāo)志的標(biāo)準(zhǔn)差:⒍總體是非標(biāo)志的方差:⒌總體是非標(biāo)志的標(biāo)準(zhǔn)差:⒍總體是非標(biāo)志的方差:16設(shè)樣本中個樣本單位某項(xiàng)標(biāo)志的標(biāo)志值分別為,其中具有和不具有某種屬性的樣本單位數(shù)目分別為和個,則指根據(jù)抽樣總體各個單位的標(biāo)志值或標(biāo)志特征計(jì)算的綜合指標(biāo),又被稱為統(tǒng)計(jì)量,它是隨機(jī)變量。抽樣指標(biāo)設(shè)樣本中個樣本單位某項(xiàng)標(biāo)志的標(biāo)志值指根據(jù)抽樣總體各個17⒈樣本平均數(shù)(又叫樣本均值):⒈樣本平均數(shù)(又叫樣本均值):18⒉樣本單位標(biāo)志值的標(biāo)準(zhǔn)差:⒊樣本單位標(biāo)志值的方差:為自由度為的無偏估計(jì)為的無偏估計(jì)⒉樣本單位標(biāo)志值的標(biāo)準(zhǔn)差:⒊樣本單位標(biāo)志值的方差:為自由19⒋樣本成數(shù):⒌樣本單位是非標(biāo)志的標(biāo)準(zhǔn)差:⒍樣本單位是非標(biāo)志的方差:為的無偏估計(jì)為的無偏估計(jì)⒋樣本成數(shù):⒌樣本單位是非標(biāo)志的標(biāo)準(zhǔn)差:⒍樣本單位是非20抽樣方法的分類重復(fù)抽樣從總體N個單位中隨機(jī)抽取一個樣本容量為n的樣本,每次從總體中抽取一個,并把結(jié)果登記下來,又放回總體中重新參加下一次的抽選。又稱放回抽樣總體單位數(shù)N不變,同一單位可能多次被抽中。根據(jù)取樣方式不同,可分為:抽樣方法的分類重復(fù)抽樣從總體N個單位中隨機(jī)抽取一個樣本容量為21抽樣方法的分類不重復(fù)抽樣每次從總體中抽選一個單位后就不再將其放回參加下一次的抽選。又稱不放回抽樣.總體單位數(shù)減少n,同一單位只可能被抽中一次。抽樣方法的分類不重復(fù)抽樣每次從總體中抽選一個單位后就不再將其22抽樣方法的分類根據(jù)對樣本的要求不同,可分為:考慮順序抽樣不考慮順序抽樣考慮各單位的中選順序。ABC≠CBA不考慮各單位的中選順序。ABC=CBA考慮順序的重復(fù)抽樣不考慮順序的不重復(fù)抽樣考慮順序的不重復(fù)抽樣不考慮順序的重復(fù)抽樣綜合起來共有四種抽樣方法抽樣方法的分類根據(jù)對樣本的要求不同,可分為:考慮順序抽樣不考23樣本的可能數(shù)目考慮順序的不重復(fù)抽樣不考慮順序的不重復(fù)抽樣考慮順序的重復(fù)抽樣不考慮順序的重復(fù)抽樣把填湖南風(fēng)采35選7福利彩票號碼看作一次抽樣,則它屬于哪一種抽樣?中特等獎的概率是多少?(0—9選6呢?)不考慮順序的不重復(fù)抽樣樣本的可能數(shù)目考慮順序的不重復(fù)抽樣不考慮順序的不重復(fù)抽樣考慮24樣本的概率分布把某一抽樣方法的全部可能的樣本指標(biāo)與其相應(yīng)的概率排列起來,就得到樣本的概率分布。若將樣本指標(biāo)的取值分別記為其相應(yīng)的概率記為P1,P2,…Pn,將它們按順序排列起來,可得如下概率分布表。

…………樣本的概率分布把某一抽樣方法的全部可能的樣本指標(biāo)與其相應(yīng)的概25第二節(jié)隨機(jī)抽樣的概率分布

樣本統(tǒng)計(jì)量總體未知參數(shù)樣本統(tǒng)計(jì)量樣本統(tǒng)計(jì)量樣本統(tǒng)計(jì)量樣本統(tǒng)計(jì)量樣本統(tǒng)計(jì)量樣本統(tǒng)計(jì)量樣本統(tǒng)計(jì)量樣本統(tǒng)計(jì)量樣本統(tǒng)計(jì)量樣本統(tǒng)計(jì)量樣本統(tǒng)計(jì)量樣本統(tǒng)計(jì)量抽樣分布樣本統(tǒng)計(jì)量所有可能值的概率分布主要樣本統(tǒng)計(jì)量平均數(shù)比率(成數(shù))方差分布的形狀及接近總體參數(shù)的程度第二節(jié)隨機(jī)抽樣的概率分布樣本統(tǒng)計(jì)量總體未知參數(shù)樣本統(tǒng)26學(xué)生ABCDEFG成績30405060708090按隨機(jī)原則抽選出4名學(xué)生,并計(jì)算平均分?jǐn)?shù)。平均數(shù)的抽樣分布樣本均值樣本均值樣本均值A(chǔ)BCDABCEABCFABCGABDEABDFABDGABEFABEGABFGACDEACDF4547.55052.55052.5555557.56052.555ACDGACEFACEGACFGADEFADEGADFGAEFGBCDEBCDFBCDGBCEF57.557.56062.56062.56567.55557.56060BCEGBCFGBDEFBDEGBDFGBEFGCDEFCDEGCDFGCEFGDEFG62.56562.56567.5706567.57072.575樣本均值4547.55052.55557.560出現(xiàn)次數(shù)1123445樣本均值62.56567.57072.575出現(xiàn)次數(shù)443211二者均值相等學(xué)生ABCDEFG按隨機(jī)原則抽選出4名學(xué)生,并27樣本均值4547.55052.55557.560出現(xiàn)次數(shù)1123445離差-15-12.5-10-7.5-5-2.50樣本均值62.56567.57072.575出現(xiàn)次數(shù)443211離差2.557.51012.515學(xué)生ABCDEFG成績30405060708090離差-30-20-100102030樣本均值4547.55052.528平均數(shù)的抽樣分布全部可能樣本平均數(shù)的均值等于總體均值,即:

從非正態(tài)總體中抽取的樣本平均數(shù)當(dāng)n足夠大時(shí)其分布接近正態(tài)分布。從正態(tài)總體中抽取的樣本平均數(shù)不論容量大小其分布均為正態(tài)分布。樣本均值的標(biāo)準(zhǔn)差為總體標(biāo)準(zhǔn)差的平均數(shù)的抽樣分布全部可能樣本平均數(shù)的均值等于總體均值,即:29比率的抽樣分布全部可能樣本比率的均值等于總體比率,即:

從非正態(tài)總體中抽取的樣本比率,當(dāng)n足夠大時(shí)其分布接近正態(tài)分布。從正態(tài)總體中抽取的樣本比率,不論容量大小其分布均為正態(tài)分布。樣本比率的標(biāo)準(zhǔn)差為總體標(biāo)準(zhǔn)的。比率的抽樣分布全部可能樣本比率的均值等于總體比率,即:30比率的抽樣分布教師是否博士A是B是C否D否E否F是具有博士學(xué)位的比率:P=0.5比率的標(biāo)準(zhǔn)差:=0.5從總體中按重復(fù)抽樣方法隨機(jī)抽?。慈?,計(jì)算其比率P和標(biāo)準(zhǔn)差比率的抽樣分布教師是否博士具有博士學(xué)位的比率:從總體31比率的抽樣分布樣本比率離差樣本比率離差A(yù)BCDABCEABCFABDEABDFABEFACDEACDF0.50.50.750.50.750.750.250.5000.2500.250.25-0.250ACEFADEFBCDEBCDFBCEFBDEFCDEF0.50.50.250.50.50.50.2500-0.25000-0.25比率的抽樣分布樣本比率離差樣本比率離差A(yù)BCD0.50A32全部可能樣本比率的均值等于總體比率,即:從非正態(tài)總體中抽取的樣本比率當(dāng)n足夠大時(shí)其分布接近正態(tài)分布。從正態(tài)總體中抽取的樣本比率不論容量大小其分布均為正態(tài)分布。樣本比率的標(biāo)準(zhǔn)差為總體標(biāo)準(zhǔn)差的。比率的抽樣分布全部可能樣本比率的均值等于總體比率,即:33學(xué)生ABCD成績60708090均值=75方差2=125從中按重復(fù)抽樣方式抽取2人,計(jì)算樣本的均值及方差S2

。方差的抽樣分布A60B70C80D90A60606060006070652550608070100200609075225450B707060652550707070007080752550709080100200C808060701002008070752550808080008090852550D90906075225450907080100200908085255090909000學(xué)生ABCD從中按重復(fù)抽樣方式抽?。踩耍?jì)算樣本的均34統(tǒng)計(jì)學(xué)課件第七章抽樣推斷35樣本抽樣分布原總體分布樣本抽樣分布原總體分布36抽樣誤差167CM169CM172CM160CM162CM167CM175CM180CM165CM167CM170CM175CM178CM180CM162CM173CM155CM160CM170CM165CM平均身高=169.8CM平均身高=174.6CM總平均身高=168.6CM抽樣誤差167CM169CM172CM160CM162CM137第三節(jié)參數(shù)估計(jì)

也叫抽樣估計(jì),就是根據(jù)樣本指標(biāo)數(shù)值對總體指標(biāo)數(shù)值作出估計(jì)或推斷。

參數(shù)估計(jì)通常,把用來估計(jì)總體特征的樣本指標(biāo)叫估計(jì)量或統(tǒng)計(jì)量,待估計(jì)的總體指標(biāo)叫總體參數(shù)。特點(diǎn)1、它在邏輯上運(yùn)用歸納推理而不是演繹推理。

2、在方法上運(yùn)用不確定的概率估計(jì)方法,而不是運(yùn)用確定的數(shù)學(xué)分析方法。3、抽樣估計(jì)存在抽樣誤差。第三節(jié)參數(shù)估計(jì)也叫抽樣估計(jì),就是根據(jù)樣本指標(biāo)數(shù)值38點(diǎn)估計(jì)從總體中抽取一個隨機(jī)樣本,計(jì)算與總體參數(shù)相應(yīng)的樣本統(tǒng)計(jì)量,然后把該統(tǒng)計(jì)量視為總體參數(shù)的估計(jì)值,稱為參數(shù)的點(diǎn)估計(jì)。簡單,具體明確優(yōu)點(diǎn)缺點(diǎn)無法控制誤差,僅適用于對推斷的準(zhǔn)確程度與可靠程度要求不高的情況點(diǎn)估計(jì)從總體中抽取一個隨機(jī)樣本,計(jì)算與總體參數(shù)相應(yīng)的樣本統(tǒng)計(jì)39的抽樣分布點(diǎn)估計(jì)的最大好處:給出確定的值點(diǎn)估計(jì)的最大問題;無法控制誤差.的抽樣分布點(diǎn)估計(jì)的最大好處:給出確定的值點(diǎn)估計(jì)的最大40問題:第一,我們?yōu)槭裁匆赃@一個而不是那一個統(tǒng)計(jì)量來估計(jì)某個總體參數(shù)?估計(jì)值的優(yōu)良標(biāo)準(zhǔn)第二,如果有兩個以上的統(tǒng)計(jì)量可以用來估計(jì)某個總體參數(shù),其估計(jì)結(jié)果是否一致?是否一個統(tǒng)計(jì)量要優(yōu)于另一個?估計(jì)值的優(yōu)良標(biāo)準(zhǔn):無偏性、有效性、一致性問題:估計(jì)值的優(yōu)良標(biāo)準(zhǔn)第二,如果有兩個以上的統(tǒng)計(jì)量可以用41抽樣估計(jì)量的優(yōu)良標(biāo)準(zhǔn)設(shè)為待估計(jì)的總體參數(shù),為樣本統(tǒng)計(jì)量,則的優(yōu)良標(biāo)準(zhǔn)為:若,則稱為的無偏估計(jì)量指樣本指標(biāo)的均值應(yīng)等于被估計(jì)的總體指標(biāo)無偏性抽樣估計(jì)量的優(yōu)良標(biāo)準(zhǔn)設(shè)為待估計(jì)的總體參數(shù),為樣本統(tǒng)計(jì)量42若,則稱為比更有效的估計(jì)量若越大越小,則稱為的一致估計(jì)量作為優(yōu)良的估計(jì)量,除了滿足無偏性的要求外,其方差應(yīng)比較小有效性指隨著樣本單位數(shù)的增大,樣本估計(jì)量將在概率意義下越來越接近于總體真實(shí)值一致性抽樣估計(jì)量的優(yōu)良標(biāo)準(zhǔn)若,則稱為比更有效的估計(jì)量若越大43學(xué)生ABCDEFG成績30405060708090有效性按隨機(jī)原則抽選出4名學(xué)生,并計(jì)算平均分?jǐn)?shù)和中位分?jǐn)?shù)。樣本均值4547.55052.55557.560出現(xiàn)次數(shù)1123445樣本均值62.56567.57072.575出現(xiàn)次數(shù)443211樣本中位數(shù)45505560657075出現(xiàn)次數(shù)4385834學(xué)生ABCDEFG有效性按隨機(jī)原則抽選出444有效性中位數(shù)的抽樣分布平均數(shù)的抽樣分布有效性中位數(shù)的抽樣分布平均數(shù)的抽樣分布45無偏性有偏無偏無偏性有偏無偏46一致性學(xué)生ABCDEFG成績30405060708090按隨機(jī)原則抽選出5名學(xué)生,并計(jì)算平均分?jǐn)?shù)。樣本均值樣本均值A(chǔ)BCDEABCDFABCDGABCEFABCEGABCFGABDEFABDEGABDFGABEFGACDEF5052545456585658606258ACDEGACDFGACEFGADEFGBCDEFBCDEGBCDFGBCEFGBDEFGCDEFG60626466606264666870樣本均值505254565860出現(xiàn)次數(shù)112233樣本均值6264666870出現(xiàn)次數(shù)32211n=4時(shí)的抽樣分布n=5時(shí)的抽樣分布一致性學(xué)生ABCDEFG按隨機(jī)原則抽選出5名學(xué)47為的無偏、有效、一致估計(jì)量;為的無偏、有效、一致估計(jì)量;為的無偏、有效、一致估計(jì)量。數(shù)理統(tǒng)計(jì)證明:抽樣估計(jì)量的優(yōu)良標(biāo)準(zhǔn)為的無偏、有效、一致估計(jì)量;數(shù)理統(tǒng)計(jì)證明:抽48區(qū)間估計(jì)給出一個區(qū)間(置信區(qū)間)并推斷真正的參數(shù)以一定的概率存在于這個區(qū)間的方法。抽樣平均誤差指每一個可能樣本的指標(biāo)值與總體指標(biāo)值之間平均離差,即一系列樣本指標(biāo)的標(biāo)準(zhǔn)差式中:為樣本平均數(shù)的抽樣平均誤差;為可能的樣本數(shù)目;為第個可能樣本的平均數(shù);為總體平均數(shù)注意:不要混淆抽樣標(biāo)準(zhǔn)差與樣本標(biāo)準(zhǔn)差!區(qū)間估計(jì)給出一個區(qū)間(置信區(qū)間)并推斷真正的參數(shù)以一定的概率49抽樣平均誤差的計(jì)算⒈樣本平均數(shù)的抽樣平均誤差當(dāng)N≥500時(shí),有重復(fù)抽樣時(shí):不重復(fù)抽樣時(shí):抽樣平均誤差的計(jì)算⒈樣本平均數(shù)的抽樣平均誤差當(dāng)N≥500時(shí)50⒉樣本成數(shù)的抽樣平均誤差重復(fù)抽樣時(shí):不重復(fù)抽樣時(shí):當(dāng)N≥500時(shí),有抽樣平均誤差的計(jì)算公式⒉樣本成數(shù)的抽樣平均誤差重復(fù)抽樣時(shí):不重復(fù)抽樣時(shí):當(dāng)N≥551關(guān)于總體方差的估計(jì)方法用過去同類問題全面調(diào)查或抽樣調(diào)查的經(jīng)驗(yàn)數(shù)據(jù)代替;用樣本標(biāo)準(zhǔn)差代替總體標(biāo)準(zhǔn)差,用代替。抽樣平均誤差的計(jì)算公式關(guān)于總體方差的估計(jì)方法用過去同類問題全面調(diào)查或抽樣調(diào)查的經(jīng)驗(yàn)52影響抽樣誤差的因素總體各單位標(biāo)志值的差異程度(即標(biāo)準(zhǔn)差的大?。涸酱?,抽樣誤差越大;樣本單位數(shù)的多少:越大,抽樣誤差越??;抽樣方法:不重復(fù)抽樣的抽樣誤差比重復(fù)抽樣的抽樣誤差??;抽樣組織方式:簡單隨機(jī)抽樣的誤差最大。影響抽樣誤差的因素總體各單位標(biāo)志值的差異程度(即標(biāo)準(zhǔn)差的大小53抽樣極限誤差指在一定的概率保證程度下,抽樣指標(biāo)與總體指標(biāo)之間抽樣誤差的最能范圍,也稱作抽樣允許誤差。常用大可△表示。上式表明:樣本平均數(shù)(成數(shù))是以總體平均數(shù)(成數(shù))為中心,,在相應(yīng)的區(qū)間內(nèi)變動。抽樣極限誤差指在一定的概率保證程度下,抽樣指標(biāo)與總體指標(biāo)之間54由于總體成數(shù)和總體平均數(shù)是未知的,它要求靠實(shí)測的抽樣平均數(shù)和抽樣成數(shù)來估計(jì),因而抽樣誤差的實(shí)際意義是希望總體平均數(shù)(成數(shù))落在某個已知的范圍內(nèi)。抽樣極限誤差所以前面的不等式應(yīng)變換為:在一個特定的全及總體中,當(dāng)抽樣方法和樣本容量固定時(shí),抽樣平均誤差是一個定值,因此,抽樣極限誤差通常以抽樣平均誤差為標(biāo)準(zhǔn)單位來衡量。即抽樣極限誤差通常表示為抽樣平均誤差的多少倍。

由于t值與樣本估計(jì)值落入允許誤差范圍內(nèi)的概率有關(guān),因此,t

也稱為概率度。由于總體成數(shù)和總體平均數(shù)是未知的,它要求靠實(shí)測的抽樣平均數(shù)和55抽樣估計(jì)的置信度抽樣指標(biāo)和總體指標(biāo)的誤差不超過一定范圍的概率大小,我們將它稱之為概率保證程度,也叫抽樣估計(jì)的置信度,一般用F(t)表示。即:置信度t值與相應(yīng)的概率保證程度存在一一對應(yīng)關(guān),常用t值及相應(yīng)的概率保證程度為:t值概率保證程度1.000.68271.960.95002.000.95453.000.9973在大樣本下抽樣估計(jì)的置信度抽樣指標(biāo)和總體指標(biāo)的誤差不超過一定范圍的概率5668.27%95.45%99.73%抽樣極限誤差68.27%95.45%99.73%抽樣極限誤差57以樣本統(tǒng)計(jì)量為中心,以抽樣平均誤差為距離單位,可以構(gòu)造一個區(qū)間,并可以一定的概率保證待估計(jì)的總體參數(shù)落在這個區(qū)間之中。區(qū)間越大,則概率保證程度越高。區(qū)間估計(jì)原理以樣本統(tǒng)計(jì)量為中心,以抽樣平均誤差為距離單位,可以構(gòu)造一58區(qū)間估計(jì)原理0.6827落在范圍內(nèi)的概率為68.27%樣本抽樣分布曲線原總體分布曲線區(qū)間估計(jì)原理0.6827落在范圍內(nèi)的概率為68.2759區(qū)間估計(jì)原理0.9545落在范圍內(nèi)的概率為95.45%樣本抽樣分布曲線原總體分布曲線區(qū)間估計(jì)原理0.9545落在范圍內(nèi)的概率為95.4560區(qū)間估計(jì)原理0.9973落在范圍內(nèi)的概率為99.73%樣本抽樣分布曲線總體分布曲線區(qū)間估計(jì)原理0.9973落在范圍內(nèi)的概率為61總體平均數(shù)的區(qū)間估計(jì)表達(dá)式其中,為極限誤差總體平均數(shù)的區(qū)間估計(jì)表其中,為極限62步驟⒈計(jì)算樣本平均數(shù);⒉搜集總體方差的經(jīng)驗(yàn)數(shù)據(jù);或計(jì)算樣本標(biāo)準(zhǔn)差,即總體平均數(shù)的區(qū)間估計(jì)步驟⒈計(jì)算樣本平均數(shù);⒉搜集總體方差的經(jīng)63⒊計(jì)算抽樣平均誤差:重復(fù)抽樣時(shí):

不重復(fù)抽樣時(shí):總體平均數(shù)的區(qū)間估計(jì)⒊計(jì)算抽樣平均誤差:重復(fù)抽樣時(shí):不重復(fù)抽樣時(shí):總體平均數(shù)64⒋計(jì)算抽樣極限誤差:⒌確定總體平均數(shù)的置信區(qū)間:總體平均數(shù)的區(qū)間估計(jì)⒋計(jì)算抽樣極限誤差:⒌確定總體平均數(shù)的置信區(qū)間:總體平均65【例A】某企業(yè)生產(chǎn)某種產(chǎn)品的工人有1000人,某日采用不重復(fù)抽樣從中隨機(jī)抽取100人調(diào)查他們的當(dāng)日產(chǎn)量,要求在95﹪的概率保證程度下,估計(jì)該廠全部工人的日平均產(chǎn)量和日總產(chǎn)量??傮w平均數(shù)的區(qū)間估計(jì)【例A】某企業(yè)生產(chǎn)某種產(chǎn)品的工人有1000人,某日采用不重復(fù)66按日產(chǎn)量分組(件)組中值(件)工人數(shù)(人)110~114114~118118~122122~126126~130130~134134~138138~14211211612012412813213614037182321186433681221602852268823768165605887006489284648600784合計(jì)—100126004144100名工人的日產(chǎn)量分組資料按日產(chǎn)量分組(件)組中值(件)工人數(shù)(人)110~114167解:解:68則該企業(yè)工人人均產(chǎn)量及日總產(chǎn)量的置信區(qū)間為:即該企業(yè)工人人均產(chǎn)量在124.797至127.203件之間,其日總產(chǎn)量在124797至127303件之間,估計(jì)的可靠程度為95﹪則該企業(yè)工人人均產(chǎn)量及日總產(chǎn)量的69總體成數(shù)的區(qū)間估計(jì)表達(dá)式其中,為極限誤差總體成數(shù)的區(qū)間估計(jì)表其中,為極限70步驟⒈計(jì)算樣本成數(shù);⒉搜集總體方差的經(jīng)驗(yàn)數(shù)據(jù);⒊計(jì)算抽樣平均誤差:重復(fù)抽樣條件下不重復(fù)抽樣條件下總體成數(shù)的區(qū)間估計(jì)步⒈計(jì)算樣本成數(shù);⒉搜集總體方差的經(jīng)驗(yàn)數(shù)71⒋計(jì)算抽樣極限誤差:⒌確定總體成數(shù)的置信區(qū)間:總體成數(shù)的區(qū)間估計(jì)⒋計(jì)算抽樣極限誤差:⒌確定總體成數(shù)的置信區(qū)間:總體成數(shù)的72【例B】若例A中工人日產(chǎn)量在118件以上者為完成生產(chǎn)定額任務(wù),要求在95﹪的概率保證程度下,估計(jì)該廠全部工人中完成定額的工人比重及完成定額的工人總數(shù)??傮w成數(shù)的區(qū)間估計(jì)【例B】若例A中工人日產(chǎn)量在118件以上者為完成生產(chǎn)定額任務(wù)73按日產(chǎn)量分組(件)組中值(件)工人數(shù)(人)110~114114~118118~122122~126126~130130~134134~138138~142112116120124128132136140371823211864合計(jì)—100100名工人的日產(chǎn)量分組資料完成定額的人數(shù)按日產(chǎn)量分組(件)組中值(件)工人數(shù)(人)110~114174解:解:75則該企業(yè)全部工人中完成定額的工人比重及完成定額的工人總數(shù)的置信區(qū)間為:即該企業(yè)工人中完成定額的工人比重在0.8432至0.9568之間,完成定額的工人總數(shù)在843.2至956.8人之間,估計(jì)的可靠程度為95﹪。則該企業(yè)全部工人中完成定額的工人比重及完成定額的工76樣本容量的確定影響樣本容量的因素總體各單位標(biāo)志值的差異程度(即標(biāo)準(zhǔn)差的大?。涸酱?,所需樣本容量越多允許的極限誤差△的大小:△越大,所需樣本容量越小;推斷的可靠程度,即置信度:對可靠程度要求越高,所需樣本容量越大;抽樣方法和抽樣組織方式:重復(fù)抽樣比不重復(fù)抽樣所需樣本容量要多;類型抽樣比簡單隨機(jī)抽樣所需樣本容量多。樣本容量的確定影響樣本容量的因素總體各單位標(biāo)志值的差異程度(77樣本容量調(diào)查誤差調(diào)查費(fèi)用小樣本容量節(jié)省費(fèi)用但調(diào)查誤差大大樣本容量調(diào)查精度高但費(fèi)用較大找出在規(guī)定誤差范圍內(nèi)的最小樣本容量確定樣本容量的意義找出在限定費(fèi)用范圍內(nèi)的最大樣本容量樣本容量調(diào)查誤差調(diào)查費(fèi)用小樣本容量節(jié)省費(fèi)用但調(diào)查誤差大大樣本78確定方法推斷總體平均數(shù)所需的樣本容量⑴重復(fù)抽樣條件下:通常的做法是先確定置信度,然后限定抽樣極限誤差?;騍通常未知。一般按以下方法確定其估計(jì)值:①過去的經(jīng)驗(yàn)數(shù)據(jù);②試驗(yàn)調(diào)查樣本的S。計(jì)算結(jié)果通常向上進(jìn)位確推斷總體平均數(shù)所需的樣本容量⑴重復(fù)抽樣條件下:通常的做法79⑵不重復(fù)抽樣條件下:推斷總體平均數(shù)所需的樣本容量⑵不重復(fù)抽樣條件下:推斷總體平均數(shù)所需的樣本容量80【例A】某食品廠要檢驗(yàn)本月生產(chǎn)的10000袋某產(chǎn)品的重量,根據(jù)上月資料,這種產(chǎn)品每袋重量的標(biāo)準(zhǔn)差為25克。要求在95.45﹪的概率保證程度下,平均每袋重量的誤差范圍不超過5克,應(yīng)抽查多少袋產(chǎn)品?【例A】某食品廠要檢驗(yàn)本月生產(chǎn)的10000袋某產(chǎn)品的重量,根81解:在不重復(fù)抽樣下:解:在不重復(fù)抽樣下:82確定方法推斷總體成數(shù)所需的樣本容量⑴重復(fù)抽樣條件下:通常的做法是先確定置信度,然后限定抽樣極限誤差。計(jì)算結(jié)果通常向上進(jìn)位通常未知。一般按以下方法確定其估計(jì)值:①過去的經(jīng)驗(yàn)數(shù)據(jù);②試驗(yàn)調(diào)查樣本的;③取方差的最大值0.25。確推斷總體成數(shù)所需的樣本容量⑴重復(fù)抽樣條件下:通常的做法是83⑵不重復(fù)抽樣條件下:確定方法推斷總體成數(shù)所需的樣本容量⑵不重復(fù)抽樣條件下:確推斷總體成數(shù)所需的樣本容量84【例B】某企業(yè)對一批總數(shù)為5000件的產(chǎn)品進(jìn)行質(zhì)量檢查,過去幾次同類調(diào)查所得的產(chǎn)品合格率為93﹪、95﹪、96﹪,為了使合格率的允許誤差不超過3﹪,在99.73﹪的概率保證程度下,應(yīng)抽查多少件產(chǎn)品?【分析】因?yàn)楣灿腥齻€過去的合格率的資料,為保證推斷的把握程度,應(yīng)選其中方差最大者,即P=93﹪?!纠鼴】某企業(yè)對一批總數(shù)為5000件的產(chǎn)品進(jìn)行質(zhì)量檢查,過去85解:解:86必要樣本容量的影響因素總體方差的大?。辉试S誤差范圍的大?。桓怕时WC程度;抽樣方法;抽樣的組織方式。重復(fù)抽樣條件下:不重復(fù)抽樣條件下:必要樣本容量的影響因素總體方差的大??;重復(fù)抽樣條件下:不重復(fù)87第四節(jié)抽樣設(shè)計(jì)

抽樣方案設(shè)計(jì)的基本原則隨機(jī)原則——抽取樣本單位時(shí),應(yīng)確保每個總體單位都有被抽取的可能;在對樣本單位的資料進(jìn)行搜集和整理時(shí),不能隨意遺漏或更換樣本單位最大抽樣效果原則抽樣誤差最小——在其他條件相同的情況下,選抽樣誤差最小的方案費(fèi)用最少——在其他條件相同的情況下,選費(fèi)用最少的方案設(shè)計(jì)抽樣方案時(shí),通常是在誤差達(dá)到一定要求的條件下,選擇費(fèi)用最少的方案第四節(jié)抽樣設(shè)計(jì)抽樣方案設(shè)計(jì)的基本原則隨機(jī)原則——抽取88簡單隨機(jī)抽樣對總體未作任何處理的情況下,然后按隨機(jī)原則直接從總體中抽出若干單位構(gòu)成樣本抽樣平均誤差的計(jì)算公式見書:P243抽取樣本的具體方法:抽簽法是將總體中每個單位的編號寫在外形完全一致的簽上,將其攪拌均勻,從中任意抽選,簽上的號碼所對應(yīng)的單位就是樣本單位。隨機(jī)數(shù)表法將總體中每個單位編上號碼,然后使用隨機(jī)數(shù)表,查出所要抽取的調(diào)查單位。簡單隨機(jī)抽樣對總體未作任何處理的情況下,然后按隨機(jī)原則直接從89應(yīng)用僅適用于規(guī)模不大、內(nèi)部各單位標(biāo)志值差異較小的總體簡單隨機(jī)抽樣的特點(diǎn)1、直接從總體中抽取所要調(diào)查的單位,無須分組、分類、排隊(duì)等處理;2、必須事先對總體中的所有單位進(jìn)行編碼和編號;3、抽取樣本時(shí)不借助有關(guān)標(biāo)志的輔助信息4、當(dāng)總體各單位村志值之間差異很大時(shí),采用此方法不能保證樣本的代表性。應(yīng)用僅適用于規(guī)模不大、內(nèi)部各單位標(biāo)志值差異較小的總體簡單隨機(jī)90先將總體全部單位按某一標(biāo)志分類,然后從各類型中按隨機(jī)原則抽取樣本單位組成樣本??傮wN樣本n等額抽取等比例抽取最優(yōu)抽取······類型抽樣實(shí)質(zhì)上是分組法與隨機(jī)原則的結(jié)合。例如,在居民生活水平調(diào)查中,先按職業(yè)分類,然后每種職業(yè)分別隨機(jī)抽取部分居民進(jìn)行調(diào)查。先將總體全部單位按某一標(biāo)志分類,然后從各類型中按隨機(jī)原則抽取91類型抽樣的優(yōu)點(diǎn):能提高樣本的代表性;能降低影響抽樣平均誤差的總方差;組織起來較為方便;類型抽樣分組的基本原則:盡量縮小各組內(nèi)標(biāo)志值之間的差異,增大組間各標(biāo)志值之間的差異。類型抽樣的優(yōu)點(diǎn):能提高樣本的代表性;類型抽樣分組的基本原則:92樣本在各組間的分配方法:等額分配法:每組抽取的單位數(shù)一樣。等比例分配法:按各組單位的比例分配樣本單位。最佳分配法:按各組的方差大小分配樣本單位。方差大的組分配較多的樣本單位。經(jīng)濟(jì)分配法:按各組的方差大小分配樣本單位,同時(shí)考慮各組抽樣調(diào)查的費(fèi)用。實(shí)際工作中比較常用的是等比例分配法。樣本在各組間的分配方法:等額分配法:每組抽取的單位數(shù)一樣。等93類型抽樣的抽樣平均誤差一、抽樣平均數(shù)二、抽樣成數(shù)類型抽樣的抽樣平均誤差一、抽樣平均數(shù)二、抽樣成數(shù)94【例】某市有250家商店,分大中小三類,現(xiàn)從中等比例抽出50家進(jìn)行銷售額調(diào)查,所得資料如下分層各層商店數(shù)Ni層權(quán)Wi各層抽取數(shù)ni各層銷售額樣本均值(萬元)樣本方差(萬元)大型商店中型商店小型商店25751500.10.30.65153017008001202800698510850合計(jì)2501.050____以95.45%的概率保證程度估計(jì)該市所有商店的平均銷售額。【例】某市有250家商店,分大中小三類,現(xiàn)從中等比例抽出5095根據(jù)題意知:N=250,W1=0.1,W2=0.3,W3=0.6,f1=f2=f3=0.2,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論