抽樣與抽樣分布三_第1頁(yè)
抽樣與抽樣分布三_第2頁(yè)
抽樣與抽樣分布三_第3頁(yè)
抽樣與抽樣分布三_第4頁(yè)
抽樣與抽樣分布三_第5頁(yè)
已閱讀5頁(yè),還剩57頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第一節(jié)抽樣及抽樣組織形式第二節(jié)常見(jiàn)的概率分布第三節(jié)抽樣分布第5章第5章抽樣和抽樣分布STAT本章重點(diǎn)1、簡(jiǎn)單隨機(jī)抽樣2、的抽樣分布3、的抽樣分布4、其他組織形式的抽樣本章難點(diǎn)1、抽樣分布原理2、中心極限定理指樣本單位的抽取不受主觀因素及其他系統(tǒng)性因素的影響,每個(gè)總體單位都有均等的被抽中機(jī)會(huì)抽樣推斷按照隨機(jī)原則

從全部研究對(duì)象中抽取一部分單位進(jìn)行調(diào)查,并以調(diào)查結(jié)果對(duì)總體數(shù)量特征作出具有一定可靠程度的估計(jì)與推斷,從而認(rèn)識(shí)總體的一種統(tǒng)計(jì)方法。

不可能進(jìn)行全面調(diào)查時(shí)

不必要進(jìn)行全面調(diào)查時(shí)

來(lái)不及進(jìn)行全面調(diào)查時(shí)對(duì)全面調(diào)查資料進(jìn)行補(bǔ)充修正時(shí)抽樣推斷的應(yīng)用第一節(jié)抽樣及抽樣組織形式一、抽樣的幾個(gè)基本概念(一)全及總體和樣本總體(二)總體參數(shù)和樣本統(tǒng)計(jì)量(三)重置抽樣與不重置抽樣二、抽樣組織形式(一)簡(jiǎn)單隨機(jī)抽樣(二)分層隨機(jī)抽樣(三)整群抽樣(四)等距抽樣(五)多階段抽樣STAT一、抽樣的幾個(gè)基本概念(一)全及總體和樣本總體STAT全及總體樣本總體又稱總體或母體,是統(tǒng)計(jì)抽樣中所要了解的研究對(duì)象整體。具有唯一性。又稱樣本或子樣,是指在統(tǒng)計(jì)抽樣中按照“等機(jī)會(huì)原則”從全及總體中抽出的部分單位。樣本不具唯一性。例如:在100萬(wàn)戶居民中,隨機(jī)抽取1000戶居民進(jìn)行家庭收支情況調(diào)查,其中的100萬(wàn)戶居民就是全及總體,而被抽中的1000戶居民則構(gòu)成樣本總體。n≥30稱為大樣本,n<30稱為小樣本.n/N稱為抽樣比.(二)總體參數(shù)和樣本統(tǒng)計(jì)量根據(jù)全及總體各單位變量值計(jì)算的反映全及總體某數(shù)量特征的綜合指標(biāo),由于全及總體唯一確定,故稱總體參數(shù)。根據(jù)樣本總體各單位變量值計(jì)算的反映樣本總體某數(shù)量特征的綜合指標(biāo),由于樣本總體不具唯一性,故稱為樣本統(tǒng)計(jì)量,它是一個(gè)隨機(jī)變量。STAT總體參數(shù)和樣本統(tǒng)計(jì)量符號(hào)STAT統(tǒng)計(jì)推斷全及總體參數(shù)(未知量)樣本總體統(tǒng)計(jì)量(已知量)抽樣推斷STAT(三))重置置抽樣樣與不不重置置抽樣樣STAT重置抽抽樣又被稱稱作重重復(fù)抽抽樣、、放回回抽樣樣抽出個(gè)體登記特征放回總體繼續(xù)抽取特點(diǎn)同一總總體單單位有有可能能被重重復(fù)抽抽中,,而且且每次次抽取取都是是獨(dú)立立進(jìn)行行。(三))重置置抽樣樣與不不重置置抽樣樣STAT不重置置抽樣樣又被稱稱作不不重復(fù)復(fù)抽樣樣、不不放回回抽樣樣抽出個(gè)體登記特征繼續(xù)抽取特點(diǎn)總體單單位數(shù)數(shù)減少少,同同一單單位只只可能能被抽抽中一一次。。在連連續(xù)抽抽取時(shí)時(shí),每每次抽抽取都都不是是獨(dú)立立進(jìn)行行。是最為為常用用的抽抽樣方方法,,用于于無(wú)限限總體和許許多有有限總總體樣樣本單單位的的抽樣樣。二、抽抽樣組組織形形式STAT(一)簡(jiǎn)單隨機(jī)抽樣(單純隨機(jī)抽樣)——對(duì)總體單位逐一編號(hào),然后按隨機(jī)原則直接從總體中抽出若干單位構(gòu)成樣本應(yīng)用僅適用于規(guī)模不大、內(nèi)部各單位標(biāo)志值差異較小的總體是最簡(jiǎn)簡(jiǎn)單、、最基基本、、最符符合隨隨機(jī)原原則隨機(jī)原原則的的實(shí)現(xiàn)現(xiàn)抽簽法法是將總總體中中每個(gè)個(gè)單位位的編號(hào)寫(xiě)在外外形完完全一一致的的簽上上,將將其攪攪拌均均勻,,從中中任意意抽選選,簽簽上的的號(hào)碼碼所對(duì)對(duì)應(yīng)的的單位位就是是樣本本單位位。隨機(jī)數(shù)數(shù)表法法將總體體中每每個(gè)單單位編上號(hào)號(hào)碼,然后后使用用隨機(jī)機(jī)數(shù)表表,查查出所所要抽抽取的的調(diào)查查單位位。計(jì)算機(jī)機(jī)模擬擬法是將隨隨機(jī)數(shù)數(shù)字編編制為為程序序存儲(chǔ)儲(chǔ)在計(jì)算機(jī)機(jī)中,需需要時(shí)時(shí)將總總體中中各單單位編編上號(hào)號(hào)碼,,啟用用隨機(jī)數(shù)數(shù)字發(fā)發(fā)生器器輸出隨隨機(jī)數(shù)數(shù)字,,然后后從總總體中中找到到相應(yīng)應(yīng)總體體單位位形成成樣本本。隨機(jī)數(shù)數(shù)字表表二、抽抽樣組組織形形式STAT(二)分層隨機(jī)抽樣(類型抽樣)——將總體全部單位分類,形成若干個(gè)類型組,然后從各類型中分別抽取樣本單位組成樣本總體N樣本n等額抽抽取等比例例抽取取········能使樣樣本結(jié)結(jié)構(gòu)更更接近近于總總體結(jié)結(jié)構(gòu),,提高高樣本本的代代表性性;能能同時(shí)時(shí)推斷斷總體體指標(biāo)標(biāo)和各各子總總體的的指標(biāo)標(biāo)二、抽抽樣組組織形形式STAT(三)整群抽樣(集團(tuán)抽樣)——將總體全部單位分為若干“群”,然后隨機(jī)抽取一部分“群”,被抽中群體的所有單位構(gòu)成樣本例:總總體群群數(shù)R=16樣樣本本群數(shù)數(shù)r=4ABCDEFGHIJKLMNOPLHPD樣本容容量簡(jiǎn)單、、方便便,能能節(jié)省省人力力、物物力、、財(cái)力和時(shí)時(shí)間,,但其其樣本本代表表性可可能較較差二、抽抽樣組組織形形式STAT(四)等距抽樣(機(jī)械抽樣或系統(tǒng)抽樣)——將總體單位按某一標(biāo)志排序,而后按一定的間隔抽取樣本單位?!ぁぁぁぁぁぁぁるS機(jī)起起點(diǎn)半距起起點(diǎn)對(duì)稱起起點(diǎn)(總體體單位位按某某一標(biāo)標(biāo)志排排序))按無(wú)關(guān)關(guān)標(biāo)志志排隊(duì)隊(duì),其其抽樣樣效果果相當(dāng)當(dāng)于簡(jiǎn)單隨隨機(jī)抽抽樣;按有有關(guān)標(biāo)標(biāo)志排排隊(duì),,其抽抽樣效效果相相當(dāng)于于類型抽抽樣。二、抽抽樣組組織形形式STAT(五)多階段抽樣——指分兩個(gè)或兩個(gè)以上的階段來(lái)完成抽取樣本單位的過(guò)程例:在在某省省100多多萬(wàn)農(nóng)農(nóng)戶抽抽取1000戶戶調(diào)查查農(nóng)戶戶生產(chǎn)產(chǎn)性投投資情情況。。

第一階段:從該省所有縣中抽取5個(gè)縣第二階段:從被抽中的5個(gè)縣中各抽4個(gè)鄉(xiāng)

第三階段:從被抽中的20個(gè)鄉(xiāng)中各抽5個(gè)村

第四階段:從被抽中的100個(gè)村中各抽10戶樣本n=100×10=1000(戶)第二節(jié)節(jié)常常見(jiàn)的的概率率分布布一、正正態(tài)分分布二、二二項(xiàng)分分布三、t分布布四、卡方分分布五、F分布布STAT一、正態(tài)分分布(一)正態(tài)態(tài)分布的定定義及其特特征STATxf(x)f(x)=隨隨機(jī)變量X的概率分布布密度函數(shù)數(shù)=總體均均值=總體方方差=3.1416;e=2.7183正態(tài)分布的的特征概率密度函函數(shù)在x的上方,即即f(x)>0。正態(tài)曲線的的最高點(diǎn)在在均值,它也是分分布的中位位數(shù)和眾數(shù)數(shù)。正態(tài)分布是是一個(gè)分布布族,每一一特定正態(tài)態(tài)分布通過(guò)過(guò)均值的標(biāo)準(zhǔn)差來(lái)區(qū)分。曲線f(x)相對(duì)于均均值對(duì)稱,尾端端向兩個(gè)方方向無(wú)限延延伸,且理理論上永遠(yuǎn)遠(yuǎn)不會(huì)與橫橫軸相交。。正態(tài)曲線下下的總面積積等于1。。隨機(jī)變量的的概率由曲曲線下的面面積給出。。STAT和對(duì)正態(tài)曲線的的影響xf(x)CAB正態(tài)分布的的概率abxf(x)概率是曲線線下的面積積!(二)標(biāo)準(zhǔn)準(zhǔn)正態(tài)分布布標(biāo)準(zhǔn)正態(tài)分分布的概率率密度函數(shù)數(shù)標(biāo)準(zhǔn)正態(tài)分分布的分布布函數(shù)STAT(二)標(biāo)準(zhǔn)準(zhǔn)正態(tài)分布布STATxms一般正態(tài)分布=1Z標(biāo)準(zhǔn)正態(tài)分布(三)正態(tài)態(tài)分布的概概率計(jì)算計(jì)算概率時(shí)時(shí),查標(biāo)準(zhǔn)正正態(tài)概率分分布表對(duì)于負(fù)的x,可由(-x)x得到對(duì)于標(biāo)準(zhǔn)正正態(tài)分布,,即X~N(0,1),有P(aXb)baP(|X|a)2a1對(duì)于一般正正態(tài)分布,,即X~N(,),,有STAT【例】設(shè)X~N(0,1),求以下下概率:(1)P(X<1.5);(2)P(X>2);(3)P(-1<X3);;(4)P(|X|2)解:(1)P(X<1.5)=(1.5)=0.9332(2)P(X>2)=1-P(2X)=1-0.9973=0.0227(3)P(-1<X3)=P(X3)-P(X<-1)=(3)-(-1)=(3)––[1-(1)]=0.9987-(1-0.8413)=0.8354(4)P(|X|2)=P(-2X|2)=(2)-(-2)=(2)-[1-(2)]=2(2)-1=0.9545【例】設(shè)X~N(5,32),求以下下概率(1)P(X10);;(2)P(2<X<10)解:(1)(2)二、二項(xiàng)分分布進(jìn)行n次重復(fù)試驗(yàn)驗(yàn),出現(xiàn)““成功”的的次數(shù)的概概率分布稱稱為二項(xiàng)分分布設(shè)X為n次重復(fù)試驗(yàn)驗(yàn)中事件A出現(xiàn)的次數(shù)數(shù),X取x的概率為STAT三、t分布布STAT概率分布密密度函數(shù)::具有自由度度為n的t分布的隨機(jī)機(jī)變量T的數(shù)學(xué)期望望和方差為為:E(T)=0;D(T)=n/(n-2),對(duì)n>2當(dāng)n充分大時(shí),,其圖形類類似于標(biāo)準(zhǔn)準(zhǔn)正態(tài)分布布密度函數(shù)數(shù)的圖形.t分布的密度函數(shù)關(guān)于x=0對(duì)稱,且不難看到,,當(dāng)n充分大時(shí),,t分布近似N(0,1)分布.但但對(duì)對(duì)于較小的的n,t分布與N(0,1)分布相差差很大.四、卡方分分布STAT記為定義:設(shè)相互獨(dú)立,都服從正態(tài)分布N(0,1),則稱隨機(jī)變量:

所服從的分布為自由度為n

的分布.分布是由正態(tài)分布派生出來(lái)的一種分布2分布的特點(diǎn)點(diǎn)分布布的的變變量量值值始始終終為為正正分布布的的形形狀狀取取決決于于其其自自由由度度n的大大小小,,通通常常為為不不對(duì)對(duì)稱稱的的正正偏偏分分布布,,但但隨隨著著自自由由度度的的增增大大逐逐漸漸趨趨于于對(duì)對(duì)稱稱期望望為為::E(2)=n,方方差差為為::D(2)=2n(n為自自由由度度)可加加性性::若若U和V為兩兩個(gè)個(gè)獨(dú)獨(dú)立立的的2分布布隨隨機(jī)機(jī)變變量量,,U~2(n1),,V~2(n2),則則U+V這一一隨隨機(jī)機(jī)變變量量服服從從自自由由度度為為n1+n2的2分布布STATc2分布布選擇容量為n的簡(jiǎn)單隨機(jī)樣本計(jì)算樣本方差S2計(jì)算卡方值2=(n-1)S2/σ2計(jì)算出所有的

2值不同容量樣本的抽樣分布c2n=1n=4n=10n=20ms總體由分布的定義,不難得到:1.

設(shè)相互獨(dú)立,都服從正態(tài)分布則2.設(shè)且X1,X2相互獨(dú)立,則這個(gè)性質(zhì)叫分布的可加性.應(yīng)用用中中心心極極限限定定理理可可得得,,若若,則當(dāng)n充分大時(shí),若的分布近似正態(tài)分布N(0,1).則可以以求求得得,,E(X)=n,D(X)=2n若由統(tǒng)統(tǒng)計(jì)計(jì)學(xué)學(xué)家家費(fèi)費(fèi)舍舍(R.A.Fisher)提出出的的,,以以其其姓姓氏氏的的第第一一個(gè)個(gè)字字母母來(lái)來(lái)命命名名則則設(shè)若若U為服服從從自自由由度度為為n1的2分布布,,即即U~2(n1),,V為服服從從自自由由度度為為n2的2分布布,,即即V~2(n2),且且U和V相互互獨(dú)獨(dú)立立,,則則稱F為服服從從自自由由度度n1和n2的F分布布,,記記為為五、、F分分布布STATF分布布不同同自自由由度度的的F分布布F(1,10)(5,10)(10,10)即它它的的數(shù)數(shù)學(xué)學(xué)期期望望并并不不依依賴賴于于第第一一自自由由度度n1.X的數(shù)學(xué)期望為為:若n2>2若X~F(n1,n2),X的概率密度為為第三節(jié)抽樣樣分布一、抽樣推斷斷的理論基礎(chǔ)礎(chǔ)二、單一總體體樣本均值、、樣本比例的的抽樣分布三、兩個(gè)總體體均值之差、、比例之差的的抽樣分布STAT一、抽樣推斷斷的理論基礎(chǔ)礎(chǔ)大數(shù)定律(大大數(shù)法則)如果隨機(jī)變量量總體存在著著有限的平均均數(shù)和方差,,則對(duì)于充分分大的抽樣單單位數(shù)n,可可以以幾乎趨趨近于1的概概率,使抽樣樣平均數(shù)與總總體平均數(shù)的的絕對(duì)離差的的期望為任意意小,即對(duì)于于任意的正數(shù)數(shù)有:STAT【例】設(shè)一個(gè)總體,,含有4個(gè)元元素(個(gè)體)),即總體單單位數(shù)N=4。4個(gè)個(gè)個(gè)體分別為為X1=1、X2=2、X3=3、X4=4??傮w體的均值、方方差及分布如如下均值和方差總體分布14230.1.2.3現(xiàn)從總體中抽抽取n=2的簡(jiǎn)單隨隨機(jī)樣本,在在重復(fù)抽樣條條件下,共有有42=16個(gè)樣本本。所有樣本本的結(jié)果如下下表3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二個(gè)觀察值第一個(gè)觀察值所有可能的n=2的樣本(共16個(gè))計(jì)算出各樣本本的均值,如如下表。并給給出樣本均值值的抽樣分布布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二個(gè)觀察值第一個(gè)觀察值16個(gè)樣本的均值(x)樣本均值的抽樣分布1.00.1.2.3P(x)1.53.04.03.52.02.5x所有樣本均值值的均值和方方差式中:M為樣本數(shù)目比較及結(jié)論:1.樣本均均值的均值((數(shù)學(xué)期望))等于總體均均值2.樣本均均值的方差等等于總體方差差的1/n樣本均值的分分布與總體分分布的比較抽樣分布=2.5σ2=1.25總體分布14230.1.2.3P(x)1.00.1.2.31.53.04.03.52.02.5x中心極限定理理定理:設(shè)X是是具有期望值值為,,方差為的的任意總總體,則樣本本平均數(shù)的抽抽樣分布,將將隨著n的增增大而趨于正正態(tài)分布,分分布形式(參參數(shù))為STAT中心極限定理理當(dāng)樣本容量足夠大時(shí)(n

30),樣本均值的抽樣分布逐漸趨于正態(tài)分布中心極限定理理:設(shè)從均值值為,方差為2的一個(gè)任意總總體中抽取容容量為n的樣本,當(dāng)n充分大時(shí),樣樣本均值的抽抽樣分布近似似服從均值為為μ、方差為σ2/n的正態(tài)分布一個(gè)任意分布的總體X二、單一總體體樣本均值、、樣本比例的的抽樣分布STAT樣本抽樣分布布原總體分布樣本均值的數(shù)數(shù)學(xué)期望樣本均值的方方差重復(fù)抽樣不重復(fù)抽樣樣本均值的抽抽樣分布STAT樣本比例的數(shù)數(shù)學(xué)期望樣本比例的方方差重復(fù)抽樣不重復(fù)抽樣樣本比例的抽抽樣分布STAT例3:假定某某統(tǒng)計(jì)人員在在填寫(xiě)的報(bào)表表中有2%至至少會(huì)有一處錯(cuò)誤,,如果我們檢檢查了一個(gè)有有600份報(bào)報(bào)表組成的隨機(jī)樣本本,

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論