




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
統(tǒng)計學(xué)
statistics李欣先
1/17/20241第九章抽樣與抽樣分布
第一節(jié)抽樣方法〔samplingmethods〕第二節(jié)抽樣誤差〔samplingerror〕第三節(jié)抽樣分布〔samplingdistribution〕第四節(jié)抽樣分布的應(yīng)用〔usingsamplingdistribution〕
1/17/20242主婦舀匙湯、夾口菜嘗嘗滋味,讀者在書店看幾眼書判斷內(nèi)容,戀人憑一見而鐘情,高考每門課的幾道題就決定了很多人的命運,作家在美國住了一兩年就寫出一部《美國印象》……1/17/20243第一節(jié)抽樣方法〔samplingmethods〕一、簡單隨機(jī)抽樣二、分層抽樣
三、系統(tǒng)抽樣
四、整群抽樣1/17/20244根據(jù)抽取的原那么不同,抽樣方法有概率抽樣〔randomsampling〕和非概率抽樣〔nonrandomsampling〕兩種。概率抽樣:簡單隨機(jī)抽樣,分層抽樣,系統(tǒng)抽樣,整群抽樣非概率抽樣:配額抽樣和判斷抽樣1/17/20245一、簡單隨機(jī)抽樣
〔simplerandomsampling〕simplerandomsamplingAsampleselectedsothateachitemorpersoninthepopulationhasthesamechanceofbeingincluded1/17/202461/17/20247Tableofrandomnumbers1/17/20248重復(fù)抽樣和不重復(fù)抽樣1、重復(fù)抽樣〔samplingwithreplacement〕又稱為重置抽樣,是指從總體N個單位中抽取一個容量為n的樣本。每次抽出一個單位后,再將其放回總體中參加下一次抽取。這樣連續(xù)抽n次即得到一個樣本。該抽樣方法的樣本可能數(shù)目記作即通常所說的可重復(fù)排列數(shù)。1/17/202492、不重復(fù)抽樣〔samplingwithoutreplacement〕又稱為不重置抽樣,是指抽中單位不再放回總體中,下一個樣本單位只能從余下的總體單位中抽取。采用不重復(fù)抽樣方法,同一總體單位不可能被重復(fù)抽中。該抽樣方法的樣本可能數(shù)目記作即通常所說的不重復(fù)排列數(shù)。1/17/202410簡單隨機(jī)抽樣可根據(jù)總體的有限性或無限性分為有限總體隨機(jī)抽樣與無限總體隨機(jī)抽樣。有限總體簡單隨機(jī)抽樣:每個樣本點〔個體〕能以相同的概率被抽出。無限總體簡單隨機(jī)抽樣:1、每一個體來自同一總體;2、每一個體是獨立抽取的。1/17/202411二、系統(tǒng)抽樣〔systematicsampling〕1/17/202412二、系統(tǒng)抽樣〔systematicsampling〕也稱機(jī)械抽樣或等距抽樣。它是先將總體單位按某一個抽樣起點,再按固定的順序和間隔來抽取樣本單位。某些情況下,系統(tǒng)樣本可能帶來偏差。1/17/2024131/17/202414三、分層抽樣〔stratifiedsampling〕又稱分類抽樣或類型抽樣。它是按與調(diào)查目的有關(guān)的某個主要標(biāo)志將總體單位劃分為假設(shè)干層〔也稱類、組或子總體〕,然后從多層中按隨機(jī)原那么分別抽取一定數(shù)目的單位構(gòu)成樣本。在某些情況下,相對于簡單隨機(jī)抽樣和系統(tǒng)抽樣,分層抽樣更能準(zhǔn)確地反映總體特征。例如調(diào)查員工對公司制度的看法,男女或者主管或者非主管看法不同1/17/202415四、整群抽樣〔clustersampling〕也稱集團(tuán)抽樣。它是將總體全部單位分為假設(shè)干局部〔每一局部稱為一個群體,簡稱群〕,然后按隨機(jī)原那么從中抽取一局部群體,抽中群體的所有單位構(gòu)成樣本。整群抽樣對抽中群體內(nèi)的所有單位進(jìn)行全面調(diào)查,而未抽中群體的單位一概不調(diào)查。例如調(diào)查中學(xué)教師對九年義務(wù)教育的看法,可能需要以學(xué)校為群,而不是以省為群。1/17/2024161/17/202417一次失敗的統(tǒng)計調(diào)查在1936年的美國總統(tǒng)選舉前,一份名為LiteraryDigest雜志進(jìn)行了一次民意調(diào)查。調(diào)查的焦點是誰將成為下一屆總統(tǒng)—是挑戰(zhàn)者,堪薩斯州州長AlfLandon,還是現(xiàn)任總統(tǒng)FranklinDelanoRoosevelt。為了解選民意向,民意調(diào)查專家們根據(jù)簿和車輛登記簿上的名單給一大批人發(fā)了簡單的調(diào)查表〔和汽車在1936年并不像現(xiàn)在那樣普及,但是這些名單比較容易得到〕。盡管發(fā)出的調(diào)查表大約有一千萬張,但收回的比例并不高。在收回的調(diào)查表中,AlfLandon非常受歡送。于是該雜志預(yù)測Landon將贏得選舉。但事實上是FranklinRoosevelt贏得了這次選舉在經(jīng)濟(jì)大蕭條時期調(diào)查有和汽車的人們,并不能夠反映全體選民的觀點。此外,只有少數(shù)的問卷被收回。這些都是值得疑心的1/17/202418第二節(jié)抽樣誤差〔samplingerror〕一、概念在抽樣調(diào)查中,誤差是指調(diào)查所得結(jié)果與總體真實數(shù)值之間的差異。二、誤差的來源1、登記性誤差在調(diào)查和匯總過程中由于觀察、測量、登記、計算等方面的差異或被調(diào)查者提供虛假資料而造成的誤差。2、代表性誤差用樣本指標(biāo)推斷總體指標(biāo)時,由于樣本結(jié)構(gòu)與總體結(jié)構(gòu)不一致。樣本缺乏代表總體而產(chǎn)生的誤差。代表性誤差又分為系統(tǒng)誤差和隨機(jī)誤差兩種。1/17/202419系統(tǒng)誤差是指由于非隨機(jī)因素引起的樣本代表性缺乏而產(chǎn)生的誤差,表現(xiàn)為樣本估計量的值系統(tǒng)性偏高或偏低,故也稱偏差。隨機(jī)誤差又稱為偶然性誤差,是指遵循原那么抽樣,由于隨機(jī)因素〔偶然性因素〕引起的代表性誤差。抽樣估計的抽樣誤差就是指這種隨機(jī)誤差。在抽樣調(diào)查中,登記性誤差和系統(tǒng)性誤差都可以盡量防止,而抽樣誤差那么是不可防止的,但可以計算并加以控制。1/17/2024201/17/2024經(jīng)濟(jì)管理學(xué)院21精確度高準(zhǔn)確度差,精密度高。準(zhǔn)確度高,精密度差。精確度差1/17/202421第三節(jié)抽樣分布〔samplingdistribution〕一、抽樣分布的概念二、樣本平均數(shù)的抽樣分布三、樣本比例的抽樣分布四、不重復(fù)抽樣的修正系數(shù)五、兩個樣本統(tǒng)計量的抽樣分布1/17/202422在進(jìn)行抽樣調(diào)查時,我們關(guān)心的焦點通常不在樣本上,樣本背后所代表的總體才是關(guān)心的重點。例如想知道一般家庭每月的支出的平均數(shù)和方差是多少,抽取100個家庭,進(jìn)行研究。又如關(guān)心群眾對總統(tǒng)候選人的支持率,抽樣1000位成年人,進(jìn)行民意調(diào)查。我們希望以樣本的統(tǒng)計量,如樣本平均數(shù)、樣本方差等,來推論總體參數(shù),如總體平均數(shù)、總體方差等,要到達(dá)此目的,必須知道樣本的統(tǒng)計量的概率分布。1/17/202423這里必須說明:如無特別聲明,我們下面只討論可重復(fù)的簡單隨機(jī)抽樣,所有變量為n的樣本稱為簡單隨機(jī)樣本,它滿足兩個條件:〔1〕相互獨立;〔2〕每個〔=1,2,…,n〕都與總體同分布。1/17/202424總體計算樣本統(tǒng)計量例如:樣本均值、比例、方差樣本1/17/202425〔一〕抽樣分布〔samplingdistribution〕的概念樣本指標(biāo)即樣本統(tǒng)計量是一種隨機(jī)變量,它有假設(shè)干可能取值〔即可能樣本指標(biāo)數(shù)值〕,每個可能取值有一定的可能性〔即概率〕從而形成它的概率分布,統(tǒng)計上稱為抽樣分布。簡言之,抽樣分布就是指樣本統(tǒng)計量的概率分布。
一、抽樣分布的根本問題1/17/202426〔二〕尋求抽樣分布的方法主要有精確方法、大樣本方法和隨機(jī)模擬法。1、精確方法當(dāng)總體的分布類型時,如果對任意自然數(shù)n都能導(dǎo)出統(tǒng)計量的分布的明顯的表達(dá)式,這種方法稱為精確方法,所得分布稱為精確抽樣分布。它對樣本變量n較小的統(tǒng)計推斷問題特別有用,故又稱小樣本方法。精確抽樣分布大多是在正態(tài)總體條件下得到的。
一、抽樣分布的根本問題1/17/2024272、大樣本方法精確抽樣分布在很多場合下不易求出或其表達(dá)式過于復(fù)雜而難于應(yīng)用。這時,我們借助于極限定理,尋求在樣本變量n無限增大時統(tǒng)計量的極限分布。假設(shè)此種分布能求得,那么當(dāng)n較大時,可用此極限分布當(dāng)作所求的抽樣分布的一種近似,這種方法稱為大樣本方法,這種極限分布常常稱為漸進(jìn)分布。一、抽樣分布的根本問題1/17/202428一、抽樣分布的根本問題〔三〕幾種常用分布在抽樣推斷中,許多場合下統(tǒng)計量服從正態(tài)分布或以正態(tài)分布為漸進(jìn)分布,所以正態(tài)分布是最常用的。此外,分布,分布,分布等精確抽樣分布也起著重要的作用。這里僅介紹分布、t分布和F分布的根本特征。1/17/202429一、抽樣分布的根本問題1、卡方(c2)分布〔1〕概念設(shè)是獨立同分布的隨機(jī)變量,且每個隨機(jī)變量都服從標(biāo)準(zhǔn)正態(tài)分布即~,那么隨機(jī)變量的分布稱作自由度為n的2分布,記為c2〔n〕。其分布密度為:1/17/202430一、抽樣分布的根本問題〔2〕分位數(shù)〔或臨界值〕假設(shè)或 那么稱k為c2〔n〕的分位數(shù),記為k?1/17/202431一、抽樣分布的根本問題〔3〕性質(zhì)假設(shè)X服從2〔n〕,那么均值E〔X〕=n,方差D〔X〕=2n。2分布具有可加性。假設(shè)X1,X2相互獨立,X1~2〔n1〕,X2~2〔n2〕那么〔X1+X2〕~2〔n1+n2〕當(dāng)n→∞時,2分布漸進(jìn)于正態(tài)分布,即2〔n〕~N〔n,2n〕1/17/202432一、抽樣分布的根本問題
選擇容量為n的簡單隨機(jī)樣本計算樣本方差S2計算卡方值
2=(n-1)S2/σ2計算出所有的
2值不同容量樣本的抽樣分布c2n=1n=4n=10n=20ms總體〔4〕2分布的圖形1/17/202433一、抽樣分布的根本問題2、t分布〔1〕概念設(shè)隨機(jī)變量x與Y相互獨立,而且X~N〔0,1〕,Y~2〔n〕,那么稱隨機(jī)變量服從自由度為n的t分布,記作t〔n〕。其分布密度為:1/17/202434一、抽樣分布的根本問題〔2〕分位數(shù)〔臨界值〕假設(shè)P(t〔n〕>k)=α那么稱k為t分布的α分位數(shù)。記為K?tα〔n〕
1/17/202435一、抽樣分布的根本問題〔3〕t分布的圖形Xt
分布與正態(tài)分布的比較正態(tài)分布t分布t不同自由度的t分布標(biāo)準(zhǔn)正態(tài)分布t(df=13)t(df=5)Z1/17/202436一、抽樣分布的根本問題(4)性質(zhì)。①t分布的均值E〔t〕=0,方差V〔t〕=n/n-2〔n>2〕。②t分布密度是關(guān)于t=0對稱的,故有t1-α〔n〕=-tα〔n〕。③當(dāng)n∞時,t分布漸進(jìn)于標(biāo)準(zhǔn)正態(tài)分布。
1/17/202437一、抽樣分布的根本問題3、F分布〔1〕概念設(shè)隨機(jī)變量X和Y相互獨立,且分別服從自由度為n1,n2的2分布,那么服從第一自由度為n1,第二自由度為n2的F分布,記作F~F〔n1,n2〕。其分布密度為:1/17/202438不同自由度的F分布F(1,10)(5,10)(10,10)1/17/202439一、抽樣分布的根本問題〔2〕分位數(shù)〔臨界值〕假設(shè)P[F〔n1,n2〕>K]=α那么稱K為F分布的α分位數(shù)記為:K?Fα〔n1,n2〕1/17/202440一、抽樣分布的根本問題〔3〕F分布的性質(zhì)①統(tǒng)計量F是大于零的正數(shù)。②F分布曲線為正偏態(tài),其尾端以橫軸為漸進(jìn)線趨于無窮。③F分布是一種連續(xù)的概率分布,不同的自由度組合有不同的F分布曲線1/17/202441二、樣本均值的抽樣分布
【例】設(shè)一個總體,含有4個元素(個體),即總體單位數(shù)N=4。4個個體分別為x1=1、x2=2、x3=3、x4=4??傮w的均值、方差及分布如下總體分布14230.1.2.3均值和方差1/17/202442
現(xiàn)從總體中抽取n=2的簡單隨機(jī)樣本,在重復(fù)抽樣條件下,共有42=16個樣本。所有樣本的結(jié)果為3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二個觀察值第一個觀察值所有可能的n=2的樣本(共16個)1/17/202443
計算出各樣本的均值,如下表。并給出樣本均值的抽樣分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二個觀察值第一個觀察值16個樣本的均值(x)X樣本均值的抽樣分布1.00.1.2.3P(X)1.53.04.03.52.02.51/17/202444
=2.5σ2=1.25總體分布14230.1.2.3抽樣分布P(X)1.00.1.2.31.53.04.03.52.02.5X1/17/202445
x的分布趨于正態(tài)分布的過程1/17/202446二、樣本平均數(shù)的抽樣分布〔一〕總體方差2時定理1:設(shè)總體X~N〔μ,2〕,〔x1,x2,…,xn〕是其一個簡單隨機(jī)樣本,那么樣本平均數(shù)~N(μ,2/n),E()=μ,V()=2/n。定理2:假設(shè)總體平均數(shù)μ和方差2有限,當(dāng)樣本容量n充分大時,無論總體分布形式如何,樣本平均數(shù)近似服從正態(tài)分布N(μ,2/n)。由上面兩個定理,根據(jù)抽樣平均誤差的定義,便可知平均數(shù)的抽樣平均誤差的計算公式為:()=1/17/202447例一個汽車電池的制造商聲稱其最好的電池壽命的分布均值為54個月,標(biāo)準(zhǔn)差為6個月。假設(shè)某一消費組織決定購置50個這種電池作為樣本來檢驗電池的壽命,以核實這一聲明?!?〕假設(shè)這個制造商之所言是真實的,試描述這50個電池樣本的平均壽命的抽樣分布?!?〕假設(shè)這個制造商之所言是真實的,那么消費組織的樣本壽命均值小于或等于52個月的概率是多少。1/17/202448例某酒店電梯中質(zhì)量標(biāo)志注明最大載重為18人,1350kg。假定該酒店游客及其攜帶行李的平均重量為70kg,標(biāo)準(zhǔn)差為6kg。試問隨機(jī)進(jìn)入電梯18人,總重量超重的概率是多少?1/17/202449定理3:設(shè)總體X~N〔μ,2〕,〔x1,x2,…,xn〕是其一個簡單隨機(jī)樣本,樣本均值為,樣本方差為S2,那么有1/17/202450二、樣本平均數(shù)的抽樣分布〔二〕總體方差2未知當(dāng)總體方差未知時,用樣本方差S2代替總體方差2,或用樣本標(biāo)準(zhǔn)差S代替總體標(biāo)準(zhǔn)差,那么有:定理4:設(shè)總體X~N〔μ,2〕,〔x1,x2,…,xn〕是其一個簡單隨機(jī)樣本,樣本均值為,樣本標(biāo)準(zhǔn)差為S,那么統(tǒng)計量結(jié)論:當(dāng)總體方差未知時,如果抽取的樣本為大樣本,那么樣本平均數(shù)服從正態(tài)分布;如果抽取的樣本為小樣本,那么樣本平均數(shù)服從t〔n-1〕分布1/17/202451三、樣本比例的抽樣分布
當(dāng)從總體中抽出一個變量n的樣本時,樣本中具有某種特征的單位數(shù)X,服從二項分布,即有X~B〔n,P〕。且有E(X)=n,V(X)=nP(1-P)因而樣本比例p=X/n也服從二項分布,且有:E〔P〕=E〔X/n〕=1/n×E〔X〕=PV〔p〕=V〔X/n〕=1/n2×V〔X〕=1/n×p〔1-p〕根據(jù)中心極限定理,當(dāng)n→∞,二次分布趨近于正態(tài)分布。所以在大樣本下,np和n〔1-p〕皆大于5,樣本比例近似服正態(tài)分布:p~N[p,1/n×p(1-p)]
1/17/202452三、樣本比例的抽樣分布由平均抽樣誤差的定義和V〔p〕=1/n×p(1-p)可知,比例的抽樣平均誤差為:
1/17/202453TheFoodMarketingInstituteshowsthat17%ofhouseholdsspendmorethan$100perweekongroceries.AssumethepopulationproportionisP=0.17andasimplerandomsampleof800householdswillbeselectedfromthepopulation.a.Showthesamplingdistributionofp,thesampleproportionofhouseholdsspendingmorethan$100perweekongroceries.b.Whatistheprobabilitythatthesampleproportionwillbewithin.02ofthepopulationproportion?1/17/202454四、不重復(fù)抽樣的修正系數(shù)
(correctionfactor)前所講的抽樣分布和抽樣平均誤差的計算公式,都是就重復(fù)抽樣而言的??梢宰C明,采用不重復(fù)抽樣時,平均數(shù)和比例的抽樣平均誤差應(yīng)為:
1/17/202455四、不重復(fù)抽樣的修正系數(shù)可見,不重復(fù)抽樣的抽樣平均誤差公式比重復(fù)抽樣的相應(yīng)公式多一個系數(shù)這個系數(shù)稱為不重復(fù)抽樣修正系數(shù)。當(dāng)N很大時,〔其中:n/N為抽樣比例〕。實際中,當(dāng)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 代理銷售活動合同樣本
- 學(xué)校愛國衛(wèi)生工作制度
- 會員返利合同樣本
- 職工食堂食品留樣制度
- 離婚協(xié)議書范本
- 通信工程施工現(xiàn)場臨時用電方案
- 職工思想道德教育制度
- “尊敬老師-友愛同學(xué)”主題班會教案
- 第六單元用四舍法試商教學(xué)設(shè)計人教版四年級上冊
- 泥漿處置專項方案
- 適老化住宅改造服務(wù)行業(yè)深度調(diào)研及發(fā)展戰(zhàn)略咨詢報告
- 2025年鄭州黃河護(hù)理職業(yè)學(xué)院單招職業(yè)技能測試題庫及答案1套
- 2025年上半年甘肅省農(nóng)墾集團(tuán)限責(zé)任公司人才招聘380人易考易錯模擬試題(共500題)試卷后附參考答案
- GB/T 45236-2025化工園區(qū)危險品運輸車輛停車場建設(shè)規(guī)范
- 中考語文文學(xué)批注-病句表達(dá)欠妥(含答案)
- 2025年河南經(jīng)貿(mào)職業(yè)學(xué)院單招職業(yè)技能測試題庫完整
- 春夏季疾病預(yù)防
- 二年級課間安全
- 法律、法規(guī)、規(guī)章、規(guī)范性文件和標(biāo)準(zhǔn)的區(qū)別
- 《哮喘的規(guī)范化治療》課件
- 2025年四川省綿陽市住房公積金服務(wù)中心招聘5人歷年高頻重點提升(共500題)附帶答案詳解
評論
0/150
提交評論