抽樣與參數(shù)估計

上傳人：2*** IP屬地：湖北上傳時間：2023-02-01 格式：PPT 頁數(shù)：31 大小：5.53MB 積分：28 舉報 版權(quán)申訴

已閱讀5頁，還剩26頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認(rèn)領(lǐng)

文檔簡介

第9講

抽樣與參數(shù)估計一﹑抽樣方法抽樣概率抽樣非概率抽樣簡單隨機抽樣分層抽樣等距抽樣整群抽樣方便抽樣判斷抽樣定額抽樣滾雪球抽樣1.簡單隨機抽樣(SimpleRandomSampling)

一般地，設(shè)一個總體含有N個個體，從中逐個不放回地抽取n個個體作為樣本(n≤N),如果每次抽取時總體內(nèi)的各個個體被抽到的機會都相等，就把這種抽樣方法叫做簡單隨機抽樣。假設(shè)要對某食品店內(nèi)的一批小包裝餅干進行衛(wèi)生達標(biāo)檢驗，我們只能從中抽取一定數(shù)量的餅干作為檢驗的樣本。得到樣本餅干的一個方法是，將這批小包裝餅干放入一個不透明的袋子中，攪拌均勻，然后不放回地摸取(這樣可以保證每一袋餅干被抽中的機會相等)，這樣我們就可以得到一個簡單隨機樣本。抽簽法(抓鬮法):例如，高一（2）班有45名學(xué)生，現(xiàn)要從中抽出8名學(xué)生去參加一個座談會，每名學(xué)生的機會相等。我們可以把45名學(xué)生的學(xué)號寫在小紙片上，揉成小球，放到一個不透明袋子中，充分?jǐn)嚢韬?，再從中逐個抽出8個號簽，從而抽出8名參加座談會的學(xué)生。2.分層抽樣法(類型抽樣：StratifiedSampling)

一般地，在抽樣時，將總體分成互不交叉的層，然后按照一定的比例，從各層獨立地抽取一定數(shù)量的個體，將各層取出的個體合在一起作為樣本，這種抽樣方法是一種分層抽樣法．假設(shè)某地區(qū)有高中生2400人，初中生10900人，小學(xué)生11000人．此地區(qū)教育部門為了了解本地區(qū)中小學(xué)生的近視情況及形成原因，要從本地區(qū)中小學(xué)生中抽?。保サ膶W(xué)生進行調(diào)查．由于樣本容量與總體的個體數(shù)的比是1:100,因此,樣本中包含的各部分的個體數(shù)應(yīng)該是

2400/10010900/10011000/100即抽取24名高中生，109名初中生和110名小學(xué)生作為樣本．3.等距抽樣(系統(tǒng)抽樣:SystematicSampling)

等距抽樣是在總體中每隔一定距離選取一個樣本，即從數(shù)量為Ｎ的總體中每隔k個單位就選取一個樣本，若需選擇n個樣本，則取k=N/n,k的值需取整．(如遇到N/n不是整數(shù)的情況，可以先從總體中隨機地剔除幾個個體，使得總體中剩余的個體數(shù)能被樣本容量整除)某學(xué)校為了了解高一年級學(xué)生對教師教學(xué)的意見，打算從高一年級500名學(xué)生中抽取50名進行調(diào)查．首先將這500名學(xué)生從1開始進行編號，然后按號碼順序以一定的間隔進行抽取．由于500/50=10,這個間隔可以定為10,即從號碼為1～10的第一間隔中隨機地抽取一個號碼，假如抽到6號，然后從第6號開始，每隔10個號碼抽取一個，得到

6,16,26,36,···,496這樣我們就得到一個容量為50的樣本．4.整群抽樣(ClusterSampling)

整群抽樣就是從總體中成群成組地抽取調(diào)查單位，而不是一個一個地抽取調(diào)查單位。整群抽樣與分層抽樣有相似之處，即它們的第一步都是根據(jù)某種標(biāo)準(zhǔn)將總體劃分為一些子群。分層抽樣是在所有子群中均要抽取樣本，作為總體樣本的一部分。而整群抽樣則不然，它是抽取若干子群并將抽出的子群中全部個體作為樣本，因此總體樣本只分布在幾個群中。某大學(xué)共有100個班級，每班30人，共3000人?，F(xiàn)要抽300人作為樣本，就可以采取隨機的辦法抽10個班。整群抽樣的優(yōu)點是可以簡化抽樣的過程；降低收集資料的費用；擴大抽樣的應(yīng)用。其缺點是樣本分布不均勻，樣本的代表性較差。5.方便抽樣(ConvenienceSampling)

方便抽樣又稱為就近抽樣、偶遇抽樣和自然抽樣，它是一種非概率抽樣方法。

方便抽樣是指調(diào)查者根據(jù)現(xiàn)實情況，以自己方便的形式抽取偶然遇到的人作為調(diào)查對象，或者僅僅選擇那些離得最近的、最容易找到的人作為調(diào)查對象。為了調(diào)查某市的交通情況，研究者到離他最近的公共汽車站，把當(dāng)時正在那里等車的人選作調(diào)查對象。

在圖書館閱覽室對當(dāng)時正在閱讀的讀者進行調(diào)查。6.判斷抽樣(JudgmentSampling)

判斷抽樣又稱為主觀抽樣和立意抽樣，它是一種非概率抽樣方法。

判斷抽樣是根據(jù)合理的判斷而得到具有代表性的樣本的一種抽樣方法。如果判斷正確，使用判斷抽樣既節(jié)約時間又節(jié)省成本，但通常就一個判斷而言，有時出現(xiàn)判斷錯誤是不可避免的。某記者可以抽取他認(rèn)為能夠代表所有參議員觀點的兩名或三名參議員進行調(diào)查。7.定額抽樣(配額抽樣：QuotaSampling)

定額抽樣是一種非概率抽樣方法。

定額抽樣與分層抽樣相似，也是按調(diào)查對象的某種屬性或特征將總體中所有個體分成若干類或?qū)樱缓笤诟鲗又谐闃?，樣本中各層（類）所占比例與他們在總體中所占比例一樣。定額抽樣的目的在于要抽選出一個總體的“模擬物”。

某高校有2000名學(xué)生，其中男生占60％，女生占40％；文科學(xué)生和理科學(xué)生各占50％；一年級學(xué)生占40％，二年級、三年級、四年級學(xué)生分別占30％、20％和10％?，F(xiàn)要用定額抽樣方法依上述三個變量抽取一個規(guī)模為100人的樣本?？傻枚~表如下：

男生（60）女生（40）文科（30）理科（30）文科（20）理科（20）年級一二三四一二三四一二三四一二三四人數(shù)1296312963864286428.滾雪球抽樣(SnowballSampling)滾雪球抽樣是一種非概率抽樣方法。

在無法了解總體情況時，可以從總體中的少數(shù)成員入手，對他們進行調(diào)查，向他們詢問還知道哪些符合條件的人；再去找那些人并詢問他們知道的人。如同滾雪球一樣，我們可以找到越來越多具有相同性質(zhì)的群體成員。這樣的抽樣方法就是滾雪球抽樣方法。要研究退休老人的生活，可以清晨到公園去結(jié)識幾位散步老人，再通過他們結(jié)識其朋友，不用很久，你就可以交上一大批老年朋友。二﹑抽樣分布與參數(shù)估計1.正態(tài)分布與總體均值的區(qū)間估計

(1)正態(tài)分布設(shè)連續(xù)型隨機變量Ｘ的概率密度為其中μ,σ>0為常數(shù)，則稱Ｘ服從參數(shù)為μ,σ的正態(tài)分布或高斯(Gauss)分布，記為Ｘ~Ｎ(μ,σ2).當(dāng)μ=0,σ=1時，為標(biāo)準(zhǔn)正態(tài)分布，記作Ｎ(0,1).

從經(jīng)驗和理論的研究告訴我們，在實踐中遇到的隨機變量，有許多是服從或近似地服從正態(tài)分布律．

,f(X)=√2πσ1e-(x-μ)22σ2﹣∞<x<+∞正態(tài)分布的密度函數(shù)f(x)的曲線簡稱為正態(tài)曲線．下圖給出３條正態(tài)曲線，它們的μ都等于零，但卻具有不同的σ值．從圖可以看出，正態(tài)曲線具有下述性質(zhì):1)

曲線是位于橫軸的上方，以直線x=μ為對稱軸，它向左右對稱地?zé)o窮伸延，并且以橫軸為漸進線．當(dāng)x=μ時曲線處于最高點，當(dāng)x向左右遠(yuǎn)離μ時，曲線逐漸降低，整條曲線呈現(xiàn)“中間高，兩邊低”的形狀．參數(shù)σ決定了正態(tài)曲線的形狀特點

(2)中心極限定理

設(shè)從均值為μ，方差為σ2的一個服從任意分布的總體中，抽取容量為n的樣本，當(dāng)n充分大時，樣本均值的抽樣分布近似服從均值為μ，方差為σ2/n的正態(tài)分布．中心極限定理告訴我們，當(dāng)樣本總體不是正態(tài)分布或者總體的分布未知時，只要樣本容量n充分大，樣本均值就服從正態(tài)分布．那么n多大才叫充分大呢?當(dāng)總體的分布未知時，通常要求n≥30.

(3).σ2已知時，總體均值μ的區(qū)間估計

設(shè)(X1,X2,···,Xn)是來自正態(tài)總體Ｎ(μ,σ)的一個樣本，其中總體方差σ２已知，則統(tǒng)計量

~N(0,1).對于給定的顯著性水平α(0<α<1),總體均值μ在置信水平1-α下的置信區(qū)間為:

本例中，雖然總體分布未知，但由于n=36,是大樣本情況，根據(jù)中心極限定理，樣本均值服從正態(tài)分布．已知:n=36,σ=1.2，1-α=0.98則α=0.02,差表得Z=2.33樣本均值Ｘ=[(3×14)+(4×8)+(2×6)+(5×5)+(1×2)+(6×1)]/36=3.31根據(jù)前面的公式，總體均值在置信水平98%下的置信區(qū)間為:=(3.31-2.33,3.31+2.33)=(2.84,3.78)也就是說，有98%的把握相信，顧客平均入住天數(shù)大約在2.8天與3.8天之間．2α(X-Z2σnX+Z)σ√nα2α√,1.2√361.2√36案例:

某飯店隨機抽取了36名顧客，對其入住天數(shù)進行統(tǒng)計調(diào)查，其中入?。程斓挠?4人，入住４天的有８人，入?。蔡斓挠校度?，入?。堤斓挠校等耍胱。碧斓挠校踩?，入?。短斓挠校比?，假設(shè)其總體標(biāo)準(zhǔn)差為1.2，試構(gòu)建98%的置信區(qū)間，估計顧客的平均入住天數(shù)．n2.t分布與總體均值的區(qū)間估計

(1)t分布設(shè)(X1,X2,···,Xn)是來自正態(tài)總體N(μ,σ2)的一個樣本,而總體方差σ２未知，樣本均值,樣本方差為S２,

X=n1ΣXii=1nS2=n-11Σ(Xi-X)i=1n2t=X-μS/√nt=X-μS/√n~t(n-1).從圖可以看出t分布是對稱分布，當(dāng)n很大時(例如當(dāng)n>30時)t分布和正態(tài)分布很接近．t分布通常是在小樣本情況下，總體方差未知時，對總體均值μ的估計和假設(shè)檢驗中使用．則選取統(tǒng)計量其中

(2)σ2未知時，總體均值μ的區(qū)間估計

設(shè)(X1,X2,···,Xn)是來自正態(tài)總體Ｎ(μ,σ)的一個樣本，但總體方差σ２未知，這時要選取統(tǒng)計量,

則

對于給定的顯著性水平α(0<α<1),總體均值μ在置信水平1-α下的置信區(qū)間為:

t=X-μS/√nt=X-μS/√n~t(n-1).

案例:研究者從人群中隨機抽取16人，調(diào)查他們的年出游天數(shù)，得到他們的年出游天數(shù)分別為13天﹑9天﹑

7天﹑

15天﹑

17天﹑

20天﹑

12天﹑

6天﹑

12天﹑

10天﹑9天﹑16天﹑

7天﹑

8天﹑

11天，假設(shè)其總體服從正態(tài)分布，試在α=0.1下建立年人均出游天數(shù)的置信區(qū)間.已知n=16,α=0.1

計算得:查表得:t=1.753

根據(jù)公式，總體均值μ在置信水平90%下的置信區(qū)間為:也就是說，有90%的把握相信，年人均出游天數(shù)大約在9.8天到13.2天之間．ΣXi=11.5X=n1i=1ni=1n(Xi-X)2√1n-1Σ

=3.96S=2α(X–t(n-1),α2S√nX+t(n-1))α2S√n11.5+1.7533.9616)=(11.5-1.7533.9616,=(9.77,13.24)

3.總體比例的區(qū)間估計

(1)樣本比例的分布樣本比例p是樣本中具有某種特征的單位數(shù)量Ｘ除以樣本中的單位總數(shù)n得到的.

總體中具有某種特征的單位占全部單位的比例稱為總體比例，記作p.

在大樣本情況下，樣本比例分布近似于正態(tài)分布．若從總體中抽取n個樣本，則樣本比例p的均值為p,p的方差為

p=nXn1p(1-p),即p~N(p,p(1-p))n1Z=√p-pp(1-p)n則統(tǒng)計量~N(0,1).

(2)總體比例的區(qū)間估計在

中，要確定p的區(qū)間估計，用p代替分母中的p,得到在1-α的置信水平下，總體比例p值的置信區(qū)間為:

在上式中，是點估計，

P(1-P)nZ=√p-p

是估計誤差．案例:航空公司的飛行時間和價格是商務(wù)旅行者選擇航班的重要因素，調(diào)查結(jié)果表明，商務(wù)旅行者一般將航空公司許諾的?？驼劭劭闯墒亲钪匾囊蛩兀谝粋€由1993名商務(wù)旅行者組成的簡單隨機樣本中，有618人認(rèn)為折扣是他們最看好的東西．試在0.95的置信水平下，估計認(rèn)為折扣最有吸引力的人數(shù)所占的比例．=(0.29,0.33)p(1-p)n(p–Z

α2√,p(1-p)np+Z

α2√

已知,n=1993,p=618/1993=0.31,1-α=0.95查表得:Z2α=Z0.025=1.96由得知,認(rèn)為折扣最有吸引力的人數(shù)所占的比例為29%~33%之間.pp))

4.樣本容量的確定

(1)估計總體均值時，樣本容量的確定

在大樣本情況下，不論是正態(tài)總體還是非正態(tài)總體，在估計總體均值μ時，我們都選取統(tǒng)計量其中，Ｘ-μ就是估計誤差，記估計誤差為△，

△=X-μ,則得到估計總體均值μ時的樣本容量為:

X-μZ=σ/√n,

Z=σ/√n△2Zn=α2σ2△2

案例:某飯店為了合理配置前臺接待人員，飯店管理部門需要了解接待一名顧客所花費的時間，要求估計誤差不超過2分鐘，假定一名服務(wù)員接待一名顧客花費時間的標(biāo)準(zhǔn)差為4分鐘，問在99%的置信水平下，需要觀察多少名顧客?2Zα=Z0.005=2.58

查表得:n=α2σ2△2Z2=(2.58)2(4)222=26.6于是，已知估計誤差△=2,標(biāo)準(zhǔn)差σ=4,1-α=0.99,α=0.01即需要觀察27名顧客。(2)估計總體比例時,樣本容量的確定估計樣本比例時,選取統(tǒng)計量,估計誤差為△,△=p–p=Z2α√p(1-p)nP(1-P)nZ=√p-p在

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

抽樣與參數(shù)估計

文檔簡介

溫馨提示

最新文檔

評論

抽樣與參數(shù)估計

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔