版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
第9講
抽樣與參數(shù)估計一﹑抽樣方法抽樣概率抽樣非概率抽樣簡單隨機抽樣分層抽樣等距抽樣整群抽樣方便抽樣判斷抽樣定額抽樣滾雪球抽樣1.簡單隨機抽樣(SimpleRandomSampling)
一般地,設(shè)一個總體含有N個個體,從中逐個不放回地抽取n個個體作為樣本(n≤N),如果每次抽取時總體內(nèi)的各個個體被抽到的機會都相等,就把這種抽樣方法叫做簡單隨機抽樣。假設(shè)要對某食品店內(nèi)的一批小包裝餅干進行衛(wèi)生達標(biāo)檢驗,我們只能從中抽取一定數(shù)量的餅干作為檢驗的樣本。得到樣本餅干的一個方法是,將這批小包裝餅干放入一個不透明的袋子中,攪拌均勻,然后不放回地摸取(這樣可以保證每一袋餅干被抽中的機會相等),這樣我們就可以得到一個簡單隨機樣本。抽簽法(抓鬮法):例如,高一(2)班有45名學(xué)生,現(xiàn)要從中抽出8名學(xué)生去參加一個座談會,每名學(xué)生的機會相等。我們可以把45名學(xué)生的學(xué)號寫在小紙片上,揉成小球,放到一個不透明袋子中,充分?jǐn)嚢韬?,再從中逐個抽出8個號簽,從而抽出8名參加座談會的學(xué)生。2.分層抽樣法(類型抽樣:StratifiedSampling)
一般地,在抽樣時,將總體分成互不交叉的層,然后按照一定的比例,從各層獨立地抽取一定數(shù)量的個體,將各層取出的個體合在一起作為樣本,這種抽樣方法是一種分層抽樣法.假設(shè)某地區(qū)有高中生2400人,初中生10900人,小學(xué)生11000人.此地區(qū)教育部門為了了解本地區(qū)中小學(xué)生的近視情況及形成原因,要從本地區(qū)中小學(xué)生中抽?。保サ膶W(xué)生進行調(diào)查.由于樣本容量與總體的個體數(shù)的比是1:100,因此,樣本中包含的各部分的個體數(shù)應(yīng)該是
2400/10010900/10011000/100即抽取24名高中生,109名初中生和110名小學(xué)生作為樣本.3.等距抽樣(系統(tǒng)抽樣:SystematicSampling)
等距抽樣是在總體中每隔一定距離選取一個樣本,即從數(shù)量為N的總體中每隔k個單位就選取一個樣本,若需選擇n個樣本,則取k=N/n,k的值需取整.(如遇到N/n不是整數(shù)的情況,可以先從總體中隨機地剔除幾個個體,使得總體中剩余的個體數(shù)能被樣本容量整除)某學(xué)校為了了解高一年級學(xué)生對教師教學(xué)的意見,打算從高一年級500名學(xué)生中抽取50名進行調(diào)查.首先將這500名學(xué)生從1開始進行編號,然后按號碼順序以一定的間隔進行抽取.由于500/50=10,這個間隔可以定為10,即從號碼為1~10的第一間隔中隨機地抽取一個號碼,假如抽到6號,然后從第6號開始,每隔10個號碼抽取一個,得到
6,16,26,36,···,496這樣我們就得到一個容量為50的樣本.4.整群抽樣(ClusterSampling)
整群抽樣就是從總體中成群成組地抽取調(diào)查單位,而不是一個一個地抽取調(diào)查單位。整群抽樣與分層抽樣有相似之處,即它們的第一步都是根據(jù)某種標(biāo)準(zhǔn)將總體劃分為一些子群。分層抽樣是在所有子群中均要抽取樣本,作為總體樣本的一部分。而整群抽樣則不然,它是抽取若干子群并將抽出的子群中全部個體作為樣本,因此總體樣本只分布在幾個群中。某大學(xué)共有100個班級,每班30人,共3000人?,F(xiàn)要抽300人作為樣本,就可以采取隨機的辦法抽10個班。整群抽樣的優(yōu)點是可以簡化抽樣的過程;降低收集資料的費用;擴大抽樣的應(yīng)用。其缺點是樣本分布不均勻,樣本的代表性較差。5.方便抽樣(ConvenienceSampling)
方便抽樣又稱為就近抽樣、偶遇抽樣和自然抽樣,它是一種非概率抽樣方法。
方便抽樣是指調(diào)查者根據(jù)現(xiàn)實情況,以自己方便的形式抽取偶然遇到的人作為調(diào)查對象,或者僅僅選擇那些離得最近的、最容易找到的人作為調(diào)查對象。為了調(diào)查某市的交通情況,研究者到離他最近的公共汽車站,把當(dāng)時正在那里等車的人選作調(diào)查對象。
在圖書館閱覽室對當(dāng)時正在閱讀的讀者進行調(diào)查。6.判斷抽樣(JudgmentSampling)
判斷抽樣又稱為主觀抽樣和立意抽樣,它是一種非概率抽樣方法。
判斷抽樣是根據(jù)合理的判斷而得到具有代表性的樣本的一種抽樣方法。如果判斷正確,使用判斷抽樣既節(jié)約時間又節(jié)省成本,但通常就一個判斷而言,有時出現(xiàn)判斷錯誤是不可避免的。某記者可以抽取他認(rèn)為能夠代表所有參議員觀點的兩名或三名參議員進行調(diào)查。7.定額抽樣(配額抽樣:QuotaSampling)
定額抽樣是一種非概率抽樣方法。
定額抽樣與分層抽樣相似,也是按調(diào)查對象的某種屬性或特征將總體中所有個體分成若干類或?qū)樱缓笤诟鲗又谐闃?,樣本中各層(類)所占比例與他們在總體中所占比例一樣。定額抽樣的目的在于要抽選出一個總體的“模擬物”。
某高校有2000名學(xué)生,其中男生占60%,女生占40%;文科學(xué)生和理科學(xué)生各占50%;一年級學(xué)生占40%,二年級、三年級、四年級學(xué)生分別占30%、20%和10%?,F(xiàn)要用定額抽樣方法依上述三個變量抽取一個規(guī)模為100人的樣本??傻枚~表如下:
男生(60)女生(40)文科(30)理科(30)文科(20)理科(20)年級一二三四一二三四一二三四一二三四人數(shù)1296312963864286428.滾雪球抽樣(SnowballSampling)滾雪球抽樣是一種非概率抽樣方法。
在無法了解總體情況時,可以從總體中的少數(shù)成員入手,對他們進行調(diào)查,向他們詢問還知道哪些符合條件的人;再去找那些人并詢問他們知道的人。如同滾雪球一樣,我們可以找到越來越多具有相同性質(zhì)的群體成員。這樣的抽樣方法就是滾雪球抽樣方法。要研究退休老人的生活,可以清晨到公園去結(jié)識幾位散步老人,再通過他們結(jié)識其朋友,不用很久,你就可以交上一大批老年朋友。二﹑抽樣分布與參數(shù)估計1.正態(tài)分布與總體均值的區(qū)間估計
(1)正態(tài)分布設(shè)連續(xù)型隨機變量X的概率密度為其中μ,σ>0為常數(shù),則稱X服從參數(shù)為μ,σ的正態(tài)分布或高斯(Gauss)分布,記為X~N(μ,σ2).當(dāng)μ=0,σ=1時,為標(biāo)準(zhǔn)正態(tài)分布,記作N(0,1).
從經(jīng)驗和理論的研究告訴我們,在實踐中遇到的隨機變量,有許多是服從或近似地服從正態(tài)分布律.
,f(X)=√2πσ1e-(x-μ)22σ2﹣∞<x<+∞正態(tài)分布的密度函數(shù)f(x)的曲線簡稱為正態(tài)曲線.下圖給出3條正態(tài)曲線,它們的μ都等于零,但卻具有不同的σ值.從圖可以看出,正態(tài)曲線具有下述性質(zhì):1)
曲線是位于橫軸的上方,以直線x=μ為對稱軸,它向左右對稱地?zé)o窮伸延,并且以橫軸為漸進線.當(dāng)x=μ時曲線處于最高點,當(dāng)x向左右遠(yuǎn)離μ時,曲線逐漸降低,整條曲線呈現(xiàn)“中間高,兩邊低”的形狀.參數(shù)σ決定了正態(tài)曲線的形狀特點
(2)中心極限定理
設(shè)從均值為μ,方差為σ2的一個服從任意分布的總體中,抽取容量為n的樣本,當(dāng)n充分大時,樣本均值的抽樣分布近似服從均值為μ,方差為σ2/n的正態(tài)分布.中心極限定理告訴我們,當(dāng)樣本總體不是正態(tài)分布或者總體的分布未知時,只要樣本容量n充分大,樣本均值就服從正態(tài)分布.那么n多大才叫充分大呢?當(dāng)總體的分布未知時,通常要求n≥30.
(3).σ2已知時,總體均值μ的區(qū)間估計
設(shè)(X1,X2,···,Xn)是來自正態(tài)總體N(μ,σ)的一個樣本,其中總體方差σ2已知,則統(tǒng)計量
~N(0,1).對于給定的顯著性水平α(0<α<1),總體均值μ在置信水平1-α下的置信區(qū)間為:
本例中,雖然總體分布未知,但由于n=36,是大樣本情況,根據(jù)中心極限定理,樣本均值服從正態(tài)分布.已知:n=36,σ=1.2,1-α=0.98則α=0.02,差表得Z=2.33樣本均值X=[(3×14)+(4×8)+(2×6)+(5×5)+(1×2)+(6×1)]/36=3.31根據(jù)前面的公式,總體均值在置信水平98%下的置信區(qū)間為:=(3.31-2.33,3.31+2.33)=(2.84,3.78)也就是說,有98%的把握相信,顧客平均入住天數(shù)大約在2.8天與3.8天之間.2α(X-Z2σnX+Z)σ√nα2α√,1.2√361.2√36案例:
某飯店隨機抽取了36名顧客,對其入住天數(shù)進行統(tǒng)計調(diào)查,其中入?。程斓挠?4人,入住4天的有8人,入?。蔡斓挠校度?,入?。堤斓挠校等耍胱。碧斓挠校踩?,入?。短斓挠校比?,假設(shè)其總體標(biāo)準(zhǔn)差為1.2,試構(gòu)建98%的置信區(qū)間,估計顧客的平均入住天數(shù).n2.t分布與總體均值的區(qū)間估計
(1)t分布設(shè)(X1,X2,···,Xn)是來自正態(tài)總體N(μ,σ2)的一個樣本,而總體方差σ2未知,樣本均值,樣本方差為S2,
X=n1ΣXii=1nS2=n-11Σ(Xi-X)i=1n2t=X-μS/√nt=X-μS/√n~t(n-1).從圖可以看出t分布是對稱分布,當(dāng)n很大時(例如當(dāng)n>30時)t分布和正態(tài)分布很接近.t分布通常是在小樣本情況下,總體方差未知時,對總體均值μ的估計和假設(shè)檢驗中使用.則選取統(tǒng)計量其中
(2)σ2未知時,總體均值μ的區(qū)間估計
設(shè)(X1,X2,···,Xn)是來自正態(tài)總體N(μ,σ)的一個樣本,但總體方差σ2未知,這時要選取統(tǒng)計量,
則
對于給定的顯著性水平α(0<α<1),總體均值μ在置信水平1-α下的置信區(qū)間為:
t=X-μS/√nt=X-μS/√n~t(n-1).
案例:研究者從人群中隨機抽取16人,調(diào)查他們的年出游天數(shù),得到他們的年出游天數(shù)分別為13天﹑9天﹑
7天﹑
15天﹑
17天﹑
20天﹑
12天﹑
6天﹑
12天﹑
12天﹑
10天﹑9天﹑16天﹑
7天﹑
8天﹑
11天,假設(shè)其總體服從正態(tài)分布,試在α=0.1下建立年人均出游天數(shù)的置信區(qū)間.已知n=16,α=0.1
計算得:查表得:t=1.753
根據(jù)公式,總體均值μ在置信水平90%下的置信區(qū)間為:也就是說,有90%的把握相信,年人均出游天數(shù)大約在9.8天到13.2天之間.ΣXi=11.5X=n1i=1ni=1n(Xi-X)2√1n-1Σ
=3.96S=2α(X–t(n-1),α2S√nX+t(n-1))α2S√n11.5+1.7533.9616)=(11.5-1.7533.9616,=(9.77,13.24)
3.總體比例的區(qū)間估計
(1)樣本比例的分布樣本比例p是樣本中具有某種特征的單位數(shù)量X除以樣本中的單位總數(shù)n得到的.
總體中具有某種特征的單位占全部單位的比例稱為總體比例,記作p.
在大樣本情況下,樣本比例分布近似于正態(tài)分布.若從總體中抽取n個樣本,則樣本比例p的均值為p,p的方差為
p=nXn1p(1-p),即p~N(p,p(1-p))n1Z=√p-pp(1-p)n則統(tǒng)計量~N(0,1).
(2)總體比例的區(qū)間估計在
中,要確定p的區(qū)間估計,用p代替分母中的p,得到在1-α的置信水平下,總體比例p值的置信區(qū)間為:
在上式中,是點估計,
P(1-P)nZ=√p-p
是估計誤差.案例:航空公司的飛行時間和價格是商務(wù)旅行者選擇航班的重要因素,調(diào)查結(jié)果表明,商務(wù)旅行者一般將航空公司許諾的??驼劭劭闯墒亲钪匾囊蛩兀谝粋€由1993名商務(wù)旅行者組成的簡單隨機樣本中,有618人認(rèn)為折扣是他們最看好的東西.試在0.95的置信水平下,估計認(rèn)為折扣最有吸引力的人數(shù)所占的比例.=(0.29,0.33)p(1-p)n(p–Z
α2√,p(1-p)np+Z
α2√
已知,n=1993,p=618/1993=0.31,1-α=0.95查表得:Z2α=Z0.025=1.96由得知,認(rèn)為折扣最有吸引力的人數(shù)所占的比例為29%~33%之間.pp))
4.樣本容量的確定
(1)估計總體均值時,樣本容量的確定
在大樣本情況下,不論是正態(tài)總體還是非正態(tài)總體,在估計總體均值μ時,我們都選取統(tǒng)計量其中,X-μ就是估計誤差,記估計誤差為△,
△=X-μ,則得到估計總體均值μ時的樣本容量為:
X-μZ=σ/√n,
Z=σ/√n△2Zn=α2σ2△2
案例:某飯店為了合理配置前臺接待人員,飯店管理部門需要了解接待一名顧客所花費的時間,要求估計誤差不超過2分鐘,假定一名服務(wù)員接待一名顧客花費時間的標(biāo)準(zhǔn)差為4分鐘,問在99%的置信水平下,需要觀察多少名顧客?2Zα=Z0.005=2.58
查表得:n=α2σ2△2Z2=(2.58)2(4)222=26.6于是,已知估計誤差△=2,標(biāo)準(zhǔn)差σ=4,1-α=0.99,α=0.01即需要觀察27名顧客。(2)估計總體比例時,樣本容量的確定估計樣本比例時,選取統(tǒng)計量,估計誤差為△,△=p–p=Z2α√p(1-p)nP(1-P)nZ=√p-p在
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年度專業(yè)版私人二手房購買協(xié)議3篇
- 2024-2030年中國大豆水解蛋白市場現(xiàn)狀分析及前景趨勢預(yù)測報告
- 2024-2030年中國城市地下管線探測行業(yè)需求趨勢預(yù)測發(fā)展規(guī)劃研究報告
- 2024-2030年中國垃圾發(fā)電項目可行性研究報告
- 2024-2030年中國地?zé)岵膳瘜S玫匕瀹a(chǎn)業(yè)未來發(fā)展趨勢及投資策略分析報告
- 2024-2030年中國土地儲備產(chǎn)業(yè)發(fā)展?fàn)顩r規(guī)劃研究報告
- 2024年度人工智能領(lǐng)域股權(quán)補償協(xié)議3篇
- 2024年度校園物業(yè)管理及優(yōu)化合同版B版
- 2024年物聯(lián)網(wǎng)技術(shù)應(yīng)用開發(fā)合作協(xié)議
- 馬鞍山職業(yè)技術(shù)學(xué)院《數(shù)據(jù)庫應(yīng)用技術(shù)案例》2023-2024學(xué)年第一學(xué)期期末試卷
- 2023年自考傳播學(xué)概論試題及答案
- GB/T 18277-2000公路收費制式
- 2023年住院醫(yī)師規(guī)范化培訓(xùn)胸外科出科考試
- 11468工作崗位研究原理與應(yīng)用第7章
- 2023實施《中華人民共和國野生動物保護法》全文學(xué)習(xí)PPT課件(帶內(nèi)容)
- 2022年初級育嬰師考試題庫附答案
- 系統(tǒng)家庭療法課件
- 新版GSP《醫(yī)療器械經(jīng)營質(zhì)量管理規(guī)范》培訓(xùn)試題
- 初中道德與法治答題技巧課件
- 河北省保定市藥品零售藥店企業(yè)藥房名單目錄
- 廣西基本醫(yī)療保險門診特殊慢性病申報表
評論
0/150
提交評論