版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第04章抽樣理論與參數(shù)估計(jì)Outline第一節(jié)抽樣的基本概念第二節(jié)抽樣方法第三節(jié)抽樣分布第四節(jié)樣本容量的計(jì)算第五節(jié)參數(shù)估計(jì)第一節(jié)抽樣的基本概念一、總體、個(gè)體與樣本二、參數(shù)與統(tǒng)計(jì)量反映總體數(shù)據(jù)特征的量數(shù)統(tǒng)稱為總體參數(shù),簡稱為參數(shù)。反映樣本數(shù)據(jù)特征的量數(shù)統(tǒng)稱為樣本統(tǒng)計(jì)量,簡稱為統(tǒng)計(jì)量。抽樣的基本概念總體(population):要研究的事物或現(xiàn)象的總體個(gè)體(unit):組成總體的每個(gè)元素(成員)總體容量(populationsize):一個(gè)總體中所含個(gè)體的數(shù)量樣本(sample):從總體中抽取的部分個(gè)體樣本容量(samplesize):樣本中所含個(gè)體的數(shù)量抽樣(sampling):為推斷總體的某些重要特征,需要從總體中按一定抽樣技術(shù)抽取若干個(gè)體的過程參數(shù)(parameter):反映總體數(shù)據(jù)特征的量數(shù)統(tǒng)計(jì)量(statistic):反映樣本數(shù)據(jù)特征的量數(shù)統(tǒng)計(jì)量是樣本的函數(shù),只依賴于樣本;樣本均值、樣本方差等都是統(tǒng)計(jì)量總體參數(shù)Vs.樣本統(tǒng)計(jì)量第二節(jié)抽樣方法一、簡單隨機(jī)抽樣二、等距抽樣三、分層抽樣一、簡單隨機(jī)抽樣所謂簡單隨機(jī)抽樣simplerandomsampling,就是在對(duì)某一特定總體中抽取樣本時(shí),總體中每一個(gè)元素或個(gè)體被抽取的可能性是同等的,而且任何元素或個(gè)體之間彼此被抽取的機(jī)會(huì)是獨(dú)立的。1.抽簽法2.隨機(jī)數(shù)字表二、等距抽樣又稱系統(tǒng)抽樣systematicsampling。先把總體所包含的各個(gè)元素或個(gè)體編上號(hào)碼。假設(shè)共有N個(gè)元素,則編出的號(hào)碼從1至N,然后可根據(jù)擬抽取的樣本容量n求得抽樣間距是k,看,k=N/n,這時(shí)可隨機(jī)確定一個(gè)起點(diǎn)a(1≤a≤k),起點(diǎn)確定后,從起點(diǎn)開始每間隔k個(gè)單位抽取一個(gè),這樣抽取的號(hào)碼序列也就確定了,即由號(hào)碼a,a+k,a+2k……a+(n-1)k組成容量為n的樣本。受總體數(shù)據(jù)的周期性的影響。三、分層抽樣stratifiedrandomsampling。按照總體已有的某些特征,承認(rèn)總體中已有的差異,按差異將總體分成幾個(gè)不同的部分,每一部分稱為一個(gè)層,在每一個(gè)層中實(shí)行簡單隨機(jī)抽樣。這種抽樣方法較充分地利用了總體的已有信息,是一種實(shí)用和操作都較方便的抽樣方法。分多少層視具體情況而定。原則:層內(nèi)差異變小,層與層之間的差異要盡可能大。-層內(nèi)同質(zhì),層外異質(zhì)??煞乐购唵坞S機(jī)抽樣造成的樣本構(gòu)成與總體構(gòu)成不成比例的現(xiàn)象。第三節(jié)抽樣分布一、樣本平均數(shù)分布二、χ2分布三、t分布四、F分布一、樣本平均數(shù)的分布samplingdistributionofthemean采用隨機(jī)抽樣的方法,從總體中抽取大小為n的樣本,計(jì)算出它的平均數(shù)X1,然后將這些個(gè)體放回總體去,再次取n個(gè)個(gè)體,又可以計(jì)算出X2,…再將n個(gè)個(gè)體放回去,再抽取n個(gè)個(gè)體,可以計(jì)算出無限個(gè)X,這些樣本平均數(shù)X所有可能值的概率分布叫平均數(shù)X的抽樣分布總體方差已知總體方差未知總體方差已知的樣本平均數(shù)分布-總體分布正態(tài)總體方差未知的樣本平均數(shù)分布中心極限定理CentralLimitTheorem設(shè)從均值為,方差為2(有限)的任意一個(gè)總體中抽取大小為n的樣本,當(dāng)n充分大時(shí),樣本均值X的抽樣分布近似服從均值為,方差為2/n的正態(tài)分布。注:什么叫n充分大呢?總體偏離正態(tài)越遠(yuǎn),則要求n就越大。在實(shí)際應(yīng)用中常要求n30或者n50標(biāo)準(zhǔn)誤standarderror樣本平均數(shù)的標(biāo)準(zhǔn)差稱為標(biāo)準(zhǔn)誤練習(xí)某電梯承受的最大拉力為1000千克,可乘坐13人。已知人群的平均體重為60千克,標(biāo)準(zhǔn)差為14千克,且服從正態(tài)分布。問電梯發(fā)生事故的概率是多少?總體方差未知的樣本平均數(shù)分布當(dāng)總體方差2未知時(shí),用S2作為2的估計(jì)值二、樣本方差的分布-2分布樣本方差的分布較復(fù)雜,它與總體分布有關(guān)。在這里只研究當(dāng)總體為正態(tài)分布時(shí),樣本方差的分布。設(shè)x1,x2,…,xn為來自正態(tài)分布N(,2)的樣本,則從數(shù)學(xué)上可以推導(dǎo)出正態(tài)總體下樣本方差S2的分布為:2分布Chi-squaredistribution2分布的特點(diǎn)正偏態(tài)分布當(dāng)df→∞時(shí),2分布為正態(tài)分布2值都是正值可加性k個(gè)2分布的和也是2分布2=df;2=2df(df>2)連續(xù)型分布2分布表
df=5,求
=0.05和
=0.01時(shí)的單側(cè)臨界值解:
三、t分布student’stdistribution自由度degreeoffreedom可以自由取值的變量的個(gè)數(shù)任意說出三個(gè)整數(shù)任意說出三個(gè)和為100的整數(shù)t分布的特點(diǎn)
對(duì)稱:左側(cè)為負(fù),右側(cè)為正,均值為0-
<t<+n→時(shí),t分布為正態(tài)分布,方差為1n>30時(shí),t分布為接近正態(tài)分布,方差>1,n<30時(shí),t分布與正態(tài)分布相差較大,隨n-1減小方差越大n>45時(shí),t分布與正態(tài)分布沒有多大差異在小樣本n<30時(shí),t分布具有重要作用t分布的一些推論四、F分布FdistributionF分布的特點(diǎn)F(n1,n2)分布形態(tài)是正偏態(tài)分布,形式隨n1,n2不同而不同,隨n1,n2的增加而漸趨正態(tài)分布F為兩個(gè)方差比率,所以為正值n1=1,n2任意時(shí),F(xiàn)值與自由度為n2的t值的平方相等,即F(1,n2)=t2(n2)F(n1,n2)=1/F1-(n2,n1)F分布的應(yīng)用F分布是統(tǒng)計(jì)學(xué)家費(fèi)歇爾(R.A.Fisher)于1924年首先發(fā)現(xiàn)的假設(shè)檢驗(yàn)區(qū)間估計(jì)方差分析回歸分析第四節(jié)樣本容量的計(jì)算最大允許誤差d是確定樣本容量的一個(gè)因素。方差與樣本容量的關(guān)系樣本容量n,總體方差2,允許誤差d,可靠性系數(shù)Z/2的關(guān)系總體方差越大,需要的樣本容量越大;允許誤差越大,需要的樣本容量越?。豢煽啃韵禂?shù)越大,需要的樣本容量越大;練習(xí)1.要使95%置信區(qū)間的允許誤差為5,應(yīng)選取多大的樣本容量?假定總體的標(biāo)準(zhǔn)差為25。2.一項(xiàng)調(diào)查中,總體比率的計(jì)劃值為0.35,則當(dāng)允許的最大絕對(duì)誤差為0.05時(shí),在求其95%置信區(qū)間時(shí)應(yīng)采用多大的樣本容量?3.一家廣告公司想估計(jì)某類商店去年所花的平均廣告費(fèi)有多少。檢驗(yàn)表明,總體方差約為1800000。如置信度取95%,并要使估計(jì)值處在總體平均值附近500元的范圍內(nèi),這家廣告公司應(yīng)取多大的樣本?第五節(jié)參數(shù)估計(jì)一、點(diǎn)估計(jì)二、區(qū)間估計(jì)參數(shù)估計(jì)設(shè)總體有待估參數(shù),自總體中抽取樣本x1,x2,…,xn點(diǎn)估計(jì)pointestimate用樣本的某一統(tǒng)計(jì)量估計(jì)
如用樣本均值估計(jì)總體均值區(qū)間估計(jì)intervalestimate求出一定概率下的取值范圍點(diǎn)估計(jì)統(tǒng)計(jì)量作為估計(jì)量estimator充分性sufficiency用到樣本的所有數(shù)據(jù)無偏性u(píng)nbiasedness估計(jì)值的平均值與真值一致有效性efficiency當(dāng)總體參數(shù)的無偏估計(jì)量有不止一個(gè)統(tǒng)計(jì)量時(shí),無偏估計(jì)變異性最小者有效性高,變異大者有效性低一致性consistency當(dāng)樣本容量無限增大時(shí),估計(jì)值越來越接近所估計(jì)的總體參數(shù)有效性哪個(gè)是更好的估計(jì)量?算術(shù)平均數(shù)vs.中數(shù)無偏估計(jì)量unbiasedestimator二、區(qū)間估計(jì)區(qū)間估計(jì)的原理樣本統(tǒng)計(jì)量的分布規(guī)律幾個(gè)概念顯著性水平significancelevel也叫置信系數(shù),指估計(jì)總體參數(shù)可能落入某區(qū)間時(shí)犯錯(cuò)誤的概率通常有三個(gè)標(biāo)準(zhǔn):
:0.05,0.01,0.001
1-:0.95,0.99,0.999置信水平、置信度
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 貨運(yùn)代理服務(wù)合同
- 水庫除險(xiǎn)技術(shù)與施工方案
- 小學(xué)階段英語學(xué)習(xí)策略分析方案
- 攤位租賃合同
- 機(jī)密資料保護(hù)協(xié)議書簽署模板
- 長期臨時(shí)員工外包服務(wù)協(xié)議
- 影視制作協(xié)議
- 物聯(lián)網(wǎng)技術(shù)合作合同范本
- 培訓(xùn)費(fèi)用結(jié)算協(xié)議范例
- 2024定制家居安裝與保養(yǎng)服務(wù)合同
- 5.2電動(dòng)汽車上電與下電功能控制課件
- 7帽子設(shè)計(jì)ppt課件(76頁P(yáng)PT)
- 平行四邊形和梯形整理與復(fù)習(xí)
- 大學(xué)課程《中國哲學(xué)史》完整word版教案
- 麥克斯韋速率分布律
- 4-6歲數(shù)學(xué)思維能力診斷測試題
- 肉牛屠宰公司組織機(jī)構(gòu)加各個(gè)崗位職責(zé)
- 小學(xué)英語人教PEP三年級(jí)起點(diǎn)四年級(jí)上冊(cè)英語全冊(cè)
- 3角的初步認(rèn)識(shí)(課件) 數(shù)學(xué)二年級(jí)上冊(cè) (共14張PPT)人教版
- 鋼絲繩的安全載重表
- 高中數(shù)學(xué)函數(shù)評(píng)課稿
評(píng)論
0/150
提交評(píng)論