第五章抽樣和抽樣分布_第1頁
第五章抽樣和抽樣分布_第2頁
第五章抽樣和抽樣分布_第3頁
第五章抽樣和抽樣分布_第4頁
第五章抽樣和抽樣分布_第5頁
已閱讀5頁,還剩39頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第五章抽樣與抽樣分布學(xué)習(xí)目的:了解抽樣的概率抽樣方法;理解抽樣分布的意義;了解抽樣分布的形成過程;理解中心極限定理;理解抽樣分布的性質(zhì)。2023/9/151第五章抽樣與抽樣分布第一節(jié)常用的抽樣方法第三節(jié)抽樣分布第三節(jié)抽樣分布的性質(zhì)2023/9/152第一節(jié)常用的抽樣方法

一、簡單隨機(jī)抽樣二、分層抽樣三、系統(tǒng)抽樣四、整群抽樣抽樣方法2023/9/154概率抽樣(probabilitysampling)根據(jù)一個已知的概率來抽取樣本單位,也稱隨機(jī)抽樣特點(diǎn)按一定的概率以隨機(jī)原則抽取樣本抽取樣本時使每個單位都有一定的機(jī)會被抽中每個單位被抽中的概率是已知的,或是可以計(jì)算出來的當(dāng)用樣本對總體目標(biāo)量進(jìn)行估計(jì)時,要考慮到每個樣本單位被抽中的概率2023/9/155簡單隨機(jī)抽樣(simplerandomsampling)1.從總體N個單位中隨機(jī)地抽取n個單位作為樣本,使得每一個總體單位都有相同的機(jī)會(概率)被抽中2.抽取元素的具體方法有重復(fù)抽樣和不重復(fù)抽樣3.特點(diǎn)簡單、直觀,在抽樣框完整時,可直接從中抽取樣本用樣本統(tǒng)計(jì)量對目標(biāo)量進(jìn)行估計(jì)比較方便4.局限性當(dāng)N很大時,不易構(gòu)造抽樣框抽出的單位很分散,給實(shí)施調(diào)查增加了困難沒有利用其他輔助信息以提高估計(jì)的效率2023/9/156分層抽樣(stratifiedsampling)將總體單位按某種特征或某種規(guī)則劃分為不同的層,然后從不同的層中獨(dú)立、隨機(jī)地抽取樣本優(yōu)點(diǎn)保證樣本的結(jié)構(gòu)與總體的結(jié)構(gòu)比較相近,從而提高估計(jì)的精度組織實(shí)施調(diào)查方便既可以對總體參數(shù)進(jìn)行估計(jì),也可以對各層的目標(biāo)量進(jìn)行估計(jì)2023/9/157系統(tǒng)抽樣(systematicsampling)將總體中的所有單位(抽樣單位)按一定順序排列,在規(guī)定的范圍內(nèi)隨機(jī)地抽取一個單位作為初始單位,然后按事先規(guī)定好的規(guī)則確定其他樣本單位先從數(shù)字1到k之間隨機(jī)抽取一個數(shù)字r作為初始單位,以后依次取r+k,r+2k…等單位優(yōu)點(diǎn):操作簡便,可提高估計(jì)的精度缺點(diǎn):對估計(jì)量方差的估計(jì)比較困難2023/9/158整群抽樣(clustersampling)將總體中若干個單位合并為組(群),抽樣時直接抽取群,然后對中選群中的所有單位全部實(shí)施調(diào)查特點(diǎn)抽樣時只需群的抽樣框,可簡化工作量調(diào)查的地點(diǎn)相對集中,節(jié)省調(diào)查費(fèi)用,方便調(diào)查的實(shí)施缺點(diǎn)是估計(jì)的精度較差2023/9/159補(bǔ)充:抽樣框把握以下問題:1、概念;2、抽樣框的形式;3、對抽樣框的要求。2023/9/15101、概念抽樣框:指包括全部抽樣單位的名單框架。調(diào)查目的確定后,總體隨之確定,總體又叫目標(biāo)總體,即理論上的抽樣范圍,與實(shí)際抽樣的總體范圍有時不一致。此外抽樣單位可以是個總體單位,也可以是若干總體單位的集合。如某省進(jìn)行農(nóng)戶收支調(diào)查,目標(biāo)總體是全省所有農(nóng)戶,抽樣單位可以是每個農(nóng)戶,也可以是每個鄉(xiāng)或村。所以,有目標(biāo)總體后還必須明確實(shí)際進(jìn)行抽樣的總體范圍和抽樣單位。2023/9/15112、抽樣框的形式(1)名單抽樣框:列出全部總體單位的名錄一覽表,如職工名單、企業(yè)名單等。(2)區(qū)域抽樣框:按地理位置將總體范圍劃分為若干小區(qū)域,以小區(qū)域?yàn)槌闃訂挝弧H缒呈芯用褡》空{(diào)查,將全市居民戶劃分為若干街道或片區(qū)。(3)時間表抽樣框:將總體全部單位按時間順序排列,把總體的時間過程分為若干小的時間單位,以時間單位作為抽樣單位。如對流水線上24小時內(nèi)生產(chǎn)的產(chǎn)品進(jìn)行質(zhì)量抽檢。2023/9/15123、對抽樣框的要求(1)應(yīng)與目標(biāo)總體一致,即包括全部總體單位,不重不漏,否則破壞隨機(jī)原則。例如,對某市居民進(jìn)行抽查,以電話號碼本為抽樣框不科學(xué)。(2)盡可能利用與所研究變量高度相關(guān)的輔助變量的信息,設(shè)計(jì)最佳的抽樣組織方式和抽樣估計(jì)方法。2023/9/1513第二節(jié)抽樣分布

一、抽樣分布的概念二、樣本均值抽樣分布的形成過程三、樣本均值的抽樣分布四、中心極限定理五、樣本比率的抽樣分布六、樣本方差的抽樣分布抽樣分布的概念樣本統(tǒng)計(jì)量的概率分布,是一種理論分布在重復(fù)選取容量為n的樣本時,由該統(tǒng)計(jì)量的所有可能取值形成的相對頻數(shù)分布

隨機(jī)變量是樣本統(tǒng)計(jì)量樣本均值,樣本比例,樣本方差等結(jié)果來自容量相同的所有可能樣本提供了樣本統(tǒng)計(jì)量長遠(yuǎn)而穩(wěn)定的信息,是進(jìn)行推斷的理論基礎(chǔ),也是抽樣推斷科學(xué)性的重要依據(jù)

抽樣分布(samplingdistribution)2023/9/1516抽樣分布的形成過程

(samplingdistribution)總體計(jì)算樣本統(tǒng)計(jì)量如:樣本均值、比例、方差樣本2023/9/1517樣本均值的

抽樣分布在重復(fù)選取容量為n的樣本時,由樣本均值的所有可能取值形成的相對頻數(shù)分布一種理論概率分布推斷總體均值

的理論基礎(chǔ)

樣本均值的抽樣分布2023/9/1519樣本均值的抽樣分布(例題分析)【例】設(shè)一個總體,含有4個元素(個體)

,即總體單位數(shù)N=4。4

個個體分別為x1=1,x2=2,x3=3,x4=4

。總體的均值、方差及分布如下總體分布14230.1.2.3均值和方差

=2.5σ2=1.252023/9/1520樣本均值的抽樣分布(例題分析)

現(xiàn)從總體中抽取n=2的簡單隨機(jī)樣本,在重復(fù)抽樣條件下,共有42=16個樣本。所有樣本的結(jié)果為3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二個觀察值第一個觀察值所有可能的n=2的樣本(共16個)2023/9/1521樣本均值的抽樣分布(例題分析)

計(jì)算出各樣本的均值,如下表。并給出樣本均值的抽樣分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二個觀察值第一個觀察值16個樣本的均值(x)x樣本均值的抽樣分布1.000.10.20.3P

(x)1.53.04.03.52.02.52023/9/1522樣本均值的分布與總體分布的比較

(例題分析)

=2.5σ2=1.25總體分布14230.1.2.3抽樣分布P(x)1.00.1.2.31.53.04.03.52.02.5x2023/9/1523中心極限定理樣本均值的抽樣分布

與中心極限定理

=50

=10X總體分布n=4抽樣分布xn=16當(dāng)總體服從正態(tài)分布N(μ,σ2)時,來自該總體的所有容量為n的樣本的均值

x也服從正態(tài)分布,

x

的數(shù)學(xué)期望為μ,方差為σ2/n。即

x~N(μ,σ2/n)2023/9/1525中心極限定理(centrallimittheorem)當(dāng)樣本容量足夠大時(n

30),樣本均值的抽樣分布逐漸趨于正態(tài)分布中心極限定理:設(shè)從均值為

,方差為

2的一個任意總體中抽取容量為n的樣本,當(dāng)n充分大時,樣本均值的抽樣分布近似服從均值為μ、方差為σ2/n的正態(tài)分布一個任意分布的總體x2023/9/1526中心極限定理(centrallimittheorem)

x的分布趨于正態(tài)分布的過程2023/9/1527樣本均值的抽樣分布

設(shè)總體共有N個單位,其均值為

,方差為

2,從中抽取容量為n的樣本,樣本均值的數(shù)學(xué)期望記為,樣本均值的方差記為。則無論是重復(fù)抽樣還是不重復(fù)抽樣,樣本均值的數(shù)學(xué)期望始終等于總體均值,即:而樣本均值的方差與抽樣方法有關(guān):重復(fù)抽樣不重復(fù)抽樣2023/9/1528樣本均值的抽樣分布比較及結(jié)論:1.樣本均值的均值(數(shù)學(xué)期望)等于總體均值;2.樣本均值的方差等于總體方差的1/n2023/9/1529樣本均值的抽樣分布對于無限總體進(jìn)行不重復(fù)抽樣時,可以按重復(fù)抽樣來處理,因?yàn)槠湫拚禂?shù)趨向于1。此時樣本均值的方差可按重復(fù)抽樣的公式來計(jì)算。對于有限總體,當(dāng)N很大,n很小時,其修正系數(shù)也趨向于1,這時樣本均值的方差也可按重復(fù)抽樣的公式計(jì)算。2023/9/1530樣本比率的

抽樣分布樣本比率的抽樣分布設(shè)總體單位數(shù)為N,具有某種屬性特征的單位數(shù)為N0,不具有某種屬性特征的單位數(shù)為N1,則有N0+N1=N,

=N0/N,N1/N=1-

,相應(yīng)的樣本比率用p表示。在重復(fù)抽選容量為n的樣本時,由樣本比率的所有可能取值形成的相對頻數(shù)分布,稱為樣本比率的抽樣分布。P的抽樣分布是樣本比率p的所有可能值的概率分布。當(dāng)樣本容量很大時,樣本比率p的抽樣分布可用正態(tài)分布近似。對于一個具體的樣本比率p,若n(1-p)和np均大于等于5,就可以認(rèn)為樣本容量足夠大。2023/9/1532樣本比率的數(shù)學(xué)期望樣本比率的方差重復(fù)抽樣不重復(fù)抽樣樣本比率的抽樣分布2023/9/1533樣本比率的抽樣分布對于無限總體進(jìn)行不重復(fù)抽樣時,可以按重復(fù)抽樣來處理,因?yàn)槠湫拚禂?shù)趨向于1。此時樣本均值的方差可按重復(fù)抽樣的公式來計(jì)算。對于有限總體,當(dāng)N很大,而抽樣比n/N小于等于5%時,其修正系數(shù)也趨向于1,這時樣本均值的方差也可按重復(fù)抽樣的公式計(jì)算。2023/9/1534樣本方差的

抽樣分布在重復(fù)抽選容量為n的樣本時,由樣本方差的所有可能取值形成的相對頻數(shù)分布,稱為樣本方差的抽樣分布。對來自正態(tài)總體的簡單隨機(jī)樣本,比值的抽樣分布服從自由度為(n-1)的分布。即樣本方差的抽樣分布2023/9/1536樣本方差的抽樣分布

分布具有如下性質(zhì)和特點(diǎn):(1)變量值始終為正。(2)其分布形狀取決于其自由度n的大小,通常為不對稱的右偏分布,但隨著自由度的增大逐漸趨于對稱。(3)(4)具有可加性。若U和V為兩個獨(dú)立的分布隨機(jī)變量,自由度分別為n1和n2,則U+V這一隨機(jī)變量服從自由度為(n1+n2)的分布。2023/9/1537抽樣分布與總體分布的關(guān)系總體分布正態(tài)分布非正態(tài)分布大樣本小樣本正態(tài)分布正態(tài)分布非正態(tài)分布2023/9/1538第三節(jié)

抽樣分布的性質(zhì)

無偏性(unbiasedness)無偏性:估計(jì)量抽樣分布的數(shù)學(xué)期望等于被估計(jì)的總體參數(shù)P(

)BA無偏有偏2023/9/1540有效性(efficiency)有效性:對同一總體參數(shù)的兩個無偏點(diǎn)估

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論