第三章 抽樣與統(tǒng)計(jì)推論_第1頁
第三章 抽樣與統(tǒng)計(jì)推論_第2頁
第三章 抽樣與統(tǒng)計(jì)推論_第3頁
第三章 抽樣與統(tǒng)計(jì)推論_第4頁
第三章 抽樣與統(tǒng)計(jì)推論_第5頁
已閱讀5頁,還剩48頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第三章抽樣與統(tǒng)計(jì)推論抽樣的意義社會學(xué)研究關(guān)注的是總體的情況,不是樣本的情況。從樣本中計(jì)算出來的數(shù)值,通常成為統(tǒng)計(jì)值,在總體中的數(shù)值,稱為參數(shù)值。特征值總體參數(shù)樣本統(tǒng)計(jì)量均值比例方差抽樣的歷程1、界定總體2、搜集全部名單3、決定樣本的大小4、選取樣本個案5、收集資料以后,評估樣本的正誤1、界定總體由樣本所得的研究結(jié)果,原則上只能推論到這個所界定的總體范圍。抽樣的歷程1、界定總體2、搜集全部名單3、決定樣本的大小4、選取樣本個案5、收集資料以后,評估樣本的正誤2、搜集全部名單根據(jù)總體的定義,收集一份全部個案的名單。這份名單,稱為抽樣框架。抽樣框架在使用前,必須審核其完整性和準(zhǔn)確性。抽樣的歷程1、界定總體2、搜集全部名單3、決定樣本的大小4、選取樣本個案5、收集資料以后,評估樣本的正誤3、決定樣本的大小決定樣本大小需考慮的幾個因素:1)所能容忍的抽樣誤差2)研究代價3)研究總體的情況4)日后作何種分析決定樣本大小的一般準(zhǔn)則:根據(jù)所能付出的研究代價的最大限度抽取最大的樣本。決定樣本的大小抽樣比例:抽樣的歷程1、界定總體2、搜集全部名單3、決定樣本的大小4、選取樣本個案5、收集資料以后,評估樣本的正誤4、選取樣本個案假定樣本的個案數(shù)目不變,使用不同的抽樣方法所犯的抽樣誤差會不相同。抽樣的歷程1、界定總體2、搜集全部名單3、決定樣本的大小4、選取樣本個案5、收集資料以后,評估樣本的正誤評估樣本之正誤方法:根據(jù)一些在總體中和樣本中都容易找出的資料來評估樣本的正誤。年齡總體N=100000樣本n=100015-1718-2223-25305020285121抽樣方法一般分為隨機(jī)抽樣和非隨機(jī)抽樣法。非隨機(jī)抽樣包括:立意抽樣法偶遇抽樣法定額抽樣法非隨機(jī)抽樣立意抽樣法依據(jù)研究員的主觀見解和判斷,選取他認(rèn)為是典型的個案。偶遇抽樣法選取一些偶然遇見的個案作為樣本,又稱為方便抽樣法。定額抽樣法根據(jù)某些標(biāo)準(zhǔn)將總體分組,然后用立意或偶遇抽樣法由每組中選取樣本個案。隨機(jī)抽樣簡單隨機(jī)抽樣系統(tǒng)隨機(jī)抽樣分層隨機(jī)抽樣簡單隨機(jī)抽樣

(simplerandomsampling)從總體N個單位中隨機(jī)地抽取n個單位作為樣本,每個單位被抽入樣本的機(jī)會是相等的特點(diǎn)簡單、直觀,在抽樣框完整時,可直接從中抽取樣本用樣本統(tǒng)計(jì)量對目標(biāo)量進(jìn)行估計(jì)比較方便局限性當(dāng)N很大時,不易構(gòu)造抽樣框抽出的單位很分散,給實(shí)施調(diào)查增加了困難沒有利用其它輔助信息以提高估計(jì)的效率系統(tǒng)隨機(jī)抽樣首先將全部個案排列起來,按抽樣比例分成間隔,并在每個間隔區(qū)內(nèi)按同樣的距離選取一個個案。分層隨機(jī)抽樣

(stratifiedsampling)將抽樣單位按某種特征或某種規(guī)則劃分為不同的層,然后從不同的層中獨(dú)立、隨機(jī)地抽取樣本。教育性別個案數(shù)目總體樣本小學(xué)或以下男女2100035000210350初中男女1800015000180150高中或以上男女900020009020總數(shù)1000001000分層隨機(jī)抽樣優(yōu)點(diǎn)保證樣本的結(jié)構(gòu)與總體的結(jié)構(gòu)比較相近,從而提高估計(jì)的精度組織實(shí)施調(diào)查方便既可以對總體參數(shù)進(jìn)行估計(jì),也可以對各層的目標(biāo)量進(jìn)行估計(jì)統(tǒng)計(jì)推論統(tǒng)計(jì)推論統(tǒng)計(jì)推論就是根據(jù)局部資料(樣本資料)對總體的特征進(jìn)行推斷。統(tǒng)計(jì)推論的兩方面特征假設(shè)某工廠有100名工人,其中男性50人,女性50人。抽樣分布總體樣本觀測前樣本值1樣本值2…樣本值n隨抽機(jī)樣…(x1,x2,…xn)(x1,x2,…xn)(x1,x2,…xn)樣本值1樣本值2樣本值nX1,X2,…,Xn隨抽機(jī)樣樣本總體X觀測以后……………抽樣分布抽樣分布即顯示由同一總體中反復(fù)不斷抽取不同樣本時,各個可能出現(xiàn)的樣本統(tǒng)計(jì)值的分布情況。抽樣分布有均值抽樣分布、方差的抽樣分布、比例的抽樣分布等。均值的抽樣分布均值抽樣分布樣本均值的數(shù)學(xué)期望樣本均值的方差樣本均值的抽樣分布

(數(shù)學(xué)期望與方差)比較及結(jié)論:1.樣本均值的均值(數(shù)學(xué)期望)等于總體均值

2.樣本均值的方差等于總體方差的1/n總體分布已知

=50

=10X總體分布n=4抽樣分布Xn=16當(dāng)總體服從正態(tài)分布N~(μ,σ2)時,來自該總體的所有容量為n的樣本的均值

X也服從正態(tài)分布,

X

的數(shù)學(xué)期望為μ,方差為σ2/n。即

X~N(μ,σ2/n)總體分布未知中心極限定理:設(shè)從均值為

,方差為

2的一個任意總體中抽取容量為n的樣本,當(dāng)n充分大時,樣本均值的抽樣分布近似服從均值為μ、方差為σ2/n的正態(tài)分布一個任意分布的總體X總體分布為正態(tài),但

未知用樣本方差作為總體方差的估計(jì)值,得到統(tǒng)計(jì)量:均值抽樣分布與總體分布的關(guān)系總體分布正態(tài)分布非正態(tài)分布大樣本小樣本正態(tài)分布正態(tài)分布非正態(tài)分布1.如果樣本相當(dāng)大,則均值的抽樣分布接近于正態(tài)分布;2.均值抽樣分布之均值就是總體之均值;均值抽樣分布的標(biāo)準(zhǔn)差為標(biāo)準(zhǔn)誤;3.由于均值的抽樣分布是正態(tài)分布,故任何兩均值之間所占的比例是可以知道的。例題:從海外A地區(qū)采購大豆10000包,已知平均每包重量為100公斤,標(biāo)準(zhǔn)差為4公斤,現(xiàn)按不重復(fù)抽樣,從中抽取樣本容量n=500包的樣本,來測定這批大豆的每包平均重量,標(biāo)出樣本平均重量短0.5公斤以上的概率。解答:沒有告知總體服從正態(tài)分布,但樣本容量夠大(n=500),根據(jù)中心極限定理,可知樣本均值服從正態(tài)分布。根據(jù)公式可知,樣本均值的:均值=100,標(biāo)準(zhǔn)差=0.1744轉(zhuǎn)換為求P(X<99.5)=?練習(xí)1某地區(qū)職工家庭的人均年收入平均為12000元,標(biāo)準(zhǔn)差為2000元。現(xiàn)采用重復(fù)抽樣從總體中隨機(jī)抽取100戶進(jìn)行調(diào)查,問出現(xiàn)樣本平均數(shù)等于或超過12500元的可能性有多大?練習(xí)2設(shè)某公司1000名職工的獎金服從正態(tài)分布,人均年獎金為2000元,標(biāo)準(zhǔn)差500元,隨機(jī)抽取36人作為樣本進(jìn)行調(diào)查,問樣本的人均年獎金在1900~2200元之間的概率有多大?

兩個樣本平均數(shù)差異的抽樣分布x1x2X1~N(μ1,σ1

2

)X2~N(μ2,σ2

2

)x2x1X1~N(μ1,σ1

2/n1)X2~N(μ2,σ2

2/n2)X11…..X21

X22

X31

X32

XK1

XK2

n1n2X12X1

—X2

(X1-X2)

~N[(μ1-μ2),(σ12/n1+σ22/n2)]X1~N(μ1,σ1

2/n1)兩個樣本平均數(shù)差異的抽樣分布X1~N(μ1,σ1

2/n1)

X2~N(μ2,σ2

2/n2)

(X1-X2)~N[(μ1-μ2),(σ12/n1+σ22/n2)]=-(μ1-μ2)

σ12/n1+σ22/n2(X1-X2)Z=-μ(X1-X2)(X1-X2)(X1-X2)

方差的抽樣分布樣本方差的數(shù)學(xué)期望樣本方差的方差其中,D(s2)=2σ4n-1一般來說,S2的分布很復(fù)雜,在特殊情況下,即總體為正態(tài)分布時,S2的分布與χ2分布相聯(lián)系。方差的抽樣分布設(shè)x1,x2,……,xn是來自總體N(μ,σ)的樣本,則:當(dāng)μ未知時,則:比例的抽樣分布

(樣本成數(shù)的分布)總體成數(shù)p是指具有某種特征的單位在二項(xiàng)總體中的比重。成數(shù)是一個特殊平均數(shù),設(shè)總體單位總數(shù)目是N,總體中有該特征的單位數(shù)是N1。設(shè)x是0、1變量(總體單位有該特征,則x取1,否則取0),則有:現(xiàn)從總體中抽出n個單位,如果其中有相應(yīng)特征的單位數(shù)是n1,則樣本成數(shù)是:

比例的抽樣分布1、當(dāng)樣本容量很大(n≥30)時,比例的抽樣分布

非常接近正態(tài)分布。2、比例抽樣分布的均值

3、比例抽樣分布的標(biāo)準(zhǔn)差簡單重復(fù)抽樣簡單

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論