抽樣理論及總體參數(shù)估計(jì)_第1頁(yè)
抽樣理論及總體參數(shù)估計(jì)_第2頁(yè)
抽樣理論及總體參數(shù)估計(jì)_第3頁(yè)
抽樣理論及總體參數(shù)估計(jì)_第4頁(yè)
抽樣理論及總體參數(shù)估計(jì)_第5頁(yè)
已閱讀5頁(yè),還剩14頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

抽樣理論及總體參數(shù)估計(jì)12一、隨機(jī)抽樣的基本概念與方法(一)隨機(jī)抽樣的基本概念

隨機(jī)抽樣是指依據(jù)隨機(jī)性原則和方法,從總體中隨機(jī)抽取對(duì)總體有充分代表性的樣本。

隨機(jī)性原則:A、總體中每個(gè)個(gè)體相互獨(dú)立;B、每個(gè)個(gè)體被抽到的機(jī)會(huì)均等。

總體和樣本

參數(shù)和統(tǒng)計(jì)量:

;Sr。(二)隨機(jī)抽樣方法1、簡(jiǎn)單隨機(jī)抽樣

簡(jiǎn)單隨機(jī)抽樣是完全按照偶然機(jī)會(huì)抽取一部分個(gè)體構(gòu)成樣本。A、抽簽;B、隨機(jī)數(shù)碼表。3

2、機(jī)械抽樣

機(jī)械抽樣也稱(chēng)等距抽樣,按一個(gè)與研究問(wèn)題的性質(zhì)沒(méi)有直接關(guān)系的標(biāo)志把總體內(nèi)每一個(gè)個(gè)體進(jìn)行編號(hào)排序,然后按固定的距離抽取一部分個(gè)體構(gòu)成樣本的抽樣方法。間隔距離的大小視所需樣本容量與總體中個(gè)體數(shù)目的比率而定。

優(yōu)點(diǎn):比簡(jiǎn)單隨機(jī)抽樣代表性強(qiáng);

缺點(diǎn):當(dāng)總體中不同特性的分布不均勻或呈一定周期性時(shí),機(jī)械抽樣可能產(chǎn)生系統(tǒng)性偏差。

3、分層抽樣

分層抽樣也稱(chēng)分類(lèi)抽樣。先按與研究?jī)?nèi)容有關(guān)的因素將總體各單位(或個(gè)體)分為不同的等級(jí)或類(lèi)型,即層,然后按比例或不按比例從每一層中再用簡(jiǎn)單隨機(jī)抽樣或機(jī)械抽樣的方法抽取一定數(shù)量的個(gè)體構(gòu)成樣本。

優(yōu)點(diǎn):抽樣誤差小,代表性強(qiáng)。

分層原則:層內(nèi)個(gè)體差異越小越好;層間差異越大越好。44、整群抽樣

整群抽樣是指從總體中一個(gè)群體一個(gè)群體地抽取研究對(duì)象的抽樣方法。

優(yōu)點(diǎn):容易組織;

缺點(diǎn):代表性不強(qiáng),抽樣誤差大。

抽樣方法的綜合運(yùn)用。二、抽樣分布(一)抽樣分布的基本概念1、抽樣分布及標(biāo)準(zhǔn)誤

抽樣分布是指樣本統(tǒng)計(jì)量的概率分布。它是統(tǒng)計(jì)推斷的理論基礎(chǔ)。(平均數(shù)的抽樣分布、標(biāo)準(zhǔn)差的抽樣分布、相關(guān)系數(shù)的抽樣分布等)5

描述所有可能個(gè)樣本統(tǒng)計(jì)量參差不齊程度的量數(shù)稱(chēng)為標(biāo)準(zhǔn)誤,即抽樣誤差。也就是某種統(tǒng)計(jì)量在抽樣分布上的標(biāo)準(zhǔn)差。標(biāo)準(zhǔn)誤用符號(hào)SE表示。標(biāo)準(zhǔn)誤越小,說(shuō)明樣本統(tǒng)計(jì)量與總體參數(shù)間的差異越小,樣本對(duì)總體的代表性越強(qiáng),用樣本統(tǒng)計(jì)量推斷總體參數(shù)的可靠性越強(qiáng)。2、自由度

自由度是指可以自由取值的數(shù)據(jù)的個(gè)數(shù),即不受任何約束可以自由變動(dòng)的變量的個(gè)數(shù),一般用符號(hào)df表示。

在總體層面上,每個(gè)變量在統(tǒng)計(jì)層面上沒(méi)有任何約束,故總體的自由度是N;在樣本層面上,對(duì)于n個(gè)數(shù)值構(gòu)成的樣本,它的自由度為:n-1。

原因:

自由度失去的多少取決于計(jì)算統(tǒng)計(jì)量時(shí)實(shí)際受約束條件的多少,要據(jù)實(shí)際條件來(lái)決定。6(二)樣本平均數(shù)的抽樣分布1、平均數(shù)抽樣分布的形態(tài)

正態(tài)總體:抽樣分布服從正態(tài)分布;

非正態(tài)總體下的大樣本:抽樣分布接近正態(tài)分布。2、平均數(shù)抽樣分布的平均數(shù)

3、平均數(shù)抽樣分布的標(biāo)準(zhǔn)差(即平均數(shù)的標(biāo)準(zhǔn)誤)

平均數(shù)標(biāo)準(zhǔn)誤的求解:A、總體正態(tài)分布,總體標(biāo)準(zhǔn)差已知7

依據(jù)正態(tài)分布理論,我們可以推知樣本平均數(shù)在多大概率上落在

的范圍之內(nèi)。

B、總體正態(tài)分布,總體標(biāo)準(zhǔn)差未知

①對(duì)于大樣本

可以直接用樣本標(biāo)準(zhǔn)差代替總體標(biāo)準(zhǔn)差,即

②對(duì)于小樣本

所有可能樣本的平均數(shù)以總體平均數(shù)為中心,服從df=n-1的t分布,此時(shí)樣本平均數(shù)的標(biāo)準(zhǔn)誤

其中,8

C、總體非正態(tài)分布,但樣本容量n≥30

對(duì)于總體非正態(tài)分布,原則上不能使用參數(shù)推斷的方法進(jìn)行推論,但對(duì)于大樣本,盡管總體非正態(tài)分布,但樣本平均數(shù)抽樣分布的形態(tài)與正態(tài)分布差異較小,所以,在大樣本情況下,無(wú)論總體是否正態(tài)分布,也無(wú)論總體標(biāo)準(zhǔn)差是否已知,我們都可以認(rèn)為平均數(shù)的抽樣分布為近似服從正態(tài),求平均數(shù)的標(biāo)準(zhǔn)誤都可用公式

三、總體參數(shù)的估計(jì)(一)點(diǎn)估計(jì)

點(diǎn)估計(jì)就是用某一樣本統(tǒng)計(jì)量的值來(lái)估計(jì)相應(yīng)的總體參數(shù)值。9

好的估計(jì)量的基本要求:

無(wú)偏性——即沒(méi)有系統(tǒng)偏差,指若用統(tǒng)一估計(jì)量估計(jì)多次,其平均值應(yīng)恰好等于預(yù)估計(jì)的總體參數(shù)值,即偏差之和為0。

有效性——當(dāng)總體參數(shù)的無(wú)偏估計(jì)值不止一個(gè)時(shí),其中統(tǒng)計(jì)量的一切可能值方差最小者有效性最高。

一致性——指當(dāng)樣本容量無(wú)限增大時(shí),估計(jì)值應(yīng)越來(lái)越接近它所估計(jì)的總體參數(shù)值。(二)區(qū)間估計(jì)

區(qū)間估計(jì)是指以一定的概率去說(shuō)明總體參數(shù)落在某一區(qū)間的可能性。

描述樣本平均數(shù)與總體平均數(shù)之間的差異用標(biāo)準(zhǔn)誤為單位,即

。10

要求按某一可靠度去估計(jì)總體平均數(shù)的取值區(qū)間時(shí),可靠度稱(chēng)為置信水平,區(qū)間的界限稱(chēng)為置信界限,置信界限內(nèi)的區(qū)間稱(chēng)為置信區(qū)間。

研究中,常以95%和99%的可靠度估計(jì)總體參數(shù)的置信區(qū)間。具體計(jì)算如下:

1、總體平均數(shù)的區(qū)間估計(jì)

A、總體正態(tài)分布,總體標(biāo)準(zhǔn)差已知時(shí)總體平均數(shù)的區(qū)間估計(jì)

此時(shí),樣本平均數(shù)與總體平均數(shù)之間的差異,即樣本平均數(shù)在所有抽樣中的位置可以表示為

當(dāng)置信度為95%時(shí),即11

當(dāng)置信度為99%時(shí),

即其置信區(qū)間為

例:某小學(xué)10歲全體女童的身高呈正態(tài)分布,其標(biāo)準(zhǔn)差為6.25厘米,現(xiàn)從該校隨機(jī)抽取27名10歲女童,測(cè)得平均身高為134.2厘米,試估計(jì)該校10歲全體女童平均身高的95%和99%的置信區(qū)間。

練習(xí):從某正態(tài)總體中隨機(jī)抽取一個(gè)樣本容量為25的樣本,其平均數(shù)為42,已知總體的標(biāo)準(zhǔn)差為6,試估計(jì)總體平均數(shù)的置信度為95%和99%的置信區(qū)間。12

B、總體正態(tài)分布,總體標(biāo)準(zhǔn)差未知時(shí)總體平均數(shù)的區(qū)間估計(jì)

(1)總體標(biāo)準(zhǔn)差未知的大樣本,可用

代替總體標(biāo)準(zhǔn)差

總體平均數(shù)的置信度為95%的置信區(qū)間為

置信度為99%的置信區(qū)間為

如果設(shè)置信度為

為一小概率(常取值為0.05和0.01,統(tǒng)計(jì)推斷時(shí)稱(chēng)為顯著性水平)。當(dāng)總體標(biāo)準(zhǔn)差已知,或總體標(biāo)準(zhǔn)差未知但為大樣本時(shí),其置信區(qū)間的一般公式為13

(2)總體標(biāo)準(zhǔn)差未知的小樣本,用

代替總體標(biāo)準(zhǔn)差

,由于此時(shí)樣本平均數(shù)的抽樣分布為t分布,所以某一置信度下總體平均數(shù)的區(qū)間估計(jì)要依據(jù)t分布來(lái)進(jìn)行,此時(shí),總體平均數(shù)的置信度為

的置信區(qū)間為

例:某小學(xué)三年級(jí)學(xué)生閱讀能力服從正態(tài)分布,現(xiàn)從中隨機(jī)抽取12名學(xué)生,其閱讀能力的得分為28、32、36、22、34、30、33、25、31、33、29、26,試估計(jì)該校三年級(jí)閱讀能力總體平均數(shù)95%和99%的置信區(qū)間。

練習(xí):從某區(qū)小學(xué)五年級(jí)學(xué)生的數(shù)學(xué)推理測(cè)試成績(jī)中隨機(jī)抽取26個(gè),求得其平均數(shù)為86分,標(biāo)準(zhǔn)差為7分。已知全區(qū)五年級(jí)學(xué)生的成績(jī)服從正態(tài)分布,請(qǐng)?jiān)?.05顯著水平上估計(jì)該區(qū)五年級(jí)學(xué)生數(shù)學(xué)推理測(cè)試成績(jī)的置信區(qū)間。14

2、總體比率的區(qū)間估計(jì)(一般用于較大樣本的情況)

如果從總體中抽取容量為n的樣本,以p表示具有某種屬性的個(gè)體占總體的比率,其標(biāo)準(zhǔn)誤為

當(dāng)總體比率p未知時(shí),樣本比率和分別是總體比率p和q的估計(jì)值,標(biāo)準(zhǔn)誤為

當(dāng)

(

中的較小者)時(shí),樣本比率近似服從正態(tài)分布,此時(shí)總體比率的置信度為的置信區(qū)間為15

例:隨機(jī)抽取某校小學(xué)二年級(jí)學(xué)生40名,用韋氏智力測(cè)驗(yàn)量表測(cè)量其智力水平,結(jié)果智商成績(jī)?cè)?10分以上的有25名,試以95%的可靠性估計(jì)全校二年級(jí)學(xué)生智力測(cè)驗(yàn)分?jǐn)?shù)總體在110分以上者占總體比例的置信區(qū)間。

練習(xí):從某縣三年級(jí)學(xué)生中隨機(jī)抽取200人,測(cè)得他們社會(huì)科學(xué)習(xí)成績(jī)?yōu)锳等的有85人。試估計(jì)該校三年級(jí)學(xué)生社會(huì)科學(xué)習(xí)成績(jī)獲A等的人數(shù)占全縣三年級(jí)總?cè)藬?shù)比率的95%和99%的置信區(qū)間。四、樣本容量的確定(一)確定樣本大小的基本原則

在盡量節(jié)省人力、經(jīng)費(fèi)和時(shí)間的條件下,確保用樣本推斷總體達(dá)到預(yù)定的可靠度及準(zhǔn)確性。16(二)由樣本平均數(shù)估計(jì)總體平均數(shù)時(shí)樣本容量的確定

A、總體標(biāo)準(zhǔn)差已知

n為一定精確度要求下應(yīng)抽取的樣本容量;

為允許的最大誤差;

為總體標(biāo)準(zhǔn)差;

為某可靠性下的雙尾臨界值。

例:擬估計(jì)上海市高校四級(jí)英語(yǔ)考試的總體平均分?jǐn)?shù),根據(jù)歷次考試成績(jī)的標(biāo)準(zhǔn)差為13分,這次的估計(jì)最大允許誤差2分,可信度為95%,問(wèn)應(yīng)當(dāng)抽多少人?17

練習(xí):已知某小學(xué)六年級(jí)數(shù)學(xué)成績(jī)的標(biāo)準(zhǔn)差為10分?,F(xiàn)從該校隨機(jī)抽取一部分學(xué)生,要求有95%的把握用這部分學(xué)生的數(shù)學(xué)成績(jī)估計(jì)全校六年級(jí)學(xué)生平均成績(jī)的差異不超過(guò)2分,那么最低抽取多少學(xué)生才能滿(mǎn)足這一要求?

B、總體正態(tài)分布,總體標(biāo)準(zhǔn)差未知

問(wèn)題:

不是一個(gè)常數(shù),隨自由度df=n-1的變化而變化,而樣本容量未知,則df無(wú)法確定,則

無(wú)法查出。

辦法:逐步試差

步驟:

(1)設(shè)

,查表得

的值,代入公式

求出

;18

(2)令

,查t值表,查得

的值,代入公式計(jì)算出

(3)重復(fù)上述做法,直到連續(xù)兩次算得的

相等,這時(shí)的

就是所要確定的樣本容量n。

例:某地區(qū)進(jìn)行六年級(jí)學(xué)生英語(yǔ)成績(jī)抽樣調(diào)查,已隨機(jī)抽取了一部分學(xué)生的英語(yǔ)成績(jī),得到的總體標(biāo)準(zhǔn)差的估計(jì)值

=11.4分。現(xiàn)要了解六年級(jí)學(xué)生英語(yǔ)成績(jī)的平均水平,在99%的可靠性下,最大允許誤差為3分,問(wèn)樣本容量應(yīng)為多少?

練習(xí):某市要對(duì)今年全市小學(xué)四年級(jí)學(xué)生的外語(yǔ)平均分?jǐn)?shù)進(jìn)行估計(jì),規(guī)定

,最大允許誤差為2分。已知去年本校小學(xué)四年級(jí)學(xué)生外語(yǔ)成績(jī)的標(biāo)準(zhǔn)差是12分,那么應(yīng)當(dāng)抽取多大樣本進(jìn)行調(diào)查才能符合估計(jì)的要求?19(三)用樣本比率估計(jì)總體比

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論