抽樣理論及總體參數(shù)估計(jì)

上傳人：3*** IP屬地：湖北上傳時(shí)間：2023-12-25 格式：PPT 頁(yè)數(shù)：19 大?。?01KB 積分：30 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩14頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶(hù)提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

抽樣理論及總體參數(shù)估計(jì)12一、隨機(jī)抽樣的基本概念與方法（一）隨機(jī)抽樣的基本概念

隨機(jī)抽樣是指依據(jù)隨機(jī)性原則和方法，從總體中隨機(jī)抽取對(duì)總體有充分代表性的樣本。

隨機(jī)性原則：A、總體中每個(gè)個(gè)體相互獨(dú)立；B、每個(gè)個(gè)體被抽到的機(jī)會(huì)均等。

總體和樣本

參數(shù)和統(tǒng)計(jì)量：

；Sr。（二）隨機(jī)抽樣方法1、簡(jiǎn)單隨機(jī)抽樣

簡(jiǎn)單隨機(jī)抽樣是完全按照偶然機(jī)會(huì)抽取一部分個(gè)體構(gòu)成樣本。A、抽簽；B、隨機(jī)數(shù)碼表。3

2、機(jī)械抽樣

機(jī)械抽樣也稱(chēng)等距抽樣，按一個(gè)與研究問(wèn)題的性質(zhì)沒(méi)有直接關(guān)系的標(biāo)志把總體內(nèi)每一個(gè)個(gè)體進(jìn)行編號(hào)排序，然后按固定的距離抽取一部分個(gè)體構(gòu)成樣本的抽樣方法。間隔距離的大小視所需樣本容量與總體中個(gè)體數(shù)目的比率而定。

優(yōu)點(diǎn)：比簡(jiǎn)單隨機(jī)抽樣代表性強(qiáng)；

缺點(diǎn)：當(dāng)總體中不同特性的分布不均勻或呈一定周期性時(shí)，機(jī)械抽樣可能產(chǎn)生系統(tǒng)性偏差。

3、分層抽樣

分層抽樣也稱(chēng)分類(lèi)抽樣。先按與研究?jī)?nèi)容有關(guān)的因素將總體各單位（或個(gè)體）分為不同的等級(jí)或類(lèi)型，即層，然后按比例或不按比例從每一層中再用簡(jiǎn)單隨機(jī)抽樣或機(jī)械抽樣的方法抽取一定數(shù)量的個(gè)體構(gòu)成樣本。

優(yōu)點(diǎn)：抽樣誤差小，代表性強(qiáng)。

分層原則：層內(nèi)個(gè)體差異越小越好；層間差異越大越好。44、整群抽樣

整群抽樣是指從總體中一個(gè)群體一個(gè)群體地抽取研究對(duì)象的抽樣方法。

優(yōu)點(diǎn)：容易組織；

缺點(diǎn)：代表性不強(qiáng)，抽樣誤差大。

抽樣方法的綜合運(yùn)用。二、抽樣分布（一）抽樣分布的基本概念1、抽樣分布及標(biāo)準(zhǔn)誤

抽樣分布是指樣本統(tǒng)計(jì)量的概率分布。它是統(tǒng)計(jì)推斷的理論基礎(chǔ)。（平均數(shù)的抽樣分布、標(biāo)準(zhǔn)差的抽樣分布、相關(guān)系數(shù)的抽樣分布等）5

描述所有可能個(gè)樣本統(tǒng)計(jì)量參差不齊程度的量數(shù)稱(chēng)為標(biāo)準(zhǔn)誤，即抽樣誤差。也就是某種統(tǒng)計(jì)量在抽樣分布上的標(biāo)準(zhǔn)差。標(biāo)準(zhǔn)誤用符號(hào)SE表示。標(biāo)準(zhǔn)誤越小，說(shuō)明樣本統(tǒng)計(jì)量與總體參數(shù)間的差異越小，樣本對(duì)總體的代表性越強(qiáng)，用樣本統(tǒng)計(jì)量推斷總體參數(shù)的可靠性越強(qiáng)。2、自由度

自由度是指可以自由取值的數(shù)據(jù)的個(gè)數(shù)，即不受任何約束可以自由變動(dòng)的變量的個(gè)數(shù)，一般用符號(hào)df表示。

在總體層面上，每個(gè)變量在統(tǒng)計(jì)層面上沒(méi)有任何約束，故總體的自由度是N；在樣本層面上，對(duì)于n個(gè)數(shù)值構(gòu)成的樣本，它的自由度為：n-1。

原因：

自由度失去的多少取決于計(jì)算統(tǒng)計(jì)量時(shí)實(shí)際受約束條件的多少，要據(jù)實(shí)際條件來(lái)決定。6（二）樣本平均數(shù)的抽樣分布1、平均數(shù)抽樣分布的形態(tài)

正態(tài)總體：抽樣分布服從正態(tài)分布；

非正態(tài)總體下的大樣本：抽樣分布接近正態(tài)分布。2、平均數(shù)抽樣分布的平均數(shù)

3、平均數(shù)抽樣分布的標(biāo)準(zhǔn)差（即平均數(shù)的標(biāo)準(zhǔn)誤）

平均數(shù)標(biāo)準(zhǔn)誤的求解：A、總體正態(tài)分布，總體標(biāo)準(zhǔn)差已知7

依據(jù)正態(tài)分布理論，我們可以推知樣本平均數(shù)在多大概率上落在

的范圍之內(nèi)。

B、總體正態(tài)分布，總體標(biāo)準(zhǔn)差未知

①對(duì)于大樣本

可以直接用樣本標(biāo)準(zhǔn)差代替總體標(biāo)準(zhǔn)差，即

②對(duì)于小樣本

所有可能樣本的平均數(shù)以總體平均數(shù)為中心，服從df=n-1的t分布，此時(shí)樣本平均數(shù)的標(biāo)準(zhǔn)誤

其中，8

C、總體非正態(tài)分布，但樣本容量n≥30

對(duì)于總體非正態(tài)分布，原則上不能使用參數(shù)推斷的方法進(jìn)行推論，但對(duì)于大樣本，盡管總體非正態(tài)分布，但樣本平均數(shù)抽樣分布的形態(tài)與正態(tài)分布差異較小，所以，在大樣本情況下，無(wú)論總體是否正態(tài)分布，也無(wú)論總體標(biāo)準(zhǔn)差是否已知，我們都可以認(rèn)為平均數(shù)的抽樣分布為近似服從正態(tài)，求平均數(shù)的標(biāo)準(zhǔn)誤都可用公式

三、總體參數(shù)的估計(jì)（一）點(diǎn)估計(jì)

點(diǎn)估計(jì)就是用某一樣本統(tǒng)計(jì)量的值來(lái)估計(jì)相應(yīng)的總體參數(shù)值。9

好的估計(jì)量的基本要求：

無(wú)偏性——即沒(méi)有系統(tǒng)偏差，指若用統(tǒng)一估計(jì)量估計(jì)多次，其平均值應(yīng)恰好等于預(yù)估計(jì)的總體參數(shù)值，即偏差之和為0。

有效性——當(dāng)總體參數(shù)的無(wú)偏估計(jì)值不止一個(gè)時(shí)，其中統(tǒng)計(jì)量的一切可能值方差最小者有效性最高。

一致性——指當(dāng)樣本容量無(wú)限增大時(shí)，估計(jì)值應(yīng)越來(lái)越接近它所估計(jì)的總體參數(shù)值。（二）區(qū)間估計(jì)

區(qū)間估計(jì)是指以一定的概率去說(shuō)明總體參數(shù)落在某一區(qū)間的可能性。

描述樣本平均數(shù)與總體平均數(shù)之間的差異用標(biāo)準(zhǔn)誤為單位，即

。10

要求按某一可靠度去估計(jì)總體平均數(shù)的取值區(qū)間時(shí)，可靠度稱(chēng)為置信水平，區(qū)間的界限稱(chēng)為置信界限，置信界限內(nèi)的區(qū)間稱(chēng)為置信區(qū)間。

研究中，常以95％和99％的可靠度估計(jì)總體參數(shù)的置信區(qū)間。具體計(jì)算如下：

1、總體平均數(shù)的區(qū)間估計(jì)

A、總體正態(tài)分布，總體標(biāo)準(zhǔn)差已知時(shí)總體平均數(shù)的區(qū)間估計(jì)

此時(shí)，樣本平均數(shù)與總體平均數(shù)之間的差異，即樣本平均數(shù)在所有抽樣中的位置可以表示為

當(dāng)置信度為95％時(shí)，即11

當(dāng)置信度為99％時(shí)，

即其置信區(qū)間為

例：某小學(xué)10歲全體女童的身高呈正態(tài)分布，其標(biāo)準(zhǔn)差為6.25厘米，現(xiàn)從該校隨機(jī)抽取27名10歲女童，測(cè)得平均身高為134.2厘米，試估計(jì)該校10歲全體女童平均身高的95％和99％的置信區(qū)間。

練習(xí)：從某正態(tài)總體中隨機(jī)抽取一個(gè)樣本容量為25的樣本，其平均數(shù)為42，已知總體的標(biāo)準(zhǔn)差為6，試估計(jì)總體平均數(shù)的置信度為95％和99％的置信區(qū)間。12

B、總體正態(tài)分布，總體標(biāo)準(zhǔn)差未知時(shí)總體平均數(shù)的區(qū)間估計(jì)

（1）總體標(biāo)準(zhǔn)差未知的大樣本，可用

代替總體標(biāo)準(zhǔn)差

，

總體平均數(shù)的置信度為95％的置信區(qū)間為

置信度為99％的置信區(qū)間為

如果設(shè)置信度為

為一小概率（常取值為0.05和0.01，統(tǒng)計(jì)推斷時(shí)稱(chēng)為顯著性水平）。當(dāng)總體標(biāo)準(zhǔn)差已知，或總體標(biāo)準(zhǔn)差未知但為大樣本時(shí)，其置信區(qū)間的一般公式為13

（2）總體標(biāo)準(zhǔn)差未知的小樣本，用

代替總體標(biāo)準(zhǔn)差

，由于此時(shí)樣本平均數(shù)的抽樣分布為t分布，所以某一置信度下總體平均數(shù)的區(qū)間估計(jì)要依據(jù)t分布來(lái)進(jìn)行，此時(shí)，總體平均數(shù)的置信度為

的置信區(qū)間為

例：某小學(xué)三年級(jí)學(xué)生閱讀能力服從正態(tài)分布，現(xiàn)從中隨機(jī)抽取12名學(xué)生，其閱讀能力的得分為28、32、36、22、34、30、33、25、31、33、29、26，試估計(jì)該校三年級(jí)閱讀能力總體平均數(shù)95％和99％的置信區(qū)間。

練習(xí)：從某區(qū)小學(xué)五年級(jí)學(xué)生的數(shù)學(xué)推理測(cè)試成績(jī)中隨機(jī)抽取26個(gè)，求得其平均數(shù)為86分，標(biāo)準(zhǔn)差為7分。已知全區(qū)五年級(jí)學(xué)生的成績(jī)服從正態(tài)分布，請(qǐng)?jiān)?.05顯著水平上估計(jì)該區(qū)五年級(jí)學(xué)生數(shù)學(xué)推理測(cè)試成績(jī)的置信區(qū)間。14

2、總體比率的區(qū)間估計(jì)（一般用于較大樣本的情況）

如果從總體中抽取容量為n的樣本，以p表示具有某種屬性的個(gè)體占總體的比率，其標(biāo)準(zhǔn)誤為

當(dāng)總體比率p未知時(shí)，樣本比率和分別是總體比率p和q的估計(jì)值，標(biāo)準(zhǔn)誤為

當(dāng)

(

中的較小者)時(shí)，樣本比率近似服從正態(tài)分布，此時(shí)總體比率的置信度為的置信區(qū)間為15

例：隨機(jī)抽取某校小學(xué)二年級(jí)學(xué)生40名，用韋氏智力測(cè)驗(yàn)量表測(cè)量其智力水平，結(jié)果智商成績(jī)?cè)?10分以上的有25名，試以95％的可靠性估計(jì)全校二年級(jí)學(xué)生智力測(cè)驗(yàn)分?jǐn)?shù)總體在110分以上者占總體比例的置信區(qū)間。

練習(xí)：從某縣三年級(jí)學(xué)生中隨機(jī)抽取200人，測(cè)得他們社會(huì)科學(xué)習(xí)成績(jī)?yōu)锳等的有85人。試估計(jì)該校三年級(jí)學(xué)生社會(huì)科學(xué)習(xí)成績(jī)獲A等的人數(shù)占全縣三年級(jí)總?cè)藬?shù)比率的95％和99％的置信區(qū)間。四、樣本容量的確定（一）確定樣本大小的基本原則

在盡量節(jié)省人力、經(jīng)費(fèi)和時(shí)間的條件下，確保用樣本推斷總體達(dá)到預(yù)定的可靠度及準(zhǔn)確性。16（二）由樣本平均數(shù)估計(jì)總體平均數(shù)時(shí)樣本容量的確定

A、總體標(biāo)準(zhǔn)差已知

n為一定精確度要求下應(yīng)抽取的樣本容量；

為允許的最大誤差；

為總體標(biāo)準(zhǔn)差；

為某可靠性下的雙尾臨界值。

例：擬估計(jì)上海市高校四級(jí)英語(yǔ)考試的總體平均分?jǐn)?shù)，根據(jù)歷次考試成績(jī)的標(biāo)準(zhǔn)差為13分，這次的估計(jì)最大允許誤差2分，可信度為95％，問(wèn)應(yīng)當(dāng)抽多少人？17

練習(xí)：已知某小學(xué)六年級(jí)數(shù)學(xué)成績(jī)的標(biāo)準(zhǔn)差為10分?，F(xiàn)從該校隨機(jī)抽取一部分學(xué)生，要求有95％的把握用這部分學(xué)生的數(shù)學(xué)成績(jī)估計(jì)全校六年級(jí)學(xué)生平均成績(jī)的差異不超過(guò)2分，那么最低抽取多少學(xué)生才能滿(mǎn)足這一要求?

B、總體正態(tài)分布，總體標(biāo)準(zhǔn)差未知

問(wèn)題：

不是一個(gè)常數(shù)，隨自由度df=n-1的變化而變化，而樣本容量未知，則df無(wú)法確定，則

無(wú)法查出。

辦法：逐步試差

步驟：

（1）設(shè)

，查表得

的值，代入公式

求出

；18

（2）令

，查t值表，查得

的值，代入公式計(jì)算出

；

（3）重復(fù)上述做法，直到連續(xù)兩次算得的

相等，這時(shí)的

就是所要確定的樣本容量n。

例：某地區(qū)進(jìn)行六年級(jí)學(xué)生英語(yǔ)成績(jī)抽樣調(diào)查，已隨機(jī)抽取了一部分學(xué)生的英語(yǔ)成績(jī)，得到的總體標(biāo)準(zhǔn)差的估計(jì)值

=11.4分。現(xiàn)要了解六年級(jí)學(xué)生英語(yǔ)成績(jī)的平均水平，在99％的可靠性下，最大允許誤差為3分，問(wèn)樣本容量應(yīng)為多少？

練習(xí)：某市要對(duì)今年全市小學(xué)四年級(jí)學(xué)生的外語(yǔ)平均分?jǐn)?shù)進(jìn)行估計(jì)，規(guī)定

，最大允許誤差為2分。已知去年本校小學(xué)四年級(jí)學(xué)生外語(yǔ)成績(jī)的標(biāo)準(zhǔn)差是12分，那么應(yīng)當(dāng)抽取多大樣本進(jìn)行調(diào)查才能符合估計(jì)的要求？19（三）用樣本比率估計(jì)總體比

人人文庫(kù)> 全部分類(lèi)> 教育資料 > 中學(xué)教育

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

抽樣理論及總體參數(shù)估計(jì)

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

抽樣理論及總體參數(shù)估計(jì)

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔