版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
抽樣理論及總體參數(shù)估計(jì)12一、隨機(jī)抽樣的基本概念與方法(一)隨機(jī)抽樣的基本概念
隨機(jī)抽樣是指依據(jù)隨機(jī)性原則和方法,從總體中隨機(jī)抽取對(duì)總體有充分代表性的樣本。
隨機(jī)性原則:A、總體中每個(gè)個(gè)體相互獨(dú)立;B、每個(gè)個(gè)體被抽到的機(jī)會(huì)均等。
總體和樣本
參數(shù)和統(tǒng)計(jì)量:
;Sr。(二)隨機(jī)抽樣方法1、簡(jiǎn)單隨機(jī)抽樣
簡(jiǎn)單隨機(jī)抽樣是完全按照偶然機(jī)會(huì)抽取一部分個(gè)體構(gòu)成樣本。A、抽簽;B、隨機(jī)數(shù)碼表。3
2、機(jī)械抽樣
機(jī)械抽樣也稱(chēng)等距抽樣,按一個(gè)與研究問(wèn)題的性質(zhì)沒(méi)有直接關(guān)系的標(biāo)志把總體內(nèi)每一個(gè)個(gè)體進(jìn)行編號(hào)排序,然后按固定的距離抽取一部分個(gè)體構(gòu)成樣本的抽樣方法。間隔距離的大小視所需樣本容量與總體中個(gè)體數(shù)目的比率而定。
優(yōu)點(diǎn):比簡(jiǎn)單隨機(jī)抽樣代表性強(qiáng);
缺點(diǎn):當(dāng)總體中不同特性的分布不均勻或呈一定周期性時(shí),機(jī)械抽樣可能產(chǎn)生系統(tǒng)性偏差。
3、分層抽樣
分層抽樣也稱(chēng)分類(lèi)抽樣。先按與研究?jī)?nèi)容有關(guān)的因素將總體各單位(或個(gè)體)分為不同的等級(jí)或類(lèi)型,即層,然后按比例或不按比例從每一層中再用簡(jiǎn)單隨機(jī)抽樣或機(jī)械抽樣的方法抽取一定數(shù)量的個(gè)體構(gòu)成樣本。
優(yōu)點(diǎn):抽樣誤差小,代表性強(qiáng)。
分層原則:層內(nèi)個(gè)體差異越小越好;層間差異越大越好。44、整群抽樣
整群抽樣是指從總體中一個(gè)群體一個(gè)群體地抽取研究對(duì)象的抽樣方法。
優(yōu)點(diǎn):容易組織;
缺點(diǎn):代表性不強(qiáng),抽樣誤差大。
抽樣方法的綜合運(yùn)用。二、抽樣分布(一)抽樣分布的基本概念1、抽樣分布及標(biāo)準(zhǔn)誤
抽樣分布是指樣本統(tǒng)計(jì)量的概率分布。它是統(tǒng)計(jì)推斷的理論基礎(chǔ)。(平均數(shù)的抽樣分布、標(biāo)準(zhǔn)差的抽樣分布、相關(guān)系數(shù)的抽樣分布等)5
描述所有可能個(gè)樣本統(tǒng)計(jì)量參差不齊程度的量數(shù)稱(chēng)為標(biāo)準(zhǔn)誤,即抽樣誤差。也就是某種統(tǒng)計(jì)量在抽樣分布上的標(biāo)準(zhǔn)差。標(biāo)準(zhǔn)誤用符號(hào)SE表示。標(biāo)準(zhǔn)誤越小,說(shuō)明樣本統(tǒng)計(jì)量與總體參數(shù)間的差異越小,樣本對(duì)總體的代表性越強(qiáng),用樣本統(tǒng)計(jì)量推斷總體參數(shù)的可靠性越強(qiáng)。2、自由度
自由度是指可以自由取值的數(shù)據(jù)的個(gè)數(shù),即不受任何約束可以自由變動(dòng)的變量的個(gè)數(shù),一般用符號(hào)df表示。
在總體層面上,每個(gè)變量在統(tǒng)計(jì)層面上沒(méi)有任何約束,故總體的自由度是N;在樣本層面上,對(duì)于n個(gè)數(shù)值構(gòu)成的樣本,它的自由度為:n-1。
原因:
自由度失去的多少取決于計(jì)算統(tǒng)計(jì)量時(shí)實(shí)際受約束條件的多少,要據(jù)實(shí)際條件來(lái)決定。6(二)樣本平均數(shù)的抽樣分布1、平均數(shù)抽樣分布的形態(tài)
正態(tài)總體:抽樣分布服從正態(tài)分布;
非正態(tài)總體下的大樣本:抽樣分布接近正態(tài)分布。2、平均數(shù)抽樣分布的平均數(shù)
3、平均數(shù)抽樣分布的標(biāo)準(zhǔn)差(即平均數(shù)的標(biāo)準(zhǔn)誤)
平均數(shù)標(biāo)準(zhǔn)誤的求解:A、總體正態(tài)分布,總體標(biāo)準(zhǔn)差已知7
依據(jù)正態(tài)分布理論,我們可以推知樣本平均數(shù)在多大概率上落在
的范圍之內(nèi)。
B、總體正態(tài)分布,總體標(biāo)準(zhǔn)差未知
①對(duì)于大樣本
可以直接用樣本標(biāo)準(zhǔn)差代替總體標(biāo)準(zhǔn)差,即
②對(duì)于小樣本
所有可能樣本的平均數(shù)以總體平均數(shù)為中心,服從df=n-1的t分布,此時(shí)樣本平均數(shù)的標(biāo)準(zhǔn)誤
其中,8
C、總體非正態(tài)分布,但樣本容量n≥30
對(duì)于總體非正態(tài)分布,原則上不能使用參數(shù)推斷的方法進(jìn)行推論,但對(duì)于大樣本,盡管總體非正態(tài)分布,但樣本平均數(shù)抽樣分布的形態(tài)與正態(tài)分布差異較小,所以,在大樣本情況下,無(wú)論總體是否正態(tài)分布,也無(wú)論總體標(biāo)準(zhǔn)差是否已知,我們都可以認(rèn)為平均數(shù)的抽樣分布為近似服從正態(tài),求平均數(shù)的標(biāo)準(zhǔn)誤都可用公式
三、總體參數(shù)的估計(jì)(一)點(diǎn)估計(jì)
點(diǎn)估計(jì)就是用某一樣本統(tǒng)計(jì)量的值來(lái)估計(jì)相應(yīng)的總體參數(shù)值。9
好的估計(jì)量的基本要求:
無(wú)偏性——即沒(méi)有系統(tǒng)偏差,指若用統(tǒng)一估計(jì)量估計(jì)多次,其平均值應(yīng)恰好等于預(yù)估計(jì)的總體參數(shù)值,即偏差之和為0。
有效性——當(dāng)總體參數(shù)的無(wú)偏估計(jì)值不止一個(gè)時(shí),其中統(tǒng)計(jì)量的一切可能值方差最小者有效性最高。
一致性——指當(dāng)樣本容量無(wú)限增大時(shí),估計(jì)值應(yīng)越來(lái)越接近它所估計(jì)的總體參數(shù)值。(二)區(qū)間估計(jì)
區(qū)間估計(jì)是指以一定的概率去說(shuō)明總體參數(shù)落在某一區(qū)間的可能性。
描述樣本平均數(shù)與總體平均數(shù)之間的差異用標(biāo)準(zhǔn)誤為單位,即
。10
要求按某一可靠度去估計(jì)總體平均數(shù)的取值區(qū)間時(shí),可靠度稱(chēng)為置信水平,區(qū)間的界限稱(chēng)為置信界限,置信界限內(nèi)的區(qū)間稱(chēng)為置信區(qū)間。
研究中,常以95%和99%的可靠度估計(jì)總體參數(shù)的置信區(qū)間。具體計(jì)算如下:
1、總體平均數(shù)的區(qū)間估計(jì)
A、總體正態(tài)分布,總體標(biāo)準(zhǔn)差已知時(shí)總體平均數(shù)的區(qū)間估計(jì)
此時(shí),樣本平均數(shù)與總體平均數(shù)之間的差異,即樣本平均數(shù)在所有抽樣中的位置可以表示為
當(dāng)置信度為95%時(shí),即11
當(dāng)置信度為99%時(shí),
即其置信區(qū)間為
例:某小學(xué)10歲全體女童的身高呈正態(tài)分布,其標(biāo)準(zhǔn)差為6.25厘米,現(xiàn)從該校隨機(jī)抽取27名10歲女童,測(cè)得平均身高為134.2厘米,試估計(jì)該校10歲全體女童平均身高的95%和99%的置信區(qū)間。
練習(xí):從某正態(tài)總體中隨機(jī)抽取一個(gè)樣本容量為25的樣本,其平均數(shù)為42,已知總體的標(biāo)準(zhǔn)差為6,試估計(jì)總體平均數(shù)的置信度為95%和99%的置信區(qū)間。12
B、總體正態(tài)分布,總體標(biāo)準(zhǔn)差未知時(shí)總體平均數(shù)的區(qū)間估計(jì)
(1)總體標(biāo)準(zhǔn)差未知的大樣本,可用
代替總體標(biāo)準(zhǔn)差
,
總體平均數(shù)的置信度為95%的置信區(qū)間為
置信度為99%的置信區(qū)間為
如果設(shè)置信度為
為一小概率(常取值為0.05和0.01,統(tǒng)計(jì)推斷時(shí)稱(chēng)為顯著性水平)。當(dāng)總體標(biāo)準(zhǔn)差已知,或總體標(biāo)準(zhǔn)差未知但為大樣本時(shí),其置信區(qū)間的一般公式為13
(2)總體標(biāo)準(zhǔn)差未知的小樣本,用
代替總體標(biāo)準(zhǔn)差
,由于此時(shí)樣本平均數(shù)的抽樣分布為t分布,所以某一置信度下總體平均數(shù)的區(qū)間估計(jì)要依據(jù)t分布來(lái)進(jìn)行,此時(shí),總體平均數(shù)的置信度為
的置信區(qū)間為
例:某小學(xué)三年級(jí)學(xué)生閱讀能力服從正態(tài)分布,現(xiàn)從中隨機(jī)抽取12名學(xué)生,其閱讀能力的得分為28、32、36、22、34、30、33、25、31、33、29、26,試估計(jì)該校三年級(jí)閱讀能力總體平均數(shù)95%和99%的置信區(qū)間。
練習(xí):從某區(qū)小學(xué)五年級(jí)學(xué)生的數(shù)學(xué)推理測(cè)試成績(jī)中隨機(jī)抽取26個(gè),求得其平均數(shù)為86分,標(biāo)準(zhǔn)差為7分。已知全區(qū)五年級(jí)學(xué)生的成績(jī)服從正態(tài)分布,請(qǐng)?jiān)?.05顯著水平上估計(jì)該區(qū)五年級(jí)學(xué)生數(shù)學(xué)推理測(cè)試成績(jī)的置信區(qū)間。14
2、總體比率的區(qū)間估計(jì)(一般用于較大樣本的情況)
如果從總體中抽取容量為n的樣本,以p表示具有某種屬性的個(gè)體占總體的比率,其標(biāo)準(zhǔn)誤為
當(dāng)總體比率p未知時(shí),樣本比率和分別是總體比率p和q的估計(jì)值,標(biāo)準(zhǔn)誤為
當(dāng)
(
中的較小者)時(shí),樣本比率近似服從正態(tài)分布,此時(shí)總體比率的置信度為的置信區(qū)間為15
例:隨機(jī)抽取某校小學(xué)二年級(jí)學(xué)生40名,用韋氏智力測(cè)驗(yàn)量表測(cè)量其智力水平,結(jié)果智商成績(jī)?cè)?10分以上的有25名,試以95%的可靠性估計(jì)全校二年級(jí)學(xué)生智力測(cè)驗(yàn)分?jǐn)?shù)總體在110分以上者占總體比例的置信區(qū)間。
練習(xí):從某縣三年級(jí)學(xué)生中隨機(jī)抽取200人,測(cè)得他們社會(huì)科學(xué)習(xí)成績(jī)?yōu)锳等的有85人。試估計(jì)該校三年級(jí)學(xué)生社會(huì)科學(xué)習(xí)成績(jī)獲A等的人數(shù)占全縣三年級(jí)總?cè)藬?shù)比率的95%和99%的置信區(qū)間。四、樣本容量的確定(一)確定樣本大小的基本原則
在盡量節(jié)省人力、經(jīng)費(fèi)和時(shí)間的條件下,確保用樣本推斷總體達(dá)到預(yù)定的可靠度及準(zhǔn)確性。16(二)由樣本平均數(shù)估計(jì)總體平均數(shù)時(shí)樣本容量的確定
A、總體標(biāo)準(zhǔn)差已知
n為一定精確度要求下應(yīng)抽取的樣本容量;
為允許的最大誤差;
為總體標(biāo)準(zhǔn)差;
為某可靠性下的雙尾臨界值。
例:擬估計(jì)上海市高校四級(jí)英語(yǔ)考試的總體平均分?jǐn)?shù),根據(jù)歷次考試成績(jī)的標(biāo)準(zhǔn)差為13分,這次的估計(jì)最大允許誤差2分,可信度為95%,問(wèn)應(yīng)當(dāng)抽多少人?17
練習(xí):已知某小學(xué)六年級(jí)數(shù)學(xué)成績(jī)的標(biāo)準(zhǔn)差為10分?,F(xiàn)從該校隨機(jī)抽取一部分學(xué)生,要求有95%的把握用這部分學(xué)生的數(shù)學(xué)成績(jī)估計(jì)全校六年級(jí)學(xué)生平均成績(jī)的差異不超過(guò)2分,那么最低抽取多少學(xué)生才能滿(mǎn)足這一要求?
B、總體正態(tài)分布,總體標(biāo)準(zhǔn)差未知
問(wèn)題:
不是一個(gè)常數(shù),隨自由度df=n-1的變化而變化,而樣本容量未知,則df無(wú)法確定,則
無(wú)法查出。
辦法:逐步試差
步驟:
(1)設(shè)
,查表得
的值,代入公式
求出
;18
(2)令
,查t值表,查得
的值,代入公式計(jì)算出
;
(3)重復(fù)上述做法,直到連續(xù)兩次算得的
相等,這時(shí)的
就是所要確定的樣本容量n。
例:某地區(qū)進(jìn)行六年級(jí)學(xué)生英語(yǔ)成績(jī)抽樣調(diào)查,已隨機(jī)抽取了一部分學(xué)生的英語(yǔ)成績(jī),得到的總體標(biāo)準(zhǔn)差的估計(jì)值
=11.4分。現(xiàn)要了解六年級(jí)學(xué)生英語(yǔ)成績(jī)的平均水平,在99%的可靠性下,最大允許誤差為3分,問(wèn)樣本容量應(yīng)為多少?
練習(xí):某市要對(duì)今年全市小學(xué)四年級(jí)學(xué)生的外語(yǔ)平均分?jǐn)?shù)進(jìn)行估計(jì),規(guī)定
,最大允許誤差為2分。已知去年本校小學(xué)四年級(jí)學(xué)生外語(yǔ)成績(jī)的標(biāo)準(zhǔn)差是12分,那么應(yīng)當(dāng)抽取多大樣本進(jìn)行調(diào)查才能符合估計(jì)的要求?19(三)用樣本比率估計(jì)總體比
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 【正版授權(quán)】 ISO/IEC 23092-1:2025 EN Information technology - Genomic information representation - Part 1: Transport and storage of genomic information
- 二零二五版果樹(shù)病蟲(chóng)害防治與種植承包合同3篇
- 影視項(xiàng)目2025年度演員選角服務(wù)合同2篇
- 二零二五版餐飲業(yè)與旅行社跨界融合合同3篇
- 二零二五版電力設(shè)施拆除與再利用合同模板3篇
- 安徽省二零二五年度事業(yè)單位圖書(shū)館管理員聘用合同3篇
- 二零二五版集體房屋買(mǎi)賣(mài)合同及社區(qū)文化活動(dòng)服務(wù)協(xié)議3篇
- 二零二五年度高端酒水品牌對(duì)外承包經(jīng)營(yíng)合同范本3篇
- 二零二五年度高速公路收費(fèi)員勞動(dòng)合同解除與補(bǔ)償標(biāo)準(zhǔn)合同3篇
- 二零二五版果園租賃與農(nóng)業(yè)循環(huán)經(jīng)濟(jì)合同2篇
- 蘇少版七年級(jí)美術(shù)下冊(cè) 全冊(cè)
- 民航概論5套模擬試卷考試題帶答案
- 2024屆中國(guó)電建地產(chǎn)校園招聘網(wǎng)申平臺(tái)高頻500題難、易錯(cuò)點(diǎn)模擬試題附帶答案詳解
- COCA20000詞匯音標(biāo)版表格
- 滬教版七年級(jí)數(shù)學(xué)上冊(cè)專(zhuān)題06圖形的運(yùn)動(dòng)(原卷版+解析)
- JTG-T-F20-2015公路路面基層施工技術(shù)細(xì)則
- 光伏發(fā)電站集中監(jiān)控系統(tǒng)通信及數(shù)據(jù)標(biāo)準(zhǔn)
- 建筑垃圾減排及資源化處置措施
- 2024年遼寧石化職業(yè)技術(shù)學(xué)院?jiǎn)握新殬I(yè)適應(yīng)性測(cè)試題庫(kù)附答案
- 中西方校服文化差異研究
- 2024年一級(jí)建造師考試思維導(dǎo)圖-市政
評(píng)論
0/150
提交評(píng)論