版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、第七章 抽樣分配 1.普通統(tǒng)計(jì)推論分成估計(jì)與檢定兩大領(lǐng)域,估計(jì)又分成點(diǎn)估計(jì)與信任區(qū)間兩種,2.7.1 估計(jì)與誤差 生態(tài)學(xué)家以為南極海域的藍(lán)鯨存量濱臨絕種邊緣,因此想知道如今的藍(lán)鯨存量有多少?在這個問題中,藍(lán)鯨存量就是我們感興趣的參數(shù)3.參數(shù)(藍(lán)鯨存量)是多少?能夠方法之一是將南極海域的水抽光后,數(shù)一數(shù)就可數(shù)出有多少尾藍(lán)鯨較可行的方式是透過統(tǒng)計(jì)的手法獲得資料再做推估 4.例7.1、南極海域藍(lán)鯨存量的估計(jì) 南極海域藍(lán)鯨捕獲量愈來愈少捕鯨協(xié)會想研討南極的藍(lán)鯨存量有多少? 5.方法1 捕獲量比較法 如第一次捕捉到270尾, 第二次捕捉到243尾,少了10%。那么估計(jì)為原有270/0.1 = 2700尾
2、, 但如今那么有2187尾。 6. 7.方法2記號法設(shè)第一次捕捉到鯨魚150尾,做記號后放回。 第二次再捕100尾,其中有6尾有記號。那么估計(jì)鯨魚存量為:8.9.估計(jì)與誤差 10.例 男生比率某大學(xué)共有學(xué)生6672人,某教授想了解此大學(xué)中男生所占的比例。便在某角落察看經(jīng)過的學(xué)生,看到100位中有40位女生、60位男生,因此他估計(jì)全校男生比率是0.6。11.現(xiàn)實(shí)上,全校學(xué)生中有 男生3091人、女生3581人,因此母體參數(shù)男生比例是 = 3091/6672 0.46,而此教授估計(jì)男生的比例是0.6。12.抽樣誤差其差距0.14有二種來源:一是由于抽樣誤差呵斥,如在同一角落多看幾次(每次都是100
3、人) ,所得男女生比例也會有不同。這種由于樣本抽樣所呵斥的誤差,稱之為“抽樣誤差,是“隨機(jī)性,也是先天存在的。要獲得抽樣誤差的數(shù)據(jù),這要重覆做很多次(如幾千次、幾萬次才干得到) 。13.假設(shè)此教授后來又察看了10天,每天都在同一角落察看100位學(xué)生,假設(shè)看到10次的男生人數(shù)分別如下:58 50 62 61 46 50 55 52 53 51由此10次算出平均數(shù)是54人,所以估計(jì)男生比例是0.54它與我們原先估計(jì)的男生比例是0.60 ,兩者相差, 0.60 - 0.54 = 0.06即為抽樣誤差。14.方法偏向 此教授在這個角落察看過往的學(xué)生,這種抽查方式也有能夠呵斥偏向,也許這個角落離男生宿舍
4、較近,男生經(jīng)過的比例偏高,此為偏向的來源。假設(shè)每位學(xué)生(不論男女生)經(jīng)過此角落時機(jī)均等,那么看到男生的比例應(yīng)是母體的比率0.46 ?,F(xiàn)實(shí)上,因男生經(jīng)過此角落的時機(jī)較大故呵斥看到男生的比例為0.54 。此兩者的差別0.54-0.46=0.08, 即為方法偏向。15.0.60(估計(jì)值) =0.46(參數(shù)) + 0.08(方法偏向) + 0.06(抽樣誤差) 16.7.2 樣本平均數(shù)的分配 隨機(jī)抽樣得到一組資料x1, ., xn后,我們最常計(jì)算的兩個統(tǒng)計(jì)量是 樣本平均數(shù) 樣本規(guī)范差S雖然資料是從同一母體抽樣, 但每次抽出的n個樣本會不同,因此算出的樣本平均數(shù)、規(guī)范差S也會不一樣,所以我們稱 、S是“
5、隨機(jī)變量17.既然每次抽樣算出的 、S不同,我們有必要了解 、S的抽樣分布長象是如何?18.抽樣分配 19.全國成年男人(約600萬人)的平均身高是多少公分? 20.21.600萬人身高直方圖22.第一組抽樣100位的身高資料 23.樣本平均數(shù) = 168.8, 規(guī)范差s = 6.3。假設(shè)以這樣的結(jié)果做母體平均數(shù) 的估計(jì),那么估計(jì)誤差是 - = 169.5 - 168.8 = 0.7(公分)24.第二組抽樣100位的身高資料 25.樣本平均數(shù) = 171.3,規(guī)范差s = 6.8。假設(shè)以第二組抽樣的平均數(shù)=171.3, 當(dāng)做一切全國成年人平均身高的估計(jì),那么估計(jì)誤差為 - = 169.5 -
6、171.3 = - 1.826.隨機(jī)變量由上面兩次抽樣結(jié)果,我們知道每次 抽樣的資料會變動(故稱xi為“隨機(jī)變量)而得到的樣本平均數(shù) 也隨之變動 (故也是隨機(jī)變量)因此估計(jì)誤差也是不確定的27.抽樣分布 28.圖7.3 全國成年男人抽樣100位平均身高X的分布 010020030040050060070080090010001100120013001400166.4166.8167.2167.6168.0168.4168.8169.2169.6170.0170.4170.8171.2171.6172.0172.4 次數(shù) 29.(1)此直方圖應(yīng)像對稱的鐘形(即常態(tài)分配)。(2)此直方圖的中心點(diǎn)(
7、也就是直方圖最高 的部份)依然是在169.5附近。(3)此直方圖比原先600萬位身高所畫直方圖更集中在中心點(diǎn)附近,即這些的規(guī)范差較原先母體Xi的規(guī)范差小。(4)這10,000個平均數(shù)的規(guī)范差是0.653比原先的母體(600萬人的身高)的規(guī)范差6.5小很,大約是原來的1/10 。30.1. 誤差在1公分之內(nèi)的時機(jī) ?抽樣誤差31.2. 估計(jì)誤差在1.3公分之內(nèi)的機(jī)率? 抽樣誤差32.3. 控制估計(jì)誤差在1公分之內(nèi)而對的時機(jī)有 95%時,那應(yīng)取多少樣本呢? 信任度33.全國成年女生610萬人其身高分布 010020030040050060070080090010001100140144148152
8、156160164168172176180184188192196200 次數(shù)(單位:千人次) 34.圖7.5 全國成年人身高分布 01002003004005006007008009001000110012001300140144148152156160164168172176180184188192196200 一切成年人的平均身高是 m=164.21,規(guī)范差 s= 7.8831。 次數(shù)(單位:千人次) 35.36.7.3 大數(shù)法那么37.中央極限定理常態(tài)分配在實(shí)際上有很多好的結(jié)果,統(tǒng)計(jì)學(xué)上常假設(shè)資料是常態(tài)分配,例如常聽到常態(tài)分班、常模、常態(tài)曲線等等這些假設(shè)的根據(jù)是什么呢? 就是中央極限定
9、理的功績 38.中央極限定理 39.中央極限定理40.(1) 不論原母體是什么分配,不論母體資料是延續(xù)型或離散型、 對稱或不對稱、右偏或左偏, 甚至是單峰或多峰都無所謂,只需樣本數(shù)n“足夠大, 分配 就會變成像鐘形的常態(tài)分配。41.(2)抽樣樣本數(shù)不論是多少個, 代表資料“中心點(diǎn)的樣本平均數(shù)的 期望值與原母體分配的期望值都一樣 42.43.(i) 常態(tài)母體 44.(ii) 右偏母體 45. (iii) 均勻母體 46. (iv) 二項(xiàng)分配母體 47. 7.4 樣本數(shù)的決議 48.誤差界限所需抽樣樣本數(shù)n 49.例 95%自信心程度 e 150.例 95%自信心程度 e 0.551.(1)誤差要
10、求愈小,那么所需樣本數(shù)就要愈大。如上例中誤差e = 1,當(dāng)要求誤差降低到e = 0.5,那么樣本數(shù)需求添加到 4 162.3 = 650位。(2)信任度愈大(即愈小),那么樣本數(shù)也要愈多。(3)規(guī)范差 愈大,那么要求的樣本數(shù)也愈多。 52.(4)實(shí)務(wù)上,通常是不知道的。因此需求用其他方式對做大約的估計(jì)。例如以客觀估計(jì) = 7.2,或是由客觀以為全國最高為200公分,最低150公分,全距是50公分,但全距大約是8,因此由8 = 50,得 = 6.25 。另外也可先抽幾個樣本(例如10個),算出樣本規(guī)范差S,以此做的估計(jì),然后再由(7.9)式, 求出樣本數(shù)n 。53.7.5 樣本變異數(shù)的分布與卡方
11、分配 54.55.卡方分配 56.卡方分配密度函數(shù) 57.圖7.11 卡方分配密度函數(shù)圖 58.假設(shè)不是規(guī)范常態(tài)而是普通的常態(tài)平方和所組成能否也是卡方配呢?59.答案 不是 60.不是規(guī)范常態(tài)而是普通的常態(tài)平方和所組成 61.樣本變異數(shù)的分布 62.答案 :是 其自在度變成n - 1, 這是由于參數(shù) 被估計(jì)值取代, 因此犧牲了一個自在度 63.64.樣本變異數(shù)的分布不是常態(tài)而是右偏的卡方分布 65.66.例7.2、假設(shè)從規(guī)范常態(tài)母體中每次抽4個, 得x1, x2, x3, x4,再計(jì)算 這樣重覆做10000次,得到10000筆數(shù)據(jù)試畫其直方圖 67.68.69.卡方分配查表 70.圖7.13
12、之幾何意義 71.查附表 72.卡方分配的運(yùn)用 卡方分配主要用在檢定 (檢定定義在第八章)它可用來檢定資料能否適宜某種分配 (適宜度檢定)或是檢定一組常態(tài)分配資料其變異數(shù) 能否等于某數(shù)。73.另外當(dāng)母體規(guī)范差未知時, 如要對母體平均數(shù)m做統(tǒng)計(jì)推論, 更需求用到樣本變異數(shù)的分配由卡方分配才導(dǎo)出7.6與7.7節(jié) 所要討論的 t分配與 F分配。74.7.6 t分配 75.“自在度k的t分配定義 76.自在度n - 1的t分配 77.自在度k的t分配的密度函數(shù) 78.圖7.14 t分配密度函數(shù)圖 79.80.81.注 (i) t分配是對稱圖形, 它的外形與常態(tài)分配類似, 不過往兩邊下降速度較常態(tài)分配緩
13、慢。(ii)當(dāng)自在度k愈大時, t分配就愈接近規(guī)范常態(tài)分配。 82.t 分配查表 83.84.查 t 附表 85.注 86.7.7 F分配 87.F分配的密度函數(shù) 88.圖7.17 F分配圖 89.90.91.F分配查表 92.93.查 F分配表 94.第七章 摘要 95.1.欲估計(jì)母體的參數(shù) 需求抽樣(普通不做普查,緣由費(fèi)時費(fèi)力),抽樣的估計(jì)值與母體參數(shù)不會一樣 會有誤差,其關(guān)系式為 估計(jì)值 = 參數(shù)+方法偏向+抽樣誤差 96.2.方法偏向 方法偏向是人為的忽略應(yīng)防止,例如方便的資料等所呵斥的偏向。抽樣誤差是自然的要素雖非人為的, 但也可由對資料的認(rèn)知降低誤差,例如以分層隨機(jī)抽樣取代 簡單隨機(jī)抽樣就能降低抽樣誤差 97.抽樣樣本數(shù)的決議 98.4.了解中央極限定理的意義、 運(yùn)用及其重
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 《奶制品培訓(xùn)資料》課件
- 《小王子英文》課件
- 《企業(yè)管理概論》課件
- 2024年雷電頌教案
- 尖子生家長會發(fā)言稿
- 單位管理制度匯編大合集【人員管理篇】十篇
- 單位管理制度合并匯編職工管理
- 單位管理制度分享大全【職員管理篇】
- 單位管理制度范文大合集人力資源管理十篇
- 單位管理制度范例合集【職工管理】十篇
- 《國家課程建設(shè)》課件
- 養(yǎng)老機(jī)構(gòu)安全隱患排查清單、自查表、治理整改臺賬
- 少數(shù)民族小學(xué)生良好行為習(xí)慣養(yǎng)成的內(nèi)需與外趨的研究課題
- 毛坯房驗(yàn)房專用表格詳細(xì)
- 江西省特種作業(yè)人員體檢表(共1頁)
- 幼兒園大班主題《我自己》個別化學(xué)習(xí)
- 派出所立體化勤務(wù)指揮室建設(shè)模式探析――以大連市公
- 物資設(shè)備部工作述職報(bào)告
- 精品資料(2021-2022年收藏)龍門吊軌道基礎(chǔ)施工方案
- 畫廊與畫家合作協(xié)議書范本
- 全口義齒-印模與模型-課件PPT
評論
0/150
提交評論