




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、抽樣及參數(shù)估計宋廷山版 第五章 抽樣及參數(shù)估計 抽樣及參數(shù)估計宋廷山版 1、抽樣 2、抽樣分布 3、參數(shù)估計方法 4、總體均值的估計區(qū)間 5、總體比例的區(qū)間估計 6、總體方差的區(qū)間估計 7、樣本容量的確定 抽樣及參數(shù)估計宋廷山版 基本概念 總體、個體、總體容量、樣本、樣本容量、抽樣、 參數(shù)、統(tǒng)計量 抽樣方法 隨機、分層 抽樣分布 樣本平均數(shù):Z分布、t分布 樣本方差:卡方分布、F分布 參數(shù)估計 點估計:充分性、無偏性、有效性、一致性 區(qū)間估計:顯著性水平、置信度、置信區(qū)間 抽樣及參數(shù)估計宋廷山版 總體(population):要研究的事物或現(xiàn)象的總體 個體(unit):組成總體的每個元素(成員
2、) 總體容量(population size):一個總體中所含個體的數(shù) 量 樣本(sample):從總體中抽取的部分個體 樣本容量(sample size):樣本中所含個體的數(shù)量 抽樣(sampling):為推斷總體的某些重要特征,需要從 總體中按一定抽樣技術抽取若干個體的過程 參數(shù)(parameter):反映總體數(shù)據(jù)特征的量數(shù) 統(tǒng)計量(statistic):反映樣本數(shù)據(jù)特征的量數(shù) 統(tǒng)計量是樣本的函數(shù),只依賴于樣本;樣本均值、樣本方差 等都是統(tǒng)計量 抽樣及參數(shù)估計宋廷山版 民意調查 在1936年的美國總統(tǒng)選舉前,一份名為Literary Digest 雜志進行 了一次民意調查。調查的焦點是誰將
3、成為下一屆總統(tǒng)是挑戰(zhàn)者, 堪薩斯州州長Alf Landon,還是現(xiàn)任總統(tǒng) Franklin Delano Roosevelt 為了解選民意向,民意調查專家們根據(jù)電話簿和車輛登記簿上的 名單給一大批人發(fā)了簡單的調查表(電話和汽車在1936年并不像 現(xiàn)在那樣普及,但是這些名單比較容易得到)。盡管發(fā)出的調查表 大約有一千萬張,但收回的比例并不高。在收回的調查表中, Alf Landon非常受歡迎。于是該雜志預測 Landon 將贏得選舉。但事 實上是Franklin Roosevelt贏得了這次選舉 調查失敗的主要原因是抽樣框出現(xiàn)了問題。在經濟大蕭條時期由 于電話和汽車并不普及,只是富裕階層才會擁有
4、,調查有電話和 汽車的人們,并不能夠反映全體選民的觀點 抽樣及參數(shù)估計宋廷山版 參數(shù)估計在統(tǒng)計方法中的地位 參數(shù)估計參數(shù)估計假設檢驗假設檢驗 統(tǒng)計方法 描述統(tǒng)計描述統(tǒng)計推斷統(tǒng)計推斷統(tǒng)計 抽樣及參數(shù)估計宋廷山版 隨機原則隨機原則 總體參數(shù)總體參數(shù)統(tǒng)計量統(tǒng)計量推斷估計推斷估計 參數(shù)估計參數(shù)估計 檢驗檢驗 假設檢驗假設檢驗 抽樣及參數(shù)估計宋廷山版 問題: 1、某研究人員想要了解濟南在校大學生每 周的自習時間,然而對于一個擁有幾十萬大 學生的城市來說,他的調查經費是遠遠不夠 的,那么這項調查還能進行嗎?如果能進行, 他該怎么進行,并判斷結論的可靠性呢? 2、某企業(yè)想調查消費者對它的產品的認知 程度,如
5、何進行,并判斷結論的可靠性呢? 抽樣及參數(shù)估計宋廷山版 1 1、抽樣、抽樣 概率抽樣(probability sampling) 隨機抽樣 按一定的概率以隨機原則抽取樣本 抽取樣本時使每個單位都有一定的機會被 抽中 每個單位被抽中的概率是已知的,或是可以 計算出來的 當用樣本對總體目標量進行估計時,要考慮 到每個樣本單位被抽中的概率 抽樣及參數(shù)估計宋廷山版 簡單隨機抽樣 (simple random sampling) 從總體N個單位中隨機地抽取n個單位作為樣本, 每個單位入抽樣本的概率是相等的 最基本的抽樣方法,是其它抽樣方法的基礎 特點 簡單、直觀,在抽樣框完整時,可直接從中 抽取樣本 用
6、樣本統(tǒng)計量對目標量進行估計比較方便 局限性 當N很大時,不易構造抽樣框 抽出的單位很分散,給實施調查增加了困難 沒有利用其它輔助信息以提高估計的效率 抽樣及參數(shù)估計宋廷山版 分層抽樣 (stratified sampling) 將抽樣單位按某種特征或某種規(guī)則劃分為不同的層, 然后從不同的層中獨立、隨機地抽取樣本 優(yōu)點 保證樣本的結構與總體的結構比較相近,從而 提高估計的精度 組織實施調查方便 既可以對總體參數(shù)進行估計,也可以對各層的 目標量進行估計 抽樣及參數(shù)估計宋廷山版 系統(tǒng)抽樣 (systematic sampling) 將總體中的所有單位(抽樣單位)按一定順序排 列,在規(guī)定的范圍內隨機地
7、抽取一個單位作為 初始單位,然后按事先規(guī)定好的規(guī)則確定其它 樣本單位 先從數(shù)字1到k之間隨機抽取一個數(shù)字r作為 初始單位,以后依次取r+k,r+2k等單位 優(yōu)點:操作簡便,可提高估計的精度 缺點:對估計量方差的估計比較困難 抽樣及參數(shù)估計宋廷山版 整群抽樣 (cluster sampling) 將總體中若干個單位合并為組(群),抽樣時直接 抽取群,然后對中選群中的所有單位全部實施 調查 特點 抽樣時只需群的抽樣框,可簡化工作量 調查的地點相對集中,節(jié)省調查費用,方便 調查的實施 缺點是估計的精度較差 抽樣及參數(shù)估計宋廷山版 2 2、抽樣分布、抽樣分布 (sampling distributio
8、n) 在重復選取容量為n的樣本時,由每一個樣本算 出的該統(tǒng)計量數(shù)值的相對頻數(shù)分布或概率分布 是一種理論分布 隨機變量是樣本統(tǒng)計量 樣本均值, 樣本比例,樣本方差等 結果來自容量相同的所有可能樣本 提供了樣本統(tǒng)計量長遠我們穩(wěn)定的信息,是進行 推斷的理論基礎,也是抽樣推斷科學性的重要依 據(jù) 抽樣及參數(shù)估計宋廷山版 樣本均值的抽樣分布 容量相同的所有可能樣本的樣本均值的概率 分布 一種理論概率分布 進行推斷總體總體均值的理論基礎 抽樣及參數(shù)估計宋廷山版 抽樣及參數(shù)估計宋廷山版 3,43,33,23,13 2,42,32,22,12 4,44,34,24,14 1,4 4 1,3 321 1,21,1
9、1 第二個觀察值第一個 觀察值 所有可能的n = 2 的樣本(共16個) 抽樣及參數(shù)估計宋廷山版 3.53.02.52.03 3.02.52.01.52 4.03.53.02.54 2.5 4 2.0 321 1.51.01 第二個觀察值 第一個 觀察值 16個樣本的均值 (x) 抽樣及參數(shù)估計宋廷山版 樣本均值的分布與總體分布的比較 抽樣及參數(shù)估計宋廷山版 樣本均值的抽樣分布 與中心極限定理 X 抽樣及參數(shù)估計宋廷山版 中心極限定理 (central limit theorem) 抽樣及參數(shù)估計宋廷山版 抽樣及參數(shù)估計宋廷山版 抽樣分布與總體分布 正態(tài)分布正態(tài)分布非正態(tài)分布非正態(tài)分布 樣本均
10、值樣本均值 正態(tài)分布正態(tài)分布 樣本均值樣本均值 正態(tài)分布正態(tài)分布 樣本均值樣本均值 非正態(tài)分布非正態(tài)分布 抽樣及參數(shù)估計宋廷山版 樣本均值的抽樣分布 (數(shù)學期望與方差) 樣本均值的數(shù)學期望 樣本均值的方差 重復抽樣 不重復抽樣 抽樣及參數(shù)估計宋廷山版 樣本比例的抽樣分布 (比例proportion) 總體(或樣本)中具有某種屬性的單位與全部單位 總數(shù)之比 不同性別的人與全部人數(shù)之比 合格品(或不合格品) 與全部產品總數(shù)之比 總體比例可表示為 樣本比例可表示為 抽樣及參數(shù)估計宋廷山版 容量相同的所有可能樣本的樣本比例的 概率分布 當樣本容量很大時,樣本比例的抽樣分 布可用正態(tài)分布近似 一種理論概
11、率分布 推斷總體總體比例的理論基礎 抽樣及參數(shù)估計宋廷山版 樣本比例的抽樣分布 (數(shù)學期望與方差) 樣本比例的數(shù)學期望 樣本比例的方差 重復抽樣 不重復抽樣 抽樣及參數(shù)估計宋廷山版 3 3、參數(shù)估計方法、參數(shù)估計方法 估計量與估計值 (estimator & estimated value) 參數(shù)估計(parameter estimation)就是用樣本統(tǒng)計量 去估計總體的參數(shù) 估計量:用于估計總體參數(shù)的統(tǒng)計量的名稱 如樣本均值,樣本比例,樣本方差等 例如: 樣本均值就是總體均值 的一個估計量 參數(shù)用 表示,估計量用 表示 估計值:估計參數(shù)時計算出來的統(tǒng)計量的具體值 如果樣本均值 x =80,
12、則80就是 的估計值 抽樣及參數(shù)估計宋廷山版 點估計 (point estimate) 用樣本的估計量的某個取值直接作為總體參 數(shù)的估計值 例如:用樣本均值直接作為總體均值的估計;用 兩個樣本均值之差直接作為總體均值之差的估計 無法給出估計值接近總體參數(shù)程度的信息 由于樣本是隨機的,抽出一個具體的樣本得到的 估計值很可能不同于總體真值 一個點估計量的可靠性是由它的抽樣標準誤差來 衡量的,這表明一個具體的點估計值無法給出估 計的可靠性的度量 抽樣及參數(shù)估計宋廷山版 區(qū)間估計 (interval estimate) 在點估計的基礎上,給出總體參數(shù)估計的一個估計區(qū) 間,該區(qū)間由樣本統(tǒng)計量加減估計誤差
13、而得到 根據(jù)樣本統(tǒng)計量的抽樣分布能夠對樣本統(tǒng)計量與總體 參數(shù)的接近程度給出一個概率度量 比如,某班級平均分數(shù)在7585之間,置信水平是95% 抽樣及參數(shù)估計宋廷山版 區(qū)間估計 抽樣及參數(shù)估計宋廷山版 將構造置信區(qū)間的步驟重復很多次,置 信區(qū)間包含總體參數(shù)真值的次數(shù)所占的 比例,也稱置信度 表示為 (1 - l 為是總體參數(shù)未在區(qū)間內的比例 常用的置信水平值有 99%, 95%, 90% l 相應的 為0.01,0.05,0.10 置信水平 (confidence level) 抽樣及參數(shù)估計宋廷山版 由樣本估計量構造出的總體參數(shù)在一定置信水平 下的估計區(qū)間 統(tǒng)計學家在某種程度上確信這個區(qū)間會包
14、含真正 的總體參數(shù),所以給它取名為置信區(qū)間 如果用某種方法構造的所有區(qū)間中有95%的區(qū)間 包含總體參數(shù)的真值,5%的區(qū)間不包含總體參數(shù) 的真值,那么,用該方法構造的區(qū)間稱為置信水 平為95%的置信區(qū)間。同樣,其他置信水平的區(qū) 間也可以用類似的方式進行表述 置信區(qū)間的表述 (confidence interval) 抽樣及參數(shù)估計宋廷山版 總體參數(shù)的真值是固定的,而用樣本構造的區(qū) 間則是不固定的,因此置信區(qū)間是一個隨機區(qū) 間,它會因樣本的不同而變化,而且不是所有 的區(qū)間都包含總體參數(shù) 實際估計時往往只抽取一個樣本,此時所構造 的是與該樣本相聯(lián)系的一定置信水平(比如95%) 下的置信區(qū)間。我們只能
15、希望這個區(qū)間是大量 包含總體參數(shù)真值的區(qū)間中的一個,但它也可 能是少數(shù)幾個不包含參數(shù)真值的區(qū)間中的一個 置信區(qū)間的表述 (confidence interval) 抽樣及參數(shù)估計宋廷山版 當抽取了一個具體的樣本,用該樣本所構造的區(qū)間是 一個特定的常數(shù)區(qū)間,我們無法知道這個樣本所產生 的區(qū)間是否包含總體參數(shù)的真值,因為它可能是包含 總體均值的區(qū)間中的一個,也可能是未包含總體均值 的那一個 一個特定的區(qū)間總是“包含”或“絕對不包含”參數(shù) 的真值,不存在“以多大的概率包含總體參數(shù)”的問 題 置信水平只是告訴我們在多次估計得到的區(qū)間中大概 有多少個區(qū)間包含了參數(shù)的真值,而不是針對所抽取 的這個樣本所構
16、建的區(qū)間而言的 置信區(qū)間的表述 (confidence interval) 抽樣及參數(shù)估計宋廷山版 置信區(qū)間的表述 (95%的置信區(qū)間) 我沒有抓住參數(shù)!我沒有抓住參數(shù)! 抽樣及參數(shù)估計宋廷山版 使用一個較大的置信水平會得到一個比較寬的置信區(qū) 間,而使用一個較大的樣本則會得到一個較準確(較 窄)的區(qū)間。直觀地說,較寬的區(qū)間會有更大的可能 性包含參數(shù) 但實際應用中,過寬的區(qū)間往往沒有實際意義 l比如,天氣預報說“在一年內會下一場雨”,雖然這很有 把握,但有什么意義呢?另一方面,要求過于準確(過窄) 的區(qū)間同樣不一定有意義,因為過窄的區(qū)間雖然看上去很 準確,但把握性就會降低,除非無限制增加樣本量,
17、而現(xiàn) 實中樣本量總是有限的 區(qū)間估計總是要給結論留點兒余地 置信區(qū)間的表述 (confidence interval) 抽樣及參數(shù)估計宋廷山版 置信區(qū)間與置信水平的關系 抽樣及參數(shù)估計宋廷山版 4 4、總體均值的估計區(qū)間、總體均值的估計區(qū)間 正態(tài)總體、方差已知 或非正態(tài)總體、大樣本 正態(tài)總體、方差未知、小樣本 抽樣及參數(shù)估計宋廷山版 正態(tài)總體、方差已知 或非正態(tài)總體、大樣本 抽樣及參數(shù)估計宋廷山版 總體均值的區(qū)間估計 (正態(tài)總體、方差已知或非正態(tài)總體大樣本) 1.假定條件 總體服從正態(tài)分布,且方差() 已知 如果不是正態(tài)分布,可由正態(tài)分布來近似 (n 30) 2.使用正態(tài)分布統(tǒng)計量 z 抽樣及
18、參數(shù)估計宋廷山版 總體均值的區(qū)間估計 (正態(tài)總體、方差已知或非正態(tài)總體大樣本) 25袋食品的重量 112.5101.0103.0102.0100.5 102.6107.5 95.0108.8115.6 100.0123.5102.0101.6102.2 116.6 95.4 97.8108.6105.0 136.8102.8101.5 98.4 93.3 抽樣及參數(shù)估計宋廷山版 總體均值的區(qū)間估計 (正態(tài)總體、方差已知或非正態(tài)總體大樣本) 抽樣及參數(shù)估計宋廷山版 總體均值的區(qū)間估計 (正態(tài)總體、方差已知或非正態(tài)總體大樣本) 36個投保人年齡的數(shù)據(jù) 233539273644 3642464331
19、33 425345544724 342839364440 394938344850 343945484532 抽樣及參數(shù)估計宋廷山版 總體均值的區(qū)間估計 (正態(tài)總體、方差已知或非正態(tài)總體大樣本) 抽樣及參數(shù)估計宋廷山版 正態(tài)總體、方差未知、小樣本 抽樣及參數(shù)估計宋廷山版 總體均值的區(qū)間估計 (正態(tài)總體、方差未知、小樣本) 1.假定條件 總體服從正態(tài)分布,但方差() 未知 小樣本 (n 30) 2. 使用 t 分布統(tǒng)計量 抽樣及參數(shù)估計宋廷山版 總體均值的區(qū)間估計 (正態(tài)總體、方差未知、小樣本) 16燈泡使用壽命的數(shù)據(jù) 1510152014801500 1450148015101520 1480149015301510 1460146014701470 抽樣及參數(shù)估計宋廷山版 總體均值的區(qū)間
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年小學教師資格考試《綜合素質》教育資源整合教育發(fā)展題(含答案)
- 家庭教育行業(yè)的發(fā)展趨勢
- 怎做銷售管理的培訓
- 2025-2030羊絨行業(yè)風險投資發(fā)展分析及投資融資策略研究報告
- 2025-2030純音聽力計行業(yè)市場現(xiàn)狀供需分析及重點企業(yè)投資評估規(guī)劃分析研究報告
- 2025-2030紫外線激光行業(yè)市場現(xiàn)狀供需分析及重點企業(yè)投資評估規(guī)劃分析研究報告
- 2025-2030程控交換機市場發(fā)展分析及行業(yè)投資戰(zhàn)略研究報告
- 2025-2030硅酸鹽材料行業(yè)市場現(xiàn)狀供需分析及重點企業(yè)投資評估規(guī)劃分析研究報告
- 2025-2030睡褲產業(yè)行業(yè)市場現(xiàn)狀供需分析及投資評估規(guī)劃分析研究報告
- 2025-2030相序指示器行業(yè)市場現(xiàn)狀供需分析及重點企業(yè)投資評估規(guī)劃分析研究報告
- 第15課《青春之光》課件-2024-2025學年統(tǒng)編版語文七年級下冊
- 世界給予我的 課件-2024-2025學年高二下學期開學第一課主題班會
- GB/T 32482-2024機動車用白光LED封裝的顏色分選
- 2024年浙江省中考英語試卷及答案
- LNG加氣站施工方案
- 演員王星受騙事件教育宣傳預防詐騙
- 互動式醫(yī)學課堂教學設計
- 安寧療護的癥狀管理:發(fā)熱
- 2024年北京老年醫(yī)院招聘筆試真題
- 修理廠入股合同
- 2024年醫(yī)師定期考核臨床類考試題庫及答案(共500題)
評論
0/150
提交評論