




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、均數的抽樣誤差和總體均數估計均數的抽樣誤差和總體均數估計1. 參數估計參數估計 包括:點估計與區(qū)間估計包括:點估計與區(qū)間估計2. 假設檢驗假設檢驗統(tǒng)計推斷的兩部分內容:統(tǒng)計推斷的兩部分內容:樣本樣本隨機抽取部分觀察單位隨機抽取部分觀察單位 ? 推斷推斷inferenceinferenceX參數估計參數估計一、抽樣誤差與標準誤一、抽樣誤差與標準誤2009年某市年某市18歲男生身高歲男生身高N(167.7, 5.32)的抽樣示意圖的抽樣示意圖 將此將此100個樣本均數看成個樣本均數看成新變量值新變量值,則這,則這100個個樣本均數構成一樣本均數構成一新分布新分布,繪制頻數圖,繪制頻數圖從正態(tài)分布總
2、體從正態(tài)分布總體N(167.7, 5.32)隨機抽樣所得樣本均數分布隨機抽樣所得樣本均數分布 ,各樣本均數各樣本均數 未必等于總體均數;未必等于總體均數; 各樣本均數間存在差異;各樣本均數間存在差異; 樣本均數的分布為中間多,兩邊少,左右基本樣本均數的分布為中間多,兩邊少,左右基本對稱。對稱。 樣本均數的變異范圍較之原變量的變異范圍大樣本均數的變異范圍較之原變量的變異范圍大大縮小。大縮小??伤愕眠@可算得這100個樣本均數的均數為個樣本均數的均數為167.69cm、標準、標準差為差為1.69cm。XX 樣本均數分布具有如下樣本均數分布具有如下特點:特點:1、抽樣誤差:、抽樣誤差: 由個體變異產生
3、的、抽樣造成的樣本由個體變異產生的、抽樣造成的樣本統(tǒng)計量與總體參數的差別統(tǒng)計量與總體參數的差別 原因:原因:1 1)抽樣)抽樣 2 2)個體差異)個體差異表示表示樣本統(tǒng)計量樣本統(tǒng)計量抽樣誤差大小的統(tǒng)計抽樣誤差大小的統(tǒng)計指標。指標。標準誤:標準誤:說明抽樣誤差的大小,總體說明抽樣誤差的大小,總體計算公式計算公式(7-27)Xn2、標準誤、標準誤(standard error, SE)實質:樣本均數的標準差實質:樣本均數的標準差若用樣本標準差若用樣本標準差s 來估計來估計 , (7-28)XSSn當樣本例數當樣本例數n一定時,標準誤與標準差呈正比一定時,標準誤與標準差呈正比當標準差一定時,標準誤與
4、樣本含量當標準差一定時,標準誤與樣本含量n的平方的平方根呈反比。根呈反比。通過增加樣本含量通過增加樣本含量n來降低抽樣誤差。來降低抽樣誤差。隨機抽樣調查隨機抽樣調查7歲男孩歲男孩120名,的身高名,的身高均數為均數為120.88,標準差為,標準差為5.23,則其標準誤,則其標準誤是多少?是多少?例子例子:48. 0nsxs指標指標意義意義應用應用標準差標準差(s s)衡量變量值變異程度,衡量變量值變異程度,s s越大表示變量值變異程度越大表示變量值變異程度越大,越大,s s越小表示變量值越小表示變量值變異程度越小變異程度越小描述正態(tài)分布(近似正描述正態(tài)分布(近似正態(tài)分布)資料的頻數分態(tài)分布)資
5、料的頻數分布;醫(yī)學參考值范圍的布;醫(yī)學參考值范圍的估計估計標準誤標準誤( )樣本均數的變異程度,表樣本均數的變異程度,表示抽樣誤差的大小。示抽樣誤差的大小。標準標準誤越大表示抽樣誤差越大,誤越大表示抽樣誤差越大,樣本均數的可靠性越小;標樣本均數的可靠性越?。粯藴收`越小表示抽樣誤差越小,準誤越小表示抽樣誤差越小,樣本均數的可靠性越大樣本均數的可靠性越大總體均數區(qū)間估計;兩總體均數區(qū)間估計;兩個或多個總體均數間比個或多個總體均數間比較較XS標準差和標準誤的區(qū)別標準差和標準誤的區(qū)別二、二、t 分布分布(一)(一)t分布概念分布概念 隨機變量隨機變量X XN N( , 2 2)標準正態(tài)分布標準正態(tài)分布
6、N N(0 0,1 12 2)z變換Xz, 1XXXtnSSn 式中式中 為自由度為自由度(degree of freedom, df) 3實際工作中,由于實際工作中,由于 未知,用未知,用 代替,則代替,則 不再服從標準正態(tài)分布,而服從不再服從標準正態(tài)分布,而服從t t 分分布。布。 XXS() /XXS均數均數標準正態(tài)分布標準正態(tài)分布N N(0 0,1 12 2)),(2nN1,nvSXnSXtXStudent Student t t分布分布自由度:自由度:n n-1-1XnXz/(二)(二)t 分布的圖形與特征分布的圖形與特征 分布只有一個參數,即自由度t t-5.0-4.0-3.0-2
7、.0-1.00.01.02.03.04.05.0(標準正態(tài)曲線)=5=1f(t)圖圖 不同自由度下的不同自由度下的t 分布圖分布圖1特征:特征: 3t 界界值值表表:詳詳見見附附表表2,可可反反映映t 分分布布曲曲下下的的面面積積。 單單側側概概率率或或單單尾尾概概率率:用用,t 表表示示; 雙雙側側概概率率或或雙雙尾尾概概率率:用用2、 t界值表:界值表:詳見附表詳見附表2,可反映,可反映t分布曲線下的面積。分布曲線下的面積。單側概率或單尾概率:用單側概率或單尾概率:用 表示;表示;雙側概率或雙尾概率:用雙側概率或雙尾概率:用 表示。表示。 表表示示; 雙雙側側概概率率或或雙雙尾尾概概率率:
8、用用/2,t表表示示。 -tt0舉例:舉例: 三、參數估計三、參數估計用樣本統(tǒng)計量推斷總體參數。用樣本統(tǒng)計量推斷總體參數??傮w均數估計:總體均數估計:用樣本均數(和標準差)用樣本均數(和標準差)推斷總體均數。推斷總體均數。1.點估計點估計(point estimation):用相應樣本統(tǒng)計量直接作為其總體參數用相應樣本統(tǒng)計量直接作為其總體參數的估計值。如用的估計值。如用 估計估計、s估計估計 等。其方等。其方法雖簡單,但未考慮抽樣誤差的大小。法雖簡單,但未考慮抽樣誤差的大小。X 按預先給定的概率按預先給定的概率(1 )所確定的包含未知所確定的包含未知總體參數的一個范圍??傮w參數的一個范圍。 總
9、體均數的區(qū)間估計:總體均數的區(qū)間估計:按預先給定的概率按預先給定的概率(1 )所確定的包含未知總體均數的一個范圍。所確定的包含未知總體均數的一個范圍。 如給定如給定 =0.05,該范圍稱為參數的該范圍稱為參數的95%可信區(qū)可信區(qū)間或置信區(qū)間;間或置信區(qū)間; 如給定如給定 =0.01,該范圍稱為參數的該范圍稱為參數的99%可信區(qū)可信區(qū)間或置信區(qū)間。間或置信區(qū)間。2區(qū)間估計區(qū)間估計(interval estimation):計算總體均數可信區(qū)間計算總體均數可信區(qū)間n需考慮:需考慮: (1)總體標準差)總體標準差 是否已知,是否已知, (2)樣本含量)樣本含量n的大小的大小n通常有兩類方法:通常有兩
10、類方法: (1)t分布法分布法 (2)z分布法分布法,2/,2/aXatSXt (1) 未知且未知且n比較?。喊幢容^?。喊磘分布分布(2) 按按z分布分布2/2/aXazXz2/2/aXazsXz 某地抽取正常成年人某地抽取正常成年人200名,測得其血清名,測得其血清膽固醇的均數為膽固醇的均數為3.64 mmol/L,標準差為,標準差為1.20mmol/L,估計該地正常成年人血清膽固,估計該地正常成年人血清膽固醇均數的醇均數的95%可信區(qū)間??尚艆^(qū)間。 舉例舉例 故該地正常成年人血清膽固醇均數的雙側故該地正常成年人血清膽固醇均數的雙側95%可信區(qū)間為可信區(qū)間為(3.47, 3.81)mmol
11、L。四、四、 假設檢驗的基本概念和步驟假設檢驗的基本概念和步驟例例 大規(guī)模調查表明,健康成年男子血紅蛋白的均數為136.0g/L,今隨機調查某單位食堂成年男性炊事員25名,測得其血紅蛋白均數121g/L,標準差48.8g/L。 問題:根據資料推論食堂炊事員血紅蛋白均數是否與健康成年男子血紅蛋白均數有無差別(一)(一) 假設檢驗的基本思想假設檢驗的基本思想假設檢驗目的假設檢驗目的判斷差別是由哪種原因造成的判斷差別是由哪種原因造成的。 抽樣誤差造成的;抽樣誤差造成的; 本質差異造成的。本質差異造成的。;/8 .48,/121,25,/0 .1360LgSLgXnLg0X造成造成 的可能原因有二:的
12、可能原因有二:案例案例炊事員血紅蛋白總體均數炊事員血紅蛋白總體均數 136.0g/L 121g/L炊事員血紅蛋白總體均數炊事員血紅蛋白總體均數 138.0g/L138.0g/LX 一種假設一種假設H0另一種假設另一種假設H1抽樣誤差抽樣誤差總體不同總體不同 假定假如炊事員均數為假定假如炊事員均數為136.0g/L136.0g/L,即,即 則則 , ,服從服從t t 分布分布, ,絕大多數絕大多數t t應該分布在主要區(qū)域應該分布在主要區(qū)域 根據根據 t 分布能夠計算出有如此大差異的概率分布能夠計算出有如此大差異的概率P P ,如果,如果P P 值很小,即計算出的值很小,即計算出的t t 值超出了
13、給定的界限,則傾向于值超出了給定的界限,則傾向于拒絕拒絕H0 0,認為山區(qū)血紅蛋白均數不是認為山區(qū)血紅蛋白均數不是136.0136.0g/Lg/L0 .136:0dHnSXt/0 假設檢驗的基本思想假設檢驗的基本思想利用小概率反證法的思想利用小概率反證法的思想利用小概率反證法思想,從問題的對立面(H0)出發(fā)間接判斷要解決的問題(H1)是否成立。然后在H0成立的條件下計算檢驗統(tǒng)計量,最后獲得P值來判斷。當P小于或等于預先規(guī)定的概率值,就是小概率事件。根據小概率事件的原理:小概率事件在一次抽樣中發(fā)生的可能性很小,如果他發(fā)生了,則有理由懷疑原假設H0,認為其對立面H1成立1.建立檢驗假設,確定檢驗水
14、準(選用單側或雙側檢驗)(1)無效假設,記為H0;(2)備擇假設,記為H1。對于檢驗假設,須注意:1)檢驗假設是針對總體而言,而不是針對樣本;2)H0和H1是相互聯系,對立的假設,后面的結論是根據H0和H1作出的,因此兩者不是可有可無,而是缺一不可二、假設檢驗的基本步驟二、假設檢驗的基本步驟3)H1的內容直接反映了檢驗單雙側。若H1中只是 0 或只是 0,則此檢驗為單側檢驗。它不僅考慮有無差異,而且還考慮差異的方向。 4)單雙側檢驗的確定,首先根據專業(yè)知識,其次根據所要解決的問題來確定。若從專業(yè)上看一種方法結果不可能低于或高于另一種方法結果,此時應該用單側檢驗。一般認為雙側檢驗較保守和穩(wěn)妥。 (3) 檢驗水準,是預先規(guī)定的概率值,它確定了小概率事件的標準。在實際工作中常取 = 0.05??筛鶕煌芯磕康慕o予不同設置。例如本題:0 .136:00H01:H = 0.052. 計算檢驗統(tǒng)計量根據變量和資料類型、設計方案、統(tǒng)計推斷的目的、是否滿足特定條件等(如數據的分布類型)選擇相應的檢驗統(tǒng)計量。 如 t 檢驗、z檢驗、F檢驗和 檢驗等。2本例采用t檢驗方法本例t值為1.540, 1XXXXtnSSnSn 是指根據所計算的檢驗統(tǒng)計量確定是指根據所計算的檢驗統(tǒng)計量確定H0成立的可成立的可能性大小,即確定在檢驗假設條件下由抽樣誤
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 高中必修上冊古詩詞大單元教學研究
- 兒童衛(wèi)生安全教育
- TNF-α參與特應性皮炎瘙癢調控的機制研究
- 醫(yī)院安全檢查
- 中學考前勵志課件
- 硬膜下血腫病人護理查房
- 顱腦疾病護理課件
- 預防結核班會課件
- 預防校園欺凌課件
- 《機械設計基礎》課件-第7章 帶傳動
- 中國貨權風險判例研究報告 2024 -供應鏈企業(yè)篇
- 康明斯產品合格證
- 礦山廢水處理行業(yè)調研及投資前景分析報告
- 【五升六暑期閱讀】專題10.環(huán)境描寫及其作用-2024年五升六暑期閱讀專項提升(統(tǒng)編版)5
- DL∕T 1057-2023 自動跟蹤補償消弧線圈成套裝置技術條件
- 【電商直播對消費者購買行為影響:以抖音直播為例開題報告1800字】
- 抑郁病診斷證明書
- 氣體分析儀檢定規(guī)程
- 2024-2029年吞咽困難飲食增稠劑行業(yè)市場現狀供需分析及市場深度研究發(fā)展前景及規(guī)劃投資研究報告
- (高清版)WST 348-2024 尿液標本的采集與處理
- FZT 73012-2017 文胸行業(yè)標準
評論
0/150
提交評論