![抽樣誤差與假設檢驗_第1頁](http://file3.renrendoc.com/fileroot_temp3/2022-3/11/377bb825-b8d3-466f-9b26-726e1b0c6558/377bb825-b8d3-466f-9b26-726e1b0c65581.gif)
![抽樣誤差與假設檢驗_第2頁](http://file3.renrendoc.com/fileroot_temp3/2022-3/11/377bb825-b8d3-466f-9b26-726e1b0c6558/377bb825-b8d3-466f-9b26-726e1b0c65582.gif)
![抽樣誤差與假設檢驗_第3頁](http://file3.renrendoc.com/fileroot_temp3/2022-3/11/377bb825-b8d3-466f-9b26-726e1b0c6558/377bb825-b8d3-466f-9b26-726e1b0c65583.gif)
![抽樣誤差與假設檢驗_第4頁](http://file3.renrendoc.com/fileroot_temp3/2022-3/11/377bb825-b8d3-466f-9b26-726e1b0c6558/377bb825-b8d3-466f-9b26-726e1b0c65584.gif)
![抽樣誤差與假設檢驗_第5頁](http://file3.renrendoc.com/fileroot_temp3/2022-3/11/377bb825-b8d3-466f-9b26-726e1b0c6558/377bb825-b8d3-466f-9b26-726e1b0c65585.gif)
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、 第四章第四章 抽樣誤差與假設檢驗抽樣誤差與假設檢驗 (Sampling Sampling E Error and rror and H Hypothesis ypothesis T Testest) 哈爾濱醫(yī)科大學哈爾濱醫(yī)科大學 李康李康 第一節(jié)第一節(jié) 均數的抽樣誤差與標準誤均數的抽樣誤差與標準誤 一、均數的抽樣誤差一、均數的抽樣誤差 在醫(yī)學研究中,絕大多數情況是由樣本信息研在醫(yī)學研究中,絕大多數情況是由樣本信息研究總體。由于個體存在差異,因此通過樣本推論究總體。由于個體存在差異,因此通過樣本推論總體時會存在一定的誤差,如樣本均數總體時會存在一定的誤差,如樣本均數 往往不往往不等于總體均數等
2、于總體均數 ,這種由抽樣造成的樣本均數與總,這種由抽樣造成的樣本均數與總體均數的差異稱為抽樣誤差體均數的差異稱為抽樣誤差。對于抽樣研究,抽。對于抽樣研究,抽樣誤差不可避免。樣誤差不可避免。X 二、抽樣誤差的分布二、抽樣誤差的分布 理論上可以證明:若從正態(tài)總體理論上可以證明:若從正態(tài)總體 中,反中,反復多次隨機抽取樣本含量固定為復多次隨機抽取樣本含量固定為n 的樣本,那么的樣本,那么這些樣本均數這些樣本均數 也服從正態(tài)分布,即也服從正態(tài)分布,即 的總體均的總體均數仍為數仍為 ,樣本均數的標準差為,樣本均數的標準差為 。2N( ,) XX/n抽樣分布抽樣分布 抽樣分布示意圖抽樣分布示意圖 中心極限
3、定理中心極限定理: : 當樣本含量很大的情況下,無論原始測量變量服當樣本含量很大的情況下,無論原始測量變量服從什么分布,從什么分布, 的抽樣分布的抽樣分布均均近似正態(tài)。近似正態(tài)。 X抽樣分布抽樣分布 抽樣分布示意圖抽樣分布示意圖 三、標準誤(三、標準誤(Standard ErrorStandard Error) 樣本均數的標準差稱為標準誤。樣本均數的標準差稱為標準誤。樣本均數的樣本均數的變異越小說明估計越精確,變異越小說明估計越精確,因此可以用標準誤表因此可以用標準誤表示抽樣誤差的大小:示抽樣誤差的大?。?實際中總體標準差實際中總體標準差 往往未知,故只能求往往未知,故只能求得樣本均數標準誤的
4、估計值得樣本均數標準誤的估計值 : nXXSnSSX 例例4.1 在某地隨機抽查成年男子在某地隨機抽查成年男子140人,計算得紅人,計算得紅細胞均數細胞均數4.771012/L,標準差標準差0.38 1012/L ,試計,試計算均數的標準誤。算均數的標準誤。 標準誤是抽樣分布的重要特征之一,可用于衡標準誤是抽樣分布的重要特征之一,可用于衡量抽樣誤差的大小,更重要的是可以用于參數的區(qū)量抽樣誤差的大小,更重要的是可以用于參數的區(qū)間估計和對不同組之間的參數進行比較。間估計和對不同組之間的參數進行比較。120.380.032( 10 /L)140XSSn 第二節(jié)第二節(jié) 總體均數的估計總體均數的估計 一
5、、可信區(qū)間的概念一、可信區(qū)間的概念( (Confidence IntervalConfidence Interval) 區(qū)間估計:區(qū)間估計:指按預先給定的概率,計算出一個區(qū)間,指按預先給定的概率,計算出一個區(qū)間, 使它能夠包含未知的總體均數。事先給定的概率使它能夠包含未知的總體均數。事先給定的概率 稱為可信度,通常取稱為可信度,通常取 。 參數估計參數估計點估計:不考慮抽樣誤差,如點估計:不考慮抽樣誤差,如區(qū)間估計:考慮抽樣誤差區(qū)間估計:考慮抽樣誤差195. 01X二、可信區(qū)間的計算二、可信區(qū)間的計算 (一)(一) 已知已知nXu/95. 096. 1/96. 1nXP95. 096. 196
6、. 1nXnXP)96.1 ,96.1(XXXX),(2/2/XXuXuX一般情況一般情況其中其中 為標準正態(tài)分布的雙側界值。為標準正態(tài)分布的雙側界值。 2/u 可信區(qū)間:可信區(qū)間:v 5v 1v ( )f t標準正態(tài)分布(二)(二) 未知未知 通常未知,這時可以用其估計量通常未知,這時可以用其估計量S 代替,但代替,但 已不再服從標準正態(tài)分布,而是服已不再服從標準正態(tài)分布,而是服從著名的從著名的 t 分布。分布。)/()(nSX 圖圖4-2 4-2 不同自由度的不同自由度的 t 分布圖分布圖 可信區(qū)間的計算可信區(qū)間的計算: : 計算可信區(qū)間的原理與前完全相同,僅僅是兩計算可信區(qū)間的原理與前完
7、全相同,僅僅是兩側概率的界值有些差別。即側概率的界值有些差別。即1)/()(2/)(2/tnSXtP). .()(2/)(2/XXStXStX,可信區(qū)間:可信區(qū)間: 需要注意:在小樣本情況下,應用這一公式的需要注意:在小樣本情況下,應用這一公式的條件是原始變量服從正態(tài)分布。在大樣本情況下條件是原始變量服從正態(tài)分布。在大樣本情況下(如(如n100),100),也可以用也可以用 替換替換 近似計算。近似計算。2/u2/t 例例4.2 4.2 某醫(yī)生測得某醫(yī)生測得2525名動脈粥樣硬化患者血漿名動脈粥樣硬化患者血漿纖維蛋白原含量的均數為纖維蛋白原含量的均數為3.32 3.32 g/Lg/L,標準差為
8、標準差為0.57 0.57 g/Lg/L,試計算該種病人血漿纖維蛋白原含量總體均試計算該種病人血漿纖維蛋白原含量總體均數的數的95%95%可信區(qū)間??尚艆^(qū)間。下限:下限:上限:上限:(g/L) 09. 325/57. 0064. 232. 3.)(2/XStX(g/L) 56. 325/57. 0064. 232. 3.)(2/XStX 例例4.3 4.3 試計算例試計算例4.14.1中該地成年男子紅細胞總體中該地成年男子紅細胞總體均數的均數的95%95%可信區(qū)間??尚艆^(qū)間。 本例屬于大樣本,可采用正態(tài)近似的方法計算本例屬于大樣本,可采用正態(tài)近似的方法計算可信區(qū)間。因為可信區(qū)間。因為 ,則,則
9、95%95%可可信區(qū)間為:信區(qū)間為:14038.077.4n,)L/10(71. 4140/38. 096. 177. 4.122/XSuX)L/10(83. 4140/38. 096. 177. 4.122/XSuX下限:下限:上限:上限: 三、模擬實驗三、模擬實驗 模擬抽樣成年男子紅細胞數。設定模擬抽樣成年男子紅細胞數。設定: : 產生產生100100個隨機樣本,分別計算其個隨機樣本,分別計算其95%95%的可信區(qū)間,的可信區(qū)間,結果用圖示的方法表示。從圖可以看出:絕大多數結果用圖示的方法表示。從圖可以看出:絕大多數可信區(qū)間包含總體參數可信區(qū)間包含總體參數 ,只有,只有6 6個可信區(qū)間個可
10、信區(qū)間沒有包含總體參數(用星號標記)。沒有包含總體參數(用星號標記)。14039.075.4n,754. 圖圖4-4-2 2 模擬抽樣成年男子紅細胞數模擬抽樣成年男子紅細胞數100100次的次的95%95%可信區(qū)間示意圖可信區(qū)間示意圖 )14039.075.4(n,* 第三節(jié)第三節(jié) 假設檢驗的意義和步驟假設檢驗的意義和步驟 ( (H Hypothesis ypothesis T Test)est) 統(tǒng)計推斷的另一個重要內容,目的是統(tǒng)計推斷的另一個重要內容,目的是通過樣通過樣本數據本數據比較總體參數之間有無差別。比較總體參數之間有無差別。 一、假設檢驗的基本思想一、假設檢驗的基本思想 例例4.4
11、 4.4 使用使用黑加侖油軟膠囊黑加侖油軟膠囊治療治療高脂血癥高脂血癥,3030名名高脂血癥高脂血癥患者治療前后血清甘油三酯檢測結患者治療前后血清甘油三酯檢測結果的差值為果的差值為1.381.380.76 (0.76 (g/L)g/L),問治療后血清甘問治療后血清甘油三酯是否有所改善?油三酯是否有所改善? 樣樣 本本治療前后甘油三治療前后甘油三酯的變化(差值)酯的變化(差值)d38. 1 76. 0 30dSnd?0d問題歸納:問題歸納: 樣本療效樣本療效 藥物作用藥物作用 + 機遇機遇 ?d01.38d對上面問題可以作如下考慮:對上面問題可以作如下考慮: 問題:問題: 究竟多大能夠下究竟多大
12、能夠下“有效有效”的結論?的結論?|d|0 假定治療前后血清甘油三酯檢測結果的差值服從正態(tài)分布,假定治療前后血清甘油三酯檢測結果的差值服從正態(tài)分布,若若 則則 服從服從t t 分布。分布。 根據根據 t 分布能夠計算出有如此大差異的概率分布能夠計算出有如此大差異的概率P P ,如果,如果P P 值很小,即計算出的值很小,即計算出的t t 值超出了給定的界限,則傾向于拒絕值超出了給定的界限,則傾向于拒絕H0 0,認為治療前后有差別。認為治療前后有差別。 0:0dHnSdtd/0圖圖4-4-3 3 利用利用t t 分布進行假設檢驗原理示意圖分布進行假設檢驗原理示意圖 二、假設檢驗的基本步驟二、假設
13、檢驗的基本步驟 1. 1.建立假設和確定檢驗水準建立假設和確定檢驗水準 無效假設無效假設H0 0( (null hypothesis)null hypothesis)指需要檢驗的假設,指需要檢驗的假設,備擇假設備擇假設H1 1( (alternative hypothesis)alternative hypothesis)指在指在H0 0成成立證據不足的情況下而被接受的假設。例如建立立證據不足的情況下而被接受的假設。例如建立治療前后血清甘油三酯療效的無效假設和備擇假治療前后血清甘油三酯療效的無效假設和備擇假設分別為設分別為 0:0dH0:1dH 檢驗水準檢驗水準 是預先規(guī)定的拒絕域的概率值,實
14、是預先規(guī)定的拒絕域的概率值,實際中一般取際中一般取 。 05. 0 說明說明 :備擇假設有雙側和單側兩種情況。雙側:備擇假設有雙側和單側兩種情況。雙側檢驗指不論正方向還是負方向的誤差,若顯著地超出檢驗指不論正方向還是負方向的誤差,若顯著地超出檢驗水準則拒絕檢驗水準則拒絕H0 0, 即為雙側檢驗;單側即為雙側檢驗;單側檢驗指僅在出現(xiàn)正方向或負方向誤差超出規(guī)定的水準檢驗指僅在出現(xiàn)正方向或負方向誤差超出規(guī)定的水準時則拒絕時則拒絕H0 0 ,如治療后血清甘油三酯下降的假設可如治療后血清甘油三酯下降的假設可表示為表示為 ):H :Hd1d10(或 001d:H 雙側檢驗和單側檢驗應如何選擇,需根據研究目
15、的雙側檢驗和單側檢驗應如何選擇,需根據研究目的和專業(yè)知識而定。和專業(yè)知識而定。一般情況下,雙側檢驗更為穩(wěn)妥,一般情況下,雙側檢驗更為穩(wěn)妥,因為對相同的樣本,雙側檢驗得出有顯著性差別的結因為對相同的樣本,雙側檢驗得出有顯著性差別的結論,單側檢驗也一定是顯著的。論,單側檢驗也一定是顯著的。 2.2.選擇檢驗方法和計算檢驗統(tǒng)計量選擇檢驗方法和計算檢驗統(tǒng)計量 根據資料類型、研究設計方案和統(tǒng)計推斷的目的,根據資料類型、研究設計方案和統(tǒng)計推斷的目的,選擇適當的檢驗方法,不同檢驗方法各有其相應的檢選擇適當的檢驗方法,不同檢驗方法各有其相應的檢驗統(tǒng)計量及計算公式。許多假設檢驗方法是以檢驗統(tǒng)驗統(tǒng)計量及計算公式。
16、許多假設檢驗方法是以檢驗統(tǒng)計量來命名的,如計量來命名的,如 t 檢驗、檢驗、u檢驗、檢驗、F檢驗和檢驗和 檢驗檢驗等。等。 3. 3.確定確定P P 值并做出統(tǒng)計推斷結論值并做出統(tǒng)計推斷結論 查表得到檢驗用的臨界值,然后將算得的統(tǒng)計量查表得到檢驗用的臨界值,然后將算得的統(tǒng)計量與拒絕域的臨界值作比較,確定與拒絕域的臨界值作比較,確定P 值。如對雙側值。如對雙側 t 檢檢驗驗 ,則,則 , ,按檢驗水準按檢驗水準 拒絕拒絕H0 0。 2/2()t| t |P 小小 結結 1.1.總體參數值在現(xiàn)實中通常不能獲得總體參數值在現(xiàn)實中通常不能獲得, ,而是通過而是通過隨機樣本來進行估計。由于個體存在差異,
17、因此通隨機樣本來進行估計。由于個體存在差異,因此通過樣本推論總體時會存在一定的誤差,這種由抽樣過樣本推論總體時會存在一定的誤差,這種由抽樣造成的樣本均數與總體均數的差異稱為抽樣誤差造成的樣本均數與總體均數的差異稱為抽樣誤差。抽樣誤差抽樣誤差的大小可以用標準誤進行衡量。的大小可以用標準誤進行衡量。 2. 2.參數估計有點估計和區(qū)間估計兩種方式。點估參數估計有點估計和區(qū)間估計兩種方式。點估計計的重要表達方式是平均值;的重要表達方式是平均值;區(qū)間估計是指按預先區(qū)間估計是指按預先給定的概率,計算出一個區(qū)間,使它能夠包含未知給定的概率,計算出一個區(qū)間,使它能夠包含未知的總體均數。區(qū)間的總體均數。區(qū)間越窄
18、說明估計的準確度越高。越窄說明估計的準確度越高。 3.3.總體均數可信區(qū)間的計算公式可以利用總體均數可信區(qū)間的計算公式可以利用 的的抽樣分布獲得。抽樣分布獲得。一種重要的方法是利用一種重要的方法是利用 t 分布計算分布計算區(qū)間兩端的可信限區(qū)間兩端的可信限 。單側可信區(qū)間只需單側可信區(qū)間只需將公式中的雙側界值換成單側界值將公式中的雙側界值換成單側界值。 4. 4.假設檢驗假設檢驗的的思想是,首先對所需要比較的總思想是,首先對所需要比較的總體提出一個體提出一個無差別的無差別的假設,然后通過樣本數據去推假設,然后通過樣本數據去推斷是否拒絕這一假設斷是否拒絕這一假設。其。其實質是判斷觀察到的實質是判斷觀察到的“差差別別”是抽樣誤差引起還是總體上的不同,目的是抽樣誤差引起還是總體上的不同,目的是評是評價兩個不同的參數或兩種不同處理引起效應不同的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度房地產項目資金代管代收代付服務合同
- 2025年度離婚夫妻共同子女法律權益保護協(xié)議
- 施工總體籌劃
- 施工日志填寫樣本施工過程中的質量問題與整改記錄
- 打造高效、智能的辦公環(huán)境-基于工業(yè)互聯(lián)網平臺的實踐研究
- 深度探討學術研究匯報的要點與制作技巧
- 業(yè)績達標股票期權合同范本
- 產品分銷合作合同書
- 萬科地產集團:合同管理新篇章
- 二手房交易合同樣本
- MotionView-MotionSolve應用技巧與實例分析
- 碳納米管應用研究
- 投標聲明書模板
- 運動技能學習與控制課件第十一章運動技能的練習
- 蟲洞書簡全套8本
- 2023年《反電信網絡詐騙法》專題普法宣傳
- 小學數學五年級上、下冊口算題大全
- 和平精英電競賽事
- 熱應激的防與控
- 高標準農田施工組織設計(全)
- 職業(yè)安全健康工作總結(2篇)
評論
0/150
提交評論