醫(yī)學科研中的統(tǒng)計學方法:抽樣誤差與假設檢驗_第1頁
醫(yī)學科研中的統(tǒng)計學方法:抽樣誤差與假設檢驗_第2頁
醫(yī)學科研中的統(tǒng)計學方法:抽樣誤差與假設檢驗_第3頁
醫(yī)學科研中的統(tǒng)計學方法:抽樣誤差與假設檢驗_第4頁
醫(yī)學科研中的統(tǒng)計學方法:抽樣誤差與假設檢驗_第5頁
已閱讀5頁,還剩29頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第一節(jié)

均數(shù)的抽樣誤差與標準誤第二節(jié)總體均數(shù)的估計第三節(jié)假設檢驗的意義和步驟

抽樣誤差與假設檢驗1.均數(shù)的抽樣誤差樣本均數(shù)與總體均數(shù)之間的差異或樣本均數(shù)之間的差異都是由于抽樣引起的,稱為均數(shù)的抽樣誤差影響均數(shù)的抽樣誤差大小的因素有兩個:總體內各個個體間的變異程度;樣本的含量n的大小。第一節(jié)均數(shù)的抽樣誤差與標準誤X1S1X2

S2

XISiXnSnxσμσ圖4-1均數(shù)的抽樣誤差抽樣誤差的分布

理論上可以證明:若從正態(tài)總體中,反復多次隨機抽取樣本含量固定為n的樣本,那么這些樣本均數(shù)也服從正態(tài)分布,即的總體均數(shù)仍為,樣本均數(shù)的標準差為。抽樣分布

抽樣分布示意圖

中心極限定理:

當樣本含量很大的情況下,無論原始測量變量服從什么分布,的抽樣分布均近似正態(tài)。抽樣分布

抽樣分布示意圖

2.標準誤(StandardError)

樣本均數(shù)的標準差稱為標準誤。樣本均數(shù)的變異越小說明估計越精確,因此可以用標準誤表示抽樣誤差的大?。?/p>

實際中總體標準差往往未知,故只能求得樣本均數(shù)標準誤的估計值:

例4-1測量140名正常人的空腹血糖,得試計算標準誤。標準誤是抽樣分布的重要特征之一,可用于衡量抽樣誤差的大小,更重要的是可以用于參數(shù)的區(qū)間估計和對不同組之間的參數(shù)進行比較。第二節(jié)總體均數(shù)的估計

統(tǒng)計推斷的任務就是用樣本信息推論總體特征。統(tǒng)計推斷參數(shù)估計假設檢驗參數(shù)估計:用樣本指標值(統(tǒng)計量)

估計總體指標值(參數(shù))。點估計區(qū)間估計第二節(jié)總體均數(shù)的估計

參數(shù)估計,用樣本均數(shù)估計總體均數(shù)。

1、點(值)估計(近似值)

2、區(qū)間估計(近似范圍)點估計:樣本均數(shù)作為總體均數(shù)的點估計

一、可信區(qū)間概念根據(jù)樣本均數(shù),按一定的可信度計算出總體均數(shù)很可能在的一個數(shù)值范圍,這個范圍稱為總體均數(shù)的可信區(qū)間(confidenceinterval,CI)。t

分布(tdistribution)WilliamSealeyGosset(1876.6—1937.10)圖4-2不同自由度下的t分布圖二、可信區(qū)間的計算(一)已知,或樣本數(shù)量大(n>50)一般情況其中為標準正態(tài)分布的雙側界值。

可信區(qū)間:服從標準正態(tài)分布

例4-2求例4-1中140名正常人的空腹血糖的95%與99%的區(qū)間(88.55-1.96×1.096,88.55+1.96×1.096)即:(86.40,90.70)(88.55-2.58×1.096,88.55+2.58×1.096)即:(85.72,91.38)

(二)未知通常未知,這時可以用其估計量S代替,但已不再服從標準正態(tài)分布,而是服從t分布。可信區(qū)間:t

值表(附表2,p195)橫坐標:自由度,υ

縱坐標:概率,p,即曲線下陰影部分的面積;

表中的數(shù)字:相應的|t|界值。t

值表規(guī)律:(1)自由度(υ)一定時,p與t

成反比;(2)概率(p)一定時,υ與t

成反比;例4-3

測得25名1歲嬰兒血紅蛋白均數(shù)為123.7g/L,標準差為11.9g/L。計算1歲嬰兒血紅蛋白均數(shù)的95%可信區(qū)間。查表區(qū)間估計的準確度:說對的可能性大小,用(1-)來衡量。99%的可信區(qū)間好于95%的可信區(qū)間(n,S一定時)。

區(qū)間估計的精確度:指區(qū)間范圍的寬窄,范圍越寬精確度越差。99%的可信區(qū)間差于95%的可信區(qū)間(n,S一定時)。

正常值范圍概念:絕大多數(shù)正常人的某指標范圍。(95%,99%,指絕大多數(shù)正常人)計算公式:用途:判斷觀察對象的某項指標是否正常.可信區(qū)間概念:總體均數(shù)所在的數(shù)值范圍(95%,99%指可信度)計算公式:用途:估計總體均數(shù)正常值范圍估計與可信區(qū)間估計

三、模擬實驗模擬抽樣成年男子紅細胞數(shù)。設定:

產(chǎn)生100個隨機樣本,分別計算其95%的可信區(qū)間,結果用圖示的方法表示。從圖可以看出:絕大多數(shù)可信區(qū)間包含總體參數(shù),只有6個可信區(qū)間沒有包含總體參數(shù)(用星號標記)。

圖4-2模擬抽樣成年男子紅細胞數(shù)100次的95%可信區(qū)間示意圖

******▲某事發(fā)生了:是由于碰巧?還是由于必然的原因?統(tǒng)計學家運用假設檢驗來處理這類問題。

第三節(jié)假設檢驗的意義和步驟

樣本1同一總體差異抽樣誤差引起

樣本2總體甲樣本1

差異本質不同引起(本質不同)總體乙樣本21.假設檢驗的基本原理及思想不能用抽樣誤差來解釋反證法:當一件事情的發(fā)生只有兩種可能A和B,為了肯定其中的一種情況A,但又不能直接證實A,這時否定另一種可能B,則間接的肯定了A。概率論(小概率時間):如果一件事情發(fā)生的概率很小,那么在進行一次試驗時,我們說這個事件是“不會發(fā)生的”。從一般的常識可知,這句話在大多數(shù)情況下是正確的,但是它一定有犯錯誤的時候,因為概率再小也是有可能發(fā)生的。

假設檢驗的原理/思想(1)建立假設檢驗假設或者稱無效假設(nullhypothesis),用H0表示,H0假設是假設兩總體均數(shù)相等。備擇假設(alternativehypothesis),用H1表示。

H1是與H0相反的假設,假設兩總體均數(shù)不相等。2、假設檢驗的步驟(2)確定檢驗水準檢驗水準(

)就是我們用來區(qū)分大概率事件和小概率事件的標準,是人為規(guī)定的。當某事件發(fā)生的概率小于

時,則認為該事件為小概率事件,是不太可能發(fā)生的事件。通常

取0.05或0.01。(3)計算統(tǒng)計量

根據(jù)資料類型與分析目的選擇適當?shù)墓接嬎愠鼋y(tǒng)計量,比如計算出u值或t值。

(4)確定概率值(P)將計算得到的u值或t值與查表得到u

或t

,ν,比較,得到P值的大小。根據(jù)u分布和t分布我們知道,如果|u|>u

或|t|>u

,則P<

;如果|u|<u

或|t|<u

,則P>

。(5)作出推斷結論(統(tǒng)計學結論,專業(yè)結論)如果p>

,認為在檢驗假設H0成立的條件下,得到等于或大于現(xiàn)有統(tǒng)計量u值或t值的可能性大于

,不屬于小概率事件,則不拒絕H0,差別無統(tǒng)計學意義,結論是不認為兩總體均數(shù)不相等。如果p<

,我們認為在檢驗假設H0成立的條件下,得到等于或大于現(xiàn)有統(tǒng)計量u值或t值的可能性小于

,可判斷為小概率事件,則拒絕H0,接受H1,差別有統(tǒng)計意義,結論是兩總體均數(shù)不相等,或者某一總體均數(shù)大于(或小于)另一總體均數(shù)。結果接受檢驗假設拒絕檢驗假設正確理解結

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論