定量的參數(shù)估計和假設檢驗基礎_第1頁
定量的參數(shù)估計和假設檢驗基礎_第2頁
定量的參數(shù)估計和假設檢驗基礎_第3頁
定量的參數(shù)估計和假設檢驗基礎_第4頁
定量的參數(shù)估計和假設檢驗基礎_第5頁
已閱讀5頁,還剩87頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、第四章 定量資料的參數(shù)估計和假設檢驗基礎醫(yī)學實驗班總結(jié):周璇 張思陽習題:王燕 陳芝羽本章重點中心極限定理標準誤的概念及計算均數(shù)的參數(shù)估計(置信區(qū)間與醫(yī)學參考值范圍的區(qū)別)計算題學習內(nèi)容一、抽樣誤差二、t 分布三、參數(shù)估計一、抽樣誤差抽樣誤差: 總體中個體變異的存在,在抽樣過程中產(chǎn)生的樣本統(tǒng)計量與總體參數(shù)間的差異以及樣本統(tǒng)計量與樣本統(tǒng)計量間的差異。兩種表現(xiàn)形式: 樣本統(tǒng)計量與總體參數(shù)間的差異 樣本統(tǒng)計量間的差異 產(chǎn)生的基本條件:個體變異 抽樣研究 正態(tài)總體中抽樣時樣本均數(shù)的抽樣分布特點各樣本均數(shù)未必等于總體均數(shù)(155.4cm);樣本均數(shù)之間存在差異;樣本均數(shù)的分布很有規(guī)律: 圍繞著總體均數(shù)(

2、155.4cm),中間多、兩邊少,左右基本對稱,也服從正態(tài)分布。 樣本均數(shù)的變異較之原變量的變異(5.3cm)大大縮小。 圖1 從N (155.4, 5.32)抽樣得到的樣本均數(shù)的頻數(shù)分布頻率中心極限定理(central limit theorem)從正態(tài)分布總體N (,) 中隨機抽樣(每個樣本的含量為n),可得無限多個樣本,每個樣本計算樣本均數(shù),則樣本均數(shù)也服從正態(tài)分布。樣本均數(shù)的均數(shù)為 ;樣本均數(shù)的標準差為返回目錄標準誤(standard error of mean,SEM或SE) 樣本均數(shù)的標準差,也被稱為均數(shù)的標準誤,它反映了樣本均數(shù)間的離散程度,也反映了樣本均數(shù)與總體均數(shù)間的差異,說

3、明均數(shù)抽樣誤差的大小。樣本統(tǒng)計量(均數(shù)或率)的標準差稱為標準誤。公式:在實際應用中可通過增加n來減小樣本均數(shù)的標準誤,從而降低抽樣誤差。注:S為樣本標準差,n為樣本含量。 往往不知道總體標差為均數(shù)標準誤的估計值返回目錄 =5.3cm標準誤:標準誤: 均數(shù)標準誤的應用1、表示均數(shù)抽樣誤差大小,描述(n相同)樣 本均數(shù)的離散程度,反映用樣本均數(shù)估計或推斷總體均數(shù)的可靠性; 2、與樣本均數(shù)相結(jié)合,用于估計總體均數(shù)的 置信(置信)區(qū)間 ; 3、用于進行均數(shù)的假設檢驗。表3 標準差與標準誤的區(qū)別與聯(lián)系聯(lián)系: 都是表示離散程度的指標 都與n大小有關(guān)均數(shù)的參數(shù)估計置信區(qū)間的概念總體均數(shù)置信區(qū)間的計算1、 t

4、分布法未知且樣本例數(shù)n較小時,按t分布原理。2、正態(tài)分布法(1)已知,按標準正態(tài)分布原理計算(2)未知但樣本例數(shù)n足夠大(n50)時 ,由t分布可知,自由度越大,t分布越逼近標準正態(tài)分布,按標準正態(tài)分布原理計算注:指總體標準差;n指的是樣本含量。 返回目錄置信區(qū)間(confidence interval, CI) 按(1-)的概率或置信度,估計總體參數(shù)所在范圍,稱作置信度為(1- )的置信區(qū)間。 置信區(qū)間:結(jié)合樣本統(tǒng)計量和標準誤確定,具有較大置信度( 1 )可能包含總體參數(shù)。 置信區(qū)間通常由兩個置信限構(gòu)成,其中較小者稱為下限,記為CL,較大者稱為上限,記為CU。 (CL, CU)置信度:預先給

5、定的概率( 1 )稱為可信度(置信度),常取95%或99%。若無特殊說明,一般取雙側(cè)95%。2. 兩總體均數(shù)之差的1置信區(qū)間 雙側(cè)均數(shù)參數(shù)估計的計算步驟first:看已知or未知,n與50的關(guān)系。未知,n50,t分布;已知或n50,正態(tài)分布。 計算自由度:v=n-1;查t介值表;按公式計算 :雙側(cè)置信區(qū)間表達式單側(cè)置信區(qū)間表達式t分布正態(tài)分布-za/2za/2a/2a/21.若已知2. 兩總體均數(shù)之差的1置信區(qū)間 雙側(cè)t分布的概念設從正態(tài)分布N (,2)中隨機抽取 含量為n的樣本,樣本均數(shù)和標準差 分別為 和s,則: t分布, = n 1則t值服從自由度為n-1的t分布(t-distribut

6、ion)。單峰分布,曲線以0為中心,左右對稱類似于標準正態(tài)分布。t分布的形狀與自由度有關(guān)自由度越小,則 越大,曲線越“扁平” ;自由度越大,則 越小,曲線越“瘦高” ;當自由度為無窮大時,t分布曲線與標準正態(tài)分布曲線完全吻合,故標準正態(tài)分布是t分布的特例。 雙側(cè)t0.05/2, 92.262 表明:從正態(tài)分布總體中隨機抽樣,取樣本含量n=10的樣本,則由該樣本計算的t值大于等于2.262的概率為0.025,小于等于-2.262的概率亦為0.025。 P(t-2.262)+P(t2.262)0.05 或:P(-2.262t50置信區(qū)間與醫(yī)學參考值的區(qū)別置信區(qū)間指的是平均數(shù)()落在范圍內(nèi)有( 1

7、)的可能性(往往為95%)。醫(yī)學參考值指的是個體對應的值落在范圍內(nèi)有( 1 )的可能性(往往為95%)。第五章 定量資料的t檢驗 通過假設檢驗判斷兩樣本均數(shù)之間的差異是由于抽樣誤差所致還是由于來自不同的總體所致。 1 = 2?一、假設檢驗(Hypothesis test)的基本思想2. 反證法:在假定H0(1 = 2 )成立的條件下,得出一個錯誤的結(jié)論或小概率事件,那么就有理由推翻H0,也就是說拒絕H0 ,接受H1 (1 2 ) 。3. 小概率原理(一)假設檢驗的基本步驟假設檢驗的方法很多,但其檢驗的基本步驟是一致的1、建立檢驗假設及確定檢驗水準 假設有兩種:1、檢驗假設 或 無效假設 或稱

8、零假設 (Hypothesis to be tested,null hypothesis)用H0表示;2、備擇假設(alternative hypothesis),用H1表示。H0和H1都是根據(jù)統(tǒng)計推斷的目的提出的對總體特征的假設,是相互聯(lián)系且對立的一對假設。H0和H1含義及注意事項:1、檢驗假設是針對總體,而非樣本;2、H0和H1是互相對立,不是可有可無,而是缺一不 可;3、H0無效假設,通常是某兩個或多個總體參數(shù)相同 或總體參數(shù)之差為0,或某資料服從某一分布等;4、H1的內(nèi)容反映出單側(cè)還是雙側(cè)。單側(cè)、雙側(cè)問題建立假設前,先要根據(jù)分析目的和專業(yè)知識明確單側(cè)檢驗還是雙側(cè)檢驗以及檢驗水準,不能在

9、假設檢驗結(jié)果得出后再加以選擇。兩樣本均數(shù)所代表的未知總體均數(shù)1與2 的比較目 的 H0H1雙側(cè)檢驗1 = 2 ?1 = 2 1 2單側(cè)檢驗1 2 ?1 = 2 1 2 1 2 ?1 = 2 1 2 檢驗水準(size of a test)符號為;也稱顯著性水準(significance level);是預先規(guī)定的概率值,它確定了小概率事件的標準。一般常取0.05或0.01;方差齊性檢驗與正態(tài)性檢驗時常取0.10或0.20; 存在單、雙側(cè)問題 2、選定檢驗方法及計算檢驗統(tǒng)計量 不同分析目的、不同設計類型和不同資料類型,選用不同檢驗方法。樣本均數(shù)與總體均數(shù)比較用單樣本t檢驗t值 3、 確定P 值,

10、作出統(tǒng)計推斷 算出樣本統(tǒng)計量t值后,查相應的t界值表,確定P 值選擇檢驗方法的根據(jù)是什么?根據(jù)實驗設計類型,選擇檢驗方法實驗設計 數(shù)據(jù)類型 檢驗方法完全隨機設計(二樣本)、多樣本配對設計、配伍組設計t 分布的發(fā)現(xiàn)使小樣本統(tǒng)計推斷成為可能;以t 分布為基礎的檢驗稱為t 檢驗;t 檢驗的主要類型:單組樣本資料的t 檢驗配對設計資料的t 檢驗兩組獨立樣本資料的t 檢驗二 、t 檢驗第一節(jié) 單組樣本t檢驗(One sample t test)適用于樣本均數(shù)與已知總體均數(shù)0的比較,其比較目的是檢驗樣本均數(shù)所代表的總體均數(shù)是否與已知總體均數(shù)0有差別。已知總體均數(shù)0一般為標準值、理論值或經(jīng)大量觀察得到的較穩(wěn)

11、定的指標值。單樣t檢驗的應用條件是總體標準差未知的小樣本資料(如nt,則P。同時減小型錯誤和型錯誤,唯一的方法就是增加樣本含量n 型錯誤與型錯誤示意圖 (以單側(cè)u檢驗為例) 樣本量一定時,愈小,愈大1a即可信度(confidence level):重復抽樣時,樣本區(qū)間包含總體參數(shù)的可能性;1-稱為檢驗效能(power of a test),也稱把握度,意義為,當兩總體確有差別,按檢驗水準,假設檢驗能發(fā)現(xiàn)其差別(拒絕H0)的能力。注意事項 1. 假設檢驗結(jié)論正確的前提是樣本資料必須能代表相應的總體,同時各對比組具有良好的組間均衡性,即各組間除了要比較的主要因素不相同外, 其它影響結(jié)果的因素應盡可

12、能相同或基本相近。為了保證資料的可比性,嚴密的試驗設計隨機抽樣,隨機分組 2. 檢驗方法的選用及其適用條件,應根據(jù)分析目的、研究設計、資料類型、樣本量大小等選用適當?shù)臋z驗方法。 t 檢驗是以正態(tài)分布為基礎的,資料的正態(tài)性可用正態(tài)性檢驗方法檢驗予以判斷。若資料為非正態(tài)分布,可采用數(shù)據(jù)變換的方法,嘗試將資料變換成正態(tài)分布資料后進行分析。3.正確理解差別有無顯著性的統(tǒng)計學意義 對假設檢驗結(jié)論中的“拒絕H0,接受H1”稱為“有統(tǒng)計學意義”;“不拒絕H0”稱為“無統(tǒng)計學意義”。不應把“有統(tǒng)計學意義”誤解為差別很大,甚至在醫(yī)學實踐中有重要的價值;同理,也不應把“無統(tǒng)計學意義”誤解為差別不大,或一定相等。拒

13、絕H0,可能產(chǎn)生I型錯誤;不拒絕H0,可能產(chǎn)生II型錯誤。另外,是否拒絕H0不僅決定于被研究事物有無本質(zhì)差異,還決定于抽樣誤差大小、檢驗水準的高低以及單側(cè)、雙側(cè)檢驗,樣本例數(shù)。 4. 結(jié)論不能絕對化 假設檢驗的結(jié)論是根據(jù)P值大小 作出的,不是百分之百的正確。5. 上述檢驗方法應用條件t檢驗的應用條件:未知且n較小時,要求樣本來自正態(tài)分布總體;兩樣本均數(shù)比較時,還要求兩樣本所屬總體的方差相等。但在實際工作中,與上述條件略有偏離時,也可應用。 u檢驗的應用條件:已知或未知但n足夠大(如n100)。6.假設檢驗和可信區(qū)間的關(guān)系 假設檢驗用以推斷總體均數(shù)間是否相同,而可信區(qū)間則用于估計總體均數(shù)所在的范

14、圍。方差分析基本思想:把全部觀察值的不同(即總變異)按設計和需要分解成兩個或多個部分,不同設計中總變異的分解各有不同,其中一定包括隨機誤差,將其他部分的變異分別于隨機誤差進行比較,從而判斷均數(shù)間的差別是否具有統(tǒng)計學意義。主要包括總變異,組間變異和組內(nèi)變異。第六章 定量資料的方差分析本章重點完全隨機設計資料方差分析要求:掌握基本步驟,能看懂相關(guān)表格。可能題型:計算題(詳見P63例題)有大量計算的概率:較低60 是采用完全隨機化的分組方法,將全部試驗對象分配到g個處理組(水平組),各組分別接受不同的處理,試驗結(jié)束后比較各組均數(shù)之間的差別有無統(tǒng)計學意義,推論處理因素的效應。完全隨機設計 (compl

15、etely random design)61統(tǒng)計分析方法選擇:1. 對于正態(tài)分布且方差齊同的資料,常采用完全隨機設計的單因素方差分析(one-way ANOVA)或成組資料的 t 檢驗(g=2);2. 對于非正態(tài)分布或方差不齊的資料,可進行數(shù)據(jù)變換或采用Wilcoxon秩和檢驗。方差分析的應用條件各樣本是相互獨立的隨機樣本各樣本來自正態(tài)分布各樣本方差相等,即方差齊。 例:某醫(yī)生為了研究一種降血脂新藥的臨床療效,按統(tǒng)一納入標準選擇120名高血脂患者,采用完全隨機設計方法將患者等分為4組,進行雙盲試驗。6周后測得低密度脂蛋白作為試驗結(jié)果,見表3。問4個處理組患者的低密度脂蛋白含量總體均數(shù)有無差別?

16、建立假設,確定檢驗水準 H0:1=2=3 =4 H1:各總體均數(shù)不等或不全相等 0.0566記總均數(shù)為 ,各處理組均數(shù)為 ,總例數(shù)為Nnl+n2+ng,g為處理組數(shù)。 計算總的離均差平方和:SS總 即所有病例混合后,每個病例與總的均數(shù)相減后求離均差平方和。 總=N-167其中:將總的變異分解為誤差導致的變異和其他因素導致的變異。SS總 SS誤差SS其他因素。 SS誤差:由于某個 組內(nèi)的病例的均有同樣的非隨機因素(都吃同一種藥),所以組內(nèi)病例間的差別就之剩下隨機誤差導致的變異了。 所以SS誤差等于每組內(nèi)的離均差平方和,然后各組相加。將SS誤差稱為SS組內(nèi)。組內(nèi)=(ni-1)gNgSS其他因素:這

17、里只有一個非隨機因素分組因素,即服藥不同, 故SS其他因素可以稱為SS組間。由于每組的差異可能是由于服藥不同而引起。所以用每組的均數(shù)減總的均數(shù)的平方乘以組例數(shù),再將每組加起來。 組間=g-1 均方差,均方(mean square,MS)。 三者之間的關(guān)系SS總= SS組內(nèi)+ SS組間總= 組內(nèi)+ 組間4、計算 (SS組間/1) _ (SS組內(nèi)/ 2) F= (MS組間)/(MS組內(nèi))5、根據(jù)P值進行推斷 計算出統(tǒng)計量F,求出對應的P值,與進行比較,以確定是否為小概率事件。 如是小概率事件,則MS組間MS組內(nèi)的可能性不大,則說明組間因素,即服用不同的降血脂藥降血脂的效果是不同的。詳細解答過程73

18、完全隨機設計方差分析表列方差分析表用t檢驗與方差分析處理資料的區(qū)別比較內(nèi)容 t檢驗 方差分析資料的利用率 低:每次僅用兩組 高:每次要用全部數(shù)據(jù)對原實驗設計的影響 殘:割裂了整體設計 全:與原實驗設計相呼應犯假陽性錯誤的概率 大:1-(1-0.05)6 =0.265 小:0.05結(jié)論的可靠性 低:統(tǒng)計量的自由度小 高:統(tǒng)計量的自由度大 注意: 三組或三個組以上設計的完全隨機設計均數(shù)進行比較時不可用t檢驗!隨機區(qū)組設計資料的方差分析隨機區(qū)組設計(randomized block design),又稱配伍組設計。是雙因素設計的方差分析,使用多因素方差分析的方法。實驗設計中常按影響試驗結(jié)果的非處理因

19、素(如性別、體重、窩別等)配成區(qū)組(block),再將區(qū)組內(nèi)的受試對象隨機分配到各組。該法統(tǒng)計檢驗效能較高。缺點是較繁瑣。變異之間的關(guān)系:SS總= SS誤差+ SS組間+ SS區(qū)組間總= 誤差+ 組間+區(qū)組間離均差平方和與自由度的分解SS誤差=SS總- SS組間-SS區(qū)組間誤差=總-組間-區(qū)組間MS區(qū)組=SS區(qū)組/v區(qū)組 MS誤差=SS誤差/v誤差基本步驟1. 建立假設(設有三個處理組,五個區(qū)組) 處理組間:H0: 3個總體均數(shù)全相等 H1: 3個總體均數(shù)不全相等 區(qū)組間: H0: 五個總體均數(shù)全相等 H1: 五個總體均數(shù)不全相等2. 確定檢驗水準 0.053. 分解方差,計算F值4. 用F值進行統(tǒng)計推斷,得到P值分析思路 隨機區(qū)組設計總變異: 處理組間變異 (1) (1) 與 (3) 比較 區(qū)組間變異 (2) (2) 與 (3) 比較 誤差變異 (3)解決問題: 1、處理因素引起的變異有無顯著性 2、

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論