




已閱讀5頁,還剩83頁未讀, 繼續(xù)免費閱讀
版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1,計量資料的統(tǒng)計推斷 總體均數(shù)的估計 與假設檢驗,2,均數(shù)的抽樣誤差與標準誤 t 分布 總體均數(shù)的估計 t 檢驗 假設檢驗的注意事項,講課內(nèi)容,3,第一節(jié) 均數(shù)的抽樣誤差與標準誤,4,了解總體特征的最好方法是對總體的每一 個體進行觀察、試驗,但這在醫(yī)學研究實 際中往往不可行。 對無限總體不可能對所有個體逐一觀察, 對有限總體限于人力、財力、物力、時間 或個體過多等原因,不可能也沒必要對所 有個體逐一研究(如對一批罐頭質(zhì)量檢查)。 借助抽樣研究。,5,欲了解某地18歲男生身高值的平均水平, 隨機抽取該地10名男生身高值作為樣本。 由于個體變異與抽樣的影響,抽得的樣本 均數(shù)不太可能等于總體均數(shù),造成樣本統(tǒng) 計量與總體參數(shù)間的差異(表現(xiàn)為來自同一 總體的若干樣本統(tǒng)計量間的差異),稱為抽 樣誤差。 抽樣誤差是不可避免的。 抽樣誤差是有規(guī)律的。,6,1999年某市18歲男生身高值 XiN(, 2) =167.7cm =5.3cm,7,樣本均數(shù)抽樣分布具有如下特點:,各樣本均數(shù)未必等于總體均數(shù) 各樣本均數(shù)間存在差異 樣本均數(shù)圍繞 =167.69cm呈正態(tài)分布 樣本均數(shù)變異度( )較原總體個 體值變異度( = 5.3cm)大大縮小,8,9,中心極限定理(central limit theorem),從均數(shù)為、標準差為的總體中獨立隨機抽樣,當樣本含量n較大時, 樣本均數(shù)的分布將趨于正態(tài)分布 此分布的均數(shù)為,標準差為,10,中心極限定理(central limit theorem),若 X i 服從正態(tài)分布 則 服從正態(tài)分布 若 X i 不服從正態(tài)分布 n大(n60):則 近似服從正態(tài)分布 n小(n60):則 為非正態(tài)分布,11,樣本統(tǒng)計量的標準差稱標準誤 (standard error, SE) 樣本均數(shù)的標準差稱均數(shù)的標準誤 (standard error of mean, SEM),12,標準差與標準誤的區(qū)別,13,第二節(jié) t 分布,14,1908年,英國統(tǒng)計學家 W.S.Gosset 以筆名“Student”在Biometrics雜志上發(fā)表論文,首次提出t分布概念,后人又稱Students t-distribution,開創(chuàng)了小樣本統(tǒng)計推斷的新紀元,被認為是統(tǒng)計學發(fā)展史上的里程碑之一。,15,t 分布的概念,16,t分布的圖形與特征 t分布為一簇單峰分布曲線,不同,曲線 形狀不同 t分布以0為中心,左右對稱 t分布與有關, 越小, t值越分散,t分 布的峰部越低,而兩側(cè)尾部翹得越高 當逼近, 逼近 ,t分布逼近u分布,f(t), =(標準正態(tài)曲線), =5, =1,0.1,0.2,-4,-3,-2,-1,0,1,2,3,4,0.3,自由度分別為1、5、時的t分布,t 值,19,t分布曲線下面積與橫軸t值間關系(附表3),t界值表中一側(cè)尾部面積稱單側(cè)概率 () 兩側(cè)尾部面積之和稱雙側(cè)概率(/2) t0.05/2,9=2.262 , t0.05,9=1.833 在相同自由度時, 值增大,減小 在相同 時,單尾 對應的t值比雙尾 的小,20,t0.05/2,9=2.262,t0.05,9=1.833,22,第三節(jié) 總體均數(shù)的估計,23,一、可信區(qū)間的概念,參數(shù)估計是用樣本統(tǒng)計量推斷總體參數(shù)。 有點估計和區(qū)間估計兩種。,點估計是用樣本統(tǒng)計量直接估計其總體參 數(shù)值。如用 估計、S估計等。 方法雖簡單,但未考慮抽樣誤差大小。,區(qū)間估計是按預先給定的概率(1 ),確定 一個包含總體參數(shù)的范圍。該范圍稱為參數(shù) 的可信區(qū)間(confidence interval, CI),24,預先給定的概率(1)稱為可信度 (confidence level),常取95%或99%。,25,二、總體均數(shù)可信區(qū)間的計算,1、未知 按t分布原理 2、已知或未知但n足夠大(如n60) 按u分布原理,26,雙側(cè),1、未知,27,故該地18歲男生身高均數(shù)的 95%可信區(qū)間為(164.35, 169.55)cm。 =167.7cm 雙尾,例 在例3-1中抽得第15號樣本的 =166.95(cm),S=3.64(cm), 求其總體均數(shù)的95%可信區(qū)間。,166.952.2621.1511=164.35169.55(cm),28,雙側(cè),2、已知或未知但n足夠大:,29,例 某地抽取正常成年人200名,測得其血清膽固醇均數(shù)為3.64 mmol/L,標準差為1.20mmol/L,估計該地正常成年人血清膽固醇均數(shù)95%可信區(qū)間。,30,三、可信區(qū)間的確切含義,從1999年某市18歲男生身高值總體 N(=167.7cm, =5.3cm)中隨機抽取100個樣本計算了100個估計的95%CI 其中有95個CI包含了 有5個不包含 =167.7cm 20號 161.00165.57 31號 161.17167.33 54號 168.05171.00 76號 167.71174.84 82號 167.98174.27,來自N(0,1)的100個樣本所計算的95%可信區(qū)間示意,32,正確性:可信度1,即區(qū)間包含總體參數(shù) 的理論概率大小,愈接近1愈好。 精確性:區(qū)間的寬度,區(qū)間愈窄愈好。 當樣本含量為定值時,上述兩者互相矛盾。 若只顧提高可信度,則可信區(qū)間會變寬。,評價可信區(qū)間估計的優(yōu)劣:,33,四、可信區(qū)間與參考值范圍的區(qū)別,可信區(qū)間用于估計總體參數(shù),總體參數(shù)只 有一個 。 參考值范圍用于估計個體值的分布范圍, 個體值有很多 。,95%可信區(qū)間中的95%是可信度,即所求可 信區(qū)間包含總體參數(shù)的可信程度為95%。 95%參考值范圍中的95%是一個比例,即 所求參考值范圍包含了95%的正常人。,34,第四節(jié) t 檢驗,35,例 某醫(yī)生測量了36名從事鉛作業(yè)男性工人的血紅蛋白含量,算得其均數(shù)為130.83g/L,標準差為25.74g/L。問從事鉛作業(yè)工人的血紅蛋白是否不同于正常成年男性平均值140g/L?,樣本均數(shù)與總體均數(shù)間差異的原因: 1.總體均數(shù)不同? 2.總體均數(shù)相同,差異由抽樣誤差造成?,統(tǒng)計推斷方法 假設檢驗(hypothesis test),36,1.進行檢驗假設 假設樣本來自某一特定總體 2.確定檢驗水準 確定最大允許誤差 3.選定檢驗方法計算檢驗統(tǒng)計量 計算樣本與總體的偏離程度 4.計算與統(tǒng)計量對應的P值 5.作出結(jié)論 根據(jù)小概率反證法思想作出推斷,假設檢驗一般步驟,37,t 檢驗(Students t-test) 設計 完全隨機設計單樣本 完全隨機設計兩樣本 配對設計 要求 1.n較小(單組60或兩組合計60) 2.樣本隨機地取自正態(tài)總體 3.兩樣本均數(shù)比較時所對應兩總體 方差相等(homogeneity of variance),38,例 某醫(yī)生測量了36名從事鉛作業(yè)男性工人的血紅蛋白含量,算得其均數(shù)為130.83g/L,標準差為25.74g/L。問從事鉛作業(yè)工人的血紅蛋白是否不同于正常成年男性平均值140g/L?,一、單樣本t 檢驗,1.建立檢驗假設,確定檢驗水準 H0: =0=140g/L 鉛作業(yè)男性工人的平均血紅蛋 白含量與正常成年男性的相等 H1: 0 =0.05,39,2.計算檢驗統(tǒng)計量,3.確定P值,作出推斷結(jié)論 |2.138| t0.05/2,35=2.030 P 0.05 按=0.05水準,拒絕H0,接受H1,有統(tǒng)計學意義??烧J為從事鉛作業(yè)男性工人的平均血紅蛋白含量低于正常成年男性的。,-2.030,2.030,0, =35,0.025,0.025,t0.05/2,35=2.030 P ( |t| 2.030 )=0.05,t 值,41,二、配對樣本t 檢驗(paired t-test) -變量為配對兩組之差的d,配對設計 兩同質(zhì)受試對象分別接受兩種不同處理 同一受試對象分別接受兩種不同處理 前后測量設計 同一受試對象分別前后接受一種處理,42,43,1.建立檢驗假設,確定檢驗水準 H0:d =0,兩種方法的測定結(jié)果相同 H1:d0, =0.05,2.計算檢驗統(tǒng)計量,44,3.確定 P 值,作出推斷結(jié)論 t=7.925t0.001/2,9=4.781 P0.001 按=0.05水準,拒絕H0,接受H1,有統(tǒng)計學意義。兩種方法對脂肪含量的測定結(jié)果不同,哥特里羅紫法測定結(jié)果較高。,45,三、兩樣本t 檢驗(two sample t-test),1.總體方差相等的 t 檢驗,46,研究目的:阿卡波糖膠囊降血糖效果 試驗設計:同期隨機對照試驗 受試對象:40名II型糖尿病病人 試驗組:阿卡波糖膠囊 對照組:拜唐蘋膠囊 觀測指標:試驗8周后空腹血糖下降值,(1)建立檢驗假設,確定檢驗水準 H0:1=2 H1:1 2 =0.05,47,(2)計算檢驗統(tǒng)計量,=n1+n22=(20+201)=38,48,按=0.05 水準,不拒絕H0,無統(tǒng)計學意義。還不能認為阿卡波糖膠囊與拜唐蘋膠囊對降低II型糖尿病病人空腹血糖的效果不同。,(3)確定P值,作出推斷結(jié)論,49,2.總體方差不相等的 t 檢驗 數(shù)據(jù)變換后進行t 檢驗 秩轉(zhuǎn)換的非參數(shù)檢驗(第8章) 近似t檢驗 t檢驗,50,Cochran & Cox法(1950) 對臨界值校正 Satterthwaite法(1946) 對自由度校正 Welch法(1947) 對自由度校正,t檢驗,51,1.單樣本u檢驗 適用于n較大(n60)或0已知時,四、u 檢驗,52,2.兩樣本u 檢驗 適用于兩樣本含量較大(n1+n260),53,t檢驗與u檢驗區(qū)別,公式 查表 與n關系 計算精度 t檢驗 較復雜 需 無關 精確 u檢驗 簡單 否 n較大 近似,54,第五節(jié) 兩均數(shù)的等效檢驗,equivalence test for two means,55,例 研究某新藥對高血脂患者膽固醇的降低作用是否相同于標準藥物, 設定等效界值=0.52mmol/L 即 就認為兩藥物等效,56,(1)建立檢驗假設,確定檢驗水準 H0: 兩藥物不等效 H1: 兩藥物等效 =0.05,57,(2)計算檢驗統(tǒng)計量, =n1+n2 2=102+100 2=200,58,t=3.569t0.001/2,200=3.340 P 0.001。 按=0.05水準, 拒絕H0,接受H1,有統(tǒng)計學意義。 新藥與標準藥物對降低膽固醇的療效相同,(3)確定P 值,作出推斷結(jié)論,59,值須在等效試驗前根據(jù)專業(yè)知識予以確定,應用等效檢驗的注意事項,研究者可把專業(yè)上或公認有臨床實際意義的差值作為等效界值 。如: 血壓 值為0.67kPa(5mmHg), 膽固醇 值為0.52mmol/L(20mg/dl), 白細胞 值為0.5 109/L(500個/mm3)。 難以確定時可用0.20.5倍標準差作為參考,H0: T C H1: T C ,雙單側(cè)檢驗假設H1同時成立,才認為等效,T試驗藥 C對照藥,H0: T C H1: T C ,61,第六節(jié) 假設檢驗的注意事項,62,反證法 根據(jù)研究目的建立假設H0,先假設H0是正確的,再分析樣本提供的信息是否支持H0,即在H0成立的條件下計算檢驗統(tǒng)計量,獲得相應P值,根據(jù)P值大小來判斷。 小概率事件原理 小概率事件(P0.05)在一次抽樣中發(fā)生的可能性很小,如果它發(fā)生了,則有理由懷疑H0的正確性,認為H1成立,該結(jié)論可能犯5%的錯誤。,一、假設檢驗的基本思想,63,1.建立檢驗假設,確定檢驗水準 (1) H0 零假設(null hypothesis) (2) H1 備擇假設(alternative hypothesis) (3) 檢驗水準(size of a test),二、假設檢驗的基本步驟,針對總體而不是針對樣本而言 H0:某兩個總體參數(shù)相等,僅一種情況 H1: 某兩個總體參數(shù)不等,有多種情況 H0與H1的內(nèi)容不能互換,否則無法決定 拒絕多種情況中的哪一種情況,64,H0: 1= 2 H1: 1 2 或 1 2 單側(cè)檢驗 H0: 1= 2 H1: 1 2 雙側(cè)檢驗。 單雙側(cè)檢驗主要根據(jù)專業(yè)知識預先確定。 雙側(cè)檢驗較保守和穩(wěn)妥。 檢驗水準:預先規(guī)定的拒絕假設H0時的最 大允許誤差,它確定了小概率事件標準。 在實際工作中常取0.05,但并非一成不變。,65,應根據(jù)變量和資料類型、設計方案、統(tǒng) 計推斷的目的、方法的適用條件等選擇 檢驗統(tǒng)計量。 所有檢驗統(tǒng)計量都是在H0成立的前提條 件下計算出來的。 檢驗統(tǒng)計量大小反映樣本與總體的偏離 程度(如t值反映樣本均數(shù)與總體均數(shù) 的偏離程度,以標準誤進行標準化),2.計算檢驗統(tǒng)計量,66,P值是決策的依據(jù) P的含義是指從H0規(guī)定的總體中隨機抽樣, 其檢驗統(tǒng)計量等于及大于現(xiàn)有樣本的檢驗 統(tǒng)計量的概率。即從H0假設總體中隨機抽 到差別至少等于現(xiàn)有樣本差別的機會。 根據(jù)獲得的事后概率P,與事先規(guī)定的 概率檢驗水準進行比較,看其是否為 小概率事件而得出結(jié)論。,3.確定P 值,作出推斷結(jié)論,67,P,按檢驗水準,拒絕H0,接受H1 有統(tǒng)計學意義(統(tǒng)計結(jié)論) statistical significance 可認為不同,高于(專業(yè)結(jié)論) P,按檢驗水準,不拒絕H0 無統(tǒng)計學意義(統(tǒng)計結(jié)論) no statistical significance 還不能認為不同(專業(yè)結(jié)論) 不拒絕H0不等于接受H0,因此時證據(jù)不足,68,三、I型錯誤和II型錯誤,大,?。淮?,小。增加n可同時縮小,。,70,可取單尾亦可取雙尾。 II型錯誤的概率大小用表示, 只取單尾, 值的大小一般未知,須在知道兩總體差值 (如12等)、及n 時,才能算出。 1稱檢驗效能(power of a test),過去稱把 握度。為當兩總體確有差異,按檢驗水準 所能發(fā)現(xiàn)該差異的能力。1只取單尾。 拒絕H0,只可能犯I型錯誤,不可能犯II型 錯誤;不拒絕H0,只可能犯II型錯誤,不 可能犯I型錯誤。,71,四、假設檢驗應注意的問題,1.要有嚴密的研究設計 組間應均衡,具有可比性,除對比的主要因素(如臨床試驗用新藥和對照藥)外,其它可能影響結(jié)果的因素(如年齡、性別、病程、病情輕重等)在對比組間應相同或相近。,72,配對設計計量資料:配對t檢驗。 完全隨機設計兩樣本計量資料: 小樣本(任一ni60)且方差齊: 兩樣本t檢驗 方差不齊: 近似t檢驗 大樣本(所有ni60): u檢驗。,2.不同資料應選用不同檢驗方法,73,3.正確理解“significance”一詞的含義 過去稱差別有或無“顯著性”,易造成兩 樣本統(tǒng)計量之間比較相差很大的誤解。 現(xiàn)在稱差別有或無“統(tǒng)計學意義”, 相應推斷為:可以認為或還不能認為兩 個或多個總體參數(shù)有差別。,74,4.結(jié)論不能絕對化 因統(tǒng)計結(jié)論具有概率性質(zhì),故“肯定”、 “一定”、“必定”等詞不要使用。 在報告結(jié)論時,最好列出檢驗統(tǒng)計量的 值,盡量寫出具體P值,而不簡單寫成 P0.05,以便讀者與同類研究進行比 較或進行循證醫(yī)學時采用Meta分析。,75,5.統(tǒng)計“有意義”與醫(yī)學“有意義” 統(tǒng)計“有意義”對應統(tǒng)計結(jié)論,醫(yī)學“有意 義”對應專業(yè)結(jié)論。 統(tǒng)計結(jié)論有意義,專業(yè)結(jié)論無意義,最終 結(jié)論沒有意義,樣本含量過大或設計存在 問題。 統(tǒng)計結(jié)論無意義,專業(yè)結(jié)論有意義,檢查 設計是否合理、樣本含量是否足夠。,76,6.可信區(qū)間與假設檢驗區(qū)別和聯(lián)系,可信區(qū)間可回答假設檢驗問題 H0: =0=140g/L 鉛作業(yè)男性工人的平均血紅蛋 白含量與正常成年男性的相等 H1: 0 =0.05 鉛作業(yè)男性工人平均血紅蛋白含量總體 均數(shù)的95%CI為(122.12,139.54) g/L, 未包括0=140g/L 按=0.05水準,拒絕H0 ,接受H1。,77,可信區(qū)間說明量的大小即推斷總體均數(shù) 所在范圍,假設檢驗推斷質(zhì)的不同即判 斷兩總體均數(shù)是否不等。 可信區(qū)間不但能回答差別有無統(tǒng)計學意 義,還能提示差別有無實際專業(yè)意義。 可信區(qū)間不能夠完全代替假設檢驗。可 信區(qū)間只能在預先規(guī)定概率的前提下 進行計算,而假設檢驗能獲得一較為確 切的P值。,78,第七節(jié) * 正態(tài)性檢驗 和兩樣本方差比較的F檢驗,79,兩小樣本t 檢驗前提條件: 相應的兩總體為正態(tài)總體 兩總體方差相等,即方差齊性 配對t 檢驗前提條件: 每對數(shù)據(jù)差值的總體為正態(tài)總體,80,一、正態(tài)性檢驗(了解),1.圖示法 概率圖(probability-probability plot) 以實際累積頻率(X)對正態(tài)分布理論累積頻率(Y)作散點圖 分位數(shù)圖(quantile-quantile plot) 以實際分位數(shù)(X)對正態(tài)分布理論分位數(shù) ( )作散點圖 如果實際值與理論值吻合,圖中散點幾乎都在一直線上,可認為該資料服從正態(tài)分布,8
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 高考數(shù)學知識運用試題及答案
- 江西省鷹潭市2025屆高三下學期一模試題 地理 含解析
- 家庭廚房燃氣火災應急預案(3篇)
- 幼兒園火災-應急預案(3篇)
- 軟件設計中的敏捷實踐與團隊協(xié)作創(chuàng)新試題及答案
- 《教育統(tǒng)計與測量評價新編教程》課件-教育統(tǒng)計與測量評價新編教程-第05章
- 計算機網(wǎng)絡基礎知識在實務中的應用試題及答案
- 技術文檔的重要性與撰寫技巧試題及答案
- 發(fā)展新興市場的風險管理策略試題及答案
- 行政法學技術應用試題與答案
- 晚期胃癌護理
- 造謠調(diào)解協(xié)議書范本
- 眩暈護理課件
- 《集成電路基礎及其應用》課件
- 2020 年全國碩士研究生入學統(tǒng)一考試英語 ( 一) 試題
- DB64 2115-2024 精神障礙患者康復服務指南
- 2025屆江蘇省南通市三模(蘇北八市)高三第三次調(diào)研測試 歷史試題(含答案)
- 形勢與政策(2025春)超星爾雅學習通答案滿分章節(jié)測試
- ISO28000:2022供應鏈安全管理體系
- 深圳市失業(yè)人員停止領取失業(yè)保險待遇申請表樣表
- 最新部編版九年級語文下冊課件(完美版)寫作布局謀篇
評論
0/150
提交評論