計數(shù)的統(tǒng)計分析演示文稿課件_第1頁
計數(shù)的統(tǒng)計分析演示文稿課件_第2頁
計數(shù)的統(tǒng)計分析演示文稿課件_第3頁
計數(shù)的統(tǒng)計分析演示文稿課件_第4頁
計數(shù)的統(tǒng)計分析演示文稿課件_第5頁
已閱讀5頁,還剩111頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、計數(shù)的統(tǒng)計分析演示文稿課件計數(shù)的統(tǒng)計分析演示文稿課件95% 可信區(qū)間CI*5個CI不包含總體均數(shù)95個CI包含總體均數(shù)95% 可信區(qū)間CI*5個CI不包含總體均數(shù)95個CI包含總可信區(qū)間估計的優(yōu)劣取決兩個方面:準確度:1,即區(qū)間包含的理論概率大小,愈接近1愈好。精度:區(qū)間的寬度,區(qū)間愈窄愈好。精度:可信上限與可信下限間的寬度;與準確度、樣本量、標準差大小有關(guān)??尚艆^(qū)間估計的優(yōu)劣取決兩個方面:精度:可信上限與可信下限間的可信區(qū)間(CI)能提供更多的推斷信息:區(qū)間范圍是否包括總體參數(shù)(總體參數(shù)差值),若不包括,表明差別無統(tǒng)計學意義;同時能顯示差別的程度及臨床意義;可信區(qū)間CI不能提供確切概率,假設

2、檢驗提供P值。 因此,統(tǒng)計推斷結(jié)果的表達:P值與可信區(qū)間相結(jié)合,同時報告。可信區(qū)間(CI)能提供更多的推斷信息:2、數(shù)值變量資料可信區(qū)間的分類單個總體均數(shù)的估計兩個總體均數(shù)差值的估計:基于兩組比較t檢驗的可信區(qū)間基于方差分析兩兩比較的可信區(qū)間2、數(shù)值變量資料可信區(qū)間的分類單個總體均數(shù)的估計兩兩比較及計算效應量的95%可信區(qū)間 藥物因素(不同藥物):兩兩比較的q檢驗及其均數(shù)差值的95%可信區(qū)間。兩兩比較及計算效應量的95%可信區(qū)間 藥物因素(不同藥1、應考慮統(tǒng)計推斷的概率性 假設檢驗結(jié)論的概率性,應注意I/II型錯誤;在報告結(jié)論時,最好列出檢驗統(tǒng)計量的值,盡量寫出具體的P值或P值的確切范圍,而不

3、簡單寫成P0.05,以便讀者與同類研究比較或進行Meta分析之用。三)統(tǒng)計推斷結(jié)果的綜合評價1、應考慮統(tǒng)計推斷的概率性 假設檢驗結(jié)論的概率性,II型錯誤與檢驗效能檢驗效能又稱把握度、功效,用1-表示( 為II型錯誤概率):是指事實上當兩總體確有差異,按檢驗水準所能發(fā)現(xiàn)該差異的能力 。檢驗效能為0.8,指做100次假設檢驗,有80次能檢驗出有差別。II型錯誤與檢驗效能檢驗效能又稱把握度、功效,用1-表示(檢驗效能的影響因素實際組間差異(效應量)的大小;研究對象個體間的標準差大??;I型錯誤率大小;樣本含量大?。褐攸c考察檢驗效能的影響因素實際組間差異(效應量)的大小;3、應圍繞研究本身全面考慮,再下

4、結(jié)論 從研究設計、抽樣等全面評估結(jié)果。如樣本代表性,有無可能出現(xiàn)系統(tǒng)偏差等。樣本均數(shù)x總體均數(shù)?抽樣誤差系統(tǒng)誤差3、應圍繞研究本身全面考慮,再下結(jié)論 從研究設計、抽樣4、專業(yè)結(jié)論同樣不能絕對化因統(tǒng)計結(jié)論具有概率性質(zhì),專業(yè)結(jié)論同樣不要使用“肯定”、“一定”、“必定”等詞匯。 4、專業(yè)結(jié)論同樣不能絕對化因統(tǒng)計結(jié)論具有概率性質(zhì),專業(yè)結(jié)論同計數(shù)(分類變量)資料的統(tǒng)計分析第三講計數(shù)(分類變量)資料的統(tǒng)計分析第三講計數(shù)資料的分類無序分類: 二項或二分類:對立、不相容的兩類。 如療效:病死與未愈等。 多項或多分類:互不相容的多類。 如血型、疾病分型、種族等有序分類:類間不相容且有程度差別。 如療效:痊愈、顯

5、效、好轉(zhuǎn)、無效。特點:無度量衡單位;定性測量計數(shù)資料的分類無序分類:特點:無度量衡單位;定性測量臨床研究中計數(shù)資料來源、分類本身設置為分類變量(PI/ECOS)計量資料轉(zhuǎn)化而來: 如評價降壓療效時,將舒張壓降低值分為三類: 5mmHg 無效 5-10mmHg 有效 10-20mmHg 顯效 計量資料轉(zhuǎn)化為計數(shù)資料,過程本身損失信息,應慎重。臨床研究中計數(shù)資料來源、分類本身設置為分類變量(PI/ECO在賦值時應考慮類型而定。 * 二分類變量: 0,1 * 有序多分類:滿足線性關(guān)系,多采用等間距賦值 如 -、+、+、+(0、1、2、3)不滿足線性關(guān)系,采用啞變量賦值 * 無序多分類變量賦值: A、

6、B、AB、O 1 2 3 4?計數(shù)資料的分類賦值在賦值時應考慮類型而定。計數(shù)資料的分類賦值 例如:在先天性畸形兒與產(chǎn)婦年齡關(guān)系研究中,將年齡劃分為三組,40歲。目的是探討不同懷孕年齡段的先天性畸形兒發(fā)生是否不同?畸形兒發(fā)生率年 齡18歲40歲采用啞變量方法:dummy variable(年齡與先天性畸形兒發(fā)生率呈U型關(guān)系,母親年齡過大或過小時,畸形兒發(fā)生率高) 例如:在先天性畸形兒與產(chǎn)婦年齡關(guān)系研究中,將年齡劃分為三原來分類啞變量賦值age1age21(18歲以下)102(18-40歲)01 3(40歲以上) 00結(jié)果18歲以下賦值為(1,0),18-40歲賦值為(0,1),40歲以上賦值為(

7、0,0)無序多分類變量同樣賦值: A、B、AB、OABO血型如何賦值?bt1,bt2,bt3?原來分類啞變量賦值age1age21(18歲以下)102(1革陽菌的啞變量賦值為(1,0,0),革陰菌啞變量賦值為(0,1,0),真菌啞變量賦值為(0,0,1)革陽菌的啞變量賦值為(1,0,0),革陰菌啞變量賦值為(0,一、計數(shù)資料的統(tǒng)計描述(一)圖表: 頻數(shù)表,直條圖,餅圖 一、計數(shù)資料的統(tǒng)計描述(一)圖表: 頻數(shù)表,直條圖,餅圖 變量類型的識別病例號年齡(歲)性別身高(m)血型心電圖尿WBC職業(yè)RBC1012/L135女1.65A正常教師4.67244男1.74B正常工人5.21326男1.80O

8、正常職員4.10425女1.61AB正常農(nóng)民3.92541男1.71A異常+工人3.49645女1.58B正常+工人5.48750女1.60O異常+干部6.78828男1.76AB正常+干部7.10931女1.62O正常軍人5.24變量類型的識別病例號年齡性別身高血型心電圖尿WBC職業(yè)RBC1、頻數(shù)表職業(yè)狀況頻數(shù)工人3干部2職員1軍人1農(nóng)民1教師1合計9 9例患者的職業(yè)狀況編號性別身高職業(yè)狀況1女1.65教師2男1.74工人3男1.80職員4女1.61農(nóng)民5男1.71工人6女1.58工人7女1.60干部8男1.76干部9女1.62軍人部分原始數(shù)據(jù)1、頻數(shù)表職業(yè)狀況頻數(shù)工人3干部2職員1軍人1農(nóng)

9、民1教師1合2、直條圖直條圖(bar 條形圖):分類變量資料的頻數(shù)圖,條與條間獨立,順序可不固定。 與Histogram直方圖不同2、直條圖直條圖(bar 條形圖):分類變量資料的頻數(shù)圖,餅圖/圓餅圖/圓圖/pie圖餅圖/圓餅圖/圓圖/pie圖百分條圖 (percent bar)百分條圖 (percent bar)(二)率、比 (構(gòu)成比、相對比) rate, proportion, ratio一、計數(shù)資料的統(tǒng)計描述(二)率、比 (構(gòu)成比、相對比)一、計數(shù)資料的統(tǒng)計描述1、率 (rate, frequency) 率又包括頻率指標(frequency)和強度指標(rate),用來測量一定時期內(nèi),某

10、人群特定事件發(fā)生的頻率或強度。率=(發(fā)生某現(xiàn)象的觀察單位數(shù))/(某時間段可能發(fā)生某現(xiàn)象的觀察單位數(shù))常用百分率、千分率、10萬分率表示。1、率 (rate, frequency) 率又包括頻率率是一個動態(tài)指標,在觀察期內(nèi)看特定人群中某事件的變化。率有時間單位觀察時間影響率的大小。反應停銷售量畸形兒發(fā)生率率是一個動態(tài)指標,在觀察期內(nèi)看特定人群中某事件的變化。反應停與臨床研究相關(guān)的率用于疾病負擔測量及選題立題:發(fā)病率、患病率、死亡率(年齡別死亡率、死因別死亡率)用于臨床療效與預后評價:病死率/生存率、復發(fā)率、治愈率/緩解率、有效率與臨床研究相關(guān)的率用于疾病負擔測量及選題立題:發(fā)病率(inciden

11、ce)是指一定時間內(nèi)某人群中新發(fā)病例的頻率。 觀察時間可為年、季、月,一般為年。 K可以為100%,1000,100000/10萬 年發(fā)病率/月發(fā)病率/季發(fā)病率發(fā)病率(incidence)是指一定時間內(nèi)某人群中新發(fā)病例的計算發(fā)病率時,分子確定要注意:病人的發(fā)病時間要“落入”觀察期內(nèi),即必須是新病例。注意病例與病人的區(qū)別。疾病必須確診2009.1.12009.12.31觀察期新發(fā)病新發(fā)病新發(fā)病發(fā)病新發(fā)病 已發(fā)病計算發(fā)病率時,分子確定要注意:2009.1.12009.12分母:可能發(fā)病的人口數(shù),其范圍界定很關(guān)鍵暴露人口又稱危險人群,指發(fā)生研究疾病可能人群應排除那些正在患病、曾經(jīng)患病、或因年齡、免疫

12、等因素而不會患該病的人,如宮頸癌年發(fā)病率?前列腺肥大發(fā)生率?分母:可能發(fā)病的人口數(shù),其范圍界定很關(guān)鍵暴露人口又稱危險人群分母用人時發(fā)病密度(incidence density ID)以觀察“人時”為分母計算的發(fā)病率觀察對象不穩(wěn)定時用。分母用人時發(fā)病密度(incidence density I現(xiàn)患率(prevalence)也稱患病率或流行率,指某特定時間某人群中某病現(xiàn)患人數(shù)所占比重或比例。現(xiàn)患率(prevalence)也稱患病率或流行率,指某特定時計算現(xiàn)患率時應注意:分子包括新、老病例,只要調(diào)查時正處于患病狀態(tài),均計算在內(nèi)。分母不考慮“暴露人口”可分為時點現(xiàn)患率與期間現(xiàn)患率point preva

13、lence period prevalence 調(diào)查時應盡量縮短調(diào)查時間Cohortstudy / cross-sectional study計算現(xiàn)患率時應注意:可分為時點現(xiàn)患率與期間現(xiàn)患率point現(xiàn)患率主要應用于慢性病的調(diào)查研究。反映某人群特定時間某病的負擔程度。可作為臨床選題與立題依據(jù),也可用于評價防治措施效果。現(xiàn)患率主要應用于慢性病的調(diào)查研究。計數(shù)的統(tǒng)計分析演示文稿課件死亡率(mortality )表示一定時期內(nèi)死亡發(fā)生的頻率或強度。粗死亡率(crude death rate)反映人群因病傷死亡危險性總水平。指示居民健康狀況和保健水平。為衛(wèi)生決策提供依據(jù)。死亡率(mortality )

14、表示一定時期內(nèi)死亡發(fā)生的頻率或病死率(case fatality rate) 表示一定時期內(nèi)(一般為一年)患某病的人群中因該病而死亡的頻率。反映疾病嚴重程度及診治水平,多用于急性病.復發(fā)率緩解率有效率治愈率病死率(case fatality rate) 表示一定時2、構(gòu)成比 (proportion)說明某一事物內(nèi)部各組成部分所占的比重和分布,常用百分數(shù)表示(0%-100%)。結(jié)石 結(jié)石類型部位 膽固醇 膽紅素 其它 合計 膽囊 70 16 32 118(%) 59.3 13.6 27.1 100 肝外膽管 12 39 24 75(%) 16.0 52.0 32.0 100 肝內(nèi)膽管 2 20

15、7 29(%) 7.0 69.0 24.0 100 合計 84 75 63 2222、構(gòu)成比 (proportion)說明某一事物內(nèi)部各組成部構(gòu)成比是一特定時間(time point)某特定事件在總體事件數(shù)中所占的比重。proportion=a/(a + b + c+)是一個靜態(tài)指標無時間單位,與時間無關(guān)。構(gòu)成比是一特定時間(time point)某特定事件在總體事3、相對比 (ratio) 是A、B兩個指標之比。比=A/B兩個指標可以性質(zhì)相同,可以不同;絕對數(shù)、相對數(shù)或平均數(shù)。兩個率的相對比?兩個比的相對比?3、相對比 (ratio) 是A、B兩個指標之比。比=A比較兩獨立事件數(shù)量大小關(guān)系指

16、標(獨立指互不包含):a/b是一個靜態(tài)指標,反映一特定時間(time point)的情況。無時間單位比較兩獨立事件數(shù)量大小關(guān)系指標(獨立指互不包含):a/b例 某地中毒與損傷匯總分析年度 發(fā)病人數(shù) 病死人數(shù) 病死率 構(gòu)成比 相對比1993 584 8 1.37 8.8 -1994 571 10 1.75 11.0 1.281995 714 12 1.68 13.2 1.23 1996 748 16 2.14 17.6 1.561997 942 21 2.23 23.0 1.631998 1095 24 2.19 26.4 1.60合計 91計數(shù)資料的統(tǒng)計描述:率與比的綜合應用例 某地中毒與損傷

17、匯總分析年度 發(fā)病人數(shù) 病死人數(shù) 例 血清TPS檢出率與消化道腫瘤淋巴結(jié)轉(zhuǎn)移的關(guān)系腫瘤 淋巴結(jié)轉(zhuǎn)移 無淋巴結(jié)轉(zhuǎn)移 n TPS 陽性率 n TPS 陽性率食管癌 7 7 100 3 1 33.3胃癌 9 6 66.7 1 0 0 大腸癌 10 7 70.0 0 0 - 合計 26 20 76.9 4 1 25.0 (7/7),(6/9),7/10,0/1(三)、注意事項計算率時要求分母不宜過小。少于10例則直接描述。例 血清TPS檢出率與消化道腫瘤淋巴結(jié)轉(zhuǎn)移的關(guān)系腫瘤 分析時不能以構(gòu)成比代率 例:某作者調(diào)查醫(yī)院門診沙眼病例,獲得如下數(shù)據(jù):年齡組(歲)沙眼病例數(shù)% 0474.6 10 20 30

18、40-601983304341819.332.142.31.7結(jié)論:說明30歲年齡組最容易患沙眼。分析時不能以構(gòu)成比代率 年齡組(歲)對觀察單位數(shù)不等的多個率,不能直接相加求其平均率.對率的比較應作統(tǒng)計推斷;資料組間比較應注意可比性;若不可比,需要進行校正-率的標準化對觀察單位數(shù)不等的多個率,不能直接相加求其平均率.(四)、率的標準化 例 甲、乙兩個醫(yī)院某疾病病死率比較病情程度 甲醫(yī)院 乙醫(yī)院 例數(shù) 病死數(shù) 病死率 例數(shù) 病死數(shù) 病死率 重 800 160 20% 100 30 30%中 200 20 10% 400 60 15% 輕 100 5 5% 1000 100 10% 合計 1100

19、 185 16.8% 1500 190 12.7%(四)、率的標準化 例 甲、乙兩個醫(yī)院某疾病病死率比較1、標準化法的基本方法方法1:采用標準人口構(gòu)成與原始分組率,計算標準化率,直接比較。方法2:采用分組標準化率與原始人口,計算標準化比,間接比較。1、標準化法的基本方法方法1:采用標準人口構(gòu)成與原始分組率,1)、直接法-標準人口病情程度 甲醫(yī)院 乙醫(yī)院 例數(shù) 病死數(shù) 病死率 例數(shù) 病死數(shù) 病死率 重 800 160 20% 800 240 30%中 200 20 10% 200 30 15% 輕 100 5 5% 100 10 10% 合計 1100 185 16.8% 1100 280 12

20、.7% 25.4% 同一標準人口同一標準人口1)、直接法-標準人口病情程度 甲醫(yī)院 2)、間接法:分組標準率病情程度 甲醫(yī)院 乙醫(yī)院 例數(shù) 病死數(shù) 病死率 例數(shù) 實際 預期 病死數(shù) 病死數(shù) 重 800 160 20% 100 30 20 中 200 20 10% 400 60 40 輕 100 5 5% 1000 100 50 合計 1100 185 16.8% 1600 220 110 計算標準化死亡比(SMR)=(實際死亡數(shù)與預期死亡數(shù)比)=220/110=2;SMR1, 表示被標化組的病死率高于標準組。2)、間接法:分組標準率病情程度 甲醫(yī)院 2、標準化率的注意事項條件:比較雙方應同質(zhì)、

21、同時、同地。比較的兩組應選用同一標準。標準選用不同,標化率可不同。標準化率只是兩組的相對水平,不反映實際的情況,只能用于比較。推斷總體標準化率也需進行假設檢驗。2、標準化率的注意事項條件:比較雙方應同質(zhì)、同時、同地。(五)基于率/比的二級描述指標相對指標:相對危險度(RR)比數(shù)比(OR)絕對指標:絕對危險度(AR,RD)NNT用來表達危險度的大小或關(guān)聯(lián)程度(五)基于率/比的二級描述指標相對指標:用來表達危險度的大小 相對指標OR(比數(shù)比)、RR(相對危險度)適用條件: 對于RCT、隊列研究:可以計算OR、RR 對于病例對照研究:只能計算OR 相對指標OR(比數(shù)比)、RR(相對危險度)1、相對危

22、險度(率比)組別 死亡 存活 合計 病死率治療組 a b a+b Pe 對照組 c d c+d Pc合計 a+c b+d a+b+c+d RR(相對危險度)為治療組與對照組的病死率之比。RR=Pe/Pc1、相對危險度(率比)組別 死亡 存實例分析 組別 未愈 痊愈 合計 未愈率 治療組 119 45 164 0.726 對照組 130 34 164 0.793某種新藥治療消化不良的療效分析。實例分析 組別 未愈 痊愈 RR計算的實例演示治療組消化不良未愈的危險度(率)=119/164=0.726對照組消化不良未愈的危險度(率)=130/164=0.793相對危險度(RR) RR計算的實例演示治

23、療組消化不良未愈的危險度(率)=119/2、比數(shù)比(OR)組別 暴露 非暴露 合計 暴露/非暴露比病例組 a b a+b a/b對照組 c d c+d c/d合計 a+c b+d a+b+c+d OR(比數(shù)比)為病例組暴露與非暴露的比例與對照組暴露與非暴露的比例之比;OR=ad/bc2、比數(shù)比(OR)組別 暴露 實例分析 組別 未愈 痊愈 合計 未愈率 治療組 119(a) 45(b) 164 0.726 對照組 130(c) 34(d) 164 0.793某種新藥治療消化不良的療效分析。實例分析 組別 未愈 痊愈 OR計算的實例演示比數(shù)比又常稱為機會比/優(yōu)勢比/比值比。OR計算的實例演示比數(shù)

24、比又常稱為機會比/優(yōu)勢比/比值比。OR病例組(50例):12例海豹肢畸形兒的母親服用反應停對照組(90例):2例正常兒的母親服用反應停OR=13.89 (12/38)/(2/88)OR病例組(50例):12例海豹肢畸形兒的母親服用反應停OR、RR的解讀(實際意義)OR、RR1,表明暴露因素為危險因素,偏離1越遠,表示危險性越強0OR、RR1,表明暴露因素為危RR與OR的關(guān)系例: 治療組消化不良未愈率=119/164=0.726;對照組消化不良未愈率=130/164=0.793 RR=0.92 OR=0.69例: 治療組消化不良未愈率=9/164=0.055;對照組消化不良未愈率=15/164=

25、0.09 RR=0.61 OR=0.58當率較低,如小于10%時, RR值與OR值近似相等。率值越?。ê卑l(fā)事件),越接近。對大規(guī)模RCT、隊列研究:OR、RR可使用。RR與OR的關(guān)系例: 治療組消化不良未愈率=119/164=3、絕對危險度(率差)對照組病死率40%,試驗組20%,RR=2?對照組病死率10%,試驗組5%,RR=2?AR 為兩個率的絕對差值:即對照組率-治療組率3、絕對危險度(率差)對照組病死率40%,試驗組20%,RR絕對危險度實例計算對于消化不良研究: 絕對危險度為(130/164)-(119/164) = 0.793-0.726 = 0.067 (常用百分數(shù)表示:6.7%

26、)治療能使消化不良未愈的危險度減少7%左右絕對危險度實例計算對于消化不良研究: 4、NNTNNT(Numbers Needed to Treat):為避免一例不良事件發(fā)生而需要治療的病例數(shù).其值為絕對危險度的倒數(shù)(1/AR)類似還有:NNH(Numbers Needed to Harm)。 4、NNTNNT(Numbers Needed to TrNNT實例演示如果治療一個病人能減少消化不良未愈的0.067危險度,即我們能挽救0.067個人。那么為挽救一個完整的人,需要治療多少病人?(NNT):0.067NNT=1, NNT=1/0.067 15需要治療15個病人,才能比對照組多治愈一個消化不

27、良的患者。NNT實例演示如果治療一個病人能減少消化不良未愈的0.067計數(shù)資料統(tǒng)計描述小結(jié)率與比可用來描述某事件發(fā)生機會的大小。基于率/比的二級描述指標:效應量相對危險度(RR)與比數(shù)比(OR)是用來描述兩組間事件發(fā)生的機會之比。當事件的發(fā)生機會較大時,RR與OR相差較大;當為罕發(fā)事件時, RR OR。絕對危險度是指率差,NNT為避免一例不良事件發(fā)生而需要治療的病例數(shù);易于臨床解讀。計數(shù)資料統(tǒng)計描述小結(jié)率與比可用來描述某事件發(fā)生機會的大小。假設檢驗:2檢驗 Pearson Chi-square test率差或率比(RR)的區(qū)間估計二、計數(shù)資料的統(tǒng)計推斷假設檢驗:2檢驗 Pearson Chi-

28、square tKarlPearson,18571936,生卒于倫敦,公認為統(tǒng)計學之父。 1879年畢業(yè)于劍橋大學數(shù)學系;曾參與激進的政治活動,還出版幾本文學作品,并且作了三年的實習律師。1884年進入倫敦大學學院 ,教授數(shù)學與力學,從此在該校工作一直到1933年。 K Pearson 最重要的學術(shù)成就,是為現(xiàn)代統(tǒng)計學打下了堅實基礎。KPearson 在1893-1912年間寫出18篇在進化論上的數(shù)學貢獻的文章,而這門“算術(shù)”,也就是今日的統(tǒng)計。許多統(tǒng)計名詞如標準差,成分分析,卡方檢驗(1900)都是他提出。 KarlPearson,18571936,生卒于倫敦,公2檢驗的主要應用 推斷兩個/

29、兩個以上總體率或構(gòu)成比有無差別;用于兩分類變量間有無相關(guān)的假設檢驗;實施擬合優(yōu)度檢驗(理論分布與實際分布的吻合情況檢驗)。 2檢驗的主要應用 推斷兩個/兩個以上總體率或構(gòu)成比有無差別(一) 設計方案與2 檢驗選擇成組設計-四格表資料的2檢驗多組比較-RC表資料的2檢驗配對設計-22列聯(lián)表的2檢驗特殊分類變量資料的統(tǒng)計分析(一) 設計方案與2 檢驗選擇成組設計-四格表資料的2檢卡方檢驗基本思想以四格表資料為例卡方檢驗基本思想以四格表資料為例 例1、在二乙基亞硝胺誘發(fā)大白鼠鼻咽癌的實驗中,一組單純用亞硝胺向鼻腔灌注,另一組在鼻注的基礎上加肌注維生素B12,問兩組發(fā)癌率有無差別? 表1 兩組大白鼠發(fā)

30、癌率的比較 處理發(fā)癌鼠數(shù)未發(fā)癌鼠數(shù)合計發(fā)癌率鼻注+VitB12組5219 71 73.2鼻注組39 342 92.9合計91 22 113 80.5 例1、在二乙基亞硝胺誘發(fā)大白鼠鼻咽癌的實驗中,一組73.2%(71) 92.9%(42) (樣本率不等)推斷總體率兩總體率相等兩總體率不等P值小概率事件拒絕H0不拒絕H02 檢驗的基本思想 73.2%(71) 92.9%(42) (樣本率不等)推1、建立假設 H0:兩組發(fā)癌率相等, H1:兩組發(fā)癌率不等, =0.05*兩組的總體發(fā)癌率相等,均等于合并發(fā)癌率 =91/113=80.5%1、建立假設 H0:兩組發(fā)癌率相等,*兩組的l在無效假設成立的條

31、件下, 計算每個格子的發(fā)癌情況, T(理論頻數(shù))=組例數(shù)*總體發(fā)癌率,可簡化為T=(行合計*列合計)/ n.處理發(fā)癌鼠數(shù)未發(fā)癌鼠數(shù)合計發(fā)癌率鼻注+VitB12組52(57.18) 19(13.82)71 73.2鼻注組39(33.82) 3(8.18)42 92.9合計91 22 113 80.5l在無效假設成立的條件下, 計算每個格子的發(fā)癌情況, T(理為反映所有格子的吻合情況,所有差值求和,(A-T)=0 (正負抵消),差值和可定義為(A -T)2 ;相對比例保持不變,T值越大, (A-T)2值越大,為消除其影響,差值定義為: (A-T)2/T統(tǒng)計量為反映所有格子的吻合情況,所有差值求和,

32、(A-T)=0 (2、計算統(tǒng)計量2在樣本量足夠大時,該統(tǒng)計量服從于自由度為=(行數(shù)-1)(列數(shù)-1)的2分布。 即2檢驗公式: 2=(A-T)2/T2分布是一簇連續(xù)性分布,與自由度有關(guān);在自由度固定時, 2值越大,P值越小,反之亦然.在無效假設成立時: 2值一般不會很大,出現(xiàn)大的2值的概率P是很小的,若P( 檢驗水準),則沒有理由拒絕它。2、計算統(tǒng)計量2Pearson Chi-square distributions 均值等于自由度Pearson Chi-square distributio3、 借助2分布計算P值2值反映了實際頻數(shù)與理論頻數(shù)的差值大小2值大小與p值呈反比關(guān)系,即2 值越大,P

33、值越??;反之亦然。2值達到界值點,就有理由認為成立的可能性不大,是小概率事件,因而拒絕H0 。對于四格表資料:0.052=3.84(1.96平方)3、 借助2分布計算P值2值反映了實際頻數(shù)與理論頻數(shù)的差四格表資料2 檢驗計算結(jié)果 本例2值=6.48,自由度為1,查2界值表,得p40時, 選用一般計算公式當1T40時, 需計算校正公式*當T1或n40時, 選用一般計算公計數(shù)的統(tǒng)計分析演示文稿課件(二)、率比(RR)區(qū)間估計 本資料為實驗研究,可以同時計算RR與OR值,用以分析Vitb12對發(fā)癌危險度的大小,RR1表示Vitb12為危險因素。以RR值為例,RR服從對數(shù)正態(tài)分布.(二)、率比(RR)

34、區(qū)間估計 本資料為實驗研究,可以同時計算實例分析 處理發(fā)癌鼠數(shù)未發(fā)癌鼠數(shù)合計鼻注/VitB12組521971鼻注組39 342合計91 22 113RR=(0.732)/ (0.929)= 0.79,其95%的可信區(qū)間為0.67-0.93,其RR值均小于1,說明維生素B12是保護因素,能減少發(fā)癌率。實例分析 處理發(fā)癌鼠數(shù)未發(fā)癌鼠數(shù)合計鼻注/Vit(三)、多個樣本率比較 適用資料特征:行X列表(RXC)-多個率比較的 2 檢驗。應用條件:不能有1/5格子的理論頻數(shù)小于5,或最小理論頻數(shù)小于2。 (三)、多個樣本率比較 適用資料特征:行X列表(RXC)-實例演示 例3某醫(yī)師研究物理療法、藥物療法和

35、外用膏藥三種療法治療周圍性神經(jīng)麻痹的療效,問三種療法的有效率有無差別? 分析三種療法的有效率?實例演示 例3某醫(yī)師研究物理療法、藥物療法和外用膏藥三表3 三種療法的有效率比較表3 三種療法的有效率比較1、建立假設H0:三種療法有效率相等,=H1:三種療法的有效率不等或不全等=0.05 1、建立假設H0:三種療法有效率相等,=2、確定統(tǒng)計量、P值與結(jié)論 =17.91, =(3-1)(2-1)=2 查卡方界值表,得P0.0167。后把乙丙兩組合并,再與甲組比較,作2檢驗, 2=17.83,=1,得P值0.0167,說明二、三組與第一組有差別。 3、兩兩比較-2 分割法先把率差異最小的兩組乙丙,分割

36、出實例演示實例演示注意事項 行X列表2檢驗應用條件:要求理論頻數(shù)不宜太小,對于行X列表不宜1/5以上格式的理論頻數(shù)小于5,或有一個理論頻數(shù)小于2。若不滿足,可采用方法:增加樣本例數(shù)以增加理論頻數(shù);刪除上述理論頻數(shù)太少行或列;將理論頻數(shù)太小、性質(zhì)相近行或列實際頻數(shù)合并。Fisher確切概率法注意事項 行X列表2檢驗應用條件:要求理論頻數(shù)不宜太小,對卡方檢驗:P=0.037卡方檢驗:P=0.037(四)、2X2列聯(lián)表(配對設計) 例2、某研究室用甲乙血清學方法檢查410例確診的鼻咽癌患者,得結(jié)果如下表,問兩種檢驗結(jié)果有無聯(lián)系?有無差別?表2 兩種血清學檢驗結(jié)果甲法乙法合計+ -+ 261 (a)1

37、10(b) 371-8 (c) 31(d) 39合計269 141 410 (四)、2X2列聯(lián)表(配對設計) 例2、某研究室用甲乙血清學1、資料特點與分析目的資料的特點:配對計數(shù)資料分析目的: A:兩法檢驗結(jié)果有無關(guān)系(四格表2檢驗) B:兩法檢驗有無差別(專用公式)。1、資料特點與分析目的資料的特點:配對計數(shù)資料2、假設檢驗(1):相關(guān)分析 檢驗目的:兩法檢驗結(jié)果有無關(guān)系。 H0:兩法檢驗結(jié)果無關(guān)系 H1:兩法檢驗結(jié)果有關(guān)系 =0.05 確定統(tǒng)計量:2值=38.85,=1 計算P值: 查卡方界值表,得P0.005, 按照=0.05的水準,拒絕H0,而接受H1,可認為兩法檢驗結(jié)果有關(guān)。 計算P

38、earson列聯(lián)系數(shù)反映相關(guān)程度sqrt(2/2+n)。(本例為r=0.294) 2、假設檢驗(1):相關(guān)分析 檢驗目的:兩法檢驗結(jié)果有無關(guān)系3、假設檢驗(2):差別分析檢驗目的:兩法檢驗結(jié)果有無差別 H0:兩總體b=cH1:兩總體bc=0.05 確定統(tǒng)計量:計算P值: 查卡方界值表,得P40時,公式可簡化(McNemar): 4、2X2列聯(lián)表差別檢驗的應用條件當b+c40時,公式可簡計數(shù)的統(tǒng)計分析演示文稿課件5、率差的95%可信區(qū)間可定義p1-p2=(b-c)/n 則率差的95%可信區(qū)間為:上例兩法總體率差值的95%可信區(qū)間為(0.200.30)。 5、率差的95%可信區(qū)間可定義p1-p2=

39、(b-c)/n 2X2列聯(lián)表資料的分析特點對此類資料可以做兩方面的分析: 相關(guān)分析:采用一般的四格表公式 差別分析:采用專用公式(b、c不宜過小)對上例結(jié)果:兩類檢驗方法結(jié)果是有關(guān)的,且有差別,甲法好于乙法。2X2列聯(lián)表資料的分析特點對此類資料可以做兩方面的分析:(五)特殊行X列表資料的分析列聯(lián)表:有序行X列表資料, 行變量、列變量的屬性分為:雙向均無序 -卡方檢驗單向有序-秩和檢驗雙向均有序?qū)傩韵嗤琄appa分析雙向均有序?qū)傩圆煌燃壪嚓P(guān)(五)特殊行X列表資料的分析列聯(lián)表:有序行X列表資料, 行變A、對于雙向/單向無序資料:若比較多個樣本率(或構(gòu)成比),可用行列表資料卡方檢驗;若分析兩個分類

40、變量之間有無關(guān)聯(lián)性以及關(guān)系的密切程度時,可用行列表卡方檢驗以及Pearson列聯(lián)系數(shù)進行分析sqrt(2/2+n)。 卡方檢驗:19.54,P0.001A、對于雙向/單向無序資料:卡方檢驗:19.54,P0.0B、單向有序資料 分組變量(如年齡)有序,而結(jié)果變量(如傳染病的類型)無序,分析不同組結(jié)果構(gòu)成情況,可用行列表卡方檢驗進行差別分析。分組變量(如療法)無序,而結(jié)果變量(如療效按等級分組)有序,比較不同組別療效,應用秩和檢驗表1 兩組患者氧療依從性對比n/(%)組別例數(shù)(n)入院時出院時出院6個月完全依從部分依從不依從完全依從部分依從不依從完全依從部分依從不依從干預組3811(30.63)16(42.89)9(25.05)23(61.35)11(30.12)2(7.23)22(58.41)10(28.1)4(12.43

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論