![分類變量資料的統(tǒng)計分析_第1頁](http://file2.renrendoc.com/fileroot_temp3/2021-10/30/3f600d67-7c17-40d3-a092-37d0a4c6762b/3f600d67-7c17-40d3-a092-37d0a4c6762b1.gif)
![分類變量資料的統(tǒng)計分析_第2頁](http://file2.renrendoc.com/fileroot_temp3/2021-10/30/3f600d67-7c17-40d3-a092-37d0a4c6762b/3f600d67-7c17-40d3-a092-37d0a4c6762b2.gif)
![分類變量資料的統(tǒng)計分析_第3頁](http://file2.renrendoc.com/fileroot_temp3/2021-10/30/3f600d67-7c17-40d3-a092-37d0a4c6762b/3f600d67-7c17-40d3-a092-37d0a4c6762b3.gif)
![分類變量資料的統(tǒng)計分析_第4頁](http://file2.renrendoc.com/fileroot_temp3/2021-10/30/3f600d67-7c17-40d3-a092-37d0a4c6762b/3f600d67-7c17-40d3-a092-37d0a4c6762b4.gif)
![分類變量資料的統(tǒng)計分析_第5頁](http://file2.renrendoc.com/fileroot_temp3/2021-10/30/3f600d67-7c17-40d3-a092-37d0a4c6762b/3f600d67-7c17-40d3-a092-37d0a4c6762b5.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、7版) 第十章 分類變量資料的統(tǒng)計分析版) 第十章 分類變量資料的統(tǒng)計分析1第十章第十章7版) 第十章 分類變量資料的統(tǒng)計分析版) 第十章 分類變量資料的統(tǒng)計分析2主要內(nèi)容主要內(nèi)容分類變量資料的統(tǒng)計描述分類變量資料的統(tǒng)計描述分類變量資料的統(tǒng)計推斷分類變量資料的統(tǒng)計推斷卡方檢驗卡方檢驗7版) 第十章 分類變量資料的統(tǒng)計分析版) 第十章 分類變量資料的統(tǒng)計分析3什么是分類變量資料?什么是分類變量資料?用什么指標(biāo)進行描述?用什么指標(biāo)進行描述?甲、乙兩地發(fā)生麻疹流行,甲地患兒100人,乙地患兒50人,何地較為嚴重?若甲地易感兒童667人,而乙地易感兒童250人。甲地麻疹發(fā)病率為 100/667100%
2、=15%乙地麻疹發(fā)病率為 50/250100%=20%7版) 第十章 分類變量資料的統(tǒng)計分析版) 第十章 分類變量資料的統(tǒng)計分析4第一節(jié)第一節(jié) 分類變量資料的統(tǒng)計描述分類變量資料的統(tǒng)計描述 常用相對數(shù)常用相對數(shù) 應(yīng)用相對數(shù)時的注意事項應(yīng)用相對數(shù)時的注意事項 率的標(biāo)準(zhǔn)化法率的標(biāo)準(zhǔn)化法7版) 第十章 分類變量資料的統(tǒng)計分析版) 第十章 分類變量資料的統(tǒng)計分析5相對數(shù)相對數(shù) 相對數(shù)相對數(shù):是兩個有關(guān)聯(lián)的數(shù)值或指標(biāo)之比。:是兩個有關(guān)聯(lián)的數(shù)值或指標(biāo)之比。 常用的相對數(shù)有:常用的相對數(shù)有: 率率 構(gòu)成比構(gòu)成比 相對比相對比7版) 第十章 分類變量資料的統(tǒng)計分析版) 第十章 分類變量資料的統(tǒng)計分析6率率(r
3、ate)率:率:是指在一定觀察時間內(nèi),某現(xiàn)象實際發(fā)生數(shù)與是指在一定觀察時間內(nèi),某現(xiàn)象實際發(fā)生數(shù)與可能發(fā)生該現(xiàn)象的總數(shù)之比,用以說明某現(xiàn)象發(fā)生可能發(fā)生該現(xiàn)象的總數(shù)之比,用以說明某現(xiàn)象發(fā)生的頻率或強度。的頻率或強度。K K為比例基數(shù),如為比例基數(shù),如100%100%、10001000等。比例基數(shù)的選擇主要依等。比例基數(shù)的選擇主要依習(xí)慣而定或使計算結(jié)果能保留習(xí)慣而定或使計算結(jié)果能保留1 12 2位整數(shù)。位整數(shù)。 K單位總數(shù)可能發(fā)生該現(xiàn)象的觀察單位數(shù)實際發(fā)生某現(xiàn)象的觀察率7版) 第十章 分類變量資料的統(tǒng)計分析版) 第十章 分類變量資料的統(tǒng)計分析7構(gòu)成比構(gòu)成比(constituent ratio) 構(gòu)成
4、比:構(gòu)成比:是指事物內(nèi)部某一部分的觀察單位數(shù)與事是指事物內(nèi)部某一部分的觀察單位數(shù)與事物內(nèi)部各組成部分的觀察單位數(shù)總和之比,用以說物內(nèi)部各組成部分的觀察單位數(shù)總和之比,用以說明事物內(nèi)部各部分所占的比重或分布。明事物內(nèi)部各部分所占的比重或分布。100事物內(nèi)部某一部分的觀察單位數(shù)構(gòu)成比事物內(nèi)部各部分的觀察單位數(shù)總和常用百分數(shù)表示,故又稱百分比。常用百分數(shù)表示,故又稱百分比。7版) 第十章 分類變量資料的統(tǒng)計分析版) 第十章 分類變量資料的統(tǒng)計分析8各部分構(gòu)成比之和為各部分構(gòu)成比之和為100%。此消彼長。此消彼長。構(gòu)成比的兩個特點:構(gòu)成比的兩個特點:7版) 第十章 分類變量資料的統(tǒng)計分析版) 第十章
5、分類變量資料的統(tǒng)計分析9例例10-1 2001年對某地中小學(xué)學(xué)生進行年對某地中小學(xué)學(xué)生進行HbsAg檢查,檢查,結(jié)果見表結(jié)果見表10-1,試計算各級學(xué)生,試計算各級學(xué)生HbsAg檢出率及陽檢出率及陽性者構(gòu)成比性者構(gòu)成比 率和構(gòu)成比不是同一指標(biāo),在應(yīng)用時應(yīng)注意加以區(qū)分。率和構(gòu)成比不是同一指標(biāo),在應(yīng)用時應(yīng)注意加以區(qū)分。 7版) 第十章 分類變量資料的統(tǒng)計分析版) 第十章 分類變量資料的統(tǒng)計分析10相對比相對比相對比:相對比:指兩個有關(guān)指標(biāo)之比,說明兩個指標(biāo)的比指兩個有關(guān)指標(biāo)之比,說明兩個指標(biāo)的比例關(guān)系。例關(guān)系。甲指標(biāo)相對比(或 100)乙指標(biāo)兩個指標(biāo)可以是絕對數(shù)、相對數(shù)、平均數(shù),可以是性質(zhì)相兩個指
6、標(biāo)可以是絕對數(shù)、相對數(shù)、平均數(shù),可以是性質(zhì)相同或性質(zhì)不同,但兩個指標(biāo)互不包含。同或性質(zhì)不同,但兩個指標(biāo)互不包含。 7版) 第十章 分類變量資料的統(tǒng)計分析版) 第十章 分類變量資料的統(tǒng)計分析11例例10-2 某地某地2003-2005年不同性別新生兒數(shù)見表年不同性別新生兒數(shù)見表10-2,試計算該地不同年份新生兒性別比。,試計算該地不同年份新生兒性別比。 7版) 第十章 分類變量資料的統(tǒng)計分析版) 第十章 分類變量資料的統(tǒng)計分析12應(yīng)用相對數(shù)的注意事項應(yīng)用相對數(shù)的注意事項 計算相對數(shù)時分母不宜過小計算相對數(shù)時分母不宜過小 正確區(qū)分構(gòu)成比和率,不能以構(gòu)成比代替率正確區(qū)分構(gòu)成比和率,不能以構(gòu)成比代替率
7、 正確計算平均率正確計算平均率 對率和構(gòu)成比進行比較時,應(yīng)注意資料的可比性對率和構(gòu)成比進行比較時,應(yīng)注意資料的可比性 率的標(biāo)準(zhǔn)化率的標(biāo)準(zhǔn)化 樣本率或構(gòu)成比進行比較時要作假設(shè)檢驗樣本率或構(gòu)成比進行比較時要作假設(shè)檢驗 7版) 第十章 分類變量資料的統(tǒng)計分析版) 第十章 分類變量資料的統(tǒng)計分析13率的標(biāo)準(zhǔn)化率的標(biāo)準(zhǔn)化7版) 第十章 分類變量資料的統(tǒng)計分析版) 第十章 分類變量資料的統(tǒng)計分析14 在進行兩個內(nèi)部構(gòu)成不同的總率比較時,采在進行兩個內(nèi)部構(gòu)成不同的總率比較時,采用統(tǒng)一的標(biāo)準(zhǔn)進行校正,然后計算校正后的標(biāo)準(zhǔn)用統(tǒng)一的標(biāo)準(zhǔn)進行校正,然后計算校正后的標(biāo)準(zhǔn)化率,再進行比較的方法稱為率的標(biāo)準(zhǔn)化法?;?,再
8、進行比較的方法稱為率的標(biāo)準(zhǔn)化法。率的標(biāo)準(zhǔn)化法率的標(biāo)準(zhǔn)化法7版) 第十章 分類變量資料的統(tǒng)計分析版) 第十章 分類變量資料的統(tǒng)計分析15計算標(biāo)準(zhǔn)化率時,首先要選定一個比較的計算標(biāo)準(zhǔn)化率時,首先要選定一個比較的“標(biāo)準(zhǔn)標(biāo)準(zhǔn)”。如,對年齡構(gòu)成進行標(biāo)化時,可選用全國、全省等大范圍人如,對年齡構(gòu)成進行標(biāo)化時,可選用全國、全省等大范圍人口構(gòu)成資料作標(biāo)準(zhǔn),也可將比較組的合并人口或以其中任一口構(gòu)成資料作標(biāo)準(zhǔn),也可將比較組的合并人口或以其中任一組的人口構(gòu)成作標(biāo)準(zhǔn)。組的人口構(gòu)成作標(biāo)準(zhǔn)。原則上,選定的標(biāo)準(zhǔn)人口應(yīng)有代表性、較穩(wěn)定,容易獲得,原則上,選定的標(biāo)準(zhǔn)人口應(yīng)有代表性、較穩(wěn)定,容易獲得,便于比較。便于比較。根據(jù)獲得
9、的資料和選定的標(biāo)準(zhǔn)不同,標(biāo)準(zhǔn)化法可分為直接法根據(jù)獲得的資料和選定的標(biāo)準(zhǔn)不同,標(biāo)準(zhǔn)化法可分為直接法和和間接法間接法。7版) 第十章 分類變量資料的統(tǒng)計分析版) 第十章 分類變量資料的統(tǒng)計分析16直接法直接法適用情況適用情況:已知被標(biāo)化組各年齡組的實際率:已知被標(biāo)化組各年齡組的實際率P Pi i,用標(biāo)準(zhǔn)人口數(shù)或標(biāo)準(zhǔn)人口構(gòu)成進行計算。用標(biāo)準(zhǔn)人口數(shù)或標(biāo)準(zhǔn)人口構(gòu)成進行計算。iiiiipCpNpNp或其中其中 為第為第i 組標(biāo)準(zhǔn)人口數(shù),組標(biāo)準(zhǔn)人口數(shù), 為標(biāo)準(zhǔn)組總?cè)藬?shù),為標(biāo)準(zhǔn)組總?cè)藬?shù), 為第為第i 組的實際率,組的實際率, 為第組標(biāo)準(zhǔn)人口構(gòu)成。為第組標(biāo)準(zhǔn)人口構(gòu)成。 iNipiCiN7版) 第十章 分類變量資
10、料的統(tǒng)計分析版) 第十章 分類變量資料的統(tǒng)計分析17甲社區(qū)標(biāo)準(zhǔn)化后的患病率甲社區(qū)標(biāo)準(zhǔn)化后的患病率 乙社區(qū)標(biāo)準(zhǔn)化后的患病率乙社區(qū)標(biāo)準(zhǔn)化后的患病率表表 10-4 甲、乙兩社區(qū) 20 歲以上居民高血壓標(biāo)準(zhǔn)化患病率(直接法) 甲社區(qū) 乙社區(qū) 年齡組 標(biāo)準(zhǔn) 人口 iN 實際患病率(%) 1 ip 預(yù)期 患病數(shù) 1iipN 實際患病率(%) 2ip 預(yù)期 患病數(shù) 2iipN 20- 1539 10.86 167 11.76 181 35- 1665 21.48 358 22.88 381 50- 1584 34.69 549 36.96 585 65- 1675 53.44 895 56.01 938 合
11、計 6463 (N) 1969 (1iipN) 2085 (2iipN) %47.30%10064631969p%26.32%10064632085p7版) 第十章 分類變量資料的統(tǒng)計分析版) 第十章 分類變量資料的統(tǒng)計分析18如根據(jù)選定的標(biāo)準(zhǔn)人口構(gòu)成做標(biāo)準(zhǔn),如根據(jù)選定的標(biāo)準(zhǔn)人口構(gòu)成做標(biāo)準(zhǔn), 7版) 第十章 分類變量資料的統(tǒng)計分析版) 第十章 分類變量資料的統(tǒng)計分析19間接法間接法適用情況:適用情況:已知被標(biāo)化組的死亡總數(shù)及年齡別人已知被標(biāo)化組的死亡總數(shù)及年齡別人口數(shù),但不知道各年齡組的實際死亡率??跀?shù),但不知道各年齡組的實際死亡率。iiPNrPP標(biāo)準(zhǔn)化死亡比標(biāo)準(zhǔn)化死亡比7版) 第十章 分類變
12、量資料的統(tǒng)計分析版) 第十章 分類變量資料的統(tǒng)計分析20標(biāo)準(zhǔn)化死亡比:標(biāo)準(zhǔn)化死亡比:被標(biāo)化組實際死亡數(shù)與預(yù)期死亡被標(biāo)化組實際死亡數(shù)與預(yù)期死亡數(shù)之比,稱為標(biāo)準(zhǔn)化死亡比(數(shù)之比,稱為標(biāo)準(zhǔn)化死亡比(standard mortality ratio),簡稱為),簡稱為SMR。若。若SMR1,表示被標(biāo)化人,表示被標(biāo)化人群的死亡率高于標(biāo)準(zhǔn)組;反之,若群的死亡率高于標(biāo)準(zhǔn)組;反之,若SMR1,表示被,表示被標(biāo)化人群的死亡率低于標(biāo)準(zhǔn)組。標(biāo)化人群的死亡率低于標(biāo)準(zhǔn)組。 iiPnrSMR/7版) 第十章 分類變量資料的統(tǒng)計分析版) 第十章 分類變量資料的統(tǒng)計分析21例例10-410-4 某地觀察了吸煙者與不吸煙者各年
13、齡組人數(shù)如表某地觀察了吸煙者與不吸煙者各年齡組人數(shù)如表10-610-6,同時觀察期內(nèi)吸煙者中有,同時觀察期內(nèi)吸煙者中有432432人死于肺癌,不吸煙者人死于肺癌,不吸煙者中有中有210210人死于肺癌,試計算吸煙者與不吸煙者的標(biāo)準(zhǔn)化死人死于肺癌,試計算吸煙者與不吸煙者的標(biāo)準(zhǔn)化死亡率。亡率。 7版) 第十章 分類變量資料的統(tǒng)計分析版) 第十章 分類變量資料的統(tǒng)計分析22吸煙者的肺癌標(biāo)準(zhǔn)化死亡比吸煙者的肺癌標(biāo)準(zhǔn)化死亡比 2912467100432.SMR非吸煙者的肺癌標(biāo)準(zhǔn)化死亡比非吸煙者的肺癌標(biāo)準(zhǔn)化死亡比 2100.8620243.67SMR 7版) 第十章 分類變量資料的統(tǒng)計分析版) 第十章 分
14、類變量資料的統(tǒng)計分析23吸煙者的肺癌標(biāo)準(zhǔn)化死亡率吸煙者的肺癌標(biāo)準(zhǔn)化死亡率 非吸煙者的肺癌標(biāo)準(zhǔn)化死亡率非吸煙者的肺癌標(biāo)準(zhǔn)化死亡率 萬萬10/83.298620.010/60.342p萬萬10/48.1482912.410/60.341p7版) 第十章 分類變量資料的統(tǒng)計分析版) 第十章 分類變量資料的統(tǒng)計分析24率的標(biāo)準(zhǔn)化應(yīng)注意的問題率的標(biāo)準(zhǔn)化應(yīng)注意的問題 (1 1)當(dāng)各比較組內(nèi)部構(gòu)成(如年齡、性別等)不同時,)當(dāng)各比較組內(nèi)部構(gòu)成(如年齡、性別等)不同時,應(yīng)對率進行標(biāo)準(zhǔn)化后,再作比較。應(yīng)對率進行標(biāo)準(zhǔn)化后,再作比較。(2 2)標(biāo)準(zhǔn)化率只表明各標(biāo)化組率的相對水平,而不代表)標(biāo)準(zhǔn)化率只表明各標(biāo)化組率的
15、相對水平,而不代表其實際水平。其實際水平。(3 3)兩總率各分組對應(yīng)的率有明顯交叉時,則不能用標(biāo))兩總率各分組對應(yīng)的率有明顯交叉時,則不能用標(biāo)準(zhǔn)化率進行比較。準(zhǔn)化率進行比較。(4 4)如為抽樣研究資料,兩樣本標(biāo)準(zhǔn)化率的比較也應(yīng)作)如為抽樣研究資料,兩樣本標(biāo)準(zhǔn)化率的比較也應(yīng)作假設(shè)檢驗。假設(shè)檢驗。 7版) 第十章 分類變量資料的統(tǒng)計分析版) 第十章 分類變量資料的統(tǒng)計分析25 率的抽樣分布率的抽樣分布 率的抽樣誤差與標(biāo)準(zhǔn)誤率的抽樣誤差與標(biāo)準(zhǔn)誤 總體率的區(qū)間估計總體率的區(qū)間估計 率比較的率比較的u u檢驗檢驗7版) 第十章 分類變量資料的統(tǒng)計分析版) 第十章 分類變量資料的統(tǒng)計分析26率的抽樣分布率
16、的抽樣分布 從某個二項分類總體中隨機抽取含量一定的樣本,其從某個二項分類總體中隨機抽取含量一定的樣本,其樣本率的分布概率是有規(guī)律的,這種規(guī)律為服從二項樣本率的分布概率是有規(guī)律的,這種規(guī)律為服從二項分布(分布(binomial distribution),即樣本中陽性數(shù)或樣),即樣本中陽性數(shù)或樣本陽性率的分布概率等于二項式展開后各項。若總體本陽性率的分布概率等于二項式展開后各項。若總體陽性率為陽性率為、樣本含量為、樣本含量為n,陽性數(shù)為,陽性數(shù)為X,則樣本中出,則樣本中出現(xiàn)現(xiàn)X個陽性事件的概率可由下式求得。個陽性事件的概率可由下式求得。 n , 2, 1, , 0 )1 ()!( !)(XXnX
17、nXPXnX7版) 第十章 分類變量資料的統(tǒng)計分析版) 第十章 分類變量資料的統(tǒng)計分析27已知:已知: =0.5,n =10; =0.3,n =5; =0.3,n =10; =0.3,n =15。試根據(jù)式(。試根據(jù)式(10-6)求各陽性數(shù)事件的概率)求各陽性數(shù)事件的概率并作概率分布圖。并作概率分布圖。 圖圖10-1 10-1 率的抽樣分布圖率的抽樣分布圖 7版) 第十章 分類變量資料的統(tǒng)計分析版) 第十章 分類變量資料的統(tǒng)計分析28率的抽樣分布特征率的抽樣分布特征1.為離散型分布;為離散型分布;2.2.當(dāng)當(dāng) =1-=1-時,呈對稱分布;時,呈對稱分布;3.3.當(dāng)當(dāng)n n增大時,逐漸逼近正態(tài)分布
18、。增大時,逐漸逼近正態(tài)分布。 一般認為,當(dāng)一般認為,當(dāng)nn和和n n(1-(1-)5)5時時, , 可近似看可近似看作正態(tài)分布。作正態(tài)分布。 7版) 第十章 分類變量資料的統(tǒng)計分析版) 第十章 分類變量資料的統(tǒng)計分析29率的抽樣誤差和標(biāo)準(zhǔn)誤率的抽樣誤差和標(biāo)準(zhǔn)誤 由于抽樣所引起的樣本率和總體率或各樣本率由于抽樣所引起的樣本率和總體率或各樣本率之間存在著差異,這種差異稱為率的抽樣誤差。之間存在著差異,這種差異稱為率的抽樣誤差。用率的標(biāo)準(zhǔn)誤表示用率的標(biāo)準(zhǔn)誤表示 。npnppsp7版) 第十章 分類變量資料的統(tǒng)計分析版) 第十章 分類變量資料的統(tǒng)計分析30例例10-6 10-6 為了解某地人群結(jié)核菌素
19、試驗陽性率情況,某醫(yī)為了解某地人群結(jié)核菌素試驗陽性率情況,某醫(yī)療機構(gòu)在該地人群中隨機檢測了療機構(gòu)在該地人群中隨機檢測了17731773人,結(jié)核菌素試驗陽人,結(jié)核菌素試驗陽性有性有682682人,陽性率為人,陽性率為38.47%38.47%,試計算其標(biāo)準(zhǔn)誤。,試計算其標(biāo)準(zhǔn)誤。%16.10116.017733847.03847.0ps7版) 第十章 分類變量資料的統(tǒng)計分析版) 第十章 分類變量資料的統(tǒng)計分析31總體率的區(qū)間估計總體率的區(qū)間估計總體率的估計:總體率的估計:點估計點估計區(qū)間估計區(qū)間估計 正態(tài)近似法正態(tài)近似法 查表法查表法7版) 第十章 分類變量資料的統(tǒng)計分析版) 第十章 分類變量資料的
20、統(tǒng)計分析32正態(tài)近似法正態(tài)近似法當(dāng)樣本含量當(dāng)樣本含量n足夠大,樣本率足夠大,樣本率p或或1-p均不太小時(如均不太小時(如np和和n(1-p)均大于均大于5),樣本率的分布近似正態(tài)分布。),樣本率的分布近似正態(tài)分布。 pSupu u 是標(biāo)準(zhǔn)正態(tài)分布雙側(cè)臨界值,在估計總體率的是標(biāo)準(zhǔn)正態(tài)分布雙側(cè)臨界值,在估計總體率的95%置信區(qū)間時,其值為置信區(qū)間時,其值為1.96;99%置信區(qū)間時,其值為置信區(qū)間時,其值為2.58。7版) 第十章 分類變量資料的統(tǒng)計分析版) 第十章 分類變量資料的統(tǒng)計分析3395%的置信區(qū)間:的置信區(qū)間: 38.47% 1.96 1.16%=36.20%40.74%99%的置信
21、區(qū)間:的置信區(qū)間: 38.47% 2.58 1.16%=35.48%41.46% 例例10-6中該地人群中結(jié)核菌素試驗陽性率中該地人群中結(jié)核菌素試驗陽性率95%和和99%的置信區(qū)間為:的置信區(qū)間為:7版) 第十章 分類變量資料的統(tǒng)計分析版) 第十章 分類變量資料的統(tǒng)計分析34查表法查表法 當(dāng)當(dāng)n較小,如較小,如n 50,特別是,特別是p接近于接近于0或或1時,按二項分時,按二項分布原理估計總體率的可信區(qū)間。布原理估計總體率的可信區(qū)間。 因其計算比較復(fù)雜,統(tǒng)計學(xué)家已經(jīng)編制了總體率可信因其計算比較復(fù)雜,統(tǒng)計學(xué)家已經(jīng)編制了總體率可信區(qū)間估計用表,可根據(jù)樣本含量區(qū)間估計用表,可根據(jù)樣本含量n和陽性數(shù)和
22、陽性數(shù)x查閱統(tǒng)計查閱統(tǒng)計學(xué)專著中的附表學(xué)專著中的附表 。7版) 第十章 分類變量資料的統(tǒng)計分析版) 第十章 分類變量資料的統(tǒng)計分析35u u 檢驗檢驗 當(dāng)樣本含量當(dāng)樣本含量n足夠大,樣本率足夠大,樣本率p或或1-p均不均不太小時(如太小時(如np和和n(1-p)均大于均大于5),樣本率的,樣本率的分布近似正態(tài)分布。樣本率和總體率之間、分布近似正態(tài)分布。樣本率和總體率之間、兩個樣本率之間的比較可用兩個樣本率之間的比較可用u檢驗檢驗(u test) 。7版) 第十章 分類變量資料的統(tǒng)計分析版) 第十章 分類變量資料的統(tǒng)計分析36樣本率與總體率的比較樣本率與總體率的比較 1pppun7版) 第十章
23、分類變量資料的統(tǒng)計分析版) 第十章 分類變量資料的統(tǒng)計分析37例例10-7 10-7 一般情況下,直腸癌圍術(shù)期并發(fā)癥發(fā)生率一般情況下,直腸癌圍術(shù)期并發(fā)癥發(fā)生率為為30%30%,現(xiàn)某醫(yī)院手術(shù)治療了,現(xiàn)某醫(yī)院手術(shù)治療了385385例直腸癌患者,圍例直腸癌患者,圍術(shù)期出現(xiàn)并發(fā)癥有術(shù)期出現(xiàn)并發(fā)癥有100100例,并發(fā)癥發(fā)生率為例,并發(fā)癥發(fā)生率為26%26%,問,問該院直腸癌患者圍術(shù)期并發(fā)癥發(fā)生率與一般情況比該院直腸癌患者圍術(shù)期并發(fā)癥發(fā)生率與一般情況比較有無統(tǒng)計學(xué)差異。較有無統(tǒng)計學(xué)差異。本例,樣本率為本例,樣本率為26%,np和和n(1-p)均大于均大于5,可采,可采用用u檢驗。檢驗。7版) 第十章 分
24、類變量資料的統(tǒng)計分析版) 第十章 分類變量資料的統(tǒng)計分析38 建立檢驗假設(shè)建立檢驗假設(shè) H0: = 0,H1: 0, =0.052. 計算計算u值值 3. 確定確定P值,判斷結(jié)果值,判斷結(jié)果本題本題u u=1.713=1.7131.961.96,P P0.05,0.05,按按 =0.05=0.05的水準(zhǔn)不拒絕的水準(zhǔn)不拒絕H H0 0,差異沒有統(tǒng)計學(xué)意義,故尚不能認為該院直腸癌患者圍差異沒有統(tǒng)計學(xué)意義,故尚不能認為該院直腸癌患者圍術(shù)期并發(fā)癥發(fā)生率與一般情況不同。術(shù)期并發(fā)癥發(fā)生率與一般情況不同。 713.1385)3.01(3.026.03.0u7版) 第十章 分類變量資料的統(tǒng)計分析版) 第十章
25、分類變量資料的統(tǒng)計分析39兩個樣本率的比較兩個樣本率的比較 121211(1)()ccppuppnn2121nnXXpc7版) 第十章 分類變量資料的統(tǒng)計分析版) 第十章 分類變量資料的統(tǒng)計分析40例例10-8 10-8 為了解某地小學(xué)生蛔蟲感染率的城鄉(xiāng)差異,抽樣調(diào)查了該地為了解某地小學(xué)生蛔蟲感染率的城鄉(xiāng)差異,抽樣調(diào)查了該地小學(xué)生小學(xué)生2279222792人,其中城鎮(zhèn)小學(xué)生人,其中城鎮(zhèn)小學(xué)生82078207人,糞檢蛔蟲卵陽性數(shù)為人,糞檢蛔蟲卵陽性數(shù)為701701人,人,蛔蟲感染率為蛔蟲感染率為8.54%8.54%,鄉(xiāng)村小學(xué)生,鄉(xiāng)村小學(xué)生1458514585人,糞檢蛔蟲卵陽性數(shù)為人,糞檢蛔蟲卵陽
26、性數(shù)為21672167人,蛔蟲感染率為人,蛔蟲感染率為14.86%14.86%,試比較該地小學(xué)生蛔蟲感染率城鄉(xiāng)差異有,試比較該地小學(xué)生蛔蟲感染率城鄉(xiāng)差異有無統(tǒng)計學(xué)意義。無統(tǒng)計學(xué)意義。 建立檢驗假設(shè)建立檢驗假設(shè) H0: 1= 2,H1: 1 2, =0.052. 計算計算u值值 1258. 01458582072167701cP7版) 第十章 分類變量資料的統(tǒng)計分析版) 第十章 分類變量資料的統(tǒng)計分析41 確定確定P P值和判斷結(jié)果值和判斷結(jié)果 本題本題 =13.739=13.7392.582.58,P P0.01,0.01,按按 =0.05=0.05的水準(zhǔn)拒絕的水準(zhǔn)拒絕H H0 0,接受,接受
27、H H1 1,差異有統(tǒng)計學(xué)意,差異有統(tǒng)計學(xué)意義。義。 3. 確定確定P值,判斷結(jié)果值,判斷結(jié)果0046. 0(1258. 01 (1258. 021PPS739.130046. 01486. 00854. 0uu7版) 第十章 分類變量資料的統(tǒng)計分析版) 第十章 分類變量資料的統(tǒng)計分析42 2檢驗檢驗 基本思想基本思想 四格表資料的卡方檢驗四格表資料的卡方檢驗 配對設(shè)計分類變量資料的卡方檢驗配對設(shè)計分類變量資料的卡方檢驗 行行列表資料的卡方檢驗列表資料的卡方檢驗7版) 第十章 分類變量資料的統(tǒng)計分析版) 第十章 分類變量資料的統(tǒng)計分析43 2檢驗(檢驗(Chi-squ
28、are test)t 是現(xiàn)代統(tǒng)計學(xué)的創(chuàng)始人之一,英是現(xiàn)代統(tǒng)計學(xué)的創(chuàng)始人之一,英國統(tǒng)計學(xué)家國統(tǒng)計學(xué)家K.Pearson于于1900年提年提出的一種具有廣泛用途的假設(shè)檢驗方出的一種具有廣泛用途的假設(shè)檢驗方法。常用于分類變量資料的統(tǒng)計推斷。法。常用于分類變量資料的統(tǒng)計推斷。7版) 第十章 分類變量資料的統(tǒng)計分析版) 第十章 分類變量資料的統(tǒng)計分析44基本思想基本思想例例10-9 某醫(yī)生欲比較用甲、乙兩種藥物治療動脈硬化某醫(yī)生欲比較用甲、乙兩種藥物治療動脈硬化的療效,甲藥治療的療效,甲藥治療71例,有效例,有效52例,例, 乙藥治療乙藥治療42例,例,有效有效39例,結(jié)果見表例,結(jié)果見表10-7。問兩
29、種藥物的有效率是否有。問兩種藥物的有效率是否有差別?差別?表表10-7 甲、乙兩種藥物治療動脈硬化的療效比較甲、乙兩種藥物治療動脈硬化的療效比較7版) 第十章 分類變量資料的統(tǒng)計分析版) 第十章 分類變量資料的統(tǒng)計分析4522()ATT 卡方檢驗的基本公式:卡方檢驗的基本公式:RCn nTnA:實際頻數(shù):實際頻數(shù)T:理論頻數(shù):理論頻數(shù)由上式可以看出,由上式可以看出,x2值反映的是在檢驗假設(shè)值反映的是在檢驗假設(shè)H0前提下實際頻數(shù)與理論頻數(shù)的吻合程度。前提下實際頻數(shù)與理論頻數(shù)的吻合程度。7版) 第十章 分類變量資料的統(tǒng)計分析版) 第十章 分類變量資料的統(tǒng)計分析46 2 2檢驗的自由度檢驗的自由度
30、指可以自由取值的基本格子數(shù)指可以自由取值的基本格子數(shù) 自由度一定時,其自由度一定時,其 2 2值的概率分布也就確定。根據(jù)自由值的概率分布也就確定。根據(jù)自由度度 和檢驗水準(zhǔn)和檢驗水準(zhǔn) 查表查表10-13 10-13 可得可得 2 2界值,若界值,若 2 2值值 2 20.050.05( ),),則可按則可按 =0.05=0.05的檢驗水準(zhǔn)拒絕的檢驗水準(zhǔn)拒絕H H0 0;若;若 2 2值值 2 20.050.05( ),),則還不能拒絕則還不能拒絕H H0 0。) 1)(1(列數(shù)行數(shù)7版) 第十章 分類變量資料的統(tǒng)計分析版) 第十章 分類變量資料的統(tǒng)計分析47四格表資料的卡方檢驗四格表資料的卡方檢
31、驗四格表資料四格表資料處處 理理+-合合 計計Aaba+bBcdc+d合合 計計a+cb+dn(a+b+c+d)7版) 第十章 分類變量資料的統(tǒng)計分析版) 第十章 分類變量資料的統(tǒng)計分析48H0 :兩藥有效率相同,即:兩藥有效率相同,即 1 2H1 :兩藥有效率不同,即:兩藥有效率不同,即 1 2 =0.05(1) 建立檢驗假設(shè),確定檢驗水準(zhǔn)建立檢驗假設(shè),確定檢驗水準(zhǔn)例例10-9 10-9 甲、乙兩種藥物治療動脈硬化的療效比較甲、乙兩種藥物治療動脈硬化的療效比較7版) 第十章 分類變量資料的統(tǒng)計分析版) 第十章 分類變量資料的統(tǒng)計分析49 2 20 . 0 2 50 . 0 2 5 ( 1 1
32、 )=5.02=5.02, 2 20 . 0 10 . 0 1 ( 1 1 )=6.63=6.63。本例。本例5.025.02 2 2=6.486.63=6.4840,Tmin548. 618. 818. 8382.3382.333982.1382.131918.5718.5752222227版) 第十章 分類變量資料的統(tǒng)計分析版) 第十章 分類變量資料的統(tǒng)計分析5022()()()()()adbcnab cd ac bd四格表專用公式:四格表專用公式:本例,本例,48. 622914271113)3919352(227版) 第十章 分類變量資料的統(tǒng)計分析版) 第十章 分類變量資料的統(tǒng)計分析5
33、1校正公式:校正公式:22(0.5)ATT 22(/2)()()()()adbcnnab cd ac bd四格表資料四格表資料 2 2檢驗的校正檢驗的校正 分布是一種連續(xù)性分布,而分類變量資料屬離散性分分布是一種連續(xù)性分布,而分類變量資料屬離散性分布,由此得到的布,由此得到的 統(tǒng)計量也是不連續(xù)的。為改善統(tǒng)計量也是不連續(xù)的。為改善 2 2統(tǒng)計量分統(tǒng)計量分布的連續(xù)性,英國統(tǒng)計學(xué)家布的連續(xù)性,英國統(tǒng)計學(xué)家Yates F建議將實際頻數(shù)和理論建議將實際頻數(shù)和理論頻數(shù)之差的絕對值減去頻數(shù)之差的絕對值減去0.5以作校正。以作校正。7版) 第十章 分類變量資料的統(tǒng)計分析版) 第十章 分類變量資料的統(tǒng)計分析52
34、例例10-10 10-10 某醫(yī)生研究比較某醫(yī)生研究比較A A、B B兩種藥物對急性細菌兩種藥物對急性細菌性肺炎的療效,有關(guān)資料見表性肺炎的療效,有關(guān)資料見表10-810-8,問兩種藥物的療,問兩種藥物的療效差別有無統(tǒng)計學(xué)意義?效差別有無統(tǒng)計學(xué)意義?表表10-8 A、B兩藥治療急性細菌性肺炎的療效比較兩藥治療急性細菌性肺炎的療效比較 7版) 第十章 分類變量資料的統(tǒng)計分析版) 第十章 分類變量資料的統(tǒng)計分析53H0: 1= 2H1: 1 2 =0.05 T22=22 8/64=2.75 5 按按 = 1= 1 , 查, 查 2 2值 表 ,值 表 , 2 20 . 0 50 . 0 5 ( 1
35、 1 )= 3 . 8 4= 3 . 8 4 , 2 2=4.79=4.79 3.843.84,P P0.05, 0.05, 按按 =0.05=0.05水準(zhǔn),拒絕水準(zhǔn),拒絕H H0 0,接受接受H H1 1,認為兩藥的療效差別有統(tǒng)計學(xué)意義,認為兩藥的療效差別有統(tǒng)計學(xué)意義,A A藥藥療效要好于療效要好于B B藥。藥。 79. 48562242642/64162640227版) 第十章 分類變量資料的統(tǒng)計分析版) 第十章 分類變量資料的統(tǒng)計分析54在實際工作中,對于四格表資料,通常規(guī)定在實際工作中,對于四格表資料,通常規(guī)定(1 1)T5T5,且,且N40N40時,直接計算值,不用校正;時,直接計算
36、值,不用校正;(2 2)1T5, 1T5, 且且N40N40時,用連續(xù)性校正檢驗;時,用連續(xù)性校正檢驗;(3 3)T1T1或或N40N40,不能用卡方檢驗,用直接計算概率的方法。,不能用卡方檢驗,用直接計算概率的方法。7版) 第十章 分類變量資料的統(tǒng)計分析版) 第十章 分類變量資料的統(tǒng)計分析55配對設(shè)計分類變量資料的配對設(shè)計分類變量資料的 2 2檢驗檢驗 7版) 第十章 分類變量資料的統(tǒng)計分析版) 第十章 分類變量資料的統(tǒng)計分析5622()40,()bcbcbc22(1)40,()bcbcbc配對卡方檢驗又稱配對卡方檢驗又稱McNemar檢驗:檢驗: 7版) 第十章 分類變量資料的統(tǒng)計分析版)
37、 第十章 分類變量資料的統(tǒng)計分析57例例10-11 10-11 用兩種血清學(xué)方法對用兩種血清學(xué)方法對100100例肝癌患者進行例肝癌患者進行檢測,有關(guān)檢測結(jié)果見表檢測,有關(guān)檢測結(jié)果見表10-910-9,問兩種血清學(xué)方,問兩種血清學(xué)方法檢測結(jié)果有無差別?法檢測結(jié)果有無差別?表表10-9 兩種血清學(xué)方法對肝癌檢測的結(jié)果比較兩種血清學(xué)方法對肝癌檢測的結(jié)果比較甲法甲法乙法乙法合計合計+-+503282-15 318合計合計65351007版) 第十章 分類變量資料的統(tǒng)計分析版) 第十章 分類變量資料的統(tǒng)計分析58H0 :兩種方法檢出率相同,即:兩種方法檢出率相同,即B = CH1 :兩種方法檢出率兩種
38、方法檢出率不同,即不同,即B C =0.05查表得,查表得,P 2 20.010.01(2 2), PP0.01, 0.01, 按按 =0.05=0.05的檢驗水準(zhǔn),拒絕的檢驗水準(zhǔn),拒絕H H0 0,接受接受H H1 1,故可認為甲、乙、丙三家醫(yī)院院內(nèi)感染率總的,故可認為甲、乙、丙三家醫(yī)院院內(nèi)感染率總的來講有差別。來講有差別。 7版) 第十章 分類變量資料的統(tǒng)計分析版) 第十章 分類變量資料的統(tǒng)計分析63例例10-13 10-13 某研究者欲了解白內(nèi)障發(fā)病是否與某研究者欲了解白內(nèi)障發(fā)病是否與ABOABO血血型有關(guān),收集有關(guān)資料見表型有關(guān),收集有關(guān)資料見表10-1110-11,問白內(nèi)障組與,問白
39、內(nèi)障組與對照組對照組ABOABO血型分布有無差別?血型分布有無差別?7版) 第十章 分類變量資料的統(tǒng)計分析版) 第十章 分類變量資料的統(tǒng)計分析64H0 :白內(nèi)障組與對照組:白內(nèi)障組與對照組ABO血型分布相同血型分布相同H1 :白內(nèi)障組與對照組白內(nèi)障組與對照組ABO血型分布不同或不全相同血型分布不同或不全相同 =0.05查表得,查表得, 2 20.050.05(3 3)=7.81=7.81, 2 2 P0.05, 0.05, 按按 =0.05=0.05的檢驗水準(zhǔn),不拒絕檢驗假設(shè),尚不能認為白的檢驗水準(zhǔn),不拒絕檢驗假設(shè),尚不能認為白內(nèi)障組與對照組內(nèi)障組與對照組ABOABO血型分布不同。血型分布不同
40、。 (1)(2)(3)25. 3122CRnnAn =(2-1)(4-1)=3 7版) 第十章 分類變量資料的統(tǒng)計分析版) 第十章 分類變量資料的統(tǒng)計分析65理論數(shù)不宜太小。(不能有理論數(shù)不宜太小。(不能有1/51/5以上格子的理論頻數(shù)小于以上格子的理論頻數(shù)小于5 5或者有一個格子的理論頻數(shù)小于或者有一個格子的理論頻數(shù)小于1 1)。處理方法)。處理方法如假設(shè)檢驗的結(jié)果是拒絕無效假設(shè),只能認為各總體率或如假設(shè)檢驗的結(jié)果是拒絕無效假設(shè),只能認為各總體率或構(gòu)成比之間總的來說有差別。若要進一步了解哪兩者之間構(gòu)成比之間總的來說有差別。若要進一步了解哪兩者之間有差別,可用卡方分割法,或者調(diào)整檢驗水準(zhǔn)。有差別,可用卡方分割法,或者調(diào)整檢驗水準(zhǔn)。對于單向有序行列表,在比較各處理組的效應(yīng)有無差別時,對于單向有序行列表,在比較各處理組的效應(yīng)有無差別時,應(yīng)該用秩和檢驗。應(yīng)該用秩和檢驗。行行列表卡方檢驗的注意事項:列表卡方檢驗的注意事項:7版) 第十章 分類變量資料的統(tǒng)計分析版) 第十章 分類變量資料的統(tǒng)計分析66如:用某藥治療某病患者,如:用某藥治療某病患者,5例中有例中有3例治愈,計例治愈,計算治愈率為算治愈率為3/5100%=60.0%,如果有,如果有4例治愈,例治愈,則其治愈率為則其治愈率為80%。
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 融資業(yè)務(wù)咨詢服務(wù)項目合同書
- 簡易保險代理居間合同
- 二零二五年度保健藥品車間智能化生產(chǎn)線改造合同
- 2025年鶴壁駕??荚囏涍\從業(yè)資格證考試
- 戰(zhàn)略合作采購協(xié)議書范本
- 2025年丹東a2貨運資格證考試題
- 項目解決方案與實施方案詳解
- 船舶制造股權(quán)轉(zhuǎn)讓居間協(xié)議
- 2025年博爾塔拉b2貨運資格證考試題庫
- 2025年綿陽貨運從業(yè)資格證考試試題及答案
- 數(shù)學(xué)-安徽省皖南八校2025屆高三上學(xué)期12月第二次大聯(lián)考試題和答案
- 退市新規(guī)解讀-上海證券交易所、大同證券
- 融資報告范文模板
- 桃李面包盈利能力探析案例11000字
- GB/Z 30966.71-2024風(fēng)能發(fā)電系統(tǒng)風(fēng)力發(fā)電場監(jiān)控系統(tǒng)通信第71部分:配置描述語言
- 腦梗死的護理查房
- 2025高考數(shù)學(xué)專項復(fù)習(xí):概率與統(tǒng)計的綜合應(yīng)用(十八大題型)含答案
- 產(chǎn)后抑郁癥講課課件
- 2024-2030年中國紫蘇市場深度局勢分析及未來5發(fā)展趨勢報告
- 銷售人員課件教學(xué)課件
- LED大屏技術(shù)方案(適用于簡單的項目)
評論
0/150
提交評論