第十章 分類變量資料統(tǒng)計分析_第1頁
第十章 分類變量資料統(tǒng)計分析_第2頁
第十章 分類變量資料統(tǒng)計分析_第3頁
第十章 分類變量資料統(tǒng)計分析_第4頁
第十章 分類變量資料統(tǒng)計分析_第5頁
已閱讀5頁,還剩33頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、第十章 分類變量資料統(tǒng)計分析統(tǒng)計資料的類型數(shù)值變量: 計量資料分類變量: 計數(shù)資料 有序分類 : 變量之間有程度的差 別, 且排列有序. (等級變量)無序分類: 二項分類多項分類變量的轉換: 定量 定性連續(xù)型計量資料離散型計量資料第十章 分類變量資料的統(tǒng)計分析第一節(jié) 統(tǒng)計描述 一.描述指標(相對數(shù)) 1. 率(rate) : 單位: %,萬分率,10萬分率 2. 構成比 (constituent ratio) 單位: % 特點: 3. 相對比 (relative ratio) 常用率比 例10-1 某研究者2000年對某校的初中生進行了近視患病情況調查,試計算各年級近視患病率和構成比及三年級和

2、一年級患病率的相對比.年級 檢查人數(shù) 患病人數(shù) 患病率 構成比 相對比一年級 442 67 二年級 428 68三年級 405 74 合計 15.89 32.53 二. 應用相對數(shù)時注意事項1. 分母不宜太小2. 率和構成比的區(qū)別3. 樣本含量不等的幾個率的平均值不等于 幾個率的算數(shù)平均值4. 對率或構成比進行比較時,應注意資料的可比性5. 率的標準化6. 兩樣本率進行比較時應進行假設檢驗三.率的標準化1.基本思想: 為消除內部構成不同對指標的影響, 采用統(tǒng)一的內部構成計算標準化率,使得出的標準化率具有可比性.2.計算方法: 直接法: 已知各年齡組的實際發(fā)病率,用標準人口數(shù)或 標準人口構成進行

3、計算 間接法: 標準化死亡比 (SMR), 實際死亡數(shù)與預 期死亡數(shù)的比 3. 率的標準化應注意的問題第三節(jié) 率的標準化法 (standardization) 西醫(yī)組 中西醫(yī)結合組 病型 病例數(shù) 治愈數(shù) 治愈率 (%) 病例數(shù) 治愈數(shù) 治愈率 (%) 普通型 60 36 60 20 13 65重型 20 8 40 60 27 45 爆發(fā)型 20 4 20 20 5 25合計 100 48 48 100 45 45例: 某病兩種療法治愈率的比較西醫(yī)標準化治愈率 P= 88200 = 44%中西醫(yī)標準化治愈率 P= 98200 = 49%例: 某病兩種療法治愈率的比較 西醫(yī)組 中西醫(yī)結合組 病型

4、病例數(shù) 原治愈率 (%) 預期治愈數(shù) 原治愈率 (%) 預期治愈數(shù) 普通型 80 60 48 65 52重型 80 40 32 45 36 爆發(fā)型 40 20 8 25 10合計 200 88 98率的標準化1.基本思想: 為消除內部構成不同對指標的影響, 采用統(tǒng)一的內部構成計算標準化率,使得出的標準化率具有可比性.2.計算方法: 直接法: 已知各年齡組的實際發(fā)病率,用標準人口數(shù)或標準人口構成進行計算 間接法: 標準化死亡比 (SMR), 實際死亡數(shù)與預期死亡數(shù)的比 3. 率的標準化應注意的問題由于內部構成不同,影響到要比較的總率,需要標準化處理?標準化率只用于比較,已經(jīng)不代表實際的水平。各分

5、組率有交叉,不能用標準化率比較抽樣得到的標準化率的比較,也應該進行假設檢驗.第二節(jié) 計數(shù)資料統(tǒng)計推斷一. 率的抽樣誤差和標準誤 樣本率和總體率或樣本率之間存在的差異,稱抽樣誤差.率的抽樣誤差用率的標準誤表示.(p or Sp).( p =陽性率, 1- p=陰性率)二. 總體率的區(qū)間估計查表法: 當n 50, 樣本率p 接近與0或1時,該資料服從二項分布,用查表法估計樣本含量p u Sp1. 正態(tài)近似法:np 和 n(1-p)5條件: n 足夠大,樣本率p 或1-p均不太小時, 即例10-5 為了解某地乙肝表面抗原攜帶情況,某研究者在該地人群中隨機檢測了該地200人,乙肝表面抗原陽性7人,乙肝

6、表面抗原攜帶率為3.5%,試計算標準誤并估計95%和99%可信區(qū)間. 95%可信區(qū)間: 3.5% Sp 99%可信區(qū)間: 3.5% Spn=200 X=7, P=3.5% 三. 兩個率比較的u 檢驗當np和 n(1-p) 5 時 樣本率的分布近似正態(tài)分布 u 檢驗(一) 檢驗步驟: 1. 建立假設, 確定檢驗水準 H0: H1: 2. 選擇檢驗方法, 計算 u 值 3. 確定 P 值, 判斷結果(二)資料類型樣本率與總體率的比較 (例10-6)計算公式:2. 兩個樣本率的比較 (例10-7) 計算公式:第三節(jié) X2 檢驗 (chi-square test)基本思想 檢驗實際頻數(shù)與理論頻數(shù)的吻合

7、程度,實際頻數(shù)與理論頻數(shù)越相近, X2 值越小; 反之,實際數(shù)與理論數(shù)相差越大, X2值越大.計算公式:理論頻數(shù)的計算: TRC= nRnC / n df=(行數(shù)-1)(列數(shù)-1)例10-8 某醫(yī)生用A,B兩種藥物治療急性下呼吸道感染.A藥治療74例,有效68例;B藥治療63例,有效52例.問兩種藥物的有效率是否有差別?處理 有效 無效 合計 有效率(%)A 藥 68 6 74 91.89B 藥 52 11 63 82.54合計 120 17 137 87.59例10-8 某醫(yī)生用A,B兩種藥物治療急性下呼吸道感染.A藥治療74例,有效68例;B藥治療63例,有效52例.問兩種藥物的有效率是否

8、有差別?處理 有效 無效 合計 有效率(%)A 藥 68 (64.82) 6 (9.18) 74 91.89B 藥 52 (55.18) 11(7.82) 63 82.54合計 120 17 137 87.59二. 2 檢驗的基本步驟建立檢驗假設,確定檢驗水準 H0: 1= 2 H1: 1 2 2. 計算2 值 資料類型不同,計算公式不同3. 確定 P 值, 判斷結果 根據(jù)查2 界值表, 確定P值三. 四格表資料的2 檢驗 1. 四格表資料的2 檢驗的專用公式 df =(R-1)(C-1)=1四格表資料的2 檢驗的校正 - Yates 連續(xù)校正校正公式:校正的目的: 英國統(tǒng)計學家(Yates)

9、認為2分布是一種連續(xù)性分布,而四格表中的資料屬離散性分布,得到的2統(tǒng)計量的抽樣分布也是離散的.因此,為改善2統(tǒng)計量分布的連續(xù)性,建議進行校正. 連續(xù)性校正應遵循的條件:1. T 5, 且 N 40時, 用非校正的公式2. 1 T 5,且N 40時,用連續(xù)性校正公 式3. T 1 或 N40:當 b+c40 時, 用校正公式. (McNemar 檢驗)4. 行列表資料的2檢驗 (R C 表資料)基本公式: A 每個格子的實際頻數(shù) nR A所對應的行合計nC A所對應的列合計例10-12. 某研究者欲比較甲、乙、丙三家醫(yī)院住院患者院內感染情況,隨機抽查同一時期住院患者感染情況,結果如下:試比較三家

10、醫(yī)院院內感染率有無差別。表10-12 三家醫(yī)院住院患者的院內感染率比較 醫(yī)院 感染 未感染 合計 合計 77 509 586 甲 43 188 231 乙 19 170 189 丙 15 151 166H0:三家醫(yī)院院內感染率相同H1:三家醫(yī)院院內感染率不相同或不全相同 df=(行數(shù)-1)(列數(shù)-1) (31)(21) =2查X2界值表: X20.05(2)=5.99 X20.01(2)=9.21 按,拒絕H0,接受H1,差別有統(tǒng)計學意義,即可認為三家醫(yī)院住院病人的院內感染率有差別。然而,三者之間誰和誰有差別,還不知道。應該進一步進行兩兩比較兩兩比較,可采用 X2分割行列表資料2檢驗應注意事項

11、 1. 行列表資料2檢驗公式的應用條件: 不能有1/5以上的格子的理論數(shù)5, 或者,不能有1個格子的理論數(shù)1 2. 如果資料不能滿足上述條件,則可以通過 (1) 在可能的情況下再增加樣本量; (2)專業(yè)上允許的情況下,合并相鄰的行或列; (3) 刪去理論數(shù)太小的行和列 3. 假設檢驗結果有差別,只能認為總的率或構成比有差別4. 單向有序變量(等級資料)的行列表,不能用X2檢驗比較組間效應,如果作X2,只能說明個處理組間的效應在構成比上有無差別。表10-12 中藥和西藥對某病的療效比較 藥物 治愈 好轉 無效 合計 合計 163 102 70 335 中藥 78 42 32 152 西藥 85

12、60 38 183小結 計數(shù)資料的統(tǒng)計描述 指標: 率、構成比、相對比 計數(shù)資料的統(tǒng)計推斷 總體參數(shù)估計:PuSp 率的假設檢驗: 樣本率與總體率的比較 - u檢驗 兩個大樣本率的比較 - u檢驗 兩個樣本率的比較 - 2檢驗 配對設計資料的兩個率比較 - 2檢驗 多個樣本率的比較 - RC表的2檢驗 假設檢驗的基本步驟完全相同統(tǒng)計資料處理的基本思路 資料的整理 : 統(tǒng)計圖,統(tǒng)計表統(tǒng)計資料的描述 (描述指標)統(tǒng)計學推斷 總體參數(shù)的估計(可信區(qū)間) 假設檢驗 統(tǒng)計資料類型的判斷例1. 某研究者欲比較甲乙兩藥治療高血壓的效果,進行了隨機對照試驗.甲乙藥組各選擇了50名病人,甲藥組血壓平均下降了10

13、.67mmHg,標準差是3.27mmHg, 乙藥組平均下降了13.20mmHg,標準差是4.33mmHg. 問兩藥降壓效果是否不同?例2. 為調查2型糖尿病發(fā)病易感因素,某研究者進行了一項以醫(yī)院為基礎的病例對照研究.結果發(fā)現(xiàn),在200名糖尿病病例中, 100人有糖尿病遺傳家族史;而200名對照者中只有50人有糖尿病家族史.問糖尿病家族史是否在兩組中分布不同?例3. 為比較A,B,C,D四種藥物治療小細胞肺癌的效果,將160人隨機分配進入四個治療組.每組40人.治療結果見下表,試比較四種藥物治療效果有無差別?處理組 有效 無效 合計 . A 藥 15 25 40 B 藥 10 30 40 C 藥 13 27 40 D 藥

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論