流行病學(xué)數(shù)據(jù)的分析處理方法課件_第1頁
流行病學(xué)數(shù)據(jù)的分析處理方法課件_第2頁
流行病學(xué)數(shù)據(jù)的分析處理方法課件_第3頁
流行病學(xué)數(shù)據(jù)的分析處理方法課件_第4頁
流行病學(xué)數(shù)據(jù)的分析處理方法課件_第5頁
已閱讀5頁,還剩30頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、流行病學(xué)數(shù)據(jù)的分析處理方法1 School of Public HealthSchool of Public Health Shandong UniversityShandong University 流行病學(xué)數(shù)據(jù)的分析處理方法2 一、原始數(shù)據(jù)的檢查一、原始數(shù)據(jù)的檢查 在數(shù)據(jù)分析前需要對原始的流行病學(xué)調(diào)查研究數(shù)據(jù)在數(shù)據(jù)分析前需要對原始的流行病學(xué)調(diào)查研究數(shù)據(jù) 進(jìn)行一次進(jìn)行一次審查審查,發(fā)現(xiàn)可能存在的錯(cuò)誤、遺漏的研究變量取值和,發(fā)現(xiàn)可能存在的錯(cuò)誤、遺漏的研究變量取值和 其他問題,并其他問題,并采取相應(yīng)的措施進(jìn)行處理采取相應(yīng)的措施進(jìn)行處理。 u若在調(diào)查表中發(fā)現(xiàn)有若在調(diào)查表中發(fā)現(xiàn)有缺失的數(shù)據(jù)缺失的數(shù)據(jù)

2、,可以通過電話再次詢問,可以通過電話再次詢問 研究對象、查閱有關(guān)的記錄、應(yīng)用儲存的血液標(biāo)本重新檢研究對象、查閱有關(guān)的記錄、應(yīng)用儲存的血液標(biāo)本重新檢 測或再次取樣等措施進(jìn)行補(bǔ)充。測或再次取樣等措施進(jìn)行補(bǔ)充。 u若發(fā)現(xiàn)若發(fā)現(xiàn)邏輯錯(cuò)誤邏輯錯(cuò)誤,也要及時(shí)改正。需要對調(diào)查問卷進(jìn)行編,也要及時(shí)改正。需要對調(diào)查問卷進(jìn)行編 碼或者對已編碼的問卷進(jìn)行核查,避免重復(fù)和遺漏。碼或者對已編碼的問卷進(jìn)行核查,避免重復(fù)和遺漏。 流行病學(xué)數(shù)據(jù)的分析處理方法3 二、選擇合適的數(shù)據(jù)管理和數(shù)據(jù)分析軟件二、選擇合適的數(shù)據(jù)管理和數(shù)據(jù)分析軟件 l常用的數(shù)據(jù)管理軟件常用的數(shù)據(jù)管理軟件 Microsoft FoxProMicrosoft

3、FoxPro、Microsoft AccessMicrosoft Access、 Microsoft ExcelMicrosoft Excel 這些數(shù)據(jù)管理軟件也具有簡單這些數(shù)據(jù)管理軟件也具有簡單 的數(shù)據(jù)分析功能,的數(shù)據(jù)分析功能,ExcelExcel的數(shù)據(jù)分析功能更強(qiáng),不的數(shù)據(jù)分析功能更強(qiáng),不 僅可實(shí)現(xiàn)描述性統(tǒng)計(jì),還可以做僅可實(shí)現(xiàn)描述性統(tǒng)計(jì),還可以做t t檢驗(yàn)、方差分析、檢驗(yàn)、方差分析、 相關(guān)回歸分析等相關(guān)回歸分析等 u常用的數(shù)據(jù)分析軟件常用的數(shù)據(jù)分析軟件 SASSAS(Statistical Analysis SystemStatistical Analysis System)和和SPSSS

4、PSS (Statistical Package for Social ScienceStatistical Package for Social Science), 它們均具有很強(qiáng)的數(shù)據(jù)分析和數(shù)據(jù)管理的功能它們均具有很強(qiáng)的數(shù)據(jù)分析和數(shù)據(jù)管理的功能 流行病學(xué)數(shù)據(jù)的分析處理方法4 三、數(shù)據(jù)的計(jì)算機(jī)錄入三、數(shù)據(jù)的計(jì)算機(jī)錄入 ( (編號、定義變量名、變量數(shù)量化)編號、定義變量名、變量數(shù)量化) u編號:給編號:給每一個(gè)每一個(gè)調(diào)查表或調(diào)查對象調(diào)查表或調(diào)查對象一個(gè)一個(gè)編號編號 以識別錄入的數(shù)據(jù)與調(diào)查表或調(diào)查對象的對以識別錄入的數(shù)據(jù)與調(diào)查表或調(diào)查對象的對 應(yīng)關(guān)系應(yīng)關(guān)系(唯一性)(唯一性) p使用阿拉伯?dāng)?shù)字使

5、用阿拉伯?dāng)?shù)字1 1、2 2、33等給每份調(diào)查表按照順等給每份調(diào)查表按照順 序編號,這樣有利于以后對輸入的數(shù)據(jù)進(jìn)行檢查、序編號,這樣有利于以后對輸入的數(shù)據(jù)進(jìn)行檢查、 核對與修改錯(cuò)誤。核對與修改錯(cuò)誤。 p可以給編號以時(shí)間、地區(qū)、單位、調(diào)查對象編號可以給編號以時(shí)間、地區(qū)、單位、調(diào)查對象編號 等,如:等,如:200501200501(濟(jì)南)(濟(jì)南)0202(歷下)(歷下)00010001(調(diào)查(調(diào)查 對象)對象) 流行病學(xué)數(shù)據(jù)的分析處理方法5 u定義變量名稱:定義變量名稱: 命名:可以應(yīng)用中文、拼音、也可以應(yīng)用英文,但以命名:可以應(yīng)用中文、拼音、也可以應(yīng)用英文,但以 使用拼音或英文為好,這樣可以方便輸

6、入。使用拼音或英文為好,這樣可以方便輸入。 注意:注意: p 變量名應(yīng)簡短、易懂易記:如對性別、年齡、身高、體重可變量名應(yīng)簡短、易懂易記:如對性別、年齡、身高、體重可 以使用以使用gender, age, height 和和weight進(jìn)行命名。對名稱較進(jìn)行命名。對名稱較 長的變量,可以使用長的變量,可以使用簡寫簡寫,如,如wt表示表示weight、ht表示表示height。 p 標(biāo)記或說明:有些數(shù)據(jù)管理和分析軟件可變量進(jìn)行標(biāo)記或說標(biāo)記或說明:有些數(shù)據(jù)管理和分析軟件可變量進(jìn)行標(biāo)記或說 明,避免時(shí)間長久了而忘記數(shù)據(jù)庫中的變量名字,如對上述明,避免時(shí)間長久了而忘記數(shù)據(jù)庫中的變量名字,如對上述 Wt

7、可標(biāo)記為可標(biāo)記為“weight”。 流行病學(xué)數(shù)據(jù)的分析處理方法6 u變量數(shù)量化變量數(shù)量化 如果調(diào)查表的設(shè)計(jì)是如果調(diào)查表的設(shè)計(jì)是編碼式編碼式的,則此步驟可省略,的,則此步驟可省略, 直接直接將變量取值編碼的結(jié)果輸入計(jì)算機(jī)。將變量取值編碼的結(jié)果輸入計(jì)算機(jī)。 若若不是編碼式不是編碼式的調(diào)查結(jié)果,則需要對變量的取值的調(diào)查結(jié)果,則需要對變量的取值 結(jié)果進(jìn)行結(jié)果進(jìn)行編碼編碼( (數(shù)量化)數(shù)量化)。 流行病學(xué)數(shù)據(jù)的分析處理方法7 l常見變量的類型常見變量的類型 1 1、字符型、字符型(character type)(character type): 輸入字符如中文或英文輸入字符如中文或英文 2 2、數(shù)值型、

8、數(shù)值型(numerical type)(numerical type): 以數(shù)值的形式輸入以數(shù)值的形式輸入 3 3、日期型、日期型(data type)(data type): 按照規(guī)定的格式輸入日期數(shù)值按照規(guī)定的格式輸入日期數(shù)值 4 4、邏輯性(、邏輯性(logical typelogical type): : 流行病學(xué)數(shù)據(jù)的分析處理方法8 l變量數(shù)量化時(shí)應(yīng)注意:變量數(shù)量化時(shí)應(yīng)注意: (1)除日期型變量外)除日期型變量外盡量使用數(shù)值型變量盡量使用數(shù)值型變量 (2)某些數(shù)值變量)某些數(shù)值變量(numerical variable) 可可直接輸入變量的取值直接輸入變量的取值,如研究對象的身高、,

9、如研究對象的身高、 體重、血壓水平等。體重、血壓水平等。 (3)分類變量分類變量(categorical variable)及及 有有 序變量序變量(ordinal variable)則可將其取值進(jìn)則可將其取值進(jìn) 行行量化量化,然后再輸入計(jì)算機(jī),然后再輸入計(jì)算機(jī) 流行病學(xué)數(shù)據(jù)的分析處理方法9 白人白人1 黑人黑人2 西班牙裔人西班牙裔人3 亞太裔亞太裔4 其它種族其它種族5 注意:注意: 分類變量在進(jìn)行多因素分析時(shí),分類變量在進(jìn)行多因素分析時(shí),必須轉(zhuǎn)換成啞變量必須轉(zhuǎn)換成啞變量 (dummy variabledummy variable),不能直接將前述的取值),不能直接將前述的取值1 1、2

10、2、 3 3、4 4、5 5放入方程中進(jìn)行分析。放入方程中進(jìn)行分析。 流行病學(xué)數(shù)據(jù)的分析處理方法10 l有序變量的數(shù)量化順序合理,則可以直接進(jìn)行分析有序變量的數(shù)量化順序合理,則可以直接進(jìn)行分析 如:教育程度如:教育程度 文盲:文盲:0 小學(xué):小學(xué):1 中學(xué):中學(xué):2 高中及中專:高中及中專:3 大學(xué):大學(xué):4 碩士及以上:碩士及以上:5 流行病學(xué)數(shù)據(jù)的分析處理方法11 流行病學(xué)數(shù)據(jù)的分析處理方法12 五、數(shù)據(jù)的整理五、數(shù)據(jù)的整理 (一)數(shù)據(jù)分組(一)數(shù)據(jù)分組 l分類變量:分類變量: 按其原有的分類進(jìn)行分組,若有必要,可將性按其原有的分類進(jìn)行分組,若有必要,可將性 質(zhì)相近或差別不大的類別進(jìn)行合并

11、。如教育程度。質(zhì)相近或差別不大的類別進(jìn)行合并。如教育程度。 l數(shù)值變量:數(shù)值變量: 按照按照實(shí)際的生理、病理或臨床意義分組實(shí)際的生理、病理或臨床意義分組,如,如 體重指數(shù):低體重、正常體重、超重和肥胖體重指數(shù):低體重、正常體重、超重和肥胖 流行病學(xué)數(shù)據(jù)的分析處理方法13 按使用的按使用的方便程度和專業(yè)上慣用方便程度和專業(yè)上慣用的方的方 法分組,如年齡在某一個(gè)合適的范圍內(nèi)每法分組,如年齡在某一個(gè)合適的范圍內(nèi)每5 5歲或歲或 1010歲分成一組。歲分成一組。 按按分位數(shù)分組分位數(shù)分組,即首先找出四分位數(shù),即首先找出四分位數(shù) (quartile)或五分位數(shù)()或五分位數(shù)(quintile)的界值,)

12、的界值, 然后應(yīng)用這些界值將研究對象平均分成然后應(yīng)用這些界值將研究對象平均分成4組(每組(每 組組25%的研究對象)或的研究對象)或5組(每組組(每組20%的研究對的研究對 象)。象)。 流行病學(xué)數(shù)據(jù)的分析處理方法14 (二)數(shù)據(jù)的轉(zhuǎn)換二)數(shù)據(jù)的轉(zhuǎn)換 1、非正態(tài)數(shù)據(jù)的變量轉(zhuǎn)換、非正態(tài)數(shù)據(jù)的變量轉(zhuǎn)換 l 原理:原理: 正態(tài)分布正態(tài)分布 參數(shù)檢驗(yàn)參數(shù)檢驗(yàn)(parametric test) 非正態(tài)數(shù)據(jù)非正態(tài)數(shù)據(jù)非參數(shù)檢驗(yàn)非參數(shù)檢驗(yàn)(non-parametric test) (不是對原始數(shù)據(jù)檢驗(yàn))如:秩和檢驗(yàn)(不是對原始數(shù)據(jù)檢驗(yàn))如:秩和檢驗(yàn) (是對(是對 原始數(shù)據(jù)的秩次檢驗(yàn))原始數(shù)據(jù)的秩次檢驗(yàn)) l

13、 檢驗(yàn):正態(tài)性檢驗(yàn)、方差齊性檢驗(yàn)檢驗(yàn):正態(tài)性檢驗(yàn)、方差齊性檢驗(yàn) l 方法:對數(shù)變換;平方根變換;倒數(shù)變換方法:對數(shù)變換;平方根變換;倒數(shù)變換 流行病學(xué)數(shù)據(jù)的分析處理方法15 2 2、分類變量轉(zhuǎn)換成啞變量、分類變量轉(zhuǎn)換成啞變量 l原理:原理: 分類變量是分類變量是二分類尺度及順序尺度二分類尺度及順序尺度,則可,則可 直接應(yīng)用其原有的數(shù)量化數(shù)值。直接應(yīng)用其原有的數(shù)量化數(shù)值。 名義尺度名義尺度因?yàn)楦黝悇e間沒有順序關(guān)系,在因?yàn)楦黝悇e間沒有順序關(guān)系,在 進(jìn)行不同分析(包括多元分析、進(jìn)行不同分析(包括多元分析、logisticlogistic回歸、回歸、 CoxCox回歸等)時(shí),不能使用原始的計(jì)算機(jī)錄入回

14、歸等)時(shí),不能使用原始的計(jì)算機(jī)錄入 數(shù)值,必經(jīng)進(jìn)行變量轉(zhuǎn)換數(shù)值,必經(jīng)進(jìn)行變量轉(zhuǎn)換即將該變量轉(zhuǎn)換即將該變量轉(zhuǎn)換 成(水平數(shù)成(水平數(shù)-1 -1)個(gè)啞變量)個(gè)啞變量,再將這些新轉(zhuǎn)換的再將這些新轉(zhuǎn)換的 變量放入多因素模型中。變量放入多因素模型中。 流行病學(xué)數(shù)據(jù)的分析處理方法16 u方法:方法: 例如:將種族原始取值轉(zhuǎn)換成啞變量(新變量)例如:將種族原始取值轉(zhuǎn)換成啞變量(新變量) 表表1. 分類變量轉(zhuǎn)換成啞變量的方法分類變量轉(zhuǎn)換成啞變量的方法 新變量新變量 . 種族種族 原始取值原始取值(x1) x1-1 x1-2 x1-3 x1-4 白人白人 1 0 0 0 0 黑人黑人 2 1 0 0 0 亞太裔

15、亞太裔 3 0 1 0 0 西班牙裔人西班牙裔人 4 0 0 1 0 其它種族其它種族 5 0 0 0 1 新變量以白人為參照,新變量以白人為參照,X1X11 1表示黑人與白人比較,依此類推表示黑人與白人比較,依此類推 流行病學(xué)數(shù)據(jù)的分析處理方法17 六、確定擬分析的因變量和應(yīng)變量六、確定擬分析的因變量和應(yīng)變量 l因(自)變量因(自)變量(independent variable):是指是指 影響疾病的發(fā)生或健康狀況的分布的變量,影響疾病的發(fā)生或健康狀況的分布的變量, 是原因變量是原因變量 、已知變量、已知變量、x變量。變量。 l應(yīng)變量應(yīng)變量(dependent variable):是指隨因變

16、量是指隨因變量 的變化而發(fā)生變化的變量,是結(jié)果變量、預(yù)的變化而發(fā)生變化的變量,是結(jié)果變量、預(yù) 測變量、測變量、y變量。變量。 應(yīng)變量是在自變量作用下產(chǎn)生反應(yīng)的變量應(yīng)變量是在自變量作用下產(chǎn)生反應(yīng)的變量 流行病學(xué)數(shù)據(jù)的分析處理方法18 意義意義 l有助于選擇擬研究的變量:有助于選擇擬研究的變量:對調(diào)查表的設(shè)計(jì)具有指導(dǎo)對調(diào)查表的設(shè)計(jì)具有指導(dǎo) 作用作用 l可以指導(dǎo)數(shù)據(jù)分析方法的選擇可以指導(dǎo)數(shù)據(jù)分析方法的選擇: 因變量是分類變量:因變量是分類變量:采用采用2檢驗(yàn),檢驗(yàn), logistic回歸分析等?;貧w分析等。 因變量是數(shù)值變量:因變量是數(shù)值變量:采用采用t檢驗(yàn)、方差分析,檢驗(yàn)、方差分析, 協(xié)方差分析、

17、多元回歸等協(xié)方差分析、多元回歸等 。 l有助于模型的建立有助于模型的建立 :應(yīng)變量(:應(yīng)變量( y )放在模型的左側(cè),)放在模型的左側(cè), 因變量(因變量(x )放在模型的右側(cè)。)放在模型的右側(cè)。 流行病學(xué)數(shù)據(jù)的分析處理方法19 l例例1. 欲評價(jià)不同治療方法(口服藥物、注射胰島欲評價(jià)不同治療方法(口服藥物、注射胰島 素及膳食控制)對糖尿病人的治療效果(血糖水平),素及膳食控制)對糖尿病人的治療效果(血糖水平), 分析時(shí)要求調(diào)整病人的性別、年齡和病程的影響分析時(shí)要求調(diào)整病人的性別、年齡和病程的影響。 血糖水平(應(yīng)變量血糖水平(應(yīng)變量y y)= =治療方法(因變量治療方法(因變量x)+x)+其它協(xié)

18、其它協(xié) 變量變量 (covariate,性別、,性別、 年齡和病程)年齡和病程) l例例2. 欲分析脂蛋白(欲分析脂蛋白(a)與冠心病發(fā)生的關(guān)系。)與冠心病發(fā)生的關(guān)系。 冠心病冠心病( (應(yīng)變量應(yīng)變量y)=y)=脂蛋白脂蛋白(a)(a)(因變量因變量x)x) 流行病學(xué)數(shù)據(jù)的分析處理方法20 七、缺失數(shù)據(jù)(七、缺失數(shù)據(jù)(missing data)的處理)的處理 l 缺失數(shù)據(jù):是指其測量結(jié)果缺失。缺失數(shù)據(jù):是指其測量結(jié)果缺失。 產(chǎn)生的原因:產(chǎn)生的原因: 問卷調(diào)查:遺漏出生日期和年齡,調(diào)查結(jié)束后又無法補(bǔ)救問卷調(diào)查:遺漏出生日期和年齡,調(diào)查結(jié)束后又無法補(bǔ)救 實(shí)驗(yàn)室檢測:血脂或血糖因?yàn)檠辶坎蛔慊蜓芯繉?/p>

19、象拒絕采血實(shí)驗(yàn)室檢測:血脂或血糖因?yàn)檠辶坎蛔慊蜓芯繉ο缶芙^采血 而致而致 l 過去處理:僅用無缺失的數(shù)據(jù)進(jìn)行分析過去處理:僅用無缺失的數(shù)據(jù)進(jìn)行分析損失樣本量損失樣本量 缺失數(shù)據(jù)缺失數(shù)據(jù)“合理合理”賦值賦值人為賦值不一定合人為賦值不一定合 理理 流行病學(xué)數(shù)據(jù)的分析處理方法21 u現(xiàn)在處理現(xiàn)在處理 數(shù)據(jù)分析處理件軟處理數(shù)據(jù)分析處理件軟處理 :SAS自動(dòng)分析處理自動(dòng)分析處理 如一個(gè)數(shù)據(jù)庫中有性別和年齡等變量,性別有如一個(gè)數(shù)據(jù)庫中有性別和年齡等變量,性別有1010個(gè)個(gè) 缺失數(shù)據(jù),年齡有缺失數(shù)據(jù),年齡有3 3個(gè)缺失數(shù)據(jù):個(gè)缺失數(shù)據(jù): 分析性別時(shí)不包括性別缺失的分析性別時(shí)不包括性別缺失的10個(gè)個(gè)體個(gè)個(gè)體

20、 分析年齡時(shí)不包括缺失年齡的分析年齡時(shí)不包括缺失年齡的3個(gè)個(gè)體個(gè)個(gè)體 當(dāng)分析中(如多因素分析)共同使用了性別和年齡時(shí),分析當(dāng)分析中(如多因素分析)共同使用了性別和年齡時(shí),分析 的實(shí)際樣本數(shù)量是性別和年齡這兩個(gè)變量均不含缺失數(shù)據(jù)的的實(shí)際樣本數(shù)量是性別和年齡這兩個(gè)變量均不含缺失數(shù)據(jù)的 樣本樣本 流行病學(xué)數(shù)據(jù)的分析處理方法22 流行病學(xué)數(shù)據(jù)分析方法的選擇流行病學(xué)數(shù)據(jù)分析方法的選擇 一、流行病學(xué)數(shù)據(jù)的分析程序一、流行病學(xué)數(shù)據(jù)的分析程序 數(shù)值變量數(shù)值變量 正態(tài)性檢驗(yàn)正態(tài)性檢驗(yàn) 正態(tài)正態(tài) 數(shù)據(jù)轉(zhuǎn)換數(shù)據(jù)轉(zhuǎn)換 非正態(tài)非正態(tài) 參數(shù)檢驗(yàn)參數(shù)檢驗(yàn) 非參數(shù)檢驗(yàn)非參數(shù)檢驗(yàn) 圖圖1. 數(shù)值變量的分析程序數(shù)值變量的分析程序

21、 流行病學(xué)數(shù)據(jù)的分析處理方法23 單因素分析單因素分析 2檢檢 驗(yàn)驗(yàn) 分類變量分類變量 分層分析分層分析 多因素分析多因素分析 logistic回歸分析回歸分析 Cox回歸分析回歸分析 其它分析方法其它分析方法 圖圖2. 2. 分類分類變量的分析程序變量的分析程序 流行病學(xué)數(shù)據(jù)的分析處理方法24 二、根據(jù)研究設(shè)計(jì)類型選擇二、根據(jù)研究設(shè)計(jì)類型選擇 (一)成組比較的設(shè)計(jì)(一)成組比較的設(shè)計(jì) 兩組比較:兩組比較:t t檢驗(yàn)或檢驗(yàn)或2 2檢驗(yàn)檢驗(yàn) 多組比較:方差分析、行多組比較:方差分析、行列表列表2 2檢驗(yàn)檢驗(yàn) 病例對照研究:按其分析方法分析病例對照研究:按其分析方法分析 分級的病列對照研究:按其分

22、析方法分析分級的病列對照研究:按其分析方法分析 (二)配對(自身實(shí)驗(yàn)前后)設(shè)計(jì)(二)配對(自身實(shí)驗(yàn)前后)設(shè)計(jì) 配比的配比的t t檢驗(yàn)、檢驗(yàn)、2 2檢驗(yàn)檢驗(yàn) 配對的病例對照研究方法進(jìn)行數(shù)據(jù)配對的病例對照研究方法進(jìn)行數(shù)據(jù) 流行病學(xué)數(shù)據(jù)的分析處理方法25 (三)重復(fù)測量的設(shè)計(jì)(三)重復(fù)測量的設(shè)計(jì) 在給定一個(gè)處理因素后在不同的時(shí)間重復(fù)在給定一個(gè)處理因素后在不同的時(shí)間重復(fù) 測量某一效應(yīng)變量的改變情況。如欲評價(jià)生物制品接測量某一效應(yīng)變量的改變情況。如欲評價(jià)生物制品接 種后的免疫學(xué)效果,在接種后的種后的免疫學(xué)效果,在接種后的2 2周、周、4 4周、周、6 6周和周和8 8周周 測定抗體滴度:測定抗體滴度:重

23、復(fù)測量的方差分析方法重復(fù)測量的方差分析方法 (四)多因素設(shè)計(jì)(四)多因素設(shè)計(jì) 自變量是數(shù)值變量:多元回歸分析方法、協(xié)方差分自變量是數(shù)值變量:多元回歸分析方法、協(xié)方差分 析方法析方法 自變量分類變量:自變量分類變量:logisticlogistic回歸分析方法、判別分回歸分析方法、判別分 析方法、聚類分析方法析方法、聚類分析方法 流行病學(xué)數(shù)據(jù)的分析處理方法26 三、根據(jù)變量的類型選擇三、根據(jù)變量的類型選擇 因變量 應(yīng)變量(y) (x) 數(shù)值變量 分類變量有序變量 數(shù)值變量 相關(guān)分析,多元回 歸分析 t檢驗(yàn),方差分析,協(xié) 方差分析,多元回 歸分析 相關(guān)分析,多元 回歸分析 分類變量 t檢驗(yàn),方差分

24、析, logistic回歸分析,判 別分析,聚類分析 2檢驗(yàn),logistic回 歸分析 2檢驗(yàn) 有序變量 方差分析,logistic 回歸分析,判別分析, 聚類分析 2檢驗(yàn),logistic回 歸分析 相關(guān)分析, 2 檢驗(yàn) 生存時(shí)間生存分析 流行病學(xué)數(shù)據(jù)的分析處理方法27 表表3. 3. 不同研究設(shè)計(jì)和數(shù)據(jù)類型的數(shù)據(jù)分析方法選擇不同研究設(shè)計(jì)和數(shù)據(jù)類型的數(shù)據(jù)分析方法選擇 研究設(shè)計(jì)類型 變量 類型 兩組比 較 兩組以上比 較 實(shí)驗(yàn)前后比較重復(fù)測量兩變量間 的聯(lián)系 數(shù)值 變量 t檢驗(yàn)方差分析配對t檢驗(yàn)重復(fù)測量 的方差分 析 線性回歸 Pearson 相關(guān)系數(shù) 分類 變量 2檢驗(yàn)2檢驗(yàn)配對2檢驗(yàn)列聯(lián)

25、表相 關(guān)系數(shù) 有序 變量 Mann- Whitney 秩和檢 驗(yàn) Kruskal- Wallis分析 (成組設(shè)計(jì)多 個(gè)樣本比較的 秩和檢驗(yàn) ) Wilcoxon符號秩 和檢驗(yàn) (配對 設(shè)計(jì)差值的符號 檢驗(yàn)) Spearma n相關(guān)系 數(shù) 生存 時(shí)間 生存分 析 流行病學(xué)數(shù)據(jù)的分析處理方法28 不同流行病學(xué)研究類型的數(shù)據(jù)分析方法不同流行病學(xué)研究類型的數(shù)據(jù)分析方法 一、描述性研究一、描述性研究 (一)現(xiàn)況研究(一)現(xiàn)況研究 分布描述:患病率、危險(xiǎn)因素流行率、數(shù)值變量分布分布描述:患病率、危險(xiǎn)因素流行率、數(shù)值變量分布 探討因素:相關(guān)回歸分析、探討因素:相關(guān)回歸分析、2 2檢驗(yàn)、檢驗(yàn)、t t檢驗(yàn)、方差

26、分析、多因檢驗(yàn)、方差分析、多因 素分析、人群歸因危險(xiǎn)度素分析、人群歸因危險(xiǎn)度 (二)生態(tài)學(xué)研究(二)生態(tài)學(xué)研究 同現(xiàn)況研究同現(xiàn)況研究 (三)篩檢(三)篩檢 篩檢試驗(yàn)的真實(shí)性和可靠性篩檢試驗(yàn)的真實(shí)性和可靠性 人群中疾病、健康狀況、危險(xiǎn)因素篩選結(jié)果分析方法:同現(xiàn)人群中疾病、健康狀況、危險(xiǎn)因素篩選結(jié)果分析方法:同現(xiàn) 況研究況研究 流行病學(xué)數(shù)據(jù)的分析處理方法29 (一)病例對照研究 病例對照研究數(shù)據(jù)病例對照研究數(shù)據(jù) 成組設(shè)計(jì)成組設(shè)計(jì) 配比設(shè)計(jì)配比設(shè)計(jì) 粗粗OR分級分級OR劑量反應(yīng)劑量反應(yīng) 分層分層OR 分級分級OR劑量反劑量反 應(yīng)應(yīng) (趨勢趨勢2檢驗(yàn)檢驗(yàn)) (趨勢趨勢 2檢驗(yàn)檢驗(yàn) ) 分層分層OR 混雜與效應(yīng)修飾分析混雜與效應(yīng)修飾分析 混雜與效應(yīng)修飾分析混雜與效應(yīng)修飾分析 圖圖3. 3. 病例對照研究數(shù)據(jù)的分析程序病例對照研究數(shù)據(jù)的分析程序 流行病學(xué)數(shù)據(jù)的分析處理方法30 (二)隊(duì)列研究二)隊(duì)列研究 隊(duì)列研究數(shù)據(jù)隊(duì)列研究數(shù)據(jù) 人時(shí)、發(fā)病密度人時(shí)、發(fā)病密度/累積發(fā)病率累積發(fā)病率 粗粗RR、AR、AR%、PAR及及PAR% 分層分層RR、AR、AR%、PAR、PAR% 分級分級RR、AR、AR%、PAR、PAR 流行病學(xué)數(shù)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論