版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
流行病學(xué)數(shù)據(jù)的分析處理方法流行病學(xué)數(shù)據(jù)的分析處理方法第1頁2流行病學(xué)數(shù)據(jù)分析前準(zhǔn)備工作
一、原始數(shù)據(jù)檢驗(yàn)
在數(shù)據(jù)分析前需要對原始流行病學(xué)調(diào)查研究數(shù)據(jù)進(jìn)行一次審查,發(fā)覺可能存在錯(cuò)誤、遺漏研究變量取值和其它問題,并采取對應(yīng)辦法進(jìn)行處理。若在調(diào)查表中發(fā)覺有缺失數(shù)據(jù),能夠經(jīng)過電話再次問詢研究對象、查閱相關(guān)統(tǒng)計(jì)、應(yīng)用儲存血液標(biāo)本重新檢測或再次取樣等辦法進(jìn)行補(bǔ)充。若發(fā)覺邏輯錯(cuò)誤,也要及時(shí)更正。需要對調(diào)查問卷進(jìn)行編碼或者對已編碼問卷進(jìn)行核查,防止重復(fù)和遺漏。流行病學(xué)數(shù)據(jù)的分析處理方法第2頁3
二、選擇適當(dāng)數(shù)據(jù)管理和數(shù)據(jù)分析軟件常見數(shù)據(jù)管理軟件
MicrosoftFoxPro、MicrosoftAccess、MicrosoftExcel
這些數(shù)據(jù)管理軟件也含有簡單數(shù)據(jù)分析功效,Excel數(shù)據(jù)分析功效更強(qiáng),不但可實(shí)現(xiàn)描述性統(tǒng)計(jì),還能夠做t檢驗(yàn)、方差分析、相關(guān)回歸分析等常見數(shù)據(jù)分析軟件
SAS(StatisticalAnalysisSystem)和SPSS(StatisticalPackageforSocialScience),它們均含有很強(qiáng)數(shù)據(jù)分析和數(shù)據(jù)管理功效流行病學(xué)數(shù)據(jù)的分析處理方法第3頁4
三、數(shù)據(jù)計(jì)算機(jī)錄入(編號、定義變量名、變量數(shù)量化)編號:給每一個(gè)調(diào)查表或調(diào)查對象一個(gè)編號以識別錄入數(shù)據(jù)與調(diào)查表或調(diào)查對象對應(yīng)關(guān)系(唯一性)使用阿拉伯?dāng)?shù)字1、2、3…等給每份調(diào)查表按照次序編號,這么有利于以后對輸入數(shù)據(jù)進(jìn)行檢驗(yàn)、查對與修改錯(cuò)誤。能夠給編號以時(shí)間、地域、單位、調(diào)查對象編號等,如:01(濟(jì)南)02(歷下)0001(調(diào)查對象)流行病學(xué)數(shù)據(jù)的分析處理方法第4頁5
定義變量名稱:命名:能夠應(yīng)用漢字、拼音、也能夠應(yīng)用英文,但以使用拼音或英文為好,這么能夠方便輸入。注意:變量名應(yīng)簡短、易懂易記:如對性別、年紀(jì)、身高、體重能夠使用gender,age,height和weight進(jìn)行命名。對名稱較長變量,能夠使用簡寫,如wt表示weight、ht表示height。標(biāo)識或說明:有些數(shù)據(jù)管理和分析軟件可變量進(jìn)行標(biāo)識或說明,防止時(shí)間長久了而忘記數(shù)據(jù)庫中變量名字,如對上述Wt可標(biāo)識為“weight”。流行病學(xué)數(shù)據(jù)的分析處理方法第5頁6
變量數(shù)量化
假如調(diào)查表設(shè)計(jì)是編碼式,則此步驟可省略,直接將變量取值編碼結(jié)果輸入計(jì)算機(jī)。
若不是編碼式調(diào)查結(jié)果,則需要對變量取值結(jié)果進(jìn)行編碼(數(shù)量化)。
流行病學(xué)數(shù)據(jù)的分析處理方法第6頁7
常見變量類型
1、字符型(charactertype):
輸入字符如漢字或英文
2、數(shù)值型(numericaltype):
以數(shù)值形式輸入
3、日期型(datatype):
按照要求格式輸入日期數(shù)值4、邏輯性(logicaltype):
流行病學(xué)數(shù)據(jù)的分析處理方法第7頁8
變量數(shù)量化時(shí)應(yīng)注意:(1)除日期型變量外盡可能使用數(shù)值型變量(2)一些數(shù)值變量(numericalvariable)可直接輸入變量取值,如研究對象身高、體重、血壓水平等。(3)分類變量(categoricalvariable)及有序變量(ordinalvariable)則可將其取值進(jìn)行量化,然后再輸入計(jì)算機(jī)
流行病學(xué)數(shù)據(jù)的分析處理方法第8頁9
如:分類變量——種族白人—1黑人—2
西班牙裔人—3亞太裔—4
其它種族—5注意:
分類變量在進(jìn)行多原因分析時(shí),必須轉(zhuǎn)換成啞變量(dummyvariable),不能直接將前述取值1、2、3、4、5放入方程中進(jìn)行分析。
流行病學(xué)數(shù)據(jù)的分析處理方法第9頁10
有序變量數(shù)量化次序合理,則能夠直接進(jìn)行分析如:教育程度文盲:0
小學(xué):1
中學(xué):2
高中及中專:3
大學(xué):4
碩士及以上:5流行病學(xué)數(shù)據(jù)的分析處理方法第10頁11
四、數(shù)據(jù)檢驗(yàn)與查對(一)檢驗(yàn)數(shù)據(jù)庫結(jié)構(gòu)數(shù)據(jù)庫樣本數(shù)(觀察數(shù))、變量數(shù)、變量名稱及定義等。(二)檢驗(yàn)各變量取值情況查看變量取值范圍,有沒有邏輯錯(cuò)誤:如性別應(yīng)有兩個(gè)取值,若有2個(gè)以上取值,說明存在錯(cuò)誤。對數(shù)據(jù)變量要檢驗(yàn)其最小值(minimum)、最大值(maximum)、均數(shù)(mean)、中位數(shù)(median),并查看是否有異常取值(outlier),如極小值及極大值。
異常值若影響顯著時(shí)應(yīng)刪除流行病學(xué)數(shù)據(jù)的分析處理方法第11頁12
五、數(shù)據(jù)整理(一)數(shù)據(jù)分組分類變量:按其原有分類進(jìn)行分組,若有必要,可將性質(zhì)相近或差異不大類別進(jìn)行合并。如教育程度。數(shù)值變量:按照實(shí)際生理、病理或臨床意義分組,如體重指數(shù):低體重、正常體重、超重和肥胖
流行病學(xué)數(shù)據(jù)的分析處理方法第12頁13
按使用方便程度和專業(yè)上慣用方法分組,如年紀(jì)在某一個(gè)適當(dāng)范圍內(nèi)每5歲或10歲分成一組。按分位數(shù)分組,即首先找出四分位數(shù)(quartile)或五分位數(shù)(quintile)界值,然后應(yīng)用這些界值將研究對象平均分成4組(每組25%研究對象)或5組(每組20%研究對象)。流行病學(xué)數(shù)據(jù)的分析處理方法第13頁14
(二)數(shù)據(jù)轉(zhuǎn)換1、非正態(tài)數(shù)據(jù)變量轉(zhuǎn)換原理:
正態(tài)分布——參數(shù)檢驗(yàn)(parametrictest)
非正態(tài)數(shù)據(jù)——非參數(shù)檢驗(yàn)(non-parametrictest)
(不是對原始數(shù)據(jù)檢驗(yàn))如:秩和檢驗(yàn)(是對原始數(shù)據(jù)秩次檢驗(yàn))檢驗(yàn):正態(tài)性檢驗(yàn)、方差齊性檢驗(yàn)方法:對數(shù)變換;平方根變換;倒數(shù)變換
流行病學(xué)數(shù)據(jù)的分析處理方法第14頁15
2、分類變量轉(zhuǎn)換成啞變量原理:分類變量是二分類尺度及次序尺度,則可直接應(yīng)用其原有數(shù)量化數(shù)值。
名義尺度因?yàn)楦黝悇e間沒有次序關(guān)系,在進(jìn)行不一樣分析(包含多元分析、logistic回歸、Cox回歸等)時(shí),不能使用原始計(jì)算機(jī)錄入數(shù)值,必經(jīng)進(jìn)行變量轉(zhuǎn)換。即將該變量轉(zhuǎn)換成(水平數(shù)-1)個(gè)啞變量,再將這些新轉(zhuǎn)換變量放入多原因模型中。流行病學(xué)數(shù)據(jù)的分析處理方法第15頁16
方法:比如:將種族原始取值轉(zhuǎn)換成啞變量(新變量)
表1.分類變量轉(zhuǎn)換成啞變量方法
新變量.種族原始取值(x1)x1-1x1-2x1-3x1-4白人10000黑人21000亞太裔30100西班牙裔人40010其它種族50001新變量以白人為參考,X1-1表示黑人與白人比較,依這類推流行病學(xué)數(shù)據(jù)的分析處理方法第16頁17
六、確定擬分析因變量和應(yīng)變量因(自)變量(independentvariable):是指影響疾病發(fā)生或健康情況分布變量,是原因變量、已知變量、x變量。應(yīng)變量(dependentvariable):是指隨因變量改變而發(fā)生改變變量,是結(jié)果變量、預(yù)測變量、y變量。
應(yīng)變量是在自變量作用下產(chǎn)生反應(yīng)變量流行病學(xué)數(shù)據(jù)的分析處理方法第17頁18
意義有利于選擇擬研究變量:對調(diào)查表設(shè)計(jì)含有指導(dǎo)作用能夠指導(dǎo)數(shù)據(jù)分析方法選擇:
因變量是分類變量:采取Χ2檢驗(yàn),logistic回歸分析等。
因變量是數(shù)值變量:采取t檢驗(yàn)、方差分析,協(xié)方差分析、多元回歸等。有利于模型建立:應(yīng)變量(y)放在模型左側(cè),因變量(x)放在模型右側(cè)。流行病學(xué)數(shù)據(jù)的分析處理方法第18頁19
例1.
欲評價(jià)不一樣治療方法(口服藥品、注射胰島素及膳食控制)對糖尿病人治療效果(血糖水平),分析時(shí)要求調(diào)整病人性別、年紀(jì)和病程影響。
血糖水平(應(yīng)變量y)=治療方法(因變量x)+其它協(xié)變量
(covariate,性別、年紀(jì)和病程)例2.
欲分析脂蛋白(a)與冠心病發(fā)生關(guān)系。
冠心病(應(yīng)變量y)=脂蛋白(a)(因變量x)
流行病學(xué)數(shù)據(jù)的分析處理方法第19頁20
七、缺失數(shù)據(jù)(missingdata)處理缺失數(shù)據(jù):是指其測量結(jié)果缺失。
產(chǎn)生原因:問卷調(diào)查:遺漏出生日期和年紀(jì),調(diào)查結(jié)束后又無法補(bǔ)救試驗(yàn)室檢測:血脂或血糖因?yàn)檠辶坎蛔慊蜓芯繉ο缶芙^采血而致過去處理:僅用無缺失數(shù)據(jù)進(jìn)行分析—損失樣本量缺失數(shù)據(jù)“合理”賦值—人為賦值不一定合理流行病學(xué)數(shù)據(jù)的分析處理方法第20頁21
現(xiàn)在處理
數(shù)據(jù)分析處理件軟處理:SAS自動分析處理
如一個(gè)數(shù)據(jù)庫中有性別和年紀(jì)等變量,性別有10個(gè)缺失數(shù)據(jù),年紀(jì)有3個(gè)缺失數(shù)據(jù):分析性別時(shí)不包含性別缺失10個(gè)個(gè)體分析年紀(jì)時(shí)不包含缺失年紀(jì)3個(gè)個(gè)體當(dāng)分析中(如多原因分析)共同使用了性別和年紀(jì)時(shí),分析實(shí)際樣本數(shù)量是性別和年紀(jì)這兩個(gè)變量均不含缺失數(shù)據(jù)樣本流行病學(xué)數(shù)據(jù)的分析處理方法第21頁22流行病學(xué)數(shù)據(jù)分析方法選擇一、流行病學(xué)數(shù)據(jù)分析程序
數(shù)值變量
正態(tài)性檢驗(yàn)正態(tài)數(shù)據(jù)轉(zhuǎn)換非正態(tài)參數(shù)檢驗(yàn)非參數(shù)檢驗(yàn)
圖1.數(shù)值變量分析程序
流行病學(xué)數(shù)據(jù)的分析處理方法第22頁23
單原因分析Χ2檢驗(yàn)分類變量分層分析多原因分析logistic回歸分析
Cox回歸分析其它分析方法
圖2.分類變量分析程序
流行病學(xué)數(shù)據(jù)的分析處理方法第23頁24
二、依據(jù)研究設(shè)計(jì)類型選擇(一)成組比較設(shè)計(jì)兩組比較:t檢驗(yàn)或Χ2檢驗(yàn)多組比較:方差分析、行×列表Χ2檢驗(yàn)病例對照研究:按其分析方法分析分級病列對照研究:按其分析方法分析(二)配對(本身試驗(yàn)前后)設(shè)計(jì)配比t檢驗(yàn)、Χ2檢驗(yàn)配正確病例對照研究方法進(jìn)行數(shù)據(jù)
流行病學(xué)數(shù)據(jù)的分析處理方法第24頁25
(三)重復(fù)測量設(shè)計(jì)
在給定一個(gè)處理原因后在不一樣時(shí)間重復(fù)測量某一效應(yīng)變量改變情況。如欲評價(jià)生物制品接種后免疫學(xué)效果,在接種后2周、4周、6周和8周測定抗體滴度:重復(fù)測量方差分析方法
(四)多原因設(shè)計(jì)自變量是數(shù)值變量:多元回歸分析方法、協(xié)方差分析方法自變量分類變量:logistic回歸分析方法、判別分析方法、聚類分析方法流行病學(xué)數(shù)據(jù)的分析處理方法第25頁26
三、依據(jù)變量類型選擇
因變量
應(yīng)變量(y)
(x)數(shù)值變量分類變量有序變量數(shù)值變量相關(guān)分析,多元回歸分析t檢驗(yàn),方差分析,協(xié)方差分析,多元回歸分析相關(guān)分析,多元回歸分析分類變量t檢驗(yàn),方差分析,logistic回歸分析,判別分析,聚類分析Χ2檢驗(yàn),logistic回歸分析Χ2檢驗(yàn)有序變量方差分析,logistic回歸分析,判別分析,聚類分析Χ2檢驗(yàn),logistic回歸分析相關(guān)分析,Χ2檢驗(yàn)生存時(shí)間生存分析表2.不一樣變量類型數(shù)據(jù)分析方法選擇流行病學(xué)數(shù)據(jù)的分析處理方法第26頁27表3.不一樣研究設(shè)計(jì)和數(shù)據(jù)類型數(shù)據(jù)分析方法選擇
研究設(shè)計(jì)類型變量類型
兩組比較兩組以上比較試驗(yàn)前后比較重復(fù)測量兩變量間聯(lián)絡(luò)數(shù)值變量t檢驗(yàn)方差分析配對t檢驗(yàn)重復(fù)測量方差分析線性回歸Pearson相關(guān)系數(shù)分類變量Χ2檢驗(yàn)Χ2檢驗(yàn)配對Χ2檢驗(yàn)列聯(lián)表相關(guān)系數(shù)
有序變量Mann-Whitney秩和檢驗(yàn)Kruskal-Wallis分析(成組設(shè)計(jì)多個(gè)樣本比較秩和檢驗(yàn))Wilcoxon符號秩和檢驗(yàn)(配對設(shè)計(jì)差值符號檢驗(yàn))Spearman相關(guān)系數(shù)生存時(shí)間生存分析流行病學(xué)數(shù)據(jù)的分析處理方法第27頁28不一樣流行病學(xué)研究類型數(shù)據(jù)分析方法一、描述性研究(一)現(xiàn)況研究分布描述:患病率、危險(xiǎn)原因流行率、數(shù)值變量分布探討原因:相關(guān)回歸分析、Χ2檢驗(yàn)、t檢驗(yàn)、方差分析、多原因分析、人群歸因危險(xiǎn)度(二)生態(tài)學(xué)研究同現(xiàn)況研究(三)篩檢篩檢試驗(yàn)真實(shí)性和可靠性人群中疾病、健康情況、危險(xiǎn)原因篩選結(jié)果分析方法:同現(xiàn)況研究流行病學(xué)數(shù)據(jù)的分析處理方法第28頁29(一)病例對照研究
病例對照研究數(shù)據(jù)成組設(shè)計(jì)配比設(shè)計(jì)粗OR→分級OR→劑量反應(yīng)分層OR分級OR→劑量反應(yīng)
(趨勢Χ2檢驗(yàn))(趨勢Χ2檢驗(yàn)
)分層OR混雜與效應(yīng)修飾分析混雜與效應(yīng)修飾分析
圖3.病例對照研究數(shù)據(jù)分析程序
二、分析性研究數(shù)據(jù)分析方法流行病學(xué)數(shù)據(jù)的分析處理方法第29頁30(二)隊(duì)列研究
隊(duì)列研究數(shù)據(jù)
人時(shí)、發(fā)病密度/累積發(fā)病率
粗RR、AR、AR%、PAR及PAR%分層RR、AR、AR%、PAR、PAR%
分級RR、AR、AR%、PAR、PA
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度健康養(yǎng)生中心加盟管理合同4篇
- 2025年度美甲店美容護(hù)膚項(xiàng)目合作合同4篇
- 二零二五年度特種耐火材料采購及技術(shù)服務(wù)合同4篇
- 2025版農(nóng)產(chǎn)品電商平臺客戶服務(wù)外包合同4篇
- 二零二五年度民政局離婚協(xié)議書模板版權(quán)授權(quán)協(xié)議4篇
- 二零二五年度智能機(jī)器人研發(fā)與應(yīng)用股權(quán)質(zhì)押擔(dān)保合同
- 二零二五年度戀愛雙方子女撫養(yǎng)權(quán)及探望權(quán)合同2篇
- 2025年度抹灰工程施工材料采購合同范本4篇
- 2025年度農(nóng)場農(nóng)業(yè)產(chǎn)業(yè)鏈金融服務(wù)合同-@-1
- 二零二五年度高標(biāo)準(zhǔn)大棚建設(shè)與農(nóng)產(chǎn)品加工合作合同2篇
- 2024公路瀝青路面結(jié)構(gòu)內(nèi)部狀況三維探地雷達(dá)快速檢測規(guī)程
- 浙江省臺州市2021-2022學(xué)年高一上學(xué)期期末質(zhì)量評估政治試題 含解析
- 2024年高考真題-地理(河北卷) 含答案
- 中國高血壓防治指南(2024年修訂版)解讀課件
- 2024年浙江省中考科學(xué)試卷
- 2024風(fēng)力發(fā)電葉片維保作業(yè)技術(shù)規(guī)范
- 《思想道德與法治》課程教學(xué)大綱
- 2024光儲充一體化系統(tǒng)解決方案
- 2024年全國高考新課標(biāo)卷物理真題(含答案)
- 處理后事授權(quán)委托書
- 食材配送服務(wù)方案投標(biāo)方案(技術(shù)方案)
評論
0/150
提交評論