傳染病預(yù)警_第1頁
傳染病預(yù)警_第2頁
傳染病預(yù)警_第3頁
傳染病預(yù)警_第4頁
傳染病預(yù)警_第5頁
已閱讀5頁,還剩58頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

傳染病預(yù)警統(tǒng)計分析模型,北京市疾病預(yù)防控制中心 杜婧 2015年6月,基本概念,監(jiān)測:連續(xù)、系統(tǒng)地收集、分析、解讀疾病發(fā)生及相關(guān)影響因素的資料,并將其發(fā)現(xiàn)用于指導(dǎo)疾病控制實踐活動。預(yù)警:在傳染病暴發(fā)流行事件發(fā)生前或發(fā)生早期發(fā)出信號,以警示該事件可能發(fā)生或其發(fā)生的范圍、程度等可能擴大預(yù)測:以已有的與傳染病流行密切相關(guān)的信息為基礎(chǔ),采用一定的統(tǒng)計模型進行模擬分析,對傳染病未來的疫情水平和趨勢做出判斷,傳染病預(yù)警模型,基于控制圖的預(yù)警模型基于時間序列理論的預(yù)警模型基于回歸理論的模時空掃描統(tǒng)計模型貝葉斯時空模型,基于控制圖的預(yù)警模型,控制圖法(control charts)移動平均法(moving average,MA)移動百分位數(shù)法(movable percentile method,MPM)累積和控制圖(cumulative sums,CUSUM)指數(shù)加權(quán)移動平均法(exponentially weighted moving average,EWMA),基于控制圖的預(yù)警模型,控制圖法原理:以歷史監(jiān)測數(shù)據(jù)為基礎(chǔ),確定監(jiān)測指標(biāo)的平均水平與標(biāo)準(zhǔn)差,按照正態(tài)分布的原理,以均數(shù)加減若干倍標(biāo)準(zhǔn)差作為控制限,監(jiān)控未來采集的監(jiān)測指標(biāo)是否“失控” 優(yōu)點:簡單明了缺點:不易發(fā)現(xiàn)較小的變化 均數(shù)-標(biāo)準(zhǔn)差圖對歷史數(shù)據(jù)具有正態(tài)分布假設(shè)不易滿足,基于控制圖的預(yù)警模型,基于控制圖的預(yù)警模型,移動百分位數(shù)法原理:中位數(shù)-極差控制圖計算歷史基線數(shù)據(jù)的百分位數(shù):優(yōu)點:非參數(shù)方法,不需要數(shù)據(jù)理論的分布假定缺點:需要一定數(shù)量的歷史基線數(shù)據(jù),北京市2015年5月猩紅熱預(yù)警示意圖(MPM),基于控制圖的預(yù)警模型,在此處鍵入公式。,基于控制圖的預(yù)警模型,根據(jù)其識別異常的靈敏度,美國CDC將Ct分為三類: C1-MILD C2-MEDIUM C3-ULTRA,模型評價的統(tǒng)計方法,意義:比較不同預(yù)警算法的差異探索模型優(yōu)化,如確定模型參數(shù),確定預(yù)警線探討可能因素對預(yù)警模型的影響,如不同基線數(shù)據(jù)特征、暴發(fā)類型、暴發(fā)強度等預(yù)警模型的評價是通過一系列指標(biāo)來實現(xiàn)的,最常用的指標(biāo)是對暴發(fā)事件探測的及時性、靈敏度和特異度,模型評價指標(biāo),及時性:從事件開始到檢測暴發(fā)之間的時間長度來衡量及時性指標(biāo):平均暴發(fā)探測滯后時間(天)采用模擬暴發(fā)來研究模型的及時性,事件開始無法測量,舉例:,采用人工插入暴發(fā)作為目標(biāo)事件,測試MPM法預(yù)警效果探討的因素:疾病類型、暴發(fā)強度和無暴發(fā)時疾病基線水平,表:MPM模型:8種疾病不同強度暴發(fā)事件的預(yù)警平均滯后期(天),模型評價指標(biāo),靈敏度:預(yù)警模型發(fā)現(xiàn)暴發(fā)事件的能力;特異度:預(yù)測模型排除非暴發(fā)事件的能力;ROC曲線:即受試者工作特征曲線-以靈敏度為縱軸,假陽性率(1-特異度)為橫軸繪制;陽性預(yù)測值:模型發(fā)出的警報中真流行事件所占的比例;陰性預(yù)測值:模型未發(fā)出警報時非流行事件所占的比例;,定性資料的ROC分析-SPSS操作,例:,CUSUM 模型在流行性腮腺炎早期預(yù)警中的應(yīng)用研究 中國衛(wèi)生統(tǒng)計計2014 年8月第31卷第4期 以2011年11月1日2012年12年31日江蘇省每日發(fā)病數(shù)為實驗數(shù)據(jù),從2012年1月1日起以CUSUM 模型進行前瞻性試驗。 最終確定模型參數(shù)為h=3,k=0.5,基于時間序列理論的預(yù)警模型,基于時間序列理論的預(yù)警模型,時間序列定義: 時間序列是指某一個變量在相同時間間隔(年、月、周、日)上的不同測量值,按時間先后順序排列而形成的序列。常用軟件:Stata,Matlab,Eviews 和SAS 推薦軟件SAS 在SAS系統(tǒng)中有一個專門進行計量經(jīng)濟與時間序列分析的模塊,編程語言簡潔,輸出功能強大,分析結(jié)果精確,時間序列分析,平穩(wěn)時間序列 : ARMA 確定性分析 非平穩(wěn)時間序列 ARIMA 隨機性分析 殘差自回歸模型 條件異方差模型,時間序列預(yù)處理,平穩(wěn)性檢驗:時序圖檢驗 自相關(guān)圖檢驗隨機性檢驗:純隨機性檢驗,平穩(wěn)時間序列的定義?,由于P值顯著大于顯著性水平0.05,所以該序列不能拒絕純隨機的原假設(shè).如果序列平穩(wěn)白噪聲,則無可提取的有用信息如果序列平穩(wěn)非白噪聲序列,則采用平穩(wěn)非白噪聲序列的建模和預(yù)測方法,平穩(wěn)時間序列,AR(P):自回歸模型MA(Q):移動平均模型ARMA(p,q):自回歸移動平均模型,ARMA模型的定義,具有如下結(jié)構(gòu)的模型稱為自回歸移動平均模型,簡記為特別當(dāng) 時,稱為中心化 模型,模型識別,樣本自相關(guān)系數(shù),樣本偏自相關(guān)系數(shù),因為由于樣本的隨機性,樣本的相關(guān)系數(shù)不會呈現(xiàn)出理論截尾的完美情況,本應(yīng)截尾的樣本自相關(guān)系數(shù)或偏自相關(guān)系數(shù)仍會呈現(xiàn)出小值振蕩的情況由于平穩(wěn)時間序列通常都具有短期相關(guān)性,隨著延遲階數(shù) 樣本自相關(guān)系數(shù)或偏自相關(guān)系數(shù)都會衰減至零值附近作小值波動,平穩(wěn)時間序列建模步驟,平穩(wěn)非白噪聲序列,計算樣本相關(guān)系數(shù),模型識別,參數(shù)估計,模型檢驗,模型優(yōu)化,序列預(yù)測,Y,N,非平穩(wěn)時間序列分析,非平穩(wěn)數(shù)據(jù)的分析方法可以分為確定性分析和隨機分析兩大類確定性假定序列變化可以由一條趨勢線來刻畫 適用于具有典型趨勢特征變化數(shù)據(jù)的預(yù)測 常用確定型時間序列模型有指數(shù)曲線模型、二次曲線模型等。 許多傳染病資料并不具有某種典型趨勢特征,從而影響預(yù)測效果。此時隨機時間序列模型則顯示明顯優(yōu)勢隨機性分析常用的模型是ARIMA模型,ARIMA模型,ARIMA模型適用于各種復(fù)雜的時間序列模式,是目前較通用的預(yù)測方法之一,已廣泛應(yīng)用于傳染病發(fā)病率的預(yù)測,特別是具有季節(jié)性趨勢的傳染病預(yù)測。使用場合差分平穩(wěn)序列擬合模型結(jié)構(gòu),差分運算,一階差分 階差分 步差分,差分方式的選擇,序列蘊含著顯著的線性趨勢,一階差分就可以實現(xiàn)趨勢平穩(wěn) 序列蘊含著曲線趨勢,通常低階(二階或三階)差分就可以提取出曲線趨勢的影響 對于蘊含著固定周期的序列進行步長為周期長度的差分運算,通??梢暂^好地提取周期信息 足夠多次的差分運算可以充分地提取原序列中的非平穩(wěn)確定性信息但過度的差分會造成有用信息的浪費,差分后序列時序圖,一階差分,1階12步差分,ARIMA模型建模步驟,獲得觀察值序列,平穩(wěn)性檢驗,差分運算,Y,N,白噪聲檢驗,Y,分析結(jié)束,N,擬合ARIMA模型,乘積ARIMA(p , d , q)(P ,D ,Q)s 模型,有的季節(jié)性時間序列不僅含有季節(jié)性成分, 還混有非季節(jié)性成分, 若單一用季節(jié)性或非季節(jié)性ARIMA 模型進行分析, 其預(yù)測效果往往不理想。季節(jié)性ARIMA 與非季節(jié)性ARIMA 的混合效應(yīng)通常表現(xiàn)為相乘的形式模型完整的結(jié)構(gòu)如下:,例:ARIMA乘積季節(jié)模型在上海市甲肝發(fā)病預(yù)測中的應(yīng)用,資料來源:上海市疾病預(yù)防控制中心歷史疫情資料,即1990年至2011年上海市按月報告甲肝病例數(shù)作為建模數(shù)據(jù),2012年月發(fā)病數(shù)作為預(yù)測效果評估數(shù)據(jù)。,例:ARIMA乘積季節(jié)模型在上海市甲肝發(fā)病預(yù)測中的應(yīng)用,例:ARIMA乘積季節(jié)模型在上海市甲肝發(fā)病預(yù)測中的應(yīng)用,例:ARIMA乘積季節(jié)模型在上海市甲肝發(fā)病預(yù)測中的應(yīng)用,預(yù)測顯示2012年月的發(fā)病數(shù)低于既往歷史發(fā)病水平,而2012年月實際發(fā)病數(shù)未出現(xiàn)明顯季節(jié)高峰。 ARIMA模型應(yīng)用于短期預(yù)測的效果較好,利用和及時補充新的數(shù)據(jù)進行模型的再次擬合,可滿足傳染病疫情預(yù)測和預(yù)警的需要。,SAS 操作,練習(xí)數(shù)據(jù):19902014年甲肝發(fā)病數(shù)(分月)可以使用19902008年數(shù)據(jù)作為訓(xùn)練集,時空掃描統(tǒng)計模型,時空掃描統(tǒng)計模型,在監(jiān)測的區(qū)域內(nèi),有時盡管出現(xiàn)了局部傳染病暴發(fā),如果局部暴發(fā)的病例數(shù)沒有使整個區(qū)域病例數(shù)顯著增加時,時間模型將難以發(fā)現(xiàn)這種暴發(fā)疫情。空間數(shù)據(jù)的統(tǒng)計分析是現(xiàn)代統(tǒng)計學(xué)發(fā)展迅速的一個分支領(lǐng)域,基于時空維度的預(yù)警模型得益于空間統(tǒng)計學(xué)的發(fā)展,用于揭示監(jiān)測指標(biāo)的空間特征,特別是早期發(fā)現(xiàn)傳染病在地理空間上的聚集性,據(jù)此發(fā)出預(yù)警信號。,時空掃描統(tǒng)計模型,時空掃描統(tǒng)計模型,時空掃描統(tǒng)計模型,統(tǒng)計假設(shè)的原假設(shè)為:病例在時間和空間上的分布是完全隨機的; 備擇假設(shè)為:與掃描窗口外比,掃描窗口內(nèi)的發(fā)病水平高;優(yōu)點:綜合考慮了時間和空間信息; 掃描窗口動態(tài)變化,避免了選擇偏移; 不需要人口數(shù)據(jù); 不僅能定性判定是否存在聚集,還能定量判定聚集程度;局限:基于各子區(qū)域內(nèi)人口增長速度一致的前提假設(shè); 掃描半徑及掃描時間長度設(shè)置缺乏客觀標(biāo)準(zhǔn); 時空掃描統(tǒng)計在探測不規(guī)則形狀的聚集,如沿河流域的集聚方面,存在局限性;,時空掃描統(tǒng)計模型,SaTScan v9.4.1/download.html,軟件主界面,例:離散泊松時空模型:在新墨西哥州腦腫瘤發(fā)病率,病例文件: nm.cas 格式: 人口文件: nm.pop 格式: 坐標(biāo)文件: nm.geo 格式: 研究時間: 1973-1991集合: 32 counties病例時間精度: Years坐標(biāo)系: Cartesian變量 #1, 年齡分組: 1 = 0-4 years, 2 = 5-9 years, . 18 = 85+ years變量 #2, 性別: 1 = male, 2 = female人口統(tǒng)計年: 1973, 1982, 1991數(shù)據(jù)資源: New Mexico SEER T

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論