香港mems短期流行預(yù)測方法的應(yīng)用_第1頁
香港mems短期流行預(yù)測方法的應(yīng)用_第2頁
香港mems短期流行預(yù)測方法的應(yīng)用_第3頁
香港mems短期流行預(yù)測方法的應(yīng)用_第4頁
香港mems短期流行預(yù)測方法的應(yīng)用_第5頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

香港mems短期流行預(yù)測方法的應(yīng)用

嚴重的急性呼吸綜合征(ss)是新世界首次在世界范圍內(nèi)傳播的傳染病,平均死亡率為11%。SARS流行雖然結(jié)束了,但是其陰影并未完全消失,禽流感目前正在亞洲多個國家流行,因此,研究SARS流行規(guī)律,預(yù)測感染人數(shù)的變化趨勢,有著重要的醫(yī)學(xué)意義和社會價值,也可以為將來可能發(fā)生的新病毒性傳染病的預(yù)防與控制提供參考。以往的研究主要是通過數(shù)學(xué)模型描述SARS的傳播過程,分析感染人數(shù)的變化規(guī)律及預(yù)測流行的高峰期及結(jié)束期等。研究方法包括確定性微分方程、系統(tǒng)動力學(xué)模型、基于統(tǒng)計學(xué)和隨機過程進行建模等。但是這些研究大都只是采用一種方法,沒有聯(lián)合幾種方法對流行數(shù)據(jù)進行預(yù)測,并從中選出較好的預(yù)測流行的方法。本研究同時采用數(shù)理統(tǒng)計學(xué)與系統(tǒng)工程學(xué)方法,包括曲線擬合、Gamma分布、時間序列和灰色動態(tài)GM(1,1)模型等13種方法,對每日病例數(shù)進行預(yù)測,通過比較預(yù)測效果選出較好的預(yù)測方法,為今后預(yù)測SARS感染人數(shù)的變化規(guī)律及其預(yù)防控制提供依據(jù)。1材料和方法1.1全球“香港旅行”的發(fā)現(xiàn)香港每日SARS病例數(shù)據(jù)來源于香港衛(wèi)生署提供的每日SARS疫情通報。SARS在香港的流行始于2003年3月11日。世界衛(wèi)生組織于流行第74天(2003年5月23日)撤消對香港的旅行警告,因此,我們把流行第74天定義為流行結(jié)束。但是,在流行第75天至第93天期間,每天仍發(fā)現(xiàn)0~4例病例。香港從流行第94天(2003年6月12日)開始再沒有新增病例出現(xiàn)。1.2基于時間序列的方法由于各段流行曲線的平穩(wěn)度不同,其預(yù)測的難易程度也不同,因此,流行第1天至第73天被分為三段:上升段(流行第1天至第32天,即2003年3月11日至2003年4月11日)、上升高峰段(流行第1天至第59天,即2003年3月11日至2003年5月8日)和全段(流行第1天至第73天,即2003年3月11日至2003年5月22日)。以這3個時間段的每天累計病例數(shù)為X,分別對這3個時段的未來兩周的病例數(shù)(Y)進行預(yù)測,即分別預(yù)測流行高峰期、下降期和終末期的每天累計病例數(shù)。使用預(yù)測誤差、95%可信區(qū)間(CI)和配對t檢驗對不同方法的預(yù)測效果進行評價。預(yù)測病例平均數(shù)不超過實際病例平均數(shù)的95%CI、預(yù)測誤差最小和配對t檢驗P>0.053項中有2項者,其預(yù)測效果屬較佳。預(yù)測誤差=[|實際病例數(shù)-預(yù)測病例數(shù)|/=[|實際病例數(shù)?預(yù)測病例數(shù)|/實際病例數(shù)]×100%??傮w均數(shù)的95%可信區(qū)間=ˉX±1.96×Sˉx=Xˉˉˉ±1.96×Sxˉ。曲線擬合:我們對這三個時間段的日累計病例數(shù)分別與流行天數(shù)擬合直線方程、二次方程、三次方程、對數(shù)曲線、復(fù)合曲線、生長曲線、S形曲線、指數(shù)方程、反函數(shù)曲線、冪曲線和γ分布等11種模型,求出它們各個時間段的方程系數(shù)、預(yù)測的日累計病例數(shù)和預(yù)測誤差。從上述3個時段中選出3種預(yù)測效果比較好的方法對流行全程(流行第2天至第87天)進行日累計病例數(shù)和日發(fā)病數(shù)的預(yù)測及評價。時間序列自歸回綜合移動平均模型(ARIMA):首先定義時間變量,然后對數(shù)據(jù)進行平穩(wěn)化處理,使原序列滿足平穩(wěn)可逆的要求。差分是平穩(wěn)化處理的一種方法,先進行一次差分,再對一次差分作自相關(guān)圖,觀察數(shù)據(jù)是否平穩(wěn)了。如果還不平穩(wěn),就進行二次差分,直到數(shù)據(jù)達到平穩(wěn)化要求為止。接著進行ARIMA模型的識別,為目標序列定階,獲得幾個粗模型;對上述得到的粗模型進行參數(shù)估計及假設(shè)檢驗,做模型診斷;分別預(yù)測日累計病例數(shù)和發(fā)病數(shù),求出各自的預(yù)測誤差?;疑到y(tǒng)動態(tài)(新陳代謝)模型:灰色動態(tài)GM(1,1)模型是一個變量的一階微分方程,是灰色理論的重要組成部分。其根據(jù)過去的信息,經(jīng)數(shù)據(jù)列的生成,建立可預(yù)測數(shù)學(xué)模型。具體方法是首先將原始數(shù)列作累加生成處理,然后建立GM(1,1)新陳代謝模型進行預(yù)測。動態(tài)(新陳代謝)模型預(yù)測方法是假設(shè)原流行數(shù)列有7d的實際病例數(shù),每次預(yù)測未來1d的病例數(shù);在預(yù)測第8天的病例數(shù)后,去掉數(shù)列的第1個數(shù)(第1天的實際病例數(shù)),在數(shù)列末端增加1個新的數(shù)(第8天的實際病例數(shù)),維持原數(shù)列7個數(shù)不變;接著預(yù)測第9天的病例數(shù),依次類推。日累計病例數(shù)和發(fā)病數(shù)預(yù)測通過SPSS13.0forwindows和DPS6.05軟件完成,實際病例數(shù)與預(yù)測病例數(shù)的比較采用配對t檢驗。2結(jié)果2.1時間序列、灰色模型、分布預(yù)測誤差流行高峰期各種預(yù)測方法的日累計病例數(shù)預(yù)測結(jié)果見表1。預(yù)測平均數(shù)落在總體均數(shù)的95%可信區(qū)間內(nèi)的方法有時間序列、灰色模型、γ分布、三次曲線和二次曲線;預(yù)測誤差最小的前3位依次為時間序列(0,1,1)、灰色模型和γ分布,其預(yù)測誤差中位數(shù)分別為0.29%、1.05%和1.11%;預(yù)測誤差中位數(shù)最大的是復(fù)合曲線,為40.20%。13種方法中,時間序列對香港SARS流行高峰期(第33天至第46天)日累計病例數(shù)的預(yù)測效果是最佳的。2.2預(yù)測誤差1.1表1顯示了流行下降期各種預(yù)測方法的日累計病例數(shù)預(yù)測結(jié)果。13種方法中,預(yù)測平均數(shù)落在總體均數(shù)95%可信區(qū)間內(nèi)的只有γ分布和灰色模型;預(yù)測誤差中位數(shù)最小的是γ分布、灰色模型和時間序列(0,1,1),其預(yù)測誤差中位數(shù)分別為0.02%、0.12%和0.70%;預(yù)測誤差中位數(shù)最大的是指數(shù)曲線,為83.17%。13種模型中,γ分布對香港SARS流行下降期(第60天至第73天)日累計病例數(shù)的預(yù)測效果是最好的。2.3預(yù)測誤差的類型預(yù)測平均數(shù)落在總體均數(shù)95%可信區(qū)間內(nèi)的只有灰色模型,其預(yù)測誤差中位數(shù)也最小,為0.03%(見表1)。預(yù)測誤差中位數(shù)比較小的還有對數(shù)曲線(1.28%)和二次曲線(3.16%);預(yù)測誤差最大的是指數(shù)曲線(267.70%)。13種預(yù)測方法中,灰色模型對香港SARS流行終末期(第74天至第87天)日累計病例數(shù)的預(yù)測效果是最理想的。2.4預(yù)測誤差的1/1和3種模型預(yù)測效果比較采用上述3個時段預(yù)測效果比較好的3種方法:γ曲線、時間序列和灰色模型,分別對流行全程進行每日累計病例數(shù)和每日發(fā)病數(shù)進行預(yù)測及評價(見表2)。在每日累計病例數(shù)預(yù)測方面,預(yù)測平均數(shù)落在總體均數(shù)95%可信區(qū)間范圍內(nèi)的有灰色模型和時間序列;灰色模型預(yù)測誤差中位數(shù)最小,為0.16%(圖1);時間序列預(yù)測誤差中位數(shù)居中,為0.59%(圖2);γ曲線預(yù)測誤差中位數(shù)最大,為0.78%,決定系數(shù)R2=0.955(圖3)。但是,3種模型的預(yù)測病例數(shù)分別與相應(yīng)的實際病例數(shù)存在著差異(配對t-test,均P<0.01)。經(jīng)綜合評估發(fā)現(xiàn),3種模型中灰色模型對日累計病例數(shù)的預(yù)測效果相對比較好,平均預(yù)測精度>98%。在日發(fā)病數(shù)預(yù)測方面,預(yù)測均數(shù)落在總體均數(shù)95%可信區(qū)間范圍內(nèi)的有γ曲線、時間序列和灰色模型(見表2)。γ曲線的預(yù)測誤差中位數(shù)為0.27%;R2=0.661;預(yù)測發(fā)病數(shù)與實際發(fā)病數(shù)差異無統(tǒng)計學(xué)意義(配對t=1.424,P>0.05)。時間序列的預(yù)測誤差中位數(shù)為3.09%;預(yù)測發(fā)病數(shù)與實際發(fā)病數(shù)差異無統(tǒng)計學(xué)意義(配對t=0.001,P>0.05)(圖4)?;疑P偷念A(yù)測誤差中位數(shù)為0;預(yù)測發(fā)病數(shù)也與實際發(fā)病數(shù)相同(配對t=1.377,P>0.05)。通過綜合考慮每種模型預(yù)測誤差的中位數(shù)、平均數(shù)和標準差大小對3種模型的預(yù)測效果進行評價?;疑P偷念A(yù)測誤差中位數(shù)雖然最小,但標準差高達57.10%,似乎不是預(yù)測日發(fā)病數(shù)的首選方法。γ曲線和時間序列的預(yù)測誤差中位數(shù)、平均數(shù)和標準差都比較小,是預(yù)測日發(fā)病數(shù)的理想方法,平均預(yù)測精度分別>97%和>89%。3基于灰色模型的香港ss預(yù)測現(xiàn)有的預(yù)測方法約300種,常用的預(yù)測技術(shù)有回歸預(yù)測、時間序列預(yù)測、灰色預(yù)測、概率模型預(yù)測等方法,可以分為統(tǒng)計型、連續(xù)型和遞推型3大類。在研究SARS感染人數(shù)的變化規(guī)律及預(yù)測流行的高峰期及結(jié)束期方面,必須選擇合適的預(yù)測方法,因此,對不同方法的預(yù)測效果進行評價顯得尤其重要。傳染病發(fā)展的一個顯著特點是病例數(shù)隨時間而變化,病例有明顯的時間先后順序,關(guān)鍵是病例之間▲預(yù)測病例數(shù)平均數(shù)不超過實際病例數(shù)平均數(shù)的95%可信區(qū)間;△日發(fā)病實際數(shù)與預(yù)測病例數(shù)差異無統(tǒng)計學(xué)意義(均P>0.05)不相互獨立。時間序列分析的特色在于逐次的觀測值通常是不獨立的,而且分析時必須考慮數(shù)據(jù)的順序時間。其研究的不是變量間的因果關(guān)系,而是重點考察變量在時間方面的發(fā)展變化規(guī)律,并為之建立數(shù)學(xué)模型。ARIMA模型是時間序列建模中最重要、最常用和最復(fù)雜的手段。在我們的研究中,ARIMA模型對香港SARS日發(fā)病數(shù)的預(yù)測效果比較好;從圖形來看,預(yù)測發(fā)病數(shù)與實際發(fā)病數(shù)非常吻合(圖4);另外,其對日累計病例數(shù)的預(yù)測效果也不錯。日發(fā)病數(shù)數(shù)列和流行高峰期數(shù)列相對波動較大,比較難于預(yù)測。日發(fā)病數(shù)數(shù)列和流行高峰期數(shù)列的較佳預(yù)測方法都是時間序列,平均預(yù)測精度>89%,提示ARIMA模型適宜用于波動較大數(shù)列的預(yù)測。由于傳染病流行過程受干預(yù)措施等眾多因素的影響,時間序列分析假定病例數(shù)僅與時間有關(guān)顯然是不夠的。傳播動力學(xué)模型則考慮了預(yù)防措施等因素對流行過程的影響。系統(tǒng)行為數(shù)列往往是沒有規(guī)律的,是隨機變化的灰色量,采用統(tǒng)計方法進行預(yù)測需要大量數(shù)據(jù),且可以解決的問題比較少,難于處理非典型過程的資料。此外,回歸分析對新數(shù)據(jù)與老數(shù)據(jù)一視同仁;只注重過去數(shù)據(jù)的擬合,不注重外推性?;疑A(yù)測可以克服這些缺點?;疑到y(tǒng)(graysystem)是指部分信息已知,部分信息未知的系統(tǒng)?;疑到y(tǒng)理論認為雜亂無章的原始數(shù)據(jù)后面必然隱藏著某種規(guī)律?;疑A(yù)測是先用數(shù)據(jù)處理的方法,將雜亂無章的原始數(shù)據(jù)(灰色量)整理成規(guī)律性較強的生成數(shù)列再作研究。SARS是一個新發(fā)傳染病,很多流行影響因素尚不了解,因此,適合于使用灰色系統(tǒng)理論進行研究。每天的SARS病例數(shù)是一個受眾多因素影響的灰色量。這些因素間的關(guān)系難于準確描述,它們對SARS流行的作用更是無法精確定量計算。由于灰色量的大小是眾多影響因素的反映,從這個灰色量出發(fā)進行預(yù)測,就不需要各個影響因素的數(shù)據(jù),而可以從病例數(shù)時間序列本身挖掘有用信息,尋找內(nèi)在規(guī)律,建立模型預(yù)測未來?;疑A(yù)測數(shù)列的長度不同,其預(yù)測效果也不同;利用鄰近預(yù)測值的前7個數(shù)進行預(yù)測,預(yù)測值能更好地反映原數(shù)列的波動規(guī)律,每補充一個新數(shù)據(jù),便去掉一個最老的數(shù)據(jù),因為老數(shù)據(jù)的信息意義將隨時間推移而降低。因此,采用固定的7個數(shù)數(shù)列進行動態(tài)的灰色預(yù)測可以提高預(yù)測精度。我們應(yīng)用灰色新陳代謝模型對香港SARS的流行進行預(yù)測,結(jié)果理想。與日發(fā)病數(shù)相比,日累計病例數(shù)數(shù)列波動比較平穩(wěn);流行終末期數(shù)列相對波動也比較小,均較易預(yù)測。日累計病例數(shù)和流行終末期的最佳預(yù)測方法都是灰色模型,平均預(yù)測精度>86%,提示灰色模型適宜用于比較平穩(wěn)數(shù)列的預(yù)測。傳染病的發(fā)展是一個動態(tài)的過程,一般來說要經(jīng)歷一個“上升-高峰-回落-終末”的過程,因而傳染病的發(fā)病數(shù)與時間的關(guān)系,從圖形來看是一個曲線。γ分布兼有指數(shù)分布和冪分布的特點,因而適用性較廣。香港社區(qū)病例數(shù)的時間分布就呈典型的γ分布。我們發(fā)現(xiàn),γ模型的SARS病例預(yù)測病例數(shù)與實際病例數(shù)吻合程度也比較理想,其平均預(yù)測精度>88%(圖3)。有關(guān)傳染病流行的過程必須考慮本身的流行特征,簡單的曲線擬合過程能解釋復(fù)雜的流行過程,對于病例趨勢的預(yù)測需考慮外界的干預(yù)措施而不僅僅是趨勢外推。我們認為曲線擬合結(jié)果

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論