疫情數(shù)據(jù)監(jiān)控分析元數(shù)據(jù)說(shuō)明_第1頁(yè)
疫情數(shù)據(jù)監(jiān)控分析元數(shù)據(jù)說(shuō)明_第2頁(yè)
疫情數(shù)據(jù)監(jiān)控分析元數(shù)據(jù)說(shuō)明_第3頁(yè)
疫情數(shù)據(jù)監(jiān)控分析元數(shù)據(jù)說(shuō)明_第4頁(yè)
疫情數(shù)據(jù)監(jiān)控分析元數(shù)據(jù)說(shuō)明_第5頁(yè)
已閱讀5頁(yè),還剩12頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

Echarts繪圖疫情數(shù)據(jù)監(jiān)控分析元數(shù)據(jù)說(shuō)明導(dǎo)語(yǔ)方法元數(shù)據(jù)關(guān)鍵因素選擇預(yù)測(cè)導(dǎo)語(yǔ)/01導(dǎo)語(yǔ)

疫情數(shù)據(jù)監(jiān)控分析研究的創(chuàng)新點(diǎn)在于結(jié)合了醫(yī)療、社會(huì)和氣象學(xué)的數(shù)據(jù)。由于涉及許多的分類(lèi)變量,一些經(jīng)典的統(tǒng)計(jì)判別方法,如線(xiàn)性判別分析在這里就失效了。數(shù)據(jù)挖掘技術(shù)被用于從大量的數(shù)據(jù)集中挖掘未知的模式和信息,同時(shí)也提供了預(yù)測(cè)未來(lái)的方法,例如預(yù)測(cè)一名顧客是否會(huì)在某家超市里花上100美金。當(dāng)然,其他的數(shù)據(jù)挖掘技術(shù),如決策樹(shù),最近鄰分類(lèi)器,貝葉斯分類(lèi)器,神經(jīng)網(wǎng)絡(luò)和隨機(jī)森林等模型也可用于疾病預(yù)測(cè)模型。對(duì)于貝葉斯分類(lèi)器,它通常較強(qiáng)地依賴(lài)于穩(wěn)健性測(cè)試。最近鄰分類(lèi)器是一種弱分類(lèi)器,對(duì)于每一次分類(lèi)都需要模型的重建。例如:對(duì)于每個(gè)新加人的實(shí)例,都得計(jì)算其與分類(lèi)器現(xiàn)有樣本間的距離。通常這種計(jì)算是非常耗時(shí)的。

/02方法方法

由于各地區(qū)的環(huán)境不一樣,本研究認(rèn)為登革熱病毒的爆發(fā)是帶有區(qū)域性質(zhì)的那么,在登革熱病毒區(qū)域傳播的過(guò)程中,不同區(qū)域所表現(xiàn)出的發(fā)病率趨勢(shì)是否有所不同?按照發(fā)病時(shí)間一新增發(fā)病數(shù)量繪制每個(gè)區(qū)域間的爆發(fā)曲線(xiàn),登革熱爆發(fā)的區(qū)域特征包括以下4種:圖:四種爆發(fā)區(qū)域方法

在安全區(qū)域,由于輸人案例的影響,發(fā)病率在初期呈現(xiàn)上升趨勢(shì),過(guò)段時(shí)間后發(fā)病率又平緩的下降接近于0;在爆發(fā)區(qū)域,自發(fā)生首個(gè)病例后發(fā)病率快速上升且一直保持較高水平;在控制區(qū)域,發(fā)病率在初期呈上升趨勢(shì),經(jīng)過(guò)控制發(fā)病率迅速下降;在復(fù)發(fā)區(qū),登革熱的發(fā)病率在得到一段時(shí)間的控制之后,又呈上升趨勢(shì)。根據(jù)每個(gè)區(qū)域時(shí)間與發(fā)病率的曲線(xiàn)圖,不同區(qū)域可分為上述4種類(lèi)型。另外探尋登革熱傳播的潛在因素可通過(guò)搜索引擎針對(duì)這個(gè)區(qū)域該段時(shí)間內(nèi)發(fā)生的相關(guān)事件做相應(yīng)的搜索,這種尋找爆發(fā)因素的途徑類(lèi)似于文本挖掘里面的情感分析。針對(duì)每個(gè)關(guān)鍵詞,可通過(guò)量化作為模型的一個(gè)變量。

/03元數(shù)據(jù)元數(shù)據(jù)元數(shù)據(jù)-因變量理想狀態(tài)為,繪制每個(gè)小區(qū)的時(shí)間一發(fā)病率曲線(xiàn),根據(jù)該曲線(xiàn)圖形判斷該小區(qū)屬于4種爆發(fā)區(qū)域中的哪一類(lèi)別,并以此作為分類(lèi)變量。但是,由于本研究所得到的爆發(fā)區(qū)域顆粒度僅局限在行政區(qū)級(jí)別,無(wú)法下沉到患者的居住小區(qū),因此樣本顆粒度僅能以行政區(qū)作為單位。元數(shù)據(jù)-自變量流行病學(xué)變量衛(wèi)生環(huán)境是登革熱爆發(fā)的一個(gè)主要因素,建筑材料的浪費(fèi)、垃圾的回收頻率、建筑的使用年限等因素都是衛(wèi)生環(huán)境的一部分。為了消除地理位置對(duì)房?jī)r(jià)的影響,本文將該小區(qū)二手房?jī)r(jià)格除以周?chē)^(qū)二手房均價(jià)作為量化指標(biāo)。該指標(biāo)通過(guò)網(wǎng)絡(luò)爬蟲(chóng)技術(shù)從互聯(lián)網(wǎng)中獲得,標(biāo)的網(wǎng)址為安居客網(wǎng)站廣州區(qū)域。由于蚊蟲(chóng)在較為干凈和安靜的水域中容易滋生,本研究將該行政區(qū)域內(nèi)所含有的河流面積、汽車(chē)修理廠數(shù)量、批發(fā)市場(chǎng)數(shù)量作為量化指標(biāo)。元數(shù)據(jù)

人口密度是傳染病爆發(fā)的一個(gè)主要因素。隨著人口密度的增長(zhǎng),所在區(qū)域每個(gè)人患病的可能性也隨之增加。人口密度=在地區(qū)人口數(shù)/所在地區(qū)區(qū)域面積。本研究中該指標(biāo)的量化是在中國(guó)經(jīng)濟(jì)普查網(wǎng)站中得到相應(yīng)的數(shù)據(jù)。城市化進(jìn)程在一定程度上也刺激了所在地區(qū)的人口流動(dòng),也就增加了登革熱擴(kuò)散的可能性。本研究利用所在地域的國(guó)民生產(chǎn)總值來(lái)刻畫(huà)城市化進(jìn)程。這些數(shù)據(jù)可以在中國(guó)經(jīng)濟(jì)普查網(wǎng)站中得到。醫(yī)療環(huán)境因?yàn)榱餍行约膊「自谪毨丝谥袀鞑?,所以所在區(qū)域的醫(yī)療環(huán)境對(duì)于登革熱的傳播扮演著至關(guān)重要的角色!如果醫(yī)療資源足夠覆蓋該地區(qū)的所有患者,那么疾病將會(huì)被有效的控制。元數(shù)據(jù)氣候變量溫度由于蚊子在悶熱的夏天繁殖速度較快,溫度理所當(dāng)然成為登革熱傳播的一個(gè)重要因素。登革熱通常爆發(fā)于擁有長(zhǎng)時(shí)間悶熱環(huán)境的熱帶地區(qū),例如泰國(guó),印度,越南,南中國(guó)等。當(dāng)然在一些擁有輸人病例的城市里,情況也會(huì)有例外。為了量化溫度這個(gè)因素,本研究選擇所在區(qū)域每天的最高、最低和平均氣溫。濕度一些證據(jù)表明濕度對(duì)于蚊子的繁殖有重要的影響。在本文中,所在區(qū)域的平均濕度、最大濕度和最低濕度被納人回歸模型中。露點(diǎn)指的是空氣中水氣含量達(dá)到飽和的氣溫,低于此溫度時(shí)水氣從空氣中析出凝成水珠。沒(méi)有任何證據(jù)表明露點(diǎn)和登革熱的爆發(fā)有直接的關(guān)系。我們?cè)谖闹幸矊⑺{人模型中。風(fēng)速是一個(gè)基本的大氣比率。它是由于空氣從高壓往低壓移動(dòng)形成的。風(fēng)速影響著天氣預(yù)報(bào),航空航天和海上作業(yè),建筑項(xiàng)目的施工,動(dòng)植物的生長(zhǎng)等一些無(wú)法量化的活動(dòng)。

/04關(guān)鍵因素選擇關(guān)鍵因素選擇

建模的第一步就是決定哪些自變量對(duì)于登革熱的爆發(fā)有決定性的影響,即確定導(dǎo)致登革熱大規(guī)模爆發(fā)的原因。對(duì)此,本文將上述中所有的變量一起進(jìn)行回歸,欲通過(guò)逐步回歸法擬合出具有表達(dá)因素的影響因素。相應(yīng)的回歸模型可以表示為:MRc,t二+TOC+HEC,t+POPD+URd+HENd++SPC,t+Td,t+HUd,t+DPd,t+WSd,t+8其中MRc,t表示每個(gè)區(qū)域的日患病率,Toc表示所在地區(qū)的地形信息,HEC,t表示所在區(qū)域的衛(wèi)生醫(yī)療條件,POPd表示所在區(qū)域的人口密度,URd表示所在區(qū)域。該時(shí)間段的GDP,HENd表示所在區(qū)域該時(shí)間段每千人口醫(yī)生數(shù),SPC,t表示所在區(qū)域人群的平均特征,Td,tHUd,tDPd,t,WSd,t表示所在區(qū)域。該時(shí)間段的氣溫,濕度,露點(diǎn)和風(fēng)速。

/05預(yù)測(cè)預(yù)測(cè)

支持向量機(jī)作為分類(lèi)器判別某區(qū)域是否為登革熱的爆發(fā)區(qū)。根據(jù)4種登革熱區(qū)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論