




已閱讀5頁(yè),還剩25頁(yè)未讀, 繼續(xù)免費(fèi)閱讀
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
2011高教社杯全國(guó)大學(xué)生數(shù)學(xué)建模競(jìng)賽承 諾 書(shū)我們仔細(xì)閱讀了中國(guó)大學(xué)生數(shù)學(xué)建模競(jìng)賽的競(jìng)賽規(guī)則.我們完全明白,在競(jìng)賽開(kāi)始后參賽隊(duì)員不能以任何方式(包括電話、電子郵件、網(wǎng)上咨詢等)與隊(duì)外的任何人(包括指導(dǎo)教師)研究、討論與賽題有關(guān)的問(wèn)題。我們知道,抄襲別人的成果是違反競(jìng)賽規(guī)則的, 如果引用別人的成果或其他公開(kāi)的資料(包括網(wǎng)上查到的資料),必須按照規(guī)定的參考文獻(xiàn)的表述方式在正文引用處和參考文獻(xiàn)中明確列出。我們鄭重承諾,嚴(yán)格遵守競(jìng)賽規(guī)則,以保證競(jìng)賽的公正、公平性。如有違反競(jìng)賽規(guī)則的行為,我們將受到嚴(yán)肅處理。我們參賽選擇的題號(hào)是(從A/B/C/D中選擇一項(xiàng)填寫(xiě)): C 我們的參賽報(bào)名號(hào)為(如果賽區(qū)設(shè)置報(bào)名號(hào)的話): 139C01 所屬學(xué)校(請(qǐng)?zhí)顚?xiě)完整的全名): 浙江工貿(mào)職業(yè)技術(shù)學(xué)院 參賽隊(duì)員 (打印并簽名) :1. 鄭濟(jì)明 2. 王慶松 3. 朱松祥 指導(dǎo)教師或指導(dǎo)教師組負(fù)責(zé)人 (打印并簽名): 王積建 日期: 2012 年 9 月 10 日賽區(qū)評(píng)閱編號(hào)(由賽區(qū)組委會(huì)評(píng)閱前進(jìn)行編號(hào)):2011高教社杯全國(guó)大學(xué)生數(shù)學(xué)建模競(jìng)賽編 號(hào) 專 用 頁(yè)賽區(qū)評(píng)閱編號(hào)(由賽區(qū)組委會(huì)評(píng)閱前進(jìn)行編號(hào)):賽區(qū)評(píng)閱記錄(可供賽區(qū)評(píng)閱時(shí)使用):評(píng)閱人評(píng)分備注全國(guó)統(tǒng)一編號(hào)(由賽區(qū)組委會(huì)送交全國(guó)前編號(hào)):全國(guó)評(píng)閱編號(hào)(由全國(guó)組委會(huì)評(píng)閱前進(jìn)行編號(hào)): 腦卒中發(fā)病環(huán)境因素分析及干預(yù) 摘 要 關(guān)鍵詞:1、 問(wèn)題重述 21世紀(jì)人類倡導(dǎo)人與自然和諧發(fā)展,環(huán)境因素成為影響健康的重要因素。腦卒中(俗稱腦中風(fēng))就是與環(huán)境因素緊密相關(guān)且威脅人類生命的疾病之一。這種疾病的誘發(fā)已經(jīng)被證實(shí)與環(huán)境因素有關(guān),其中與氣溫和濕度存在著密切的關(guān)系。對(duì)腦卒中的發(fā)病的環(huán)境因素進(jìn)行分析,其目的是為了進(jìn)行疾病的風(fēng)險(xiǎn)評(píng)估,對(duì)腦卒中高危人群能夠及時(shí)采取干預(yù)措施,也讓尚未得病的健康人,或者亞健康人了解自己得腦卒中風(fēng)險(xiǎn)程度,進(jìn)行自我保護(hù)。同時(shí),通過(guò)數(shù)據(jù)模型的建立,掌握疾病發(fā)病率的規(guī)律,對(duì)于衛(wèi)生行政部門(mén)和醫(yī)療機(jī)構(gòu)合理調(diào)配醫(yī)務(wù)力量、改善就診治療環(huán)境、配置床位和醫(yī)療藥物等都具有實(shí)際的指導(dǎo)意義。現(xiàn)從中國(guó)某城市各家醫(yī)院2007年1月至2010年12月的腦卒中發(fā)病病例信息以及相應(yīng)期間當(dāng)?shù)氐闹鹑諝庀筚Y料(Appendix-C2)和 數(shù)據(jù)(見(jiàn)Appendix-C1)。需解決一下幾個(gè)問(wèn)題:?jiǎn)栴}一:根據(jù)病人基本信息,對(duì)發(fā)病人群進(jìn)行統(tǒng)計(jì)描述。問(wèn)題二:建立數(shù)學(xué)模型研究腦卒中發(fā)病率與氣溫、氣壓、相對(duì)濕度間的關(guān)系。問(wèn)題二 :查閱和搜集文獻(xiàn)中有關(guān)腦卒中高危人群的重要特征和關(guān)鍵指標(biāo),結(jié)合1、2中所得結(jié)論,對(duì)高危人群提出預(yù)警和干預(yù)的建議方案。 二、問(wèn)題分析 腦卒中(俗稱腦中風(fēng))作為威脅人類生命的疾病之一,并且病發(fā)的人群受環(huán)境因素的影響不斷擴(kuò)展。對(duì)腦卒中人群及受環(huán)境因素的影響分析來(lái)對(duì)疾病的風(fēng)險(xiǎn)評(píng)估,對(duì)腦卒中高危人群能夠及時(shí)采取干預(yù)措施成為一項(xiàng)無(wú)疑是一項(xiàng)十分復(fù)雜的系統(tǒng)工程。 對(duì)于問(wèn)題一,利用中國(guó)某城市各家醫(yī)院2007年1月至2010年12月的腦卒中發(fā)病病例信息以及相應(yīng)期間當(dāng)?shù)氐闹鹑諝庀筚Y料(Appendix-C2)和數(shù)據(jù)(見(jiàn)Appendix-C1)。通過(guò)excel對(duì)已知數(shù)據(jù)進(jìn)行統(tǒng)計(jì)整理,再利用matlab程序?qū)δX卒中病發(fā)者的性別指數(shù)、年齡指數(shù)、職業(yè)指數(shù)、月份指數(shù)進(jìn)行合理的統(tǒng)計(jì)得出相應(yīng)數(shù)據(jù)比率。 三、模型假設(shè)3.1模型假設(shè):1) 發(fā)病病例的信息中,若兩個(gè)病例的信息相同,則視為不同的兩個(gè)人;2)以診斷報(bào)告時(shí)間為準(zhǔn)來(lái)統(tǒng)計(jì)發(fā)病人群的數(shù)量;3)導(dǎo)致腦卒中發(fā)病的內(nèi)在原因只與性別、年齡、職業(yè)有關(guān);4)導(dǎo)致腦卒中發(fā)病的外在原因只與氣壓、溫度和濕度有關(guān);5)氣壓、溫度和濕度之間具有相關(guān)關(guān)系;6)月平均氣壓、月平均最高氣壓、月平均最低氣壓具有相關(guān)關(guān)系;7)月平均溫度、月平均最高溫度、月平均最低溫度具有相關(guān)關(guān)系;8)月平均濕度、月平均最高濕度、月平均最低濕度具有相關(guān)關(guān)系;9)關(guān)于環(huán)境因素如氣壓、溫度和濕度的觀測(cè)數(shù)據(jù)都是準(zhǔn)確可靠的;10)按照國(guó)際慣例1,發(fā)病率以10萬(wàn)人群的發(fā)病人數(shù)來(lái)表示。但由于本題是研究某地區(qū)的發(fā)病人數(shù),并沒(méi)有與其它地區(qū)比較,所以在本題分析中,發(fā)病率以發(fā)病人數(shù)來(lái)表示。四、符號(hào)說(shuō)明定義1,月平均氣壓是日平均氣壓的平均值。月平均最高氣壓是日平均最高氣壓的平均值。月平均最高氣壓是日平均最高氣壓的平均值。定義2,月平均溫度是日平均溫度的平均值。月平均最高溫度是日平均最高溫度的平均值。月平均最高溫度是日平均最高溫度的平均值。定義3,月平均濕度是日平均濕度的平均值。月平均最低濕度是日平均最低氣壓的平均值。表示男性病例總數(shù),表示女性病例總數(shù),表示總病例數(shù); 五、模型的建立及求解5.0發(fā)病人群數(shù)據(jù)的預(yù)處理 根據(jù)已知題意給出的中國(guó)某城市各家醫(yī)院2007年1月至2010年12月的腦卒中發(fā)病病例信息以及相應(yīng)期間當(dāng)?shù)刂鹑諝庀筚Y料,進(jìn)行如下數(shù)據(jù)預(yù)處理: 1)以2007年1月至2010年12月的一共48個(gè)月的腦卒中發(fā)病病例為準(zhǔn),其他時(shí)間數(shù)據(jù)應(yīng)當(dāng)刪除,一共得到58925個(gè)病例.2)如果病例的信息中,年齡與職業(yè)不符(例如:12周歲是老師)、診斷時(shí)間不詳、數(shù)據(jù)明顯出錯(cuò)的都不應(yīng)該考慮在統(tǒng)計(jì)范圍之內(nèi),應(yīng)當(dāng)刪掉。3)5.1對(duì)發(fā)病人群的統(tǒng)計(jì)分析(問(wèn)題1)5.1.1性別分析 1)性別差異性簡(jiǎn)單分析男、女性病發(fā)比例為 (1)其中,表示男性,表示女性。經(jīng)統(tǒng)計(jì),代入(1)得男、女病發(fā)比例分別為54.02%和45.98%(matlab程序見(jiàn)附錄1)。可見(jiàn)男性在腦卒中的病發(fā)者要大于女性腦卒中病發(fā)人數(shù)。2)單因素方差分析2逐月統(tǒng)計(jì)男女病例人數(shù),考察在相同時(shí)間點(diǎn)上男女人群發(fā)病人數(shù)是否有顯著差異,給定顯著性水平,分析結(jié)果為,對(duì)應(yīng)的(見(jiàn)圖1) , 又查表得,由于所以腦卒中發(fā)病男女人群有顯著差異(matlab程序見(jiàn)附錄2)。圖1 男女發(fā)病人群的單因素方差分析結(jié)果5.1.2不同年齡段發(fā)病人群差異性分析1)簡(jiǎn)單分析不同年齡階段發(fā)病比例為 (2)其中,分別表示“40歲以下”、“40-50”、“50-60”、“60-70”、“70-80”、“80以上”。經(jīng)統(tǒng)計(jì),將不同年齡階段腦卒中病發(fā)者人數(shù)代入(2)式,得到不同年齡階段腦卒中病發(fā)者比例,見(jiàn)圖2。(matlab程序見(jiàn)附錄3) 圖2 不同年齡段發(fā)病人群比例圖由圖2可以看出在50歲以下的人口中腦卒中病發(fā)的人數(shù)比例較小,70-80之間腦卒中的比例最為嚴(yán)重,80歲以上的人腦卒中較為嚴(yán)重,所以高齡的人是發(fā)生腦卒中的高危人群,我們應(yīng)當(dāng)高度關(guān)注。2)單因素方差分析根據(jù)圖2結(jié)果,剔除“40歲以下”和“40-50”年齡段,對(duì)其余4個(gè)年齡段進(jìn)行單因素方差分析,逐月統(tǒng)計(jì)不同年齡段發(fā)病人群人數(shù),考察在相同時(shí)間點(diǎn)上不同年齡段發(fā)病人群人數(shù)是否有顯著差異,給定顯著性水平,分析結(jié)果為,對(duì)應(yīng)的(見(jiàn)圖3) ,所以腦卒中不同年齡段發(fā)病人群有顯著差異(matlab程序見(jiàn)附錄4(tongji6.m和tongji60.m))。圖3 不同年齡段發(fā)病人群的單因素方差分析結(jié)果 5.1.3不同職業(yè)發(fā)病人群的差異性分析1)簡(jiǎn)單分析不同職業(yè)發(fā)病比例為 (3)其中,分別表示“農(nóng)民”、“工人”、“退休人員”、“教師”、“漁民”、“醫(yī)務(wù)人員”、“職工”、“離退人員”、“其它職業(yè)”。經(jīng)統(tǒng)計(jì),不同職業(yè)腦卒中病發(fā)者的比例,見(jiàn)圖4。(matlab程序見(jiàn)附錄4)圖4 不同職業(yè)病發(fā)者比例由圖4得出農(nóng)民、工人、退休人員、其他職業(yè)的人員患腦卒中的比例偏高,說(shuō)明了職業(yè)也是患腦卒中的重要因素。2)單因素方差分析根據(jù)圖4結(jié)果,對(duì)農(nóng)民、工人、退休人員進(jìn)行單因素方差分析,給定顯著性水平,分析結(jié)果為,對(duì)應(yīng)的(見(jiàn)圖5) ,所以腦卒中不同年齡段發(fā)病人群有顯著差異(matlab程序見(jiàn)附錄5(tongji7.m和tongji70.m))。圖5 不同年齡段發(fā)病人群的單因素方差分析結(jié)果5.1.4不同月份發(fā)病者的差異性分析1)簡(jiǎn)單分析定義季節(jié)指數(shù)為 (4)其中,為第月的平均人數(shù),為48個(gè)月的月平均人數(shù)。經(jīng)統(tǒng)計(jì),不同月份腦卒中病發(fā)者的比例,見(jiàn)圖6。(matlab程序見(jiàn)附錄6) 圖6 2007年-2010年各月季節(jié)指數(shù) 由圖6看出在五、六、七月份為腦卒中高發(fā)期,一、二月為低發(fā)期。5.2發(fā)病率與氣壓、氣溫、相對(duì)濕度間的關(guān)系分析(問(wèn)題2)由于題目提供了環(huán)境因素(氣壓、溫度和濕度)的8個(gè)變量,根據(jù)假設(shè)5)8),這8個(gè)變量間具有明顯的顯著相關(guān)關(guān)系,所以必須做降維處理,把8個(gè)變量整合成互不相關(guān)的少數(shù)幾個(gè)變量,然后再尋找發(fā)病率與這少數(shù)幾個(gè)變量的關(guān)系式。這需要進(jìn)行主成分分析。5.2.1主成分分析法31)基本原理主成分分析是把多個(gè)變量轉(zhuǎn)化為少數(shù)幾個(gè)新綜合變量的一種多元統(tǒng)計(jì)方法,其基本思想就是在保留原始變量盡可能多的信息的前提下達(dá)到降維的目的,從而簡(jiǎn)化問(wèn)題的復(fù)雜性并抓住問(wèn)題的主要矛盾.其手段是將原來(lái)眾多的具有一定相關(guān)性的變量重新組合成新的少數(shù)幾個(gè)相互無(wú)關(guān)的綜合變量(也叫抽象變量),來(lái)代替原來(lái)變量,這些新的綜合變量稱之為主成分.一般地說(shuō),利用主成分分析得到的主成分與原來(lái)的變量之間有如下基本關(guān)系:(1)每一個(gè)主成分都是各原始變量的線性組合.(2)主成分的數(shù)目大大少于原始變量的數(shù)目.(3)主成分保留了原始變量的絕大多數(shù)信息.(4)主成分之間互不相關(guān).據(jù)此我們建立數(shù)學(xué)模型.2)數(shù)學(xué)模型在一個(gè)統(tǒng)計(jì)問(wèn)題中,假設(shè)我們收集到個(gè)樣品,每個(gè)樣品觀測(cè)到個(gè)變量(記為為簡(jiǎn)單起見(jiàn),可以設(shè)均值為0,方差為1,(),構(gòu)成一個(gè)階的樣本原始資料陣.主成分分析的目的在于利用個(gè)原始變量()構(gòu)造少數(shù)幾個(gè)新的綜合變量,使得新變量為原始變量的線性組合,新變量互不相關(guān),新變量包含個(gè)原始變量的絕大部分信息.這樣定義為原始變量,為新的綜合變量指標(biāo),每一個(gè)新綜合變量指標(biāo)是個(gè)原始變量的線性組合: (5)同時(shí)要求滿足以下幾個(gè)條件:(1)與相互無(wú)關(guān);(2)是的一切線性組合中方差最大者;是與不相關(guān)的的所有線性組合中方差最大者;是分別都不相關(guān)的的所有線性組合中方差最大者.則新變量分別稱為原變量的第一、第二、第主成分.從以上的分析可以看出,主成分分析的實(shí)質(zhì)就是確定原來(lái)變量在諸主成分上的系數(shù).從數(shù)學(xué)上可以證明,他們分別是個(gè)原始變量()相關(guān)矩陣的前個(gè)具有較大特征值所對(duì)應(yīng)的特征向量,而各個(gè)新綜合變量的方差恰好是相應(yīng)的特征值.各主成分的方差貢獻(xiàn)大小按特征根順序排列,是依次遞減的,即.其幾何意義是:主成分分析相當(dāng)于對(duì)原坐標(biāo)軸做一次旋轉(zhuǎn)變換,使得新坐標(biāo)系的第1軸對(duì)應(yīng)于數(shù)據(jù)變易的最大方向,第2軸與第1軸正交,且對(duì)應(yīng)于數(shù)據(jù)變易的第二大方向,依次類推.3)基本步驟(1)確定分析變量,收集原始數(shù)據(jù);設(shè)原始數(shù)據(jù)矩陣為其中表示第個(gè)樣品(對(duì)象)在第個(gè)變量上的取值。(2)在進(jìn)行主成分分析之前,要檢驗(yàn)該樣本矩陣是否適合于主成分分析.KMO檢驗(yàn)是檢驗(yàn)變量之間偏相關(guān)關(guān)系的統(tǒng)計(jì)量,用于檢驗(yàn)變量間的偏相關(guān)系數(shù)是否過(guò)小. KMO統(tǒng)計(jì)量越接近于1,說(shuō)明各變量間的偏相關(guān)系數(shù)越大,KMO統(tǒng)計(jì)量大于0.9,效果最好;如果統(tǒng)計(jì)量小于0.6,則不適合于做主成分分析.Bartlett球形檢驗(yàn)是檢驗(yàn)相關(guān)矩陣是否是單位矩陣,即各變量是否各自獨(dú)立.(3)對(duì)原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化,即令 (6)其中分別為第列元素的樣本均值和樣本標(biāo)準(zhǔn)差,即則為標(biāo)準(zhǔn)化的樣本資料庫(kù).(4)由標(biāo)準(zhǔn)化后的數(shù)據(jù)矩陣求協(xié)方差矩陣,或者由原始數(shù)據(jù)矩陣求相關(guān)系數(shù)矩陣.這兩種方法結(jié)果相等.本文采用直接計(jì)算原始數(shù)據(jù)的相關(guān)矩陣的方法(對(duì)于數(shù)量級(jí)差別較大或者有量綱的數(shù)據(jù)宜適用).設(shè)原始數(shù)據(jù)的相關(guān)系數(shù)矩陣為 (7)為原變量與的相關(guān)系數(shù),其計(jì)算公式為 (8)(5)計(jì)算的特征根和特征向量;根據(jù)特征方程得的特征根為,將特征根按照從大到小的順序排列,排列后的特征根不妨仍然表示為.同時(shí)可得對(duì)應(yīng)的特征向量,將他們標(biāo)準(zhǔn)正交化,稱為主軸.(6)計(jì)算所有變量的方差貢獻(xiàn)率及累計(jì)方差貢獻(xiàn)率;的方差貢獻(xiàn)率為 (9)的累計(jì)方差貢獻(xiàn)率為 (10)(7)確定主成分的數(shù)目. 方法有:一般取累計(jì)貢獻(xiàn)率達(dá)85%95%的主成分;選用所有的主成分;累計(jì)特征值乘積大于1的主成分;畫(huà)出特征值變化曲線,以轉(zhuǎn)折點(diǎn)位置為標(biāo)準(zhǔn)判斷.本文采用累計(jì)貢獻(xiàn)率達(dá)85%95%的主成分. (8)確定主成分函數(shù)表達(dá)式模型. 設(shè)個(gè)主成分對(duì)應(yīng)的特征向量分別為,其中,表示的第行的元素,則第個(gè)主成分的函數(shù)表達(dá)式為 (11)(9)提煉主成分的抽象意義.由與的相關(guān)系數(shù)的大小可以確定主要與哪幾個(gè)變量顯著相關(guān),然后根據(jù)這幾個(gè)變量的實(shí)際意義提煉的抽象意義.(10)檢驗(yàn)主成分模型.根據(jù)個(gè)樣本的個(gè)主成分的函數(shù)值,通過(guò)計(jì)算個(gè)主成分的相關(guān)系數(shù)就可以檢驗(yàn)個(gè)主成分是否線性無(wú)關(guān).如果兩個(gè)主成分的相關(guān)系數(shù)為0,則說(shuō)明這兩個(gè)主成分線性無(wú)關(guān),模型有效;否則線性相關(guān),模型無(wú)效.(11)求主成分函數(shù)值。將各樣本標(biāo)準(zhǔn)化數(shù)據(jù)代入(7),可以求得各樣本的第個(gè)主成分的函數(shù)值.4)模型求解(1)收集原始數(shù)據(jù)矩陣.本文選取了某地區(qū)的月平均氣壓的平均值、月最高氣壓的平均值、月最低氣壓的平均值、月平均氣溫的平均值、月最高氣溫的平均值、月平均氣壓的平均值8項(xiàng)指標(biāo),并分別記為. 每個(gè)指標(biāo)有48個(gè)數(shù)據(jù)(見(jiàn)附件1)。使用SPSS軟件進(jìn)行求解(見(jiàn)附錄7)。(2)將原始數(shù)據(jù)標(biāo)準(zhǔn)化,(SPSS內(nèi)部計(jì)算).(3)求原始數(shù)據(jù)的相關(guān)系數(shù)矩陣,如圖7所示. 圖7 相關(guān)系數(shù)矩陣 圖8因子分析檢驗(yàn)圖從圖8看出,表格的第一行為檢驗(yàn)變量間偏相關(guān)程度的KMO統(tǒng)計(jì)量,其值在0.6之上才適合做主成分分析,效果顯著,如果小于0.6,效果不顯著,不適合做主成分分析。下面的三行為球形檢驗(yàn)的結(jié)果,球形檢驗(yàn)原假設(shè)的變量是不相關(guān)的,顯然只有拒絕原假設(shè)的情況下數(shù)據(jù)才適合做因子分析。本例中KMO值為0.720,球形檢驗(yàn)顯著,兩個(gè)條件都滿足,變量間相關(guān)程度大,適合做因子分析。(4)計(jì)算矩陣的特征根、各因子的方差貢獻(xiàn)率及累計(jì)方差貢獻(xiàn)率,并確定主成分的個(gè)數(shù).如圖9所示。圖9 特征值及其累計(jì)方差貢獻(xiàn)率從圖9中可以看出,第一、第二主成分對(duì)方差的累計(jì)貢獻(xiàn)率達(dá)到95.461%,它們分別對(duì)應(yīng)著原樣本數(shù)據(jù)點(diǎn)數(shù)據(jù)變異的最大、次大方向,是原變量系統(tǒng)的一個(gè)最佳整合,從而我們可以以95.461%的精度將變量的有效維數(shù)從8維降至2維.因此可以將前2個(gè)因子作為主因子.(5)確定主成分函數(shù)表達(dá)式模型,因子得分系數(shù)矩陣如圖10所示.圖10 因子得分系數(shù)矩陣 設(shè)2個(gè)主成分分別為,則建立模型為 (12) 其中均為原變量經(jīng)過(guò)均值為0,方差為1標(biāo)準(zhǔn)化后的變量.(6)對(duì)主成分的意義進(jìn)行解釋。圖11給出了原變量與第1、第2主成分的相關(guān)系數(shù).圖11 旋轉(zhuǎn)后的因子載荷矩陣第一主成分,與原變量(平均氣壓的平均值)、(最高氣壓的平均值)(最低氣壓的平均值)、(最低氣溫的平均值)的相關(guān)系數(shù)的絕對(duì)值都超過(guò)了0.948,因此它是一個(gè)反映氣溫和氣壓的綜合因子,我們稱之為氣壓溫度因子. 第二主成分,與原變量(月平均相對(duì)濕度的平均值)的相關(guān)系數(shù)為0.925、(月最低相對(duì)濕度的平均值)的相關(guān)系數(shù)為0.948,其余的都不超過(guò)0.266,因此它是一個(gè)反映相對(duì)濕度的因子,稱為濕度因子.(7)計(jì)算2個(gè)主成分的函數(shù)值.將48個(gè)經(jīng)過(guò)標(biāo)準(zhǔn)化的數(shù)據(jù)代入模型,可以得到48個(gè)地區(qū)的主成分的函數(shù)值,結(jié)果如表1所示. 表1 48個(gè)月對(duì)應(yīng)的主成分函數(shù)值序號(hào)y1y2z序號(hào)y1y2z1-1.68170.548548725-1.601-0.0619462-0.7683-0.208252826-1.1211.777993-0.4507-0.216678427-0.6750.007673940.152-1.5909858280.1144-0.91786151.1598-1.77581082290.9219-2.09885560.92590.75541137301.34170.058478871.52390.20971043311.35210.471575281.5284-0.42721080320.94021.664496290.56751.00551206330.35751.511582810-0.13180.1921265340.2595-0.72776911-0.6524-0.9464120235-1.0911.166766712-1.18930.5304129736-1.3310.315362313-1.5177-0.4902120937-1.4530.257784114-1.3599-1.3556171638-1.0830.8107128015-0.1654-2.0187178739-0.82301845-1.03159840-0.401-0.0761553170.9955-1.31491755410.7358-0.6591715180.67641.86591533420.78240.70991618191.6182-0.25252078431.24550.64451621201.14590.73561322441.3537-0.1331716210.5359158160.9467164722-0.18990.9149133146-0.2460.4312170923-0.90770.5766147547-0.531-0.633161524-1.036-0.9904147248-0.593-1.4721719(8)檢驗(yàn)主成分模型.由于主成分分析的4個(gè)條件中的前3個(gè)(每一個(gè)主成分都是各原始變量的線性組合;主成分的數(shù)目大大少于原始變量的數(shù)目;主成分保留了原始變量的絕大多數(shù)信息),只要檢驗(yàn)4個(gè)主成分是否相關(guān)即可.由步驟(7)計(jì)算的2個(gè)主成分的得分矩陣,求矩陣的協(xié)方差矩陣如圖12所示.圖12 因子得分的協(xié)方差矩陣從圖12可以看出,主成分得分的協(xié)方差矩陣為單位矩陣,說(shuō)明提取的2個(gè)主成分是互不相關(guān)的.滿足假設(shè)的條件,模型和結(jié)果有效.5.2.2多元非線性回歸分析4將48個(gè)月的發(fā)病率作為因變量,記作,將發(fā)病率的48個(gè)數(shù)據(jù)填入表1中。下面尋找發(fā)病率與主成分的關(guān)系式,這需要使用多元非線性回歸分析方法。經(jīng)過(guò)反復(fù)試驗(yàn)探索,找到的非線性回歸模型為 (13)其中,。 模型檢驗(yàn)的,說(shuō)明模型有效。平均絕對(duì)相對(duì)誤差為26.38%。5.2.3結(jié)果分析1)從非線性回歸模型(12)可以得到以下結(jié)論:(1)由可得,發(fā)病率與氣壓溫度因子具有正相關(guān)性;(2)由可得,發(fā)病率與濕度因子具有負(fù)相關(guān)性;(3)由可得,氣壓溫度因子比濕度因子對(duì)于發(fā)病率的影響顯著;2)從主成分模型(11)可以得到以下結(jié)論:由第1個(gè)方程可知:(1)由的系數(shù)為負(fù)值可得,氣壓溫度因子與月平均氣壓、月平均最高氣壓、月平均最低氣壓具有負(fù)相關(guān)性;(2)由的系數(shù)為正值可得,氣壓溫度因子與月平均溫度、月平均最高溫度、月平均最低溫度具有正相關(guān)性;(3)由的系數(shù)為負(fù)值可得,氣壓溫度因子與月平均相對(duì)濕度、月平均最低相對(duì)濕度具有負(fù)相關(guān)性;由第2個(gè)方程可知:(4)由的系數(shù)為正值可得,濕度因子與月平均氣壓、月平均最高氣壓、月平均最低氣壓具有正相關(guān)性;(5)由可得,濕度因子與月平均溫度、月平均最高溫度成負(fù)相關(guān)性,與月平均最低溫度具有正相關(guān)性;(6)由的系數(shù)為正值可得,濕度因子與月平均相對(duì)濕度、月平均最低相對(duì)濕度具有正相關(guān)性;5.3高危人群預(yù)警分析(問(wèn)題3)首先預(yù)測(cè)2011年的氣象狀況,然后預(yù)測(cè)未來(lái)2011年的高危人群的發(fā)病率和發(fā)病時(shí)間,最后提出預(yù)警和干預(yù)措施。5.3.1未來(lái)2011年氣象預(yù)測(cè)1)氣壓、溫度狀況預(yù)測(cè)觀察月平均氣壓、月平均最高氣壓、月平均最低氣壓、月平均溫度、月平均最高溫度,月平均最低溫度的歷史數(shù)據(jù),發(fā)現(xiàn)隨時(shí)間做周期性變化,于是建立余弦函數(shù)模型,利用過(guò)去36個(gè)月的歷史數(shù)據(jù)進(jìn)行參數(shù)估計(jì),然后使用2009年的12個(gè)數(shù)據(jù)進(jìn)行預(yù)測(cè),評(píng)估誤差并檢驗(yàn)?zāi)P偷目煽啃?。最后預(yù)測(cè)出2010年的12個(gè)月的數(shù)據(jù)。建模結(jié)果見(jiàn)表2.(MATLAB程序見(jiàn)附錄8)。2011年12個(gè)月的預(yù)測(cè)結(jié)果見(jiàn)表3.表2 模型參數(shù)估計(jì)結(jié)果變量表達(dá)式參數(shù)擬合值平均相對(duì)誤差0.15%0.14%0.15%11.77%7.75%34.71%表3 2011年12個(gè)月的氣壓、溫度預(yù)測(cè)值月份123456平均溫度4.99785.29698.666214.211120.459625.7531平均壓力1026.11024.31020.11014.71009.61006最高壓力1018.21023.71027.710291027.41023.2最低壓力1014.71019.51022.61023.21021.11016.9最高溫度23.742617.530212.2499.2949.445612.6638最低溫度16.02659.69374.38921.52791.87315.3328月份789101112平均溫度28.686228.480325.190119.68913.43748.0948平均壓力1004.91006.71010.91016.21021.41025.1最高壓力1017.61012.11008.11006.61008.21012.3最低壓力1011.71006.91003.81003.21005.21009.4最高溫度18.098524.314429.669732.7532.741729.647最低溫度10.983917.319122.648425.550225.250321.82892)濕度狀況預(yù)測(cè)觀察月平均濕度、月平均最低濕度的歷史數(shù)據(jù),發(fā)現(xiàn)它們隨時(shí)間做平穩(wěn)性波動(dòng),于是建立馬爾克夫模型,利用過(guò)去36個(gè)月的歷史數(shù)據(jù)進(jìn)行建模,然后預(yù)測(cè)出第37個(gè)數(shù)據(jù)。采用“新陳代謝”思想,把第37個(gè)數(shù)據(jù)加入建模序列,并同時(shí)去掉最老的第1個(gè)數(shù)據(jù),保持?jǐn)?shù)據(jù)“等維”,建模并預(yù)測(cè)出第38個(gè)數(shù)據(jù),如此滾動(dòng)預(yù)測(cè),直至預(yù)測(cè)出2009年的12個(gè)數(shù)據(jù),并做誤差分析,檢驗(yàn)?zāi)P偷目煽啃?。最后預(yù)測(cè)出2011年的12個(gè)數(shù)據(jù)。(1)自相關(guān)系數(shù)原始序列的各階自相關(guān)系數(shù)反映已知數(shù)據(jù)對(duì)未來(lái)數(shù)據(jù)的影響程度. 各階自相關(guān)系數(shù)為 (13)式中, (14)對(duì)各階自相關(guān)系數(shù)歸一化得, (15)可作為各階步長(zhǎng)的馬爾柯夫鏈權(quán)重,是按預(yù)測(cè)需要計(jì)算的最大階數(shù),一般取.根據(jù)可以確定轉(zhuǎn)移步數(shù).(2)加權(quán)馬爾柯夫模型狀態(tài)劃分。設(shè)劃分的個(gè)濕度區(qū)間為其中,盡可能小,盡可能大.,如果則表明第年的相對(duì)誤差處于第種狀態(tài).狀態(tài)轉(zhuǎn)移概率矩陣的構(gòu)造。設(shè)步轉(zhuǎn)移概率為,記: (15)其中,表示狀態(tài)經(jīng)過(guò)步轉(zhuǎn)移到狀態(tài)的次數(shù),為狀態(tài)出現(xiàn)的次數(shù).由于數(shù)據(jù)序列最后的狀態(tài)轉(zhuǎn)向不確定,故計(jì)數(shù)時(shí)要去掉數(shù)據(jù)序列中最末的個(gè)數(shù)據(jù)(也就是只考慮前面的個(gè)數(shù)據(jù)).由構(gòu)成的矩陣稱為步轉(zhuǎn)移概率矩陣,記作 (16)已知每一步的概率轉(zhuǎn)移矩陣和每一步的初始狀態(tài),則馬爾柯夫鏈就可以確定.預(yù)測(cè)值計(jì)算選取距離預(yù)測(cè)年最近的個(gè)年份,按照距離預(yù)測(cè)年由近到遠(yuǎn),轉(zhuǎn)移步數(shù)分別為,以這幾年的相對(duì)誤差所對(duì)應(yīng)的狀態(tài)為初始狀態(tài),不妨設(shè)第年所對(duì)應(yīng)的初始狀態(tài)分別為,其中,.例如,當(dāng)時(shí),說(shuō)明距離預(yù)測(cè)年第2年的狀態(tài)是第5狀態(tài).在轉(zhuǎn)移步數(shù)對(duì)應(yīng)的轉(zhuǎn)移矩陣中,取起始狀態(tài)所對(duì)應(yīng)的行向量,從而組成新的概率矩陣 (17)將矩陣加權(quán)得 (18)將矩陣按列求和得 (19)找出向量的最大分量得 (20)分量所對(duì)應(yīng)的狀態(tài)就是預(yù)測(cè)年的狀態(tài),則該年度的預(yù)測(cè)值為 (21)(3)計(jì)算過(guò)程和結(jié)果以預(yù)測(cè)2010年第1月的數(shù)據(jù)為例。利用2007、2008、2009年的36個(gè)月的歷史數(shù)據(jù)進(jìn)行建模。自相關(guān)系數(shù)。以根據(jù)(13)、(14)、(15)式計(jì)算可得各階的自相關(guān)系數(shù),確定最大滯后階數(shù).各階自相關(guān)系數(shù)及權(quán)重見(jiàn)表4.表4 自相關(guān)系數(shù)及權(quán)重120.47370.24140.66250.3375劃分的6種狀態(tài)區(qū)間,見(jiàn)表4.表4 各個(gè)狀態(tài)區(qū)間狀態(tài)編號(hào)狀態(tài)區(qū)間0,60)60,65)65,70)70,75)75,80)80,100構(gòu)造轉(zhuǎn)移概率矩陣如果有的狀態(tài)不能從統(tǒng)計(jì)表中得到轉(zhuǎn)移概率,則假定它未來(lái)轉(zhuǎn)移到各個(gè)狀態(tài)的概率都相等,即都等于.根據(jù)(15)可得1步和2步內(nèi)的轉(zhuǎn)移概率矩陣分別見(jiàn)表5和表6.表5 1步轉(zhuǎn)移概率矩陣2/31/3000001/52/51/51/501/81/41/803/81/801/73/71/72/70001/94/91/31/9001/31/301/3 表6 2步轉(zhuǎn)移概率矩陣1/31/31/30001/5001/52/51/51/81/805/81/8002/74/702/71/701/81/201/41/8001/302/30組成預(yù)測(cè)年份的新轉(zhuǎn)移概率矩陣.選擇離預(yù)測(cè)年最近的2個(gè)年份,轉(zhuǎn)移步數(shù)分別為,根據(jù)(17)式得預(yù)測(cè)年的轉(zhuǎn)移概率矩陣,見(jiàn)表7. 表7月份狀態(tài)步長(zhǎng)權(quán)重預(yù)測(cè)年的轉(zhuǎn)移概率矩陣概率來(lái)源12345636210.662501/73/72/71/7035320.337501/81/201/41/8加權(quán)求和00.13680.45270.09460.27370.0422確定預(yù)測(cè)年份的狀態(tài).預(yù)測(cè)年的狀態(tài)向量的最大分量值為0.4527,對(duì)應(yīng)的狀態(tài)為第3狀態(tài),即第37個(gè)月的濕度將處于第3狀態(tài),濕度67.5.將第37個(gè)月的濕度值67.5放入序列中,同時(shí)去掉第1個(gè)月的濕度數(shù)據(jù),重新構(gòu)建馬爾柯夫鏈,得第38個(gè)月的濕度。以此類推,可得2010年12個(gè)月的濕度值,見(jiàn)表8.平均絕對(duì)相對(duì)誤差為7.97%,可靠性高.表8 2010年濕度預(yù)測(cè)月份123456789101112實(shí)際67.577.572.567.577.572.567.577.572.567.577.5725模擬70.9474.6870.8169.5768.3976.475.5871.5877.274.2968.962.23絕對(duì)相對(duì)誤差4.85%3.78%2.39%2.98%13.32%5.10%10.69%8.27%6.09%9.14%12.48%16.50%表8 2011年濕度預(yù)測(cè)月份12345678910111272.577.572.567.577.572.567.577.572.567.577.572.557.557.557.557.557.557.557.557.557.557.557.5未來(lái)2011年12個(gè)月的發(fā)病人數(shù)預(yù)測(cè)將預(yù)測(cè)得到的2011年12個(gè)月的氣象數(shù)據(jù)代入主成分模型(12)和多元非線性回歸模型(13),計(jì)算得到2011年發(fā)病率的發(fā)展趨勢(shì),如圖13所示。圖13 2011年發(fā)病率趨勢(shì)從圖13可知,2011年發(fā)病率的發(fā)展趨勢(shì)是,15月保持平穩(wěn)態(tài)勢(shì),從6月份開(kāi)始呈現(xiàn)上升態(tài)勢(shì),至8、9、10月份到達(dá)高發(fā)期,之后,11和12月份下降進(jìn)入低發(fā)期。5.3.3干預(yù)措施和建議查閱文獻(xiàn)5-9,發(fā)現(xiàn)以下信息:1)腦卒中,又稱中風(fēng)或腦血管意外,它包括腦出血、蛛網(wǎng)膜下腔出血、腦梗死和短暫性腦缺血發(fā)作等急性腦血管病,是一組突然起病,以出現(xiàn)意識(shí)障礙和局灶性神經(jīng)功能缺失為共同特征的急性腦血管病。2)它具有以下特征:(1)發(fā)病率高;(2)致殘率高;(3)死亡率高;(4)復(fù)發(fā)率高。3)它的關(guān)鍵指標(biāo)為:(1)頭暈。(2)肢體麻木。(3)暫時(shí)性吐字不清或講話不靈。(4)肢體無(wú)力或活動(dòng)不靈。(5)與平時(shí)不同的頭痛。(6)不明原因突然跌倒或暈倒。(7)短暫意識(shí)喪失或個(gè)性和智力的突然變化。(8)全身明顯乏力,肢體軟弱無(wú)力。(9)惡心嘔吐或血壓波動(dòng)。腦卒中病人大部分是“三高”、有家族病史與前科老年人。建議措施:(1)衛(wèi)生機(jī)構(gòu)在2011年的秋季前做好迎接高發(fā)病人的準(zhǔn)備。(2)預(yù)防為主,多鍛煉,多吃蔬菜,不吸煙,不喝酒,防“三高”。 六、需要進(jìn)一步研究的問(wèn)題對(duì)高危人群如男性人群、60歲以上人群、農(nóng)民群體進(jìn)行預(yù)測(cè),做好預(yù)警和干預(yù)。七、模型評(píng)價(jià)7.1 模型優(yōu)點(diǎn):1)主要因素并進(jìn)行了定量分析,7.2模型缺點(diǎn):1)當(dāng)考慮定性相關(guān)因素較多時(shí),八、參考文獻(xiàn)1周曉平,楊進(jìn).腦卒中發(fā)生時(shí)氣節(jié)規(guī)律及其氣象醫(yī)學(xué)原理探討.中醫(yī)雜志,2006年6月,第47卷第6期.2謝文龍,尚濤.SPSS統(tǒng)計(jì)分析與數(shù)據(jù)挖掘.北京:北京電子工業(yè)出版社,2012.13韓中庚.數(shù)學(xué)建模方法與應(yīng)用.北京:高等教育出版社,2005.6(2006重印).4陳在余,陶應(yīng)虎.統(tǒng)計(jì)學(xué)原理與實(shí)務(wù).北京:清華大學(xué)出版社,2009.3/zhongfeng/129.html 復(fù)發(fā)/zhongfeng/195.html 高危人群,低溫危害 /zy/my/zyys/zyyf/734419.html 高溫危害九、附錄附錄1.統(tǒng)計(jì)發(fā)病人群的性別比例建立M-文件:%統(tǒng)計(jì)發(fā)病人群的性別比例A=xlsread(c題數(shù)據(jù)1.xls,sheet1,A2:F58926);%讀入發(fā)病人群信息,58925行-6列a=size(A);B=zeros(1,2);for i=1:a(1) if A(i,1)=1 B(1,1)=B(1,1)+1;%男性病人的人數(shù) else B(1,2)=B(1,2)+1;%女性病人的人數(shù) endendB=B/a(1),%性別比例附錄2.方差程序建立M文件夾:function y=tongji50(A,t)% A是發(fā)病人數(shù)信息矩陣, t是年份2007,2008,2009,2010a=size(A);B=zeros(2,12);for i=1:a(1) if A(i,4)=t if A(i,1)=1 if A(i,5)=1 B(1,1)=B(1,1)+1; elseif A(i,5)=2 B(1,2)=B(1,2)+1; elseif A(i,5)=3 B(1,3)=B(1,3)+1; elseif A(i,5)=4 B(1,4)=B(1,4)+1; elseif A(i,5)=5 B(1,5)=B(1,5)+1; elseif A(i,5)=6 B(1,6)=B(1,6)+1; elseif A(i,5)=7 B(1,7)=B(1,7)+1; elseif A(i,5)=8 B(1,8)=B(1,8)+1; elseif A(i,5)=9 B(1,9)=B(1,9)+1; elseif A(i,5)=10 B(1,10)=B(1,10)+1; elseif A(i,5)=11 B(1,11)=B(1,11)+1; elseif A(i,5)=12 B(1,12)=B(1,12)+1; end else if A(i,5)=1 B(2,1)=B(2,1)+1; elseif A(i,5)=2 B(2,2)=B(2,2)+1; elseif A(i,5)=3 B(2,3)=B(2,3)+1; elseif A(i,5)=4 B(2,4)=B(2,4)+1; elseif A(i,5)=5 B(2,5)=B(2,5)+1; elseif A(i,5)=6 B(2,6)=B(2,6)+1; elseif A(i,5)=7 B(2,7)=B(2,7)+1; elseif A(i,5)=8 B(2,8)=B(2,8)+1; elseif A(i,5)=9 B(2,9)=B(2,9)+1; elseif A(i,5)=10 B(2,10)=B(2,10)+1; elseif A(i,5)=11 B(2,11)=B(2,11)+1; elseif A(i,5)=12 B(2,12)=B(2,12)+1; end end endendy=B,%1年*12個(gè)月的男女發(fā)病人數(shù) %發(fā)病人群信息A=xlsread(c題數(shù)據(jù)1.xls,sheet1,A2:F58926);%58925行-6列a=size(A);B1=tongji50(A,2007);B2=tongji50(A,2008);B3=tongji50(A,2009);B4=tongji50(A,2010);B=B1;B2;B3;B4B,%48*2矩陣,男女48個(gè)月的發(fā)病人數(shù)p = anova1(B),% 下面做單因素方差分析附錄3.統(tǒng)計(jì)各階段發(fā)病人群年齡比例建立M-文件:%發(fā)病人群信息A=xlsread(c題數(shù)據(jù)1.xls,sheet1,A2:F58926);%58925行-6列a=size(A);B=zeros(1,6);for i=1:a(1) if A(i,2)=40 & A(i,2)=50 & A(i,2)=60 & A(i,2)=70 & A(i,2)80 B(1,5)=B(1,5)+1;%80歲以上病發(fā)人數(shù) else B(1,6)=B(1,6)+1; endendB=B/a(1) %年齡比率附錄4、不同職業(yè)病發(fā)者比例%發(fā)病人群信息A=xlsread(c題數(shù)據(jù)1.xls,sheet1,A2:F58926);%58925行-6列a=size(A);B=zeros(1,9);for i=1:a(1) if A(i,3)=1 B(1,1)=B(1,1)+1;%農(nóng)民
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年凝血因子VIII、IX項(xiàng)目建議書(shū)
- 第14課《詩(shī)詞三首-行路難(其一)》教學(xué)設(shè)計(jì) 2024-2025學(xué)年統(tǒng)編版語(yǔ)文九年級(jí)上冊(cè)
- 第23課《〈孟子〉三章》教學(xué)設(shè)計(jì) 2024-2025學(xué)年統(tǒng)編版語(yǔ)文八年級(jí)上冊(cè)
- 滄州泊頭一品施工方案
- 石材鋪裝專項(xiàng)施工方案完整
- Unit 6 Section A (2a~2e)教學(xué)設(shè)計(jì) -2024-2025學(xué)年人教版英語(yǔ)七年級(jí)上冊(cè)
- 合肥市裝配式建筑項(xiàng)目設(shè)計(jì)階段技術(shù)方案
- 2024年河北承德熱力集團(tuán)外縣區(qū)及外埠地區(qū)招聘39人筆試參考題庫(kù)附帶答案詳解
- 2024年廣西南寧市江南區(qū)維羅中學(xué)中考聯(lián)考語(yǔ)文試卷
- -教科版高中信息技術(shù)選修2教學(xué)設(shè)計(jì)-2.2.2 圖形、圖像的加工方法-
- Android移動(dòng)應(yīng)用開(kāi)發(fā)基礎(chǔ)教程-教案
- 腦梗合并心衰護(hù)理查房
- JGT472-2015 鋼纖維混凝土
- 第九屆鵬程杯五年級(jí)數(shù)學(xué)競(jìng)賽初試真題
- 電梯結(jié)構(gòu)與原理-第2版-全套課件
- 《現(xiàn)代漢語(yǔ)》語(yǔ)音教學(xué)上課用課件
- 采購(gòu)流程各部門(mén)關(guān)系圖
- 《遙感導(dǎo)論》全套課件
- 力士樂(lè)工程機(jī)械液壓培訓(xùn)資料(共7篇)課件
- 村光伏發(fā)電申請(qǐng)書(shū)
- 降低混凝土路面裂縫發(fā)生率QC小組資料
評(píng)論
0/150
提交評(píng)論