基于逐步回歸的腦卒中發(fā)病環(huán)境因素分析及干預(yù)模型(共18頁(yè))_第1頁(yè)
基于逐步回歸的腦卒中發(fā)病環(huán)境因素分析及干預(yù)模型(共18頁(yè))_第2頁(yè)
基于逐步回歸的腦卒中發(fā)病環(huán)境因素分析及干預(yù)模型(共18頁(yè))_第3頁(yè)
基于逐步回歸的腦卒中發(fā)病環(huán)境因素分析及干預(yù)模型(共18頁(yè))_第4頁(yè)
基于逐步回歸的腦卒中發(fā)病環(huán)境因素分析及干預(yù)模型(共18頁(yè))_第5頁(yè)
已閱讀5頁(yè),還剩17頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、 1基于逐步回歸的腦卒中發(fā)病環(huán)境因素分析(fnx)及干預(yù)模型摘要(zhiyo)本文通過(guò)建立合理的假設(shè),對(duì)某地區(qū)2009-2010年腦卒中發(fā)病率與8種氣象因素進(jìn)行了相關(guān)分析,并經(jīng)多元逐步回歸建立了腦卒中發(fā)病率的預(yù)報(bào)模型進(jìn)行了定量分析,得到了較為合理的結(jié)論(jiln)??紤]到發(fā)病率與氣象因素的復(fù)雜關(guān)系,在逐步線性回歸模型的基礎(chǔ)上,引進(jìn)廣義線性回歸模型(GLM)進(jìn)行推廣。針對(duì)問(wèn)題一,本文對(duì)性別、年齡段、職業(yè)和時(shí)間序列以及4年的平均發(fā)病例數(shù)進(jìn)行統(tǒng)計(jì)和分析,在刪除了一些缺失或失真數(shù)據(jù)的基礎(chǔ)上,對(duì)數(shù)據(jù)分別進(jìn)行整理分析。最后,在性別方面,得到腦卒中發(fā)病率男性比女性的高。從年齡結(jié)構(gòu)看,發(fā)病人數(shù)主要集中在509

2、0這一年齡區(qū)間內(nèi),其所占比例達(dá)81.10%。從職業(yè)結(jié)構(gòu)看,農(nóng)民的發(fā)病率最大。從各年的平均發(fā)病人數(shù)看,在各年季節(jié)交替月份的患病人數(shù)較多。針對(duì)問(wèn)題二,考慮到氣溫、氣壓和相對(duì)濕度對(duì)發(fā)病率的影響不確定,本文首先建立了Pearson相關(guān)分析模型,通過(guò)r值的大小來(lái)判斷發(fā)病率與各指標(biāo)是否存在著某種相關(guān)。經(jīng)計(jì)算得出溫度與發(fā)病率呈正相關(guān),氣壓、相對(duì)濕度與發(fā)病率呈負(fù)相關(guān),且各指標(biāo)與發(fā)病率均呈弱相關(guān),相關(guān)度并不顯著。其次,考慮到發(fā)病率有可能受到多個(gè)因素的共同影響,于是用逐步線性回歸模型對(duì)各因素逐步分析刪除,最后得出腦卒中月平均發(fā)病率與平均氣壓、最大氣壓、最小氣壓、平均溫度、最高溫度和最高相對(duì)濕度這五個(gè)因素的一個(gè)多元

3、回歸線性預(yù)報(bào)模型,并進(jìn)行了一定的定量分析。最后,考慮到逐步線性回歸模型的各指標(biāo)是相互獨(dú)立性,而氣壓和溫度之間存在相互作用,通過(guò)引入平均氣壓和平均溫度交互項(xiàng),對(duì)模型二進(jìn)行了改進(jìn),得到了一個(gè)更優(yōu)的模型。通過(guò)對(duì)模型的定量分析,本文預(yù)報(bào)模型具有實(shí)際應(yīng)用價(jià)值。針對(duì)問(wèn)題三,腦卒中高危人群的重要特征有:偏癱、失語(yǔ)、精神癥狀等,關(guān)鍵指標(biāo)有:高血壓、吸煙醉酒、血脂異常、糖尿病等。結(jié)合問(wèn)題一、二的結(jié)論,分別針對(duì)高危人群提出預(yù)警和干預(yù)的建議方案。從這兩個(gè)方案中得知:減少腦卒中發(fā)病率要從提高身體素質(zhì)、疾病的認(rèn)知和膳食均衡這三方面去考慮。最后,考慮到逐步線性回歸模型中腦卒中發(fā)病率與氣象因素中的線性關(guān)系,而實(shí)際上,發(fā)病率

4、與氣象因素關(guān)系的復(fù)雜性線性關(guān)系并不足以充分刻畫,本文在假設(shè)腦卒中發(fā)病例數(shù)與整個(gè)地區(qū)是一個(gè)小概率事件上,其實(shí)際分布接近于泊松分布,利用廣義線性回歸模型(GLM)進(jìn)行推廣,一定程度優(yōu)化了逐步回歸模型。關(guān)鍵字:腦卒中 氣象因素 相關(guān)(xinggun)分析 多元逐步回歸 GLM模型問(wèn)題(wnt)重述腦卒中(俗稱腦中風(fēng))是目前(mqin)威脅人類生命的嚴(yán)重疾病之一,它的發(fā)生是一個(gè)漫長(zhǎng)的過(guò)程,一旦得病就很難逆轉(zhuǎn)。這種疾病的誘發(fā)已經(jīng)被證實(shí)與環(huán)境因素,包括氣溫和濕度之間存在密切的關(guān)系。對(duì)腦卒中的發(fā)病環(huán)境因素進(jìn)行分析,其目的是為了進(jìn)行疾病的風(fēng)險(xiǎn)評(píng)估,對(duì)腦卒中高危人群能夠及時(shí)采取干預(yù)措施,也讓尚未得病的健康人,或

5、者亞健康人了解自己得腦卒中風(fēng)險(xiǎn)程度,進(jìn)行自我保護(hù)。同時(shí),通過(guò)數(shù)據(jù)模型的建立,掌握疾病發(fā)病率的規(guī)律,對(duì)于衛(wèi)生行政部門和醫(yī)療機(jī)構(gòu)合理調(diào)配醫(yī)務(wù)力量、改善就診治療環(huán)境、配置床位和醫(yī)療藥物等都具有實(shí)際的指導(dǎo)意義。數(shù)據(jù)(見Appendix-C1)來(lái)源于中國(guó)某城市各家醫(yī)院2007年1月至2010年12月的腦卒中發(fā)病病例信息以及相應(yīng)期間當(dāng)?shù)氐闹鹑諝庀筚Y料(Appendix-C2)。請(qǐng)你們根據(jù)題目提供的數(shù)據(jù),回答以下問(wèn)題:1根據(jù)病人基本信息,對(duì)發(fā)病人群進(jìn)行統(tǒng)計(jì)描述。2建立數(shù)學(xué)模型研究腦卒中發(fā)病率與氣溫、氣壓、相對(duì)濕度間的關(guān)系。3查閱和搜集文獻(xiàn)中有關(guān)腦卒中高危人群的重要特征和關(guān)鍵指標(biāo),結(jié)合1、2中所得結(jié)論,對(duì)高危

6、人群提出預(yù)警和干預(yù)的建議方案。符號(hào)說(shuō)明及名詞定義符號(hào)符號(hào)說(shuō)明簡(jiǎn)單相關(guān)系數(shù)腦卒中發(fā)病人數(shù)回歸分析解析變量(或指標(biāo))回歸方程的回歸系數(shù)殘差殘差絕對(duì)值與實(shí)際值的百分比各個(gè)月份殘差絕對(duì)值 表示各月份的實(shí)際值基本假設(shè)假設(shè)4年中年與年間氣象沒(méi)有發(fā)生劇烈變化假設(shè)發(fā)病人數(shù)不存在人口遷移的巨大變化問(wèn)題分析4.1背景分析腦卒中(Stroke)是腦中風(fēng)的學(xué)名,是一種突然起病的腦血液循環(huán)障礙性疾病。又叫腦血管意外。是指在腦血管疾病的病人,因各種誘發(fā)因素引起腦內(nèi)動(dòng)脈狹窄,閉塞或破裂,而造成急性腦血液循環(huán)障礙,臨床上表現(xiàn)為一過(guò)性或永久性腦功能障礙的癥狀和體征腦卒中分為缺血性腦卒中和出血性腦卒中。根據(jù)統(tǒng)計(jì)中國(guó)每年發(fā)生腦卒中

7、病人達(dá)200萬(wàn),發(fā)病率高達(dá)120/10萬(wàn)?,F(xiàn)幸存中風(fēng)病人700萬(wàn),其中450萬(wàn)病人不同程度喪失勞動(dòng)力和生活不能自理。致殘率高達(dá)75%。盡管該病與高血壓、心臟病等主要危險(xiǎn)因素有關(guān),但其發(fā)病往往受季節(jié)氣候變化及其它外界因素的影響。氣象因素的變化對(duì)腦血管病發(fā)病的影響,國(guó)內(nèi)外均有報(bào)道。多數(shù)研究指出,在冬季腦卒中的發(fā)病率有明顯增加,發(fā)病率與溫度有很大的關(guān)聯(lián),但也有研究指出,腦卒中發(fā)病率與季節(jié)沒(méi)有明顯的變化,這些日漸深入的研究結(jié)果不盡一致,主要是因?yàn)楦鞯氐牡乩須夂蛱攸c(diǎn)(tdin)差別較大以及社會(huì)因素、人種遺傳等等方面的區(qū)別。為了更好的預(yù)防這種疾病,本文對(duì)2007-2010年某地區(qū)腦卒中發(fā)病率與該地區(qū)相應(yīng)的

8、思念氣象因素指標(biāo)進(jìn)行分析,初步驗(yàn)證了氣象因素與腦卒中發(fā)病率之間的關(guān)系。4.2問(wèn)題(wnt)一分析根據(jù)附件1-4,本文以腦卒中發(fā)病(f bng)人數(shù),分別從發(fā)病時(shí)間、性別、年齡結(jié)構(gòu)和職業(yè)進(jìn)行數(shù)據(jù)整理分析,得到一些初步的結(jié)論,對(duì)腦卒中發(fā)病情況進(jìn)行一些簡(jiǎn)單的分析與總結(jié)。通過(guò)數(shù)據(jù)的初始處理發(fā)現(xiàn)題目所給的數(shù)據(jù)中存在空缺,對(duì)于數(shù)據(jù)的統(tǒng)計(jì)問(wèn)題,數(shù)據(jù)的空缺是不可忽視的地方,要綜合考慮空缺數(shù)據(jù)的作用以及給數(shù)據(jù)統(tǒng)計(jì)造成的影響大小,喬珠峰、田鳳占和黃厚寬1等人指出:如果缺失的數(shù)據(jù)占總數(shù)據(jù)量的比例較小,認(rèn)為缺失數(shù)據(jù)對(duì)原始數(shù)據(jù)的處理影響較小,可以忽略不計(jì),如果缺失數(shù)據(jù)在總數(shù)據(jù)量中所占比例較大可能對(duì)原始數(shù)據(jù)的處理造成很大

9、的影響,不能直接忽略,需要通過(guò)填補(bǔ)來(lái)完善數(shù)據(jù)才能進(jìn)行計(jì)算。對(duì)每個(gè)部分共計(jì)多少數(shù)據(jù),缺失多少數(shù)據(jù),刪除多少數(shù)據(jù)以及剩余多少完整數(shù)據(jù)進(jìn)行研究,通過(guò)對(duì)數(shù)據(jù)的進(jìn)一步處理,得到男女患病比例的扇形圖,將年齡結(jié)構(gòu)處理后的數(shù)據(jù)轉(zhuǎn)化成柱狀圖,據(jù)圖分析患病人群所處的年齡段,根據(jù)這一結(jié)果結(jié)合腦卒中的患病原因分析不同年齡段患病的原因;對(duì)于按月份劃分的數(shù)據(jù),做出各年中每月患病人數(shù)與年份患病總?cè)藬?shù)比值的折線圖,通過(guò)圖示結(jié)果分析患病人數(shù)與月份之間的關(guān)系,從而反映氣候的變化對(duì)腦卒中病發(fā)的影響情況,以及對(duì)此應(yīng)做出的相關(guān)防御措施。對(duì)于職業(yè)這一類別的數(shù)據(jù),通過(guò)統(tǒng)計(jì)缺失數(shù)據(jù)所占的比例比較大,如果要對(duì)數(shù)據(jù)進(jìn)行填補(bǔ)將會(huì)耗費(fèi)很大的人力物力

10、,對(duì)此認(rèn)為獲取這類缺失數(shù)據(jù)造成的代價(jià)太大,此外由于職業(yè)之一類別的數(shù)據(jù)分析沒(méi)能對(duì)解題帶來(lái)較大的幫助,而且職業(yè)指標(biāo)的概念比較模糊無(wú)法準(zhǔn)確描述這類數(shù)據(jù)的處理對(duì)現(xiàn)實(shí)生活和相關(guān)研究有何積極作用,因此本文不再對(duì)這一類別的數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析。4.3問(wèn)題二分析本文通過(guò)統(tǒng)計(jì)2007-2010年間的腦卒中月平均發(fā)病人數(shù),對(duì)應(yīng)選取4年間的8個(gè)氣象因子:平均氣壓、最高氣壓、最低氣壓、平均溫度、最高溫度、最低溫度、平均相對(duì)濕度以及最低相對(duì)濕度,試圖建立月平均發(fā)病率與氣象因子之間的數(shù)學(xué)模型。通過(guò)查詢資料得知發(fā)病率等于月發(fā)病人數(shù)與發(fā)病總?cè)藬?shù)的比值,但是使用發(fā)病率建立的模型所反映的變量之間的變化趨勢(shì)不明顯(無(wú)量綱化處理后的原因

11、),故本文建立發(fā)病人數(shù)與氣象因素之間的模型,再用發(fā)病人數(shù)除以總?cè)藬?shù)即可得到發(fā)病率與氣象因子之見的數(shù)學(xué)模型。首先建立基于Pearson簡(jiǎn)單相關(guān)分析的模型,分析腦卒中月均患病人數(shù)與氣象指標(biāo)的相關(guān)關(guān)系,然后本文利用逐步回歸分析建立月發(fā)病率與多項(xiàng)氣象因素之間的預(yù)測(cè)模型,通過(guò)t值檢驗(yàn),逐步剔除一些對(duì)因變量影響不大的指標(biāo),直到所有指標(biāo)都通過(guò)t值檢驗(yàn)才終止計(jì)算,得到最終腦卒中月發(fā)病數(shù)與氣象因素的預(yù)報(bào)模型。最后本文認(rèn)為氣壓與溫度之間存在一定的相互關(guān)系,在逐步回歸模型的基礎(chǔ)上通過(guò)引入交叉項(xiàng)對(duì)模型進(jìn)行改進(jìn),進(jìn)一步提高模型的擬合度,完善模型。 4.4問(wèn)題(wnt)三分析通過(guò)查閱資料得到腦卒中高危人群的重要特征和關(guān)鍵

12、指標(biāo),結(jié)合問(wèn)題一和問(wèn)題二得到的結(jié)論,分別對(duì)高危人群提出(t ch)預(yù)警和干預(yù)的建議方案。對(duì)預(yù)警方案從生活、醫(yī)療和就醫(yī)三個(gè)方面提出建議;對(duì)干預(yù)方案從腦卒中高危人群和非高危人群兩方面提出建議。模型的建立(jinl)與求解5.1問(wèn)題一模型的建立與求解腦卒中是目前威脅人類健康的嚴(yán)重疾病之一,它的發(fā)生是一個(gè)漫長(zhǎng)的過(guò)程,一旦得病就很難逆轉(zhuǎn)。每年都有很多人患上腦卒中,本文通過(guò)對(duì)往年患病人群的數(shù)據(jù)進(jìn)行統(tǒng)計(jì),按發(fā)病人群的性別、年齡、發(fā)病年份和病人的職業(yè)進(jìn)行歸類總結(jié)。根據(jù)所得的結(jié)果分析腦卒中患病人群在年齡結(jié)構(gòu)上的分布情況以及在不同職業(yè)、不同性別的分布情況。5.1.1缺失數(shù)據(jù)的處理通過(guò)初步分析,發(fā)現(xiàn)原始數(shù)據(jù)存在一些

13、缺失,對(duì)于缺失的數(shù)據(jù)針對(duì)不同的情況有不同的處理方式。2007-2010年間共61923例腦卒中發(fā)病數(shù),其中缺失信息數(shù)據(jù)經(jīng)過(guò)整理得到下表表1:缺失個(gè)數(shù)及其占總數(shù)據(jù)百分比類別性別年齡月份缺失個(gè)數(shù)1215138所占百分比0.0002%0.24%0.0006%通過(guò)表1可以看到按性別、年齡和月份為類別的數(shù)據(jù)中,缺失數(shù)據(jù)的個(gè)數(shù)占總數(shù)的百分比都非常小,本文認(rèn)為對(duì)總體統(tǒng)計(jì)處理所造成的影響很小,因此這三個(gè)類別的缺失數(shù)據(jù)可以采用直接刪除數(shù)據(jù),對(duì)剩余的數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析。5.1.2按不同類別統(tǒng)計(jì)數(shù)據(jù)李翠花2曾總結(jié)了腦卒中的患病因素有高血壓、心臟病、肥胖、糖尿病以及抽煙酗酒等本文通過(guò)Excel對(duì)2007-2010年四年

14、中腦卒中發(fā)病情況進(jìn)行整理分析,分別從性別、年齡結(jié)構(gòu)、發(fā)病時(shí)間和職業(yè)四個(gè)方面進(jìn)行初步分析。通過(guò)網(wǎng)上搜索資料得知腦卒中的發(fā)病與高血壓、心臟病、肥胖、糖尿病和吸煙酗酒等有很大的關(guān)系,本文通過(guò)患病人群的性別分布、年齡結(jié)構(gòu)以及患病人群的從事職業(yè)的統(tǒng)計(jì)結(jié)果分別分析腦卒中病因與相關(guān)統(tǒng)計(jì)結(jié)果的關(guān)系。1)按性別統(tǒng)計(jì)對(duì)于2007-2010年的數(shù)據(jù),本文通過(guò)統(tǒng)計(jì)4年中男性(nnxng)患者的總?cè)藬?shù)和女性患者的總?cè)藬?shù),作出患病人群的性別比例,結(jié)果如下圖圖1:患病(hun bn)人群男女比例根據(jù)圖1得知男性患腦卒中的比例與女性患腦卒中的比例為1:0.85,通過(guò)(tnggu)查閱資料和結(jié)合生活實(shí)際不難發(fā)現(xiàn)現(xiàn)實(shí)生活中的絕大

15、部分男性(成年人)都有吸煙的生活的習(xí)性,而女性吸煙的人數(shù)比較少,通過(guò)前面的結(jié)論已經(jīng)得知吸煙會(huì)導(dǎo)致腦卒中的病發(fā),男性由于吸煙增加了腦卒中的病發(fā),因此男性患腦卒中疾病的比例會(huì)大于女性。同時(shí)隨著社會(huì)的發(fā)展工作上的應(yīng)酬變成了達(dá)成合作的必要條件,應(yīng)酬時(shí)酒已經(jīng)成為必不可少的一道菜肴,由于出面談生意大部分是男性,前面已經(jīng)分析得知過(guò)量的喝酒也是造成腦卒中病發(fā)的重要因素之一,從這個(gè)角度分析,男性患腦卒中的概率比女性要大,因此就整個(gè)男女集體來(lái)分析比較,腦卒中的患病人群中男性的比例會(huì)大于女性。據(jù)此我們也可以證實(shí)抽煙酗酒會(huì)增加腦卒中病發(fā)的概率,因此減少抽煙或者不抽煙以及不酗酒(適量飲酒)可以有效降低腦卒中的病發(fā),同時(shí)

16、也有利于身心健康。2)按年齡分析根據(jù)2007-2010年的數(shù)據(jù),本文通過(guò)統(tǒng)計(jì)4年中各個(gè)年齡段患病人數(shù)的總和作出直方圖,據(jù)圖分析相關(guān)結(jié)果(這里本文將0歲的兒童歸結(jié)到1-10歲的年齡段,大于100歲的人歸結(jié)到91-100歲的年齡段)圖2:患病(hun bn)人群的年齡段分布對(duì)于年齡我們將1-10歲歸為兒童,11-20歸為青少年,21-40為中年41-60歲為中老年61-100歸為老人。通過(guò)計(jì)算得知患病人數(shù)的平均值為6177.2,據(jù)此可以得知患病人數(shù)大于平均值的年齡段、人數(shù)和所占比值(bzh)如下表表2:患病(hun bn)人數(shù)大于平均值的年齡段、人數(shù)和所占比值年齡段51-6061-7071-808

17、1-90人數(shù)8692148882155611280所占比例14.04%24.04%34.81%18.21%本文將患病人數(shù)大于平均值的年齡段段稱為病癥高發(fā)年齡段,因此腦卒中病癥高發(fā)年齡段大部分為老年人。通過(guò)查閱資料得知老年人腹部脂肪容易堆積,形成向心性肥胖,肥胖者高血壓的患病率較高,因?yàn)槔夏耆巳菀谆几哐獕?;此外老年人新陳代謝能力降低,存在一定的代謝障礙容易患糖尿病;隨著年齡的增加老年人接受刺激的能力也隨之下降,患上心臟病的概率也增大,前面已知心臟病,高血壓,糖尿病等都是引發(fā)腦卒中的發(fā)病因素,因此老年人患腦卒中的概率比較大,患病的人數(shù)也比其他年齡段多。通過(guò)分析得知老年人可以通過(guò)鍛煉身體增強(qiáng)自身的抵

18、抗能力和身體素質(zhì),用強(qiáng)健的體魄阻擋腦卒中的病發(fā),同時(shí)還可以陶冶情操,修養(yǎng)身心。此外據(jù)圖2可得,31-50歲的中年也有較大一部分的患病人數(shù),其中還有兒童。伴隨著社會(huì)的發(fā)展,中年人的生活習(xí)慣越來(lái)越?jīng)]有規(guī)律,飲食也雜亂無(wú)章,由于不良的生活習(xí)慣會(huì)導(dǎo)致高血壓、肥胖等癥狀的病發(fā),所以也有較大一部分的中年人因此患病。對(duì)于兒童患病原因是由天性的遺傳和缺乏維生素K造成,因此兒童也有小部分的患者。中年人可以通過(guò)調(diào)整飲食結(jié)構(gòu)和改善生活習(xí)慣來(lái)避免相關(guān)病癥的發(fā)生,從而減少腦卒中的病發(fā),對(duì)于兒童可以通過(guò)補(bǔ)充相關(guān)的維生素來(lái)抵抗病菌的入侵,提高免疫能力,減少病癥的發(fā)生。3)按月份分析由于2009年患病人數(shù)比較少,而其他3年的

19、數(shù)據(jù)相對(duì)較高,為了更直觀的反映4年數(shù)據(jù)之間的變化趨勢(shì),本文用每月的患病人數(shù)與年患病總數(shù)的比值畫出折線圖圖3:不同月份(yufn)患病人數(shù)分布從圖中可以看出各年季節(jié)交替月份的患病人數(shù)比臨近月份的患病人數(shù)較多,由于(yuy)交替月份的氣溫的變化無(wú)常,白晝溫差較大而且不易預(yù)測(cè),老年人身體的抵抗力較弱,因此在季節(jié)交替的月份不少老年人就會(huì)因防備不及而發(fā)生腦子中等疾病,此外天氣變冷時(shí)特別是冬春季節(jié),氣溫偏低, 人體血管收縮明顯,血壓(xuy)增高,危險(xiǎn)因素控制不佳的情況下,容易發(fā)生心腦血管事件從而造成腦卒中的病發(fā)。所以,特別是對(duì)有危險(xiǎn)因素如高血壓、糖尿病、動(dòng)脈硬化的老年人,在季節(jié)交換的月份要注意防寒保暖,

20、做好防御疾病的相關(guān)措施,在春冬季節(jié)的時(shí)候要注意保暖,常到陽(yáng)光充足的地方曬曬太陽(yáng),這樣有利于對(duì)危險(xiǎn)因素的控制,防止腦卒中的病發(fā)。 4)按職業(yè)分析根據(jù)2007-2010年的數(shù)據(jù),本文通過(guò)統(tǒng)計(jì)不同職業(yè)的患病人數(shù)得到下圖圖4:不同職業(yè)患病人數(shù)比例根據(jù)圖4本文拋開其他和缺失數(shù)據(jù)的選項(xiàng),根據(jù)不同職業(yè)的患病人數(shù)進(jìn)行分析,農(nóng)民這一職業(yè)中腦卒中的患病人數(shù)最多,由于農(nóng)民市場(chǎng)在野外勞作,長(zhǎng)時(shí)間經(jīng)受烈日的暴曬以及暴雨的沖洗容易導(dǎo)致腦卒中的病發(fā);其次是退休人員,退休人員大多數(shù)和老人,老人容易患心臟病和高血壓等疾病,由于這些疾病容易造成腦卒中的病發(fā),所以退休人員中有較多的患病者;接著是工人,由于工人的工作環(huán)境比較惡劣,并

21、且時(shí)常加班加點(diǎn),造成體力活動(dòng)過(guò)量,進(jìn)而促使腦卒中的病發(fā),所以工人占據(jù)一定的比例。5.2問(wèn)題二模型(mxng)的建立與求解5.2.1模型一:基于(jy)Pearson簡(jiǎn)單相關(guān)分析的模型相關(guān)(xinggun)關(guān)系是現(xiàn)象間不嚴(yán)格的依存關(guān)系,即個(gè)變量之間不存在確定性的關(guān)系,依據(jù)陳勝可3的總結(jié):相關(guān)關(guān)系中當(dāng)一個(gè)或幾個(gè)相互聯(lián)系的變量取一定數(shù)值時(shí),與之相應(yīng)的另一變量也會(huì)發(fā)生變化,但其關(guān)系值不是固定的,往往按照某種規(guī)律在一定范圍內(nèi)變化。通過(guò)對(duì)附件給出的數(shù)據(jù),首先計(jì)算氣象因素月平均值和腦卒中月平均發(fā)病數(shù)具體數(shù)據(jù)如下表表3:2007-2010年的月平均數(shù)據(jù)月份平均氣壓最高氣壓最低氣壓平均氣溫最高氣溫最低氣溫平均濕

22、度最低濕度患病人數(shù)111.74395285.6251024.483.7580657.6040320.84193567.8306551.008061348.2521022.1441024.9941019.1146.73934710.885753.48469870.7062851.95721256.2531019.2251022.3621015.98510.3483914.795166.64435567.2546.39516137341017.1171020.1391014.05713.3816417.80939.64854866.3755446.12258134651009.7141011.88

23、31007.3621.5862926.737917.3443564.4193540.217741400.561005.6941007.3871003.87124.4741728.307521.6083377.1583358.583331232.571003.9231005.5841002.13729.1483933.2653226.0080673.8387155.35484130081006.0241007.7381004.26128.887132.8822625.9459774.887156.193551295.7591011.3341013.0481009.63524.7828.54333

24、22.0433378.17560.141671241101018.211020.1881016.35819.4362923.5887116.0112973.1693550.540321330.5111023.1691025.41020.91312.1666716.58258.5670.97548.916671205121023.331026.1371020.616.80564511.018553.37983966.862946.975811142.5若隨機(jī)變量X、Y的聯(lián)合分布是二維正態(tài)分布,和分別為n次獨(dú)立觀測(cè)值,相關(guān)系數(shù)r的公式為 (1)其中,。通過(guò)Matlab結(jié)合表3的數(shù)據(jù)計(jì)算得到表4:指

25、標(biāo)的相關(guān)關(guān)系r值變量平均氣壓最高氣壓最低氣壓平均溫度最高溫度最低溫度平均濕度最低濕度r值-0.1326-0.1161-0.11610.09520.11390.0743-0.3798-0.4005簡(jiǎn)單相關(guān)系數(shù)r有如下性質(zhì)表5:相關(guān)系數(shù)r的性質(zhì)-1完全負(fù)相關(guān)(-1,-0.5)強(qiáng)負(fù)相關(guān)-0.5中負(fù)相關(guān)(-0.5,0)弱負(fù)相關(guān)0無(wú)線性相關(guān)(0,0.5)弱正相關(guān)0.5中正相關(guān)(0.5,1)強(qiáng)正相關(guān)1完全正相關(guān)結(jié)合表4和表5得知腦卒中的患病人數(shù)與各個(gè)(gg)自變量之間的關(guān)系如下表表6:各個(gè)(gg)自變量與腦卒中的相關(guān)關(guān)系變量平均氣壓最高氣壓最低氣壓平均溫度最高溫度最低溫度平均濕度最低濕度關(guān)系弱負(fù)相關(guān)弱負(fù)相

26、關(guān)弱負(fù)相關(guān)弱正相關(guān)弱正相關(guān)弱正相關(guān)弱負(fù)相關(guān)弱負(fù)相關(guān)5.2.2模型(mxng)二:逐步回歸模型步驟一:多元線性回歸方程的建立多元線性回歸方程3-4的基本公式 (2)式中表示方程的回歸系數(shù),對(duì)于回歸系數(shù)采用最小二乘法進(jìn)行擬合,公式為 (3)通過(guò)計(jì)算得到回歸參數(shù)為-22613 2274 -1020 -1227 538 -628 133 35 -79從而得到多元線性回歸方程 (2)通過(guò)Matlab軟件對(duì)方程擬合度進(jìn)行分析結(jié)果如下圖5:各個(gè)指標(biāo)與患病人數(shù)的擬合圖對(duì)方程擬合優(yōu)度進(jìn)行檢驗(yàn)得到?jīng)Q定系數(shù)通過(guò)修正得,越大說(shuō)明方程的擬合程度越好。根據(jù)擬合優(yōu)度的檢驗(yàn)以及圖5的擬合效果發(fā)現(xiàn)回歸函數(shù)的擬合程度不高存在較大

27、的誤差,可能存在一些不相關(guān)的指標(biāo)影響著模型的擬合,因此需要對(duì)方程作進(jìn)一步分析。步驟二:函數(shù)的誤差分析根據(jù)(gnj)多元線性回歸方程公式(4)利用表3中各個(gè)自變量的數(shù)據(jù)進(jìn)行預(yù)測(cè),通過(guò)預(yù)測(cè)得到的數(shù)據(jù)與實(shí)際(shj)想比較,計(jì)算出回歸方程的誤差,本文通過(guò)殘差進(jìn)行檢驗(yàn),殘差的計(jì)算公式為: (3)計(jì)算(j sun)的得到的預(yù)測(cè)值和殘差如下表表7:預(yù)測(cè)值及殘差月份實(shí)際預(yù)測(cè)殘差11348.251501.3-153.0521256.251419.1-162.85313731530.4-157.4413461499.9-153.951400.51530.2-129.761232.51388.0-155.5713

28、001450.8-150.881295.751488.5-192.75912411353.4-112.4101330.51473.6-143.11112051396.1-191.1121142.51311.6-169.1根據(jù)表4中各個(gè)月份的殘差值,分別計(jì)算出殘差絕對(duì)值與實(shí)際數(shù)據(jù)的比值,公式 (4)式中表示殘差絕對(duì)值與實(shí)際值的百分比,各個(gè)月份殘差絕對(duì)值,表示各月份的實(shí)際值。理想的即誤差較小的函數(shù)殘差跟實(shí)際數(shù)據(jù)的比值百分比比較小。通過(guò)計(jì)算得到如下結(jié)果表8:殘差絕對(duì)值與實(shí)際值的百分比月份123456比值11.35%12.96%11.46%11.43%9.2%12.62%月份789101112比值11

29、.6%14.88%9.05%11.75%15.85%14.80%通過(guò)上表的數(shù)據(jù)可以看出每個(gè)月份殘差絕對(duì)值與實(shí)際值的百分比都超過(guò)了10%,本文認(rèn)為模擬出來(lái)的數(shù)據(jù)殘差百分比超過(guò)5%的公式,擬合程度不高,自變量中存在一些對(duì)擬合有影響的因素。 步驟三:逐步回歸分析題目需要分析腦卒中的發(fā)病率與氣溫、氣壓以及相對(duì)濕度間的關(guān)系,本文首先考慮8個(gè)指標(biāo):平均氣壓、最高氣壓、最低氣壓、平均氣溫、最高氣溫、平均相對(duì)濕度和最低相對(duì)濕度共同作用對(duì)發(fā)病率的影響,由于一些對(duì)因變量影響不顯著的指標(biāo)降低了模型的擬合度,因此采用逐步分析回歸剔除影響不顯著的指標(biāo)。通過(guò)t檢驗(yàn)逐步分析各個(gè)自變量對(duì)腦卒中發(fā)病率影響,對(duì)通過(guò)不了t檢驗(yàn)(對(duì)

30、發(fā)病率影響很?。┑淖宰兞窟M(jìn)行逐個(gè)的剔除,最終得到全部能通過(guò)t值檢驗(yàn)的數(shù)值指標(biāo)作為最終函數(shù)的自變量,然后再對(duì)函數(shù)進(jìn)行相關(guān)分析。t檢驗(yàn)在回歸(hugu)模型中變量的選擇是一個(gè)難題,在選擇變量時(shí),一方面希望盡可能不遺漏重要的影響變量,另一方面又要遵循參數(shù)節(jié)省原則,使自變量的個(gè)數(shù)盡可能少,因?yàn)楫?dāng)自變量數(shù)目較過(guò)大時(shí),模型計(jì)算復(fù)雜,且會(huì)擴(kuò)大估計(jì)方差,降低模型精度。對(duì)于變量的篩選方法比較多,結(jié)合(jih)本題的情況本文采用向后選擇變量法進(jìn)行篩選,它是變量篩選的一種常用方法。它首先以全部自變量作為解釋變量(binling)擬合方程(公式4),然后每一步都在未通過(guò)t檢驗(yàn)的自變量中選擇一個(gè)值最小的變量,將它從模型

31、中刪除,直到某一步之后所有的自變量都通過(guò)t檢驗(yàn)。通過(guò)Matlab軟件求得t值如下表表9:各個(gè)自變量的t值xx1x2x3x4x5x6x7x8t值4.0125-3.6197-4.25830.9795-2.18230.42171.2724-2.3166注:x1平均氣壓,x2最高氣壓,x3最低氣壓,x4平均氣溫,x5最高氣溫,x6最低氣溫,x7平均相對(duì)濕度,x8最低相對(duì)濕度根據(jù)查表得知t的臨界值為3.182,小于臨界值的指標(biāo)有x4、x5、x7和x8。對(duì)于t的絕對(duì)值最小的自變量,認(rèn)為該變量對(duì)腦卒中發(fā)病率的影響最低,可以剔除。根據(jù)表5可以看出x6的t值絕對(duì)值最小,對(duì)因變量的影響最小,因此可以剔除x6平均相

32、對(duì)濕度這一變量,根據(jù)向后選擇變量法思想,刪除x6這一指標(biāo)后對(duì)剩余的7個(gè)自變量重新擬合回歸方程,此時(shí)方程為通過(guò)Matlab軟件對(duì)方程擬合度進(jìn)行分析結(jié)果如下圖6:剔除x6后方程擬合圖據(jù)圖可以看出用公式(7的擬合程度)較高,此外運(yùn)算還得到?jīng)Q定系數(shù),修正后的,另外兩個(gè)參數(shù)F=5.8166和P=0.0541,如果F小于置信區(qū)間 F0.05(n,n-k-1)=6.09,P大于基準(zhǔn)值0.05則認(rèn)為變量之間的顯著性較差,這里F0.05因此方程中可能還存在一些不相關(guān)的指標(biāo)影響著模型的擬合。根據(jù)t值檢驗(yàn)的思想對(duì)剔除x6之后剩余的指標(biāo)計(jì)算相應(yīng)的t值得到結(jié)果如下表10:剔除x6之后各個(gè)自變量的t值xx1x2x3x4x

33、5x6x7x8t值4.6707-4.4175-4.81753.7742-3.6245-1.5596-3.1098注:-表示(biosh)該指標(biāo)已刪除此時(shí)(c sh)通過(guò)查表得臨界值t0.025(4)=2.776,沒(méi)有通過(guò)t檢驗(yàn)(jinyn)的指標(biāo)為x7,故決定再刪除指標(biāo)x7,對(duì)剩余指標(biāo)進(jìn)行擬合得出回歸方程: (5)對(duì)方程擬合度進(jìn)行分析如下圖7:剔除x6、x7后方程擬合圖注:-表示該指標(biāo)已刪除通過(guò)決定系數(shù)R2=0.8562以及修正后的R2=0.6835結(jié)合圖7可以得知方程的擬合程度較好,同時(shí)結(jié)合指標(biāo)F值和p值,由于F=4.9600 F0.05(n,n-k-1)=4.95,p=0.0500綜合考慮

34、各個(gè)系數(shù)分析,認(rèn)為方程的擬合程度較好。進(jìn)一步討論剩余指標(biāo)是否通過(guò)t值檢驗(yàn),對(duì)剔除x6,x7指標(biāo)之后的數(shù)據(jù)進(jìn)行各指標(biāo)的t值求解,結(jié)果如下表11:剔除x6、x7之后各個(gè)自變量的t值xx1x2x3x4x5x6x7x8t值4.0256-3.7430-4.21093.3089-3.1533-3.3960此時(shí)t0.025(5)=2.571,從上表可以看出所有指標(biāo)都通過(guò)了t檢驗(yàn),計(jì)算終止。因此可以得到最終腦卒中月發(fā)病數(shù)與氣象因素的預(yù)報(bào)模型。步驟四:結(jié)果分析根據(jù)公式:,在調(diào)查樣本不變的前提下,分析指標(biāo)與發(fā)病人數(shù)的相關(guān)性等同于分析指標(biāo)與發(fā)病率的相關(guān)性。本題通過(guò)控制變量分析,即假設(shè)其他自變量不變(或者用相同的數(shù)據(jù)

35、帶入),針對(duì)某一自變量的變化趨勢(shì)(或者帶入不同的數(shù)據(jù)),研究因變量的變化,通過(guò)因變量的變化結(jié)果分析兩個(gè)因素之間的內(nèi)在聯(lián)系。由于公式(7)是線性函數(shù),則當(dāng)其他自變量保持不變時(shí)做如下分析:平均氣壓的相關(guān)系數(shù)為1892.63 ,可以認(rèn)為腦卒中患病人數(shù)與平均氣壓呈正相關(guān)患病人數(shù)隨著平均氣壓的增加而增加,根據(jù)相關(guān)系數(shù)的大小可以得知患病人數(shù)的變化趨勢(shì)隨著平均氣壓的改變會(huì)產(chǎn)生強(qiáng)烈的變化,因此可知平均氣壓在很大程度上影響著患病人數(shù)的數(shù)量。最高氣溫的相關(guān)系數(shù)為-490.538 ,可以認(rèn)為隨著最高溫度的增加,腦卒中的患病人數(shù)反而下降,因?yàn)橄嚓P(guān)系數(shù)相對(duì)較小,可以分析得最高氣溫的變化對(duì)腦卒中患病人數(shù)的變化影響(yng

36、xing)程度不是很大。最低相對(duì)濕度的相關(guān)系數(shù)為-38.188 , 可以(ky)認(rèn)為隨著最低相對(duì)濕度的增加,腦卒中患病人數(shù)反而下降。由于相關(guān)系數(shù)很小僅為38,由此可以認(rèn)為最低相對(duì)濕度的變化對(duì)患病人數(shù)的作用比較小,只是微妙的影響。5.2.3模型(mxng)二的改進(jìn)從陳光紅,張繼澤1氣溫和氣壓之間的短時(shí)變化關(guān)系的結(jié)論中可知,氣壓在短時(shí)間內(nèi)會(huì)隨著氣溫的升高而增大。從微觀角度上看,溫度高,氣體分子運(yùn)動(dòng)快,這就促進(jìn)壓強(qiáng)的增大,但隨著溫度的升高,氣體分子便向周圍擴(kuò)散,則該區(qū)域內(nèi)的氣體分子數(shù)就會(huì)減少,導(dǎo)致壓強(qiáng)降低。同樣的,濕度與大氣壓強(qiáng)也存在著密切的關(guān)系。因此氣壓與溫度之間因存在相互之作用姜啟源7在考慮因素

37、有相互作用時(shí)引入交叉因子來(lái)改善模型,就得考慮它們之間的交叉影響。因此,本文對(duì)逐步回歸分析模型作進(jìn)一步討論。本文引入一個(gè)氣溫與氣壓的交叉項(xiàng),由得到,再結(jié)合逐步回歸分析模型得到的回歸方程(x),得到一個(gè)新的多元一次回歸方程,其通式為: (6)根據(jù)題中所給數(shù)據(jù),利用Matlab統(tǒng)計(jì)工具箱命令實(shí)現(xiàn)多元線性回歸,求解出回歸方程系數(shù)分別為:表12:bb0b1b2b3b4b5b8b9數(shù)值-7375.82510.2-1202-1295-29.7-727.7-52.60.8因此可以得到多元回歸方程為:隨機(jī)誤差項(xiàng)方差的估計(jì)圖8:殘差分析(fnx)分析(fnx)上圖可知,最大絕對(duì)殘差所占實(shí)際值的百分值為2%F0.0

38、5(12,4)=5.91; P=0.01440.05; 綜合上述指標(biāo)(zhbio)說(shuō)明模型的擬合優(yōu)度和顯著性都非常好。本文通過(guò)比較模型二與模型三,分析這兩個(gè)模型的殘差的方差,得出模型二殘差的方差951.2834大于模型三殘差的方差255.229。圖9:擬合比較圖由上圖可知,本文進(jìn)一步探討后做出的多元回歸模型擬合值比未探討前模型擬合值要精確,說(shuō)明指標(biāo)間確實(shí)存在著關(guān)聯(lián)性,此次探討具有重大意義。5.3問(wèn)題三的求解腦卒中是一種嚴(yán)重危害人類健康的常見病,其死亡率、病殘率非常高。目前,隨著人們生活水平的逐漸提高,強(qiáng)烈地社會(huì)競(jìng)爭(zhēng)力給人們身心造成的壓力,使缺血性腦卒中的發(fā)病率逐漸上升,且發(fā)病年齡有提早趨勢(shì)。因

39、此對(duì)高危人群提出預(yù)警和干預(yù)的建議方案已是刻不容緩。高危人群的重要特征有:偏癱 、偏身感覺(jué)障礙、同向偏盲、失語(yǔ)、精神癥狀、排尿障礙及昏迷;也可出現(xiàn)皮質(zhì)盲、丘腦性感覺(jué)障礙、共濟(jì)失調(diào) 、構(gòu)音障礙、眼肌麻痹、吞咽困難、交叉性癱或四肢癱瘓、閉鎖綜合征。高危人群的關(guān)鍵指標(biāo)有:高血壓、房顫和心瓣膜病、吸煙酗酒、血脂異常、糖尿病、很少進(jìn)行體育運(yùn)動(dòng)、肥胖、有卒中家庭史。本文針對(duì)不同的高危人群分別提出預(yù)警和干預(yù)。一般認(rèn)為病輕者或處于亞健康的人群適合提出預(yù)警,而病重者適合提出干預(yù)。問(wèn)題一所得結(jié)論:腦卒中發(fā)病率大多數(shù)為男性高于女性,而這主要與男性的不良生活習(xí)性較多有關(guān),男性吸煙醉酒者相對(duì)于女性來(lái)說(shuō)占了很大一部分;腦卒

40、中發(fā)病率在多數(shù)在年齡(ninlng)在5090這一年齡區(qū)間內(nèi),其所占比例已達(dá)到81.10%。問(wèn)題二所得結(jié)論:溫度與發(fā)病率呈正相關(guān),氣壓、濕度(shd)與發(fā)病率呈負(fù)相關(guān),且各個(gè)自變量與腦卒中發(fā)病率呈弱相關(guān);通過(guò)回歸分析,有多個(gè)變量影響著發(fā)病人數(shù),它們總體存在線性相關(guān)。針對(duì)分析高危人群(rnqn)提出預(yù)警的建議方案:從生活方面,多做有氧運(yùn)動(dòng),增強(qiáng)體魄,改善飲食平衡,避免暴飲暴食,少吸煙少飲酒,生活有規(guī)律,盡量避免通宵熬夜,要注意氣候變化,尤其是季節(jié)轉(zhuǎn)變或氣候驟變,特別是男性和老年人;從醫(yī)療方面,加強(qiáng)對(duì)疾病影響生活的宣傳力度,提高高危人群對(duì)腦卒中及其關(guān)鍵指標(biāo)的重視,積極去了解疾病產(chǎn)生原因和預(yù)防疾病到

41、來(lái);從就醫(yī)時(shí)間,若發(fā)現(xiàn)自己同時(shí)具備幾種易患因素,就應(yīng)立即去醫(yī)院就醫(yī)。針對(duì)分析高危人群提出干預(yù)的建議方案:非腦卒中高危人群干預(yù)。結(jié)合減鹽防控高血壓項(xiàng)目干預(yù),同步進(jìn)行健康宣傳。對(duì)于非腦卒中高危人群或無(wú)慢病史者,倡導(dǎo)健康生活方式;對(duì)有慢病史者,根據(jù)相關(guān)疾病診治指南給予干預(yù)。腦卒中高危人群干預(yù)。針對(duì)每位腦卒中高危個(gè)體存在的主要危險(xiǎn)因素,進(jìn)行包括低鹽膳食在內(nèi)的健康指導(dǎo)、藥物干預(yù)、介入或手術(shù)治療干預(yù)?;蒯t(yī)院專科醫(yī)師制定治療干預(yù)方案,指導(dǎo)基層醫(yī)療衛(wèi)生機(jī)構(gòu)實(shí)施健康指導(dǎo)和藥物干預(yù);需進(jìn)行介入或手術(shù)治療的由基地醫(yī)院進(jìn)行診治。六、模型的推廣針對(duì)逐步回歸分析對(duì)數(shù)據(jù)進(jìn)行回歸分析,得到的結(jié)果不是很理想,原因是本文處理得

42、到的數(shù)據(jù)有些是不服從正態(tài)分布的,而多元線性回歸模型對(duì)于處理響應(yīng)變量是非正態(tài)分布時(shí)它并不適應(yīng)。本文搜索相關(guān)資料時(shí)發(fā)現(xiàn)“廣義線性模型”能夠很好地處理響應(yīng)變量處于非正態(tài)分布時(shí)的適應(yīng)性。廣義線性模型由Nelder和Wedderbum在1972年提出,用于建立非正態(tài)響應(yīng)變量的模型2。廣義線性模型被廣泛地應(yīng)用于分類數(shù)據(jù)分析,或稱定性數(shù)據(jù)分析。例如醫(yī)學(xué)統(tǒng)計(jì)、生物統(tǒng)計(jì)、社會(huì)學(xué)統(tǒng)計(jì)等。本文采用基于Matlab的廣義線性模型,研究Matlab統(tǒng)計(jì)工具箱GLM模塊的應(yīng)用,給出廣義線性Poisson回歸模型的Matlab的算法,由此算法可知回歸方程的通式為: (7)根據(jù)Matlab軟件中Poisson回歸模型中的glmfit函數(shù)得到:

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論