




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、戒煙成功影響因素的分析摘 要本文針對戒煙的影響因素分析,對具體不同問題分別建立了合理的模型,并依據(jù)所給的數(shù)據(jù),使用數(shù)理統(tǒng)計、相關性分析、曲線擬合、主成分分析等知識和利用MATLAB、SPSS、EXCEL等軟件編程給出一定的算法。最后,得出與問題相關的結論,對戒煙人士提出自己的戒煙對策和建議。針對問題一,要求對再次吸煙的累加發(fā)病率分布情況進行說明,首先對缺失數(shù)據(jù)進行剔除處理,使用多元統(tǒng)計方法對數(shù)據(jù)進行處理,通過圖表的形式得到不同年齡段、不同性別等因素下的累加發(fā)病率分布情況;針對問題二,要求定量分析出不同因素對戒煙時間長短的影響,首先利用SPSS軟件對相關變量因素與戒煙天數(shù)進行相關性分析,得到對戒
2、煙時間有顯著影響是每日抽煙數(shù)和調整的CO濃度兩個因素,然后分別對每日抽煙數(shù)和調整的CO濃度與戒煙天數(shù)的關系進行曲線擬合,得到回歸模型;針對問題三,要求得到影響戒煙成功的主要因素,結合問題一和問題二得到的結論,根據(jù)成功戒煙的數(shù)據(jù)進行主成分分析得到主要影響因素為每天抽煙數(shù),調整CO濃度和年齡,其比重分別為35.328%,28.873%,22.383%,另外,通過層次分析法,對得到的主要影響因素進行了可靠性檢驗;針對問題四,要求撰寫一篇500字左右的短文,向有志于戒煙的人士提供戒煙對策和建議。本文綜合問題一、二、三所得到的結論,結合實際,在短文中有針對性的提出了自己的意見。本文還對模型的誤差進行了定
3、量分析;利用MATLAB對問題二中擬合模型進行了優(yōu)化度檢驗;利用層次分析法對問題三建立的模型進行了可靠性檢驗。最后,基于問題二中自變量之間是否存在多重共線性的考慮,對模型進行了恰當?shù)母倪M;并把多元回歸模型、主成分分析法和層次分析法應用于相關方面,對模型做出了縱向的推廣和橫向的推廣。本文分析思路清晰、全面,數(shù)據(jù)處理得當,切入點獨到,模型運用合理,特色鮮明。關鍵詞:戒煙;數(shù)據(jù)擬合;回歸分析;主成分分析;層次分析;MATLAB;SPSS1 問題的重述一、背景知識眾所周知,吸煙不僅危害自身健康,而且由此引起的被動吸煙更是危害公眾身心健康的主要原因。為此,如何幫助相關人士擺脫煙癮的困擾也就成為一個重要的
4、研究課題。本文研究數(shù)據(jù)涉及 234人,他們都自愿表示戒煙但還未戒煙。在他們戒煙的這一天,測量了每個人的CO(一氧化碳)水平并記下他們抽最后一支煙到CO測定時間。CO的水平提供了一個他們先前抽煙數(shù)量的客觀指標,但其值也受到抽最后一支煙的時間的影響, 因此抽最后一支煙的時間可以用來調整CO的水平。記錄下研究對象的性別、年齡及自述每日抽煙支數(shù)。這個調查跟蹤1年, 考察他們一直保持戒煙的天數(shù), 由此估計這些人中再次吸煙的累加發(fā)病率, 也就是原吸煙者戒煙一段時間后又再吸煙的比例. 其中假設原煙民戒煙的可信度是很低的(更恰當?shù)卣f多數(shù)是再犯者)戒煙天數(shù)是從0到他(她)退出戒煙或研究截止時間(1 年)的天數(shù)。
5、假定他們全部沒有人中途退出研究。二、相關數(shù)據(jù)1.本文研究數(shù)據(jù)變量說明見原題數(shù)據(jù)表12.研究所得數(shù)據(jù)詳見原題數(shù)據(jù)表2三、需要解決的問題根據(jù)原題所提供數(shù)據(jù),回答以下問題:問題一:試分析上述234人中再次吸煙的累加發(fā)病率分布情況(如不同年齡段、不同性別等因素下的累加發(fā)病率分布情況)。問題二:你認為年齡、性別、每日抽煙支數(shù)及調整的CO濃度等因素會影響戒煙時間(天數(shù))長短嗎?如果影響請利用附錄中的數(shù)據(jù),分別給出戒煙時間與上述你認為有影響的因素之間的定量分析結果。問題三:請利用附錄中的數(shù)據(jù)建立適當?shù)臄?shù)學模型,討論影響戒煙成功的主要因素有哪些,并對你的模型進行可靠性分析。問題四:請根據(jù)你的模型,撰寫一篇50
6、0字左右的短文,向有志于戒煙的人士提供戒煙對策和建議。2 問題的分析一、對問題的總分析 本文針對戒煙的影響因素分析是對大樣本多數(shù)據(jù)的統(tǒng)計分析和模型建立,首先要對數(shù)據(jù)做合理優(yōu)化,對具體不同問題分別建立了合理的模型,并依據(jù)所給的數(shù)據(jù),使用數(shù)理統(tǒng)計、相關性分析、曲線擬合、主成分分析等知識和利用MATLAB、SPSS、EXCEL等軟件編程給出一定的算法。最后,得出與問題相關的結論,對戒煙人士提出自己的戒煙對策和建議。二、對具體問題的分析1.對問題一的分析根據(jù)附件所給出的數(shù)據(jù)(見附表一),分析被研究者的再次吸煙的累加發(fā)病率分布情況。首先利用excel剔除了數(shù)據(jù)有所缺失的個體變量,然后根據(jù)統(tǒng)計學原理的有關
7、知識,通過控制變量法對不同性別、年齡、抽煙支數(shù)等因素下的累加發(fā)病率進行分組、統(tǒng)計,并利用excel做出條形圖進行直觀的比較,得出相應的結果。2.對問題二的分析 問題二要求利用附錄中的數(shù)據(jù)來定量分析年齡、性別、每日抽煙支數(shù)及調整的CO濃度等因素隊戒煙時間(天數(shù))長短影響。首先我們對其它各變量與戒煙天數(shù)的相關性分析,得到和戒煙天數(shù)相關的變量,然后根據(jù)題意,得到會對戒煙天數(shù)長短的變量。對相關變量的數(shù)據(jù)進行分組處理,求不同區(qū)間內戒煙天數(shù)的平均值,把組距中間值作為那一組的數(shù)值,用SPSS和MATLAB對數(shù)據(jù)進行處理得到相關變量和戒煙天數(shù)的定量分析結果。3.對問題三的分析根據(jù)原題所給的數(shù)據(jù),假設戒煙天數(shù)達
8、到365天的為戒煙成功。因此,抽取出所有戒煙天數(shù)為365天的數(shù)據(jù),進而研究影響戒煙成功的主要因素。根據(jù)問題一、問題二的結論,運用是spss進行主成分分析,將所有影響因素降維成最主要的影響因素,從而得出影響戒煙成功的主要因素。4.對問題四的分析根據(jù)問題一、二、三的研究討論,我們可得出戒煙成功的主要因素,從這些具體的因素進行討論,對有志戒煙得人士提出戒煙的對策和意見。3 模型的假設1.假設原煙民戒煙的可信度是很低的;2.假設被研究的234人中沒有人在研究期間中途退出研究;3.假設原題所給研究數(shù)據(jù)都是真實有效的,不存在人為因素的影響;4.假設被研究對象中存在數(shù)據(jù)缺失的個體刪除后不對研究結果構成顯著性
9、影響;5.假設本次研究中戒煙天數(shù)沒有達到365天的都算作戒煙不成功;6.假設被研究對象的選取是隨機的;7.假設戒煙時間沒有達到365天的視為戒煙失?。? 名詞解釋與符號說明一、名詞解釋累加發(fā)病率:指已知無某種疾病的人群,經過一段特定的觀察期(一年及以上)以后,發(fā)生某病的頻率。累加發(fā)病率集中在01之間。(1)二、符號說明序號符號意義1x1年齡2x2性別(1表示男,2表示女)3x3每日抽煙支數(shù)4x4CO濃度5x5距離抽最后一支煙的分鐘數(shù)6x6調整的CO濃度7y戒煙天數(shù)8p累加發(fā)病率5 模型的建立與求解一、問題一的分析與求解1.對問題的分析根據(jù)附件所給出的數(shù)據(jù)(見附表一),分析被研究者的再次吸煙的累
10、加發(fā)病率分布情況。首先利用excel剔除了數(shù)據(jù)有所缺失的個體變量,然后根據(jù)統(tǒng)計學原理的有關知識,通過控制變量法對不同性別、年齡、抽煙支數(shù)等因素下的累加發(fā)病率進行分組、統(tǒng)計,并利用excel做出條形圖進行直觀的比較,得出相應的結果。2.對問題的求解模型 統(tǒng)計分布模型(1)模型的建立為了保證研究數(shù)據(jù)的可靠程度,利用excel將數(shù)據(jù)不完整的10個個體變量進行刪除。同時根據(jù)不同的影響因素,控制其他變量的,利用數(shù)理統(tǒng)計的知識,對不同因素對累加發(fā)病率的影響用表和直方圖的表達出來,可得出不同因素下的累加發(fā)病率的頻率分布情況。(2)模型的求解 性別因素利用統(tǒng)計學原理,通過對經過處理之后的數(shù)據(jù)進行分組、統(tǒng)計后,
11、得到不同性別的累加發(fā)病率分布頻率表,見表1.1表1.1 不同性別的累加發(fā)病率頻率分布表總人數(shù)戒煙成功戒煙失敗累計發(fā)病率p男104178738.84%女1201410647.32%根據(jù)表1.1,利用excel做出的不同性別對累加發(fā)病率的影響分布直方圖如圖一。圖一 不同性別對累加發(fā)病率的影響頻率分布圖由表1.2及圖一可得出:男女的性別不同對累加發(fā)病率的影響基本一致,女性累加發(fā)病率略高于男性。年齡因素根據(jù)統(tǒng)計學原理,將年齡進行分段,統(tǒng)計每一年齡段的參與研究的總人數(shù)及戒煙失敗的人數(shù),并根據(jù)公式(1)計算其累加發(fā)病率,得到不同年齡階段的累計發(fā)病率分布頻率表,見表1.2。表1.2 不同年齡段的累加發(fā)病率頻
12、率分布表不同年齡段總人數(shù)戒煙成功戒煙失敗累加發(fā)病率p20-294343917.41%30-396185323.66%40-495484620.54%50-594453917.41%60-69175125.36%70-795141.79%根據(jù)表1.2,利用excel做出不同年齡段的累加發(fā)病率頻率分布圖,見圖二.圖二 不同年齡段的累加發(fā)病率頻率分布直方圖由表1.2結合圖二可得:年齡在30-40歲時的累加發(fā)病率最高,之后隨著年齡的上升,累加發(fā)病率逐漸降低。60歲以后急劇降低。 每日抽煙支數(shù)因素與年齡因素的研究方法相似,將224名被研究者的每日抽煙支數(shù)進行統(tǒng)計整理,利用數(shù)理統(tǒng)計的知識,分層次計算不同階
13、段的參與人數(shù)和戒煙失敗的人數(shù),根據(jù)公式(1)計算出累加發(fā)病率,得到各階段的累加發(fā)病率分布表,見表1.3。表1.3 不同的每日抽煙支數(shù)下的累加發(fā)病率的頻率分布表每日抽煙支數(shù)參與人數(shù)戒煙成功戒煙失敗累加發(fā)病率P0-9434156.70%10-196123616.07%20-2954117633.93%30-394483013.39%40-491732511.16%50-10053114.91%根據(jù)表1.3,利用excel畫出每日抽煙支數(shù)各階段的累加發(fā)病率分布直方圖,見圖三。圖三 每日抽煙支數(shù)不同階段的累加發(fā)病率的分布直方圖由表1.3結合圖三可得:每日抽煙在20-29支,累加發(fā)病率最大。30之后,隨
14、診每日抽煙支數(shù)的增加,累加發(fā)病率逐漸降低。當每日抽煙支數(shù)大于50之后,累加發(fā)病率最小。可能是因為被研究人群中,每日抽煙支數(shù)大于50的所占比例較小,基數(shù)小。CO濃度因素將研究所得的CO濃度進行區(qū)間劃分,統(tǒng)計各區(qū)間段的累加發(fā)病率大小,得到CO濃度因素下的累加發(fā)病率的頻率分布表,見表1.4.表1.4 不同CO濃度下的累加發(fā)病率分布表CO濃度參與人數(shù)戒煙成功戒煙失敗累加發(fā)病率P0-99316251116%100-1995174419.64%200-29964105424.11%300-3994453917.41%400-499243219.38%500-900100104.46%根據(jù)表1.4,利用ex
15、cel得出CO濃度的頻率分布直方圖,見圖四。圖四 CO濃度因素影響下的頻率分布直方圖由表1.4及圖四可得:CO濃度在100-400之間時,累加發(fā)病率較高,其中最高點位于200-300之間。當CO濃度高于400時,累加發(fā)病率隨著CO濃度的升高而降低。而當其濃度超過600時,累加發(fā)病率極低,不過這可能是由于此時的參與人數(shù)較小,因此累加發(fā)病率低。調整的CO濃度因素與CO濃度的影響作用相似的,將調整的CO濃度進行區(qū)間劃分,統(tǒng)計各層級的累加發(fā)病率分布頻率表,見表1.5.表1.5 不同調整CO濃度的累加發(fā)病率頻率分布表調整的CO濃度參與人數(shù)戒煙成功戒煙失敗累加發(fā)病率P0-991492312610.27%1
16、00-199412390.89%200-2998260.89%300-5993030.00%600-8998260.89%900-119910190.45%12300-15005140.45%根據(jù)表1.5,利用excel可得出不同調整CO濃度下的累加發(fā)病率頻率分布直方圖,見圖五。圖五 不同調整CO濃度影響下的累加發(fā)病率頻率分布直方圖結合表1.5及圖五可得:由圖可看出調整CO濃度在1400-1600之間時累加發(fā)病率最高,在濃度教育600及大于1800時較低。調整的CO濃度位于(600,1400)時,累加發(fā)病率隨著濃度的增加而升高,而在調整的CO濃度位于(1400,2000)時,累加發(fā)病率與濃度呈
17、負相關關系。二、問題二的分析與求解1.對問題的分析問題二要求利用附錄中的數(shù)據(jù)來定量分析年齡、性別、每日抽煙支數(shù)及調整的CO濃度等因素隊戒煙時間(天數(shù))長短影響。首先我們對其它各變量與戒煙天數(shù)的相關性分析,得到和戒煙天數(shù)相關的變量,然后根據(jù)題意,得到會對戒煙天數(shù)長短的變量。對相關變量的數(shù)據(jù)進行分組處理,求不同區(qū)間內戒煙天數(shù)的平均值,把組距中間值作為那一組的數(shù)值,用SPSS和MATLAB對數(shù)據(jù)進行處理得到相關變量和戒煙天數(shù)的定量分析結果。2.對問題的求解模型 擬合回歸模型(1)模型的準備與問題一一樣,為了便于研究對戒煙時間的影響,我們把缺失值進行了剔除處理。同時,本問考慮到研究中所獲得的戒煙天數(shù)是
18、指從0到他(她)退出戒煙或研究截止時間的天數(shù),因此數(shù)據(jù)中戒煙天數(shù)為365天的戒煙者,其戒煙天數(shù)是不確定的。為提高模型的精確性,我們又把戒煙天數(shù)是365天的數(shù)據(jù)剔除,只對戒煙天數(shù)小于365天的數(shù)據(jù)進行處理和分析。(2)模型的建立與求解由SPSS中雙變量相關性分析得到的每個變量之間的相關性數(shù)據(jù)(見附表),得到變量年齡、性別、每日抽煙支數(shù)、CO濃度、距離抽最后一支煙的分鐘數(shù)、調整的CO濃度和戒煙天數(shù)的顯著性(雙側)值,結果如表2.1:表2.1 相關變量與戒煙天數(shù)的相關性變量顯著性(雙側)值相關性年齡0.075不相關性別0.781不相關每日抽煙支數(shù)0.059不相關CO濃度0.0000.01水平顯著相關
19、距離抽最后一支煙的分鐘數(shù)0.0450.05水平顯著相關調整的CO濃度0.0050.01水平顯著相關根據(jù)題意變量CO濃度和距離抽最后一支煙的分鐘數(shù)可得到調整的CO濃度,調整的CO濃度水平提供了一個自愿者們先前抽煙數(shù)量的客觀標準,在一定程度上,調整的CO濃度和每日抽煙支數(shù)有一定的關系。由此,我們可以主觀的認為每日抽煙數(shù)和調整的CO濃度能影響戒煙時間的長短。每日抽煙數(shù)與戒煙天數(shù)的定量分析我們分別對每日抽煙數(shù)和調整的CO濃度和戒煙天數(shù)的數(shù)據(jù)進行處理。由篩選后的數(shù)據(jù)可得每日抽煙數(shù)的范圍為2,60,我們對每日抽煙數(shù)以10為組距在1,60內分組,處理后的數(shù)據(jù)見表2.2:表2.2 每日抽煙支數(shù)與戒煙天數(shù)的關系
20、表每日抽煙數(shù)組距中間值戒煙總天數(shù)總人數(shù)戒煙天數(shù)均值1-105.515832271.9511-2015.516876924.4521-3025.515165726.6031-4035.511613236.2841-5045.5324746.2951-6055.5197632.83同時,根據(jù)表2.2,利用excel可得出每日抽煙支數(shù)與戒煙天數(shù)的變化關系折線圖,見圖六。圖六 每日抽煙支數(shù)與戒煙天數(shù)的變化關系圖利用SPSS軟件進行曲線擬合,結果證明:立方擬合的效果最好,此時造成的誤差最小,顯著性較高。此時,檢驗統(tǒng)計量=0.985,=45.117,=0.022。模型匯總RR 方調整 R 方估計值的標準誤
21、.993.985.9643.356自變量為 每日抽煙數(shù)。由上述方法可得到戒煙天數(shù)與每日抽煙支數(shù)之間的關系,見圖七。圖七 每日抽煙支數(shù)與戒煙天數(shù)的曲線擬合。由上得到每日抽煙數(shù)和戒煙天數(shù)的回歸分析方程式:可以看出每日抽煙數(shù)和戒煙天數(shù)在整體上呈負相關 調整的CO濃度與戒煙天數(shù)的定量分析與每日抽煙支數(shù)的分析類似,將調整的CO濃度與戒煙天數(shù)的數(shù)據(jù)進行預處理,得到表2.3.表2.3 調整的CO濃度與戒煙天數(shù)之間的數(shù)據(jù)處理調整的CO濃度組距中間值戒煙總天數(shù)總人數(shù)戒煙天數(shù)均值800-999899.5159819.881000-11991099.55701733.531200-13991299.53073605
22、1.221400-15991499.522117828.351600-17991699.54802817.141800-19991899.51125.50利用SPSS進行數(shù)據(jù)的處理可得到結果:二次的R方為0.805且為最大值。此時F值為6.184較小,Sig值為0.086較大,擬合較好。由此可得到調整的CO濃度與戒煙天數(shù)之間的曲線關系,見圖八:圖八 調整的CO濃度與戒煙天數(shù)的曲線擬合由SPSS得到的參數(shù)估計值,可以得到調整的CO濃度和戒煙天數(shù)的回歸分析方程式:可以看出調整的CO濃度和戒煙天數(shù)呈負相關。三、問題三的分析與求解1.對問題 的分析根據(jù)原題所給的數(shù)據(jù),假設戒煙天數(shù)達到365天的為戒煙成
23、功。因此,抽取出所有戒煙天數(shù)為365天的數(shù)據(jù),進而研究影響戒煙成功的主要因素。根據(jù)問題一、問題二的結論,運用是spss進行主成分分析,將所有影響因素降維成最主要的影響因素,從而得出影響戒煙成功的主要因素。2.對問題的求解模型 主成分分析模型(1)模型的準備為消除不同變量的量綱的影響,且不改變變量的相關系數(shù),首先需要對變量進行標準化處理,標準化處理可通過SPSS實現(xiàn)。(2) 模型的建立與求解忽略其他因素對戒煙成功的影響,認為年齡,性別,每日抽煙數(shù)以及調整CO濃度為影響戒煙成功的主成分,通過主成分分析可知,相應的主成分特征值和累計貢獻率如下表3.1:表3.2 各個因素的主成分特征值和累計貢獻率解釋
24、的總方差成份初始特征值提取平方和載入旋轉平方和載入合計方差的 %累積 %合計方差的 %累積 %合計方差的 %累積 %11.41335.32835.3281.41335.32835.3281.39334.83234.83221.15528.87364.2001.15528.87364.2001.17529.36864.2003.89522.38386.5834.53713.417100.000提取方法:主成份分析。(3)模型的可靠性檢驗由表3.2可得:根據(jù)各因素權重向量可知戒煙成功主要因素有每日抽煙支數(shù),調整CO濃度和年齡。其比重分別為35.328%,28.873%,22.383%。由此可知影響
25、戒煙的主要因素為每日抽煙支數(shù),調整的CO濃度和年齡??紤]到每一種成分對戒煙成功的影響不一樣,為確定各指標對戒煙成功影響的權重,本文采用層次分析法進行影響程度評判。模型的層次結構如下:目標層A為“戒煙成功因素分析”;準則層B包括年齡x1、性別x2、每天吸煙支數(shù)x3和調整的CO濃度x4;方案層C為“戒煙成功”和“戒煙失敗”。流程圖如下:對于層次分析法中的比較判斷矩陣,根據(jù)每個成分的累計貢獻率來確定各個指標之間相對重要程度,構造比較判斷矩陣如下: 得到判斷矩陣后,利用MATLAB(附程序一)求其最大特征向量并進行一致性檢驗,結果如下:w =(0.2239,0.1338,0.3535,0.2888)C
26、I=-1;CR= -1.1111CR0.1,表明比較判斷矩陣的不一致程度在允許范圍內,判斷矩陣具有滿意一致性,可以作為評判的權向量。根據(jù)各因素權重向量可知戒煙成功主要因素有每天抽煙數(shù),調整CO濃度和年齡。其比重分別為35.328%,28.873%,22.383%四、問題四的分析與求解1.對問題的分析問題四要求撰寫一篇500字左右的短文,向有志于戒煙的人士提供戒煙對策和建議。本文綜合問題一、二、三所得到的結論,結合實際,在短文中有針對性的提出了自己的意見。2對問題的求解對戒煙者的建議眾所周知,吸煙不僅危害自身的健康,也對社會和公眾產生諸多不利影響,尤其是由此引起的被動吸煙更是危害公眾身心健康的主
27、要原因。戒煙已經成為一項勢在必行的任務。因此,對于提高戒煙成功率的主要影響因素的研究,將對推動戒煙者的戒煙具有重大意義。結合問題一、二、三的數(shù)據(jù)以及具體的模型分析,可以看出,性別、年齡不同的戒煙者在累加發(fā)病率和戒煙天數(shù)上的差別并不是很大。而每日抽煙支數(shù)和CO濃度和戒煙者的累加發(fā)病率的關系相對來說比較明顯。因此可以得知,煙齡越長,抽煙數(shù)量(即煙癮)越大的戒煙者的累加發(fā)病率越高,也越不容易戒煙。據(jù)此,我們將對戒煙者提出以下幾點建議:(1)不論性別如何,也不管年齡多大,只要有一顆戒煙的決心,并且努力克制自己的煙癮,最后都是能夠成功戒煙的。(2)由于每日抽煙只數(shù),也可以當作平時所說的煙癮對戒煙成功與否
28、的影響較大,因此戒煙者應當從每日抽煙只數(shù)的減少處開始著手,每天堅持減少抽煙只數(shù),發(fā)揮自己堅強的毅力,必然是能夠戒煙成功的。(3)根據(jù)數(shù)據(jù)分析和模型的求解結果可知,CO濃度以及調整的CO濃度可以在一定程度上反映戒煙者的煙齡大小和煙癮大小,由于煙齡越大、煙癮越大的人戒煙越難,所以尤其是年齡較大的戒煙者,越應該發(fā)揮巨大的戒煙決心。最后,戒煙是一項長遠而艱巨的任務,戒煙者務必相信自己,無論性別、無論年齡、也無論煙癮的大小,都應該堅定不移的貫徹落實每日提醒自己克制的做法,堅持每天減少抽煙量,長久之后,一定能夠實現(xiàn)戒煙成功的目標。6 誤差分析1.在缺失值的處理時為了方便研究,我們直接進行了剔除處理,沒有對
29、樣本進行插值,對模型的結果會造成一定誤差;2.曲線擬合過程中,我們把顯著性較低的自變量忽略,不考慮其中,使得擬合后的模型不夠精確;3.在進行數(shù)據(jù)處理時,為方便得到回歸曲線,我們對自變量進行了分組研究,并取均值進行分析,會導致結果模糊化。7 模型的評價一、模型的優(yōu)點(1)在構建模型前,對數(shù)據(jù)進行了預處理,刪除了部分缺失數(shù)據(jù),在簡化了數(shù)據(jù)處理的同時,增加了模型的科學性,也體現(xiàn)出思維的嚴謹性與靈活性;(2)充分利用了題目所提供的各種信息,盡可能地保持了數(shù)據(jù)的完整性,使得模型更加精確更加科學;(3)多次利用SPSS及MATLAB等高效的數(shù)學軟件進行數(shù)據(jù)處理和模型的求解,成功地解決了問題,得到了比較理想
30、的結果;(4)運用了簡化之后的多元回歸分析模型,將復雜的問題簡單化,并逐步對模型進行改進,最終得出較為準確可靠的結果。二、模型的缺點(1)使用原始數(shù)據(jù)進行模型的建立和求解,加大了數(shù)據(jù)處理的難度,也使模型的結果可能受到個別異常數(shù)據(jù)的影響。(2)由于原題所提供的僅為234人的數(shù)據(jù),該數(shù)據(jù)可能不足以準確地反映普遍的規(guī)律,也不能夠利用數(shù)據(jù)作出精確的模型來揭示累加發(fā)病率的分布情況。(3)運用MATLAB進行去點擬合時,丟失部分數(shù)據(jù),模型的結果與實際情況存在一定的誤差。8 模型的推廣本文的模型是建立在解決多個具有相關性的自變量與因變量之間的相關關系的問題上的基礎上,采用了多變量分析,構建出了多元回歸分析模型,具有一般性,適合進行進一步推廣。上述模型不局限于本題所解決的戒煙問題,可以推廣到大部分求解多變量的相關性分析問題。在解決具體問題時,可以根據(jù)具體問題對該模型進行一定的改進和修改。參考文獻1 史書良.統(tǒng)計學原理M.北京:清華大學出版社,2007.2 茆詩松.周紀薌.概率論與數(shù)理統(tǒng)計M.北京:中國統(tǒng)計出版社,2007.3 張文彤.SPSS 11 統(tǒng)計分析教程M.北京:北京希望
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 醫(yī)療健康醫(yī)療器械研發(fā)合作合同
- 儲物柜租賃合同
- 家具的采購合同
- 移動應用軟件開發(fā)委托代理合同
- 物業(yè)股權抵押合同
- 汽車維修與保養(yǎng)合同
- 幼兒園實習生勞動合同范本
- 品牌合作合同書:活動贊助
- 2025年古建筑修復合作合同范本
- 2025年居民住房互換合同策劃大綱
- 2025年湖南現(xiàn)代物流職業(yè)技術學院高職單招職業(yè)技能測試近5年??及鎱⒖碱}庫含答案解析
- 第二十章手術減肥及體形塑造美容手術美容外科學概論講解
- 2025年蘇州衛(wèi)生職業(yè)技術學院高職單招職業(yè)技能測試近5年??及鎱⒖碱}庫含答案解析
- 履帶式剪叉高空作業(yè)平臺安全操作規(guī)程
- 《水稻育秧技術新》課件
- 2024-2025年第一學期初中德育工作總結
- 圍手術期手術患者護理要點
- 2025年大連長興開發(fā)建設限公司工作人員公開招聘高頻重點提升(共500題)附帶答案詳解
- 貨物學 課件1.3貨物的計量
- 《鈉離子電池用電解液編制說明》
- 全球醫(yī)療旅游經濟的現(xiàn)狀與未來趨勢
評論
0/150
提交評論