




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
目錄TOC\o"1-4"\h\z\u32128摘要: 120242關(guān)鍵詞: 128815Abstract: 113136Keywords: 14687引言 2145951一元線性回歸的思想及其應用舉例 434591.1一元線性回歸模型 5251341.2一元線性回歸模型的檢驗 625061.3一元線性回歸模型舉例 7305232多元線性回歸模型的思想及其應用舉例 1046222.1多元線性回歸的數(shù)學模型 10103222.2多元線性回歸模型的檢驗 11165742.3多元線性回歸模型應用舉例 12305922.3.1研究問題的提出 12240882.3.2數(shù)據(jù)采集與多元回歸分析 12104712.3.3EXCEL作回歸分析確定待定系數(shù)的值 13120722.3.4總結(jié) 142663前進法、后退法、逐步回歸法思想及其舉例 15213513.1前進法 15252103.1.1前進法回歸分析的應用 16184793.1.1.1回歸方程 16117603.1.1.2回歸方程及系數(shù)檢驗 1623033.2后退法 1682063.2.1后退法回歸分析的應用 17150063.2.1.1回歸方程 176113.2.1.2回歸方程及系數(shù)的檢驗 171633.3逐步回歸法 17290363.3.1逐步回歸分析的應用 18225043.3.2研究結(jié)果比較 1918332致謝 錯誤!未定義書簽。26101參考文獻 1932186附錄 20多元回歸分析的應用研究摘要:回歸分析方法是多元統(tǒng)計分析的各方法中應用最廣泛的一種,也是數(shù)理統(tǒng)計中最成熟最常用的方法,主要是研究變量間的相互依賴關(guān)系。首先,本文通過建立一元線性回歸模型,闡述了一元線性回歸模型的基本統(tǒng)計思想以及它在實際問題研究中的應用原理。然后,推廣建立了多元線性回歸,運用SPSS等統(tǒng)計軟件建立了由熟料化學成分分析結(jié)果預測抗壓強度的模型,來指導水泥生產(chǎn)配比的調(diào)整,其更好的論證了多元線性回歸,最優(yōu)回歸模型的檢驗、評價及預測。最后,通過前進法、后退法、逐步回歸法,闡述了各個方法的思想以及步驟,論證了在多元回歸方法中,并不是所有的自變量都對因變量有顯著影響這一思想,舉例說明了各方法的優(yōu)缺點,保證所有子集為最優(yōu)回歸子集。同時我們也看出線性回歸模型在解決這類經(jīng)濟增長、預測問題上有很好的效果,其作用具有很好的參考價值。關(guān)鍵詞:一元線性回歸;多元線性回歸;前進法;后退法;逐步回歸MultipleRegressionAnalysisofAppliedResearchAbstract:Regressionanalysismethodisthemostwidelyusedinvariousmethodsofmultivariatestatisticalanalysisofa,isalsothemostmatureandmostcommonlyusedmethodinmathematicalstatistics,mainlyisthestudyofmutuallydependentrelationshipbetweenvariables.Firstofall,throughtheestablishmentofayuanlinearregressionmodel,thispaperexpoundsthebasicstatisticalideaofayuanlinearregressionmodelanditsapplicationintheactualproblemresearchprinciple.Then,establishedthemultivariatelinearregression,usingthestatisticalsoftwareofSPSSwasestablishedbytheclinkerchemicalcompositionanalysisresultpredictionmodelofcompressivestrength,toguidetheadjustmentoftheratioofcementproduction,itsbetterdemonstratesthemultiplelinearregression,theoptimalregressionmodelofinspection,evaluationandprediction.Finally,throughtheformerentered,regressivemethod,stepwiseregressionmethod,thispaperexpoundsthedifferentmethodsofthoughtandsteps,demonstratedinmultivariateregressionmethod,andnotalltheindependentvariablesonthedependentvariablehasasignificantimpactontheideas,theadvantagesanddisadvantagesofeachmethodisillustratedbyanexample,ensuringthatallsubsetsoftheoptimalsubsetregression.Atthesametimewealsoseethatthelinearregressionmodeltodealwiththeproblemofthiskindofeconomicgrowth,forecasthasverygoodeffect,itsactionhastheverygoodreferencevalue.Keywords:Ayuanlinearregression;Multiplelinearregression;Beforethelaw;Back為尋找參數(shù)的估計值,定義的離差平方和達到最小,則滿足對其分別求偏導數(shù),并令其為零,則有經(jīng)整理其方程組得到的最小二乘估計為其中得到其回歸直線1.2一元線性回歸模型的檢驗檢驗,其檢驗回歸系數(shù)的顯著性。原假設為對立假設是構(gòu)造統(tǒng)計量為其中,是的無偏估計,當原假設成立時,其統(tǒng)計量服從自由度為的分布,給定顯著性水平,當時接受,認為對的一元線性回歸不成立。檢驗。,根據(jù)平方和分解式簡寫為構(gòu)造統(tǒng)計量其中服從自由度為的分布,給定顯著性水平,當說明回歸方程顯著,對有顯著的線性關(guān)系。1.3一元線性回歸模型舉例某快餐店已經(jīng)在全國建立了多家分店。其成功的重要經(jīng)驗之一就是:店要建在學校附近。在新建立一家分店之前,管理層需要對這個新店的年銷售額做出估計,這一估計用于確定新建餐館的規(guī)模。管理人員認為,設在某校園附近餐館的年銷售額與該學校的人數(shù)有關(guān)。初步的看法是,設在規(guī)模大、學生人數(shù)多的學校附近的餐館的年銷售額高于設在規(guī)模小、學生人數(shù)少的學校附件的餐館的年銷售額。為研究新餐館的年銷售額隨當?shù)貙W生人數(shù)的變化規(guī)律,該快餐店收集了它的10個坐落在校園附近的銷售分店的年銷售額與其所在地學生人數(shù)的數(shù)據(jù),這些數(shù)據(jù)如表1-2表1-210個分店的年銷售額及分店駐地學生人數(shù)餐館序號學生人數(shù)(1000人)年銷售額(1000人)1258261053888481185121176161377201578201699221491026202圖1-2學生人數(shù)與餐館年銷售額關(guān)系散點圖譬如,對第一個分店,,表示該店坐落在有2000名學生的一所學校附近,年銷售額為5800元;第二分店附近的一所學校有6000名學生,它的銷售額達105000元;余類推。以學生人數(shù)為橫軸,年銷售額為縱軸,將觀察結(jié)果組成的數(shù)據(jù)對在直角坐標系中描出相應的散點圖。如圖1-2,從圖1-2可見,數(shù)據(jù)點大致落在一條直線附近,這顯示這兩個變量近似地就有線性關(guān)系。設隨機變量與變量之間存在某種線性相關(guān)關(guān)系,這里,是可以控制的(或可以觀察的)變量,設其中,稱為隨機誤差。未知參數(shù)都不依賴于,式(1-1)稱為一元線性回歸模型。它描述了相依變量(銷售額)與一個獨立變量(學生人數(shù))之間的線性關(guān)系。按前述假設,(1-7)式等價于方程,該式表示當已知時,可以精確地算出數(shù)學期望,由于表示不可控制的隨機因素,通常就用作為的估計值,由樣本得到(1-7)式的估計則方程為關(guān)于的估計回歸方程或回歸方程,其圖形稱為回歸直線,式中表示的估計。系數(shù)采用最小二乘法計算,這里我們用的多項式擬合命令實現(xiàn),其程序見附錄1所示,得因此,用最小二乘法求得的估計回歸方程是:回歸直線如圖1-2所示,可以看到它與所有的數(shù)據(jù)點都很接近。如果有充足的理由相信這個方程真實地反映了與之間的關(guān)系。對于給定的的值,我們就能夠預測出可以信賴的的值,譬如,若一個新建的分店坐落在一所16000名學生的學校附近,那么有:即,這家分店的年銷售額會達到140000元。變量與之間線性關(guān)系是統(tǒng)計意義上的,因此必須要對這種線性關(guān)系作統(tǒng)計檢驗。假定與的回歸具有的形式。如果變量與之間確有這樣的關(guān)系,即變量的值對的值施加了影響,則不會為零。因此,應該檢驗假設(1)檢驗經(jīng)推導可知,的估計服從正態(tài)分布,即′其中而得無偏估計為殘差平方和,可以得出,故,于是中的估計量就是,故可使用檢驗法對進行檢驗,檢驗統(tǒng)計量當為真時,此時其的拒絕域是:其中,為顯著性水平。當假設被拒絕時,認為回歸效果是顯著的,反之,就認為回歸效果不顯著。將表1-2中的數(shù)據(jù)帶入,可以計算出,且而對和自由度為的條件下,可以計算出臨界值現(xiàn)在,故在顯著水平下拒絕,即認為,認為回歸效果是顯著的。(2)檢驗在回歸模型中只有一個獨立變量的情況下檢驗和檢驗產(chǎn)生同樣的結(jié)論。也就是說,若用檢驗法拒絕了,改用檢驗法同樣會得到拒絕的結(jié)論。當為真時,統(tǒng)計量簡寫為其中服從自由度為的分布,將表2的數(shù)據(jù)帶人,可以計算得又知且,所以通過計算可得對于,得出由于成立,故拒絕所獲結(jié)論與檢驗相同。由次,我們有充分的理由相信方程真實地反映了與之間的關(guān)系。由以上可以看到,通過一元回歸模型很好的解決的該快餐店的銷售額估計,從而使其擴大經(jīng)營有依可循,能有效的避免決策失誤,減少經(jīng)濟損失,增大經(jīng)濟效益.可以說線性回歸模型在解決這類經(jīng)濟增長、預測問題上有很好的效果。2多元線性回歸模型的思想及其應用舉例2.1多元線性回歸的數(shù)學模型設隨機變量與一般變量的線性回歸模型為其中,是個未知參數(shù),稱為回歸參數(shù),稱為回歸系數(shù),稱為被解釋變量(因變量),是個可以精確測量并控制的一般變量,稱為解釋變量(自變量),是隨機誤差,且 稱為理論回歸方程。對一個實際問題,獲得組觀測數(shù)據(jù)則線性回歸模型式可以表示為寫成矩陣形式為其中對于多元線性回歸方程未知參數(shù)的估計與一元線性回歸方程的參數(shù)估計原理一樣,采用最小二乘估計,即尋找的估計值即離差平方和最小。使其滿足對其分別求偏導數(shù),并令其為0,以上方程組經(jīng)整理后,用矩陣形式表示的正規(guī)方程組移向得當存在時,即得回歸參數(shù)的最小二乘估計為得出多元線性回歸預測模型為2.2多元線性回歸模型的檢驗對于多元線性回歸方程的顯著性檢驗與一元線性回歸方程的顯著檢驗既有相同之處,也有不同之處。下面將介紹兩種統(tǒng)計檢驗方法即檢驗和檢驗。檢驗,檢驗是對整個回歸方程的顯著性檢驗,為此提出原假設為建立對進行檢驗的統(tǒng)計量,利用總離差平方和的分解簡寫為則統(tǒng)計量如下在正態(tài)假設下,當原假設成立時服從自由度為的分布,于是,可以利用統(tǒng)計量對回歸方程的總體顯著性進行檢驗。當時,拒絕原假設,認為在顯著性水平下,與有顯著的線性關(guān)系即回歸方程是顯著的,反之,當時,認為回歸方程不顯著。檢驗,檢驗是用來對每個回歸系數(shù)是否有意義進行的檢驗。構(gòu)造統(tǒng)計量其中是矩陣主對角線的第個元素,服從自由度為的分布。當給定顯著性水平,如果則認為對有顯著影響,否則認為其線性效果不顯著。檢驗,檢驗是用于檢驗回歸方程對樣本觀測值的擬合程度,其計算公式為復相關(guān)系數(shù)說明這一組影響因素與的相關(guān)程度,值越接近1,說明利用多元線性回歸的效果越好。2.3多元線性回歸模型應用舉例2.3.1研究問題的提出水泥熟料的強度在水泥生產(chǎn)中是一個關(guān)鍵性的指標,甚至可以說是水泥熟料質(zhì)量好壞的結(jié)論性指標。由于其測量周期長,數(shù)據(jù)不能及時反饋給用戶,同時企業(yè)又不能因為此項指標的缺失而拒絕發(fā)貨,因此多數(shù)水泥企業(yè)出廠管理采用強度累計增長率即二元回歸的方法預測水泥熟料強度。經(jīng)過長期實踐證明,累計增長率的方法確實可以作為預測水泥熟料強度的依據(jù),但要做到水泥企業(yè)的精細化管理,其預測的準確程度還有待商榷。影響水泥熟料強度的因素很多,如:礦物組成數(shù)量、化學成分、熟料的燒結(jié)狀況、熟料礦物晶體的晶型等。累計增長率的方法完全忽略了這些關(guān)系,本文提及的多元回歸分析強調(diào)化學成分與水泥熟料強度的關(guān)系,運用多元回歸的方法預測水泥熟料的強度。眾所周知水泥熟料的水化產(chǎn)物主要有4種,分別為:。其中對水泥熟料強度起主要作用的是和對水泥熟料的影響較大。水泥熟料的強度是其礦物組成物理特性的表現(xiàn),直接獲取水泥熟料水化產(chǎn)物的含量比較困難,但其化學成分通過化學分析的方法卻能得到較精確的結(jié)果,水泥熟料的化學成分能間接反映其水化產(chǎn)物。是水泥熟料水化的有害成分,含量過高會影響水泥的安定性。因此本文選取水泥熟料中的化學成分的含量與水泥熟料強度進行多元回歸分析。2.3.2數(shù)據(jù)采集與多元回歸分析選取生產(chǎn)工藝狀況比較穩(wěn)定、熟料全分析及物檢數(shù)據(jù)準確度符合分析、檢驗要求、并具有代表性的若干組檢驗數(shù)據(jù)作為回歸分析基礎數(shù)據(jù),原始數(shù)據(jù)應不少于20組。在此采集千業(yè)水泥公司6、7月份熟料檢驗結(jié)果列于附錄表2-1根據(jù)常規(guī)熟料化學分析項目,建立多元線性回歸分析的數(shù)學模型如下:式中:為預測的熟料抗壓強度;分別表示熟料化學分析中的百分含量;為待定系數(shù)。2.3.3EXCEL作回歸分析確定待定系數(shù)的值創(chuàng)建一個EXCEL工作表,并將所采集的數(shù)據(jù)組熟料化學分析及物檢數(shù)據(jù)輸入表中。然后將光標移到列、回歸系數(shù)行的單元格,單擊“粘貼函數(shù)”打開粘貼函數(shù)中的“函數(shù)分類(C)”選擇其中“查找與引用”,在“函數(shù)名(N)”中選擇“INDEX”然后按“確定”,此時在編輯欄中出現(xiàn)“=INDEX()”。再在“=INDEX()”的括號內(nèi)輸入表格定位:(LINEST(I5:I30,B5:H30),8),此時編輯欄中顯示=INDEX(LINEST(I5:I30,B5:H30),8),單擊編輯欄的“√”即可得出的值。將光標移到x1下回歸系數(shù)行的單元格,采用同樣方法輸入=INDEX(LINEST(I5:I30,B5:H30),7),,即可得出x1的數(shù)值,移動光標到相應系數(shù)下單元格,同樣方法,只需將公式中最后一個數(shù)字依次改為“6、5、4、3、2、1”,即可依次得出的值。在EXCCEL中可以方便地用所求公式對強度結(jié)果進行驗算,將光標移到上面EXCCEL工作表的單元格J5,單擊后單擊“粘貼函數(shù)”打開粘貼函數(shù)中的“函數(shù)分類(C)”選擇其中“全部”,在“函數(shù)名(N)”中選擇“SUMPRODUCT”然后按“確定”,此時在編輯欄中出現(xiàn)“=SUMPRODUCT()”。再在“=SUMPRODUCT()”的括號內(nèi)輸入:“B5:H5,C2:I2”,然后再加上即“+B2”,此時編輯欄中顯示=SUMPRODUCT(B5:H5,C2:I2)+B2。單擊編輯欄的“√”,即可得出6.17的抗壓強度預測值見表2-1。將光標移到單元格J5的右下角,當其變?yōu)楹谑謺r,按下鼠標左鍵,向下拖至單元格J30,即可得出所有相應的抗壓強度預測值。將光標移到工作表的單元格K5,單擊后在上方編輯欄內(nèi)輸入公式“J5-I5”即可得出6.17的物理檢測值和預測值的差,采用同樣方法向下拖至單元格K30,即可得出所有相應的誤差值。其統(tǒng)計分析結(jié)果見表2-1其預測公式在SPSS中選擇工具一數(shù)據(jù)分析一回歸,其輸出結(jié)果見下表2-2,以及附錄表2-3表2-2系數(shù)表模型非標準化系數(shù)標準系數(shù)tSig.B標準誤差試用版1(常量)2.0171.0002.017.059x1.687.011.95361.450.000x2.537.012.66145.534.000x3.878.026.39934.349.000x4-1.088.030-.364-36.399.000x5-1.497.021-.780-71.426.000x6.126.008.17014.897.000x7.477.011.50944.921.000將所有結(jié)果保留2位有效數(shù)字,則水泥熟料強度預測公式(1)為:式中:每個回歸系數(shù)下面括號中的數(shù)值是與其互相對應的值.其中為水泥熟料強度預測值,分別代表水泥熟料中:元素的含量。由以上回歸方程可以看出,它與EXCEL所得到的回歸系數(shù)值極匹配,所選取的回歸方程準確性較好,在實際測量中結(jié)果也令人滿意。下面對模型進行檢驗。(1)檢驗根據(jù)顯著性水平,查分布表,得通過統(tǒng)計軟件計算處理得到從以上可得三個回歸系數(shù)的檢驗均通過,同理檢驗通過,所選擇的自變量是影響強度的的主要因素。檢驗通過計算機得到根據(jù)顯著性水平,查分布表得,因為,所以,檢驗通過,表明回歸方程的回歸效果顯著。整體上對有高度顯著的線性關(guān)系。(3)復相關(guān)系數(shù),決定系數(shù),由決定系數(shù)看回歸方程高度顯著。本文所得的回歸經(jīng)驗公式是建立在生產(chǎn)工藝較穩(wěn)定,化學分析結(jié)果和熟料強度有較好的線性相關(guān)關(guān)系的基礎上。采用此方法,對焦作千業(yè)水泥有限責任公司2007年6月17日至2007年7月16日期間生產(chǎn)較為正常的熟料抗壓強度進行了預測(見附錄表2-1),與物檢實際抗壓強度相比,其絕對強度誤差最大值為,絕對平均強度誤差為,相關(guān)性很好,并且以水泥熟料水化機理、礦物組成與其強度的關(guān)系為依據(jù),強調(diào)水泥熟料中化學成分對其強度的影響,選用多元回歸的分析方法,打破傳統(tǒng)累計增長率的預測形式、預測模型更加科學,具有指導水泥生產(chǎn)配比調(diào)整的意義。2.3.4總結(jié)在多元線性回歸分析中,我們知道回歸方程中所包含的自變量越多,那么回歸平方和就越大,則剩余平方和就越小,一般情況下剩余標準差也隨之減少,回歸方程效果越好,而精度也越高。在“最優(yōu)”回歸方程中總希望包括盡可能多的自變量,特別是對因變量有顯著影響的自變量不能遺漏。但回歸方程所包括的自變量太多,也帶來不利的一面,首先,若要求自變量多,則在預測時必須測定許多量,并且計算也不方便;其次,如果在回歸方程中包括有對因變量y不起作用或作用極小的自變量,那么剩余平方和也不會由于自變量的增加而減少,相反由于的自由度的減少,反而使剩余標準差增大,這就影響回歸方程的精度;第三,由于存在著對因變量影響不顯著的自變量,以致影響回歸方程的穩(wěn)定性,使預測效果下降。因而,在“最優(yōu)”回歸方程中,又希望不包括對因變量影響不顯著的自變量。綜上所述,所謂最優(yōu)回歸方程,就是在回歸方程中包括所有對因變量有顯著影響的自變量,而不包括對因變量影響不顯著的自變量的回歸方程。最優(yōu)回歸方程的建立,是采取將自變量逐個引入的方法。引入自變量的條件是:該自變量的偏回歸平方和經(jīng)檢驗是所有自變量中最顯著的。同時,每引入一個新變量后,要求對已引入的自變量逐個進行檢驗,將偏回歸平方和變得不顯著的自變量及時剔除。由于每步都作檢驗,因而保證了最后所建立的回歸方程中所有自變量都是顯著的。上述這種建立最優(yōu)回歸方程的理論和方法,稱為逐步回歸分析。3前進法、后退法、逐步回歸法思想及其舉例3.1前進法前進法的思想是變量有少變多,每次增加一個,直至沒有可引入的變量為止,具體做法是首先將全部個自變量分別對因變量建立個一元線性回歸方程,并分別計算這個一元回歸方程的個回歸系數(shù)的檢驗值,記為,選其最大值記為給定顯著性水平,若,則首先將引入回歸方程,為了方便,設就是。接下來因變量分別與建立個二元線性回歸方程,對這個回歸方程中的回歸系數(shù)進行檢驗,計算值,記為,選其最大者記為若,則接著將引入回歸方程。以上述方法接著做下去,直至所有的未被引入方程的自變量的值均小于時為止。這時,得到的回歸方程就是最終確定的方程。每步檢驗中的臨界值與自變量數(shù)目有關(guān),在用軟件計算時,我們實際使用的是顯著性值做檢驗。3.1.1前進法回歸分析的應用例4現(xiàn)實生活中,影響一個地區(qū)居民消費的因素很多,例如,一個地區(qū)的人均生產(chǎn)總值、收入水平、消費價格指數(shù)、生活必需品的花費等。本例選取9個解釋變量研究城鎮(zhèn)居民家庭平均每人全年的消費性支出,解釋變量為:居民的食品花費,居民的服裝花費,居民的居住花費,居民的醫(yī)療花費,居民的教育花費,地區(qū)的職工平均工資,地區(qū)的人均,地區(qū)的消費價格指數(shù),地區(qū)的失業(yè)率。本例選取2009年《中國統(tǒng)計年鑒》我國的30個省、市、自治區(qū)(西藏地區(qū)失業(yè)率數(shù)據(jù)缺失,因此從樣本中剔除西藏)2008年的數(shù)據(jù),以居民的消費性支出(元)為因變量,以如下9個變量為自變量作多元線性回歸。數(shù)據(jù)見附錄,其中,自變量單位為元,的單位為。對例題4城鎮(zhèn)居民消費性支出關(guān)于9個自變量做回歸數(shù)據(jù),用前進法做變量選擇,取顯著性水平。3.1.1.1回歸方程從中可以看到,前進法依次引入,則城鎮(zhèn)居民消費性支出關(guān)于9個自變量的回歸方程為3.1.1.2回歸方程及系數(shù)檢驗回歸模型的假設檢驗:從表中可以看出,其值小于0.05,則說明居民消費性支出的回歸系數(shù)不為0,其回歸模型有統(tǒng)計意義。偏回歸系數(shù)的假設檢驗:表中,則在0.05的顯著性水平下,該各回歸系數(shù)不為0.說明對各個自變量有顯著影響。衡量線性回歸模型優(yōu)劣的標準,其復決定系數(shù),表明:用樣本量和模型中自變量的個數(shù)進行調(diào)整后,模型中自變量有的解釋力比前四次回歸都顯著,這也說明了與之間高度的線性相關(guān)關(guān)系。3.2后退法后退法。是將全部自變量回歸,然后對每個自變量做顯著性檢驗,剔除最不重要的變量.后退法其具體做法是對個回歸系數(shù)進行檢驗,記求得的值為,選其最小者記為給定顯著性水平,若,則首先將從回歸方程中剔除,為了方便,設就是。接著對剩下的個自變量重新建立回歸方程,進行回歸系數(shù)的顯著性檢驗,像上面那樣計算出,如果又有,則剔除,重新建立關(guān)于個自變量的回歸方程,依此類推,直至回歸方程中所剩余的個自變量的檢驗值均大于臨界值,沒有可剔除的自變量為止,這時,得到的回歸方程就是最終確定的方程。3.2.1后退法回歸分析的應用對例4城鎮(zhèn)居民消費性支出關(guān)于9個自變量做回歸數(shù)據(jù),用前進法做變量選擇,取顯著性水平。3.2.1.1回歸方程后退法依次引入了其最優(yōu)回歸模型如下:居住,醫(yī)療保健,教育,平均工資,人均,消費價格指數(shù)3.2.1.2回歸方程及系數(shù)的檢驗回歸模型的假設檢驗:從表中可以看出拒絕原假設,說明回歸方程顯著,其回歸模型有統(tǒng)計意義。偏回歸系數(shù)的假設檢驗:表中檢驗的結(jié)果,值分別等于3.602,3.121,3.014,2.683,8.397,1.738,3.502各自值為0.002,0.005,0.006,0.013,0.000,0.096,0.002在顯著性水平,則拒絕原假設,該各偏回歸系數(shù)均不為0,且對居民消費性支出有顯著影響。(3)衡量線性回歸模型優(yōu)劣的標準:復決定系數(shù)為調(diào)整的復決定系數(shù)表明:用樣本量和模型中自變量的個數(shù)進行調(diào)整后,模型中自變量有的解釋力比前兩次回歸都顯著,這也說明與之間高度的線性相關(guān)關(guān)系。3.3逐步回歸法逐步回歸的基本思想是有進有出。具體做法是將變量一個一個引入,每引入一個自變量后,對已選入的變量進行逐個檢驗,當原引入的變量由于后面變量的引入而變得不再顯著時,要將其剔除。引入一個變量或從回歸方程剔除一個變量,為逐步回歸的一步,每一步都要進行檢驗,以確保每次引入新的變量之前回歸方程中只包含顯著的變量,這個過程反復進行,直到既無顯著的自變量選入回歸方程,也無不顯著自變量從回歸方程中剔除為止。這樣就避免了前進法和后退法各自的缺陷,保證了最后所得的回歸子集是最優(yōu)回歸子集。在逐步回歸法中要注意的一個問題是引入自變量和剔除自變量的顯著性水平值是不同的,要求引入自變量的顯著性水平小于剔除自變量的顯著性水平,否則可能產(chǎn)生“死循環(huán)”。3.3.1逐步回歸分析的應用表3-1的數(shù)據(jù)是1968—1983年間美國與電話線制造有關(guān)的數(shù)據(jù),各變量的含義如下:年份;國民生產(chǎn)總值(10億美元);新房東工數(shù)(單位:1000);失業(yè)率();滯后6個月的最惠利率;用戶用線增量(%);年電話線銷量(百萬尺雙線)。表3-11968-1983美國與電話線制造數(shù)據(jù)x1x2x3x4x5x6y19861051.81503.63.65.85.9587319691078.81486.73.56.74.5785219701075.31434.85.08.44.2818919711107.52035.06.06.24.2749419721171.12360.05.65.44.9853419731235.02043.04.95.95868819741217.81331.05.69.44.1727019751202.31160.08.59.43.4502019761271.01535.07.77.24.2603519771332.71961.87.06.64.5742519781399.22009.36.07.63.9940019791431.61721.96.010.64.4935019801480.71290.07.214.93.9654019811510.31100.07.616.63.1767519821492.21039.09.217.50.6741919831535.41200.08.816.01.57923用spss做回歸,其輸出結(jié)果如附錄表3-2所示:(1)從輸出結(jié)果表3-2可以看出,逐步回歸的最優(yōu)子集模型為模型3,回歸方程為從回歸方程可以看出,對1968—1983年間美國與電話線制造年電話線銷量(百萬尺雙線)有顯著影響的是新房東工數(shù)(單位:1000)、失業(yè)率()、滯后6個月的最惠利率,回歸方程中失業(yè)率()的回歸系數(shù)為負,即,失業(yè)率越高年電話銷量越低,這也符合實際情況。方差分析表,表明回歸方程顯著,說明整體上在顯著性水平的情況下對有顯著影響。回歸系數(shù)的顯著檢驗。自變量對均有顯著影響。其中失業(yè)率()的最大,但仍在的顯著性水平下對高度顯著,這充分說明在多元回歸中不能僅憑簡單相關(guān)系數(shù)的大小而決定變量的取舍。在輸出結(jié)果可以看到逐步回歸的選元過程。本例逐步回歸法的選元過程依次將引入回歸模型,沒有剔除變量,保留作為最終模型。相比之下,后退法首先做全模型的回歸,每個自變量都有機會展示自己的作用,所得結(jié)果更值得信服,說明兩種方法對自變量重要性的認可是不同的,這與自變量之間的相關(guān)性有關(guān)聯(lián)。3.3.2研究結(jié)果比較從上面的例子可以得出前進法和后退法顯然都有明顯的不足。前進法可能存在這樣的問題,既不能反映引進新的自變量后的變化情況。因為某個自變量開始可能是顯著的,但當引入其他自變量后它就變得不顯著了,但是也沒有機會將其剔除,即一旦引入,就是“終身制”的。這種只考慮引入而沒有考慮剔除的做法顯然是不全面的。我們在許多例子中會發(fā)現(xiàn)可能最先引入的某個自變量—當其他自變量相繼引入后—會變得對因變量很不顯著。后退法明顯不足是,一開始把全部自變量引入回歸方程,這樣計算量很大。如果有些自變量不太重要,一開始就不引入,就可減少一些計算量;再就是一旦某個自變量被剔除,它就再也沒有機會重新進入回歸方程。逐步回歸的思想是有進有出,即吸收了前進法和后退法的優(yōu)點,克服它們的不足,把兩者結(jié)合起來,避免了前進法和后退法的各自缺陷,保證了最后所得的回歸子集是最優(yōu)回歸子集。參考文獻[1]何曉群.回歸分析與經(jīng)濟數(shù)據(jù)建模[M].北京:中國人民大學出版社,1997.[2]何曉群,劉文卿.應用回歸分析(第三版)[M].北京:中國人民大學出版社,2011.[3]王學民.應用多元分析[M].(第三版)[M].上海財經(jīng)大學出版社,2009.[4]賈俊平.統(tǒng)計學[M].北京:中國人民大學出版社,2007.[5]倪加勛,袁衛(wèi),易丹輝,蔡志洲.應用統(tǒng)計學[M].北京:中國人民大學出版社,1998.[6]陳汝棟,于延榮.數(shù)學模型與數(shù)學建模(第2版)[M].北京:國防工業(yè)出版社,2009.[7
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025至2030年中國女式運動褲數(shù)據(jù)監(jiān)測研究報告
- 2025至2030年中國圓柱式木質(zhì)百貨組合貨架數(shù)據(jù)監(jiān)測研究報告
- 2025至2030年中國全自動C型鋼機數(shù)據(jù)監(jiān)測研究報告
- 人教版(三起)第一單元 初步認識與基本操作 1 信息和信息技術(shù)-窗口操作-教學設計
- 2025年中國PVC美化防火板市場調(diào)查研究報告
- 全國青島版初中信息技術(shù)第六冊第一單元第7課《身份驗證》教學設計
- 2024-2025學年高中政治第3單元思想方法與創(chuàng)新意識第7課唯物辯證法的聯(lián)系觀第2框用聯(lián)系的觀點看問題課堂訓練新人教版必修4
- 2024年春七年級語文下冊第二單元5黃河頌作業(yè)設計含解析新人教版
- Unit 1 Life Choices Lesson 2 Understanding and Coping with Stress 教學設計-2024-2025學年高中英語北師大版(2019)必修第一冊
- 21古詩詞三首楓橋夜泊(教學設計)2024-2025學年統(tǒng)編版語文五年級上冊
- 2024年高考物理真題分類匯編(全一本附答案)
- 醫(yī)藥銷售月總結(jié)匯報
- 地質(zhì)勘探行業(yè)復工安全培訓課件
- 神經(jīng)系統(tǒng)疾病的癥狀和藥物治療
- 冷庫制冷負荷計算表
- 八年級上冊數(shù)學幾何綜合題
- 年終獎計算方案
- 《惡心與嘔吐》課件
- 普通話培訓班合作協(xié)議書
- 《西方思想經(jīng)典》課件
- 中醫(yī)診療設備種類目錄
評論
0/150
提交評論