




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
南昌工程學(xué)院畢業(yè)設(shè)計(jì)(論文)理學(xué)系系(院)信息與計(jì)算科學(xué)專業(yè)論文題目多元回歸模型及其在工業(yè)生產(chǎn)總值預(yù)測(cè)中的應(yīng)用研究學(xué)生姓名班級(jí)學(xué)號(hào)指導(dǎo)教師多元回歸模型及其在工業(yè)生產(chǎn)總值預(yù)測(cè)中的應(yīng)用研究Multipleregressionmodelanditsapplicationinindustrialproductionprediction總計(jì)論文26頁表格7個(gè)插圖2副摘要經(jīng)濟(jì)指標(biāo)預(yù)測(cè)是一項(xiàng)具有挑戰(zhàn)性的研究工作。本文利用多元回歸模型研究經(jīng)濟(jì)指標(biāo)影響因素,并為資源優(yōu)化配置提供一定參考意見。以中國(guó)各省制造業(yè)工業(yè)生產(chǎn)總值為研究對(duì)象,依據(jù)背景知識(shí)選取七個(gè)自變量:朔料制品、水泥、玻璃、原煤、生鐵、粗鋼、鋼筋、盤條,建立多元線性回歸模型。再通過觀測(cè)獲取n組觀測(cè)數(shù)據(jù),應(yīng)用最小二乘法求出回歸參數(shù)估計(jì)值。運(yùn)用回歸方程的顯著性檢驗(yàn),回歸系數(shù)的顯著性檢驗(yàn),多重共線性檢驗(yàn),異方差檢驗(yàn)等檢驗(yàn)方法法刪除不符合線性關(guān)系的自變量或得到更符合實(shí)際關(guān)系的多元線性模型。關(guān)鍵詞:工業(yè)生產(chǎn)總值,多元回歸模型,資源優(yōu)化配置,經(jīng)濟(jì)預(yù)測(cè)。AbstractEconomicindexpredictionisachallengingresearchwork.Inthispaper,usingmultivariateregressionmodeloffactorsinfluencingeconomicindex,andoptimalallocationofresourcestoprovideacertainreference.InChinamanufacturingindustrygrossindustrialproductionastheresearchobject,basedonthebackgroundknowledgeofselectedsevenvariables:Schaumburgmaterialproducts,cement,glass,coal,pigiron,crudesteel,rebar,wirerod,establishedamultiplelinearregressionmodel.ThroughobservationtoobtaintheNgroupsofobservationdata,theapplicationoftheleastsquaresmethodtogetregressionparameterestimation.Applicationofsignificancetestofregressionequationthesignificancetestofregressioncoefficients,themulticollinearityofinspection,testingforheteroscedasticitytestmethodtodeletenotconsistentwiththelinearrelationshipbetweenvariablesorgetmoreaccordwithrealrelationshipinthemultivariatelinearmodel.Keyword:Grossindustrialproduction;multipleregressionmodel;optimizetheallocationofresources;economicforecasting.目錄摘要 -=1\*ROMANI-Abstract -=2\*ROMANII-第一章引言 -1-1.1工業(yè)生產(chǎn)總值簡(jiǎn)介 -1-1.2回歸分析思想 -2-第二章多元線性回歸模型 -3-第三章多元線性回歸的參數(shù)估計(jì) -5-3.1參數(shù)的最小二乘估計(jì) -5-3.2最小二乘估計(jì)的性質(zhì) -6-第四章模型的檢驗(yàn)及修正 -7-4.1回歸方程的顯著性 -7-4.2回歸系數(shù)的顯著性 -8-4.3多重共線性檢驗(yàn) -9-4.4異方差檢驗(yàn) -11-4.5異方差的修正方法 -12-第五章回歸擬合度 -14-5.1決定系數(shù) -14-5.2決定系數(shù)的性質(zhì)和修正決定系數(shù) -15-第六章工業(yè)生產(chǎn)總值預(yù)測(cè)模型分析 -17-6.1SPSS簡(jiǎn)介 -17-6.2模型建立和數(shù)據(jù)搜集 -17-6.3基于SPSS的回歸分析實(shí)現(xiàn) -19-6.4統(tǒng)計(jì)檢驗(yàn) -19-6.5異方差檢驗(yàn)及修正 -21-6.6模型意義 -22-結(jié)論 -24-參考文獻(xiàn) -25-第一章引言隨著科學(xué)技術(shù)的進(jìn)步和社會(huì)的發(fā)展,在處理工業(yè)、經(jīng)濟(jì)、農(nóng)業(yè)和醫(yī)學(xué)等方面的問題的時(shí)候,需要研究影響問題的多個(gè)因素是如何作用于實(shí)際問題的,以及這些因素相互之間的關(guān)系。也就是因?yàn)閷?shí)際問題大都是多因素影響的,所以我們主要致力于研究如何用多元回歸分析解決問題。多元回歸分析是一種綜合分析方法,它依靠統(tǒng)計(jì)軟件能很方便的對(duì)問題進(jìn)行分析,所以隨著電子計(jì)算機(jī)技術(shù)的普及,它的應(yīng)用越來越廣泛。[1]本文先對(duì)工業(yè)生產(chǎn)總值和回歸分析的思想進(jìn)行簡(jiǎn)要介紹,然后描述了如何通過最小二乘法建立多元回歸模型,再通過回歸方程顯著性、回歸系數(shù)顯著性、多重共線性檢驗(yàn)和異方差檢驗(yàn)等顯著性檢驗(yàn)法對(duì)求得的多元回歸模型進(jìn)行檢驗(yàn)最后得到最終模型。本文主要是先闡述多元回歸分析的理論知識(shí),然后運(yùn)用這些知識(shí)應(yīng)用到具體的問題中。用SPSS軟件求出工業(yè)生產(chǎn)總值預(yù)測(cè)的回歸模型。通過該模型就可以知道在我國(guó)主要的制造業(yè)哪個(gè)行業(yè)對(duì)工業(yè)生產(chǎn)總值影響最重,哪個(gè)行業(yè)對(duì)工業(yè)生產(chǎn)總值影響最輕。如此在進(jìn)行資源分配時(shí)就可以優(yōu)先對(duì)影響重的行業(yè)優(yōu)先分配。本文參考了許多相關(guān)的書籍和文獻(xiàn),但由于作者的水平有限,本文存在一些紕漏,希望能得到完善。1.1工業(yè)生產(chǎn)總值簡(jiǎn)介工業(yè)生產(chǎn)總值是以貨幣的形式表現(xiàn)出在一個(gè)報(bào)告期內(nèi)工業(yè)企業(yè)的產(chǎn)品的總量,它是在國(guó)家一年終了時(shí)進(jìn)行工業(yè)產(chǎn)品統(tǒng)計(jì)中是很重要的一項(xiàng)指標(biāo),可以使政府從數(shù)值上了解一個(gè)地區(qū)的工業(yè)生產(chǎn)規(guī)模、一個(gè)地區(qū)經(jīng)濟(jì)繁榮程度,如果這項(xiàng)指標(biāo)出現(xiàn)錯(cuò)誤將會(huì)影響到國(guó)家對(duì)工業(yè)產(chǎn)品一年增加值以及工業(yè)產(chǎn)品銷售率等指數(shù)的計(jì)算。因此對(duì)工業(yè)生產(chǎn)總值進(jìn)行預(yù)測(cè)是一件非常重要、有意義的事,如果我們能夠做好對(duì)一個(gè)地區(qū)的工業(yè)生產(chǎn)總值的預(yù)測(cè)有助于政府制定國(guó)民經(jīng)濟(jì)發(fā)展計(jì)劃,合理分配有限資源。[5]當(dāng)我們?cè)谟?jì)算工業(yè)生產(chǎn)總值時(shí)根據(jù)所用的價(jià)格不同,可以分為不變價(jià)工業(yè)生產(chǎn)總值和現(xiàn)價(jià)工業(yè)生產(chǎn)總值。所謂不變價(jià)工業(yè)生產(chǎn)總值就是在計(jì)算各個(gè)不同時(shí)期的工業(yè)生產(chǎn)總值時(shí),對(duì)某一種產(chǎn)品先選定曾經(jīng)某一個(gè)時(shí)期的工業(yè)產(chǎn)品的價(jià)格作為標(biāo)準(zhǔn),而其他時(shí)期的這種產(chǎn)品也以這個(gè)標(biāo)準(zhǔn)計(jì)算其生產(chǎn)總值,我們把這個(gè)標(biāo)準(zhǔn)叫做不變價(jià)。采用不變價(jià)計(jì)算工業(yè)生產(chǎn)總值可以使我們計(jì)算現(xiàn)在和將來的價(jià)格有一個(gè)恒定的比較標(biāo)準(zhǔn),消除了價(jià)格變動(dòng)的影響;現(xiàn)價(jià)工業(yè)生產(chǎn)總值則是在計(jì)算工業(yè)生產(chǎn)總值時(shí),采用計(jì)算的當(dāng)年產(chǎn)品實(shí)際銷售價(jià)格計(jì)算工業(yè)生產(chǎn)總值。工業(yè)生產(chǎn)總值的構(gòu)成包括:成品價(jià)值、對(duì)外加工費(fèi)收入、自制半成品、在產(chǎn)品期末期初差額價(jià)值。1.2回歸分析思想多元回歸分析思想是一種在現(xiàn)實(shí)生活中應(yīng)用性很強(qiáng)的思想。它是人們依靠已掌握的知識(shí)和經(jīng)驗(yàn)通過定性分析尋找出與要研究的問題有關(guān)的變量,再通過收集大量的數(shù)據(jù),用數(shù)理統(tǒng)計(jì)的方法對(duì)這些數(shù)據(jù)進(jìn)行觀測(cè),并應(yīng)用一定的方法來確定各變量之間的關(guān)系的科學(xué)方法。因?yàn)楝F(xiàn)實(shí)生活問題大多涉及多個(gè)影響因素,所以這種思想經(jīng)常用到。[9]回歸問題根據(jù)變量之間是否存在線性關(guān)系可以分為線性回歸和非線性回歸,又根據(jù)變量的數(shù)量可以分為一元回歸和多元回歸,而我們所研究的實(shí)際問題大多都是多元非線性回歸,而我們并沒有合適的方法直接對(duì)多元非線性回歸進(jìn)行研究,因此我們要找到合適的模型和方法將多元非線性回歸轉(zhuǎn)變?yōu)槎嘣€性回歸。[7]回歸分析預(yù)測(cè)時(shí)先對(duì)所要研究的經(jīng)濟(jì)預(yù)測(cè)對(duì)象進(jìn)行定性分析,找出研究對(duì)象的一個(gè)或多個(gè)影響因素,再去掉那些對(duì)經(jīng)濟(jì)問題影響很小的因素,留下影響大的因素。然后引進(jìn)待定系數(shù)b,建立待定回歸方程。最后搜集研究對(duì)象及其影響因素的數(shù)據(jù),再對(duì)這些數(shù)據(jù)進(jìn)行定量分析,求出待定系數(shù)b,最后得到預(yù)測(cè)回歸模型。[6]
第二章多元線性回歸模型我們可以把一元線性回歸看作是多元線性回歸的一個(gè)特例,其模型一般形式是:。多元線性回歸是描述一個(gè)因變量和多個(gè)自變量的關(guān)系。我們可以設(shè)已知自變量和因變量y,多元線性回歸模型的一般形式是:[2-4](2.1)公式中的,,……是回歸系數(shù),它們是待估計(jì)參數(shù),u是隨機(jī)變量。因?yàn)槲覀冞M(jìn)行回歸分析需要N組觀測(cè)值()k=1,2,3……N.給出回歸分析系數(shù)的估計(jì)值,則多元樣本回歸函數(shù)為:(2.2)回歸殘差為因變量與其估計(jì)值的差:。(2.3)將上面所說的N組觀測(cè)值代入方程則可得N個(gè)方程,如下:其中是N個(gè)相互獨(dú)立且服從同一正態(tài)分布的隨機(jī)變量。設(shè),,,則矩陣方程為:。模型假設(shè)由于現(xiàn)實(shí)動(dòng)力系統(tǒng)錯(cuò)綜復(fù)雜,很難建立相應(yīng)的多元回歸模型,如果我們建立的模型存在錯(cuò)誤則最后得到的結(jié)果很難保證它的價(jià)值和有效性,當(dāng)我們用這些錯(cuò)誤的模型應(yīng)用到實(shí)際問題中進(jìn)行預(yù)測(cè)時(shí),就會(huì)做出錯(cuò)誤的決斷。為了保證所建立的模型的準(zhǔn)確性,需要對(duì)模型做如下假設(shè):[20]因變量和自變量存在線性關(guān)系:,是隨機(jī)誤差項(xiàng)。2.隨機(jī)誤差項(xiàng)的方差的大小與k無關(guān),為一個(gè)常數(shù)。,k=1,2,N成立。3.,k=1,2,N成立。即各組的觀測(cè)值的隨機(jī)誤差項(xiàng)的數(shù)學(xué)期望為零。4.隨機(jī)誤差項(xiàng)服從正態(tài)分布。5.對(duì)不同組的數(shù)據(jù)求得的隨機(jī)誤差項(xiàng)是線性不相關(guān)的,即。6.對(duì)每一個(gè)解釋變量與任何一個(gè)隨機(jī)誤差項(xiàng)都是線性不相關(guān),即。第三章多元線性回歸的參數(shù)估計(jì)3.1參數(shù)的最小二乘估計(jì)與一元線性回歸方程的參數(shù)估計(jì)原理是一樣的,多元線性回歸方程的未知參數(shù),,……的估計(jì)方法也可以用最小二乘估計(jì)法。所謂最小二乘估計(jì)法,就是尋找出,,……的估計(jì)值,,……,使,,……的離差平方和最小,那么,,……滿足條件[8](3.1)可以求得回歸參數(shù),,……的最小二乘估計(jì)值,,……。因?yàn)镼是關(guān)于,,……的非負(fù)二次函數(shù),它的最小值總是存在的,,,……應(yīng)該滿足下列方程組:引進(jìn)參數(shù)估計(jì)量,解釋變量回歸值,回歸殘差.然后把樣本數(shù)據(jù)代入回歸方程可得:則回歸殘差項(xiàng)的向量為:殘差平方和的向量為:。求對(duì),,……的偏導(dǎo)數(shù)得:。整理得:當(dāng)?shù)哪婢仃嚧嬖跁r(shí),最小二乘估計(jì)可以表示為:。[10-12]3.2最小二乘估計(jì)的性質(zhì)多元回歸分析的最小二乘估計(jì)的性質(zhì)有以下幾點(diǎn):線性,即估計(jì)量為隨即變量Y的線性函數(shù).在多元線性回歸中,回歸系數(shù)的估計(jì)量,根據(jù)模型假設(shè)知道,X是固定的矩陣,故與Y是線性關(guān)系。無偏性,即與B是無偏估計(jì)。,和是無偏估計(jì)。.在滿足和的條件下,B的線性函數(shù)的最小方差線性無偏估計(jì)為,是任一(p+1)維常數(shù)向量。.說明估計(jì)值與殘差值u是不相關(guān)的。當(dāng)滿足~時(shí),~,~,和獨(dú)立。第四章模型的檢驗(yàn)及修正面對(duì)實(shí)際問題中錯(cuò)綜復(fù)雜的關(guān)系的研究,我們并不能事先判斷變量y與變量之間是否有線性關(guān)系。在進(jìn)行回歸參數(shù)估計(jì)前,用方程去擬合因變量y與自變量的關(guān)系,這只是我們經(jīng)過定性分析做出的假設(shè),而定性分析的自主性很強(qiáng),所以這樣得到的回歸方程很可能存在錯(cuò)誤,并不能作為最終的結(jié)果。因此在我們求出線性回歸方程后,為了消除一些錯(cuò)誤的變量給回歸方程帶來的影響,我們還需要對(duì)方程進(jìn)行顯著性檢驗(yàn)。4.1回歸方程的顯著性多元線性回歸方程的顯著性檢驗(yàn)就是進(jìn)行模型總體顯著性檢驗(yàn),要看從整體上是否對(duì)隨機(jī)變量y有影響。我們可以做出假設(shè)[13]如果H0被接受,則表明因變量y與自變量的線性回歸模型沒有意義。通過總離差平方和分解法,可以構(gòu)造對(duì)H0進(jìn)行檢驗(yàn)的統(tǒng)計(jì)量。(4.1)我們引進(jìn)三個(gè)新的變量,,。并設(shè)置為:總的偏差平方和:回歸平方和:殘差平方和:平方和分解式可簡(jiǎn)寫為:構(gòu)造F檢驗(yàn)統(tǒng)計(jì)量[15,16](4.2)對(duì)于給定的顯著水平a,當(dāng)F值大于臨界值時(shí),拒絕H0,回歸方程顯著,即x與y有顯著的線性關(guān)系。4.2回歸系數(shù)的顯著性本節(jié)主要研究每個(gè)自變量是否對(duì)應(yīng)變量y的影響顯著,這就需要對(duì)每個(gè)自變量進(jìn)行顯著性假設(shè):,j=1,2,……,p若接受H0j,則不顯著;若拒絕,則顯著。設(shè)~,令,i,j=0,1,……,p,可知~,由此可構(gòu)造統(tǒng)計(jì)量t[15,16]其標(biāo)準(zhǔn)差(4.3)當(dāng)成立,統(tǒng)計(jì)量服從n-p-1的t分布。給定顯著性水平a,當(dāng),拒絕假設(shè),對(duì)y影響顯著;當(dāng),接受假設(shè),對(duì)y影響不顯著。4.3多重共線性檢驗(yàn)多重共線性的介紹:如今我們所研究的經(jīng)濟(jì)問題復(fù)雜性很高,各個(gè)因素之間都可能存在線性或非線性關(guān)系。如果只是關(guān)注因變量和自變量的線性關(guān)系還不能說明問題的復(fù)雜性,因?yàn)槌艘蜃兞亢妥宰兞看嬖诰€性關(guān)系,自變量之間也存在線性關(guān)系,這就是多重共線性。多元線性回歸模型的矩陣形式為,我們對(duì)自變量X的基本假定是矩陣的各列向量是線性無關(guān)的。即,相當(dāng)于。當(dāng)假定不滿足時(shí),我們稱該模型存在多重共線性,多重共線性有兩種:完全多重共線性,即,不存在不完全多重共線性,即,對(duì)角線元素比較大。在實(shí)際問題中大多是這種情況。多重共線性檢驗(yàn)方法一.直觀判斷法:1.觀察求得的參數(shù)的最小二乘估計(jì)值,如果發(fā)現(xiàn)這些估計(jì)值不符合我們所研究的實(shí)際情況或經(jīng)濟(jì)理論,那么該模型就可能存在多重共線性。2.當(dāng)我們改變樣本的觀測(cè)值,增加或者減少變量,觀察參數(shù)的估計(jì)值隨著的變化,變化明顯就說明該模型存在多重共線性。3.通過觀察回歸方程的系數(shù)與其相對(duì)應(yīng)的單相關(guān)系的正負(fù)符號(hào),如果它們的符號(hào)相反,則該模型存在二.單相關(guān)系數(shù)矩陣法該方法比較簡(jiǎn)單,就是先計(jì)算出兩個(gè)自變量之間的相關(guān)系數(shù),再將計(jì)算出的結(jié)果制作成一張矩陣表。當(dāng)兩個(gè)自變量的相關(guān)系數(shù)r>0.8時(shí),一般可以判定該模型存在多重共線性。三.t檢驗(yàn)法首先求出每個(gè)系數(shù)的方差,然后用它的平方根即標(biāo)準(zhǔn)差除回歸系數(shù),得(4.4)給出一定的置信水平a,將計(jì)算值與從t分布表上查到的理論值進(jìn)行比較.當(dāng)計(jì)算值的絕對(duì)值,則該回歸系數(shù)通過顯著性檢驗(yàn),它不會(huì)引起多重共線性;當(dāng)計(jì)算值的絕對(duì)值,該系數(shù)沒有通過顯著性檢驗(yàn),它會(huì)引起多重共線性。四.輔助回歸模型檢驗(yàn)將模型的每個(gè)解釋變量對(duì)其他變量進(jìn)行回歸,在計(jì)算出擬合優(yōu)度當(dāng)某個(gè)擬合優(yōu)度比較大,則該解釋變量xi與其他解釋變量存在共線性。多重共線性的克服和處理方法:當(dāng)?shù)玫降幕貧w方程存在多重共線性,則我們應(yīng)該想方法消除或者減輕導(dǎo)致存在多重共線性的解釋變量的影響。處理方法有:刪減變量法,就是根據(jù)以下幾點(diǎn)原則刪除多元回歸方程的某個(gè)自變量。eq\o\ac(○,1).這個(gè)自變量應(yīng)該是與因變量之間的相關(guān)系數(shù)最小的。eq\o\ac(○,2).在求得的相關(guān)系數(shù)中,刪除相關(guān)系數(shù)高的自變量中的一個(gè)。eq\o\ac(○,3).當(dāng)某個(gè)自變量xi的回歸系數(shù)與其單相關(guān)系正負(fù)符號(hào)相反,應(yīng)該刪除這個(gè)自變量。eq\o\ac(○,4).對(duì)于沒有通過t檢驗(yàn)的自變量的回歸系數(shù)所對(duì)應(yīng)的自變量應(yīng)該刪除。變換模型形式法假設(shè)自變量和線性相關(guān),原模型形式為:模型滯后一期得:兩式相減得:令;;;;則上式可寫為:(4.5)與的共線性將減弱。4.4異方差檢驗(yàn)在前面模型假設(shè)中提出了六條基本假設(shè),當(dāng)模型符合上述六條假設(shè)時(shí)。應(yīng)用最小二乘法求得的參數(shù)估計(jì)量是無偏的、有效的。但在研究實(shí)際經(jīng)濟(jì)問題時(shí),很難完全滿足著六條基本假設(shè)。當(dāng)違背了第二項(xiàng)基本假設(shè),那么應(yīng)用最小二乘法求得的參數(shù)估計(jì)量就可能不是無偏的、有效的,甚至我們都不能求得參數(shù)估計(jì)量。這里我們要研究模型違背了上述第二條基本假設(shè)的問題,我們稱這個(gè)為異方差性問題。異方差性的后果:[21]一.參數(shù)估計(jì)量非有效對(duì)參數(shù)估計(jì)量進(jìn)行無偏性和有效性的證明中,當(dāng)模型出現(xiàn)異方差性,其最小二乘法參數(shù)的估計(jì)量仍然具有無偏性,但是不具有有效性。因?yàn)樵谟行缘淖C明中利用了同方差性條件,,I為n階單位矩陣。所以參數(shù)估計(jì)量不再具有有效性。二.變量的顯著性檢驗(yàn)失去意義在多元線性回歸模型的顯著性檢驗(yàn)的t檢驗(yàn)中,構(gòu)造的統(tǒng)計(jì)量t中包含有隨機(jī)誤差項(xiàng)共同的方差,并且有t統(tǒng)計(jì)量服從t(n-p-1)分布。如果出現(xiàn)了異方差性,t檢驗(yàn)就沒有意義了。采用其它檢驗(yàn)也是如此。三.模型的預(yù)測(cè)失效在預(yù)測(cè)值的置信區(qū)間a中包含有隨機(jī)誤差項(xiàng)共同方差。所以當(dāng)模型出現(xiàn)異方差性時(shí),它的預(yù)測(cè)功能將失效。異方差性的檢驗(yàn)異方差性檢驗(yàn)就是檢驗(yàn)隨機(jī)誤差項(xiàng)的方差和解釋變量、觀測(cè)值之間的相關(guān)性。檢驗(yàn)法有以下幾種:Goldfeld—Quandt檢驗(yàn),把按絕對(duì)值的大小分為兩組,參照分組把模型的觀測(cè)值分為兩組。用,分別表示樣本容量。在這兩組中,分別用最小二乘法,求出兩組樣本的誤差項(xiàng)方差估計(jì)和,當(dāng)假設(shè)成立時(shí),的絕對(duì)值小的一組的與的絕對(duì)值大的一組的進(jìn)行比較,應(yīng)該有,用和定義F統(tǒng)計(jì)量:.該統(tǒng)計(jì)量F在誤差項(xiàng)方差一定的零假設(shè)下,服從F分布。對(duì)給定的顯著性水平,當(dāng),拒絕零假設(shè),也就是異方差性存在。當(dāng),接受零假設(shè),即隨機(jī)誤差項(xiàng)為同方差。圖示法檢驗(yàn)首先假設(shè)不存在異方差性,對(duì)模型進(jìn)行最小二乘法估計(jì),因?yàn)闅埐钍强梢钥闯烧`差項(xiàng)的估計(jì),做出解釋變量與殘差平方的散點(diǎn)圖,根據(jù)圖形的類型來判斷異方差是否存在。圖形如下:圖(1):異方差檢驗(yàn)示意圖圖(a)中,與x之間沒有可觀察到的系統(tǒng)模式,表明模型中不存在異方差。圖(c)表明與變量x之間存在線性關(guān)系,圖(b)、(d)、(e)表明與x間存在比較復(fù)雜的關(guān)系。如果殘差的平方與x間呈現(xiàn)(b)—(e)中的任意一種關(guān)系,則數(shù)據(jù)中可能存在異方差。4.5異方差的修正方法加權(quán)最小二乘法:加權(quán)最小二乘法就是對(duì)原模型進(jìn)行加權(quán)以消除模型存在的異方差性,使原模型變成一個(gè)新的模型,在對(duì)這個(gè)新模型采用最小二乘法估計(jì)其參數(shù)。設(shè)線性回歸模型:;即隨機(jī)誤差項(xiàng)的方差與解釋變量存在線性相關(guān)性,則可以用去除原模型,使之變成如下形式的新模型:t=1,2……n(4.6)對(duì)該模型有:即新模型存在同方差性。于是可以用最小二乘法估計(jì)其參數(shù),得到關(guān)于參數(shù),,……是無偏的、有效的估計(jì)量。這就是加權(quán)最小二乘法,在這里權(quán)就是。
第五章回歸擬合度所謂的回歸擬合度檢驗(yàn)就是對(duì)我們已經(jīng)制作好的預(yù)測(cè)模型進(jìn)行檢驗(yàn),并比較它們的預(yù)測(cè)結(jié)果與實(shí)際發(fā)生情況的吻合程度。結(jié)果與實(shí)際的吻合程度就是求得的回歸直線與觀測(cè)到的樣本數(shù)據(jù)的擬合程度。擬合度可以判斷一個(gè)回歸模型所得到的結(jié)果的好壞,擬合度越高結(jié)果就越好,因此我們要得到好的結(jié)果就要將得到的多個(gè)預(yù)測(cè)模型同時(shí)進(jìn)行檢驗(yàn)比較,我們要選的就是其中擬合度最高的。一條回歸直線的擬合度主要取決于兩個(gè)方面:1.取決于回歸直線的選擇,這個(gè)是由所選取的參數(shù)估計(jì)方法決定的;2.取決于所觀測(cè)的樣本數(shù)據(jù)分布決定的。我們求回歸方程時(shí)用的是最小二乘估計(jì)法,這就意味著參數(shù)估計(jì)方法是確定的,而上面說過擬合度取決于回歸直線的選擇和樣本數(shù)據(jù)的分布,因此回歸擬合度就取決于樣本數(shù)據(jù)的分布了。樣本數(shù)據(jù)的分布其實(shí)是由變量的關(guān)系而決定的,所以回歸擬合度可以檢驗(yàn)變量關(guān)系的真實(shí)性,判斷模型的假設(shè)是否成立。當(dāng)回歸擬合度比較差的時(shí)候,這個(gè)回歸模型得到的結(jié)果就不符合我們的要求,因此我們就要對(duì)原模型進(jìn)行修改、完善,將擬合度較差的模型變成擬合度好的回歸模型。[19]5.1決定系數(shù)為了將因變量的實(shí)際觀測(cè)值y和它的樣本平均值的離差中分解出由自變量決定的那部分,我們將總離差分成兩個(gè)部分:1.因變量的理論回歸值和它的的樣本平均值的離差,這部分是能夠由回歸直線解釋的。2.因變量的實(shí)際觀測(cè)值y和它的理論回歸值的離差,這部分是不能夠由回歸直線解釋的。對(duì)實(shí)際觀測(cè)值y進(jìn)行離差分解有:(5.1)將上式兩邊平方并求和得:設(shè):總離差平方和,殘差平方和,回歸平方和,則兩邊除以SST得:(5.2)當(dāng)SSR在SST中占得比重越大,樣本觀測(cè)點(diǎn)和樣本回歸直線離得越近。決定系數(shù)就是反應(yīng)自變量對(duì)因變量決定程度的指標(biāo),用表示:(5.3)5.2決定系數(shù)的性質(zhì)和修正決定系數(shù)eq\o\ac(○,1)決定系數(shù)具有非負(fù)性由于,,,分子和分母都是平方和,不可能是負(fù)數(shù),因此。eq\o\ac(○,2)決定系數(shù)的取值范圍是:。當(dāng)所有觀測(cè)值都在回歸直線上的時(shí)候,,這時(shí);當(dāng)觀測(cè)值不是都在回歸直線上的時(shí)候,,則,這時(shí);當(dāng)自變量與因變量無關(guān)時(shí),y的總離差全部歸于殘差平方和,則,這時(shí)=0。所以。eq\o\ac(○,3)決定系數(shù)即是樣本觀測(cè)值的函數(shù),也是一個(gè)統(tǒng)計(jì)量。因?yàn)闆Q定系數(shù)的大小受到自變量的個(gè)數(shù)的影響,當(dāng)含有不同個(gè)數(shù)的自變量的回歸模型進(jìn)行擬合程度比較時(shí),我們應(yīng)該對(duì)擬合決定系數(shù)進(jìn)行調(diào)整。一般常用方法為:對(duì),將分子和分母分別除以各自的自由度,這樣將變成均方差比,就可以消除自變量的個(gè)數(shù)對(duì)擬合度的影響。綜上,調(diào)整后的決定系數(shù)為:(5.4)
第六章工業(yè)生產(chǎn)總值預(yù)測(cè)模型分析6.1SPSS簡(jiǎn)介SPSS是由三位美國(guó)斯坦福大學(xué)研究生在20世紀(jì)60年代末研制的世界上最早的一款統(tǒng)計(jì)分析軟件。該款軟件能夠研制成功是非常有深遠(yuǎn)意義的,它也是具有相當(dāng)多并且齊全的功能,世界上許多使用者紛紛就SPSS的各種齊全的功能以及各功能的高效率處理問題能力給予了很高的評(píng)價(jià)與稱贊。SPSS軟件操作界面、輸出結(jié)果的界面最大的特點(diǎn)就是看上去非常美觀并且結(jié)構(gòu)很簡(jiǎn)潔。為了讓非統(tǒng)計(jì)專業(yè)人員和那些統(tǒng)計(jì)知識(shí)不是了解很深的使用者也能很好的使用該軟件,它借鑒了Windows的窗口方式來展示各種管理和數(shù)據(jù)分析方法的功能,使用對(duì)話框展示各種功能選擇項(xiàng)。要使用該軟件來進(jìn)行科研工作,使用者只需要掌握一定的統(tǒng)計(jì)分析原理并擁有基本的Windows操作技能就可以。為了方便數(shù)據(jù)的傳輸,SPSS軟件的數(shù)據(jù)接口是很通用的規(guī)格而且數(shù)據(jù)采用類似EXCEL的方式輸入與管理,這樣能很方便的從其他數(shù)據(jù)庫(kù)中讀入數(shù)據(jù)。6.2模型建立和數(shù)據(jù)搜集本研究以制造業(yè)工業(yè)生產(chǎn)總值為對(duì)象,根據(jù)背景知識(shí)選取如下因變因素,以下對(duì)各變量進(jìn)行設(shè)置:y為工業(yè)總產(chǎn)值(單位:億元)x1為塑料制品產(chǎn)量(單位:萬噸)x2為水泥產(chǎn)量(單位:萬噸)x3為平板玻璃產(chǎn)量(單位:萬重量箱)x4為生鐵產(chǎn)量(單位:萬噸)x5為粗鋼產(chǎn)量(單位:萬噸)x6為鋼筋產(chǎn)量(單位:萬噸)x7為盤條產(chǎn)量(單位:萬噸)u為隨機(jī)誤差項(xiàng)。并建立模型:(6.1)數(shù)據(jù)搜集:該數(shù)據(jù)主要是中國(guó)制造業(yè)主要工業(yè)產(chǎn)品,并按地區(qū)分組統(tǒng)計(jì),選取中國(guó)這些產(chǎn)品一年的產(chǎn)量。由于西藏地區(qū)生產(chǎn)的工業(yè)產(chǎn)品較少,所以沒有列出。具體數(shù)據(jù)見下表:表(1):中國(guó)2007年制造業(yè)工業(yè)產(chǎn)品統(tǒng)計(jì)數(shù)據(jù)地區(qū)工業(yè)總產(chǎn)值(當(dāng)年價(jià)格)塑料制品(萬噸)水泥(萬噸)平板玻璃(萬重量箱)生鐵(萬噸)粗鋼(萬噸)鋼筋(萬噸)盤條(線材)(萬噸)全國(guó)10591.983305.23136117.2553918.0747651.6348928.810275.487919.02北京331.9232.661168.6235.22780.51810.76296.34416.3天津204.8240.9614.79186.061435.41602.13185.1964.14河北376.27137.379758.2810031.7610523.0110569.291335.431171.84山西258.4913.442780.91971.913727.642506.36372.93465.82內(nèi)蒙古124.346.052871.171395.721260.091040.36100.9676.63遼寧680.18159.33893.21941.214057.594140.27246.94453.91吉林94.5721.971903.81850.76545.66599.6730.5969.16黑龍江175.4114.061645.06490.21374.11436.05184.533.3上海600.5772.46959.44744.531790.362081.5823.2178.48江蘇1425.76327.3711849.786856.113802.154721.471577.49949.47浙江875.07768.8810548.512917.53238.08577.23131.63183.74安徽173.27111.175402.23472.561517.71663.61501.04257.69福建253.94106.664500.11867.12477.88588.82289.47222.27江西56.0912.955008.54686.641047.361306.81496.39332.42山東1736.69315.4715023.895175.614906.674406.911090.68638.12河南797.9121.699471.363619.931974.952275.39556.84660.1湖北126.5853.715638.852178.341679.791778.17226.99178.93湖南425.5623.255683.281518.121247.761331.79337.18224.3廣東923.24754.459799.576123.03755.251154.03444.76284.86廣西175.5321.714350.48530.34639.3765.67288.06207.22海南2.032.25633.327.6818.844.546.540.67重慶84.8522.683000.05254.18328.38358.3649.76102.41四川364.483.516375.62495.791470.731415.34492.78195.91貴州28.317.962059.062.5363.19349.36176.45118.83云南37.2416.113568.53329.81202.78883.85228.43183.61陜西181.625.143175.491175.08365.55396.27318.9453.67甘肅52.4110.321540.21591.89592.78602.898.84140.53青海1.220.27436.8592.9590.09114.711.317.54寧夏16.232.02817.3661.8246.250.3637.775.08新疆7.4639.471479.28113.66391.82446.85148.06142.086.3基于SPSS的回歸分析實(shí)現(xiàn)SPSS是一款專用統(tǒng)計(jì)軟件,在建立數(shù)學(xué)模型之后,本文采用SPSS實(shí)現(xiàn)數(shù)學(xué)模型求解。在SPSS中輸入各變量,并為各變量設(shè)置名稱。然后點(diǎn)擊Analyze→Regression→Linear進(jìn)入線性回歸對(duì)話框,在左邊源變量欄中選定變量Y,使之進(jìn)入Dependent欄,選定變量,單擊按鈕使之進(jìn)入Independent欄。如圖:[14,17,18]圖(2):在SPSS軟件中將選定變量輸入圖示6.4統(tǒng)計(jì)檢驗(yàn)用spss計(jì)算得到如下結(jié)果:表(2):模型摘要ModelRRSquareAdjustedRSquareStd.ErroroftheEstimateDurbin-Watson1.993(a).987.983245.843471.739表(3):方差分析ModelSumofSquaresdfMeanSquareFSig.1Regression105371311.469715052901.628249.095.000(a)Residual1390297.2462360439.011Total106760408.73430表(4):回歸系數(shù)ModelUnstandardizedCoefficientsStandardizedCoefficientstSig.CollinearityStatisticsBStd.ErrorBetaToleranceVIF1(Constant)-2.21147.145-.047.963塑料制品x1.989.452.3172.187.039.02737.136水泥x2.036.024.4601.535.138.006158.735平板玻璃x3-.055.059-.281-.979.338.007145.382生鐵x4.013.154.058.083.934.001858.839粗鋼x5.004.173.020.026.981.0011170.54鋼筋x6.456.366.4411.262.220.005216.267盤條x7-.016.495-.012-.033.975.004242.790由此可得:(6.2)決定系數(shù);調(diào)整決定系數(shù);該方程的決定系數(shù)比較高,因此該模型的擬合度較好。,該線性回歸方程顯著。6.5異方差檢驗(yàn)及修正用SPSS對(duì)模型進(jìn)行異方差檢驗(yàn),如圖:圖(3):在SPSS中對(duì)變量進(jìn)行異方差檢驗(yàn)圖示最后可得殘差絕對(duì)值和各自變量的相關(guān)系數(shù)為:0.59,0.47,0.287,0.489,0.513,0.416,0.547不相等,說明存在異方差,需要用加權(quán)最小二乘估計(jì)。用SPSS可得到最優(yōu)權(quán)重為3.000。進(jìn)行加權(quán)分析最后可得結(jié)果:表(5):模型摘要ModelRRSquareAdjustedRSquareStd.ErroroftheEstimateDurbin-Watson11.000(a)1.0001.000.085931.581表(6):方差分析ModelSumofSquaresdfMeanSquareFSig.1Regression2587.0887369.57550065.439.000(a)Residual.17022.007Total2587.28830表(7):回歸系數(shù)ModelUnstandardizedCoefficientsStandardizedCoefficientstSig.CollinearityStatisticsBStd.ErrorBetaToleranceVIF1(Constant)-13.0133.488-3.733.001塑料制品x1.841.096.2648.823.000.003314.686水泥x2.020.011.2602.103.047.0005366.476平板玻璃x3-.017.019-.084-.866.395.0003333.757生鐵x4-.008.019-.038-.440.664.0002602.303粗鋼x5.080.021.3703.836.001.0003255.656鋼筋x6.405.055.3937.408.000.001984.360盤條x7-.217.104-.163-2.090.048.0002131.465由上表可知:決定系數(shù);修正決定系數(shù);方程的決定系數(shù)較高,而決定系數(shù)越高,模型擬合度就越好,因此該模型的擬合度很好;,模型總體顯著,即全部自變量總體與因變量存在線性關(guān)系。此時(shí)的多元線性回歸方程為:(6.3)6.6模型意義本文通過選取工業(yè)生產(chǎn)總值和塑料制品、水泥、平板玻璃、生鐵、粗鋼、鋼筋、盤條的產(chǎn)量,經(jīng)過回歸分析和統(tǒng)計(jì)檢驗(yàn),最后得到回歸方程:由上述多言回歸模型可知:所選取的各工業(yè)產(chǎn)品每增加一個(gè)單位的產(chǎn)量,工業(yè)生產(chǎn)總值就增加相應(yīng)系數(shù)數(shù)值的產(chǎn)量。而平板玻璃產(chǎn)量系數(shù)是負(fù)值則工業(yè)生產(chǎn)總值就相對(duì)減少相應(yīng)系數(shù)數(shù)值的產(chǎn)量。這可能是由于國(guó)家所采取的經(jīng)濟(jì)政策或者其它的因?yàn)榈貐^(qū)特殊性的原因造成的。由模型知自變量塑料制品產(chǎn)量和鋼筋產(chǎn)量系數(shù)的絕對(duì)值最大,因此它們對(duì)工業(yè)生產(chǎn)總值的影響也最大。當(dāng)我們要最高的提高全國(guó)各地
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年強(qiáng)地運(yùn)動(dòng)加速度儀項(xiàng)目合作計(jì)劃書
- 竹簍子企業(yè)縣域市場(chǎng)拓展與下沉戰(zhàn)略研究報(bào)告
- 碳化鈮企業(yè)縣域市場(chǎng)拓展與下沉戰(zhàn)略研究報(bào)告
- 香菇調(diào)料企業(yè)數(shù)字化轉(zhuǎn)型與智慧升級(jí)戰(zhàn)略研究報(bào)告
- 粘膠長(zhǎng)絲企業(yè)ESG實(shí)踐與創(chuàng)新戰(zhàn)略研究報(bào)告
- 丁香欖企業(yè)縣域市場(chǎng)拓展與下沉戰(zhàn)略研究報(bào)告
- 輕奢餐飲企業(yè)縣域市場(chǎng)拓展與下沉戰(zhàn)略研究報(bào)告
- 硫酸鋅(皓礬)企業(yè)ESG實(shí)踐與創(chuàng)新戰(zhàn)略研究報(bào)告
- 機(jī)場(chǎng)貴賓休息室運(yùn)營(yíng)企業(yè)制定與實(shí)施新質(zhì)生產(chǎn)力戰(zhàn)略研究報(bào)告
- 仿古銅工藝品批發(fā)企業(yè)ESG實(shí)踐與創(chuàng)新戰(zhàn)略研究報(bào)告
- 《實(shí)踐論》《矛盾論》導(dǎo)讀修改稿課件
- 先天性馬蹄內(nèi)翻足后內(nèi)側(cè)松懈和肌腱移植術(shù)后護(hù)理查房
- 2019分布式電源信息采集裝置技術(shù)規(guī)范
- 農(nóng)業(yè)產(chǎn)業(yè)化稅收政策解析
- 七年級(jí)上冊(cè)數(shù)學(xué)應(yīng)用題專項(xiàng)
- 臺(tái)球廳合伙協(xié)議書
- SWITCH塞爾達(dá)傳說曠野之息-1.6金手指127項(xiàng)修改使用說明教程
- 阻生牙的拔除
- 新形式下做好檢察信息工作的心得體會(huì)
- 綠色低碳節(jié)能先行3000字(9篇)
- 水文地質(zhì)手冊(cè)
評(píng)論
0/150
提交評(píng)論