




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、楚雄師院 數(shù)學(xué)系09級01班 韓金偉 學(xué)號|:20091021135 楚雄師范學(xué)院2012年數(shù)學(xué)建摸模擬論文 題 目 應(yīng)用回歸分析 姓 名 韓金偉 系 (院) 數(shù)學(xué)系09級01班 專 業(yè) 數(shù)學(xué)與應(yīng)用數(shù)學(xué) 2012 年8月 22 日題目:應(yīng)用回歸分析摘要:隨著社會經(jīng)濟(jì)的不斷發(fā)展,科學(xué)技術(shù)的不
2、斷進(jìn)步,統(tǒng)計方法越來越成為人們必不可少的工具和手段。應(yīng)用回歸分析是其中的一個重要分支,數(shù)據(jù)處理,數(shù)據(jù)檢驗(yàn),模型的建立和檢驗(yàn)都是回歸分析不可缺少的部分。針對多組數(shù)據(jù)的多個變量樣本,我們通常都會對它建立回歸模型,在此建模過程中我們就要對給定的數(shù)據(jù)做合理化檢驗(yàn)分析,找出數(shù)據(jù)的規(guī)律,再對數(shù)據(jù)進(jìn)行分類建模。當(dāng)然,因?yàn)楦髯兞恐g或多或少都會存在強(qiáng)影響的變量,所以通常都要做剔除性檢驗(yàn)和重新建模,最后建立出一個合理化的模型。關(guān)鍵詞:回歸分析 相關(guān)性 自相關(guān) 殘差 異常點(diǎn) 正態(tài)性 杠桿值 27一、問題重述 (10.1 附錄一)中給定了一些關(guān)于自變量與因變量的一些數(shù)據(jù),請按所給的要求對給定的數(shù)據(jù)進(jìn)行分析:要求:1
3、.檢測強(qiáng)影響點(diǎn),并求出杠桿值. 2.正態(tài)性檢驗(yàn). 3.相關(guān)性檢驗(yàn). 4.自變量的多重共線性檢測,若有多重共線性,試消除,再建模. 5.殘差的自相關(guān)性分析,模型的合理性分析. 6.預(yù)測時的預(yù)測值.2、 問題分析本題是要針對一組數(shù)據(jù)做合理化的線性分析,先后要求對數(shù)據(jù)做了異常值的檢驗(yàn)和剔除,各變量的正態(tài)性檢驗(yàn),在從相關(guān)性的角度對各變量做相關(guān)性檢驗(yàn),得出數(shù)據(jù)是否適合做多元線性規(guī)劃模型。為了使建立的模型具有很好的擬合效果和實(shí)際意義,又要求對各變量做相關(guān)性檢驗(yàn)的同時進(jìn)而做多重共線性的診斷,從中發(fā)現(xiàn)自變量之間是否存在著多重共線性。在有多重共線性的情況下,為了消除多重共線性的影響,我們又要做剔除不合理的變量再
4、做回歸模型。當(dāng)然在做好的模型中,我們又要剔除不能通過t檢驗(yàn)的變量,最后建立沒有強(qiáng)多重共線性,沒有異常點(diǎn)且通過了F檢驗(yàn),t檢驗(yàn)的合理化模型,再對給定的數(shù)據(jù)做出預(yù)測。3、 模型假設(shè) 假設(shè)y為因變量,為自變量,y 因變量y,X1 自變量x1,X2 自變量x2,X3 自變量x3,X4 自變量x4,X5 自變量x5,X6 自變量x6, 第i個值的殘差, 第i個值的學(xué)生化殘差, 第i個值的刪除殘差, 第i個值的刪除學(xué)生化殘差, 第i個值的杠桿值, 平均杠桿值。四、符號說明符號意義符號意義id序列號第i個值的庫克距離y因變量y第i個值的馬氏距離X1自變量x1條件數(shù)X2自變量x2X矩陣X3自變量x3系數(shù)X4自
5、變量x4VIF方差擴(kuò)大因子X5自變量x5DWDW檢驗(yàn)X6自變量x6條件索引第i個值的殘差FF檢驗(yàn)第i個值的學(xué)生化殘差tT檢驗(yàn)第i個值的刪除殘差平均數(shù)第i個值的刪除學(xué)生化殘差隨機(jī)序列項第i個值的杠桿值S樣本偏度系數(shù)平均杠桿值B樣本峰度系數(shù)五、模型建立和求解1、問題一的求解1.1 檢測數(shù)據(jù)中的強(qiáng)影響點(diǎn)1.1.1 對數(shù)據(jù)中的強(qiáng)影響點(diǎn)進(jìn)行初略的箱圖檢 從繪制的箱圖來看數(shù)據(jù)存在著強(qiáng)影響點(diǎn),初步可以看出強(qiáng)影響點(diǎn)分別在的3號位和12號位,的34號位。為了進(jìn)一步的檢測出強(qiáng)影響點(diǎn)的位置和數(shù)據(jù),減小強(qiáng)影響點(diǎn)對整體數(shù)據(jù)的影響,我們進(jìn)一步對強(qiáng)影響點(diǎn)進(jìn)行分析。1.1.2 異常值分析為了更好的檢測出異常值,我們分別用計算
6、機(jī)計算出數(shù)據(jù)的普通殘差,學(xué)生化殘差,刪除殘差,刪除化學(xué)生化殘差,杠桿值,庫克距離,見下表。行id普通殘差學(xué)生化殘差刪除殘差刪除學(xué)生化殘差杠桿值庫克距離MaHar距離18.865560.259810.009270.25610.089270.001243.481342-5.93733-0.18289-7.40626-0.180190.173340.001186.7601332.674990.094364.376020.092930.363720.0008114.18495425.371510.7401628.387170.734980.081230.00933.168156.598250.1972
7、57.752070.194350.123840.000974.8297760.28040.00830.323250.008180.1075304.1938378.898680.2753311.199710.271440.180450.00287.03778-2.35542-0.0775-3.35246-0.076320.272410.0003610.623879-40.22151-1.19949-47.02746-1.207790.119720.034784.6691910-0.56327-0.01819-0.77195-0.017910.245330.000029.567811111.046
8、830.3203512.213210.315950.07050.001552.749571239.750551.2902255.056051.303830.2530.091579.8669413-18.80111-0.56615-22.41318-0.560240.136160.00885.3101814-0.09178-0.00285-0.11614-0.00280.1847107.2036515-121.51298-3.92016-166.26646-5.28110.244170.808569.5225216-11.86591-0.36065-14.41086-0.355850.15160
9、.003995.912371746.774921.3912454.401841.412040.11520.045094.4926518-17.50514-0.52083-20.37286-0.5150.115760.006354.51472195.516740.158615.994850.156240.054750.000312.135362041.57211.1765543.776361.183680.025350.010490.988762126.445230.7680929.328840.763210.073320.009192.859482216.9460.5143220.522030
10、.508510.149250.007975.8208823-7.2257-0.217-8.56757-0.213840.131620.001255.1332824-51.78403-1.51739-58.45459-1.549250.089120.042373.475492544.588081.2792948.254861.292210.050990.019231.98853263.031760.093713.808070.092290.178860.000326.9755827-33.32922-0.93683-34.61906-0.935040.012260.004850.4780628-
11、10.30989-0.32055-13.10228-0.316140.188120.003987.3367629-10.61974-0.31957-12.64242-0.315180.134990.002785.264683010.37850.3000911.407760.295920.065220.001282.543733140.574351.1709144.423891.177760.061650.018582.404543218.002930.5198619.735870.514040.062810.003722.449463324.066170.7400729.919910.7349
12、0.170650.019036.65523340.807781.300162751.191331.314420.97471822.2361938.013553520.165160.5873122.488160.581390.07830.005683.0536536-27.726-0.82321-32.13335-0.81910.112160.015394.37417374.907220.14365.524770.141460.086780.000373.384323856.710321.7063167.49561.759680.134790.07915.256939-44.43245-1.28
13、994-49.23352-1.303540.072520.025692.8281440-59.69256-1.72471-65.51344-1.780520.063850.041442.49016 從上表中我們可以看到,絕對值最大的學(xué)生化殘差為,大于3,因而根據(jù)學(xué)生化殘差診斷認(rèn)為數(shù)據(jù)存在異常值。絕對值最大的刪除學(xué)生化殘差為,同樣在第15號位,因而根據(jù)學(xué)生化殘差和刪除學(xué)生化殘差診斷認(rèn)為第15個數(shù)據(jù)為異常值。其中心化杠桿值位居第五,庫克距離。再根據(jù)刪除殘差,庫克距離,馬氏距離都出現(xiàn)了相當(dāng)大的不合理性,因此我們認(rèn)為第34個數(shù)據(jù)為異常值。1.2 求解杠桿值 由中心化的帽子矩陣主對角線元素可得: 因此,
14、中心化杠桿值的平均值是 故: 1)、第15號位的中心化杠桿值為,平均杠桿值為; 2)、第34號位的中心化杠桿值為,平均杠桿值為;1.3 消除異常值 在前面我們檢測出了異常值在第15號位和34號位,具體如下表:idYX1X2X3X4X5X6C00k距離Mahal距離14434979768152050.001243.481342290277031661290.001186.76013367611592130093390.0008114.184954536926292582470.00933.168154816742941632020.000974.829776296315434141111904.
15、19383745310560475102120.00287.03778617114858417202850.0003610.62387951498727112-12420.034784.669191040015599915111740.000029.5678111473626281912070.001552.74957121572511799450.091579.866941344045658419131950.00885.310181448092756392023207.20365151362726824171340.808569.5225216530111529311132560.0039
16、95.91237176107810284572660.045094.492651861710687821872760.006354.51472196009798711282660.000312.135362048067656213121960.010490.98876212793826441081100.009192.85948224465632991681880.007975.8208823450541005011152050.001255.1332824335535560801700.042373.4754925459615379651930.019231.9885326630601081
17、041782730.000326.97558274838378711182330.004850.478062861774125661642650.003987.33676296058912171882830.002785.264683038864308110101760.001282.5437331351344465791430.018582.4045432366713456891620.003722.44946334938830871302070.019036.655233464811210512351234822.2361938.0135535449576972542000.005683.
18、05365363406135551301520.015394.374173729229454713131230.000373.384323868882105812092680.07915.2569394088055611111970.025692.82814404618288541472250.041442.49016為了使模型的數(shù)據(jù)不存在異常點(diǎn),我們?nèi)∷浇鼣?shù)據(jù)的平均值代替異常值,重新組合數(shù)據(jù),組合后的數(shù)據(jù)在(10.2 附錄二),(原始數(shù)據(jù)中沒有小數(shù),為了保持一致性和合理性,我們對所求平均值按四舍五入法取數(shù))。2、 問題二的求解2.1 正態(tài)性的圖示檢驗(yàn)2.1.1 通過用修改過的數(shù)據(jù)作出數(shù)據(jù)的
19、直方圖如下:通過直方圖我們可以看到,圖形是以鐘型分布,符合正態(tài)性曲線的基本分布規(guī)律,可以初步判定數(shù)據(jù)呈現(xiàn)正態(tài)分布。為了更為細(xì)致的看出個變量的正態(tài)性,我們同時繪制P-P圖和Q-Q圖加以判斷。2.1.2 繪制數(shù)據(jù)的P-P圖和Q-Q圖 從數(shù)據(jù)的P-P圖和Q-Q圖來看(圖象見(10.3 附錄三),觀測的積累概率與期望的積累概率都在線性直線的附近,而且滿足正態(tài)分布的要求,因此可以判定數(shù)據(jù)呈現(xiàn)正態(tài)分布。2.1.3 S,K的極限分布 樣本偏度系數(shù) 該系數(shù)用于檢驗(yàn)對稱性,S>0時,分布呈正偏態(tài),S<0時,分布呈負(fù)偏態(tài)。 樣本峰度系數(shù) 該系數(shù)用于檢驗(yàn)峰態(tài),K>0時為尖峰分布,S<0時為扁
20、平分布;當(dāng)S=0,K=0時分布呈正態(tài)分布。 :F(x)服從正態(tài)分布 :F(x)不服從正態(tài)分布 當(dāng)原假設(shè)為真時,檢驗(yàn)統(tǒng)計量 對于給定的 R 其中于因變量y為例做正態(tài)性檢驗(yàn),s=0,y=0服從正態(tài)分布。3 問題三的求解3.1 數(shù)據(jù)相關(guān)性的散點(diǎn)圖 從各變量和因變量y的散點(diǎn)圖來看,和因變量y都有明顯的正相關(guān)性,與因變量y的相關(guān)不太顯著。因而進(jìn)一步做數(shù)據(jù)的相關(guān)陣分析。3.2 樣本的相關(guān)陣 有樣本觀測值,分別計算與之間的簡單相關(guān)系數(shù),得自變量樣本的相關(guān)陣 由于相關(guān)陣是對稱矩陣,可記為,表示中心化的設(shè)計陣,則相關(guān)陣可表示為 進(jìn)一步求出y與每個自變量的相關(guān)系數(shù),得增廣的樣本相關(guān)陣為 通過軟件計算出樣本的增廣相
21、關(guān)陣為 從表中可以看出的值都在0.7以上,都與因變量y有較強(qiáng)的正相關(guān)性,的值分別為0.168,0.051,從而可以判定與因變量y有較弱的正相關(guān)性,這與散點(diǎn)圖的判斷結(jié)果基本保持一致(限于表格的大小,這里采用了wps截圖工具對圖表進(jìn)行了截圖處理)。另外,從表中的數(shù)據(jù)還可以看出,的相關(guān)系數(shù)為0.810,的相關(guān)系數(shù)為0.738,的相關(guān)系數(shù)為0.712,它們的自變量之間也存在顯著的相關(guān)性。4 問題四的求解4.1 自變量的多重共線性檢測4.1.1 樣本的相關(guān)陣檢驗(yàn)多重共線性從問題三中我們得到的相關(guān)系數(shù)為0.810,的相關(guān)系數(shù)為0.738,的相關(guān)系數(shù)為0.712,它們的自變量之間存在著顯著的相關(guān)性,說明自變
22、量之間存在多重共線性。4.1.2 樣本的VIF檢驗(yàn)檢驗(yàn)多重共線性 對自變量做中心標(biāo)準(zhǔn)化,則為自變量的相關(guān)陣。記 稱其主對角線元素為自變量的方差擴(kuò)大因子。 根據(jù)可以得到 其中,為的離差平方和,用作為衡量自變量的方差擴(kuò)大程度的因子。記為自變量對其余p-1個自變量的復(fù)決定系數(shù),則也可以作為方差擴(kuò)大因子的定義式。同樣也可以用p個自變量所對應(yīng)的方差擴(kuò)大因子的平均數(shù)來度量多重共線性,當(dāng) 遠(yuǎn)遠(yuǎn)大于1時,就表示存在嚴(yán)重的多重共線性。 下面就我們就計算數(shù)據(jù)的方差擴(kuò)大因子為系數(shù)a模型非標(biāo)準(zhǔn)化系數(shù)標(biāo)準(zhǔn)系數(shù)共線性統(tǒng)計量B標(biāo)準(zhǔn) 誤差試用版tSig.容差VIF1(常量)25.99221.5301.207.236X1-.5
23、141.498-.115-.343.734.01374.911X2.0341.434.008.024.981.01473.409X3.0061.499.001.004.997.01952.766X42.9951.063.1122.818.008.9451.059X5-1.262.904-.055-1.396.172.9531.049X62.1581.4641.0501.474.150.003337.326a. 因變量: Y 從表中的輸出結(jié)果可以看出,的方差擴(kuò)大因子VIF都很大,遠(yuǎn)遠(yuǎn)的超過了10,說明之間存在著嚴(yán)重的多重共線性。4.1.3 條件數(shù)檢驗(yàn)多重共線性 特征根分析表明,當(dāng)矩陣有一個特征根
24、近似為零時,設(shè)計矩陣X的列向量間必存在多重共線性,并且有多少個特征根接近零,X就有多少個多重共線性關(guān)系。記的最大特征根為,則 為特征根的條件數(shù),條件數(shù)度量了矩陣的特征根的散布程度,可以用它來判斷多重共線性是否存在以及多重共線性存在的嚴(yán)重程度。通常0<k<10時,設(shè)計矩陣X沒有多重共線性;當(dāng)10<k<100時,存在較強(qiáng)的多重共線性;當(dāng)k>100時,存在嚴(yán)重的多重共線性。共線性診斷a模型維數(shù)特征值條件索引方差比例(常量)X1X2X3X4X5X6116.3841.000.00.00.00.00.00.01.002.2644.915.00.00.00.00.00.86.0
25、03.1626.283.01.00.00.00.58.05.004.0978.132.02.00.01.00.01.02.005.05610.647.02.01.00.01.17.00.006.03713.083.91.00.00.01.21.06.007.000203.025.04.98.98.98.01.001.00a. 因變量: Y 下面是計算出來數(shù)據(jù)的條件數(shù)為 從條件數(shù)可以看到,最大的條件數(shù),說明自變量間存在嚴(yán)重的多重共線性,這一判斷與上面的方差擴(kuò)大因子法判斷結(jié)果一致。表中的方差比例是按從小到大的順序排列的,不是按自變量順序排列的,這與方差擴(kuò)大因子不同。在維數(shù)為7的時候,我們可以看到的
26、系數(shù)都很快的增大要接近1,這也可以說明之間存在嚴(yán)重的多重共線性,這與前面檢驗(yàn)的結(jié)果一致。4.2 消除多重共線性 這里我們采用剔除解釋變量的方法來消除多重共線性,從上面的檢驗(yàn)表來看,的方差擴(kuò)大因子為最大,遠(yuǎn)遠(yuǎn)大于10,并且它的方差比例在維數(shù)為7的時候直接就等于1,因此我們做剔除來消除多重共線性。系數(shù)a模型非標(biāo)準(zhǔn)化系數(shù)標(biāo)準(zhǔn)系數(shù)共線性統(tǒng)計量B標(biāo)準(zhǔn) 誤差試用版tSig.容差VIF1(常量)32.66321.4081.526.136X11.673.207.3758.071.000.7211.387X22.129.189.49411.240.000.8071.239X32.188.236.4119.260
27、.000.7891.268X42.8301.075.1062.632.013.9551.047X5-1.352.917-.059-1.474.150.9571.044a. 因變量: Y 從表中的輸出結(jié)果可以看出,剔除了變量后做回歸分析,的方差擴(kuò)大因子VIF都很小了,并且都小于10,說明之間存在著很弱的多重共線性。共線性診斷a模型維數(shù)特征值條件索引方差比例(常量)X1X2X3X4X5115.4061.000.00.00.00.00.00.012.2524.629.00.02.01.02.00.903.1525.956.00.12.06.00.60.024.0967.487.02.08.89.11
28、.01.025.0569.800.03.75.03.50.18.006.03612.191.95.02.00.36.20.06a. 因變量: Y 剔除后從得出的條件數(shù)來看到,最大的條件數(shù),說明自變量間還存在較弱的多重共線性。表中的方差比例在維數(shù)為7的時候,我們可以看到的系數(shù)都沒有接近1,這也可以說明各自變量之間還存在著較弱的多重共線性,但是對模型不會造成很大的影響,考慮到模型的全局性便不再對自變量做處理。4.3 模型的建立 對于因變量與多個自變量有關(guān)的問題。我們可以采用多元線性回歸進(jìn)行問題的分析。 多元線性回歸模型的基本形式:設(shè)隨機(jī)變量與一般變量的理論線性回歸模型為: 其中,是個未知參數(shù),稱為
29、回歸常數(shù),稱為回歸系數(shù)。稱為被解釋變量(因變量),而是個可以精確測量并可控制的一般變量,稱為解釋變量(自變量)。是隨機(jī)誤差,與一元線性回歸一樣,對隨機(jī)誤差項我們常假定 稱 為理論回歸方程。將剔除異常值的數(shù)據(jù)導(dǎo)入到spss17.0(簡體中文版)的數(shù)據(jù)框中,然后用spss17.0軟件做多元線性回歸分析得到下列表:模型匯總模型RR 方調(diào)整 R 方標(biāo)準(zhǔn) 估計的誤差1.973a.947.93929.328a. 預(yù)測變量: (常量), X5, X3, X4, X2, X1。 從模型匯總表中可以看出,復(fù)相關(guān)系數(shù),決定系數(shù),由決定系數(shù)看回歸方程高度顯著。Anovab模型平方和df均方FSig.1回歸52346
30、1.1435104692.229121.715.000a殘差29244.85734860.143總計552706.00039a. 預(yù)測變量: (常量), X5, X3, X4, X2, X1。b. 因變量: Y 從方差分析表,P值=0.000,表明回歸方程通過了顯著性F檢驗(yàn),也說明整體上對有高度顯著的線性影響。系數(shù)a模型非標(biāo)準(zhǔn)化系數(shù)標(biāo)準(zhǔn)系數(shù)tSig.B標(biāo)準(zhǔn) 誤差試用版1(常量)32.66321.4081.526.136X11.673.207.3758.071.000X22.129.189.49411.240.000X32.188.236.4119.260.000X42.8301.075.106
31、2.632.013X5-1.352.917-.059-1.474.150a. 因變量: Y 從系數(shù)表中可以得到對5個自變量的線性回歸方程為 從回歸方程中可以看到,對因變量y起正影響,對因變量起負(fù)影響。 通過看上面的t檢驗(yàn)數(shù)據(jù)發(fā)現(xiàn),在顯著性水平時,只有的Sig(收尾概率)大于0.05,不能通過顯著性t檢驗(yàn),因此我們再做剔除不合理變量做回歸分析模型匯總模型RR 方調(diào)整 R 方標(biāo)準(zhǔn) 估計的誤差1.971a.944.93729.815a. 預(yù)測變量: (常量), X4, X1, X2, X3。 從模型匯總表中可以看出,復(fù)相關(guān)系數(shù),決定系數(shù),比沒剔除時的值要小,但是由決定系數(shù)看回歸方程任然具有高度的顯著
32、性。Anovab模型平方和df均方FSig.1回歸521592.6374130398.159146.687.000a殘差31113.36335888.953總計552706.00039a. 預(yù)測變量: (常量), X4, X1, X2, X3。b. 因變量: Y從方差分析表,P值=0.000,表明回歸方程通過了顯著性F檢驗(yàn),也說明整體上對有高度顯著的線性影響。系數(shù)a模型非標(biāo)準(zhǔn)化系數(shù)標(biāo)準(zhǔn)系數(shù)tSig.共線性統(tǒng)計量B標(biāo)準(zhǔn) 誤差試用版容差VIF1(常量)24.59121.0401.169.250X11.663.211.3737.896.000.7221.386X22.084.190.48310.96
33、7.000.8291.206X32.216.239.4179.259.000.7941.259X42.7071.090.1022.484.018.9611.040a. 因變量: Y現(xiàn)在再看上面的t檢驗(yàn)數(shù)據(jù)發(fā)現(xiàn),在顯著性水平時,的Sig(收尾概率)都小于0.05,全部通過顯著性t檢驗(yàn),但是常數(shù)項c不能通過t檢驗(yàn)。4.3.1 含常數(shù)項的模型建立對四個自變量的線性回歸方程為從回歸方程中可以看到,對因變量y都起正影響作用。4.3.2 不含常數(shù)項的模型 現(xiàn)在再看上面的t檢驗(yàn)數(shù)據(jù)發(fā)現(xiàn),在顯著性水平時,的Sig(收尾概率)都小于0.05,全部通過顯著性t檢驗(yàn),但是常數(shù)項c的sig=0.250>0.05
34、,不能通過t檢驗(yàn),因此我們再做剔除常數(shù)項c再來做回歸分析。Dependent Variable: YMethod: Least SquaresDate: 08/23/12 Time: 16:37Sample: 1 40Included observations: 40VariableCoefficientStd. Errort-StatisticProb. X11.7329540.2029028.5408370.0000X22.1296940.18679011.401560.0000X32.3348540.21795510.712530.0000X43.3482640.9
35、460683.5391370.0011R-squared0.941510 Mean dependent var464.0000Adjusted R-squared0.936636 S.D. dependent var119.0460S.E. of regression29.96653 Akaike info criterion9.732679Sum squared resid32327.74 Schwarz cr
36、iterion9.901566Log likelihood-190.6536 Hannan-Quinn criter.9.793743Durbin-Watson stat1.773928 從模型匯總表中可以看出,決定系數(shù),比沒剔除常數(shù)項時的值要小,但是在0.94以上回歸方程任然具有高度的顯著性。再看上面的t檢驗(yàn)數(shù)據(jù)發(fā)現(xiàn),在顯著性水平時,的Sig(收尾概率)都小于0.05,全部通過顯著性t檢驗(yàn)。此模型較為合理,得到回歸方程為:從回歸方程中可以看到,對因變量y都起正影響作用。5 問題五的求解5.1 殘差的自相關(guān)性檢驗(yàn)5.1.1 圖示檢驗(yàn)法 圖示檢驗(yàn)法是
37、一種直觀的檢驗(yàn)方法,它是對給定的回歸模型直接用普通最小二乘法估計參數(shù),求出殘差項,作為隨機(jī)項的真實(shí)值的估計值,再繪制的散點(diǎn)圖,根據(jù)的相關(guān)性來判斷隨機(jī)項的序列相關(guān)性。繪制,的散點(diǎn)圖,用作為散布點(diǎn)繪圖。 這里我們?nèi)砝L制模型的殘差散布點(diǎn)繪圖從圖像中看出,用繪制的殘差散布點(diǎn)繪圖,散布在了直角坐標(biāo)系的第一象限和第三象限,表明隨機(jī)擾動項存在正的序列相關(guān)。5.1.2 殘差的自相關(guān)和偏自相關(guān)檢驗(yàn) 從圖中可以看出AC自相關(guān)系數(shù)都小于1,大于-1,殘差存在較弱的相關(guān)性,PAC值也是在(-1,1)的范圍內(nèi),同樣存在較弱的偏相關(guān)性。5.1.3 DW檢驗(yàn) 隨機(jī)擾動項的一階自回歸形式為 為了檢驗(yàn)序列的相關(guān)性,構(gòu)造假設(shè)
38、為了檢驗(yàn)上述的假設(shè),構(gòu)造DW統(tǒng)計量首先求出回歸估計的殘差,因而DW統(tǒng)計量為 其中, 如果認(rèn)為與 近似相等,則可得到 同樣認(rèn)為與 近似相等時,則可得到 由此可以得到DW的檢驗(yàn)式為 因而DW值與的對應(yīng)關(guān)系為DW誤差項的自相關(guān)性-14完全負(fù)自相關(guān)(-1,0)(2,4)負(fù)自相關(guān)02無自相關(guān)(0,1)(0,2)正自相關(guān)10完全正自相關(guān)計算DW的檢驗(yàn)值為:模型匯總b模型RR 方調(diào)整 R 方標(biāo)準(zhǔn) 估計的誤差Durbin-Watson1.971a.944.93729.8151.772a. 預(yù)測變量: (常量), X4, X1, X2, X3。b. 因變量: Y 從表中可以看出模型的DW檢驗(yàn)值為1.772,通過
39、可以近似的計算出的值為 通過查上面的DW值與的對應(yīng)關(guān)系表可以得到,故可以判定數(shù)據(jù)存在正自相關(guān),這與前面圖像法判斷的結(jié)果一致。5.2 模型的合理性分析5.2.1 帶常數(shù)項的模型從個變量的系數(shù)來看,他們對y的影響程度都差不多,而且對y都起正影響作用,先后對數(shù)據(jù)做了異常值的剔除,正態(tài)性檢驗(yàn),在從相關(guān)性的角度對變量做了相關(guān)性檢驗(yàn),剔除了產(chǎn)生多重共線性影響模型的變量,再剔除了不能通過t檢驗(yàn)的變量(除常數(shù)項給予保留)最后建立了沒有強(qiáng)多重共線性,沒有異常點(diǎn)且通過了F檢驗(yàn)的合理化模型。下面給出了模型的預(yù)測圖從預(yù)測圖來看,左邊是預(yù)測圖,兩條細(xì)線表示預(yù)測值的兩倍標(biāo)準(zhǔn)誤差帶,右邊是有關(guān)預(yù)測的一些評價指標(biāo)。從他的誤差
40、帶我們可以看出回歸模型較為精確,誤差帶緊隨實(shí)際曲線變動,再從右邊的MAPE=5.108434可以判定模型的預(yù)測精度較高,模型的預(yù)測度較好。5.2.1 不帶常數(shù)項的模型 通過了異常點(diǎn)檢驗(yàn),多重共線性檢驗(yàn),F(xiàn)檢驗(yàn),t檢驗(yàn)的模型。下面給出了模型的預(yù)測圖從預(yù)測圖來看,左邊是預(yù)測圖,兩條細(xì)線表示預(yù)測值的兩倍標(biāo)準(zhǔn)誤差帶,右邊是有關(guān)預(yù)測的一些評價指標(biāo)。從他的誤差帶我們可以看出回歸模型較為精確,誤差帶緊隨實(shí)際曲線變動,再從右邊的MAPE=5.374592可以判定模型的預(yù)測精度較高,模型的預(yù)測度較好。剔除常數(shù)項的MAPE值要比保留常數(shù)項的MAPE值要大,說明剔除常數(shù)項后,模型的精度降低了,模型的預(yù)測效果不如保留
41、常數(shù)項的好。6 問題六的求解預(yù)測時的預(yù)測值.6.1 帶常數(shù)項的模型預(yù)測用最終合理化模型對給定的進(jìn)行預(yù)測,分別取代入下列模型進(jìn)行Y的預(yù) 它與470的值差不多,所以模型能夠合理的解釋因變量Y。6.2 不帶常數(shù)項的模型預(yù)測 分別取代入下列模型進(jìn)行Y的預(yù) 它比保留了常數(shù)項更為接近470,預(yù)測效果要比保留常數(shù)項的好些。6、 模型檢驗(yàn) 將第一組數(shù)據(jù),第二組數(shù)據(jù)和第三組數(shù)據(jù)分別代入模型 進(jìn)行檢驗(yàn)第一組數(shù)據(jù)的檢驗(yàn) 第二組數(shù)據(jù)的檢驗(yàn) 第三組數(shù)據(jù)的檢驗(yàn) 從檢驗(yàn)的結(jié)果來看,的檢測值與實(shí)際的值相差不大,但是與真實(shí)值相差過大。7、 模型評價從建模的過程看,已經(jīng)剔除了異常值,存在多重共線性的變量和不能通過t檢驗(yàn)的變量,模
42、型已經(jīng)算是很合理化了。但是在進(jìn)行模型檢測的時候,通過模型的計算值與真實(shí)值不是很相近,還出現(xiàn)了很大的差距,所以整個模型不是太完善,還需進(jìn)一步的分析和改進(jìn)。在保留常數(shù)項和不保留常數(shù)項的問題上,始終會對模型造成很大的改變,所以這里我們給出了兩個合理化模型,保留了常數(shù)項和不保留常數(shù)項的模型。8、 參考文獻(xiàn)【1】 易丹輝.數(shù)據(jù)分析與EViews應(yīng)用.北京:中國人民大學(xué)出版社,2008【2】 何曉群,劉文卿.應(yīng)用回歸分析(第三版).北京:中國人民大學(xué)出版社,2011【3】 盧文群.SPSS for windows 統(tǒng)計分析(第三版).北京:電子工業(yè)出版社,2006【4】 姜啟源,謝金星,葉 俊.數(shù)學(xué)建模(
43、第三版).高等教育出版社,2003【5】 楚雄師院數(shù)學(xué)系.數(shù)學(xué)實(shí)驗(yàn).科學(xué)出版社.2010【6】 百度文庫(9、 看法和建議模型不能很好的擬合真實(shí)值,可能是因?yàn)橄惓V档姆椒ú粚?,也可能是常?shù)項不能通過t檢驗(yàn)的結(jié)果。因此最好是剔除異常值再建模。在是否保留常數(shù)項的問題上,我們建議適當(dāng)?shù)倪x取。10、 附錄行YX1X2X3X4X5X6144349797681520522902770316612936761159213009339453692629258247548167429416320262963154341411119745310560475102128617114858417202859514
44、98727112-124210400155999151117411473626281912071215725117994513440456584191319514480927563920232151362726824171341653011152931113256176107810284572661861710687821872761960097987112826620480676562131219621279382644108110224465632991681882345054100501115205243355355608017025459615379651932663060108104178273274838378711182332861774125661642652960589121718
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 強(qiáng)化基本醫(yī)療衛(wèi)生服務(wù)的重要性
- 糧食等重要農(nóng)產(chǎn)品穩(wěn)產(chǎn)保供的重要性
- 工業(yè)企業(yè)揮發(fā)性有機(jī)物排放控制的政策支持與激勵措施
- 圓柱施工方案
- 三級人力資源管理師-企業(yè)人力資源管理師(三級)《理論知識》考前沖刺卷4
- 專題08應(yīng)用文寫作
- 安徽省安慶一中江西省南昌二中等五省六校(K12聯(lián)盟)高三上學(xué)期期末聯(lián)考英語試題
- 福建省莆田市第二十四中學(xué)2017-2018學(xué)年高一上學(xué)期期末考?xì)v史試題
- 工會組織在企業(yè)文化建設(shè)中的獨(dú)特作用
- 九年義務(wù)教育全日制初級中學(xué)英語教學(xué)大綱( 試用修訂版)
- 北師大版心理健康四年級下冊全冊教案教學(xué)設(shè)計
- 品牌服裝設(shè)計課件
- 肝病科進(jìn)修總結(jié)匯報
- 化妝品企業(yè)質(zhì)量管理手冊
- 區(qū)域間的數(shù)據(jù)共享協(xié)議
- 建筑工程施工日志模板
- NB-T 47013.7-2012(JB-T 4730.7) 4730.7 承壓設(shè)備無損檢測 第7部分:目視檢測
- 【高中語文】《社會歷史的決定性基礎(chǔ)》課件49張+統(tǒng)編版+選擇性必修中冊
- oecd 稅收協(xié)定范本
- 我的家鄉(xiāng)聊城臨清宣傳介紹模板
- DL∕T 547-2020 電力系統(tǒng)光纖通信運(yùn)行管理規(guī)程
評論
0/150
提交評論