




已閱讀5頁,還剩14頁未讀, 繼續(xù)免費閱讀
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
精品文檔實驗七 多元回歸模型(2學時)一、實驗目的和要求1. 熟練掌握多元線性回歸模型的建立方法,掌握并能檢驗所建立回歸方程的顯著性與方程系數(shù)的顯著性,能根據(jù)實際問題作預測與控制;2.掌握平方和分解公式,會編程求總離差平方和TSS、回歸平方和RSS、殘差平方和ESS、復相關系數(shù)平方等統(tǒng)計量; 3.會根據(jù)實際問題對建立多元非線性回歸模型,掌握多元線性回歸的regress命令格式二、實驗內容1.多元線性回歸模型(1)多元線性回歸模型多元線性回歸模型待定常數(shù),回歸系數(shù),.矩陣表示對進行次獨立觀測,得組數(shù)據(jù) 則有 ,其中 相互獨立,且采用矩陣記號 -觀測向量- 設計矩陣-待估回歸參數(shù)向量 -隨機誤差向量 多元線性回歸模型(2)參數(shù)估計及性質-的最小二乘估計-隨機誤差項方差的無偏估計-回歸方程給出,可由的觀測值和經驗回歸方程求得的預測值%求回歸參數(shù)命令(3)復相關系數(shù)及相關性檢驗總離差平方和分解 總離差殘差平方和(Total Sum of Squares) 殘差平方和(Error Sum of Squares) 回歸平方和(Regression Sum of squares)復相關系數(shù)平方,回歸愈越顯著%求復相關系數(shù)平方命令TSS=sum(y-mean(y).2) %計算總離差平方和,y是因變量Y數(shù)據(jù)RSS=sum(y1-mean(y).2) %計算回歸平方和ESS=sum(y-y1).2) %計算殘差平方和R2=RSS/ESS; %計算樣本決定系數(shù)R2=RSS/TSS(4)回歸方程的顯著性檢驗檢驗假設: 統(tǒng)計量 給出顯著性水平,檢驗值,當拒絕,認為與線性回歸顯著;否則線性關系不顯著%回歸方程顯著性檢驗命令F=(n-p-1)*SSR/SSE %計算的F統(tǒng)計量,n是樣本容量F1=finv(0.95,p,n-p-1) %查F統(tǒng)計量0.05的分位數(shù)F2=finv(0.99,p,n-p-1) %查F統(tǒng)計量0.01的分位數(shù)p=1-fcdf(F,p,n-p-1) %求檢驗P值,F(xiàn)是上面計算結果(5)回歸系數(shù)的統(tǒng)計推斷檢驗假設 統(tǒng)計量 檢驗值當,拒絕,認為與線性回歸顯著;否則不顯著%回歸系數(shù)顯著性的t檢驗命令T=b1/sqrt(SSE/(n-2)*sqrt(sum(x-mean(x).2) %t統(tǒng)計量觀測值to, x是自變量,b1是X的回歸系數(shù)T1=tinv(0.975,n-p-1) %t統(tǒng)計量0.05的分位數(shù)T2=tinv(0.995,n-p-1) %t統(tǒng)計量0.01的分位數(shù)p=2-2*tcdf(T,n-p-1) %t檢驗的p值(6)預測及統(tǒng)計推斷 因變量的點估計和區(qū)間估計給出,的預測值的置信區(qū)間 4.多元線性回歸建模的基本步驟(1)對問題進行直觀分析,選擇因變量與解釋變量,作出因變量與各解釋變量散點圖,初步設定多元線性回歸模型參數(shù)個數(shù);(2) 多元回歸建模命令輸入因變量與自變量的觀測數(shù)據(jù)(y,X), 計算參數(shù)的估計regeress,調用格式有以下三種:(1)b = regress(Y,X)(2)b,bint,r,rint,stats = regress(Y,X)(3)b,bint,r,rint,stats = regress(Y,X,alpha) 輸入?yún)?shù):因變量觀測向量;矩陣,第一列元素全為1,第j列是自變量Xj觀測向量,對一元線性回歸,取p=1即可;alpha為顯著性水平.輸出參數(shù):向量b-回歸系數(shù)估計值bint-回歸系數(shù)的(1-alpha)置信區(qū)間;向量r-殘差列向量;rint-模型的殘差的(1- a)的置信區(qū)間;stats-用于檢驗回歸模型的統(tǒng)計量,有4個分量值:第一個是復相關系數(shù)平方,第二個是F統(tǒng)計量值,第三個是與統(tǒng)計量F對應的概率P,當P n,p=size(A); %讀取A的行數(shù)和列數(shù)X=A(:,1:3) %X1-X3構成的數(shù)據(jù)矩陣 y=A(:,4)mmdl=LinearModel.fit(X,y) %調用LinearModel類的fit方法求解模型 結果輸出:結果輸出 mmdl = Linear regression model: y 1 + x1 + x2 + x3Estimated Coefficients:參數(shù)估計表 Estimate SE tStat pValue 參數(shù)估計 殘差平方 t統(tǒng)計量 檢驗P值 (Intercept) 162.06 346.15 0.46818 0.64686 x1 7.2739 1.3523 5.3787 9.7273e-05 x2 13.957 3.167 4.4071 0.00059659 x3 -4.3996 19.76 -0.22265 0.82702 以下是關于一些統(tǒng)計量的結果:Number of observations: 18, Error degrees of freedom: 14Root Mean Squared Error: 100R-squared: 0.957, Adjusted R-Squared 0.948F-statistic vs. constant model: 105, p-value = 7.75e-10 其他結果,點擊工作區(qū)mmdl,顯示很多結果。包括給出3個平方和SSE、SST、SSR及MSE,殘差Residuals,因變量擬合Fittde等諸多結果。說明:1),修正后的復相關系數(shù)平方 均認為和的線性關系顯著.2)F統(tǒng)計量觀測值,及檢驗概率均拒絕原假設,認為和的線性關系顯著.3)從參數(shù)估計表看出, 認為, 認為認為與關系顯著,與關系不顯著,可進一步考慮是否剔除.此外,該類結果還給出了一系列統(tǒng)計量值,如Fitted-因變量擬合結果,Residual殘差結果,平方和SSESSTSSR等。例3.2.3現(xiàn)代服務業(yè)是社會分工不斷深化的產物,隨著經濟的發(fā)展,科學技術的進步,現(xiàn)代服務業(yè)的發(fā)展受到多種因素和條件的影響。不僅受到經濟總體發(fā)展水平的影響,還受到第二產業(yè)、就業(yè)、投入等因素的影響,從這幾個主要方面出發(fā),利用江蘇省統(tǒng)計年鑒的有關數(shù)據(jù),通過建立多元線性回歸模型對1990-2008年各種因素對現(xiàn)代服務業(yè)的影響進行回歸分析。假如構建如下江蘇省服務業(yè)增長模型:,Y代表江蘇省服務業(yè)的增加值(單位:億元),反映了江蘇省服務業(yè)發(fā)展的總體水平。x1x4表示影響江蘇省服務業(yè)發(fā)展的四種主要因素和影響,其中x1代表江蘇省人均GDP(單位:元),說明江蘇省總體經濟發(fā)展水平對服務業(yè)的影響;x2代表江蘇省第二產業(yè)的增加值(單位:億元),說明了工業(yè)發(fā)展對服務業(yè)的影響,體現(xiàn)了生產性服務業(yè)的需求規(guī)模;x3表示江蘇省服務業(yè)的就業(yè)人數(shù)(單位:萬人); x4表示江蘇省服務業(yè)資本形成總額(單位:億元),主要體現(xiàn)服務業(yè)投資的經濟效應。表3.11 江蘇省關于服務業(yè)發(fā)展及各影響因素相關數(shù)據(jù)年份服務業(yè)增加值Y省人均GDPX1第二產業(yè)增加值X2服務業(yè)就業(yè)人數(shù)X3服務業(yè)資本形成總額X4198937.76203870.24589.74252.01199028.13210935.53623.19275.82199193.582353101.33640.95330.711992160.623106325.34706.39439.321993286.584321478.79786.37620.971994277.125801588.72855.97858.911995387.117319528.49920.451102.711996367.168471358.86975.661293.431997291.779371337.741025.221370.211998280.0110049228.241102.311624.741999227.6110695280.051151.681773.372000329.1611765515.741192.021903.372001385.4412882471.571263.772131.872002437.0214396697.031341.862189.782003601.39168301182.621407.632686.572004704.72202231650.881443.373362.1920051291.11245601917.051542.463930.5620061360.09288141895.81625.064628.5920071769.28339282055.561713.335287.91解:(1)建立回歸模型,,n=19,p=4回歸分析程序%輸入各影響因素的數(shù)據(jù)x0=203870.24589.74252.01210935.53623.19275.822353101.33640.95330.713106325.34706.39439.324321478.79786.37620.975801588.72855.97858.917319528.49920.451102.718471358.86975.661293.439371337.741025.221370.2110049228.241102.311624.7410695280.051151.681773.3711765515.741192.021903.3712882471.571263.772131.8714396697.031341.862189.78168301182.621407.632686.57202231650.881443.373362.19245601917.051542.463930.56288141895.81625.064628.59339282055.561713.335287.91;y=37.76,28.13,93.58,160.62,286.58,277.12,387.11,367.16,291.77,280.01,227.61,329.16,385.44,437.02,601.39,704.72,1291.11,1360.09,1769.28; %Y服務業(yè)增加值列向量n,p=size(x0); %矩陣的行數(shù)即樣本容量n,列數(shù)即回歸變量個數(shù)x=ones(n,1),x0; % 構造設計矩陣,第一列為1,后4列為X1-X4db,dbint,dr,drint,dstats=regress(y,x); % 調用多元回歸分析命令,輸出回歸參數(shù)db,回歸參數(shù)置信區(qū)間dbinr,殘差dr,殘差置信區(qū)間drint,及一些統(tǒng)計量dstats程序運行結果:1)回歸參數(shù)的估計n=19, p=4輸出:db =345.2493 0.1672 0.1962 -0.7012 -0.6537得到回歸參數(shù)估計為所以,服務業(yè)增加值Y對4個自變量的線性回歸方程為回歸參數(shù)的區(qū)間估計結果dbint = 22.8409 667.6576 的置信區(qū)間 0.0731 0.2613 的置信區(qū)間為0.0731, 0.2631 0.0201 0.3722 的置信區(qū)間 -1.1650 -0.2374 的置信區(qū)間 -1.2867 -0.0207 的置信區(qū)間2)殘差輸出結果:dr = -83.8119 -59.4867 0.5889 14.6534 82.1633 7.9945 80.5396 64.6092 -72.1976 44.5876 5.7768 -4.5670 73.2709 -79.9409 -46.9710 -136.1633 113.7938 -10.20225.3624即殘差向量殘差的置信區(qū)間結果drint = -221.9639 54.3402 即的置信區(qū)間-221.9639, 54.3402 -205.9396 86.9662 -151.4255 152.6034 -140.5198 169.8267 -62.4916 226.8182 -144.3484 160.3374 -72.5509 233.6301 -92.9528 222.1712 -214.9770 70.5819 -103.0712 192.2464 -137.4586 149.0121 -162.2339 153.0999 -64.6853 211.2271 -195.3209 35.4392 -191.1233 97.1813 -228.7041 -43.6224 -12.7351 240.3227 -149.3628 128.9584 -85.7809 96.5057 的置信區(qū)間-85.7809, 96.50573)輸出 統(tǒng)計量值dstats = 1.0e+003 * %下列數(shù)據(jù)要100.00010 0.1727 0.0000 5.7926可決系數(shù)R2=0.00010接近0, F統(tǒng)計量觀測值,檢驗P值, Fa,或者由F0的p值為p0=00.05,所以拒絕H0,接受備擇假設H1,說明總體回歸系數(shù)bi不全為零,即表明模型的線性關系在95%的置信水平下顯著成立.2)回歸系數(shù)的t 檢驗%t檢驗程序S=MSE*inv(x*x); % 計算回歸參數(shù)的協(xié)方差矩陣T0=db./sqrt(diag(S); % 每個回歸參數(shù)的T統(tǒng)計量 Ta=tinv(0.975,n-p-1); % t分布的分位數(shù)pp=tpdf(T0,n-p-1); % 每個回歸參數(shù)的T統(tǒng)計量對應的概率t檢驗程序結果:S =1.0e+04 * 2.2597 -0.0003 -0.0004 -0.0032 0.0024 -0.0003 0.0000 0.0000 0.0000 -0.0000 -0.0004 0.0000 0.0000 0.00
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 文化與娛樂:2025年網(wǎng)絡文學版權保護與產業(yè)發(fā)展研究報告
- 蛋鴨養(yǎng)殖場建設項目可行性研究報告
- 2025金融行業(yè)反洗錢技術創(chuàng)新與監(jiān)管效能評估報告
- 特色行業(yè)研究報告
- 5G時代2025年邊緣計算在工業(yè)互聯(lián)網(wǎng)領域的市場趨勢研究報告
- 4學前教育普惠化趨勢下民辦園教育創(chuàng)新與教育信息化融合研究報告
- 2025年專用設備制造行業(yè)服務化轉型市場布局與競爭格局報告
- 二升三暑假語文數(shù)學試卷
- 2025年中醫(yī)藥現(xiàn)代化進程中新西蘭市場拓展可行性研究報告
- 2025年中醫(yī)藥現(xiàn)代化國際市場拓展:中東地區(qū)市場潛力分析報告
- 2025年山東省高考招生統(tǒng)一考試高考真題化學試卷(真題+答案)
- 事故隱患內部報告獎勵制度
- 醫(yī)院培訓課件:《緊急情況下口頭醫(yī)囑制度與執(zhí)行流程》
- 北京市大興區(qū)2023-2024學年八年級下學期期末歷史試題(原卷版)
- 2023年山東省夏季普通高中學業(yè)水平合格考試會考生物試題及參考答案
- 北京市東城區(qū)名校2024年八年級物理第二學期期末質量檢測試題及答案解析
- MOOC 中國文化概論-華南師范大學 中國大學慕課答案
- 西藥房工作管理制度
- 化工原理化工計算所有公式總結
- 旋挖樁增加鋼護筒施工補充方案
- 學齡人口信息采集表
評論
0/150
提交評論