回歸分析課設_第1頁
回歸分析課設_第2頁
回歸分析課設_第3頁
回歸分析課設_第4頁
回歸分析課設_第5頁
已閱讀5頁,還剩18頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

概率論與數(shù)理統(tǒng)計課程設計概率論與數(shù)理統(tǒng)計課程設計摘要在市場的經(jīng)濟活動中,經(jīng)常會遇到某一市場現(xiàn)象的發(fā)展和變化取決于幾個影響因素的情況,也就是一個因變量和自變量幾個有依存關系的情況。它們相互聯(lián)系,相互依存,因而它們之間存在著一定的關系,一般說來,變量之間的關系大致可分為兩類:一類是確定性的關系,也就是我們所熟知的函數(shù)關系:另一類是非確定性的關系。應當指出,確定性關系與相關關系之間往往無法截然區(qū)分。一方面,由于測量誤差等隨機因素的影響,確定性關系在實際中往往通過相關關系表現(xiàn)出來;另一方面,當人們對客觀事物的內(nèi)部規(guī)律了解的更加深刻時,相關關系又可能轉(zhuǎn)化為確定性關系。數(shù)據(jù)統(tǒng)計中研究變量之間相互關系的一種有效方法就是回歸分析。關鍵詞:回歸分析;變量;測量誤差;數(shù)據(jù)統(tǒng)計;因素;目錄HYPERLINK1設計目的 1HYPERLINK2設計題目 1HYPERLINK3設計原理 2HYPERLINK3.1二元線性回歸模型的建立 2HYPERLINK3.2結(jié)果的分析 4HYPERLINK4設計程序 7HYPERLINK4.1輸入數(shù)據(jù),觀察與的線性關系 7HYPERLINK4.2作回歸分析與檢驗 8HYPERLINK4.3殘差分析 9HYPERLINK4.4方差分析 10HYPERLINK5設計總結(jié) 12HYPERLINK致謝 12HYPERLINK參考文獻 12PAGE1影響彩電銷售的回歸分析1設計目的熟練掌握概率論與數(shù)理統(tǒng)計在實際問題上的應用。了解二元回歸方程,回歸系數(shù)的檢驗方法及應用二元回歸方程進行預測的方法,并將所學的知識結(jié)合MATLAB對數(shù)據(jù)的處理解決實際問題,并用MATLAB軟件進行解算并檢驗;學會應用MATLAB軟件進行二元回歸實驗的分析方法2設計題目下面是十個地區(qū)彩電的需求量與其價格以及消費者可支配收入的相關數(shù)據(jù),如表一所示。表一設定兩個自變量指標分別為:價格,消費者收入,彩電需求量作為因變量,則可建立如下的二元線性回歸模型:其中分別為未知參數(shù),為隨機誤差,與自變量無關,服從。3設計原理3.1二元線性回歸模型的建立在實際問題中,經(jīng)常會出現(xiàn)兩個變量之間的相關關系不是線性的(即直線型),而是非線性的(即曲線型)。設其中有兩個變量與,我們可以用一個確定函數(shù)關系式:大致的描述與之間的相關關系,函數(shù)稱為關于的回歸函數(shù),方程成為關于的回歸方程。二元線性回歸處理的是兩個變量與之間的線性關系,可以設想的值由兩部分構成:一部分由自變量的線性影響所致,表示的線性函數(shù);另一部分則由眾多其他因素,包括隨機因素的影響所致,這一部分可以視為隨機誤差項,記為??傻枚€性回歸模型自變量是可以控制的隨機變量,成為回歸變量;固定的未知參數(shù),成為回歸系數(shù);稱為響應變量或因變量。由于是隨機誤差,根據(jù)中心極限定理,通常假定是未知參數(shù)。在根據(jù)專業(yè)知識或者散點圖,選擇合適的曲線,將其轉(zhuǎn)化成線性方程。3.1.1模型回歸系數(shù)的估計為了估計回歸系數(shù),假定試驗得到兩個變量與的個數(shù)據(jù)對我們將這對觀測值代入式(1),得,這里互獨立的隨機變量,均服從正態(tài)分布,即回歸系數(shù)估計的方法有多種,其中使用最廣泛的是最小二乘法,即要求選取的的值使得述隨機誤差的平方和達到最小,即求使得函數(shù)取得最小值的。由于是的二元函數(shù),利用微積分中的函數(shù)存在極值的必要條件,分別對求偏導數(shù),并令其為0,構成二元一次方程組,,化簡后得到如下正規(guī)方程組,,解方程組得到總體參數(shù)估計量,這里均已有的觀測數(shù)據(jù)。由此得到回歸方程:帶入觀測,得到值稱為回歸預測值。3.2結(jié)果的分析在實際問題中,對于給定的顯著性水平,查表可知的臨界值,如果有樣本觀測值計算得到的統(tǒng)計量的觀測值大于,則在顯著性水平下拒絕原假設,如果統(tǒng)計量的觀測值不大于,則接受原假設,即認為因素的不同水平對總體無顯著影響。3.2.1回歸方程顯著性的檢驗建立二元線性回歸方程當且僅當變量之間存在線性相關關系時才是有意義的,因此必須對變量之間的線性相關的顯著性進行檢驗,即對建立的回歸模型進行顯著性檢驗。首先引入幾個概念:,稱為總偏差平方和,它表示觀測值總的分散程度;,稱為回歸平方和,它是由回歸變量的變化引起的,放映了回歸變量對變量線性關系的密切程度;,稱為殘差(剩余)平方和,它是由觀測誤差等其他因素起誤差,它的值越小說明回歸方程與原數(shù)據(jù)擬合越好。可以證明下列關系成立即我們主要考慮回歸平方和在總偏差和中所占的比重,記稱為復相關系數(shù),用的大小來評價模型的有效性,越大,則反映回歸變量與相應變量之間的線性函數(shù)關系越密切。引入統(tǒng)計量。定義,可知于給定的顯著水平(一般這里取0.05或0.01),查表可得臨界值如果,則認為與之間的線性關系顯著;如果,則認為與之間的線性關系不顯著,或者不存在線性關系,在實際應用中也可以通過對應的概率來說明與之間的線性相關性顯著。表3.1.1.1線性回歸的方差分析表方差來源平方和自由度F值臨界值顯著性回歸剩余總計(1)當時,認為與之間的線性相關關系不顯著,或者不存在線性相關關系;(2)當時,認為與之間的線性相關關系顯著;(3)當時,認為與之間的線性相關關系特別顯著。3.2.2回歸方程參數(shù)顯著性的檢驗在回歸分析中,檢驗就是對回歸參數(shù)的顯著性進行檢驗;檢驗是對回歸方程的顯著性進行檢驗。在一元回歸中,二者是等價的;但在多元回歸中,檢驗通過則檢驗一定能夠通過,而檢驗通過檢驗不一定通過。值就是方便大家判斷顯著性的,一般地,例如在時,,就拒絕原假設,說明線性顯著。3.2.3回歸系數(shù)的置信區(qū)間回歸方程(1)的回歸系數(shù)是一個點估計值,給定置信水平后,可得到他們對應的置信區(qū)間,并且回歸區(qū)間越短越好,如果這個回歸系數(shù)的置信區(qū)間包含0點,則說明該回歸變量的影響不顯著,需要進一步地修改回歸方程,盡量是每個回歸系數(shù)的置信區(qū)間都不包含0點。3.2.4利用模型預測在對所建立的回歸模型進行相關程度檢驗與分析之后,如果預測變量與相關變量的每一個給定值,帶入回歸模型,就可以求得一個相對應的回歸預測值,稱為模型的點估計值。4設計程序為了研究這些數(shù)據(jù)中所蘊含的規(guī)律,設定兩個自變量指標分別為:價格,消費者收入;彩電需求量作為因變量,畫出它們的散點圖。4.1輸入數(shù)據(jù),觀察與的線性關系在命令窗口輸入:>>x1=[5919654562366470674064406800724075717068]';>>x2=[76291210671116119012921434159618001930]';>>y=[235624432073246311534143530387039634668]';>>plot(x1,y,'r*',x2,y,'k*')生成如圖4.1的散點圖,可以看出,和y大體成線性關系。圖4.1散點圖4.2作回歸分析與檢驗(1)在命令窗口輸入:>>y=[5919654562366470674064406800724075717068]';x1=[235624432073246311534143530387039634668]';x2=[76291210671116119012921434159618001930]';x=[ones(10,1),x1,x2];[b,bint,r,rint,stats]=regress(y,x,0.05);bstats生成結(jié)果:b=1.0e+003*5.2073-0.00020.0016stats=1.0e+004*0.00010.00200.00004.6373即得到回歸系數(shù)為5.2073,-0.0002,0.0016,負相關系數(shù),對應的概率,可知回歸方程從以上數(shù)據(jù)看來,該模型線性回歸顯著。4.3殘差分析在命令窗口輸入:rcoplot(r,rint)出現(xiàn)圖4.1.3.1從殘差圖可以看出,數(shù)據(jù)的殘差離零點較近,且殘差的置信區(qū)間均包含零點,這說明回歸模型能較好的符合原始數(shù)據(jù)。圖4.3.1殘差圖4.4方差分析在命令窗口輸入:x=[3.5,4.5,3.3,4,3.9,2.27,2.35,2.29,2.36,2.33,1.17,1.15,1.14,1.19,1.20];a=[3.5,4.5,3.3,4,3.9];b=[2.27,2.35,2.29,2.36,2.33];c=[1.17,1.15,1.14,1.19,1.20];f1=sum((x(1,:)-mean(x)).^2);f2=(sum((mean(a)-mean(x))^2)+sum((mean(b)-mean(x))^2)+sum((mean(c)-mean(x))^2))*3;st=f1sa=f2se=f1-f2st=18.8169sa=10.7618se=8.0551結(jié)論:彩電銷售量與消費者收入水平正相關,與彩電的價格負相關,較好地體現(xiàn)了實際的經(jīng)濟意義(一般來說,隨著消費者收入的增加,彩電的需求是增加的;隨著彩電價格的提升,彩電的需求是下降的。),并且較好地通過了相關的檢驗??梢?,本文所假定的二元線性回歸方程各個方面表現(xiàn)良好,即最終建立的二元線性回歸模型為:。在該二元線性回歸方程中,的系數(shù)說明要增加彩電的銷售量在很大程度上取決于消費者的收入。的系數(shù)為負數(shù),說明要增加彩電銷售量,商家也應該適當調(diào)整彩電價格,以低價優(yōu)惠來吸引顧客。5設計總結(jié)通過對概率論與數(shù)理統(tǒng)計的這道實際問題的解決,不僅使我更加深刻的理解了概率論與數(shù)理統(tǒng)計的基礎知識,對線性回歸及線性回歸的方差分析、相關系數(shù)的顯著性檢驗有了更深刻的了解,而且使我對這些知識在實際中的應用產(chǎn)生了濃厚的興趣,同時對我學習好概率論與數(shù)理統(tǒng)計這門課有很大幫助。在實現(xiàn)這道題的過程中我應用MATLAB軟件,學會了這個軟件的一些新的應用,更加熟練的操作該軟件進行一些數(shù)據(jù)上的處理。致謝本論文是張玉春老師指導下完成的。她嚴肅的科學態(tài)度,嚴謹?shù)闹螌W精神,精益求精的工作作風,深深地感染和激勵著我。在此,我向張老師致以誠摯的謝意和崇高的敬意。同時我還要感謝我的同學們,在論文設計中

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論