基于蒙特卡羅方法的回歸模型合理性研究畢業(yè)論文_第1頁
基于蒙特卡羅方法的回歸模型合理性研究畢業(yè)論文_第2頁
基于蒙特卡羅方法的回歸模型合理性研究畢業(yè)論文_第3頁
基于蒙特卡羅方法的回歸模型合理性研究畢業(yè)論文_第4頁
基于蒙特卡羅方法的回歸模型合理性研究畢業(yè)論文_第5頁
已閱讀5頁,還剩18頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、 . . . 編號本科生畢業(yè)論文(設(shè)計)題 目 基于Monte-Carlo方法的回歸模型合理性研究 19 / 23目錄摘要. I關(guān)鍵詞. IAbstract. IIKeywords. II前言. 1第1章 理論準(zhǔn)備. 11.1 蒙特卡羅方法的基本思想. 11.2 一元線性回歸分析. 11.2.1 回歸模型簡介. 11.2.2 回歸參數(shù)的估計. 21.2.2.1和參數(shù)的點估計. 21.2.3 相關(guān)系數(shù)的檢驗. 31.2.3.1離差平方和之間的關(guān)系. 31.2.3.2決定系數(shù)與相關(guān)系數(shù). 41.2.4的估計. 4第2章 模型建立 . 52.1 線性回歸過程. 52.2 蒙特卡羅實驗. 92.3 結(jié)

2、論. 152.4 模型評價. 15參考文獻(xiàn). 15附錄. 15致. 18基于Monte-Carlo方法的回歸模型合理性研究 摘要:本文針對文獻(xiàn)中使用汽車車輪彎沉數(shù)據(jù)所建立的模型進(jìn)行分析,發(fā)現(xiàn)模型的正態(tài)假設(shè)有一定的問題,在此基礎(chǔ)之上,用Monte-Carlo方法重新生成新的樣本,并建立模型,發(fā)現(xiàn)新的模型與文獻(xiàn)中的模型有差異,表明原模型的正態(tài)假設(shè)不滿足,原模型不具有適用性。 關(guān)鍵字:統(tǒng)計檢驗;蒙特卡羅方法;一元線性回歸模型;汽車彎沉值Rationality of regression model research based on Monte Carlo methodAbstract:Based

3、on the data of car wheel deflection value of the literature to carry on the model analysis, this paper finds that the model assumption of normality has some problems.On this basis, the new model is established with the Monte-Carlo method to regenerate a new sample and finds the new model and the mod

4、el in the literature have differences.Thus,the paper draw a conclusion that the original model of the normality assumption is not met and has no applicability. Keywords:statistical test ;Monte Carlo method ;a linear regression model ;car wheel deflection value前言 彎沉是指在固定的軸載作用下,路基或路面表面輪隙位置產(chǎn)生的總垂直變形(總彎沉

5、),以0.01mm為單位。 在此之前有人做過汽車彎沉檢測車輛修正系數(shù)865-67,也把修正系數(shù)求出來,但都只是一個結(jié)論。本文基于前人試驗的數(shù)據(jù),把回歸過程用SPSS來實現(xiàn),建立了一元線性回歸模型,結(jié)合統(tǒng)計檢驗方法對回歸模型進(jìn)行檢驗,再用Monte-Carlo方法,在SPSS中產(chǎn)生標(biāo)準(zhǔn)正態(tài)分布隨機(jī)數(shù),對模型合理性再次檢驗,從而總結(jié)出了一套更系統(tǒng)、更合理的計算彎沉檢測車輛修正系數(shù)的方法。 本文是在大樣本下進(jìn)行分析處理的,樣本數(shù)為,因此樣本總體服從正態(tài)分布。假設(shè)汽車車輪下未墊鋼板時測得的數(shù)據(jù)用變量來表示,車輪下墊鋼板時測得的數(shù)據(jù)用變量來表示。第1章 理論準(zhǔn)備1.1 蒙特卡羅方法的基本思想 蒙特卡羅(

6、Monte Carlo)方法也稱為隨機(jī)模擬方法,它的基本思想是,首先建立一個概率模型或隨機(jī)過程,使它的參數(shù)等于問題的解;然后通過對抽樣試驗來計算所求參數(shù)的統(tǒng)計特征,最后給出所求解的近似值。而解的精確度可用估計值的標(biāo)準(zhǔn)誤差來表示。 假設(shè)是隨機(jī)變量且數(shù)學(xué)期望,那么近似確定的方法是對進(jìn)行次重復(fù)抽樣,產(chǎn)生相互獨立的值得序列、,并計算其算術(shù)平均值:根據(jù)柯爾莫哥羅夫加強(qiáng)大數(shù)定理有,因此,當(dāng)充分大時,下試成立的概率等于1,亦即可以用作為所求量的估計值。1.2 一元線性回歸分析1.2.1 回歸模型簡介如果一個自變量(解釋變量)與一個因變量(被解釋變量)所形成的的關(guān)系是線性相關(guān)關(guān)系,即值隨著的改變而改變,則可以

7、通過建立一元線性模型來描述與的關(guān)系。而將所建的一元線性模型稱為一元回歸模型,表示為 (11)其中為總體回歸直線的截距,為總體回歸直線的斜率,為隨機(jī)誤差項,為樣本量。公式(11)稱為關(guān)于的一元線性回歸模型。從模型可以看到,因變量由兩部分構(gòu)成:一部分是由線性函數(shù)構(gòu)成的確定性數(shù)值,另一部分是由決定的隨機(jī)變量數(shù)值。一元線性回歸模型準(zhǔn)確地表示了自變量與因變量的線性相關(guān)關(guān)系。即當(dāng)給定一個值時,的數(shù)值主要會隨線性函數(shù)部分而變化,但是由于的存在,所以值仍然是不確定的,是隨機(jī)的?;貧w模型是從總體的角度描述自變量與因變量的關(guān)系。因此,模型中的和就是從總體上說明與變量關(guān)系的系數(shù),但它們的數(shù)值在實際中是不可能得到的,

8、只能通過樣本數(shù)據(jù)得到它們的估計值。而且對這些參數(shù)估計時,必須在滿足一些基本假設(shè)條件下進(jìn)行。這些假設(shè)是:(1)是隨機(jī)變量,且。隨機(jī)誤差項分布的均值為零的含義是:雖然隨機(jī)因素對被解釋變量有影響,但從平均意義上來說,其影響為零,從而在給定的情況下,被解釋變量的平均水平完全由解釋變量確定。隨機(jī)誤差項方差恒定,稱為同方差,其具體含義是:雖然各個隨機(jī)誤差項的取值是不同的,但是方差是一樣的,違背該假設(shè)就成為異方差。(2)隨機(jī)變量與相互獨立。隨機(jī)誤差項之間互不相關(guān)的具體含義是:對應(yīng)于任意兩個不同的值,隨機(jī)誤差項互不相關(guān),因而各個被解釋變量之間也是不相關(guān)的。在正態(tài)分布的假定下,不相關(guān)等價于獨立。違背這個假定,就

9、稱為誤差項自相關(guān)。(3)與自變量相互獨立。解釋變量是非隨機(jī)的,換句話說,在重復(fù)抽樣下,的取值是確定不變的。1.2.2 回歸參數(shù)的估計 回歸分析的任務(wù)就是恰當(dāng)?shù)姆椒ü烙嫵鰠?shù),并且使估計出來的參數(shù)有良好的統(tǒng)計特性。如果有個不全相等的, , 做獨立試驗,可以得對樣本數(shù)據(jù), , 。通過這些數(shù)據(jù)即可得到回歸函數(shù)的估計,即 (12)其中和分別作為和的估計值,就是稱為關(guān)于的一元線性回歸方程,其圖形是回歸直線。1.2.2.1和參數(shù)的點估計和的估計值和可以通過最小二乘法計算得到。如果回歸函數(shù)為,可以假設(shè)一元線性回歸方程為。假定對樣本數(shù)據(jù), ,為已知,現(xiàn)在需要確定通過這些點的哪一條直線描述與最好。根據(jù)最小二乘法

10、建立回歸直線的原則就是:使得估計值與的離差平方和最小。因此設(shè) (13)將代入公式(13)中,有 (14)根據(jù)微分學(xué)中求極值的原理,對公式(14)中的和分別求一階偏導(dǎo)數(shù),并令一階偏導(dǎo)數(shù)為零,即有經(jīng)整理,可得到兩個二元一次方程解上述方程組,即可求出的和的值:,所求和即為和的點估計值,將和的值代入(12)中,可得到一元線性回歸方程:.1.2.3 相關(guān)系數(shù)的檢驗1.2.3.1 離差平方和之間的關(guān)系與是否具有相關(guān)關(guān)系,可以通過值是否隨值得變動來解釋。當(dāng)給定時,的實際值與的差值就是值隨值的全部變化,稱之為總變差,用表示。在這全部變差中,一部分變差可以用設(shè)定的回歸方程來解釋,即的部分,我們稱之為回歸變差。另

11、一部分變差是設(shè)定的回歸方程所不能解釋的,稱為剩余變差,用表示。對于任意給定的總有成立。因此,可以利用變差之間的數(shù)量關(guān)系確定變量之間的聯(lián)系程度。如果在總變差中,回歸變差所占的比例越大,則說明值隨值的變化越顯著,或者說解釋的能力越強(qiáng)。反之,回歸變差在總變差中所占的比例越小,則說明值隨值的變化越不顯著,或者說解釋的能力很差。 對于所有的數(shù)據(jù)點,因為,所以可以證明: (15)其中稱為總離差平方和,稱為剩余平方和,稱為回歸平方和。1.2.3.2 決定系數(shù)與相關(guān)系數(shù) 根據(jù)公式(15)離差平方和之間的關(guān)系,利用回歸平方和與總離差平方和的比值來說明與的相關(guān)性,即有稱為決定系數(shù),也稱為可決定系數(shù)。其含義是:在全

12、部變差中研究者所設(shè)定的回歸方程能夠解釋的部分所占的比例。因此從理論上說,的取值應(yīng)在之間,其值越接近于,說明相關(guān)程度越高。特別的,在研究一元線性關(guān)系時,為簡化起見,將開方,用表示,即,稱為相關(guān)系數(shù),在實踐中經(jīng)常使用簡化的形式,即相關(guān)系數(shù)的取值圍是. 當(dāng)時,表示與是正相關(guān)關(guān)系,即當(dāng)增加(減少)時,也隨之增加(減少)。當(dāng)時,表示與是負(fù)相關(guān)關(guān)系,即當(dāng)增加(減少)時,卻隨之減少(增加)。通過的數(shù)值,一方面可以判斷與的相關(guān)性,另一方面可以說明線性相關(guān)的程度。1.2.4的估計,的方差都含有隨機(jī)擾動項的方差,而總體隨機(jī)擾動項的實際上是未知的,因此實際上無法計算和真實值的方差,這就需要對進(jìn)行估計。我們定義 (1

13、6) 它是關(guān)于的無偏估計量。第2章 模型建立2.1 線性回歸過程 將數(shù)據(jù)導(dǎo)入SPSS窗口,定義變量名:(車輪下不墊鋼板測得的彎沉值)、(車輪下墊鋼板測得的彎沉值);畫圖,執(zhí)行GraphsScatter / DotSimple Scatter 命令,以為軸,以為軸,畫散點圖,如圖所示 圖21從圖可以看出隨變化而變化,說明與之間呈現(xiàn)線性關(guān)系。 執(zhí)行AnalyzeRegressionLinearLinear Regression將(車輪下不墊鋼板)移入Independent(s)(自變量)框中,把移入Dependent(因變量)框中Continue;StatisticsRegression Coef

14、ficientsEstimates、Model fitDurbin-Watson、Casewise diagnostics、Outliers outside,并在后面的方框中改為2,即大于兩個標(biāo)準(zhǔn)差單位的觀測值就認(rèn)為是異常值。 Plots將ZPRED(標(biāo)準(zhǔn)化預(yù)測值)選入框中,把ZRESID(標(biāo)準(zhǔn)化殘差)移入框中Normal probability plot、Histogram,以便檢驗殘差的正態(tài)性和方差齊性。 SaveUnstandardized(未經(jīng)標(biāo)準(zhǔn)化預(yù)測值)、Standardized、StudentizedMean、IndividualContinue。 單擊Option按鈕,采用系統(tǒng)

15、默認(rèn)設(shè)置。 最后單擊OK,輸出結(jié)果與分析如下: 自變量進(jìn)入或剔除情況表表,如表所示表21表中的模型中只有一個自變量。模型擬合的總體情況表,如表所示。表22由表知復(fù)相關(guān)系數(shù),與的相關(guān)為;確定系數(shù),說明模型的擬合優(yōu)度非常高;經(jīng)過校正的系數(shù)為,也說明模型的擬合優(yōu)度非常高;誤差的獨立性檢驗檢驗的值為,查檢驗表知,可以說明殘差與自變量之間相互獨立?;貧w方程檢驗的方差分析表,如表所示表23表中列出了回歸項和殘差項的平方和、自由度和均方,還列出了值以與值。從表中可以看出,回歸方程是顯著的,,,說明(車輪下墊鋼板測得的彎沉值)受(車輪下不墊鋼板測得的彎沉值)的顯著影響;剩余平方和(殘差平方和)為?;貧w系數(shù)估計

16、與其檢驗表,如表所示。表24表中顯示回歸模型中的回歸系數(shù)是:Constant(常數(shù)項,即回歸直線截距)為,自變量系數(shù)為,由此可知該分析的非標(biāo)準(zhǔn)化回歸方程可以寫為: ,標(biāo)準(zhǔn)化回歸方程為:。從表中也可看出回歸系數(shù)的顯著性水平為,表明統(tǒng)計量檢驗假設(shè)“回歸系數(shù)等于的概率為遠(yuǎn)小于”,同樣說明了量變量之間的線性相關(guān)關(guān)系極為顯著,建立的回歸方程是有效的。異常值診斷表,如表所示表25在此如果標(biāo)準(zhǔn)化殘差的絕對值超過,就稱為異常值。表中依次列出了所有異常值的編號、標(biāo)準(zhǔn)化殘差大小、因變量取值、因變量的預(yù)測值以與殘差,從表可以看出所用的數(shù)據(jù)異常值不是很多,只有4個。殘差統(tǒng)計量表,如表所示表26表中列出了預(yù)測值、標(biāo)準(zhǔn)預(yù)

17、測值、預(yù)測值標(biāo)準(zhǔn)誤差、經(jīng)調(diào)整的預(yù)測值、非標(biāo)準(zhǔn)化殘差、標(biāo)準(zhǔn)化殘差、學(xué)生化殘差、標(biāo)準(zhǔn)化學(xué)生殘差、剔除殘差、標(biāo)準(zhǔn)化剔除殘差、馬氏距離、庫克距離以與中心杠桿值。橫行依次列出上述各值的最小值、最大值、均值、標(biāo)準(zhǔn)差以與參與計算得觀測量數(shù)目。 圖描繪了殘差的正態(tài)分布。從圖中可以看出,代表殘差值的點分布在對角線兩旁,可以判定殘差是近似服從正態(tài)分布的,從而證明樣本是近似來自正態(tài)分布的總體。圖描繪了標(biāo)準(zhǔn)化殘差的直方圖,從圖中可知標(biāo)準(zhǔn)化殘差的均值為,方差為,約等于,因此近似服從標(biāo)準(zhǔn)正態(tài)分布。圖描繪了標(biāo)準(zhǔn)化預(yù)測變量與標(biāo)準(zhǔn)化殘差的散點圖,圖中各點隨機(jī)分布在一條穿過零點的水平直線的兩側(cè),說明殘差的分布是常數(shù),從而說明殘差

18、方差齊性。圖 22圖23圖242.2 蒙特卡羅實驗 下面看用正態(tài)數(shù)據(jù)生成模型的樣本,看系數(shù)變化大小,變化大說明原始數(shù)據(jù)不滿足正態(tài)性假定。 蒙特卡羅實驗:給定的值,從的正態(tài)分布中抽取隨機(jī)數(shù),將這些隨機(jī)數(shù)和的值代入回歸模型(1)中,計算相應(yīng)的值,這是我們從回歸模型(1)中抽取的樣本,再與進(jìn)行最小二乘估計,產(chǎn)生新的樣本回歸模型,這一過程稱為蒙特卡羅實驗。在上述建立的一元線性回歸模型:下,由表知殘差平方和為,利用公式(16)可計算出隨機(jī)擾動項的方差的估計值為,標(biāo)準(zhǔn)差為。從標(biāo)準(zhǔn)正態(tài)分布中隨機(jī)抽取值,執(zhí)行TransformCompute命令,Compute Variable /Target Variabl

19、e(目標(biāo)變量)輸入變量名randomType & Label(類型或標(biāo)簽)中輸入“標(biāo)準(zhǔn)正態(tài)隨機(jī)數(shù)”,F(xiàn)unction groupRandom Numbers(隨機(jī)數(shù))Function and Special Variables(函數(shù)和特殊變量)Rv. Normal,將其移入Numeric Expression矩形框中,在兩個問號處分別輸入和,即產(chǎn)生的,點擊OK。 從而得到一組的隨機(jī)數(shù)據(jù),將新產(chǎn)生的隨機(jī)數(shù)代入已建立的模型,此過程在Eviews軟件中進(jìn)行,打開Eviews窗口,執(zhí)行FileNewWorkfile,在Workfile Range窗口下的Workfile frequency欄下

20、選擇Undated or irregular,在Start date矩形框中輸入,End date矩形框中輸入;然后在命令窗口輸入 得到系列、(即得到的新的樣本值)。 在一元線性回歸模型中,滿足假設(shè)的最小二乘估計量,具有無偏性和方差最小性,并且在隨機(jī)誤差項服從正態(tài)分布的假定下,估計量也服從正態(tài)分布?;诤蜕鲜霎a(chǎn)生的的樣本值,對樣本回歸模型進(jìn)行估計,記錄估計的系數(shù)和方差。重復(fù)上述過程次,就產(chǎn)生系數(shù)的個估計值,求這個估計值點的平均數(shù),如果估計值的均值近似等于總體回歸模型(原樣本回歸模型)的真實值,就可以反映估計量的無偏性。把算得的的值導(dǎo)入窗口,再與原來做最小二乘回歸,過程與第一次建立模型時一樣,得

21、到結(jié)果如表、所示,得到新的散點圖,如圖,回歸直線圖如圖。表28由表知,模型中只有一個自變量。表29由表知復(fù)相關(guān)系數(shù),與的相關(guān)為;確定系數(shù),說明模型的擬合優(yōu)度非常高;經(jīng)過校正的系數(shù)為,也說明模型的擬合優(yōu)度非常高;誤差的獨立性檢驗檢驗的值為,約等于,可以說明殘差與自變量之間相互獨立。表210從表中可以看出,回歸方程是顯著的,,,說明(產(chǎn)生的的新樣本)受(車輪下不墊鋼板測得的彎沉值)的顯著影響;剩余平方和(殘差平方和)為。表211表中顯示回歸模型中的回歸系數(shù)是:Constant(常數(shù)項)為,自變量系數(shù)為,由此可知該分析的非標(biāo)準(zhǔn)化回歸方程可以寫為: ,標(biāo)準(zhǔn)化回歸方程為:。從表中也可看出回歸系數(shù)的顯著性

22、水平為,表明統(tǒng)計量檢驗假設(shè)“回歸系數(shù)等于的概率為遠(yuǎn)小于”,說明建立的回歸方程是有效的。但對于常數(shù)項的影響較大,從-0.84變?yōu)?2.635 。表212由表知樣本異常值只有兩個。表213 圖24圖描繪了標(biāo)準(zhǔn)化預(yù)測因變量與標(biāo)準(zhǔn)化殘差的散點圖,圖中各點隨機(jī)分布在一條穿過零點的水平直線的兩側(cè),說明殘差的分布是常數(shù),即說明殘差方差齊性。 圖25在這里我們重復(fù)上述過程次,分別得到 和的個估計值,將其導(dǎo)入窗口,執(zhí)行,依次得到和估計值的頻率分布圖,如圖、所示。從圖、中可以看出和的均值分別為和近似等于真值和,從而通過蒙特卡羅模擬仿真的方法直觀地描繪了最小二乘估計量的無偏性。圖26圖272.3 結(jié)論 由上述分析過

23、程可知回歸系數(shù)的估計值變化不大,但常數(shù)估計值變化較大,因此可得出總體回歸系數(shù)有正態(tài)性,而總體常數(shù)項有偏正態(tài)性,正態(tài)性這項假定只能是近似的。2.4 模型評價此模型已比較好,也利用蒙特卡羅方法即做蒙特卡羅實驗(在這里重復(fù)100次)驗證估計系數(shù)的無偏性,驗證如所期待的那樣都說明用最小二乘估計出的系數(shù)估計量是無偏的,也就是最優(yōu)的。但模型中常數(shù)項變化較大,只能說明正態(tài)性這項假定只能是近似的。在使用做蒙特卡羅過程中,由于重復(fù)的次數(shù)較多,如果能設(shè)計一個程序的話就不用那么麻煩;還有雖然從估計值的頻率分布直方圖中可以看出和估計值的均值與真實值很相近,但從圖中也可看出有些區(qū)間數(shù)的頻率大很多。參考文獻(xiàn)1 徐鐘濟(jì).

24、蒙特卡羅方法 M . :科學(xué)技術(shù),1985:5-7,11-12.2 朱洪文,宋力. 應(yīng)用統(tǒng)計 M . :高等教育,2004:203-205,217.3 王少平,繼生,歐陽志剛.計量經(jīng)濟(jì)學(xué) M . :高等教育,2011:15-27.4 郝犁仁,樊元,郝哲歐.實用統(tǒng)計分析 M . :中國水利水電,2002:206-216.5 易丹輝. 數(shù)據(jù)分析與應(yīng)用 M . :中國統(tǒng)計,2002:1-50.6 茆詩松,王靜龍,濮曉龍.高等數(shù)理統(tǒng)計 M . :高等教育,德國:施普林格,1998:400-426.7 軍. 科學(xué)策略中的蒙特卡羅策略 M . 8 朔,友,宏秋. 利用一元線性回歸的方法計算彎沉檢測車輛修正系數(shù) J . 交通科技,2007,110(4):65-67.附錄 汽車彎沉值數(shù)據(jù)表序列xy111011721001063114121410010951301386170181714815781321409160170101821931116017012130142131481631414014915112119161461551716217218180191191121252020021221152161221341422314015024180196251101172616017527160182281301382911011730130145311

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論