




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、咸陽師范學院2013屆本科畢業(yè)論文摘 要 回歸分析和方差分析是探究和處理相關關系的兩個重要的分支,其中回歸分析方法是預測方面最常用的數學方法,它是利用統(tǒng)計數據來確定變量之間的關系,并且依據這種關系來預測未來的發(fā)展趨勢。本文主要介紹了一元線性回歸分析方法和多元線性回歸分析方法的一般思想方法和一般步驟,并且用它們來研究和分析我們在生活中常遇到的一些難以用函數形式確定的變量之間的關系。在解決的過程中,建立回歸方程,再通過該回歸方程進行預測。關鍵詞:多元線性回歸分析;參數估計;檢驗Abstract Regression analysis and analysis of variance is the
2、inquiry and processing of the correlation between two important branches, wherein the regression analysis method is the most commonly used mathematical prediction method, it is the use of statistical data to determine the relationship between the variables, and based on this relationship predict fut
3、ure trends. introduces a linear regression analysis and multiple linear regression analysis method general way of thinking and the general steps, and use them to research and analysis that we encounter in our life, are difficult to determine as a function relationship between the variables in the so
4、lving process, the regression equation is established by the regression equation to predict.Keywords: Multiple linear regression analysis; parameter estimation;inspection 目 錄摘 要IAbstractII目 錄III引言11 回歸分析的背景來源及其概念11.1 回歸分析的背景11.2 回歸分析的基本概念12 線性回歸分析模型22.1 一元線性回歸的模型22.1.1 回歸參數和的估計32.1.2 一元線性回歸方程的顯著性檢驗3
5、2.2 多元線性回歸分析的模型42.2.1 回歸參數和的估計52.2.2 多元線性回歸分析方程的顯著性檢驗53 實例應用53.1 問題提出53.2 建立模型63.3 關于家庭收入與家庭食品支出的應用63.4 多元線性回歸分析在我國民航客運量與其影響因素中的應用8小結12參考文獻13謝辭1413 引言回歸分析是研究生活中多個相關變量變化的一種最常見的數學方法,運用它來解決實際問題,不僅可以使問題簡單化 ,還可以對未來的數據進行預測。本文主要將回歸分析應用于研究家庭食品支出和家庭收入以及我國民航客運量和國民收入、消費額、鐵路客運量、民航航線里程、來華入境人數之間的關系。 1 回歸分析的背景來源及其
6、概念 1.1 回歸分析的背景 “回歸”這一概念是在19世紀80年代由英國的統(tǒng)計學家弗朗西斯·高爾頓在研究父代身高和子代身高之間的關系時提出來的。他發(fā)現不管父代身高是高或是矮,子代的身高都有回歸父輩平均身高的趨勢,他把這種現象稱作回歸?,F如今,回歸分析已經成為社會科學定量分析研究中最基本、應用最為廣泛的一種數據處理方法。它不但可以給出描述自變量和因變量之間相關關系的函數表達式,還可以用來預測因變量的取值。在現實生活中,影響某一現象的因素常常是多方面的。社會科學的研究不可能像自然科學研究那樣運用實驗的方法來進行解決,人們?yōu)榱伺搴徒忉屖挛镏g變化的真實原因和規(guī)律,就必須借助一些經驗數據并
7、進行整理分析。而回歸分析的最大優(yōu)點恰恰就在于它可以通過統(tǒng)計方法來對干擾因素加以控制,從而幫助我們來發(fā)現自變量與因變量之間的關系。1.2 回歸分析的基本概念一切運動著的事物都是相互聯系、相互制約的,從而,描述事物和事物運動的變量之間也是相互聯系、相互制約的。變量之間的關系總體可以分為兩類:一類叫做確定關系,即函數關系,它的特征是:一個變量隨其他變量的確定而確定。例如球的體積和半徑之間的關系;另一類關系叫做相關關系,這類關系的特征是:變量之間的關系很難用一種精確的方法表示出來。例如農業(yè)上的施肥量和畝產量之間有一定的關系,但是由施肥量不能精確地算出畝產量,由畝產量也不能精確地計算出施肥量。而回歸分析
8、就是用來處理和描述這種相關關系的。那么,什么是回歸分析呢?我們大家都知道,數學分析和高等數學是研究連續(xù)變量之間的關系,泛函分析是研究函數集之間的關系,而回歸分析則是研究隨機變量之間的相關關系的一種數學方法。它是最常用的數理統(tǒng)計方法,能解決決策、控制、生產工藝優(yōu)化等問題。目前,回歸分析在工農業(yè)生產及科學研究中有著極其廣泛的作用,同時也在實驗數據的處理、經驗公式的推導、產品的統(tǒng)計質量管理、市場的預測、氣象預報和醫(yī)學衛(wèi)生等許多領域都常常會運用回歸分析。回歸分析主要研究的內容是:(1)從一組數據出發(fā),確定這些變量(參數)之間的定量關系,所得到的表達式稱為回歸方程;(2)對求得的回歸方程的可信度進行檢驗
9、;(3)在有關的許多變量中,判斷變量的顯著性,即哪些是顯著的,哪一些是不顯著的,顯著地保留,不顯著的忽略;(4)利用所求得的回歸方程進行預測和控制?;貧w分析中,當研究的因果關系只涉及因變量和一個自變量時,叫做一元回歸分析;當研究的因果關系涉及因變量和多個自變量時,叫做多元回歸分析。另外,依據描述自變量和因變量之間的函數關系是線性的還是非線性的,把回歸分析又分為線性回歸分析和非線性回歸分析。本文主要研究線性回歸分析。2 線性回歸分析模型線性回歸分析是回歸分析中較為簡單的一類,并且它在現實生活中的應用及其泛。線性回歸分析則是研究和處理變量之間的線性相關關系的數學方法。根據所研究自變量的多少,可以將
10、線性回歸分析分為一元線性回歸分析和多元線性回歸分析。2.1 一元線性回歸的模型一元線性回歸模型又稱簡單直線回歸模型,它是根據成對的兩種變量的數據,配合直線方程式,根據自變量的變動,來推算因變量發(fā)展趨勢和水平的方法。它是研究相關的兩種數量變動與存在關系的一種方法。一元線性回歸模型的一般形式: (1) 上式中,表示隨的變化而線性變化的部分,是隨機誤差,是其它一切不確定因素影響的總和,它的值是不可測的,通常假定服從,稱函數為一元線性回歸函數。為回歸常數,為回歸系數,他們統(tǒng)稱為回歸參數。其中稱為回歸自變量或回歸因子;稱為回歸因變量或響應變量。 若,是的一組觀測值,那么一元線性回歸模型可表示為: 上式中
11、, , , 2.1.1 回歸參數和的估計 用最小二乘法估計的值,即取它們的一組估計值,使其隨機誤差的平方和達到最小,即使與的最佳擬合。若記則顯然有并且關于可微,則由多元函數存在極值的必要條件得 則稱為的最小二乘估計,其中 , 于是可得到經驗回歸方程 。 其中有 , 則是的無偏估計。2.1.2 一元線性回歸方程的顯著性檢驗 根據回歸方程求出估計值以后,現在的問題是:與之間是否確實存在這種線性關系呢?也就是說是否為,這就需要對回歸方程作顯著性檢驗。顯著性檢驗法有檢驗法、檢驗法和檢驗法,而檢驗法是最常用、最基本的檢驗方法。只要判斷出與的大小即可,當時,則說明的假設不成立,即模型中的一次項是必要的。換
12、而言之,模型對水平而言是顯著的,反之就是不顯著的。經過檢驗,當回歸方程有意義時,便可用它來進行預測。當給定時求出預測值即可。2.2 多元線性回歸分析的模型線性回歸模型適合于分析一個因變量和多個自變量之間的相關關系?,F假設一個回歸模型中有個自變量,即有, 則該回歸模型可以表示為: (2)其中服從,并且獨立同部分布。上式中,表示個體在因變量中的取值,為截距的總體參數,為斜率的總體參數。由于該回歸模型中包含多個自變量,因此將(2)式稱為多元線性回歸模型。 如果我們定義一下的矩陣: 此時,我們可以采用矩陣的表達形式,將一般的多元線性回歸模型表示為: (3)上面的式子也常常簡記為:。這里,表示因變量的向
13、量,表示總體參數的向量,表示由所有自變量和一列常數1所組成的矩陣, 則表示隨機誤差變量的向量。2.2.1 回歸參數和的估計類似于一元線性回歸分析的參數估計,求多元線性回歸分析的回歸系數的估計值,就是求最小二乘函數達到最小的值。于是可求得的最小二乘估計 。從而可得經驗回歸方程 ,稱為殘差向量。通常有為的最小二乘估計。2.2.2 多元線性回歸分析方程的顯著性檢驗假設不全為0。當成立時,構造統(tǒng)計量服從,對于給定的顯著性水平(一般取值為0.01或0.05),檢驗的拒絕域為。當多元線性回歸方程經過檢驗是顯著的之后,并且其中每一個系數均顯著不為0時,便可以用此方程進行預測。即給定,將其代入回歸方程,可得到
14、:。3 實例應用3.1 問題提出食品是人們生活中不可缺少的。每個家庭都必須在食品支出上加以重視,然而,一個家庭的收入是該家庭食品支出的先決條件。也就是說,家庭收入影響著家庭食品支出。那么它們之間到底有什么關系呢?另外,在現實生活中,影響某一變量的因素不止一個,有時候從表面上看,諸多的因素好像都與某一因變量有著某種相關關系,其實不然。在這些因素中有的因素對該變量是顯著性的或起決定性作用,而有的因素則是不顯著的。要解決這類問題,我們就必須借助于多元線性回歸。例如:在我國民航客運量的研究中,影響民航客運量的因素是多方面的,其中包括國民收入、鐵路客運量、民航航線里程等。下面本文將分別解決以上的兩個問題
15、。3.2 建立模型 假設家庭收入為,家庭食品支出為,那么可以設這兩種變量之間的關系為:,其中為回歸參數,是隨機誤差,并且服從; 假設我國民航客運量為,國民收入、消費額、鐵路客運量、民航航線里程和來華旅游入境人數分別為,和。則設變量之間的關系為:,其中為回歸參數為不可測量的誤差變量。3.3 關于家庭收入與家庭食品支出的應用 為了研究家庭收入和該家庭食品支出之間的關系,隨機調查了10個家庭,所得數據如下:家庭收入和食品支出數據 單位:百元12345678910家庭收入20303240152613383540食品支出76812911410910首先設家庭收入為(單位:百元),家庭食品支出為(單位:百
16、元)根據題中所給出的數據,我們可以畫出散點圖,由圖我們可只看出,家庭收入與家庭食品支出之間存在線性關系。表3.1 樣本數據計算表序號 家庭收入 食品支出 1 20 7 400 49 1402 30 6 900 36 180 3 30 8 1024 64 2564 40 12 1600 144 4805 15 9 225 81 1356 26 11 676 121 2867 13 4 169 16 52 8 38 10 1444 100 3809 35 9 1225 81 31510 40 10 1600 100 400 289 84 9263 792 2624 通過以上計算可以得到家庭食品支出
17、對家庭收入的樣本回歸方程是: 該方程說明,當收入為零時,家庭的食品支出也必須有2.1056元。這部分的支出可看作是基本支出或固定支出水平;在一定的范圍內,收入每增加100元,食品支出就增加21.78元。用檢驗法進行顯著性檢驗,取顯著水平。因為 拒絕域為 ,而所以拒絕,也就是說家庭收入對家庭食品支出有著顯著的影響。取,即當家庭收入為4200元時,食品支出的預測值為:(百元)置信度為95%的預測區(qū)間為 通過計算可以得到,因此可得預測區(qū)間為:(4.3518,18.1546),即有95%的把握估計當家庭收入為4200元時,家庭食品支出額在435到1815.46元之間。3.4 多元線性回歸分析在我國民航
18、客運量與其影響因素中的應用為了研究我國民航客運量的變化趨勢及其成因,現以民航客運量作為因變量,以國民的收入、消費額、鐵路客運量、民航航線里程以及來華旅游入境人數作為影響國民航客運量的主要因素。根據2004年統(tǒng)計摘要可以獲得1988-2003年統(tǒng)計數據見下表4.2。 表4.2 民航統(tǒng)計數據表年份 /萬人 /億元 /億元 /萬人 / 萬km /萬人 1998 231 3010 1888 81491 14.89 180.921989 298 3350 2195 86389 16.00 420.391990 343 3688 2531 92204 19.53 570.251991 401 3941 2
19、799 95300 21.82 776.711992 445 4258 3054 99922 23.27 792.431993 391 4726 3358 106044 22.91 947.701994 554 5652 3905 11353 26.02 1285.221995 744 7020 4879 112110 27.72 1783.301996 997 7859 5552 108579 32.43 2281.951997 1310 9313 6386 112429 38.91 2690.231998 1442 11738 8038 122645 37.38 3169.481999 1
20、283 13176 9005 113807 47.19 2450.142000 1660 14384 9663 95712 50.68 2746.202001 2178 16557 10969 95081 55.91 3335.502002 2886 20223 12985 99693 83.66 3311.502003 3383 24882 15949 105458 96.08 4152.70運用回歸分析的方法分析上面的所給出的一系列數據,并且建立多元線性回歸模型并用MATLAB軟件進行解決。建立回歸分析模型,定義民航客運量為,國民收入、消費額、鐵路客運量、民航航線里程和來華旅游入境人數分別
21、為,和.設變量之間的關系為: 其中為不可測量的誤差變量。根據統(tǒng)計數據,利用MATLAB計算出回歸系數。具體如下:>231 298 343 401 445 391 554 744 997 1310 1442 1283 1660 2178 2886 3383 ;>3130 1888 81491 14.89 180.92;3350 2195 86389 16.00 420.39;3688 2531 92204 19.53 570.25;3941 2799 95300 21.82 776.71;4258 3054 99922 23.27 792.43;4736 3358 106044 22
22、.91 947.70;5652 3905 11353 26.02 1285.22;7020 4879 112110 27.72 1783.30;7859 5552 108579 32.43 2281.95;9313 6386 112429 37.38 3169.48;13176 9005 113807 47.19 2450.14;14384 9663 95712 50.68 2746.20;16557 10969 5081 55.91 3335.65;20223 12985 99693 83.66 3311.50;24882 15949 105458 96.08 4152.70;> ;&
23、gt;計算出: 回歸系數;因此所得的多元線性回歸方程為:;該方程中的,都有明確的含義。例如說:當0.5196時則表示國民收入每增加1億元,在其他條件不變的情況下,民航客運量就會增加0.5196萬人。運用檢驗法對回歸方程進行檢驗,經過計算可得,取顯著性水平,查分布表得,因為。故拒絕,表明線性回歸方程高度顯著,即就說明,整體上對有顯著的影響。對回歸系數進行顯著性檢驗,,代入公式,。計算得:給定,查分布表得,其中,均大于所查表的值,而,這樣的結果說明回歸系數中,,,對有顯著性影響,而對無顯著影響,這說明鐵路客運量對民航客運量無顯著影響。此時,該多元線性回歸模型中可以剔除鐵路客運量的影響,從而得到新的
24、線性回歸模型為:再經過檢驗可知,所有的回歸變量均對有顯著性影響,并且可以計算出復相關系數。因為復相關系數接近1,則可認為與之間相關關系顯著,說明擬合程度很高,故該模型的預測值和真實值之間很接近。經過調查,已知2010年的國民收入為30782億元,總的消費額為22351億元,民航航線里程為198463萬km,來華旅游入境人數是5268.46萬人。即有1 30782 22351 18463 5268.46; 因而可得2010年民航客運量的預測值為:萬人。即預計,2010年我國民航客運量可達到4585萬人。 然而,線性回歸分析主要解決實際問題中的具有相關關系的變量,在某一范圍之中,這種線性關系可以一
25、直維持著,但實際生活中的問題,并不總是如我們所想的那樣,它總會有一個極限。當某一變量達到上限的時候,就不會和其他的變量再次呈現線性關系了。此時,線性回歸分析的方法就不可用了。那么,當我們遇到這種問題時,就不得不采用控制的方法加以解決。對于我國民航客運量的問題中,在國民收入、消費額、鐵路客運量一定的前提條件下,當民航客運量時,來華旅游入境人數應控制的范圍由方程組 其中所確定,即分別解出,可以作為控制的上下限。小結在現實生活中,當我們遇到幾個變量之間的關系無法用函數形式確定的時候,我們便會盡可能多的去調查和搜集與此相關的一些數據,然后再利用回歸分析的方法去研究和分析這些數據之間的關系。本文首先介紹
26、了線性回歸分析的來源、闡述及其分類,另外,重點讓我們了解了一元線性回歸分析和多元線性回歸分析在數學建模中的一般步驟和一般思想。在運用回歸分析解決問題的過程中,最關鍵的是對其線性回歸方程中的參數進行估計。然而對于參數估計的方法,我們通常采用的是最小二乘法的原則,在必要的情況下,通常也借助于MATLAB軟件進行相應的計算,從而得到相應的線性回歸方程,并對方程和回歸系數進行顯著性檢驗,最后進行預測。 在本文中,主要研究了家庭收入與家庭食品支出之間的線性關系、我國民航客運量與國民收入等多個因素的線性關系,通過對它們所提到數據的分析和研究,并建立相應的數學模型,進而可以得出線性回歸方程,通過顯著性檢驗之后,并分別計算出家庭收入為4200元時家庭食品支出的預測和2010年我國民航客運量的預測。通過計算的這兩個實例分別體現了一元線性回歸分析和多元線性回歸分析在數學建模中的應用。在此過程中,我們可以明確地得到運用回歸分析解決實際問題的一般步驟:第一步,根據所給數據確定相關變量,第二步,假設線性回歸模型,第三步,對模型中的回歸參數進行估計,第四步,檢驗顯著性,第五步,依據回歸方程進行預測,最后,將建立的回歸模型應用于實際生活生產中。參考文獻【1】 薛毅主編. 數學建模基礎. 北京工業(yè)大學出版社 2005.1 【2】 楊虎 ,鐘波 , 劉
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- T-ZJWL 001-2024 大宗商品供應鏈金融動產質押監(jiān)管倉儲服務規(guī)范
- T-ZNZ 264.3-2024 重金屬中度污染農田土壤修復和安全利用技術規(guī)范 第3部分:超積累東南景天與芝麻輪作
- 二零二五年度服裝品牌廠家全國代理合作協(xié)議
- 2025年度電影院包場租賃及廣告合作合同
- 二零二五年度金融科技股權投資合同協(xié)議
- 二零二五年度工傷事故賠償調解協(xié)議(含傷殘評定)
- 二零二五年度全包裝修合同模板含定制家具制作
- 2025年度離職賠償協(xié)議書中的離職員工離職通知及手續(xù)辦理
- 二零二五年度聯防聯控疫情防控科研合作合同
- 2025年度線上虛擬購物體驗合同書
- 硬筆書法紙(打直接打印)
- 陳銀子礦山基建施工組織方案方案
- 襄陽房地產市場月報2024年08月
- 工業(yè)互聯網平臺的架構與功能
- 八年級英語下冊課件教學
- 人教版(2019) 必修第二冊 Unit 1 Cultural Heritage Discovering Useful Structures(教案)
- 陳獨秀生平事跡
- 2024年人教版初三數學(下冊)模擬試卷及答案(各版本)
- 《大學美育》高職全套教學課件
- 醫(yī)院CT機房裝飾改造工程施工組織設計
- 軟件工程自考02333重點難點匯集
評論
0/150
提交評論