第八章_回歸分析_第1頁
第八章_回歸分析_第2頁
第八章_回歸分析_第3頁
第八章_回歸分析_第4頁
第八章_回歸分析_第5頁
已閱讀5頁,還剩39頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、第八章_回歸分析 8.1 回歸分析基礎(chǔ) 8.2 用Excel進行回歸分析處理 8.3 上機實驗八 用Excel進行回歸分析 回歸和相關(guān)已成為統(tǒng)計學(xué)中最基本的概念之一,其分析方法已是最標準、最常用的統(tǒng)計工具之一。從狹義上看,相關(guān)分析的任務(wù)主要是評判現(xiàn)象之間的相關(guān)程度高低以及相關(guān)的方向,而回歸分析則是在相關(guān)分析的基礎(chǔ)上進一步借用數(shù)學(xué)方程將那種顯著存在的相關(guān)關(guān)系表示出來,從而使這種被揭示出的關(guān)系具體化并可運用于實踐中去。從廣義的角度去理解相關(guān)和回歸,此時回歸分析就包含著相關(guān)分析。 【實例描述實例描述】 1887年生物統(tǒng)計學(xué)家高爾頓在研究豌豆和人體的身高遺傳規(guī)律時,首先提出“回歸”的思想 。1888年

2、他又引入“相關(guān)”(Correlation)的概念。原來,他在研究人類身高的遺傳時發(fā)現(xiàn),不管祖先的身高是高還是低,成年后代的身高總有向一般人口的平均身高回歸的傾向。 8.1 回歸分析基礎(chǔ)回歸分析基礎(chǔ) 8.1.1 一元線性回歸 8.1.2 多元線性回歸 8.1.3 逐步回歸 8.1.1 一元線性回歸 回歸分析最簡單的情形是一個自變量和一個因變量,且它們有線性關(guān)系,這叫一元線性回歸,即模型為YABX,這里X是自變量,Y是因變量,是隨機誤差,通常假定隨機誤差的均值為0,方差為2(20),2與X的值無關(guān)。 A和B為未知待估的總體參數(shù),又稱其為回歸系數(shù)。 8.1.1 一元線性回歸 如何根據(jù)樣本資料去估計就

3、成為回歸分析的基本任務(wù)。由此可以假設(shè)樣本的回歸方程如下: bxaY、上式中, 、和分別為Y、A和B的估計值Y222)()()(xxnyxxynxxyyxxbnxbnyxbya8.1.1 一元線性回歸 例例8-1:為研究某類企業(yè)的生產(chǎn)量和單位成本之間的關(guān)系,現(xiàn)隨機抽取10個企業(yè),得如下數(shù)據(jù)(見表8-1): 根據(jù)該資料,經(jīng)計算可得表8-2: 8.1.1 一元線性回歸由上表資料,可得: 2221024225446710336542.25()n xyx ybn xx 58.8546754( 2.25)1010yxabnn 這樣就可以得到生產(chǎn)量(x)和單位成本(y)之間的樣本回歸方程 58.85-2.2

4、5Yabxx8.1.2 多元線性回歸 總體的多元線性回歸方程為 1122kkYAB XB XB X總體回歸方程一般未知,需要通過樣本去估計。設(shè)估計方程為 1122kk +b x +b x +b xYa上式中,、b1、b2、bk稱為回歸系數(shù),其中,bi(i=1,2,,k)又稱為偏回歸系數(shù),它表示當其它自變量均為零時,xi每變化一個單位對因變量影響的數(shù)值。 8.1.2 多元線性回歸 設(shè)樣本為(x1,x2,xk,y),利用最小二乘法可估計出回歸方程中的參數(shù),即要求221122kk()(b x +b x +b x )QyYya=最小值 當k=2可解得:22211222211222211112221)(

5、)()()()()()()(xxxxxxxxyyxxxxxxyyxxxxb22211222211112211222112)()()()()()()()(xxxxxxxxyyxxxxxxyyxxxxb121 12212xxyayb xb xbbnnn8.1.2 多元線性回歸 例例8-2:為研究某商品的需求量、價格、消費者收入三者之間的關(guān)系,經(jīng)調(diào)查得如表8-3所示資料: 根據(jù)上表資料,可得如表8-4的回歸計算表: 8.1.2 多元線性回歸據(jù)表中數(shù)據(jù),如果設(shè)需求量(y)與收入(x1)及價格(x2)之間的回歸方程為: 8.1.2 多元線性回歸8.1.3 逐步回歸 逐步回歸分析的主要計算步驟如下: (1

6、)確定F檢驗值 (2)逐步計算 如果已計算t步(包含t0), 且回歸方程中已引入l個變量, 則第t+1步的計算為: 計算全部自變量的貢獻V(偏回歸平方和)。 在已引入的自變量中, 檢查是否有需要剔除的不顯著變量。 在已引入的變量中選取具有最小V值的一個并計算其F值, 如果FF2,則不需要剔除變量, 這時則考慮從未引入的變量中選出具有最大V值的一個并計算F值, 如果FF1, 則表示該變量顯著, 應(yīng)將其引人回歸方程, 計算轉(zhuǎn)至。 如果F = F1, 表示已無變量可選入方程, 則逐步計算階段結(jié)束, 計算轉(zhuǎn)人(3) 剔除或引人一個變量后, 相關(guān)系數(shù)矩陣進行消去變換, 第t+1步計算結(jié)束。其后重復(fù)計算。

7、 (3)其他計算, 主要是回歸方程入選變量的系數(shù)、復(fù)相關(guān)系數(shù)及殘差等統(tǒng)計量的計算 8.2 用用EXCEL進行回歸分析處理進行回歸分析處理 8.2.1相關(guān)函數(shù) 8.2.2 Excel回歸分析工具 8.2.1相關(guān)函數(shù) 1線性回歸函數(shù)LINEST 功能 :運算結(jié)果返回一線性回歸方程的參數(shù),即當已知一組混合成本為Y因變量序列值、N組Xi有關(guān)自變量因素的數(shù)量序列值時,函數(shù)返回回歸方程的系數(shù)mi(i=1,2n單位變動成本)和常數(shù)b(固定成本或費用)。 多元回歸方程模型則為:y=m1x1m2x2mnxnb。 8.2.1相關(guān)函數(shù) 語法:LINEST (known_ys, known_xs, const, st

8、ats)。其中Known_ys 是關(guān)系表達式 y = mx + b 中已知的 y 值集合;Known_xs是關(guān)系表達式 y = mx + b 中已知的可選 x 值集合;Const 為一邏輯值,用于指定是否將常量 b 強制設(shè)為 0;Stats為一邏輯值,指定是否返回附加回歸統(tǒng)計值。 8.2.1相關(guān)函數(shù) 附加回歸統(tǒng)計值如下: 8.2.1相關(guān)函數(shù) 例例8-3:計算柯布-道格拉斯生產(chǎn)函數(shù)(Cobb-Douglas ):lnQ = lnA + a lnL + b lnK,式中Q為產(chǎn)出,L和K分別表示勞動和資本投入量,A表示平均生產(chǎn)技術(shù)水平, a和b分別是Q相對于L和K的彈性。使用下表的統(tǒng)計數(shù)據(jù),求線性回

9、歸參數(shù)A, a, b。 8.2.1相關(guān)函數(shù)8.2.1相關(guān)函數(shù) (1)建立“線性回歸”工作表,如圖8-1所示。 圖8-1 “線性回歸”工作表8.2.1相關(guān)函數(shù) (2)在單元格E1中輸入“l(fā)n(Q)”,在單元格F1中輸入“l(fā)n(L)” ,在單元格G1中輸入“l(fā)n(K)”。 (3)選中單元格E2,輸入公式“=LN(B2)”,復(fù)制公式到單元區(qū)域E3:E19;選中單元格F2,輸入公式“=LN(C2)”,復(fù)制公式到單元區(qū)域F3:F19;選中單元格G2,輸入公式“=LN(D2)”,復(fù)制公式到單元區(qū)域G3:G19。 (4)將E2:E19定義為因變量,將F2:G19定義為自變量,選中單元格A20,在單元格中輸入

10、“回歸分析”。 (5)選中單元區(qū)域A21:C25,插入統(tǒng)計函數(shù)“LINEST”,在函數(shù)參數(shù)Known_ys中輸入“E2:E19”,在參數(shù)Knowm_xs中輸入“F2:G19”,在參數(shù)Const中輸入值“TRUE”,在參數(shù)Stats中輸入值“TRUE”。如圖8-2所示。 8.2.1相關(guān)函數(shù) 圖8-2 函數(shù)LINEST參數(shù)對話框8.2.1相關(guān)函數(shù) (4)按Ctrl + Shift + Enter將返回值以數(shù)組形式顯示,輸出結(jié)果如圖8-3所示。 圖8-3 回歸分析輸出結(jié)果8.2.1相關(guān)函數(shù) 由回歸計算得線性回歸參數(shù)LnA=-6.2119,a=2.437547,b=0.8577589,保留四位小數(shù)得柯

11、布-道格拉斯生產(chǎn)函數(shù)lnQ= -16.2119+2.4375lnL+0.8578lnK。8.2.1相關(guān)函數(shù) 2索引取值函數(shù)index 如果只想要返回值中的指定項,則可以用索引取值index函數(shù)。 語法格式:INDEX(單元格區(qū)域或數(shù)組常量,行序號,列序號);功能:使用索引從單元格區(qū)域或數(shù)組中選取值??捎迷摵瘮?shù)在LINEST函數(shù)返回系數(shù)序列數(shù)組表中根據(jù)所需數(shù)據(jù)所處的行列位置定位選取。8.2.1相關(guān)函數(shù) 3四舍五入函數(shù)ROUND 語法格式:ROUND(數(shù)字,小數(shù)位數(shù));功能:將數(shù)字四舍五入到指定的小數(shù)位數(shù)。由于LINEST函數(shù)的返回值為6位小數(shù),用此函數(shù)指定保留的小數(shù)位數(shù)。 例如在需要的位置輸入“

12、=ROUND(INDEX(LINEST(Y,X,TRUE,TRUE),1,4),2)”,則表示取linest函數(shù)返回的數(shù)組的第1行第4列的數(shù)據(jù),并保留2位小數(shù)。 8.2.2 Excel回歸分析工具 例例8-4:某溶液濃度正比對應(yīng)于色譜儀器中的峰面積,現(xiàn)欲建立不同濃度下對應(yīng)峰面積的標準曲線以供測試未知樣品的實際濃度。已知8組對應(yīng)數(shù)據(jù)如下所示,建立標準曲線,并且對此曲線進行評價,給出分析數(shù)據(jù)。=0.018.2.2 Excel回歸分析工具 (1)建立“溶液濃度”工作表,如圖8-4所示。 圖8-4 “溶液濃度”工作表8.2.2 Excel回歸分析工具 (2)選擇成對的數(shù)據(jù)列,將它們使用“X、Y散點圖”

13、制成散點圖,如圖8-5所示。 圖8-5 X、Y散點圖8.2.2 Excel回歸分析工具 (3)選中數(shù)據(jù)點,單擊右鍵,選擇“添加趨勢線”-“線性”,并在選項標簽中要求給出公式和相關(guān)系數(shù)等,可以得到擬合的直線。如圖8-68-8所示。 圖8-6 “添加趨勢線”-“線性”對話框 圖8-7 “添加趨勢線”選項8.2.2 Excel回歸分析工具 圖8-8 趨勢線及其公式由圖中可知,擬合的直線是y=1639.5x-200.89,R2的值為0.9961。 8.2.2 Excel回歸分析工具 為了進一步使用更多的指標來描述這一個模型,可以使用數(shù)據(jù)分析中的“回歸”工具來詳細分析這組數(shù)據(jù)。 (1)打開“溶液濃度”工

14、作表,在“工具”菜單中選擇“數(shù)據(jù)分析”命令,選擇“回歸”分析工具。 (2)單擊確定按鈕,打開“回歸”分析工具對話框。在輸入選項Y值輸入?yún)^(qū)域中輸入$B$1:$B$9,X值輸入?yún)^(qū)域中輸入$A$1:$A$9,選中“標志”、“常數(shù)為零”選項;在輸出選項中選擇輸出區(qū)域,本例中不妨選擇輸出區(qū)域為$D$1;選擇“殘差”、“正態(tài)分布”選項,如圖8-9所示。8.2.2 Excel回歸分析工具 圖8-9 “回歸”分析工具對話框8.2.2 Excel回歸分析工具 (3)單擊“確定”按鈕?!盎貧w”工具為我們提供了三張圖,分別是殘差圖、線性擬合圖和正態(tài)概率圖,輸出結(jié)果如圖8-10所示。 圖8-10 “回歸”分析工具輸出

15、結(jié)果8.2.2 Excel回歸分析工具 Excel回歸分析工具的輸出結(jié)果包括3個部分: 1回歸統(tǒng)計表 回歸統(tǒng)計表包括以下幾部分內(nèi)容: (1)Multiple R:是R2的平方根,又稱為相關(guān)系數(shù),用來衡量變量x和y之間相關(guān)程度的大小。上例中R為0.999076,表示二者之間的關(guān)系是高度正相關(guān)的。 (2)R Square:用來說明自變量解釋因變量變差的程度,以測定因變量y的擬合效果。 8.2.2 Excel回歸分析工具 (3)Adjusted R Square:僅用于多元回歸才有意義,它用于衡量加入獨立變量后模型的擬合程度。當有新的獨立變量加入后,即使這一變量同因變量之間不相關(guān),未經(jīng)修正的R2也要

16、增大,修正的R2僅用于比較含有同一個因變量的各種模型。 (4)標準誤差:用來衡量擬合程度的大小,也用于計算與回歸相關(guān)的其他統(tǒng)計量,值越小說明擬合程度越好。 (5)觀測值:用于估計回歸方程的數(shù)據(jù)的觀測值個數(shù)。8.2.2 Excel回歸分析工具 2方差分析表 方差分析表的主要作用是通過F檢驗來判斷回歸模型的回歸效果。 3回歸參數(shù)表 回歸參數(shù)表主要用于回歸方程的描述和回歸參數(shù)的推斷。 如圖8-10所示的回歸參數(shù)表中第16行和第17行分別是截距和諧率的各項指標,第二列是具體的值,據(jù)此可以寫出回歸方程。第三列是各個回歸系數(shù)的P值,最后是置信區(qū)間的上下限。 從計算結(jié)果中可得到回歸方程:y=1627.15x

17、。 8.3 上機實驗八 用Excel進行回歸分析 一、實驗?zāi)康募耙?1了解回歸分析與相關(guān)分析的不同點,了解回歸分析的基本方法。 2能用Excel相關(guān)函數(shù)求回歸方程。 3會用Excel回歸分析工具對數(shù)據(jù)進行回歸分析,理解回歸分析的輸出結(jié)果,并能根據(jù)回歸分析工具的輸出結(jié)果正確寫出回歸方程。8.3 上機實驗八 用Excel進行回歸分析 二、實驗內(nèi)容 (一)確定企業(yè)年設(shè)備能力與年勞動生產(chǎn)率的關(guān)系 某市電子工業(yè)公司有14個所屬企業(yè),各企業(yè)的年設(shè)備能力與年勞動生產(chǎn)率統(tǒng)計數(shù)據(jù)如下表。試分析企業(yè)年設(shè)備能力與年勞動生產(chǎn)率的關(guān)系。若該公司計劃新建一個設(shè)備能力為9.2千瓦/人的企業(yè),估計勞動生產(chǎn)率將為多少?8.3 上機實驗八 用Excel進行回歸分析 (二)測定某礦脈的金屬含量 一礦脈有13個相鄰樣本點,人為地設(shè)定一個原點,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論