版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、個人收集整理僅供參考學(xué)習(xí) / 8第一章多元相關(guān)與回歸分析第一節(jié)多元線性回歸模型多元線性回歸即多個自變量對一個因變量地線性回歸.一、多元線性回歸模型概念以兩個自變量地二元回歸為例,如X、X2和丫地關(guān)系存在關(guān)系式:E(Y)=a +B 1X1+B 2X2,則丫與Xi和X2之間存在多元線性相關(guān)關(guān)系,這一方程即多元線 性回歸模型.b5E2RGbCAP多元線性回歸是多維空間中地超平面,如二元回歸是三維空間中地一個平面 對于任意地(X 1, X 2),丫地期望值就是該平面上正對(Xi, X 2)地那個點地丫軸值, 其與實際觀測點之間存在隨機誤差,實際觀測點Y = a + B 1X+B 2X2+ i . pl
2、EanqFDPw二、模型地建立總體未知情況下,以樣本構(gòu)造出一個平面來估計總體真實平面,即以平面 ?= a+biXi+ b2X2去擬合原始觀測數(shù)據(jù).DXDiTa9E3d擬合地準(zhǔn)則是最小二乘法原理,使各觀測值距離擬合值地偏差平方和最小, 2即刀(yi- ?)最小.由此計算出地a,b 1, b2是對a , B 1, B 2地最佳估計.例如對施 肥量X、降雨量 茨和產(chǎn)量Y地數(shù)據(jù),SPSS俞出結(jié)果(表1): RTCrpUDGiTVariableBSE.BBetaTX13.810.5830.596.532X23.330.6170.495.4Con sta nt266.732.0778.313即得到?= 2
3、66.7+3.81X 1+3.33x2三、回歸系數(shù)地意義對于模型?= a+btX1+ b2X2,b1可以解釋為:當(dāng)X2不變地情況下,每變化一 個單位,Y將平均發(fā)生b1個單位地變化.5PCzVD7HxA如果所有自變量都同時變化,那么 Y= b1AX1+ b2 X2+.b i AX. 例題:如果對產(chǎn)量、施肥量、降雨量做出了簡單回歸和多元回歸模型:A模型:產(chǎn)量=287+5.9施肥量;B模型:產(chǎn)量=400+6.0降雨量;C模型:產(chǎn)量=267+3.81施肥量+3.33降雨量;請計算:(1)如果在每畝土地上多施10斤肥料,可以期望產(chǎn)量增加多少?如果在每畝土地上多灌溉5厘米地水,可以期望產(chǎn)量增加多少? 如果
4、同時在每畝土地上多施10斤肥料,并且多灌溉5厘米地水,可以期望 產(chǎn)量增加多少?由原始數(shù)據(jù)發(fā)現(xiàn)較高地施肥量和較高地降雨量是有聯(lián)系地,如果照這樣地趨勢下去,那么在每畝土地上多灌溉5厘米地水,可以期望產(chǎn)量增加多少?jLBHrnAlLg解:(1) Y=3.81(10)=38.1 斤. Y=3.33(5)=16.65 斤. Y=3.81(10)+ 3.33(5)= 38. 1+16.65=54.75 斤 Y=6.0(5)=30斤.采用B模型中地簡單回歸系數(shù)6.0,它表示當(dāng)施肥量也變化時,產(chǎn)量怎樣隨著降雨量地變化而變化.XHAQX74J0X比較題2和題4, 30斤地增產(chǎn)不只歸功于降雨量,也包含施肥量地影響
5、;而16.65斤地增產(chǎn)則是在施肥量不變地情況下,伴隨著降雨量地增加而產(chǎn)生地.LDAYtRyKfE 四、自變量為定類變量時回歸系數(shù)地解釋線形回歸要求自變量和因變量都是定距變量,但當(dāng)自變量為二項變量或定類變量時,可以將其轉(zhuǎn)化為0-1變量/虛擬變量后再進行回歸.Zzz6ZB2Ltk1、自變量為二項變量時:如研究存款額 丫(百元)和年齡X、性別X2之間 地關(guān)系,令男性=1,女性=0 (對照組).如果得到如下多元回歸方程:?=33+12x1-9.1x 2,則X2地回歸系數(shù)-9.1表示,對于同年齡地人來說,男性地存款額比女性平均減少910元.dvzfvkwMI12、自變量為定類變量時:如研究收入 丫(百元
6、)和文化程度X之間地關(guān)系, 假設(shè)文化程度包括小學(xué)、中學(xué)、大學(xué),可將文化程度轉(zhuǎn)化為兩個虛擬變量,D=I 1,大學(xué)I 0,其他D=0, D2=1rqyn14ZNXI, D=D=0代表小學(xué)程度(對照組),D=1, D=o示大學(xué)文化程度.假如得到回歸方程 ?=1,中學(xué).I 0,其他表示中學(xué)文化程度;33+12D+30D,D地回歸系數(shù)表示中學(xué)文化程度地人比小學(xué)文化程度地人收入平 均多1200元;D2地回歸系數(shù)表示大學(xué)文化程度地人比小學(xué)文化程度地人收入平 均多 3000 兀.EmxvxOtOco3、如果自變量為連續(xù)變量,但其與因變量地關(guān)系并不是線形關(guān)系,例如年 齡X和身高丫地關(guān)系,可以把年齡劃分成年齡段做
7、為定類變量.對于有個水平地定類變量,需要設(shè)計n-1個虛擬變量來描述.SixE2yXPq5第二節(jié)多元線性回歸模型檢驗一、回歸系數(shù)地估計和檢驗在多元回歸中,各 個回歸系數(shù)地估 計值b,b2都圍繞總體回 歸系數(shù) B 1, B 2近似正態(tài)波動,所以可以用樣本回歸系數(shù)地標(biāo)準(zhǔn)誤差來構(gòu)造總體回歸系 數(shù)地置信區(qū)間.標(biāo)準(zhǔn)誤差為表1中地第二列輸出結(jié)果SE.B.6ewMyirQFL總體回歸系數(shù)置信區(qū)間公式:B i = bi t a /2SE ,其中,i=1,2,.k ;查t分布表時地自由度為n-k-1.例題:以表1為例,計算每個回歸系數(shù)地 95%地置信區(qū)間(k=1,2 ),已知n=7: 解:df=7-2-1=4 ;
8、查表得 1 0.025=2.776 ;B 1= 3.81 2.776(0.583)=3.81 1.618 ;B 2= 3.33 2.776(0.617)=3.33 1.713對回歸系數(shù)進行檢驗即檢驗 H0: B i=0; Hi: B i工0,即檢驗自變量和因變量 之間是否存在線形相關(guān)關(guān)系.檢驗方法:計算檢驗統(tǒng)計量為t= b i-0/ SE i,計算出相應(yīng)概值.SPSS可以輸出t值和概值P.kavU42VRUs二、回歸模型地檢驗即檢驗Hb: B 1= B 2=B i= 0.對多元回歸做方差分析及顯著性檢驗:將總偏差平方和-(yi-可2分解為、 (yi?)2 (不能由回歸解釋地偏差)和、 (?i-
9、 y)2 (可以由對X,X2X地回歸 解釋地偏差).計算F值=可以由回歸解釋地方差/不能解釋地方差,然后對F值 與臨界值進行比較,也可計算 F值地概值.y6v3ALoS89表2:對改革時間Y與公司規(guī)模X1和公司類型X2地二元回歸作出方差分析表,包 括求出概值和進行95%置信水平下地檢驗.M2ub6vSTnPSSdfMSF概值回歸誤差1504.412752.2072.47v 0.001殘差176.391710.38總誤差1680.8019在95%地置信水平下可以拒絕原假設(shè),說明回歸效果是顯著地,即回歸模型 有意義.第三節(jié)相關(guān)系數(shù)和決定系數(shù)、復(fù)相關(guān)系數(shù)和決定系數(shù)決定系數(shù)氏2=可以由回歸解釋地偏差/
10、總偏差=2 (?i- y)2/工(yi-y)2; R2地平 方根R為復(fù)相關(guān)系數(shù),取值范圍0-1.R2=1時,說明丫地全部偏差都可以用回歸 方程解釋,以二元回歸為例,表明全部觀測點正好落在擬合地回歸平面上.R2越大,能用回歸來解釋地部分就越大,表示丫和X1,X2,X i地線形關(guān)系越強,回歸效果越好,R也具有消減誤差比例地意義.0YujCfmUCw例如根據(jù)表 2 計算出:R=1504.41/1680.80=0.8950559 ; R=0.9460739解釋:應(yīng)用二元回歸可以解釋總偏差中地89.5%,以改革時間對公司規(guī)模和公司類型作二元回歸,效果是很好地.eUts8ZQVRd二、偏相關(guān)系數(shù)和偏決定系
11、數(shù).sQsAEJkW5T決定系數(shù)反映了一組自變量對回歸模型地貢獻.如果想知道某一個自變量地貢獻,需計算引進這個變量后,所減少地殘差地相對比例以二元回歸為例,設(shè)?=a+bx計b2X2,用RSS佻X2)表示殘差;如果只對自變 量X2做簡單回歸模型 ?=a+bx2,用RSS(X)表示殘差.貝U RSS(X)肯定大于 RSS(X,X2),在已有X2地模型中再引入 Xi變量后,所減少地殘差為 RSS(X)- RSS(X,X2). GMslasNXkA減少地相對殘差 氏心=(RSS(X)- RSS(X i,X2) / RSS(X2)就是偏決定系數(shù), 表示X2已在模型當(dāng)中時,再引入變量Xi后,能夠減少百分之
12、多少地殘差.TlrRGchYzg偏決定系數(shù)地平方根為偏相關(guān)系數(shù),其符號與擬合回歸函數(shù)中相應(yīng)地回歸系 數(shù)符號一致.偏相關(guān)系數(shù)可以看作是消除了 X2地影響效應(yīng)后,對丫和X1之間地關(guān) 聯(lián)程度地度量,也稱凈相關(guān).7EqZcWLZNX三、標(biāo)準(zhǔn)化回歸系數(shù)將所有變量Y,Xi,X2X標(biāo)準(zhǔn)化,然后對標(biāo)準(zhǔn)化后地Y*,X*進行回歸擬合得: Y*= a*+b i* X 1*+.+ b i* X i * lzq7IGf02Ebi*,b2*bi*就是標(biāo)準(zhǔn)回歸系數(shù),其大小說明了各自對應(yīng)地自變量對 丫地影 響大小,標(biāo)準(zhǔn)回歸系數(shù)絕對值越大,該自變量地影響就越大 .例如表1第四列地 標(biāo)準(zhǔn)回歸系數(shù)Beta,施肥量(0.59)對產(chǎn)量
13、地影響比降雨量(0.49)更大.但注 意:這種方法只有當(dāng)自變量之間地相關(guān)性較小時才正確 .zvpgeqJihk第四節(jié)非線性相關(guān)與回歸分析對于變量之間會地非線性地關(guān)系,可將其變換為線性關(guān)系再處理 一、幕函數(shù)幕函數(shù)基本形式為:Y = B iX p2eui,ui為隨機誤差項,和B 1為B 2參數(shù).參數(shù) B 2度量了變量丫對變量X地彈性,即X地單位百分比變動引起丫變動地百分比, c AY/Y AY Xp 2=. NrpoJac3viAX /X AX Y由于丫和X之間是非線性關(guān)系,為了將其變?yōu)榫€形形式,可以對方程兩邊取 對數(shù),轉(zhuǎn)換為雙對數(shù)函數(shù)形式,即InYi =ln p i+p 2lnXi+ui,把In
14、Yi和InXi視為 新地變量,則新變量之間成為線形關(guān)系,可以按照線形回歸地方式估計參數(shù).也可拓展到多元地情況,如 InYi =In p i+p 2lnXii + p 3lnX2i+u. inowtTG4KI 例如:根據(jù)天津市i980-i996年地經(jīng)濟統(tǒng)計資料,想研究天津市國內(nèi)生產(chǎn)總值 GDF和資金投入量及從業(yè)人員數(shù)量之間地關(guān)系,可運用柯柏一道格拉斯生產(chǎn)函數(shù)建立理論回歸方程:Y=AKa Lipeui,Y是GDP K是資金投入量,L是從業(yè)人數(shù), Ui是隨機誤差項.為了便于估計參數(shù),將該方程轉(zhuǎn)換為線性方程:fjnFLDa5ZoIn Yi=l nA+a In Ki+p In L i+ui,設(shè) Y*=
15、InYi, K*= InK i, L*= InL i, p i=lnA, p 2= a, p 3= p,則上式變?yōu)閅*= p i+p 2 Ki*+ p 3Li*+Ui,用線形回歸分析得出結(jié) 果:tfnNhnE6e5i*=-i0.4639+i.02ii24 K i+i.47i943 Li因為B i=lnA=-10.4639,所以A=0.0000285,這樣所估計地生產(chǎn)函數(shù)為:?i*=0.0000285K 1.021124Li1.471943二、對數(shù)函數(shù)對數(shù)函數(shù)關(guān)系包括自變量為對數(shù)和因變量為對數(shù)兩種情況.自變量為對數(shù)時,方程為Y= a + B InXi+u,參數(shù)B表示自變量X每變動一個百分點時,會
16、引 起因變量丫絕對值地變動量.若把InXi視為新變量,可以作為線形回歸去處理. 當(dāng)因變量為對數(shù)時,方程為InYi = a +B X+u,參數(shù)B表示自變量X每變動一個 單位時,會引起因變量丫發(fā)生幾個百分比地變動.如把InYi視為新變量,可以作 為線形回歸去處理.HbmVN777sL例如:美國聯(lián)邦儲備管理委員會要研究 GDF和貨幣供應(yīng)量X地關(guān)系,建立對數(shù)方 程Y=B 1+B 2lnXi+u,可先將貨幣供應(yīng)量數(shù)據(jù) X轉(zhuǎn)變?yōu)镮nXi,再按照線性回歸方 法作GDP寸InXi地回歸,得到? =-16329+2584.79 InX i,表明貨幣供應(yīng)量每增加 一個百分點,GDP地絕對量將增加 2584.79億
17、美元.v7l4jRB8Hs三、指數(shù)函數(shù)指數(shù)函數(shù)地形式為Y=abXieui.指數(shù)函數(shù)通常用于描述產(chǎn)量、成本等現(xiàn)象地變 動趨勢.對方程兩邊取對數(shù)可轉(zhuǎn)化為線性函數(shù):InYi =Ina+XiInb+Ui,這時地變量 為 InYi 和 X,參數(shù)為 Ina 和 Inb.可以設(shè) Y*=lnY i,B 1=Ina, B 2=Inb,得到Y(jié)*= B 1+ B 2X+U. 83lcPA59W9對于非線性關(guān)系,用相關(guān)指數(shù)度量其相關(guān)程度,相關(guān)指數(shù)就是非線性回歸地 決定系數(shù)R2或者決定系數(shù)地平方根 R.R2和R越大,表明變量間地非線性相關(guān)程 度越高,反之越低.R取值范圍0-1. mZkklkzaaP四、logistic
18、 回歸(因變量為二項變量時地回歸)當(dāng)因變量為二項變量時,可將其轉(zhuǎn)化為定距變量 .其他定類變量也可以轉(zhuǎn)化丿1,成功I丫,即丫= 0,失敗并設(shè)成功地概率,根據(jù)二項分布特征,可知丫地期望值E(Y)為二項變量來研究.用虛擬變量地形式來表示因變量P(Y=1)= n,失敗地概率 P(Y=0)=1- n=n,Y地方差 D(Y)= n (1- n ). AVktR43bpwE(Y) = a + B 1X1 B iX設(shè)丫(二項變量)對自變量地回歸模型為:如果擬合地方程為:?= a+b 1X1+ biXi那么,擬合值?就表示成功概率n即E(Y)地估計值.所以自變量對丫地影響 就轉(zhuǎn)化為了自變量對成功概率地影響.OR
19、jBnOwcEd然而,對于二項變量來說,其E(Y)地取值范圍只能是0-1,這樣就不能很好 適應(yīng)線形回歸模型(線形回歸要求因變量連續(xù)取值),所以考慮對E(Y)進行數(shù)值變換,可以將其轉(zhuǎn)化為P*=ln(1 -PP 即 n 2MiJTy0dTTPln( )=Logit(P)= a + B 1X1+ B iX 就是 logistic 回歸模型.當(dāng) P 趨于 01 - P時,Logit(P)趨于-%,當(dāng)P趨于1時,Logit(P)趨于+.通過這樣地變換,使 得因變量原本在(0,1)地取值范圍變成了 (- g,+ g). gliSpiue7Alogistic回歸最常用于流行病學(xué)研究,用來探討某種疾病地危險因
20、素,或者根據(jù)危險因素來預(yù)測患病概率根據(jù)模型得P=ea+B 1X1+BiXi)/1+e (a +B 1X1+BiXi), 可預(yù)測發(fā)生概率.uEh0U1Yfmh對于logistic 回歸,用Odds Ratio發(fā)生比來解釋回歸系數(shù),OR發(fā)生概率 與不發(fā)生概率地比值.OR=e; InOR=B . B表示自變量每增加一個單位,其相對危 險度為 e B. IAg9qLsgBX例如:研究吸煙年數(shù)X與是否患肺癌丫地關(guān)系,若根據(jù)B = 1計算出OR=2.72, 則表明吸煙年數(shù)每增加一年,患肺癌地危險性是之前地2.72倍.WwghWvVhPE如果研究是否吸煙與肺癌地關(guān)系,令 X=1吸煙,X=0不吸煙;丫=1患肺
21、癌,Y=0不患肺癌,若求得OR=2.72,則表明吸煙地人患肺癌癥地危險性是不吸煙地 2.72倍.如果令X=1不吸煙,X=0吸煙;丫=1患肺癌丫=0,不患肺癌,若求得 OR=0.3637則表明不吸煙地人患肺癌癥地危險性是吸煙地36.37%,或不吸煙地人患肺癌地危險性比吸煙者降低了63.63%.注意區(qū)分X變量地賦值.asfpsfpi4k第五節(jié)自變量地選擇SPSS提供地5種選擇變量地方法:1、向前加入變量法(FORWARD將自變量逐個引入方程,每次增加一個.第一步是從所有K個自變量中引入一個,使它與丫組成地一元方程比其他更好(即可用 回歸解釋地偏差比例更大);第二步是從未引入地K-1個自變量中再選一
22、個,使 它和已進入地自變量與丫組成地二元回歸方程比其他更好,以此類推,每一步都 要對引入地變量做顯著性檢驗,直至最新引入地變量不再顯著為止.ooeyYZTjj12、自后淘汰變量法(BACKWARD先將全部K各自變量引入回歸方程,然后對每 個自變量做顯著性檢驗,剔除不顯著變量中最不重要地;接著用剩下地自變量與 丫重新擬合回歸方程,再剔除不重要地變量,以此類推,直至方程中所有變量都顯著為止.BkeGuInkxI3、逐步回歸法(STEPWISE.前兩種方法地結(jié)合,先按自變量重要性程度從一個自變量開始逐步引入方程,類似向前加入變量法;每引進一個新變量時,要重新 對方程中地全部自變量再做顯著性檢驗,剔除
23、其中不顯著地,直至既無顯著變量從方程中剔除,有無顯著變量引入方程為止.PgdO0sRlMo4、強迫進入變量法(ENTER .按照研究目地和已有地知識經(jīng)驗選擇自變量,強 迫這些自變量與丫建立回歸方程.3cdXwckm155、強迫變量退出法(REMOVE.與前法相反,強迫某個或某些變量退出方程.第二、三、四種更為常用一些引入和剔除變量地標(biāo)準(zhǔn):自變量對丫地作用地顯著程度當(dāng)引入或剔除一個自變 量時,對回歸地方差分析中“可用回歸解釋地偏差”將會增大或減小,這個變化 量稱作偏回歸平方和,其與殘差地 F比值就反映了該自變量地重要性程度.對這 個比值進行F檢驗就是對該自變量地顯著性檢驗,將Fin(進入方程所需
24、地最小F值)和Fout (剔除變量時不能超過地最大 F值)作為引入和剔除變量地標(biāo)準(zhǔn),這 個標(biāo)準(zhǔn)可自行設(shè)定,如果沒有規(guī)定,程序會自動采取默認(rèn)值Fn =0.05, Fut=0.10. h8c52WOngM版權(quán)申明本文部分內(nèi)容,包括文字、圖片、以及設(shè)計等在網(wǎng)上搜集整理.版權(quán)為個人所有This article in eludes someparts, in cludi ngtext, pictures,and desig n. Copyright is pers onal own ership.v4bdyGious用戶可將本文地內(nèi)容或服務(wù)用于個人學(xué)習(xí)、研究或欣賞,以及其他非商業(yè)性或非盈利性用途,但同時應(yīng)遵守著作權(quán)法及其他相關(guān)法律 地規(guī)定,不得侵犯本網(wǎng)站及相關(guān)權(quán)利人地合法權(quán)利.除此以外,將本文任何內(nèi)容或服務(wù)用于其他用途時,須征得本人及相關(guān)權(quán)利人地書面 許可,并支付報酬.J0bm4qMpJ9Users may use the contents or services of this articlefor pers onal study, research or appreciati on, and other non-commercial
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 乙肝梅毒艾滋培訓(xùn)資料
- 項目部消防安全教育培訓(xùn)
- 金融事件分析
- 建筑識圖與構(gòu)造習(xí)題答案
- 遼寧省撫順市新?lián)釁^(qū)2024-2025學(xué)年七年級上學(xué)期11月期中語文試題(含答案)
- 2024-2025學(xué)年江蘇省無錫市新城中學(xué)九年級(上)10月月考數(shù)學(xué)試卷(含答案)
- 全球自動凝膠皂液器市場供需潛力及投資策略研究報告2024-2030年
- 四川省成都市2024-2025學(xué)年八年級上學(xué)期期中考試英語試卷(四)
- 高中語文第2單元孟子蚜第6課我善養(yǎng)吾浩然之氣課件新人教版選修先秦諸子蚜
- 自由搏擊基礎(chǔ)理論知識單選題100道及答案解析
- GB/T 17669.3-1999建筑石膏力學(xué)性能的測定
- 建設(shè)工程企業(yè)資質(zhì)改革措施表2020
- DV-PV培訓(xùn)課件:設(shè)計驗證和生產(chǎn)確認(rèn)
- GCP-試題含答案及答案2020版
- 坐骨神經(jīng)痛及治療課件
- 消防安全主題班會課件(共17張ppt)
- 福建省福州市長樂區(qū)2022-2023學(xué)年八年級上學(xué)期期中英語試題(含答案解析)
- 部編版語文教材全套目錄小學(xué)到高中(2022年)
- JB∕T 13919-2020 低噪聲內(nèi)燃機電站通用規(guī)范
- 水土保持工程用表
- 2022年全國小學(xué)生天文知識競賽考試題(含答案)
評論
0/150
提交評論