多元線性回歸演示文稿_第1頁(yè)
多元線性回歸演示文稿_第2頁(yè)
多元線性回歸演示文稿_第3頁(yè)
多元線性回歸演示文稿_第4頁(yè)
多元線性回歸演示文稿_第5頁(yè)
已閱讀5頁(yè),還剩67頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

多元線性回歸演示文稿現(xiàn)在是1頁(yè)\一共有72頁(yè)\編輯于星期五多元線性回歸現(xiàn)在是2頁(yè)\一共有72頁(yè)\編輯于星期五第12章多元線性回歸§12.1多元線性回歸模型§12.2回歸方程的擬合優(yōu)度§12.3顯著性檢驗(yàn)§12.4多重共線性§12.5利用回歸方程進(jìn)行估計(jì)和預(yù)測(cè)(刪去)§12.6變量選擇與逐步回歸(刪去)§12.7虛擬自變量的回歸現(xiàn)在是3頁(yè)\一共有72頁(yè)\編輯于星期五§12.1多元線性回歸模型12.1.1多元回歸模型與回歸方程12.1.2估計(jì)的多元回歸方程12.1.3參數(shù)的最小二乘估計(jì)現(xiàn)在是4頁(yè)\一共有72頁(yè)\編輯于星期五12.1多元線性回歸模型一個(gè)因變量與兩個(gè)及兩個(gè)以上自變量的回歸問(wèn)題就是多元回歸。12.1.1多元回歸模型與回歸方程設(shè)因變量y,k個(gè)自變量分別為x1,x2,…,xk,描述因變量y如何依賴自變量x1,x2,…,xk和誤差項(xiàng)

的方程,稱為多元回歸模型(multipleregressionmodel)。多元回歸模型一般形式為:其中,b0

,b1,b2

,,bk是參數(shù)

是被稱為誤差項(xiàng)的隨機(jī)變量y是x1,,x2

,,xk

的線性函數(shù)加上誤差項(xiàng)

包含在y里面但不能被k個(gè)自變量的線性關(guān)系所解釋的變異性現(xiàn)在是5頁(yè)\一共有72頁(yè)\編輯于星期五12.1.1多元回歸模型與回歸方程(1).誤差項(xiàng)ε是一個(gè)期望值為0的隨機(jī)變量,即E()=0。即:(2).對(duì)于自變量x1,x2,…,xk的所有值,的方差2都相同(3).誤差項(xiàng)ε是一個(gè)服從正態(tài)分布的隨機(jī)變量,即ε~N(0,2),且相互獨(dú)立。獨(dú)立性意味著對(duì)于自變量x1,x2,…,xk的一組特定值所對(duì)應(yīng)的ε與x1,x2,…,xk任意一組其他值所對(duì)應(yīng)的ε不相關(guān)。正態(tài)性意味著對(duì)于給定的x1,x2,…,xk的值,因變量y也是一個(gè)服從正態(tài)分布的隨機(jī)變量?,F(xiàn)在是6頁(yè)\一共有72頁(yè)\編輯于星期五12.1.1多元回歸模型與回歸方程根據(jù)回歸模型的假定有E(y)=0+1x1+2x2+…+

kxk,上式稱為多元回歸方程(multipleregressionequation),它描述了因變量y的期望值與自變量x1,x2,...,xk之間的關(guān)系。現(xiàn)在是7頁(yè)\一共有72頁(yè)\編輯于星期五12.1.1多元回歸模型與回歸方程二元線性回歸模型(觀察到的y)回歸面0ix1yx2(x1,x2)}現(xiàn)在是8頁(yè)\一共有72頁(yè)\編輯于星期五12.1.2估計(jì)的多元回歸方程現(xiàn)在是9頁(yè)\一共有72頁(yè)\編輯于星期五12.1.3參數(shù)的最小二乘估計(jì)2.求解各回歸參數(shù)的標(biāo)準(zhǔn)方程如下1.使因變量的觀察值與估計(jì)值之間的離差平方和達(dá)到最小來(lái)求得

。即現(xiàn)在是10頁(yè)\一共有72頁(yè)\編輯于星期五12.1.3參數(shù)的最小二乘估計(jì)【例12.1】繼續(xù)沿用第11章中例11.6。一家大型商業(yè)銀行在多個(gè)地區(qū)設(shè)有分行,其業(yè)務(wù)主要是進(jìn)行基礎(chǔ)設(shè)施建設(shè)、國(guó)家重點(diǎn)項(xiàng)目建設(shè)、固定資產(chǎn)投資等項(xiàng)目的貸款。近年來(lái),該銀行的貸款額平穩(wěn)增長(zhǎng),但不良貸款額也有較大比例的提高,這給銀行業(yè)務(wù)的發(fā)展帶來(lái)較大壓力。為弄清楚不良貸款形成的原因,抽取了該銀行所屬的25家分行2002年的有關(guān)業(yè)務(wù)數(shù)據(jù)。試建立不良貸款(y)與貸款余額(x1)、累計(jì)應(yīng)收貸款(x2)、貸款項(xiàng)目個(gè)數(shù)(x3)和固定資產(chǎn)投資額(x4)的線性回歸方程,并解釋各回歸系數(shù)的含義

用Excel進(jìn)行回歸

現(xiàn)在是11頁(yè)\一共有72頁(yè)\編輯于星期五12.1.3參數(shù)的最小二乘估計(jì)現(xiàn)在是12頁(yè)\一共有72頁(yè)\編輯于星期五§12.2回歸方程的擬合優(yōu)度12.2.1多重判定系數(shù)12.2.2估計(jì)標(biāo)準(zhǔn)誤差現(xiàn)在是13頁(yè)\一共有72頁(yè)\編輯于星期五12.2多重判定系數(shù)多元回歸中因變量離差平方和的分解:SST=SSR+SSE多重判定系數(shù)(multiplecoefficientofdetermination)是多元回歸中的回歸平方和占總平方和的比例,它是度量多元回歸方程擬合程度的一個(gè)統(tǒng)計(jì)量,反映了在因變量y的變差中被估計(jì)的回歸方程所解釋的比例。計(jì)算公式為現(xiàn)在是14頁(yè)\一共有72頁(yè)\編輯于星期五12.2多重判定系數(shù)注:由于自變量個(gè)數(shù)的增加,將影響到因變量中被估計(jì)回歸方程中所解釋的變差數(shù)量。當(dāng)增加自變量時(shí),會(huì)使預(yù)測(cè)誤差變得比較小,從而減少殘差平方和SSE,由于回歸平方和SSR=SST-SSE,當(dāng)SSE變小時(shí),SSR會(huì)變大,從而R2也會(huì)變大。如果模型中增加一個(gè)自變量,即使這個(gè)自變量在統(tǒng)計(jì)上并不顯著,R2也會(huì)變大,為避免這種情況,提出調(diào)整的多重判定系數(shù)(adjustedmultiplecoefficientofdetermination)計(jì)算公式為現(xiàn)在是15頁(yè)\一共有72頁(yè)\編輯于星期五12.2多重判定系數(shù)調(diào)整的多重判定系數(shù)的解釋與R2類似,不同的是:(1).同時(shí)考慮了樣本量和模型中的自變量的個(gè)數(shù)的影響,這就使得的值永遠(yuǎn)小于R2,而且的值不會(huì)由于模型中自變量個(gè)數(shù)的增加而越來(lái)越接近1。因此,在多元回歸分析中,通常用調(diào)整的多重判定系數(shù)。(2).R2的平方根稱為多重相關(guān)系數(shù),也稱為復(fù)相關(guān)系數(shù),它度量了因變量同k個(gè)自變量的相關(guān)程度?,F(xiàn)在是16頁(yè)\一共有72頁(yè)\編輯于星期五12.2.2估計(jì)標(biāo)準(zhǔn)誤差多元回歸分析中的估計(jì)標(biāo)準(zhǔn)誤差也是對(duì)誤差項(xiàng)的標(biāo)準(zhǔn)差的一個(gè)估計(jì)值,它是衡量多元回歸方程的擬合優(yōu)度方面也起著重要作用。計(jì)算公式為多元回歸中對(duì)se的解釋:由于se所估計(jì)的是預(yù)測(cè)誤差的標(biāo)準(zhǔn)差,其含義是根據(jù)自變量x1,x2,…,xk來(lái)預(yù)測(cè)因變量y時(shí)的平均預(yù)測(cè)誤差。現(xiàn)在是17頁(yè)\一共有72頁(yè)\編輯于星期五§12.3顯著性檢驗(yàn)12.3.1線性關(guān)系檢驗(yàn)12.3.2回歸系數(shù)檢驗(yàn)和推斷現(xiàn)在是18頁(yè)\一共有72頁(yè)\編輯于星期五12.3.1線性關(guān)系檢驗(yàn)1.檢驗(yàn)因變量與所有自變量之間的關(guān)系是否顯著,也被稱為總體顯著性檢驗(yàn)。2.檢驗(yàn)方法是將回歸平方和(SSR)同殘差平方和(SSE)加以比較,應(yīng)用F檢驗(yàn)來(lái)分析二者之間的差別是否顯著。如果是顯著的,因變量與自變量之間存在線性關(guān)系如果不顯著,因變量與自變量之間不存在線性關(guān)系現(xiàn)在是19頁(yè)\一共有72頁(yè)\編輯于星期五12.3.1線性關(guān)系檢驗(yàn)第1步:提出假設(shè)H0:12k=0線性關(guān)系不顯著H1:1,2,,k至少有一個(gè)不等于0第2步:計(jì)算檢驗(yàn)統(tǒng)計(jì)量F第3步:作出統(tǒng)計(jì)決策。給定顯著性水平和分子自由度k、分母自由度n-k-1找出臨界值F,若F>F,拒絕H0;若F<F,則不拒絕H0。也可利用P值來(lái)判斷?,F(xiàn)在是20頁(yè)\一共有72頁(yè)\編輯于星期五12.3.1線性關(guān)系檢驗(yàn)【例12.2】根據(jù)例12.1建立的回歸方程,對(duì)回歸方程線性關(guān)系的顯著性進(jìn)行檢驗(yàn)(a=0.05)解:提出假設(shè)H0:1=2=3=4=0H1:1,2,3,4至少有一個(gè)不等于0計(jì)算檢驗(yàn)統(tǒng)計(jì)量F作出統(tǒng)計(jì)決策。給定顯著性水平=0.05和分子自由度4、分母自由度25-4-1=20找出臨界值F=2.87,則F>F,所以拒絕H0,這意味著不良貸款與貸款余額、累計(jì)應(yīng)收貸款、貸款項(xiàng)目個(gè)數(shù)和固定資產(chǎn)投資額之間的線性關(guān)系是顯著的?,F(xiàn)在是21頁(yè)\一共有72頁(yè)\編輯于星期五12.3.2回歸系數(shù)檢驗(yàn)和推斷1.在回歸方程通過(guò)線性關(guān)系檢驗(yàn)后,就可以對(duì)各個(gè)回歸系數(shù)有選擇地進(jìn)行一次或多次檢驗(yàn)。但究竟要對(duì)哪幾個(gè)回歸系數(shù)進(jìn)行檢驗(yàn),通常需要在建立模型之前作出決定。對(duì)回歸系數(shù)檢驗(yàn)的個(gè)數(shù)進(jìn)行限制,以避免犯過(guò)多的第一類錯(cuò)誤(棄真錯(cuò)誤)2.對(duì)每一個(gè)自變量都要單獨(dú)進(jìn)行檢驗(yàn)3.應(yīng)用

t檢驗(yàn)統(tǒng)計(jì)量現(xiàn)在是22頁(yè)\一共有72頁(yè)\編輯于星期五12.3.2回歸系數(shù)檢驗(yàn)和推斷4.回歸系數(shù)檢驗(yàn)的具體步驟:提出假設(shè)H0:bi

=0(自變量xi

因變量y沒(méi)有線性關(guān)系)H1:bi

0(自變量xi

因變量y有線性關(guān)系)計(jì)算檢驗(yàn)的統(tǒng)計(jì)量

t作出統(tǒng)計(jì)決策。給定顯著性水平,并進(jìn)行決策t>t,拒絕H0;t<t,不拒絕H0現(xiàn)在是23頁(yè)\一共有72頁(yè)\編輯于星期五12.3.2回歸系數(shù)檢驗(yàn)和推斷【例12.3】根據(jù)例12.1建立的回歸方程,對(duì)回歸方程各系數(shù)的顯著性進(jìn)行檢驗(yàn)(a=0.05)解:提出假設(shè)H0:i=0(i=1,2,3,4)H1:i≠0計(jì)算檢驗(yàn)統(tǒng)計(jì)量,由excel可知,t1=3.84,t2=1.88,t3=0.17,t4=1.88作出統(tǒng)計(jì)決策。給定顯著性水平=0.05和自由度25-4-1=20找出臨界值t/2=2.1,則只有b1通過(guò)了檢驗(yàn)?,F(xiàn)在是24頁(yè)\一共有72頁(yè)\編輯于星期五12.3.2回歸系數(shù)檢驗(yàn)和推斷5.回歸系數(shù)在(1-)%置信水平下的置信區(qū)間為回歸系數(shù)的抽樣標(biāo)準(zhǔn)差現(xiàn)在是25頁(yè)\一共有72頁(yè)\編輯于星期五§12.4多重共線性12.4.1多重共線性及其所產(chǎn)生的問(wèn)題12.4.2多重共線性的判別12.4.3多重共線性問(wèn)題的處理現(xiàn)在是26頁(yè)\一共有72頁(yè)\編輯于星期五12.4多重共線性當(dāng)回歸模型中使用兩個(gè)或兩個(gè)以上的自變量時(shí),這些自變量之間往往會(huì)提供多余的信息。也就是說(shuō),這些變量之間彼此相關(guān)。例如,在例12.1所建立的回歸方程中,使用了4個(gè)變量,即貸款余額、累計(jì)應(yīng)收貸款、貸款項(xiàng)目個(gè)數(shù)和固定資產(chǎn)投資額。雖然對(duì)預(yù)測(cè)不良貸款都有作用,但由于4個(gè)自變量之間本身存在相關(guān)關(guān)系,在預(yù)測(cè)中所用的信息就是重復(fù)的。從直觀上看,貸款余額與累計(jì)應(yīng)收貸款之間就有較高的相關(guān)關(guān)系,這兩個(gè)變量所提供的信息就是重復(fù)的,或許只用一個(gè)自變量就可以了。現(xiàn)在是27頁(yè)\一共有72頁(yè)\編輯于星期五12.4.1多重共線性及其所產(chǎn)生的問(wèn)題1.多重共線性(multicollinearity)是指在回歸模型中,有兩個(gè)或兩個(gè)以上的自變量彼此相關(guān)。2.多重共線性帶來(lái)的問(wèn)題有(1).變量之間高度相關(guān)時(shí),可能會(huì)使回歸的結(jié)果造成混亂,甚至?xí)逊治鲆肫缤?2).多重共線性可能對(duì)參數(shù)估計(jì)值的正負(fù)號(hào)產(chǎn)生影響,特別是各回歸系數(shù)的正負(fù)號(hào)有可能同我們預(yù)期的正負(fù)號(hào)相反所以,當(dāng)存在多重共線性時(shí),對(duì)回歸系數(shù)的解釋將是危險(xiǎn)的?,F(xiàn)在是28頁(yè)\一共有72頁(yè)\編輯于星期五12.4.2多重共線性的判別1.檢測(cè)多重共線性的最簡(jiǎn)單的一種辦法是計(jì)算模型中各對(duì)自變量之間的相關(guān)系數(shù),并對(duì)各相關(guān)系數(shù)進(jìn)行顯著性檢驗(yàn)。如果有一個(gè)或多個(gè)相關(guān)系數(shù)是顯著的,就表示模型中所用的自變量之間相關(guān),因而存在著多重共線性問(wèn)題2.如果出現(xiàn)下列情況,暗示存在多重共線性(1).模型中各對(duì)自變量之間顯著相關(guān)。(2).當(dāng)模型的線性關(guān)系檢驗(yàn)(F檢驗(yàn))顯著時(shí),幾乎所有回歸系數(shù)的t檢驗(yàn)卻不顯著。(3).回歸系數(shù)的正負(fù)號(hào)與預(yù)期的相反?,F(xiàn)在是29頁(yè)\一共有72頁(yè)\編輯于星期五12.4.2多重共線性的判別【例12.4】利用例12.1的數(shù)據(jù),按上述方法判別所建立的回歸方程是否存在多重共線性。貸款余額,應(yīng)收貸款,貸款項(xiàng)目個(gè)數(shù),固定資產(chǎn)投資額之間的相關(guān)矩陣現(xiàn)在是30頁(yè)\一共有72頁(yè)\編輯于星期五12.4.2多重共線性的判別計(jì)算出相關(guān)系數(shù)統(tǒng)計(jì)量:1.t(25-2)=2.07,所有統(tǒng)計(jì)量t>t(25-2)=2.07,所以均拒絕原假設(shè),說(shuō)明這4個(gè)自變量?jī)蓛芍g都有顯著的相關(guān)關(guān)系現(xiàn)在是31頁(yè)\一共有72頁(yè)\編輯于星期五12.4.2多重共線性的判別2.由表Excel輸出的結(jié)果可知,回歸模型的線性關(guān)系顯著(Significance-F=1.03539E-06<=0.05)。而回歸系數(shù)檢驗(yàn)時(shí)卻有3個(gè)沒(méi)有通過(guò)t檢驗(yàn)(P-Value=0.075、0.86、0.067>=0.05)。這也暗示了模型中存在多重共線性3.固定資產(chǎn)投資額的回歸系數(shù)為負(fù)號(hào)(-0.029),與預(yù)期的不一致由以上三點(diǎn)可以判斷回歸模型中存在多重共線性?,F(xiàn)在是32頁(yè)\一共有72頁(yè)\編輯于星期五12.4.3多重共線性問(wèn)題的處理多重共線性問(wèn)題的解決辦法:(1).將一個(gè)或多個(gè)相關(guān)的自變量從模型中剔除,使保留的自變量盡可能不相關(guān)(2).如果要在模型中保留所有的自變量,則應(yīng)該:避免根據(jù)t統(tǒng)計(jì)量對(duì)單個(gè)參數(shù)進(jìn)行檢驗(yàn);對(duì)因變量y值的推斷(估計(jì)或預(yù)測(cè))限定在自變量樣本值的范圍內(nèi)?,F(xiàn)在是33頁(yè)\一共有72頁(yè)\編輯于星期五12.4.3多重共線性問(wèn)題的處理【例12.5】利用例12.1所建立的回歸方程,對(duì)多重共線性問(wèn)題進(jìn)行處理。解:首先,考慮將一些相關(guān)的自變量從模型中剔除。從前表可以看出,貸款余額與貸款項(xiàng)目個(gè)數(shù)的相關(guān)系數(shù)最高,而且從定性角度看,貸款余額與應(yīng)收貸款之間也有很強(qiáng)的相關(guān)關(guān)系。因此將貸款項(xiàng)目個(gè)數(shù)和累積應(yīng)收貸款這兩個(gè)自變量剔除,建立不良貸款與貸款余額和固定資產(chǎn)投資額的線性模型。從結(jié)果可以看出,線性關(guān)系和各回歸系數(shù)在0.05的顯著水平下是顯著的,多重共線性問(wèn)題不存在了。現(xiàn)在是34頁(yè)\一共有72頁(yè)\編輯于星期五12.4.3多重共線性問(wèn)題的處理多重共線性問(wèn)題帶來(lái)的主要麻煩是對(duì)單個(gè)回歸系數(shù)的解釋和檢驗(yàn)。在求因變量的置信區(qū)間和預(yù)測(cè)區(qū)間時(shí)一般不會(huì)受其影響,但必須保證用于估計(jì)或預(yù)測(cè)的自變量的值是在樣本數(shù)據(jù)的范圍之內(nèi)。因此,如果僅僅是為了估計(jì)或預(yù)測(cè),可以將所有自變量都保留在模型中。在建立多元線性回歸模型時(shí),不要試圖引入更多的自變量,除非有必要。特別是在社會(huì)科學(xué)的研究中,由于所使用的大多數(shù)數(shù)據(jù)都是非試驗(yàn)性質(zhì)的,因此,在某些情況下,得到的結(jié)果往往并不令人滿意,但這不一定是選擇的模型不適合,而是數(shù)據(jù)的質(zhì)量不好,或者是由于引入的自變量不合適?,F(xiàn)在是35頁(yè)\一共有72頁(yè)\編輯于星期五§12.7虛擬自變量的回歸12.7.1在模型中引進(jìn)虛擬變量12.7.2含有一個(gè)虛擬自變量的回歸現(xiàn)在是36頁(yè)\一共有72頁(yè)\編輯于星期五12.7.1在模型中引進(jìn)虛擬變量1.虛擬變量(dummyvariable)是指用數(shù)字代碼表示的定性自變量2.當(dāng)模型中使用虛擬自變量時(shí),稱為虛擬自變量的回歸。3.虛擬變量的取值只能是0,14.回歸分析中引入虛擬自變量的方法:(1).如果定性自變量只有兩個(gè)水平時(shí)。比如,性別(男,女)現(xiàn)在是37頁(yè)\一共有72頁(yè)\編輯于星期五12.7.1在模型中引進(jìn)虛擬變量(2).有兩個(gè)以上水平的虛擬自變量。比如,貸款企業(yè)的類型(家電,醫(yī)藥,其他)一般而言,如果定性自變量有k個(gè)水平,需要引入k-1個(gè)虛擬變量。5.對(duì)于含有一個(gè)虛擬自變量的回歸,采用下列形式的回歸方程:現(xiàn)在是38頁(yè)\一共有72頁(yè)\編輯于星期五12.7.1在模型中引進(jìn)虛擬變量【例12.8】為研究考試成績(jī)與性別之間的關(guān)系,從某大學(xué)商學(xué)院隨機(jī)抽取男女學(xué)生各8名,得到他們的市場(chǎng)營(yíng)銷學(xué)課程的考試成績(jī)?nèi)缦卤韺?duì)性別引入虛擬變量現(xiàn)在是39頁(yè)\一共有72頁(yè)\編輯于星期五12.7.2含有一個(gè)虛擬自變量的回歸1.模型中只含有一個(gè)虛擬變量的回歸:建立回歸模型為:y=0+1x+e回歸方程可寫:E(y)=0+1x男(x=0):E(y)=0—男學(xué)生考試成績(jī)的期望值女(x=1):E(y)=0+1—女學(xué)生考試成績(jī)的期望值注意:當(dāng)指定虛擬變量0—1時(shí)0總是代表與虛擬變量值0所對(duì)應(yīng)的那個(gè)分類變量水平的平均值1總是代表與虛擬變量值1所對(duì)應(yīng)的那個(gè)分類變量水平的平均響應(yīng)與虛擬變量值0所對(duì)應(yīng)的那個(gè)分類變量水平的平均值的差值,即平均值的差值=(0+1)-0=1現(xiàn)在是40頁(yè)\一共有72頁(yè)\編輯于星期五12.7.2含有一個(gè)虛擬自變量的回歸解:散點(diǎn)圖男女【例12.9】沿用例12.8。試建立考試成績(jī)與性別之間的線性回歸模型,并解釋回歸系數(shù)的含義?,F(xiàn)在是41頁(yè)\一共有72頁(yè)\編輯于星期五12.7.2含有一個(gè)虛擬自變量的回歸【例12.10】為研究工資水平與工作年限和性別之間的關(guān)系,在某行業(yè)中隨機(jī)抽取10名職工,所得數(shù)據(jù)如下表現(xiàn)在是42頁(yè)\一共有72頁(yè)\編輯于星期五12.7.2含有一個(gè)虛擬自變量的回歸2.模型中含有一個(gè)數(shù)值型自變量和一個(gè)虛擬變量回歸引進(jìn)虛擬變量時(shí),回歸方程可寫:

E(y)=0+1x1+2x2女(

x2=0):E(y|女性)=0+1x1男(x2=1):E(y|男性)=(0+2)+1x10的含義表示:女性職工的期望月工資收入(0+2)的含義表示:男性職工的期望月工資收入1含義表示:工作年限每增加1年,男性或女性工資的平均增加值2含義表示:男性職工的期望月工資收入與女性職工的期望月工資收入之間的差值(0+2)-0=2現(xiàn)在是43頁(yè)\一共有72頁(yè)\編輯于星期五習(xí)題選講

【習(xí)題12.01】根據(jù)下面的數(shù)據(jù)用Excel進(jìn)行回歸,并對(duì)回歸結(jié)果進(jìn)行討論,計(jì)算x1=200、x2=7時(shí)y的預(yù)測(cè)值。SUMMARYOUTPUT回歸統(tǒng)計(jì)MultipleR0.459234RSquare0.210896AdjustedRSquare-0.01456標(biāo)準(zhǔn)誤差13.34122觀測(cè)值10現(xiàn)在是44頁(yè)\一共有72頁(yè)\編輯于星期五習(xí)題選講

方差分析

dfSSMSFSignificanceF回歸分析2332.9837166.49190.935410.436485殘差71245.916177.988總計(jì)91578.9

Coefficients標(biāo)準(zhǔn)誤差tStatP-valueIntercept25.028722.278631.123440.298298XVariable1-0.049710.105992-0.469040.653301XVariable21.9281691.472161.3097550.231624現(xiàn)在是45頁(yè)\一共有72頁(yè)\編輯于星期五習(xí)題選講

【習(xí)題12.02】根據(jù)下面Excel輸出的回歸結(jié)果,說(shuō)明模型中涉及多少個(gè)自變量?多少個(gè)觀察值?寫出回歸方程,并根據(jù)F、se、R2及修正的的值對(duì)模型進(jìn)行討論。

現(xiàn)在是46頁(yè)\一共有72頁(yè)\編輯于星期五習(xí)題選講

【習(xí)題12.03】根據(jù)兩個(gè)自變量得到的多元回歸方程為現(xiàn)在是47頁(yè)\一共有72頁(yè)\編輯于星期五習(xí)題選講

【習(xí)題12.04】一家電器銷售公司的管理人員認(rèn)為,每月的銷售額是廣告費(fèi)用的函數(shù),并想通過(guò)廣告費(fèi)用對(duì)月銷售額作出估計(jì)。下面是近8個(gè)月的銷售額與廣告費(fèi)用數(shù)據(jù)。要求:(1).用電視廣告費(fèi)用作自變量,月銷售額作因變量,建立估計(jì)的回歸方程。(2).用電視廣告費(fèi)用和報(bào)紙廣告費(fèi)用作自變量,月銷售額作因變量,建立估計(jì)的回歸方程。(3).上述(1)和(2)所建立的估計(jì)方程,電視廣告費(fèi)用的系數(shù)是否相同?對(duì)其回歸系數(shù)分別進(jìn)行解釋。(4).根據(jù)問(wèn)題(2)所建立的估計(jì)方程,在銷售收入的總變差中,被估計(jì)的回歸方程所解釋的比例是多少?(5).根據(jù)問(wèn)題(2)所建立的估計(jì)方程,檢驗(yàn)回歸系數(shù)是否顯著(a=0.05)?現(xiàn)在是48頁(yè)\一共有72頁(yè)\編輯于星期五習(xí)題選講

現(xiàn)在是49頁(yè)\一共有72頁(yè)\編輯于星期五習(xí)題選講

【習(xí)題12.05】某農(nóng)場(chǎng)通過(guò)試驗(yàn)取得早稻收獲量與春季降雨量和春季溫度的數(shù)據(jù)如下。要求:(1).試確定早稻收獲量對(duì)春季降雨量和春季溫度的二元線性回歸方程。(2).解釋回歸系數(shù)的實(shí)際意義。(3).根據(jù)你的判斷,模型中是否存在多重共線性?

現(xiàn)在是50頁(yè)\一共有72頁(yè)\編輯于星期五習(xí)題選講

【習(xí)題12.12】為分析某行業(yè)中的薪水有無(wú)性別歧視,從該行業(yè)中隨機(jī)抽取15名員工,有關(guān)的數(shù)據(jù)如下。要求:用Excel進(jìn)行回歸,并對(duì)結(jié)果進(jìn)行分析?,F(xiàn)在是51頁(yè)\一共有72頁(yè)\編輯于星期五習(xí)題選講

【習(xí)題12.06】一家房地產(chǎn)評(píng)估公司想對(duì)某城市的房地產(chǎn)銷售價(jià)格y與地產(chǎn)的評(píng)估價(jià)值x1、房產(chǎn)的評(píng)估價(jià)值x2和使用面積x3建立一個(gè)模型,以便對(duì)銷售價(jià)格作出合理預(yù)測(cè)。為此,收集了20棟住宅的房地產(chǎn)評(píng)估數(shù)據(jù)如下。用Excel進(jìn)行回歸,回答下面的問(wèn)題:(1).寫出估計(jì)的多元回歸方程。(2).在銷售價(jià)格的總變差中,被估計(jì)的回歸方程所解釋的比例是多少?(3).檢驗(yàn)回歸方程的線性關(guān)系是否顯著(a=0.05)。(4).檢驗(yàn)各回歸系數(shù)是否顯著

(a=0.05)?現(xiàn)在是52頁(yè)\一共有72頁(yè)\編輯于星期五習(xí)題選講

【習(xí)題12.07】根據(jù)11.4題中的數(shù)據(jù),回答下面的問(wèn)題:(1).a=0.01的水平下,檢驗(yàn)二元回歸模型線性關(guān)系的顯著性。(2).在a=0.05的水平下,檢驗(yàn)回歸系數(shù)b1的顯著性,你認(rèn)為x1應(yīng)該從模型中剔除嗎?(3).在a=0.05的水平下,檢驗(yàn)回歸系數(shù)b2的顯著性,你認(rèn)為x2應(yīng)該從模型中剔除嗎?現(xiàn)在是53頁(yè)\一共有72頁(yè)\編輯于星期五習(xí)題選講

【習(xí)題12.08】根據(jù)下面的數(shù)據(jù)回答下面的問(wèn)題:(1).計(jì)算y與x1之間的相關(guān)系數(shù),有無(wú)證據(jù)表明二者之間存在線性關(guān)系(a=0.05)?(2).計(jì)算y與x2之間的相關(guān)系數(shù),有無(wú)證據(jù)表明二者之間存在線性關(guān)系(a=0.05)?(3).根據(jù)上面的結(jié)論,你認(rèn)為E(y)=b0+b1x1+b2x2對(duì)預(yù)測(cè)y是否有用?(4).用Excel進(jìn)行回歸,并對(duì)模型進(jìn)行檢驗(yàn),所得的結(jié)論與(3)是否相同?(5)計(jì)算x1與x2之間的相關(guān)系數(shù),所得結(jié)果意味著什么?現(xiàn)在是54頁(yè)\一共有72頁(yè)\編輯于星期五習(xí)題選講

【習(xí)題12.09】下面是隨機(jī)抽取的15家大型商場(chǎng)銷售的同類產(chǎn)品的有關(guān)數(shù)據(jù)(單位:元)。要求:(1).計(jì)算y與x1、y與x2之間的相關(guān)系數(shù),是否有證據(jù)表明銷售價(jià)格與購(gòu)進(jìn)價(jià)格、銷售價(jià)格與銷售費(fèi)用之間存在線性關(guān)系?(2).根據(jù)上述結(jié)果,你認(rèn)為用購(gòu)進(jìn)價(jià)格和銷售費(fèi)用來(lái)預(yù)測(cè)銷售價(jià)格是否有用?(3).用Excel進(jìn)行回歸,并檢驗(yàn)?zāi)P偷木€性關(guān)系是否顯著(a=0.05)。(4).解釋判定系數(shù)R2,所得結(jié)論與問(wèn)題(2)中是否一致?(5).計(jì)算x1與x2之間的相關(guān)系數(shù),所得結(jié)果意味著什么?(6).模型中是否存在多重共線性?你對(duì)模型有何建議?現(xiàn)在是55頁(yè)\一共有72頁(yè)\編輯于星期五習(xí)題選講

【習(xí)題12.10】設(shè)因變量為y,一個(gè)數(shù)值型自變量x1和一個(gè)具有兩個(gè)水平(水平1和水平2)的分類型自變量。要求:(1).寫出因變量y關(guān)于自變量x1和分類自變量的多元回歸方程。(2).對(duì)應(yīng)于分類自變量水平1的y的期望值是多少?(3).對(duì)應(yīng)于分類自變量水平2的y的期望值是多少?現(xiàn)在是56頁(yè)\一共有72頁(yè)\編輯于星期五習(xí)題選講

【習(xí)題12.11】一家貨物運(yùn)輸公司想研究運(yùn)輸費(fèi)用與貨物類型的關(guān)系,并建立運(yùn)輸費(fèi)用與貨物類型的回歸模型,以此對(duì)運(yùn)輸費(fèi)用作出預(yù)測(cè)。該運(yùn)輸公司所運(yùn)輸?shù)呢浳锓譃閮煞N類型:易碎品和非易碎品。下面給出了15個(gè)路程大致相同、而貨物類型不同的運(yùn)輸費(fèi)用數(shù)據(jù)。要求:(1).寫出運(yùn)輸費(fèi)用與貨物類型之間的線性方程。(2).對(duì)模型中的回歸系數(shù)進(jìn)行解釋。(3).檢驗(yàn)?zāi)P偷木€性關(guān)系是否顯著(a=0.05)?現(xiàn)在是57頁(yè)\一共有72頁(yè)\編輯于星期五§12.5利用回歸方程進(jìn)行估計(jì)和預(yù)測(cè)刪去不講現(xiàn)在是58頁(yè)\一共有72頁(yè)\編輯于星期五§12.5利用回歸方程進(jìn)行估計(jì)和預(yù)測(cè)STATISTICA輸出的不良貸款的置信區(qū)間【例12.6】根據(jù)例12.1的數(shù)據(jù),取x1=100、x2=10、x3=15、x4=60,建立不良貸款的95%的置信區(qū)間和預(yù)測(cè)區(qū)間?,F(xiàn)在是59頁(yè)\一共有72頁(yè)\編輯于星期五§12.5利用回歸方程進(jìn)行估計(jì)和預(yù)測(cè)STATISTICA輸出的不良貸款的預(yù)測(cè)區(qū)間現(xiàn)在是60頁(yè)\一共有72頁(yè)\編輯于星期五§12.5利用回歸方程進(jìn)行估計(jì)和預(yù)測(cè)STATISTICA輸出的不良貸款的置信區(qū)間【例12.6】根據(jù)例12.1的數(shù)據(jù),取x1=100、x2=10、x3=15、x4=60,建立不良貸款的95%的置信區(qū)間和預(yù)測(cè)區(qū)間?,F(xiàn)在是61頁(yè)\一共有72頁(yè)\編輯于星期五§12.5利用回歸方程進(jìn)行估計(jì)和預(yù)測(cè)STATISTICA輸出的不良貸款的預(yù)測(cè)區(qū)間現(xiàn)在是62頁(yè)\一共有72頁(yè)\編輯于星期五§12.6變量選擇與逐步回歸12.6.1變量選擇過(guò)程12.6.2向前選擇12.6.3向后剔除12.6.4逐步回歸現(xiàn)在是63頁(yè)\一共有72頁(yè)\編輯于星期五變量選擇過(guò)程1.在建立回歸模型時(shí),對(duì)自變量進(jìn)行篩選2.選擇自變量的原則是對(duì)統(tǒng)計(jì)量進(jìn)行顯著性檢驗(yàn)(1).將一個(gè)或一個(gè)以上的自變量引入到回歸模型中時(shí),是否使得殘差平方和(SSE)有顯著地減少。如果增加一個(gè)自變量使SSE的減少是顯著的,則說(shuō)明有必要將這個(gè)自變量引入回歸模型,否則,就沒(méi)有必要將這個(gè)自變量引入回歸模型(2).確定引入自變量是否使SSE有顯著減少的方法,就是使用F統(tǒng)計(jì)量的值作為一個(gè)標(biāo)準(zhǔn),以此來(lái)確定是在模型中增加一個(gè)自變量,還是從模型中剔除一個(gè)自變量3.變量選擇的方法主要有:向前選擇、向后剔除、逐步回歸、最優(yōu)子集等現(xiàn)在是64頁(yè)\一共有72頁(yè)\編輯于星期五§12.6.2向前選擇

1.從模型中沒(méi)有自變量開始2.對(duì)k個(gè)自變量分別擬合對(duì)因變量y的一元線性回歸模型,共有k個(gè),然后找出F統(tǒng)計(jì)量的值最高的模型及其自變量(P值最小的),并將其首先引入模型3.分別擬合引入模型外的k-1個(gè)自變量的線性回歸模型,如此反復(fù)進(jìn)行,直至模型外的自變量均無(wú)統(tǒng)計(jì)顯著性為止現(xiàn)在是65頁(yè)\一共有72頁(yè)\編輯于星期五§12.6.3向后剔除

1.先對(duì)因變量擬合包括所有k個(gè)自變量的回歸模型。然后考察p(p<k)個(gè)去掉一個(gè)自變量的模型(這

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論