版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
思考與練習(xí)題思考題10.1.多重判定系數(shù)和修正的多重判定系數(shù)有什么作用?多重判定系數(shù)是多元回歸中的回歸平方和占總平方和的比例,它是度量多元回歸方程擬合程度的一個(gè)統(tǒng)計(jì)量,反映了在因變量y的變差中被估計(jì)的回歸方程所解釋的比例,其計(jì)算公式為:修正的多重判定系數(shù)考慮了樣本量()和模型中自變量的個(gè)數(shù)()的影響,這就使得的值永遠(yuǎn)小于,而且的值不會(huì)由于模型中自變量個(gè)數(shù)的增加而越來越接近1,其計(jì)算公式為:10.2.如何進(jìn)行回歸系數(shù)的顯著性檢驗(yàn)?將回歸均方(MSR)同殘差均方(MSE)加以比較,應(yīng)用F檢驗(yàn)來分析二者之間的差別是否顯著。10.3.模型中虛擬變量是什么,為什么要引入虛擬變量?虛擬變量是用以反映質(zhì)的屬性的一個(gè)人工變量,是量化了的自變量,通常取值為0或1。引入虛擬變量可使線形回歸模型變得更復(fù)雜,但對(duì)問題描述更簡(jiǎn)明,一個(gè)方程能達(dá)到兩個(gè)方程的作用,而且接近現(xiàn)實(shí)。10.4.多重共線性會(huì)導(dǎo)致什么后果,如何檢測(cè)并處理?多重共線性是指回歸模型中兩個(gè)或兩個(gè)以上的自變量彼此相關(guān),多重共線可能會(huì)使回歸的結(jié)果造成混亂,可能對(duì)參數(shù)估計(jì)值的正負(fù)號(hào)產(chǎn)生影響。檢測(cè)多重共線性的最簡(jiǎn)單的一種辦法是計(jì)算模型中各對(duì)自變量之間的相關(guān)系數(shù),并對(duì)各相關(guān)系數(shù)進(jìn)行顯著性檢驗(yàn)。將一個(gè)或多個(gè)相關(guān)的自變量從模型中剔除,使保留的自變量盡可能不相關(guān)。10.5.解釋向前回歸、向后剔除和逐步回歸的異同點(diǎn)。逐步回歸法可以認(rèn)為是向前引入法與向后剔除法的綜合。逐步回歸法克服了向前引入法與向后剔除法的缺點(diǎn),吸收兩種方法的優(yōu)點(diǎn)。10.6.多元線性回歸預(yù)測(cè)和因果分析有什么不同?預(yù)測(cè)因果分析遺漏的變量遺漏變量對(duì)于預(yù)測(cè)的影響小的多。預(yù)測(cè)的目標(biāo)是基于可用的變量的線性組合,得到優(yōu)化的預(yù)測(cè)。因此不存在對(duì)預(yù)測(cè)來說“真正的”系數(shù)進(jìn)行優(yōu)化估計(jì)的說法。除非如果加入遺漏的變量,可以改進(jìn)預(yù)測(cè)。因果分析的主要目標(biāo)是得到回歸系數(shù)的無偏倚估計(jì)。因此遺漏的變量造成的偏倚是極具威脅的。特別是那些既影響因變量,又和自變量相關(guān)的變量。這些變量的遺漏往往會(huì)導(dǎo)致無效結(jié)論。反映了預(yù)測(cè)模型對(duì)數(shù)據(jù)的擬合度。最大化R2對(duì)預(yù)測(cè)建模是關(guān)鍵性的。當(dāng)小的時(shí)候,也能做好因果分析,檢驗(yàn)自變量對(duì)因變量效果的假設(shè)??梢酝ㄟ^大樣本量抵消小的短處。多重共線性預(yù)測(cè)不管多重共線性??吹氖撬凶宰兞康慕M合對(duì)因變量的預(yù)測(cè)能力。因此可以不一個(gè)個(gè)地拆開對(duì)待自變量。多重共線性是因果分析的一個(gè)主要問題。當(dāng)兩個(gè)或更多自變量高度相關(guān)時(shí),對(duì)每個(gè)自變量獨(dú)立的系數(shù)估計(jì)就能難得到可靠的結(jié)論。缺失數(shù)據(jù)缺失數(shù)據(jù)對(duì)預(yù)測(cè)的影響可能有兩個(gè)方面。首先,某個(gè)數(shù)據(jù)缺失了本身對(duì)預(yù)測(cè)來說是一個(gè)有用的信息。其次,不僅僅訓(xùn)練數(shù)據(jù)會(huì)缺失,測(cè)試數(shù)據(jù)也會(huì)有缺失。以前對(duì)缺失數(shù)據(jù)的研究都是為了做參數(shù)估計(jì)和假設(shè)檢驗(yàn)。測(cè)量誤差測(cè)量誤差對(duì)預(yù)測(cè)肯定有影響。但如何干預(yù)要看情況。很多時(shí)候做預(yù)測(cè)的數(shù)據(jù)就長(zhǎng)成那樣,也沒法干預(yù)。測(cè)量誤差會(huì)對(duì)因果分析的參數(shù)估計(jì)帶來誤差。因此需要盡量控制。練習(xí)題10.7.為了分析薪酬與受教育年限、工作年限之間的關(guān)系,某調(diào)查機(jī)構(gòu)調(diào)查了15個(gè)員工的情況,數(shù)據(jù)如下表所示:?jiǎn)T工編號(hào)薪酬(元)受教育年限(年)工作年限(年)1550012224850963700012104685016353500926900016275400125849501249825016210670012611795016312435094136300129145900128158500163(1)建立回歸模型,得出估計(jì)方程并對(duì)解釋回歸系數(shù)的含義。(2)根據(jù)估計(jì)方程說明的含義。解:首先多元線性回歸模型需要滿足殘差零均值、方差齊性、正態(tài)性及獨(dú)立性的假設(shè),同時(shí)還需要進(jìn)行多重共線性診斷。先做出因變量的分布圖以及回歸的殘差圖,如下從以上殘差圖可以看出,基本滿足零均值、正態(tài)性、方差齊性條件。(1)設(shè)薪酬為,受教育年限為,工作年限為,根據(jù)最小二乘法估計(jì)回歸模型參數(shù):,,可得估計(jì)方程為下面運(yùn)用SPSS軟件進(jìn)行回歸分析,結(jié)果如下表所示模型匯總b模型RR方調(diào)整R方標(biāo)準(zhǔn)估計(jì)的誤差Durbin-Watson1.926a.858.834659.3982.235a.預(yù)測(cè)變量:(常量),工作年限,受教育年限。b.因變量:薪酬根據(jù)上表對(duì)于殘差獨(dú)立性的檢驗(yàn),DW值在2附近,說明模型不存在自相關(guān)。模型的參數(shù)估計(jì)和檢驗(yàn)a模型非標(biāo)準(zhǔn)化系數(shù)標(biāo)準(zhǔn)系數(shù)tSig.共線性統(tǒng)計(jì)量β標(biāo)準(zhǔn)誤差β容忍度VIF1(常量)-1897.3051071.848-1.770.102受教育年限597.51470.730.9808.448.000.8791.138工作年限135.28170.493.2231.919.079.8791.138a.因變量:薪酬從上表可以看出VIF<10,不存在較嚴(yán)重的多重共線性。對(duì)于回歸系數(shù)的解釋:在控制其他變量不變的情況下,每增加1年受教育年限,薪酬增加597.514元;在控制其他變量不變的情況下,每增加1年工作年限,薪酬增加135.281元。(2),修正后,說明薪酬能被回歸方程所解釋的比例為83.4%。10.8.某公司對(duì)于新上線的產(chǎn)品通過電腦端和手機(jī)端兩種渠道進(jìn)行推廣,為調(diào)查收入與兩種推廣渠道的關(guān)系,選取了87個(gè)月的收入和渠道推廣費(fèi)用數(shù)據(jù):收入(萬元)電腦端費(fèi)用(萬元)手機(jī)端費(fèi)用(萬元)955.01.5902.02.0964.51.5922.52.5943.03.0953.53.0933.02.5(1)確定估計(jì)方程。(2)給出收入的預(yù)測(cè)值及95%置信區(qū)間和預(yù)測(cè)區(qū)間。解:首先多元線性回歸模型需要滿足殘差零均值、方差齊性、正態(tài)性及獨(dú)立性的假設(shè),同時(shí)還需要進(jìn)行多重共線性診斷。先做出因變量的分布圖以及回歸的殘差圖,如下從殘差圖中可以發(fā)現(xiàn)零均值、方差齊性不滿足,可采用加權(quán)最小二乘法進(jìn)行估計(jì),殘差的正態(tài)性近似滿足。(1)設(shè)收入為,電腦端費(fèi)用為,手機(jī)端費(fèi)用為,根據(jù)最小二乘法估計(jì)回歸模型參數(shù):,,可得估計(jì)方程為:下面運(yùn)用SPSS軟件進(jìn)行回歸分析,結(jié)果如下表所示模型匯總b模型RR方調(diào)整R方標(biāo)準(zhǔn)估計(jì)的誤差Durbin-Watson1.955a.912.868.7521.650a.預(yù)測(cè)變量:(常量),手機(jī)端費(fèi)用,電腦端費(fèi)用。b.因變量:收入從上表看出,DW在2附近,基本滿足獨(dú)立性。模型的參數(shù)估計(jì)和檢驗(yàn)a模型非標(biāo)準(zhǔn)化系數(shù)標(biāo)準(zhǔn)系數(shù)tSig.共線性統(tǒng)計(jì)量β標(biāo)準(zhǔn)誤差β容忍度VIF1(常量)82.8052.18137.968.000電腦端費(fèi)用2.176.3421.1246.367.003.7061.417手機(jī)端費(fèi)用1.514.574.4652.635.058.7061.417a.因變量:收入從表中可以看出VIF<10,不存在較嚴(yán)重的多重共線性。(2)收入的預(yù)測(cè)值及95%置信區(qū)間和預(yù)測(cè)區(qū)間如下表所示收入y預(yù)測(cè)值標(biāo)準(zhǔn)化預(yù)測(cè)值置信區(qū)間下限置信區(qū)間上限預(yù)測(cè)區(qū)間上限預(yù)測(cè)區(qū)間下限9595.961.2194.3897.5493.3498.589090.19-1.7188.4291.9587.4592.929694.870.6693.4996.2592.3797.379292.03-0.7890.9893.0889.6994.379493.880.1592.6095.1591.4396.329594.960.7093.5196.4192.4297.519393.12-0.2392.2693.9790.8695.3710.9.某地區(qū)為了研究農(nóng)作物產(chǎn)量與降水量和溫度的關(guān)系,隨機(jī)選取7組數(shù)據(jù)進(jìn)行分析。產(chǎn)量(公斤)降水量(ml)溫度(℃)23502053400357475050961508511680010013750011516815012017(1)建立二元線性回歸方程,對(duì)回歸模型的線性關(guān)系和回歸系數(shù)進(jìn)行檢驗(yàn)()。(2)判斷是否存在多重共線性。解:首先多元線性回歸模型需要滿足殘差零均值、方差齊性、正態(tài)性及獨(dú)立性的假設(shè)。先做出因變量的分布圖以及回歸的殘差圖,如下從殘差圖中看出正態(tài)性、零均值、方差齊性基本滿足。模型匯總b模型RR方調(diào)整R方標(biāo)準(zhǔn)估計(jì)的誤差Durbin-Watson1.993a.986.980309.1721.523a.預(yù)測(cè)變量:(常量),溫度,降水量。b.因變量:產(chǎn)量根據(jù)上表DW值在2附近,說明殘差獨(dú)立性假設(shè)基本滿足。模型的參數(shù)估計(jì)和檢驗(yàn)a模型非標(biāo)準(zhǔn)化系數(shù)標(biāo)準(zhǔn)系數(shù)Sig.共線性統(tǒng)計(jì)β標(biāo)準(zhǔn)錯(cuò)誤β容忍度VIF1(常量)1243.750524.2262.373.077降水量41.05117.759.7602.312.082.03231.676溫度113.358158.280.236.716.513.03231.676a.因變量:產(chǎn)量y(1)二元線性回歸方程為:①首先對(duì)回歸方程總體進(jìn)行F檢驗(yàn):提出假設(shè):,:,至少有一個(gè)不為0計(jì)算檢驗(yàn)統(tǒng)計(jì)量:根據(jù)給定的顯著性水平,查F分布表,得,顯然,故拒絕原假設(shè),這表明農(nóng)作物產(chǎn)量和降水量、溫度之間存在顯著的關(guān)系。②對(duì)回歸系數(shù)進(jìn)行t檢驗(yàn):提出假設(shè):,:(i=1,2)根據(jù)給定的顯著性水平,自由度4查t分布表,得,顯然,,故不拒絕原假設(shè),這表明降水量、溫度和產(chǎn)量之間不存在顯著的關(guān)系。(2)由(1)可知,模型F檢驗(yàn)顯著,但回歸系數(shù),的t檢驗(yàn)均不顯著,模型可能存在多重共線性。VIF>10,,的共線性超過容許界限,存在嚴(yán)重共線性。10.10.某房地產(chǎn)行業(yè)為對(duì)新開發(fā)地區(qū)房產(chǎn)進(jìn)行合理估價(jià),選取了10棟房產(chǎn)的評(píng)估數(shù)據(jù),以此建立模型實(shí)現(xiàn)價(jià)格預(yù)測(cè)。房產(chǎn)編號(hào)售價(jià)(元/m2)地產(chǎn)房產(chǎn)面積(m2143508002089127302480090029551725035250380359410760457004002176134305630010003958126506665058044651882077200610512718770876507705395185309815010305539195001084002270488918150(1)進(jìn)行逐步回歸,確定估計(jì)方程。(2)給出預(yù)測(cè)值及95%置信區(qū)間和預(yù)測(cè)區(qū)間。解:首先多元線性回歸模型需要滿足殘差零均值、方差齊性、正態(tài)性及獨(dú)立性的假設(shè)。先做出因變量的分布圖以及回歸的殘差圖,如下從殘差圖中看出零均值、方差齊性、獨(dú)立性基本滿足;正態(tài)性近似滿足。(1)對(duì)3個(gè)自變量分別進(jìn)行一元線性回歸,計(jì)算F統(tǒng)計(jì)量。,,在顯著性水平下,因此x1不適合來解釋因變量。由此,選擇F統(tǒng)計(jì)量最大的自變量進(jìn)入模型,可得到估計(jì)的回歸方程:。同時(shí)引入自變量及交互項(xiàng),分別計(jì)算F統(tǒng)計(jì)量。,在顯著性水平下,因此x2可以來解釋因變量。進(jìn)一步針對(duì)回歸系數(shù)進(jìn)行顯著性檢驗(yàn),提出假設(shè):,:(i=2,3),,在顯著性水平,自由度7查t分布表,得,顯然,,故不拒絕原假設(shè),這表明面積及面積與房產(chǎn)的交互項(xiàng)和售價(jià)之間不存在顯著的關(guān)系。綜上,估計(jì)的回歸方程為。下面運(yùn)用SPSS軟件進(jìn)行回歸分析,結(jié)果如下表所示模型的參數(shù)估計(jì)a模型非標(biāo)準(zhǔn)化系數(shù)標(biāo)準(zhǔn)系數(shù)tSig.β標(biāo)準(zhǔn)錯(cuò)誤β1(常量)2497.690730.4663.419.009房產(chǎn)x.982.174.8945.646.000a.因變量:售價(jià)y排除的變量a模型輸入βt顯著性偏相關(guān)共線性統(tǒng)計(jì)容許1地產(chǎn)x.264b1.766.121.555.890面積x.133b.560.593.207.484a.因變量:售價(jià)yb.模型中的預(yù)測(cè)變量:(常量),房產(chǎn)x(2)預(yù)測(cè)值及95%置信區(qū)間和預(yù)測(cè)區(qū)間如下表編號(hào)售價(jià)y(元/m2預(yù)測(cè)值標(biāo)準(zhǔn)化預(yù)測(cè)值置信區(qū)間下限置信區(qū)間上限預(yù)測(cè)區(qū)間上限預(yù)測(cè)區(qū)間下限143504549.58-1.503634.275464.892754.186344.98248005400.20-0.834751.636048.763724.997075.40352506027.84-0.335510.556545.144398.967656.73457004635.03-1.443749.055521.022854.416415.66563006385.38-0.055896.346874.424765.258005.51666506883.370.356363.167403.585253.568513610.866873.148194.095853.769213.46876507796.851.077059.718533.996085.419508.30981507938.291.187156.958719.646207.359669.241084007299.840.686699.467900.215642.708956.9810.11.男女的薪資差異一直存在著爭(zhēng)議,某調(diào)查機(jī)構(gòu)為了研究性別與薪資的關(guān)系,隨機(jī)調(diào)查了12名員工,相關(guān)數(shù)據(jù)如下。月薪(元)工作年限(年)性別(1=男性,0=女)55843.2166903.9145782.7079554.7173464.5058683.4157723.3045502.8048732.7167453.8139502.3133482.40進(jìn)行回歸并對(duì)結(jié)果進(jìn)行分析。解:首先多元線性回歸模型需要滿足殘差零均值、方差齊性、正態(tài)性及獨(dú)立性的假設(shè)。先做出因變量的分布圖以及回歸的殘差圖,如下從殘差圖中看出正態(tài)性、零均值、方差齊性基本滿足。模型匯總b模型RR方調(diào)整R方標(biāo)準(zhǔn)估計(jì)的誤差Durbin-Watson1.987a.975.969246.6761.474a.預(yù)測(cè)變量:(常量),性別,工作年限。b.因變量:月薪根據(jù)上表DW值在2附近,說明殘差獨(dú)立性假設(shè)基本滿足。模型的參數(shù)估計(jì)和檢驗(yàn)a模型非標(biāo)準(zhǔn)化系數(shù)標(biāo)準(zhǔn)系數(shù)tSig.共線性統(tǒng)計(jì)量B標(biāo)準(zhǔn)誤差試用版容差VIF1(常量)-235.3283
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年合資合約示范
- 2025年分期付款醫(yī)療合同
- 2025年家庭財(cái)產(chǎn)保險(xiǎn)的保險(xiǎn)期限說明
- 2025版鋁塑門窗行業(yè)市場(chǎng)分析與競(jìng)爭(zhēng)情報(bào)服務(wù)合同2篇
- 2025版太陽能光伏發(fā)電站安全防護(hù)與應(yīng)急預(yù)案合同3篇
- 2025版定制家具原材料采購(gòu)合同范本4篇
- 2025年度政府機(jī)關(guān)打印機(jī)設(shè)備采購(gòu)與維保合同3篇
- 個(gè)人與國(guó)有企業(yè)借款合同范本(2024版)2篇
- 二零二五年度旅游度假區(qū)租賃權(quán)轉(zhuǎn)讓及配套設(shè)施合同
- 2025年度特色餐廳加盟經(jīng)營(yíng)合同樣本
- 2025水利云播五大員考試題庫(kù)(含答案)
- 中藥飲片驗(yàn)收培訓(xùn)
- 手術(shù)室??谱o(hù)士工作總結(jié)匯報(bào)
- DB34T 1831-2013 油菜收獲與秸稈粉碎機(jī)械化聯(lián)合作業(yè)技術(shù)規(guī)范
- 創(chuàng)傷處理理論知識(shí)考核試題及答案
- 2019級(jí)水電站動(dòng)力設(shè)備專業(yè)三年制人才培養(yǎng)方案
- 肝素誘導(dǎo)的血小板減少癥培訓(xùn)課件
- 抖音認(rèn)證承諾函
- 高等數(shù)學(xué)(第二版)
- 四合一體系基礎(chǔ)知識(shí)培訓(xùn)課件
- ICD-9-CM-3手術(shù)與操作國(guó)家臨床版亞目表
評(píng)論
0/150
提交評(píng)論