




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、精品文檔精品文檔第9章含定性變量的回歸模型思考與練習參考答案9.1 一個學生使用含有季節(jié)定性自變量的回歸模型,對春夏秋冬四個季節(jié)引入 4個0-1型自變量,用SPSS軟件計算的結果中總是自動刪除了其中的一個自變量, 他為此感到困惑不解。出現(xiàn)這種情況的原因是什么? 答:假如這個含有季節(jié)定性自變量的回歸模型為:X = % + 3梯牡 + UXkt 山牡 +sD2t +SD3F其中含有k個定量變量,記為X。對春夏秋冬四個季節(jié)引入4個0-1型自變量, 記為D,只取了 6個觀測值,其中春季與夏季取了兩次,秋、冬各取到一次觀測 值,則樣本設計矩陣為:1YaX11Xk11000、1VX12Xk20100(X,
2、 D )=1VX13Xk300101YX14Xk400011YaX15X k501007YaX16Xk61000顯然,(X,D)中的第1列可表示成后4列的線性組合,從而(X,D)不滿秩,參 數(shù)無法唯一求出。這就是所謂的 虛擬變量陷井”,應避免當某自變量xj對其余p-1個自變量的復判定系數(shù)R2超過一定界限時,SPSS 軟件將拒絕這個自變量 為進入回歸模型。稱Tolj=1- R2為自變量為的容忍度(Toleranee ),SPSS軟件的默認容忍度為 0.0001。也就是說,當R2 0.9999 時,自變量Xj將被自動拒絕在回歸方程之外,除非我們修改容忍度的默認值。而在這個模型中出現(xiàn)了完全共線性,所
3、以SPSS軟件計算的結果中總是自動刪除了其中的一個定性自變量。9.2對自變量中含有定性變量的問題,為什么不對同一屬性分別建立回歸模型, 而采取設虛擬變量的方法建立回歸模型?答:原因有兩個,以例9.1說明。一是因為模型假設對每類家庭具有相同的斜率 和誤差方差,把兩類家庭放在一起可以對公共斜率做出最佳估計;二是對于其他統(tǒng)計推斷,用一個帶有虛擬變量的回歸模型來進行也會更加準確,這是均方誤差的自由度更多。9.3研究者想研究采取某項保險革新措施的速度y對保險公司的規(guī)模xi和保險公司類型的關系(參見參考文獻【3】)。因變量的計量是第一個公司采納這項 革新和給定公司采納這項革新在時間上先后間隔的月數(shù)。第一個
4、自變量公司的 規(guī)模是數(shù)量型的,用公司的總資產額(百萬美元)來計量;第二個自變量公司 是定性變量,由兩種類型構成,即股份公司和互助公司。數(shù)據(jù)資料見表9.8,試建立y對公司規(guī)模和公司類型的回歸。表9.8iyX1公司類型117151互助22692互助321175互助43031互助522104互助60277互助712210互助819120互助94290互助1016238互助1128164股份1215272股份1311295股份143868股份153185股份1621224股份1720166股份1813305股份1930124股份2014246股份解:對定型變量“公司類型”進行數(shù)量化處理:引入虛擬變量X
5、2:公司類型為“互助”時,X2=1,為“股份”時,X 2=0則表9.5中數(shù)據(jù)轉換成以下數(shù)據(jù):iyX1公司類型1171511226921321175143031152210416027717122101819120194290110162381112816401215272013112950143868015318501621224017201660181330501930124020142460建立回歸方程y = b0+b1X1+b2X2+ e用SPSS軟件作線性回歸,得到輸出結果如下:Model Summ aryModelRR SquareAdjusted R SquareStd. E rr
6、or of the Estimate1.946 a.895.8833.221a. Predictors: (Constant),公司類型,x1R檢驗:擬合優(yōu)度R=0.883,接近1,說明回歸擬合的效果較好ANOVA bModelSum of SquaresdfMean SquareFSig.1Regressi on1504.4132752.20772.497.000 aResidual176.3871710.376Total1680.80019a. Predictors: (Constant),公司類型,x1b. Depe ndent Variable: yF檢驗:F值=72.497, Sig
7、.值為0,說明回歸方程通過F檢驗Coe fficientsModelUn sta ndardized Coefficie ntsStan dardized Coefficie ntstSig.BStd. ErrorBeta1(Co nsta nt)41.9302.01020.859.000x1-.102.009-.911-11.443.000公司類型-8.0551.459-.439-5.521.000a. Depe ndent Variable: yT檢驗:回歸系數(shù)通過t檢驗,回歸方程為:y= 41.930 - 0.102 x 1 8.055 x 2說明:若引入虛擬變量X2,當公司類型為“互助
8、”時,X2=0,為“股份”時,X 2 = 1則回歸方程為:y= 33.874 - 0.102x1 + 8.055x2結果分析:(1) 股份制公司采取保險革新措施的積極性比互助型公司高,原因可能在于股 份制公司建立在共同承擔風險上,所以更愿意革新;(2) 公司規(guī)模越大,采取保險革新措施的傾向越大:大規(guī)模公司的保險制度的 更新對公司的影響程度比小規(guī)模公司大,因此大規(guī)模公司更傾向于比較更新措施 和現(xiàn)有政策帶來的效益,最終表現(xiàn)在采納革新措施的時間間隔較短。9.4 .表9.9的數(shù)據(jù)是我國歷年鐵路里程數(shù)據(jù),根據(jù)散點圖觀察在某時間點有折 點,用折線回歸擬合這個數(shù)據(jù)。解:由散點圖9(見下圖)可看出在1995年
9、(t=16)有折點,考慮由兩段構成的 分段線性回歸,這可以通過引入一個 0-1型虛擬自變量實現(xiàn)。由散點圖可知該折點為t=16,則引入虛擬自變量x,0,t 蘭 16X =t 16,t 16由SPSS俞出的調整后的決定系數(shù)RS 0.980,說明擬合優(yōu)度較好由輸出的系數(shù)表可以得出回歸方程為:0 =5.183 0.055t 0.106x由SPSS俞出方程分析表可知,F(xiàn)值為594.524,且P值約為零,說明回歸方程非 常顯著;系數(shù)表中回歸參數(shù)對應的t檢驗P值都約等于零,說明回歸參數(shù)均通過了顯著性 檢驗。因此,折線方程成立。7.50-G.50-.00-5.5020250散點圖方差分析表ANOVA bMod
10、elSum of SquaresdfMean SquareFSig.1Regressi on11.11325.557594.524.000 aResidual.20622.009Total11.31924a Predictors: (Con sta nt), x, tb. Depe ndent Variable: y系數(shù)表Coe fficientsModelUn sta ndardized Coefficie ntsStan dardized Coefficie ntstSig.BStd.ErrorBeta1(Co nsta nt)5.183.049106.303.000t.055.005.5
11、8911.859.000x.106.012.4509.065.000a. Depe ndent Variable: y9.5某省統(tǒng)計局1990年9月在全省范圍內進行了一次公眾安全感問卷調查,參 考文獻【10】選取了調查表中的一個問題進行分析。本題對其中的數(shù)據(jù)做了適當?shù)暮喜?。?391人填寫的問卷設計:“一人在家是否害怕生人來”。因變量 y=1表示害怕,y=2表示不害怕。2個自變量:x1是年齡,x2是文化程度。各變 量的取值含義如表9.10所示。表 9.10是否害怕y年齡x1文化程度x2害怕11628歲22文盲0不害怕 02945歲37小學14660歲53中學261歲以上68中專以上3現(xiàn)在的問題
12、是:公民一人在家害怕生人來這個事件,與公民的年齡x1、文化程度x2有沒有關系呢?調查數(shù)據(jù)見表 9.11 o表 9.11序 號X1X2niy=1y=0pi12203090.12500222111380.2916732223891462430.3756442238326570.3154853704310.700006371271890.6607173724871962910.40266837310327760.264429535309450.45000105316330.5000011532188731150.38889126834718290.38542136802020.16667146811
13、0370.3181815682187110.394741634040.10000其中,pi是根據(jù)(9.44)式計算的。(1) 把公民的年齡x1、文化程度x2作為數(shù)值型變量,建立y對x1、x2的 logistic 回歸。(2) 把公民的年齡x1、文化程度x2作為定性型變量,用0-1變量將其數(shù)量化, 建立y對公民的年齡和文化程度的logistic 回歸。(3) 你對回歸的效果是否滿意,你認為主要的問題是什么?解: 先對P進行邏輯變換,令p=ln(-B),則1- PiPi = -0 -必1 -2X2;i直接用SPSS!行y與x1、x2的logistic回歸,輸出結果如下:ANOVA bModelSu
14、m ofSquaresdfMean SquareFSig.1Regressi on.5622.281.386.687 aResidual9.45913.728Total10.02015a. Predictors: (Con sta nt), x2, x1b. Depe ndent Variable: ppiModelUn sta ndardized Coefficie ntsStan dardized Coefficie ntstSig.BStd.ErrorBeta1(Co nsta nt)-.144.662-.218.831x1-.006.012-.137-.510.619x2-.136.1
15、91-.193-.715.487Coe fficientsaa. Depe ndent Variable: ppi由SPSS輸出系數(shù)表結果得到回歸方程:p =-0.144-0.006 x1-0.136 x2則還原后logistic回歸方程為:exo( -0.144 - 0.006捲 一 0.136x2)?=1 exp(-0.144 -0.006x1 - 0.136x2)由方差分析表知F值=0.386,P值=0.687,大于5%說明回歸方程不顯著;由系數(shù)表知回歸參數(shù)的t檢驗均沒有通過,因為P值都大于5%說明回歸參數(shù) 未通過顯著性檢驗。由于logistic回歸模型存在異方差,所以采用加權最小二乘法
16、重新擬合,權重:i =niP/1 - pjSPS輸出結果如下:ANOVA b,cModelSum of SquaresdfMean SquareFSig.1Regressi on8.39324.1974.304.037 aResidual12.67613.975Total21.06915a. Predictors: (Co nsta nt), x2, x1b. Depe ndent Variable: ppic. Weighted Least Squares Regressi on - Weighted by w iCoe fficientsModelUn sta ndardized Coef
17、ficie ntsStan dardized Coefficie ntstSig.BStd.ErrorBeta1(Co nsta nt).146.309.472.645x1.002.005.086.398.697x2-.331.116-.617-2.858.013a. Depe ndent Variable: ppib. Weighted Least Squares Regressi on - Weighted by w i由輸出結果得到回歸方程:f? =0.146 0.002捲-0.33俶2exp( 0.1460.002x1-0.331x2)還原后的回歸萬程:B=-1 +exp(0.146
18、+0.002x1 -0.331x2)由方差分析表結果知:F值=4.304 , P值=0.037,小于5%說明回歸方程顯著; 由系數(shù)表知捲對應的回歸系數(shù)相應的 P值=0.697,大于5%說明捲對應的回歸 系數(shù)沒有通過檢驗,不顯著;X2對應的回歸系數(shù)相應的P值=0.013,小于5%說明X2對應的回歸系數(shù)通過檢 顯著性驗,且該回歸系數(shù)為-0.331,表明文化程度越高越不害怕。(2)把公民的年齡x1、文化程度x2作為定性型變量,引入6個0-1變量表示年齡x1=22I0,x22x2 =乜7=37JI0,x=37x3 = 53,片=53.0,x 式 531,x2 = 00X2“1,冷=1x231,皆20,
19、x2 - 21)直接進行y與6個虛擬變量的未加權的logistic 回歸,SPSS俞出結果如下:由方差分析表知F=2.472 , P值=0.106,大于5%說明回歸方程不顯著;且 除了外,其它自變量對應的回歸系數(shù)都沒通過檢驗。ANOVA bModelSum ofSquaresdfMean SquareFSig.1Regressi on4.74341.1862.472.106aResidual5.27711.480Total10.02015a. Predictors: (Co nsta nt), x13, x2, x12, x11b. Depe ndent Variable: ppiModelU
20、nstandardizedCoefficientsStandardizedCoefficientstSig.BStd.E rrorBeta1(Constant)-1.044.417-2.505.029x2-.136.155-.193-.881.397x11.220.490.120.449.662x121.273.490.6972.600.025x13.969.490.5301.979.073Coe fficientsaa. Dependent Variable: ppi下面通過后退法選擇變量對上述模型改進SPSS俞出結果如下表:ANOVAdModelSum of SquaresdfMean S
21、quareFSig.1Regressi on4.74341.1862.472.106aResidual5.27711.480Total10.020152Regressi on4.64731.5493.459.051 bResidual5.37412.448Total10.020153Regressi on4.27422.1374.835.027 cResidual5.74613.442Total10.02015a Predictors: (Co nsta nt), x13, x2, x12, x11b. Predictors: (Co nsta nt), x13, x2, x12c. Pred
22、ictors: (Con sta nt), x13, x12d. Depe ndent Variable: ppiCoe fficients aModelUnstandardizedCoefficientsStandardizedCoefficientstSig.BStd.E rrorBeta1(Constant)-1.044.417-2.505.029x2-.136.155-.193-.881.397x11.220.490.120.449.662x121.273.490.6972.600.025x13.969.490.5301.979.0732(Constant)-.934.326-2.86
23、5.014x2-.136.150-.193-.912.380x121.163.410.6362.838.015x13.859.410.4702.097.0583(Constant)-1.139.235-4.846.000x121.163.407.6362.857.013x13.859.407.4702.110.055a Dependent Variable: ppi后退法的過程中剔除了 x11, x2 ,留下了 x12, x13,但是x13對應的回歸系數(shù)未通過檢驗,將其剔除,最后留下了 x12 ;而且回歸方程顯著,2)加權回歸:用后退法選擇變量,由輸出結果(如下)可知最后只留下了X2ANOVA
24、ModelSum of SquaresdfMean SquareFSig.1Regression9.97942.4952.475.106 aResidual11.090111.008Total21.069152Regression9.52633.1753.301.058 bResidual11.54312.962Total21.069153Regression8.87024.4354.726.029 cResidual12.19913.938Total21.069154Regression8.23818.2388.989.010dResidual12.83114.916Total21.0691
25、5a. Predictors: (Constant), x13, x2, x11, x12b. Predictors: (Constant), x13, x2, x12c. Predictors: (Constant), x2, x12d. Predictors: (Constant), x2e. Dependent Variable: ppif. Weighted Least Squares Regression - Weighted by w iCoe fficients a,bModelUnstandardizedCoefficientsStandardized CoefficientstSig.BStd.ErrorBeta1(Constant)-.092.425-.217.832x2-.344.118-.641-2.901.014x11.263.392.490.
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 美國 教學設計-2024-2025學年人教版地理七年級下冊
- 2024-2025學年湖南省新邵縣高一上冊10月聯(lián)考數(shù)學檢測試題
- 第一單元Flash動畫初步第2課三、《改變對象的不透明度》教學設計 2023-2024學年人教版初中信息技術八年級上冊
- 出租毛坯房裝修合同范例
- 縣城郊區(qū)房屋買賣合同范本
- 修理電機合同范例
- 合作意愿合同范例
- 產品互換合同范例
- 與店簽定合同范例
- 業(yè)主購買瓷磚合同范例
- 2024年貴州蔬菜集團有限公司招聘筆試參考題庫附帶答案詳解
- 國際貿易(對外經(jīng)濟貿易大學)智慧樹知到期末考試答案2024年
- 高級審計師《審計理論與審計案例分析》真題
- 營養(yǎng)健康食堂建設指南
- 邯鄲市2024屆高三第三次調研考試(一模)物理試卷
- 酒店公共區(qū)域電梯安全使用培訓
- 【初中語文】第6課《老山界》課件 2023-2024學年統(tǒng)編版語文七年級下冊
- 銀行法律法規(guī)
- 道路貨物運輸經(jīng)營申請表
- 班級家長群管理制度
- 《秘書文檔管理》思考與實訓習題及答案 -第4章
評論
0/150
提交評論