




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
#上機練習5LOGISTIC回歸分析與因子分析本上機練習的主要目的:熟悉如何利用SPSS軟件來進行Logistic回歸分析與因子分析。本練習所使用數(shù)據(jù)文件為“T3_2.sav”和“Apart2.sav"。1-LOGISTIC回歸分析Q:如何利用Logistic回歸模型來考察大學生的不同特征對他們是否在外租房具有顯著的影響?(數(shù)據(jù)文件為“Apart2.sav”)該數(shù)據(jù)文件來自于2000年對北京市高校大學生在外租房的調查,具體請查看數(shù)據(jù)字典文件“Apart2_dct.doc”。打開上述數(shù)據(jù)文件后,我們從主菜單中選擇AnalyzedRegression^BinaryLogistic...,分另I」將變量rental和age、sex、school、educat、grade和income選入“Dependent”和“Covariate(s)”?!癕ethod”中選擇默認的“Enter”,即模型中包括上述全部自變量。點擊最下面的“Categorical...”,將分類變量sex、school、educat、grade選入“CategoricalCovariates”中。然后分另選中這4個變量,并逐一在“Contrast”中選擇Simple”(即自變量中除參照組之外的各類分別與參照組比較)和點擊Change”。上述動作連續(xù)操作4次(注意:我們以每個分類變量的最后一類為參照組)。完成后點擊“Continue”返回。點擊“0K”,即得到以下結果(SPSS系統(tǒng)默認進行兩步求解,在第一步“Step0”,模型沒有包括自變量,只有截距。通常這一步所得到的模型是無意義的。如果
進行逐步回歸或利用變量組可能需要更多的求解步驟。)OmnibusTestsofModelCoefficientsChi-squaredfSig.Step1Step50.34512.000Block50.34512.000Model50.34512.000ModelSummaryStep-2LoglikelihoodCox&SnellRSquareNagelkerkeRSquare1393.948a.119.177a.Estimationterminatedatiterationnumber5becauseparameterestimateschangedbylessthan.001.上述-2Loglikelihood、Cox&SnellRSquare和NagelkerkeRSquare的結果都沒有太大的意義,我們只需了解即可,不要輕易利用這些統(tǒng)計量像線性回歸模型中的R2—樣來解釋模型的擬合程度。ClassificationTablea,bObservedPredictedeverrentPercentageCorrectnoyesStep0everrentno3000100.0yes980.0OverallPercentage75.4Constantisincludedinthemodel.Thecutvalueis.500ClassificationTableaObservedPredictedeverrentPercentageCorrectnoyesStep1everrentno2871395.7yes791919.4OverallPercentage76.9a.Thecutvalueis.500Step1中分類表的預測正確率為76.9%,略高于Step0中分類表的75.4%,表明模型的擬合程度還可以。
BS.E.WalddfBS.E.WalddfSig.Exp(B)AGE.216.0787.6901.0061.241SEX(1).606.2714.9851.0261.833SCHOOL18.6154.001SCHOOL(1)-1.424.4758.9871.003.241SCHOOL(2)-1.290.4577.9561.005.275SCHOOL(3).130.450.0841.7721.139SCHOOL(4)-.988.4634.5491.033.372EDUCAT1.9552.376EDUCAT(1).652.6231.0931.2961.919EDUCAT(2).131.504.0681.7941.141GRADE.2943.961GRADE(1).307.608.2561.6131.360GRADE(2).178.576.0961.7571.195GRADE(3).162.601.0731.7871.176INCOME.000.000.4931.4831.000Constant-5.9431.71512.0021.001.003VariablesintheEquationa.Variable(s)enteredonstep1:AGE,SEX,SCHOOL,EDUCAT,GRADE,INCOME.上述結果表明,大學生的年齡、性別和其所在學校對他們是否在外租房具有顯著的影響,而大學生的學歷層次、年級和可支配收入對他們是否在外租房的影響并不顯著。不過,需要提醒大家的是,我們只是在SPSS的“Categorical…”中將那些定類自變量加以定義,而并沒有事先用一些相應的虛擬變量來表示。更好的方式或者說更符合學術習慣的做法是:先將那些定類變量用某些虛擬變量來表示,然后再進行Logistic回歸分析。我們將上述定類自變量分別用相應的虛擬變量來表示(這可以用“Transform”“Recode”來實現(xiàn))。于是,我們會得到以下結果,大家可以與上表加以比較:VariablesintheEquationBS.E.WalddfSig.Exp(B)AGE.216.0787.6901.0061.241MALE■606.2714.9851.0261.833BD-1.424.4758.9871.003.241QH-1.290.4577.9561.005.275RD.130.450.0841.7721.139PL-.988.4634.5491.033.372UNIV-.520.3811.8651.172.594MASTER-.652.6231.0931.296.521GRAD_4-.307.608.2561.613.735GRAD_3-.145.423.1181.731.865GRAD_2-.129.368.1241.725.879INCOME.000.000.4931.4831.000Constant-4.9951.6029.7281.002.007a.Variable(s)enteredonstep1:AGE,MALE,BD,QH,RD,PL,UNIV,MASTER,GRAD_4,GRAD_3,GRAD_2,INCOME.不過,到目前為止,我們只是知道大學生的不同特征對其是否外出租房影響的顯著性,我們并不知道對其外出租房概率的影響程度,比如,年齡增加1歲會導致外出租房的概率增加多少。這個問題涉及到如何獲得Logistic回歸模型的邊際影響:如果自變量為連續(xù)變量,如年齡Age,我們可利用大學生外岀租房概率對其的偏導數(shù)來獲得:OP{r=IIX,X,X,123-OXkTOC\o"1-5"\h\z}°exp?+Xp+OP{r=IIX,X,X,123-OXk_=卩0J2233k(1+exp(P+XP+XP+XP+)》0112233…其中:其它自變量如果為定量變量,則取平均值代入;如果為虛擬(定類)變量,則取該變量為1的比例代入。上述均值我們可以通過描述性統(tǒng)計得到:DescriptiveStatisticsNMinimumMaximumMeanStd.Deviationeverrent48501.28.450age493173621.412.563dispossibleincome453204000605.41431.665MALE49401.52.500BD47101.20.402QH47101.22.414RD47101.21.406PL47101.21.411UNIV48901.50.501MASTER48901.26.441GRAD_449901.06.242GRAD_349901.24.427GRAD_2ValidN(listwise)46539801.36.481于是,我們可以計算得到大學生的年齡對其外出租房概率的邊際影響為0.0381,即在其他方面特征相同的情形下,大學生的年齡每增加1歲會導致外出租房的概率增加3.81%。(大家可以將相應的數(shù)據(jù)復制到excel中,然后利用sumproduct函數(shù)就可以得到)如果自變量為虛擬變量,比如性別Male,我們可直接利用該變量從0變化到1所造成的概率變化來表示:TOC\o"1-5"\h\zap{r二11X,X,X,—1231+exp(卩+X卩+X卩+X卩++0X卩+)0112233k…1/?????\1+exp(P+XP+XP+XP+~~+1xP+)0112233k其中:其它自變量如果為定量變量,則取平均值代入;如果為虛擬(定類)變量,則取該變量為1的比例代入。于是,我們可以得到大學生的性別對其外出租房概率的邊際影響為0.1058,即在其他方面特征相同的情形下,男生比女生外出租房的概率大10.58。大家可以試著計算一下,看是否與我計算的結果相同?2.因子分析生育率的影響因素分析。生育率受社會、經(jīng)濟、文化、計劃生育政策等很多因素影響,但這些因素對生育率的影響并不是完全獨立的,而是交織在一起的。
如果直接利用選定的變量對生育率進行多元回歸分析,可能會存在多重共線性問題,造成部分信息的丟失。因此,我們需要先對自變量進行因子分析,找出基本的數(shù)據(jù)結構,然后再用新生成的因子對生育率進行多元回歸分析。1我們所選擇的變量包括:多孩率(X1)、節(jié)育率(x2)、初中以上文化程度的人口比例(x3)、人均國民收入(x4)和城鎮(zhèn)人口比例(x5)。所使用數(shù)據(jù)文件為“T3_2.sav”,所對應的數(shù)據(jù)字典為“T3_2_dct.doc”。打開數(shù)據(jù)集“T3_2.sav”后,我們從主菜單中選擇AnalyzedDataReduction9Factor...,將上述5個變量全部選入“Variables”。點擊下面的“Descriptives",在彈出的對話框中選擇“Initialsolution(最初解)"、“Coefficients(觀測變量的相關系數(shù)矩陣)"、“Significancelevels(每個相關系數(shù)的顯著性水平)"、“Reproduced(由因子模型估計出的相關系數(shù)及殘差)”和“KMOandBartlett'stestofsphericity(KMO測度和Bartlett球體檢驗)”。1:id蘭舊|副團門|胡函|£|翻囲罔匪|劃坐懾|陽⑥|123456789101112131415161:id蘭舊|副團門|胡函|£|翻囲罔匪|劃坐懾|陽⑥|12345678910111213141516idx1簸'id<^>multi-childrenrate[:-:1]發(fā)birthcontrolrate[:-:2]<^>populationratioofjunii:‘::軫averagenationali門匚o「i<^>urbanpopulationratio|Variables:123
varvarvar-Statistics一廠UnivariatedescriptivesPInitialsolutionvarOKPasteResetCancelHelpCorrelalionMatrix或Coefficienb廠Inverse破Signifiesnc皂I皂”已k兩Reproduced廠DeterminantI-Anti-imageKMOandBartlett'stestofsphericitySelectionVariable:y.u4SOUII!□.茲Descriptives...IExtraction...IRotation...Scores...Options...Value...oo./D|點擊“Continue”返回。點擊“Extraction”,在彈出的對話框中選擇“Unrotatedfactorsolution(未經(jīng)旋轉的因子解)"和“Screeplot(碎石圖)",其它選擇默認。注意:默認的提取因子方法為Principalcomponents(主成分分析)。1此例題來自于《社會統(tǒng)計分析方法——SPSS軟件應用》第93頁,郭志剛主編(2007),中國人民大學出版社。
ididx2x3x53Variables:OK56ResetDCancel8Help91011SelectionVariable:D12Value.13141516<S>?2@x3x4瞬x5Descriptives...I<^>multi-childrenrate[x1]?birthcontrolrate[m2]⑥populationratioofjunic燼>averagenationalincon影urbanpopulationratio|丄2|旨—SPSSDataEditorFileEdit¥iewTrarLsformAnalyzeGraphsUtilitiesWindowHelpididx2x3x53Variables:OK56ResetDCancel8Help91011SelectionVariable:D12Value.13141516<S>?2@x3x4瞬x5Descriptives...I<^>multi-childrenrate[x1]?birthcontrolrate[m2]⑥populationratioofjunic燼>averagenationalincon影urbanpopulationratio|丄2|旨—SPSSDataEditorFileEdit¥iewTrarLsformAnalyzeGraphsUtilitiesWindowHelpFactorAnalysis:Extraction目舊I劇國I"I:“I岡I韻l?l魚I樨隹I圜垂I匿I颶魁MaximumIterationsforConvergence:(25_-Extract——f*Eigenvaluesover:|l「Numberoffactors:「Method:-AnalyzeCorrelationmatrix'■'Covariancematrix匝ScreeplotContinueCancelHelp-Display—7Unrotatedfactorsolution|F'「i匚ip日I匚口「「1p匚i「舊門垃J|Extraction...IRotation...IScores...Options...TOiZiiZi.Ci~點擊“Continue”返回。點擊Rotation",在彈出的Method對話框中選擇Varimax(方差最大法)",在Display對話框中選擇“Rotatedsolution(旋轉后的因子解)"和“Loadingplot(s)(因子負載圖)",其它選擇默認。發(fā)id?multi-childrenrate[:-:1]?birthcontrolrate[:-:2]populationratioofjunic<$>averagenationalincon<$>urbanpopulationratio|x5varvarvarvarx1idOKPasteFlesetCancelHelp-Method—CNoneVarimaxCDirectOblimin
Delta:[o發(fā)id?multi-childrenrate[:-:1]?birthcontrolrate[:-:2]populationratioofjunic<$>averagenationalincon<$>urbanpopulationratio|x5varvarvarvarx1idOKPasteFlesetCancelHelp-Method—CNoneVarimaxCDirectOblimin
Delta:[oCQuartimaxCEquamaKCPromaxKappapDisplay一WRotatedsolutionPLoadingplot(s]16SelectionVariable:MaximumIterationsforConvergence:Descriptives...IExtraction...IRotation...IScores...Options...T5iziizi./tidy./IBBOib.Jziz:ContinueCancelHelp昌T/_2-SPSSDataEditorFileE^itViewHataTransformAiL:dlyzeGraphsUtilitiesWindowHelp目舊直I團口|c|畫|益|審|戲]潤韻劃血周叵創(chuàng)1:id點擊“Continue”返回。點擊“Scores”,在“Displayfactorscorecoefficientmatrix顯示因子分數(shù)的系數(shù)矩陣)”前打上勾。曲舊I劉團廠||社|卬開*r『-|口蟲|匚|區(qū)o)|1:id1idx1x2x3x4x5varvarvarvarDHelpValue...nSelectionVariable:岡廠SaveasvariablesMethodi忖FlegressiunCBartlett「Anderson-RubinWDisplayfactorscorecoefficientmatrix<^>id<^>multi-childrenrate[k1]<^>birthcontrolrate[x2]‘::曲舊I劉團廠||社|卬開*r『-|口蟲|匚|區(qū)o)|1:id1idx1x2x3x4x5varvarvarvarDHelpValue...nSelectionVariable:岡廠SaveasvariablesMethodi忖FlegressiunCBartlett「Anderson-RubinWDisplayfactorscorecoefficientmatrix<^>id<^>multi-childrenrate[k1]<^>birthcontrolrate[x2]‘::軫populationratioofiunic<^>averagenationali門匚o「i':絵urbanpopulationratio|CancelDescriptives...IExtraction...IRotation...Scores...Options...點擊“Continue”返回。點擊“Options”值的大小排列)”前打上勾。[eee]T3_2-SPSSDataEditorFileEditViewDataTr:=LTLsformArL:ilyzeGraphs;UtilitWindowHelp目舊咼I團十|函I訶勖I囲罔匪I圜涸周廨⑥I1:ld1id,在“Sortedbysize(因子負載按絕對123456789101112131415x1x2x3x4x5varvarvarvarOKvar劎d⑥multi-childrenrate[:-:1]燼>birthcontrolrate[:-:2]':騎populationratioofjunic'⑥日”已ragenationalincon'⑥urbanpopulationratio|Variables:PasteResetCancelHelp-MissingValues—席ExcludecaseslistwiseCExcludecasespairwiseCFleplacewithmean一CoefficientDisplayFormat一兩Sortedbysize廠Suppressabsolutevalueslessthan:SelectionVariable:Descriptives...IExtraction...|Flotation...Scores...Options...甘制ue...|點擊“COntinue”返回,點擊“OK”J我們得到以下結果:CorrelationMatrixmulti-childrenratebirthcontrolratepopulationratioofjuniormiddleandaboveaveragenationalincomeurbanpopulationratioCorrelationmulti-childrenrate1.000-.761-.542-.453-.453birthcontrolrate-.7611.000.293.253.245populationratioofjuniormiddleandabov、-.542.2931.000.771.849averagenationalincome-.453.253.7711.000.878urbanpopulationratio-.453.245.849.8781.000Sig.(1-tailed)multi-childrenrate.000.001.006.006birthcontrolrate.000.058.089.096populationratioofjuniormiddleandabov、.001.058.000.000averagenationalincome.006.089.000.000urbanpopulationratio.006.096.000.000KMOandBartlett'sTestKaiser-Meyer-OlkinMeasureofSamplingAdequacy..713Bartlett'sTestofApprox.Chi-Square106.776Sphericitydf10Sig..000上述結果表明,多孩率和節(jié)育率之間存在著較強的相關關系,而其它三個變量之間存在著較強的相關關系,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 物流業(yè)無人機配送技術應用方案
- 房地產(chǎn)業(yè)合伙經(jīng)營協(xié)議書
- 典當合同典當行借款合同
- 取土場施工方案
- 西寧抗風門施工方案
- 環(huán)境影響評價及保護方案手冊
- 四干渠電站施工方案
- 空心方樁施工方案
- 醫(yī)院智能化施工方案
- 電梯消防施工方案范本
- 《中國資本市場》課件
- 農(nóng)機檢修培訓課件
- 2025車位租賃合同范本
- 2025年學校信息中心工作計劃
- VR游戲設計與制作知到智慧樹章節(jié)測試課后答案2024年秋四川長江職業(yè)學院
- 平行線的判定與性質證明題專訓30題(人教版)(人教版) 帶解析
- 心理咨詢倫理守則
- 【MOOC】森林植物識別技術 -珍稀植物識別-南京森林警察學院 中國大學慕課MOOC答案
- 《學習雷鋒好榜樣》課件
- 2024解析:第十八章電功率-講核心(解析版)
- 廣告品印刷行業(yè)發(fā)展概況及未來三年行業(yè)發(fā)展趨勢預測
評論
0/150
提交評論