




版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、.第七章第七章 相關(guān)分析和線(xiàn)性回歸分析相關(guān)分析和線(xiàn)性回歸分析.一、相關(guān)分析和回歸分析概述一、相關(guān)分析和回歸分析概述v相關(guān)分析和回歸分析都是分析客觀(guān)事物之相關(guān)分析和回歸分析都是分析客觀(guān)事物之間關(guān)系的數(shù)量分析方法。間關(guān)系的數(shù)量分析方法。v客觀(guān)事物之間的關(guān)系大致可以歸納為客觀(guān)事物之間的關(guān)系大致可以歸納為2 2類(lèi):類(lèi):函數(shù)關(guān)系:兩事物之間一一對(duì)應(yīng)的關(guān)系。函數(shù)關(guān)系:兩事物之間一一對(duì)應(yīng)的關(guān)系。統(tǒng)計(jì)關(guān)系:兩事物之間的一種非一一對(duì)應(yīng)的統(tǒng)計(jì)關(guān)系:兩事物之間的一種非一一對(duì)應(yīng)的關(guān)系。統(tǒng)計(jì)關(guān)系可再進(jìn)一步分為線(xiàn)性相關(guān)關(guān)系。統(tǒng)計(jì)關(guān)系可再進(jìn)一步分為線(xiàn)性相關(guān)和非線(xiàn)性相關(guān)和非線(xiàn)性相關(guān)正相關(guān):兩個(gè)變量線(xiàn)性的相隨變動(dòng)方向相同。正相
2、關(guān):兩個(gè)變量線(xiàn)性的相隨變動(dòng)方向相同。負(fù)相關(guān):兩個(gè)變量線(xiàn)性的相隨變動(dòng)方向相反。負(fù)相關(guān):兩個(gè)變量線(xiàn)性的相隨變動(dòng)方向相反。.v事物之間的函數(shù)關(guān)系比較容易分事物之間的函數(shù)關(guān)系比較容易分析和測(cè)度,而統(tǒng)計(jì)關(guān)系卻不像函析和測(cè)度,而統(tǒng)計(jì)關(guān)系卻不像函數(shù)關(guān)系那樣直接,但確實(shí)普遍存數(shù)關(guān)系那樣直接,但確實(shí)普遍存在,并且有的關(guān)系強(qiáng),有的關(guān)系在,并且有的關(guān)系強(qiáng),有的關(guān)系弱,程度各異。相關(guān)分析和回歸弱,程度各異。相關(guān)分析和回歸分析正是以不同的方式測(cè)度事物分析正是以不同的方式測(cè)度事物間統(tǒng)計(jì)關(guān)系的非常有效的工具。間統(tǒng)計(jì)關(guān)系的非常有效的工具。.二、相關(guān)分析二、相關(guān)分析v通過(guò)圖形和數(shù)值兩種方式,能夠通過(guò)圖形和數(shù)值兩種方式,能夠有效
3、地揭示事物之間統(tǒng)計(jì)關(guān)系的有效地揭示事物之間統(tǒng)計(jì)關(guān)系的強(qiáng)弱程度。強(qiáng)弱程度。v散點(diǎn)圖:將數(shù)據(jù)以點(diǎn)的形式畫(huà)在散點(diǎn)圖:將數(shù)據(jù)以點(diǎn)的形式畫(huà)在直角平面上。(直觀(guān))直角平面上。(直觀(guān))v相關(guān)系數(shù)相關(guān)系數(shù).(二)散點(diǎn)圖(二)散點(diǎn)圖v含義含義v簡(jiǎn)單散點(diǎn)圖:生成一對(duì)相關(guān)變量的散簡(jiǎn)單散點(diǎn)圖:生成一對(duì)相關(guān)變量的散點(diǎn)圖點(diǎn)圖v重疊散點(diǎn)圖:生成多對(duì)相關(guān)變量的散重疊散點(diǎn)圖:生成多對(duì)相關(guān)變量的散點(diǎn)圖點(diǎn)圖v矩陣散點(diǎn)圖:同時(shí)生成多對(duì)相關(guān)變量矩陣散點(diǎn)圖:同時(shí)生成多對(duì)相關(guān)變量的矩陣散點(diǎn)圖的矩陣散點(diǎn)圖v三維散點(diǎn)圖:生產(chǎn)成三個(gè)變量之間的三維散點(diǎn)圖:生產(chǎn)成三個(gè)變量之間的三維散點(diǎn)圖三維散點(diǎn)圖.散點(diǎn)圖的基本操作散點(diǎn)圖的基本操作v簡(jiǎn)單散點(diǎn)圖簡(jiǎn)單散
4、點(diǎn)圖v重疊散點(diǎn)圖重疊散點(diǎn)圖v矩陣散點(diǎn)圖矩陣散點(diǎn)圖v三維散點(diǎn)圖三維散點(diǎn)圖.練習(xí)練習(xí)v高校科研研究高??蒲醒芯?sav:.sav:v繪制課題總數(shù)與論文數(shù)的簡(jiǎn)單散點(diǎn)繪制課題總數(shù)與論文數(shù)的簡(jiǎn)單散點(diǎn)圖,并分析它們之間的線(xiàn)性關(guān)系。圖,并分析它們之間的線(xiàn)性關(guān)系。v繪制課題總數(shù)、投入科研經(jīng)費(fèi)以及繪制課題總數(shù)、投入科研經(jīng)費(fèi)以及論文數(shù)的矩陣散點(diǎn)圖,并分析它們論文數(shù)的矩陣散點(diǎn)圖,并分析它們之間的線(xiàn)性關(guān)系。之間的線(xiàn)性關(guān)系。.相關(guān)系數(shù)相關(guān)系數(shù)v雖然散點(diǎn)圖能夠直觀(guān)的展現(xiàn)變量之間的統(tǒng)雖然散點(diǎn)圖能夠直觀(guān)的展現(xiàn)變量之間的統(tǒng)計(jì)關(guān)系,但并不精確。相關(guān)系數(shù)以數(shù)值的計(jì)關(guān)系,但并不精確。相關(guān)系數(shù)以數(shù)值的方式精確的反映了兩個(gè)變量間線(xiàn)性相關(guān)
5、的方式精確的反映了兩個(gè)變量間線(xiàn)性相關(guān)的強(qiáng)弱程度,利用相關(guān)系數(shù)進(jìn)行變量間線(xiàn)性強(qiáng)弱程度,利用相關(guān)系數(shù)進(jìn)行變量間線(xiàn)性關(guān)系的分析通常需要完成以下兩大步驟。關(guān)系的分析通常需要完成以下兩大步驟。v計(jì)算樣本相關(guān)系數(shù)計(jì)算樣本相關(guān)系數(shù)r。(不同類(lèi)型的變量。(不同類(lèi)型的變量應(yīng)采用不同的相關(guān)系數(shù)指標(biāo),但他們的取應(yīng)采用不同的相關(guān)系數(shù)指標(biāo),但他們的取值范圍和含義都是相同的。)值范圍和含義都是相同的。)v對(duì)樣本來(lái)自的兩總體是否存在顯著的線(xiàn)性對(duì)樣本來(lái)自的兩總體是否存在顯著的線(xiàn)性關(guān)系進(jìn)行推斷。關(guān)系進(jìn)行推斷。.相關(guān)系數(shù)相關(guān)系數(shù)r rv相關(guān)系數(shù)相關(guān)系數(shù)r r的取值在的取值在-1-1+1+1之間。之間。vr0r0表示兩變量存在正的
6、線(xiàn)性相關(guān)關(guān)系表示兩變量存在正的線(xiàn)性相關(guān)關(guān)系;r0;r0.80.8表示兩變量之間具有較強(qiáng)的線(xiàn)性表示兩變量之間具有較強(qiáng)的線(xiàn)性關(guān)系關(guān)系; ; r r0.34040)v6 6、必須是連續(xù)變量、必須是連續(xù)變量.多元回歸方程中的自變量選擇多元回歸方程中的自變量選擇v1 1、強(qiáng)行進(jìn)入法(、強(qiáng)行進(jìn)入法(enterenter),即一般),即一般所稱(chēng)的復(fù)回歸分析法。強(qiáng)迫所有變所稱(chēng)的復(fù)回歸分析法。強(qiáng)迫所有變量有順序地進(jìn)入回歸方程。在研究量有順序地進(jìn)入回歸方程。在研究設(shè)計(jì)中,如果研究者事先建立假設(shè),設(shè)計(jì)中,如果研究者事先建立假設(shè),決定變量的重要性層次,則應(yīng)使用決定變量的重要性層次,則應(yīng)使用enterenter法比較合
7、適。此法又稱(chēng)法比較合適。此法又稱(chēng)“層次層次式進(jìn)入法式進(jìn)入法”(hierarchical hierarchical enterenter)。)。.v2 2、后退法(、后退法(BackwardBackward),將已納入方程的),將已納入方程的變量按對(duì)因變量的貢獻(xiàn)大小由小到大依次變量按對(duì)因變量的貢獻(xiàn)大小由小到大依次剔除,每剔除一個(gè)自變量,即重新檢驗(yàn)每剔除,每剔除一個(gè)自變量,即重新檢驗(yàn)每一自變量對(duì)因變量的貢獻(xiàn)。一自變量對(duì)因變量的貢獻(xiàn)。v3 3、前進(jìn)法(、前進(jìn)法(ForwardForward),對(duì)已納入方程的),對(duì)已納入方程的變量不考察其顯著性,直到方程外變量均變量不考察其顯著性,直到方程外變量均達(dá)不
8、到入選標(biāo)準(zhǔn)。達(dá)不到入選標(biāo)準(zhǔn)。v4 4、強(qiáng)制剔除法(、強(qiáng)制剔除法(RemoveRemove)與后退法相同,)與后退法相同,只是篩選的是只是篩選的是BlockBlock.v5 5、逐步回歸法(、逐步回歸法( Stepwise Stepwise ),運(yùn)用很廣,報(bào)),運(yùn)用很廣,報(bào)告中出現(xiàn)的幾率最高。結(jié)合了前進(jìn)法和后退法的告中出現(xiàn)的幾率最高。結(jié)合了前進(jìn)法和后退法的優(yōu)點(diǎn)。第一,模型中先不包含任何預(yù)測(cè)變量,與優(yōu)點(diǎn)。第一,模型中先不包含任何預(yù)測(cè)變量,與因變量相關(guān)最高者首先進(jìn)入回歸方程;第二,控因變量相關(guān)最高者首先進(jìn)入回歸方程;第二,控制回歸方程中的變量后,根據(jù)每個(gè)預(yù)測(cè)變量與因制回歸方程中的變量后,根據(jù)每個(gè)預(yù)測(cè)
9、變量與因變量的偏相關(guān)的高低來(lái)決定進(jìn)入方程的順序;第變量的偏相關(guān)的高低來(lái)決定進(jìn)入方程的順序;第三,已進(jìn)入方程的自變量,每引入一個(gè)自變量,三,已進(jìn)入方程的自變量,每引入一個(gè)自變量,就對(duì)方程中的每一自變量進(jìn)行顯著性檢驗(yàn),若發(fā)就對(duì)方程中的每一自變量進(jìn)行顯著性檢驗(yàn),若發(fā)現(xiàn)不顯著,就剔除;每剔除一個(gè)自變量有也對(duì)留現(xiàn)不顯著,就剔除;每剔除一個(gè)自變量有也對(duì)留在方程中的自變量再進(jìn)行顯著性檢驗(yàn),再不顯著,在方程中的自變量再進(jìn)行顯著性檢驗(yàn),再不顯著,又剔除,直至沒(méi)有自變量引入,也沒(méi)有自變量剔又剔除,直至沒(méi)有自變量引入,也沒(méi)有自變量剔除為止。除為止。.v在選擇回歸的方法時(shí),注意專(zhuān)業(yè)上在選擇回歸的方法時(shí),注意專(zhuān)業(yè)上的要
10、求要先于統(tǒng)計(jì)學(xué)檢驗(yàn)的準(zhǔn)則。的要求要先于統(tǒng)計(jì)學(xué)檢驗(yàn)的準(zhǔn)則。vHowerHower(19871987)建議:()建議:(1 1)應(yīng)優(yōu)先)應(yīng)優(yōu)先使用使用enterenter或或stepwisestepwise。(。(2 2)使用)使用enterenter時(shí),可根據(jù)研究計(jì)劃時(shí)的相關(guān)時(shí),可根據(jù)研究計(jì)劃時(shí)的相關(guān)理論,決定變量投入的順序。理論,決定變量投入的順序。.回歸方程的統(tǒng)計(jì)檢驗(yàn)回歸方程的統(tǒng)計(jì)檢驗(yàn)v通過(guò)樣本數(shù)據(jù)建立回歸方程后一般不通過(guò)樣本數(shù)據(jù)建立回歸方程后一般不能立即用于對(duì)實(shí)際問(wèn)題的分析和預(yù)測(cè),能立即用于對(duì)實(shí)際問(wèn)題的分析和預(yù)測(cè),通常要進(jìn)行各種統(tǒng)計(jì)檢驗(yàn),包括回歸通常要進(jìn)行各種統(tǒng)計(jì)檢驗(yàn),包括回歸方程的擬合優(yōu)
11、度檢驗(yàn)、回歸方程的顯方程的擬合優(yōu)度檢驗(yàn)、回歸方程的顯著性檢驗(yàn)、回歸系數(shù)的顯著性檢驗(yàn)、著性檢驗(yàn)、回歸系數(shù)的顯著性檢驗(yàn)、殘差分析等。殘差分析等。.回歸方程的擬合優(yōu)度檢驗(yàn)回歸方程的擬合優(yōu)度檢驗(yàn)v檢驗(yàn)樣本數(shù)據(jù)點(diǎn)聚集在回歸線(xiàn)周?chē)拿芗瘷z驗(yàn)樣本數(shù)據(jù)點(diǎn)聚集在回歸線(xiàn)周?chē)拿芗潭?,從而評(píng)價(jià)回歸方程對(duì)樣本數(shù)據(jù)的代程度,從而評(píng)價(jià)回歸方程對(duì)樣本數(shù)據(jù)的代表程度。表程度。v認(rèn)為認(rèn)為y y各觀(guān)測(cè)值的之間的差異主要由兩個(gè)方各觀(guān)測(cè)值的之間的差異主要由兩個(gè)方面的原因造成:一是解釋變量面的原因造成:一是解釋變量x x取值的不同取值的不同造成的;二是由于其他隨機(jī)因素造成的。造成的;二是由于其他隨機(jī)因素造成的。vSST=SSA+SS
12、ESST=SSA+SSE(回歸平方和剩余平方和)(回歸平方和剩余平方和)v若若SSASSA所占的比例遠(yuǎn)大于所占的比例遠(yuǎn)大于SSESSE所占的比例,所占的比例,那么回歸方程的擬合優(yōu)度會(huì)比較高。那么回歸方程的擬合優(yōu)度會(huì)比較高。.v擬合優(yōu)度檢驗(yàn)采用擬合優(yōu)度檢驗(yàn)采用R R2 2統(tǒng)計(jì)量,該統(tǒng)計(jì)量統(tǒng)計(jì)量,該統(tǒng)計(jì)量稱(chēng)為判定系數(shù)或決定系數(shù),它是稱(chēng)為判定系數(shù)或決定系數(shù),它是SSA/SSTSSA/SSTv反映因變量的全部變異中能夠通過(guò)回歸反映因變量的全部變異中能夠通過(guò)回歸關(guān)系被自變量解釋的比例,即檢驗(yàn)回歸關(guān)系被自變量解釋的比例,即檢驗(yàn)回歸的效果如何。的效果如何。v如果自變量的個(gè)數(shù)很多,有時(shí)要以調(diào)整如果自變量的個(gè)數(shù)
13、很多,有時(shí)要以調(diào)整后的決定系數(shù)代替原先的決定系數(shù)。因后的決定系數(shù)代替原先的決定系數(shù)。因?yàn)樵黾有碌淖宰兞繒?huì)使決定系數(shù)增大,為增加新的自變量會(huì)使決定系數(shù)增大,這種決定系數(shù)會(huì)有高人為控制的機(jī)制在這種決定系數(shù)會(huì)有高人為控制的機(jī)制在內(nèi),此時(shí)用調(diào)整后的決定系數(shù)更好。內(nèi),此時(shí)用調(diào)整后的決定系數(shù)更好。.回歸方程的顯著性檢驗(yàn)回歸方程的顯著性檢驗(yàn)v線(xiàn)性回歸方程能夠較好地反映被解釋變量線(xiàn)性回歸方程能夠較好地反映被解釋變量和解釋變量之間統(tǒng)計(jì)關(guān)系的前提應(yīng)是,被和解釋變量之間統(tǒng)計(jì)關(guān)系的前提應(yīng)是,被解釋變量和解釋變量之間確實(shí)存在顯著的解釋變量和解釋變量之間確實(shí)存在顯著的線(xiàn)性關(guān)系。回歸方程的顯著性檢驗(yàn)正是要線(xiàn)性關(guān)系?;貧w方程
14、的顯著性檢驗(yàn)正是要檢驗(yàn)被解釋變量與所有解釋變量之間的線(xiàn)檢驗(yàn)被解釋變量與所有解釋變量之間的線(xiàn)性關(guān)系是否顯著,用線(xiàn)性模型來(lái)描述它們性關(guān)系是否顯著,用線(xiàn)性模型來(lái)描述它們之間的關(guān)系是否恰當(dāng)。之間的關(guān)系是否恰當(dāng)。v基本出發(fā)點(diǎn)與擬合優(yōu)度檢驗(yàn)非常相似?;境霭l(fā)點(diǎn)與擬合優(yōu)度檢驗(yàn)非常相似。v檢驗(yàn)采用檢驗(yàn)采用F統(tǒng)計(jì)量。統(tǒng)計(jì)量。.回歸系數(shù)的顯著性檢驗(yàn)回歸系數(shù)的顯著性檢驗(yàn)v主要目的是研究回歸方程中的每個(gè)解釋主要目的是研究回歸方程中的每個(gè)解釋變量與被解釋變量之間是否存在顯著的變量與被解釋變量之間是否存在顯著的線(xiàn)性關(guān)系,也就是研究解釋變量能夠有線(xiàn)性關(guān)系,也就是研究解釋變量能夠有效地解釋被解釋變量的線(xiàn)性變化,他們效地解釋被
15、解釋變量的線(xiàn)性變化,他們能夠保留在線(xiàn)性回歸方程中。能夠保留在線(xiàn)性回歸方程中。v是圍繞回歸系數(shù)估計(jì)值的抽樣分布展開(kāi)是圍繞回歸系數(shù)估計(jì)值的抽樣分布展開(kāi)的,由此構(gòu)造服從某種理論分布的檢驗(yàn)的,由此構(gòu)造服從某種理論分布的檢驗(yàn)統(tǒng)計(jì)量,并進(jìn)行檢驗(yàn)。統(tǒng)計(jì)量,并進(jìn)行檢驗(yàn)。.vt t統(tǒng)計(jì)量:在一元線(xiàn)性回歸分析中,統(tǒng)計(jì)量:在一元線(xiàn)性回歸分析中,回歸方程顯著性檢驗(yàn)和回歸系數(shù)顯回歸方程顯著性檢驗(yàn)和回歸系數(shù)顯著性檢驗(yàn)的作用是相同的,兩者可著性檢驗(yàn)的作用是相同的,兩者可以相互代替,同時(shí)回歸方程顯著性以相互代替,同時(shí)回歸方程顯著性檢驗(yàn)中檢驗(yàn)中F Ft t2 2。v但在多元線(xiàn)性回歸中的這兩種檢驗(yàn)但在多元線(xiàn)性回歸中的這兩種檢驗(yàn)通
16、常不能互相替代。通常不能互相替代。.殘差分析殘差分析v所謂殘差是指由回歸方程計(jì)算所得的預(yù)測(cè)值與所謂殘差是指由回歸方程計(jì)算所得的預(yù)測(cè)值與實(shí)際樣本值之間的差距。實(shí)際樣本值之間的差距。v殘差分析是回歸方程檢驗(yàn)中的重要組成部分,殘差分析是回歸方程檢驗(yàn)中的重要組成部分,其出發(fā)點(diǎn)是,如果回歸方程能較好地反映被解其出發(fā)點(diǎn)是,如果回歸方程能較好地反映被解釋變量的特征和變化規(guī)律,那么殘差序列中應(yīng)釋變量的特征和變化規(guī)律,那么殘差序列中應(yīng)不包含明顯的規(guī)律行和趨勢(shì)性。不包含明顯的規(guī)律行和趨勢(shì)性。v殘差分析的主要任務(wù)可大致歸納為,分析殘差殘差分析的主要任務(wù)可大致歸納為,分析殘差是否服從均值為是否服從均值為0 0的正態(tài)分
17、布、分析殘差是否為的正態(tài)分布、分析殘差是否為等方差的正態(tài)分布、分析殘差序列是否獨(dú)立、等方差的正態(tài)分布、分析殘差序列是否獨(dú)立、借助殘差探測(cè)樣本中的異常值等。借助殘差探測(cè)樣本中的異常值等。v圖形分析和數(shù)值分析是殘差分析的有效工具。圖形分析和數(shù)值分析是殘差分析的有效工具。.如何看回歸結(jié)果?如何看回歸結(jié)果?v哪些自變量(我們選定)進(jìn)入了回哪些自變量(我們選定)進(jìn)入了回歸方程歸方程v對(duì)回歸方程進(jìn)行檢驗(yàn),看方程是否對(duì)回歸方程進(jìn)行檢驗(yàn),看方程是否有意義有意義v看回歸效果,看回歸效果, R R2 2.回歸分析的三個(gè)重要指標(biāo)回歸分析的三個(gè)重要指標(biāo)v方差分析:方差分析:F F檢驗(yàn)用于檢驗(yàn)回歸模型與數(shù)檢驗(yàn)用于檢驗(yàn)回
18、歸模型與數(shù)據(jù)的擬合程度。若據(jù)的擬合程度。若F F值顯著,表明預(yù)測(cè)變值顯著,表明預(yù)測(cè)變量與指標(biāo)變量之間存在很強(qiáng)的線(xiàn)性關(guān)系,量與指標(biāo)變量之間存在很強(qiáng)的線(xiàn)性關(guān)系,也可以說(shuō)回歸方程顯著。也可以說(shuō)回歸方程顯著。 v回歸系數(shù)的顯著性檢驗(yàn):若回歸系數(shù)的顯著性檢驗(yàn):若b b顯著,則表顯著,則表明預(yù)測(cè)變量與指標(biāo)變量之間存在強(qiáng)線(xiàn)性明預(yù)測(cè)變量與指標(biāo)變量之間存在強(qiáng)線(xiàn)性相關(guān)。相關(guān)。 vR R2 2:解釋回歸平方和在總平方和中所占:解釋回歸平方和在總平方和中所占的比率,即解釋回歸的效果。的比率,即解釋回歸的效果。.練習(xí)練習(xí)v利用線(xiàn)性回歸分析研究高等院校人利用線(xiàn)性回歸分析研究高等院校人文社會(huì)科學(xué)研究中立項(xiàng)課題數(shù)是否文社會(huì)科
19、學(xué)研究中立項(xiàng)課題數(shù)是否受高級(jí)職稱(chēng)投入人年數(shù)、投入科研受高級(jí)職稱(chēng)投入人年數(shù)、投入科研事業(yè)經(jīng)費(fèi)、專(zhuān)著數(shù)的影響。事業(yè)經(jīng)費(fèi)、專(zhuān)著數(shù)的影響。v分析母親對(duì)情感溫暖的理解是否受分析母親對(duì)情感溫暖的理解是否受到過(guò)度干涉、拒絕否認(rèn)和懲罰嚴(yán)厲到過(guò)度干涉、拒絕否認(rèn)和懲罰嚴(yán)厲的影響。的影響。.虛擬變量虛擬變量v若某個(gè)自變量是分類(lèi)變量,則須將分類(lèi)變量若某個(gè)自變量是分類(lèi)變量,則須將分類(lèi)變量轉(zhuǎn)化為二進(jìn)制虛擬變量(轉(zhuǎn)化為二進(jìn)制虛擬變量(dummy variabledummy variable),),每個(gè)虛擬變量只代表每個(gè)虛擬變量只代表2 2級(jí)(級(jí)(0 0,1 1),即某一屬),即某一屬性出現(xiàn)時(shí),虛擬變量取值為性出現(xiàn)時(shí),虛擬變
20、量取值為1 1,否則為,否則為0 0。設(shè)。設(shè)虛擬變量時(shí),以一種取值作為對(duì)比水平(基虛擬變量時(shí),以一種取值作為對(duì)比水平(基礎(chǔ)水平),若原自變量有幾個(gè)水平,就應(yīng)使礎(chǔ)水平),若原自變量有幾個(gè)水平,就應(yīng)使用用n-1n-1個(gè)虛擬變量,實(shí)則虛擬變量代表的是同個(gè)虛擬變量,實(shí)則虛擬變量代表的是同一變量的不同取值。一變量的不同取值。.v如性別變量有男或女兩類(lèi)如性別變量有男或女兩類(lèi), ,可將兩個(gè)類(lèi)別可將兩個(gè)類(lèi)別分別以?xún)蓚€(gè)分別以?xún)蓚€(gè)0/10/1二值變量的形式重新編碼。二值變量的形式重新編碼。設(shè)置變量設(shè)置變量X X1 1表示是否男,取表示是否男,取1 1表示男,取表示男,取0 0表示不是男。再設(shè)置變量表示不是男。再設(shè)
21、置變量X X2 2表示是否女,表示是否女,取取1 1表示是女,取表示是女,取0 0表示不是女。表示不是女。v產(chǎn)生的回歸方程中各虛擬變量回歸系數(shù)的產(chǎn)生的回歸方程中各虛擬變量回歸系數(shù)的含義是,相對(duì)參照類(lèi),各個(gè)類(lèi)對(duì)解釋變量含義是,相對(duì)參照類(lèi),各個(gè)類(lèi)對(duì)解釋變量平均貢獻(xiàn)的差,進(jìn)而可進(jìn)一步研究各類(lèi)別平均貢獻(xiàn)的差,進(jìn)而可進(jìn)一步研究各類(lèi)別間對(duì)被解釋變量的平均貢獻(xiàn)差異。間對(duì)被解釋變量的平均貢獻(xiàn)差異。.Collinearity Collinearity diagnostics diagnostics (共線(xiàn)性診斷)(共線(xiàn)性診斷)v復(fù)共線(xiàn)問(wèn)題(共線(xiàn)性,復(fù)共線(xiàn)問(wèn)題(共線(xiàn)性,collinearitycollineari
22、ty問(wèn)問(wèn)題):由于自變量間的相關(guān)太高,造成題):由于自變量間的相關(guān)太高,造成回歸分析之情境困擾。如果自變量間有回歸分析之情境困擾。如果自變量間有共線(xiàn)性問(wèn)題,表示一個(gè)預(yù)測(cè)變量是其他共線(xiàn)性問(wèn)題,表示一個(gè)預(yù)測(cè)變量是其他自變量的線(xiàn)性組合。若有嚴(yán)重的共線(xiàn)性自變量的線(xiàn)性組合。若有嚴(yán)重的共線(xiàn)性存在,則模型的參數(shù)就不能完全被估計(jì)存在,則模型的參數(shù)就不能完全被估計(jì)出來(lái)。出來(lái)。.自變量間是否有共線(xiàn)性問(wèn)題,自變量間是否有共線(xiàn)性問(wèn)題,可以由以下數(shù)據(jù)判斷:可以由以下數(shù)據(jù)判斷:(1 1)VIF=5VIF=5,存在復(fù)共線(xiàn)。所以在回歸分析中,存在復(fù)共線(xiàn)。所以在回歸分析中,最好先做個(gè)相關(guān)分析,最好先做個(gè)相關(guān)分析,以探討變量間的
23、相關(guān)情形,以探討變量間的相關(guān)情形,如果某些變量間的相關(guān)系數(shù)太高,可考慮挑選一如果某些變量間的相關(guān)系數(shù)太高,可考慮挑選一個(gè)較重要的變量投入回歸分析個(gè)較重要的變量投入回歸分析。(2 2)容忍度)容忍度tolerance=1-Rtolerance=1-R2 2 ,其中,其中R R2 2是此自變量是此自變量與其他自變量間的多元相關(guān)系數(shù)的平方。容忍度與其他自變量間的多元相關(guān)系數(shù)的平方。容忍度界于界于0 0和和1 1之間,如果一個(gè)自變量的容忍度太小,之間,如果一個(gè)自變量的容忍度太小,表示此變量與其他自變量間有共線(xiàn)性問(wèn)題;其值表示此變量與其他自變量間有共線(xiàn)性問(wèn)題;其值若接近若接近0 0,表示此變量幾乎就是其
24、他變量的線(xiàn)性,表示此變量幾乎就是其他變量的線(xiàn)性組合。組合。.(3 3)條件指針()條件指針(condition indexcondition index,CICI),),CI CI 越大,越有共線(xiàn)性問(wèn)題。越大,越有共線(xiàn)性問(wèn)題。Eigenvalue condition indexEigenvalue condition index(k k)若)若k k2 2=100=100表示存在復(fù)共線(xiàn),若表示存在復(fù)共線(xiàn),若k k2 2=1000=1000,表示存在嚴(yán)重的復(fù)共線(xiàn)。表示存在嚴(yán)重的復(fù)共線(xiàn)。v關(guān)于復(fù)共線(xiàn)問(wèn)題,也有說(shuō)法,即認(rèn)為關(guān)于復(fù)共線(xiàn)問(wèn)題,也有說(shuō)法,即認(rèn)為若若torrencetorrence降至降至0
25、.50.5以下,而以下,而VIF VIF 上升上升到到2.02.0以上,就應(yīng)檢查自變量是否為自以上,就應(yīng)檢查自變量是否為自相關(guān)。相關(guān)。.上機(jī)練習(xí)上機(jī)練習(xí)v母親的受教育程度和職業(yè)狀況與母母親的受教育程度和職業(yè)狀況與母親的情感溫暖的理解有什么關(guān)系?親的情感溫暖的理解有什么關(guān)系?請(qǐng)根據(jù)相關(guān)分析的進(jìn)行分析。請(qǐng)根據(jù)相關(guān)分析的進(jìn)行分析。v年均可支配收入和年人均消費(fèi)支出年均可支配收入和年人均消費(fèi)支出是否對(duì)教育支出有影響?請(qǐng)用回歸是否對(duì)教育支出有影響?請(qǐng)用回歸分析的結(jié)果建立關(guān)于教育支出的回分析的結(jié)果建立關(guān)于教育支出的回歸模型。歸模型。.五、路徑分析五、路徑分析v路徑分析又稱(chēng)路徑分析又稱(chēng)“結(jié)構(gòu)方程模型結(jié)構(gòu)方程模
26、型”(structural equation modelsstructural equation models,SEMSEM)或)或“同時(shí)方程檢驗(yàn)?zāi)P屯瑫r(shí)方程檢驗(yàn)?zāi)P汀保╯imultaneous equation simultaneous equation modelsmodels),因?yàn)樗瑫r(shí)讓所有預(yù)測(cè)),因?yàn)樗瑫r(shí)讓所有預(yù)測(cè)變量進(jìn)入回歸模型變量進(jìn)入回歸模型 。.路徑分析的基本步驟路徑分析的基本步驟v1 1、根據(jù)相關(guān)理論與文獻(xiàn)資料,建立一個(gè)可以檢驗(yàn)的初、根據(jù)相關(guān)理論與文獻(xiàn)資料,建立一個(gè)可以檢驗(yàn)的初始模型,并繪出一個(gè)沒(méi)有路徑系數(shù)的路徑圖(始模型,并繪出一個(gè)沒(méi)有路徑系數(shù)的路徑圖(path pat
27、h diagramdiagram)。)。路徑圖中的因果關(guān)系用箭頭表示,箭頭指向的是路徑圖中的因果關(guān)系用箭頭表示,箭頭指向的是“果果”(因(因變量),箭頭起始處是變量),箭頭起始處是“因因”(自變量)。對(duì)多重回歸分析(自變量)。對(duì)多重回歸分析來(lái)說(shuō),箭頭所指的變量為回歸方程的因變量,箭頭起始處為來(lái)說(shuō),箭頭所指的變量為回歸方程的因變量,箭頭起始處為回歸方程的預(yù)測(cè)變量。回歸方程的預(yù)測(cè)變量。在設(shè)計(jì)因果關(guān)系時(shí),要有相應(yīng)的理論背景。因果模型結(jié)構(gòu)的在設(shè)計(jì)因果關(guān)系時(shí),要有相應(yīng)的理論背景。因果模型結(jié)構(gòu)的初始圖中通常包括直接效果和間接效果。在直接效果中如果初始圖中通常包括直接效果和間接效果。在直接效果中如果路徑系數(shù)
28、達(dá)到顯著,表示兩個(gè)變量間有直接因果關(guān)系存在;路徑系數(shù)達(dá)到顯著,表示兩個(gè)變量間有直接因果關(guān)系存在;在間接效果中如果路徑系數(shù)達(dá)到顯著,表示兩個(gè)變量間有間在間接效果中如果路徑系數(shù)達(dá)到顯著,表示兩個(gè)變量間有間接的因果關(guān)系存在。間接效果的影響路徑是多元的,并不是接的因果關(guān)系存在。間接效果的影響路徑是多元的,并不是每個(gè)中間變量的影響都會(huì)達(dá)到顯著。每個(gè)中間變量的影響都會(huì)達(dá)到顯著。.v2 2、選用適當(dāng)?shù)幕貧w模型(通常用、選用適當(dāng)?shù)幕貧w模型(通常用enterenter法),來(lái)估計(jì)路徑系數(shù)并檢驗(yàn)其是否顯法),來(lái)估計(jì)路徑系數(shù)并檢驗(yàn)其是否顯著。在路徑分析中,選用的分析方法是著。在路徑分析中,選用的分析方法是多重回歸分
29、析,而多重回歸分析,而“路徑系數(shù)路徑系數(shù)”就是回就是回歸方程中的歸方程中的“標(biāo)準(zhǔn)化偏回歸系數(shù)標(biāo)準(zhǔn)化偏回歸系數(shù)”。復(fù)。復(fù)回歸中讓所有預(yù)測(cè)變量同時(shí)進(jìn)入回歸方回歸中讓所有預(yù)測(cè)變量同時(shí)進(jìn)入回歸方程,再由每個(gè)變量的程,再由每個(gè)變量的t t值的大小與機(jī)率值值的大小與機(jī)率值檢驗(yàn)檢驗(yàn)betabeta值的影響是否顯著。值的影響是否顯著。.v3 3、評(píng)估理論模型,可刪除不顯著的路徑、評(píng)估理論模型,可刪除不顯著的路徑系數(shù),重新計(jì)算新模型的路徑系數(shù)。在系數(shù),重新計(jì)算新模型的路徑系數(shù)。在刪除部分影響路徑后,會(huì)成為一種刪除部分影響路徑后,會(huì)成為一種“約約束模型束模型”(restrict modelrestrict mod
30、el),由于預(yù)),由于預(yù)測(cè)變量數(shù)的改變,路徑系數(shù)也會(huì)跟著改測(cè)變量數(shù)的改變,路徑系數(shù)也會(huì)跟著改變,因而要重新進(jìn)行復(fù)回歸分析。變,因而要重新進(jìn)行復(fù)回歸分析。.驗(yàn)證研究路徑圖驗(yàn)證研究路徑圖數(shù)學(xué)焦慮數(shù)學(xué)焦慮數(shù)學(xué)態(tài)度數(shù)學(xué)態(tài)度數(shù)學(xué)成績(jī)數(shù)學(xué)成績(jī)數(shù)學(xué)投入數(shù)學(xué)投入動(dòng)機(jī)動(dòng)機(jī).v此研究圖,要進(jìn)行三個(gè)復(fù)回歸,此研究圖,要進(jìn)行三個(gè)復(fù)回歸,(1 1)因變量為數(shù)學(xué)成績(jī),預(yù)測(cè)變量為數(shù))因變量為數(shù)學(xué)成績(jī),預(yù)測(cè)變量為數(shù)學(xué)焦慮、數(shù)學(xué)態(tài)度、數(shù)學(xué)投入動(dòng)學(xué)焦慮、數(shù)學(xué)態(tài)度、數(shù)學(xué)投入動(dòng)(2 2)目標(biāo)變量為數(shù)學(xué)學(xué)習(xí)態(tài)度,預(yù)測(cè)變)目標(biāo)變量為數(shù)學(xué)學(xué)習(xí)態(tài)度,預(yù)測(cè)變量為數(shù)學(xué)焦慮、數(shù)學(xué)學(xué)習(xí)投入動(dòng)機(jī)量為數(shù)學(xué)焦慮、數(shù)學(xué)學(xué)習(xí)投入動(dòng)機(jī)(3 3)目標(biāo)變量為數(shù)學(xué)學(xué)
31、習(xí)投入動(dòng)機(jī),預(yù))目標(biāo)變量為數(shù)學(xué)學(xué)習(xí)投入動(dòng)機(jī),預(yù)測(cè)變量為數(shù)學(xué)焦慮。測(cè)變量為數(shù)學(xué)焦慮。.練習(xí)練習(xí)母親情感母親情感溫暖的理溫暖的理解解過(guò)度干涉過(guò)度干涉心理健康心理健康拒絕否拒絕否認(rèn)認(rèn).曲線(xiàn)估計(jì)曲線(xiàn)估計(jì)v變量間相關(guān)關(guān)系的分析中,變量之間變量間相關(guān)關(guān)系的分析中,變量之間的關(guān)系并不總是表現(xiàn)出線(xiàn)性關(guān)系的關(guān)系并不總是表現(xiàn)出線(xiàn)性關(guān)系, ,非非線(xiàn)性關(guān)系也是極為常見(jiàn)的,通過(guò)繪制線(xiàn)性關(guān)系也是極為常見(jiàn)的,通過(guò)繪制散點(diǎn)圖的方式可粗略考察這種非線(xiàn)性散點(diǎn)圖的方式可粗略考察這種非線(xiàn)性關(guān)系。對(duì)于非線(xiàn)性關(guān)系通常無(wú)法直接關(guān)系。對(duì)于非線(xiàn)性關(guān)系通常無(wú)法直接通過(guò)線(xiàn)性回歸來(lái)分析,無(wú)法直接建立通過(guò)線(xiàn)性回歸來(lái)分析,無(wú)法直接建立線(xiàn)性模型,線(xiàn)性模型
32、,v變量之間的非線(xiàn)性可以劃分為本質(zhì)線(xiàn)變量之間的非線(xiàn)性可以劃分為本質(zhì)線(xiàn)性關(guān)系和本質(zhì)非線(xiàn)性關(guān)系。性關(guān)系和本質(zhì)非線(xiàn)性關(guān)系。.v所謂本質(zhì)線(xiàn)性關(guān)系是指變量關(guān)系形式上雖所謂本質(zhì)線(xiàn)性關(guān)系是指變量關(guān)系形式上雖然是呈非線(xiàn)性關(guān)系(如,二次曲線(xiàn)),但然是呈非線(xiàn)性關(guān)系(如,二次曲線(xiàn)),但可通過(guò)變換化為線(xiàn)性關(guān)系,并可最終通過(guò)可通過(guò)變換化為線(xiàn)性關(guān)系,并可最終通過(guò)線(xiàn)性回歸分析建立線(xiàn)性模型。線(xiàn)性回歸分析建立線(xiàn)性模型。v本質(zhì)非線(xiàn)性關(guān)系是指變量關(guān)系不僅形式上本質(zhì)非線(xiàn)性關(guān)系是指變量關(guān)系不僅形式上呈非線(xiàn)性關(guān)系,而且也無(wú)法通過(guò)變量變換呈非線(xiàn)性關(guān)系,而且也無(wú)法通過(guò)變量變換化為線(xiàn)性關(guān)系,最終無(wú)法通過(guò)線(xiàn)性回歸分化為線(xiàn)性關(guān)系,最終無(wú)法通過(guò)線(xiàn)性
33、回歸分析建立線(xiàn)性模型,曲線(xiàn)估計(jì)要解決的就是析建立線(xiàn)性模型,曲線(xiàn)估計(jì)要解決的就是本質(zhì)線(xiàn)性關(guān)系問(wèn)題。本質(zhì)線(xiàn)性關(guān)系問(wèn)題。.步驟步驟v選擇模型選擇模型vSPSS自動(dòng)生成參數(shù)估計(jì),并輸出自動(dòng)生成參數(shù)估計(jì),并輸出回歸方程顯著性檢驗(yàn)的回歸方程顯著性檢驗(yàn)的F值、值、p值、值、判定系數(shù)等統(tǒng)計(jì)量判定系數(shù)等統(tǒng)計(jì)量v以判定系數(shù)為主要依據(jù)選擇最優(yōu)模以判定系數(shù)為主要依據(jù)選擇最優(yōu)模型,并進(jìn)行預(yù)測(cè)分析。型,并進(jìn)行預(yù)測(cè)分析。.曲線(xiàn)估計(jì)(Curve Estimation)v對(duì)于對(duì)于一元回歸一元回歸,若散點(diǎn)圖的趨勢(shì)若散點(diǎn)圖的趨勢(shì)不呈線(xiàn)性分布,不呈線(xiàn)性分布,可以利用曲線(xiàn)估可以利用曲線(xiàn)估計(jì)方便地進(jìn)行線(xiàn)計(jì)方便地進(jìn)行線(xiàn)性擬合性擬合(lin
34、er)(liner)、二次擬合二次擬合(Quadratic)(Quadratic)、三次擬合三次擬合(Cubic)(Cubic)等。采用哪種擬等。采用哪種擬合方式主要取決合方式主要取決于各種擬合模型于各種擬合模型對(duì)數(shù)據(jù)的充分描對(duì)數(shù)據(jù)的充分描述述( (看修正看修正Adjusted RAdjusted R2 2 -1)1)不同模型的表示不同模型的表示模型名稱(chēng)模型名稱(chēng)回歸方程回歸方程相應(yīng)的線(xiàn)性回歸方程相應(yīng)的線(xiàn)性回歸方程Linear(Linear(線(xiàn)性線(xiàn)性) )Y=bY=b0 0+b+b1 1t tQuadratic(Quadratic(二二次次) )Y=bY=b0 0+b+b1 1t+bt+b2 2
35、t t2 2Compound(Compound(復(fù)合復(fù)合) )Y=bY=b0 0(b(b1 1t t) )Ln(Y)=ln(bLn(Y)=ln(b0 0)+ln(b)+ln(b1 1)t)tGrowth(Growth(生長(zhǎng)生長(zhǎng)) )Y=eY=eb0+b1tb0+b1tLn(Y)=bLn(Y)=b0 0+b+b1 1t tLogarithmicLogarithmic( (對(duì)數(shù)對(duì)數(shù)) )Y=bY=b0 0+b+b1 1ln(t)ln(t)Cubic(Cubic(三次三次) )Y=bY=b0 0+b+b1 1t+bt+b2 2t t2 2+b+b3 3t t3 3S SY=eY=eb0+b1/tb0
36、+b1/tLn(Y)=bLn(Y)=b0 0+b+b1 1 / / t tExponentialExponential( (指數(shù)指數(shù)) )Y=bY=b0 0 * * e eb1b1* *t tLn(Y)=ln(bLn(Y)=ln(b0 0)+b)+b1 1t tInverse(Inverse(逆逆) )Y=bY=b0 0+b+b1 1/t/tPower(Power(冪冪) )Y=bY=b0 0(t(tb1 b1 ) )Ln(Y)=ln(bLn(Y)=ln(b0 0)+b)+b1 1ln(t)ln(t)Logistic(Logistic(邏輯邏輯) )Y=1/(1/u+bY=1/(1/u+b0
37、0b b1 1t t) )Ln(1/Y-Ln(1/Y-1/u)=ln(b1/u)=ln(b0 0+ln(b+ln(b1 1)t)t).操作操作v可通過(guò)繪制并觀(guān)察樣本數(shù)據(jù)的散點(diǎn)可通過(guò)繪制并觀(guān)察樣本數(shù)據(jù)的散點(diǎn)圖粗略確定被解釋變量和解釋變量圖粗略確定被解釋變量和解釋變量之間的相關(guān)關(guān)系,為曲線(xiàn)擬合中的之間的相關(guān)關(guān)系,為曲線(xiàn)擬合中的模型選擇提供依據(jù)。模型選擇提供依據(jù)。.練習(xí)練習(xí)v年人均收入和教育支出年人均收入和教育支出.sav:分析:分析居民家庭教育支出和消費(fèi)性支出之居民家庭教育支出和消費(fèi)性支出之間的關(guān)系間的關(guān)系.二項(xiàng)二項(xiàng)Logistic回歸回歸v利用多元回歸方法分析變量之間的關(guān)系利用多元回歸方法分析變量之間的關(guān)系或進(jìn)行預(yù)測(cè)時(shí)的一個(gè)基本要求是,被解或進(jìn)行預(yù)測(cè)時(shí)的一個(gè)基本要求是,被解釋變量應(yīng)是連續(xù)定距變量。如課題數(shù)、釋變量應(yīng)是連續(xù)定距變量。如課題數(shù)、教育
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- Photoshop平面設(shè)計(jì)基礎(chǔ) 課件 任務(wù)5.2 制作餅干宣傳海報(bào)
- 肉羊飼料定制銷(xiāo)售協(xié)議
- 房屋租賃合同標(biāo)準(zhǔn)化管理規(guī)范文本范本精裝修家具家電
- 成都臨街商鋪?zhàn)赓U及品牌宣傳合作合同
- 離婚協(xié)議書(shū)范本涉及知識(shí)產(chǎn)權(quán)分割
- 保安員整改方案
- 產(chǎn)業(yè)園區(qū)場(chǎng)地調(diào)研合作協(xié)議
- 餐飲企業(yè)租賃及品牌授權(quán)合同
- 店面承重柱改造方案
- 寧夏農(nóng)學(xué)面試題及答案
- 2023年下半年浙江溫州蒼南縣事業(yè)單位選調(diào)工作人員筆試參考題庫(kù)(共500題)答案詳解版
- (2023版)小學(xué)語(yǔ)文一年級(jí)上冊(cè)電子課本
- 新華鎮(zhèn)生活污水處理管網(wǎng)與新華農(nóng)場(chǎng)管網(wǎng)并網(wǎng)項(xiàng)目環(huán)境影響報(bào)告表
- 互聯(lián)網(wǎng)導(dǎo)論智慧樹(shù)知到課后章節(jié)答案2023年下上海第二工業(yè)大學(xué)
- 《旅游學(xué)概論》第七章
- 工程物探-第五章電法勘探課件
- KSS編碼說(shuō)明電廠(chǎng)KKS編號(hào)
- 臺(tái)區(qū)線(xiàn)損綜合分析臺(tái)區(qū)線(xiàn)損分類(lèi)及計(jì)算方法
- 人民醫(yī)院普外科臨床技術(shù)操作規(guī)范2023版
- 【酒店管理系統(tǒng)的設(shè)計(jì)與開(kāi)發(fā)(論文)】
- 舉一反三- 三年級(jí)奧數(shù) - 第37講 面積計(jì)算
評(píng)論
0/150
提交評(píng)論