相關(guān)分析和回歸分析PPT課件_第1頁
相關(guān)分析和回歸分析PPT課件_第2頁
相關(guān)分析和回歸分析PPT課件_第3頁
相關(guān)分析和回歸分析PPT課件_第4頁
相關(guān)分析和回歸分析PPT課件_第5頁
已閱讀5頁,還剩55頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、9.1 相關(guān)分析和回歸分析概述 客觀事物之間的關(guān)系大致可歸納為兩大類,即l 函數(shù)關(guān)系:指兩事物之間的一種一一對(duì)應(yīng)的關(guān)系,如商品的銷售額和銷售量之間的關(guān)系。l 相關(guān)關(guān)系(統(tǒng)計(jì)關(guān)系):指兩事物之間的一種非一一對(duì)應(yīng)的關(guān)系,例如家庭收入和支出、子女身高和父母身高之間的關(guān)系等。相關(guān)關(guān)系又分為線性相關(guān)和非線性相關(guān)。相關(guān)分析和回歸分析都是分析客觀事物之間相關(guān)關(guān)系的數(shù)量分析方法。第1頁/共60頁雙變量關(guān)系強(qiáng)度測(cè)量的主要指標(biāo)雙變量關(guān)系強(qiáng)度測(cè)量的主要指標(biāo)第2頁/共60頁9.2 相關(guān)分析 相關(guān)分析通過圖形和數(shù)值兩種方式,有效地揭示事物之間相關(guān)關(guān)系的強(qiáng)弱程度和形式。 9.2.1 散點(diǎn)圖 它將數(shù)據(jù)以點(diǎn)的的形式畫在直角坐

2、標(biāo)系上,通過觀察散點(diǎn)圖能夠直觀的發(fā)現(xiàn)變量間的相關(guān)關(guān)系及他們的強(qiáng)弱程度和方向。第3頁/共60頁基本工資11001000900800年齡60504030性別女職工男職工第4頁/共60頁9.2.2 相關(guān)系數(shù) 利用相關(guān)系數(shù)進(jìn)行變量間線性關(guān)系的分析通常需要完成以下兩個(gè)步驟: 第一,計(jì)算樣本相關(guān)系數(shù)r;u相關(guān)系數(shù)r的取值在-1+1之間uR0表示兩變量存在正的線性相關(guān)關(guān)系;r0.8表示兩變量有較強(qiáng)的線性關(guān)系; |r|0.3表示兩變量之間的線性關(guān)系較弱第二,對(duì)樣本來自的兩總體是否存在顯著的線性關(guān)系進(jìn)行推斷。第5頁/共60頁 對(duì)不同類型的變量應(yīng)采用不同的相關(guān)系數(shù)來度量,常用的相關(guān)系數(shù)主要有Pearson簡單相關(guān)

3、系數(shù)、Spearman等級(jí)相關(guān)系數(shù)和Kendall 相關(guān)系數(shù)等。9.2.2.1 Pearson簡單相關(guān)系數(shù)(適用于兩個(gè)變量都是數(shù)值型的數(shù)據(jù)) Pearson簡單相關(guān)系數(shù)的檢驗(yàn)統(tǒng)計(jì)量為:22)()()( )(yyxxyyxxiiiir221r ntr第6頁/共60頁9.2.2.2 Spearman等級(jí)相關(guān)系數(shù) Spearman等級(jí)相關(guān)系數(shù)用來度量定序變量間的線性相關(guān)關(guān)系,設(shè)計(jì)思想與Pearson簡單相關(guān)系數(shù)相同,只是數(shù)據(jù)為非定距的,故計(jì)算時(shí)并不直接采用原始數(shù)據(jù) ,而是利用數(shù)據(jù)的秩,用兩變量的秩 代替 代入Pearson簡單相關(guān)系數(shù)計(jì)算公式中,于是其中的 和 的取值范圍被限制在1和n之間,且可被簡

4、化為:( ,)iix y( ,)iix y(,)iiU Vixiy222i21161()(1)nniiiiiDrDUVn n ,其中第7頁/共60頁 如果兩變量的正相關(guān)性較強(qiáng),它們秩的變化具有同步性,于是 的值較小,r趨向于1; 如果兩變量的正相關(guān)性較弱,它們秩的變化不具有同步性,于是 的值較大,r趨向于0; 在小樣本下,在零假設(shè)成立時(shí), Spearman等級(jí)相關(guān)系數(shù)服從Spearman分布;在大樣本下, Spearman等級(jí)相關(guān)系數(shù)的檢驗(yàn)統(tǒng)計(jì)量為Z統(tǒng)計(jì)量,定義為: 其中,Z統(tǒng)計(jì)量近似服從標(biāo)準(zhǔn)正態(tài)分布。22i11()nniiiiDUV1Zr n22i11()nniiiiDUV第8頁/共60頁9

5、.2.3 計(jì)算相關(guān)系數(shù)的基本操作 相關(guān)分析用于描述兩個(gè)變量間關(guān)系的密切程度,其特點(diǎn)是變量不分主次,被置于同等的地位。 在Analyze的下拉菜單Correlate命令項(xiàng)中有三個(gè)相關(guān)分析功能子命令Bivariate過程、Partial過程、 Distances過程,分別對(duì)應(yīng)著相關(guān)分析、偏相關(guān)分析和相似性測(cè)度(距離)的三個(gè)spss過程。 Bivariate過程用于進(jìn)行兩個(gè)或多個(gè)變量間的相關(guān)分析,如為多個(gè)變量,給出兩兩相關(guān)的分析結(jié)果。 Partial過程,當(dāng)進(jìn)行相關(guān)分析的兩個(gè)變量的取值都受到其他變量的影響時(shí),就可以利用偏相關(guān)分析對(duì)其他變量進(jìn)行控制,輸出控制其他變量影響后的偏相關(guān)系數(shù)。 Distanc

6、es過程用于對(duì)各樣本點(diǎn)之間或各個(gè)變量之間進(jìn)行相似性分析,一般不單獨(dú)使用,而作為聚類分析和因子分析等的預(yù)分析。第9頁/共60頁 Bivariate相關(guān)分析步驟(1)選擇菜單AnalyzeCorrelateBivariate,出現(xiàn)窗口:第10頁/共60頁(2)把參加計(jì)算相關(guān)系數(shù)的變量選到Variables框。(3)在Correlation Coefficents框中選擇計(jì)算哪種相關(guān)系數(shù)。(4)在Test of Significance框中選擇輸出相關(guān)系數(shù)檢驗(yàn)的雙邊(Two-Tailed)概率p值或單邊(One-Tailed)概率p值。(5)選中Flag significance correlati

7、on選項(xiàng)表示分析結(jié)果中除顯示統(tǒng)計(jì)檢驗(yàn)的概率p值外,還輸出星號(hào)標(biāo)記,以標(biāo)明變量間的相關(guān)性是否顯著;不選中則不輸出星號(hào)標(biāo)記。(6)在Option按鈕中的Statistics選項(xiàng)中,選中Cross-product deviations and covariances表示輸出兩變量的離差平方和協(xié)方差。第11頁/共60頁8.2.4 相關(guān)分析應(yīng)用舉例 為研究高等院校人文社會(huì)科學(xué)研究中立項(xiàng)課題數(shù)會(huì)受哪些因素的影響,收集1999年31個(gè)省市自治區(qū)部分高校有關(guān)社科研究方面的數(shù)據(jù),研究立項(xiàng)課題數(shù)(當(dāng)年)與投入的具有高級(jí)職稱的人年數(shù)(當(dāng)年)、發(fā)表的論文數(shù)(上年)之間是否具有較強(qiáng)的線性關(guān)系。 對(duì)該問題的研究可以采用相

8、關(guān)分析的方法,首先可繪制矩陣散點(diǎn)圖;其次可以計(jì)算Pearson簡單相關(guān)系數(shù)。第12頁/共60頁9.3 偏相關(guān)分析 9.3.1 偏相關(guān)分析和偏相關(guān)系數(shù) 上節(jié)中的相關(guān)系數(shù)是研究兩變量間線性相關(guān)性的,若還存在其他因素影響,就相關(guān)系數(shù)本身來講,它未必是兩變量間線性相關(guān)強(qiáng)弱的真實(shí)體現(xiàn),往往有夸大的趨勢(shì)。 例如,在研究商品的需求量和價(jià)格、消費(fèi)者收入之間的線性關(guān)系時(shí),需求量和價(jià)格之間的相關(guān)關(guān)系實(shí)際還包含了消費(fèi)者收入對(duì)價(jià)格和商品需求量的影響。在這種情況下,單純利用相關(guān)系數(shù)來評(píng)價(jià)變量間的相關(guān)性顯然是不準(zhǔn)確的,而需要在剔除其他相關(guān)因素影響的條件下計(jì)算變量間的相關(guān)。偏相關(guān)的意義就在于此。第13頁/共60頁 偏相關(guān)分

9、析也稱凈相關(guān)分析,它在控制其他變量的線性影響的條件下分析兩變量間的線性關(guān)系,所采用的工具是偏相關(guān)系數(shù)。 控制變量個(gè)數(shù)為1時(shí),偏相關(guān)系數(shù)稱一階偏相關(guān);當(dāng)控制兩個(gè)變量時(shí),偏相關(guān)系數(shù)稱為二階偏相關(guān);當(dāng)控制變量的個(gè)數(shù)為0時(shí),偏相關(guān)系數(shù)稱為零階偏相關(guān),也就是簡單相關(guān)系數(shù)。第14頁/共60頁利用偏相關(guān)系數(shù)進(jìn)行分析的步驟 第一,計(jì)算樣本的偏相關(guān)系數(shù) 假設(shè)有三個(gè)變量y、x1和x2,在分析x1和y之間的凈相關(guān)時(shí),當(dāng)控制了x2的線性作用后,x1和y之間的一階偏相關(guān)定義為: 偏相關(guān)系數(shù)的取值范圍及大小含義與相關(guān)系數(shù)相同。12 121,2222121212212(1)(1)yyxxxyyyyyyrr rrrrrrr1

10、其中, 、 、 分別表示 和x的相關(guān)系數(shù)、 和 的相關(guān)系數(shù)、和 的相關(guān)系數(shù)。第15頁/共60頁 第二,對(duì)樣本來自的兩總體是否存在顯著的凈相關(guān)進(jìn)行推斷 檢驗(yàn)統(tǒng)計(jì)量為: 其中,r為偏相關(guān)系數(shù),n為樣本數(shù),q為階數(shù)。T統(tǒng)計(jì)量服從n-q-2個(gè)自由度的t分布。221nqtrr第16頁/共60頁9.3.2 偏相關(guān)分析的基本操作1.選擇菜單AnalyzeCorrelatePartial第17頁/共60頁2.把參與分析的變量選擇到Variables框中。3.選擇一個(gè)或多個(gè)控制變量到Controlling for框中。4.在Test of Significance框中選擇輸出偏相關(guān)檢驗(yàn)的雙尾概率p值或單尾概率p

11、值。5.在Option按鈕中的Statistics選項(xiàng)中,選中Zero-order Correlations表示輸出零階偏相關(guān)系數(shù)。 至此,SPSS將自動(dòng)進(jìn)行偏相關(guān)分析和統(tǒng)計(jì)檢驗(yàn),并將結(jié)果顯示到輸出窗口。第18頁/共60頁9.3.3 偏相關(guān)分析的應(yīng)用舉例 上節(jié)中研究高校立項(xiàng)課題總數(shù)影響因素的相關(guān)分析中發(fā)現(xiàn),發(fā)現(xiàn)立項(xiàng)課題數(shù)與論文數(shù)之間有較強(qiáng)正線性相關(guān)關(guān)系,但應(yīng)看到這種關(guān)系中可能摻入了投入高級(jí)職稱的人年數(shù)的影響,因此,為研究立項(xiàng)課題總數(shù)和發(fā)表論文數(shù)之間的凈相關(guān)系數(shù),可以將投入高級(jí)職稱的人年數(shù)加以控制,進(jìn)行偏相關(guān)分析。第19頁/共60頁9.4 線性回歸分析9.4.1線性回歸分析概述 線性回歸分析的內(nèi)

12、容能否找到一個(gè)線性組合來說明一組自變量和因變量的關(guān)系如果能的話,這種關(guān)系的強(qiáng)度有多大,也就是利用自變量的線性組合來預(yù)測(cè)因變量的能力有多強(qiáng)整體解釋能力是否具有統(tǒng)計(jì)上的顯著性意義在整體解釋能力顯著的情況下,哪些自變量有顯著意義 回歸分析的一般步驟確定回歸方程中的解釋變量(自變量)和被解釋變量(因變量)確定回歸方程對(duì)回歸方程進(jìn)行各種檢驗(yàn)利用回歸方程進(jìn)行預(yù)測(cè)第20頁/共60頁9.4.2 線性回歸模型 一元線性回歸模型的數(shù)學(xué)模型: 其中x為自變量;y為因變量; 為截距,即常量; 為回歸系數(shù),表明自變量對(duì)因變量的影響程度。xy1001第21頁/共60頁多元線性回歸方程: y=0+1x1+2x2+.+kxk

13、+ 1、2、k為偏回歸系數(shù)。 I表示在其他自變量保持不變的情況下,自變量x1變動(dòng)一個(gè)單位所引起的因變量y的平均變動(dòng)。第22頁/共60頁 9.4.3 線性回歸方程的統(tǒng)計(jì)檢驗(yàn)線性回歸方程的統(tǒng)計(jì)檢驗(yàn)l9.4.3.1回歸方程的擬合優(yōu)度回歸方程的擬合優(yōu)度 回歸直線與各觀測(cè)點(diǎn)的接近程度稱為回歸方程的擬合優(yōu)度,回歸直線與各觀測(cè)點(diǎn)的接近程度稱為回歸方程的擬合優(yōu)度,也就是也就是樣本觀測(cè)值聚集在回歸線周圍的緊密程度樣本觀測(cè)值聚集在回歸線周圍的緊密程度 。1、離差平方和的分解:離差平方和的分解: 建立直線回歸方程可知:建立直線回歸方程可知:y y的觀測(cè)值的總變動(dòng)的觀測(cè)值的總變動(dòng)可由可由 來反映,稱為總變差。引起總變

14、差的來反映,稱為總變差。引起總變差的原因有兩個(gè):原因有兩個(gè):n由于由于x x的取值不同,使得與的取值不同,使得與x x有線性關(guān)系的有線性關(guān)系的y y值不同;值不同;n隨機(jī)因素的影響。隨機(jī)因素的影響。2)( yy第23頁/共60頁bxayxyy)(0yy ) (0yy )(yy第24頁/共60頁總離差平方和可分解為222yyyyyy 即:總離差平方和(即:總離差平方和(SST)=SST)=剩余離差平方和剩余離差平方和(SSE) +(SSE) +回歸離差回歸離差平方和(平方和(SSR)SSR) 其中;其中;SSRSSR是由是由x x和和y y的直線回歸關(guān)系引起的,可以由回歸直的直線回歸關(guān)系引起的,

15、可以由回歸直線做出解釋;線做出解釋;SSESSE是除了是除了x x對(duì)對(duì)y y的線性影響之外的隨機(jī)因素所引起的線性影響之外的隨機(jī)因素所引起的的Y Y的變動(dòng),是回歸直線所不能解釋的。的變動(dòng),是回歸直線所不能解釋的。第25頁/共60頁2 2、可決系數(shù)(判定系數(shù)、決定系數(shù)) 回歸平方和在總離差平方和中所占的比例可以作為一個(gè)回歸平方和在總離差平方和中所占的比例可以作為一個(gè)統(tǒng)計(jì)指標(biāo),用來衡量統(tǒng)計(jì)指標(biāo),用來衡量X與與Y 的關(guān)系密切程度以及回歸直線的代的關(guān)系密切程度以及回歸直線的代表性好壞,稱為可決系數(shù)。表性好壞,稱為可決系數(shù)。n對(duì)于一元線性回歸方程:對(duì)于一元線性回歸方程:22222211yyyyyyyyRS

16、STSSESSTSSESSTSSTSSRR第26頁/共60頁n對(duì)于多元線性回歸方程:對(duì)于多元線性回歸方程: 在多元線性回歸分析中,引起判定系數(shù)增加的原因有兩在多元線性回歸分析中,引起判定系數(shù)增加的原因有兩個(gè):一個(gè)是方程中的解釋變量個(gè)數(shù)增多,另一個(gè)是方程中引入個(gè):一個(gè)是方程中的解釋變量個(gè)數(shù)增多,另一個(gè)是方程中引入了對(duì)被解釋變量有重要影響的解釋變量。如果某個(gè)自變量引入了對(duì)被解釋變量有重要影響的解釋變量。如果某個(gè)自變量引入方程后對(duì)因變量的線性解釋有重要貢獻(xiàn),那么必然會(huì)使誤差平方程后對(duì)因變量的線性解釋有重要貢獻(xiàn),那么必然會(huì)使誤差平方和顯著減小,并使平均的誤差平方和也顯著減小,從而使調(diào)方和顯著減小,并使

17、平均的誤差平方和也顯著減小,從而使調(diào)整的判定系數(shù)提高。所以在多元線性回歸分析中,調(diào)整的判定整的判定系數(shù)提高。所以在多元線性回歸分析中,調(diào)整的判定系數(shù)比判定系數(shù)更能準(zhǔn)確的反映回歸方程的擬合優(yōu)度。系數(shù)比判定系數(shù)更能準(zhǔn)確的反映回歸方程的擬合優(yōu)度。1/1/1122nSSTpnSSERSSTSSER第27頁/共60頁 9.4.3.2回歸方程的顯著性檢驗(yàn)(方差分析F檢驗(yàn)) 回歸方程的顯著性檢驗(yàn)是要檢驗(yàn)被解釋變量與所有的解釋變量之間的線性關(guān)系是否顯著。 對(duì)于一元線性回歸方程,檢驗(yàn)統(tǒng)計(jì)量為: 對(duì)于多元線性回歸方程,檢驗(yàn)統(tǒng)計(jì)量為:),(21)2/() (1/)()2/(1/22nFnyyyynSSESSRF),

18、(1p) 1/() (/)() 1/(/22pnFpnyypyypnSSEpSSRF第28頁/共60頁 9.4.3.3回歸系數(shù)的顯著性檢驗(yàn)(t檢驗(yàn)) 回歸系數(shù)的顯著性檢驗(yàn)是要檢驗(yàn)回歸方程中被解釋變量與每一個(gè)解釋變量之間的線性關(guān)系是否顯著。 對(duì)于一元線性回歸方程,檢驗(yàn)統(tǒng)計(jì)量為: 2)()2()(221nyySntxxtiiyi其中,第29頁/共60頁 對(duì)于多元線性回歸方程,檢驗(yàn)統(tǒng)計(jì)量為:1)() 1()(22pnyySpntxxtiiyiijii其中,第30頁/共60頁 9.4.3.4殘差分析 殘差是指由回歸方程計(jì)算得到的預(yù)測(cè)值與實(shí)際樣本值之間的差距,定義為: 對(duì)于線性回歸分析來講,如果方程能夠

19、較好的反映被解釋變量的特征和規(guī)律性,那么殘差序列中應(yīng)不包含明顯的規(guī)律性。殘差分析包括以下內(nèi)容:殘差服從正態(tài)分布,其平均值等于0;殘差取值與X的取值無關(guān);殘差不存在自相關(guān);殘差方差相等。 ).(22110ppiiiixxxyyye第31頁/共60頁1、對(duì)于殘差均值和方差齊性檢驗(yàn)可以利用殘差圖進(jìn)行分析。如果殘差均值為零,殘差圖的點(diǎn)應(yīng)該在縱坐標(biāo)為0的中心的帶狀區(qū)域中隨機(jī)散落。如果殘差的方差隨著解釋變量值(或被解釋變量值)的增加呈有規(guī)律的變化趨勢(shì),則出現(xiàn)了異方差現(xiàn)象。2、DW檢驗(yàn)。 DW檢驗(yàn)用來檢驗(yàn)殘差的自相關(guān)。檢驗(yàn)統(tǒng)計(jì)量為: DW=2表示無自相關(guān),在0-2之間說明存在正自相關(guān),在2-4之間說明存在負(fù)

20、的自相關(guān)。一般情況下,DW值在1.5-2.5之間即可說明無自相關(guān)現(xiàn)象。)1 (2)(22221nttnttteeeDW第32頁/共60頁 9.4.3.5多重共線性分析 多重共線性是指解釋變量之間存在線性相關(guān)關(guān)系的現(xiàn)象。測(cè)度多重共線性一般有以下方式:1、容忍度: 其中, 是第i個(gè)解釋變量與方程中其他解釋變量間的復(fù)相關(guān)系數(shù)的平方,表示解釋變量之間的線性相關(guān)程度。容忍度的取值范圍在0-1之間,越接近0表示多重共線性越強(qiáng),越接近1表示多重共線性越弱。2、方差膨脹因子VIF。方差膨脹因子是容忍度的倒數(shù)。VIF越大多重共線性越強(qiáng),當(dāng)VIF大于等于10時(shí),說明存在嚴(yán)重的多重共線性。 21iiRTol2iR第

21、33頁/共60頁3、特征根和方差比。根據(jù)解釋變量的相關(guān)系數(shù)矩陣求得的特征根中,如果最大的特征根遠(yuǎn)遠(yuǎn)大于其他特征根,則說明這些解釋變量間具有相當(dāng)多的重復(fù)信息。如果某個(gè)特征根既能夠刻畫某解釋變量方差的較大部分比例(0.7以上),又能刻畫另一解釋變量方差的較大部分比例,則表明這兩個(gè)解釋變量間存在較強(qiáng)的線性相關(guān)關(guān)系。4、條件指數(shù)。指最大特征根與第i個(gè)特征根比的平方根。通常,當(dāng)條件指數(shù)在0-10之間時(shí)說明多重共線性較弱;當(dāng)條件指數(shù)在10-100之間說明多重共線性較強(qiáng);當(dāng)條件指數(shù)大于100時(shí)說明存在嚴(yán)重的多重共線性。 imik第34頁/共60頁9.4.4線性回歸分析的基本操作(1)選擇菜單AnalyzeR

22、egressionLinear,出現(xiàn)窗口:第35頁/共60頁(2)選擇被解釋變量進(jìn)入Dependent框。(3)選擇一個(gè)或多個(gè)解釋變量進(jìn)入Independent(s)框。(4)在Method框中選擇回歸分析中解釋變量的篩選策略。其中Enter表示所選變量強(qiáng)行進(jìn)入回歸方程,是SPSS默認(rèn)的策略,通常用在一元線性回歸分析中;Remove表示從回歸方程中剔除所選變量;Stepwise表示逐步篩選策略;Backward表示向后篩選策略;Forward表示向前篩選策略。第36頁/共60頁注:多元回歸分析中,變量的篩選一般有向前篩選、向后篩選、逐步篩選三種基本策略。 向前篩選( Forward )策略:解

23、釋變量不斷進(jìn)入回歸方程的過程。首先,選擇與被解釋變量具有最高線性相關(guān)系數(shù)的變量進(jìn)入方程,并進(jìn)行回歸方程的各種檢驗(yàn);然后,在剩余的變量中尋找與被解釋變量偏相關(guān)系數(shù)最高且通過檢驗(yàn)的變量進(jìn)入回歸方程,并對(duì)新建立的回歸方程進(jìn)行各種檢驗(yàn);這個(gè)過程一直重復(fù),直到再也沒有可進(jìn)入方程的變量為止。 向后篩選( Backward )策略:變量不斷剔除出回歸方程的過程。首先,所有變量全部引入回歸方程,并對(duì)回歸方程進(jìn)行各種檢驗(yàn);然后,在回歸系數(shù)顯著性檢驗(yàn)不顯著的一個(gè)或多個(gè)變量中,剔除t檢驗(yàn)值最小的變量,并重新建立回歸方程和進(jìn)行各種檢驗(yàn);第37頁/共60頁 如果新建回歸方程中所有變量的回歸系數(shù)檢驗(yàn)都顯著,則回歸方程建立

24、結(jié)束。否則按上述方法再一次剔除最不顯著的變量,直到再也沒有可剔除的變量為止。 逐步篩選( Stepwise )策略:在向前篩選策略的基礎(chǔ)上結(jié)合向后篩選策略,在每個(gè)變量進(jìn)入方程后再次判斷是否存在應(yīng)該剔除出方程的變量。因此,逐步篩選策略在引入變量的每一個(gè)階段都提供了再剔除不顯著變量的機(jī)會(huì)。第38頁/共60頁(5)第三和第四步中確定的解釋變量及變量篩選策略可放置在不同的塊(Block)中。通常在回歸分析中不止一組待進(jìn)入方程的解釋變量和相應(yīng)的篩選策略,可以單擊Next和Previous按鈕設(shè)置多組解釋變量和變量篩選策略并放置在不同的塊中。(6)選擇一個(gè)變量作為條件變量放到Selection Varia

25、ble框中,并單擊Rule按鈕給定一個(gè)判斷條件。只有變量值滿足判定條件的樣本才參與線性回歸分析。(7)在Case Labels框中指定哪個(gè)變量作為樣本數(shù)據(jù)點(diǎn)的標(biāo)志變量,該變量的值將標(biāo)在回歸分析的輸出圖形中。第39頁/共60頁9.4.5 線性回歸分析的其他操作1、Statistics按鈕,出現(xiàn)的窗口可供用戶選擇更多的輸出統(tǒng)計(jì)量。第40頁/共60頁(1)Estimates:SPSS默認(rèn)輸出項(xiàng),輸出與回歸系數(shù)相關(guān)的統(tǒng)計(jì)量。包括回歸系數(shù)(偏回歸系數(shù))、回歸系數(shù)標(biāo)準(zhǔn)誤差、標(biāo)準(zhǔn)化回歸系數(shù)、回歸系數(shù)顯著性檢驗(yàn)的t統(tǒng)計(jì)量和概率p值,各解釋變量的容忍度。(2)Confidence Intervals:輸出每個(gè)非

26、標(biāo)準(zhǔn)化回歸系數(shù)95的置信區(qū)間。(3)Descriptive:輸出各解釋變量和被解釋變量的均值、標(biāo)準(zhǔn)差、相關(guān)系數(shù)矩陣及單側(cè)檢驗(yàn)概率p值。第41頁/共60頁(4)Model fit:SPSS默認(rèn)輸出項(xiàng),輸出判定系數(shù)、調(diào)整的判定系數(shù)、回歸方程的標(biāo)準(zhǔn)誤差、回歸方程顯著F檢驗(yàn)的方程分析表。(5)R squared change:輸出每個(gè)解釋變量進(jìn)入方程后引起的判定系數(shù)的變化量和F值的變化量。(6)Part and partial correlation:輸出方程中各解釋變量與被解釋變量之間的簡單相關(guān)、偏相關(guān)系數(shù)。第42頁/共60頁(7)Covariance matrix:輸出方程中各解釋變量間的相關(guān)系數(shù)

27、、協(xié)方差以及各回歸系數(shù)的方差。(8)Collinearity Diagnostics:多重共線性分析,輸出各個(gè)解釋變量的容忍度、方差膨脹因子、特征值、條件指標(biāo)、方差比例等。(9)在Residual框中:Durbin-waston表示輸出DW檢驗(yàn)值;Casewise Diagnostic表示輸出標(biāo)準(zhǔn)化殘差絕對(duì)值大于等于3(SPSS默認(rèn)值)的樣本數(shù)據(jù)的相關(guān)信息,包括預(yù)測(cè)值、殘差、杠桿值等。第43頁/共60頁2、Options選項(xiàng),出現(xiàn)的窗口可供用戶設(shè)置多元線性回歸分析中解釋變量篩選的標(biāo)準(zhǔn)以及缺失值的處理方式。3、Plot選項(xiàng),出現(xiàn)的窗口用于對(duì)殘差序列的分析。第44頁/共60頁(1)窗口左邊框中各變

28、量名的含義是:DEPENDNT表示被解釋變量,*ZPRED表示標(biāo)準(zhǔn)化預(yù)測(cè)值,*ZRESID表示標(biāo)準(zhǔn)化殘差,*DRESID表示剔除殘差,*ADJPRED表示調(diào)整的預(yù)測(cè)值,*SRESID表示學(xué)生化殘差,*SDRESID表示剔除學(xué)生化殘差。(2)繪制多對(duì)變量的散點(diǎn)圖,可根據(jù)需要在scatter框中定義散點(diǎn)圖的縱坐標(biāo)和橫坐標(biāo)變量。(3)在Standardized Residual Plots框中選擇Histogram選項(xiàng)繪制標(biāo)準(zhǔn)化殘差序列的直方圖;選擇Normal probability plot繪制標(biāo)準(zhǔn)化殘差序列的正態(tài)分布累計(jì)概率圖。選擇Produce all partial plots選項(xiàng)表示依次

29、繪制被解釋變量和各個(gè)解釋變量的散點(diǎn)圖。第45頁/共60頁4、Save選項(xiàng),該窗口將回歸分析的某些結(jié)果以SPSS變量的形式保存到數(shù)據(jù)編輯窗口中,并可同時(shí)生成XML格式的文件,便于分析結(jié)果的網(wǎng)絡(luò)發(fā)布。(1)Predicted Values框中:保存非標(biāo)準(zhǔn)化預(yù)測(cè)值、標(biāo)準(zhǔn)化預(yù)測(cè)值、調(diào)整的預(yù)測(cè)值和預(yù)測(cè)值的均值標(biāo)準(zhǔn)誤差。(2)Distance框中:保存均值或個(gè)體預(yù)測(cè)值95(默認(rèn))置信區(qū)間的下限值和上限值。(3)Residual框中:保存非標(biāo)準(zhǔn)化殘差、標(biāo)準(zhǔn)化殘差等。(4)Influence Statistics框中:保存剔除第i個(gè)樣本后統(tǒng)計(jì)量的變化量。5、WSL選項(xiàng),采用加權(quán)最小二乘法替代普通最小二乘法估計(jì)

30、回歸參數(shù),并指定一個(gè)變量作為權(quán)重變量。第46頁/共60頁 為研究高等院校人文社會(huì)科學(xué)研究中立項(xiàng)課題數(shù)受哪些因素的影響,收集1999年31個(gè)省市自治區(qū)部分高校有關(guān)社科研究方面的數(shù)據(jù),并利用線性回歸分析方法進(jìn)行分析。這里,以課題總數(shù)為被解釋變量,解釋變量為投入人年數(shù)(X2)、受投入高級(jí)職稱的人年數(shù)(X3)、投入科研事業(yè)費(fèi)(X4)、專著數(shù)(X6)、論文數(shù)(X7)、獲獎(jiǎng)數(shù)(X8)。 (1)解釋變量采用強(qiáng)制進(jìn)入策略(Enter),并做多重共線性檢測(cè)。 (2)解釋變量采用向后篩選策略讓SPSS自動(dòng)完成解釋變量的選擇。 9.4.6 應(yīng)用舉例應(yīng)用舉例第47頁/共60頁9.5 曲線估計(jì) 9.5.1 曲線估計(jì)概述

31、 變量間的相關(guān)關(guān)系中,并不總是表現(xiàn)出線性關(guān)系,非線性關(guān)系也是極為常見的。變量之間的非線性關(guān)系可以劃分為本質(zhì)線性關(guān)系和本質(zhì)非線性關(guān)系。本質(zhì)線性關(guān)系是指變量關(guān)系形式上雖然呈非線性關(guān)系,但可通過變量變換為線性關(guān)系,并最終可通過線性回歸分析建立線性模型。本質(zhì)非線性關(guān)系是指變量關(guān)系不僅形式上呈非線性關(guān)系,而且也無法變換為線性關(guān)系。本節(jié)的曲線估計(jì)是解決本質(zhì)線性關(guān)系問題的。第48頁/共60頁常見的本質(zhì)線性模型有:1、二次曲線(Quadratic),方程為 ,變量變換后的方程為2、復(fù)合曲線(Compound),方程為,變量變換后的方程為3、增長曲線(Growth),方程為,變量變換后的方程為2012yxx20

32、1211()yxx xx01xy 01ln( )ln()ln()yx01xye01ln( ) yx第49頁/共60頁4、對(duì)數(shù)曲線(Logarithmic),方程為 ,變量變換后的線性方程為5、三次曲線(Cubic),方程為,變量變換后的方程為6、S曲線(S),方程為 ,變量變換后的方程為7、指數(shù)曲線(Exponential),方程為,變量變換后的線性方程為01ln( )yx01 1yx230123yxxx012 132yxxx01/xye01 1ln( )yx10 xye01ln( )ln()yx第50頁/共60頁8、逆函數(shù)(Inverse),方程為變量變換后的方程為9、冪函數(shù)(Power),

33、方程為變量變換后的方程為10、邏輯函數(shù)(Logistic),方程為 變量變換后的線性方程為01/yx01 1yx10()yx01ln( )ln()ln( )yx0111/xy 0111ln()ln(ln() )xy第51頁/共60頁 SPSS曲線估計(jì)中,首先,在不能明確究竟哪種模型更接近樣本數(shù)據(jù)時(shí),可在多種可選擇的模型中選擇幾種模型;然后SPSS自動(dòng)完成模型的參數(shù)估計(jì),并輸出回歸方程顯著性檢驗(yàn)的F值和概率p值、判定系數(shù)R2等統(tǒng)計(jì)量;最后,以判定系數(shù)為主要依據(jù)選擇其中的最優(yōu)模型,并進(jìn)行預(yù)測(cè)分析等。另外,SPSS曲線估計(jì)還可以以時(shí)間為解釋變量實(shí)現(xiàn)時(shí)間序列的簡單回歸分析和趨勢(shì)外推分析。第52頁/共60頁 9.5.2 曲線估計(jì)的基本操作 可通過繪制并觀察樣本數(shù)據(jù)的散點(diǎn)圖粗略確定被解釋變量和解釋變量之間的相關(guān)關(guān)系,為曲線擬

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論