




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第八早SPSS相關(guān)分析與回歸分析6.1相關(guān)分析和回歸分析概述客觀事物之間的關(guān)系大致可歸納為兩大類,即函數(shù)關(guān)系:指兩事物之間的一種 對(duì)應(yīng)的關(guān)系,如商品的銷售額和銷售量之間的關(guān)系。相關(guān)關(guān)系(統(tǒng)計(jì)關(guān)系):指兩事物之間的一種非 對(duì)應(yīng)的關(guān)系,例如家庭收入和 支出、子女身高和父母身高之間的關(guān)系等。相關(guān)關(guān)系又分為線性相關(guān)和非線性相關(guān)。 相關(guān)分析和回歸分析都是分析客觀事物之間相關(guān)關(guān)系的數(shù)量分析方法。6.2相關(guān)分析相關(guān)分析通過(guò)圖形和數(shù)值兩種方式,有效地揭示事物之間相關(guān)關(guān)系的強(qiáng)弱程度和形式。6.2.1散點(diǎn)圖它將數(shù)據(jù)以點(diǎn)的的形式畫在直角坐標(biāo)系上,通過(guò)觀察散點(diǎn)圖能夠直觀的發(fā)現(xiàn)變量間的相關(guān)關(guān)系及他們的強(qiáng)弱程度和方向。6
2、.2.2相關(guān)系數(shù)利用相關(guān)系數(shù)進(jìn)行變量間線性關(guān)系的分析通常需要完成以下兩個(gè)步驟:第一,計(jì)算樣本相關(guān)系數(shù) r;相關(guān)系數(shù)r的取值在-1+1之間R0表示兩變量存在正的線性相關(guān)關(guān)系;r0.8表示兩變量有較強(qiáng)的線性關(guān)系; |r| y)2/p 匚(p1)C 2 F ( p, n p 1)(y 02 /( np.16.3.3.3回歸系數(shù)的顯著性檢驗(yàn)(t檢驗(yàn))回歸系數(shù)的顯著性檢驗(yàn)是要檢驗(yàn)回歸方程中被解釋變量與每一個(gè)解釋變量之間的線性 關(guān)系是否顯著。對(duì)于一元線性回歸方程,檢驗(yàn)統(tǒng)計(jì)量為:2)(XiSy其中,6.3.3.4 殘差分析殘差是指由回歸方程計(jì)算得到的預(yù)測(cè)值與實(shí)際樣本值之間的差距,定義為:eiyi ? yi
3、( o 1x12x2. pXp)對(duì)于線性回歸分析來(lái)講,如果方程能夠較好的反映被解釋變量的特征和規(guī)律性,那么殘差序列中應(yīng)不包含明顯的規(guī)律性。殘差分析包括以下內(nèi)容:殘差服從正態(tài)分布,其平均值等 于0;殘差取值與 X的取值無(wú)關(guān);殘差不存在自相關(guān);殘差方差相等。1、對(duì)于殘差均值和方差齊性檢驗(yàn)可以利用殘差圖進(jìn)行分析。如果殘差均值為零,殘差圖的點(diǎn)應(yīng)該在縱坐標(biāo)為 0的中心的帶狀區(qū)域中隨機(jī)散落。如果殘差的方差隨著解釋變量值(或被 解釋變量值)的增加呈有規(guī)律的變化趨勢(shì),則出現(xiàn)了異方差現(xiàn)象。2、DW僉驗(yàn)。DW檢驗(yàn)用來(lái)檢驗(yàn)殘差的自相關(guān)。檢驗(yàn)統(tǒng)計(jì)量為:DW=2表示無(wú)自相關(guān),在 0-2之間說(shuō)明存在正自相關(guān),在 2-4之
4、間說(shuō)明存在負(fù)的自相關(guān)。般情況下,DW直在1.5-2.5之間即可說(shuō)明無(wú)自相關(guān)現(xiàn)象。e ti.) 2DW6.3.3.5 多重共線性分析多重共線性是指解釋變量之間存在線性相關(guān)關(guān)系的現(xiàn)象。測(cè)度多重共線性一般有以下方式:1、容忍度:Tol i 1Ri2其中,是第i個(gè)解釋變量與方程中其他解釋變量間的復(fù)相關(guān)系數(shù)的平方,表示解釋 變量之間的線性相關(guān)程度。容忍度的取值范圍在0-1之間,越接近0表示多重共線性越強(qiáng),越接近1表示多重共線性越弱。2、方差膨脹因子 VIF。方差膨脹因子是容忍度的倒數(shù)。VIF越大多重共線性越強(qiáng),當(dāng)VIF大于等于10時(shí),說(shuō)明存在嚴(yán)重的多重共線性。3、特征根和方差比。根據(jù)解釋變量的相關(guān)系數(shù)矩
5、陣求得的特征根中,如果最大的特征根遠(yuǎn)遠(yuǎn)大于其他特征 根,則說(shuō)明這些解釋變量間具有相當(dāng)多的重復(fù)信息。如果某個(gè)特征根既能夠刻畫某解釋變量方差的較大部分比例(0.7以上),又能刻畫另一解釋變量方差的較大部分比例,則表明這 兩個(gè)解釋變量間存在較強(qiáng)的線性相關(guān)關(guān)系。4、條件指數(shù)。指最大特征根與第i個(gè)特征根比的平方根。通常,當(dāng)條件指數(shù)在0-10之間時(shí)說(shuō)明多重共線性較弱;當(dāng)條件指數(shù)在 10-100之間說(shuō)明多重共線性較強(qiáng);當(dāng)條件指數(shù)大于100時(shí)說(shuō)明存在嚴(yán)重的多重共線性。6.3.3線性回歸分析的基本操作(1 )選擇菜單 An alyze Regressio n Lin ear,出現(xiàn)窗口選擇被解釋變量進(jìn)入Depe
6、ndent框。(3 )選擇一個(gè)或多個(gè)解釋變量進(jìn)入In depe nden t(s)框。 在Method框中選擇回歸分析中解釋變量的篩選策略。其中Enter表示所選變量強(qiáng)行進(jìn)入回歸方程,是 SPSS默認(rèn)的策略,通常用在一元線性回歸分析中;Remove表示從回歸方程中剔除所選變量;Stepwise表示逐步篩選策略;Backward表示向后篩選策略;Forward表示向前篩選策略。注:多元回歸分析中,變量的篩選一般有向前篩選、向后篩選、逐步篩選三種基本策略。向前篩選(Forward )策略:解釋變量不斷進(jìn)入回歸方程的過(guò)程。首先,選擇與被解 釋變量具有最高線性相關(guān)系數(shù)的變量進(jìn)入方程,并進(jìn)行回歸方程的各
7、種檢驗(yàn);然后,在剩余的變量中尋找與被解釋變量偏相關(guān)系數(shù)最高且通過(guò)檢驗(yàn)的變量進(jìn)入回歸方程,并對(duì)新建立的回歸方程進(jìn)行各種檢驗(yàn);這個(gè)過(guò)程一直重復(fù),直到再也沒有可進(jìn)入方程的變量為止。向后篩選(Backward )策略:變量不斷剔除出回歸方程的過(guò)程。首先,所有變量全 部引入回歸方程,并對(duì)回歸方程進(jìn)行各種檢驗(yàn);然后,在回歸系數(shù)顯著性檢驗(yàn)不顯著的一個(gè) 或多個(gè)變量中,剔除t檢驗(yàn)值最小的變量,并重新建立回歸方程和進(jìn)行各種檢驗(yàn);如果新建 回歸方程中所有變量的回歸系數(shù)檢驗(yàn)都顯著,則回歸方程建立結(jié)束。否則按上述方法再一次剔除最不顯著的變量,直到再也沒有可剔除的變量為止。逐步篩選(Stepwise )策略:在向前篩選策
8、略的基礎(chǔ)上結(jié)合向后篩選策略,在每個(gè)變 量進(jìn)入方程后再次判斷是否存在應(yīng)該剔除出方程的變量。因此,逐步篩選策略在引入變量的每一個(gè)階段都提供了再剔除不顯著變量的機(jī)會(huì)。第三和第四步中確定的解釋變量及變量篩選策略可放置在不同的塊(Block )中。通常在回歸分析中不止一組待進(jìn)入方程的解釋變量和相應(yīng)的篩選策略,可以單擊Next和Previous按鈕設(shè)置多組解釋變量和變量篩選策略并放置在不同的塊中。 選擇一個(gè)變量作為條件變量放到Selection Variable框中,并單擊 Rule按鈕給定一個(gè)判 斷條件。只有變量值滿足判定條件的樣本才參與線性回歸分析。 在Case Labels框中指定哪個(gè)變量作為樣本數(shù)
9、據(jù)點(diǎn)的標(biāo)志變量,該變量的值將標(biāo)在回歸 分析的輸出圖形中。634線性回歸分析的其他操作1、Statistics按鈕,出現(xiàn)的窗口可供用戶選擇更多的輸出統(tǒng)計(jì)量。Estimates: SPSS默認(rèn)輸出項(xiàng),輸出與回歸系數(shù)相關(guān)的統(tǒng)計(jì)量。包括回歸系數(shù)(偏回歸系數(shù))、回歸系數(shù)標(biāo)準(zhǔn)誤差、 標(biāo)準(zhǔn)化回歸系數(shù)、回歸系數(shù)顯著性檢驗(yàn)的 t統(tǒng)計(jì)量和概率p 值,各解釋變量的容忍度。 Confidenee Intervals :輸出每個(gè)非標(biāo)準(zhǔn)化回歸系數(shù)95%的置信區(qū)間。Descriptive :輸出各解釋變量和被解釋變量的均值、標(biāo)準(zhǔn)差、相關(guān)系數(shù)矩陣及單 側(cè)檢驗(yàn)概率p值?;脽羝?4Model fit : SPSS默認(rèn)輸出項(xiàng),輸出
10、判定系數(shù)、調(diào)整的判定系數(shù)、回歸方程的標(biāo)準(zhǔn) 誤差、回歸方程顯著 F檢驗(yàn)的方程分析表。 R squared change:輸出每個(gè)解釋變量進(jìn)入方程后引起的判定系數(shù)的變化量和F值 的變化量。Part and partial correlation :輸出方程中各解釋變量與被解釋變量之間的簡(jiǎn)單相關(guān)、 偏相關(guān)系數(shù)。幻燈片45 Covarianee matrix :輸出方程中各解釋變量間的相關(guān)系數(shù)、協(xié)方差以及各回歸系數(shù) 的方差。Colli nearity Diag no sties :多重共線性分析,輸出各個(gè)解釋變量的容忍度、方差膨 脹因子、特征值、條件指標(biāo)、方差比例等。 在 Residual 框中:Du
11、rbin-waston 表示輸出 DW 檢驗(yàn)值;Casewise Diagnostic 表示 輸出標(biāo)準(zhǔn)化殘差絕對(duì)值大于等于3 (SPSS默認(rèn)值)的樣本數(shù)據(jù)的相關(guān)信息,包括預(yù)測(cè)值、殘差、杠桿值等。2、Options選項(xiàng),出現(xiàn)的窗口可供用戶設(shè)置多元線性回歸分析中解釋變量篩選的標(biāo)準(zhǔn)以及缺 失值的處理方式。3、Plot選項(xiàng),出現(xiàn)的窗口用于對(duì)殘差序列的分析。(1) 窗口左邊框中各變量名的含義是:DEPENDNT表示被解釋變量,*ZPRED表示標(biāo)準(zhǔn)化 預(yù)測(cè)值,*ZRESID表示標(biāo)準(zhǔn)化殘差,*DRESID表示剔除殘差,*ADJPRED表示調(diào)整的預(yù)測(cè) 值,*SRESID表示學(xué)生化殘差,*SDRESID表示剔除
12、學(xué)生化殘差。(2) 繪制多對(duì)變量的散點(diǎn)圖,可根據(jù)需要在scatter框中定義散點(diǎn)圖的縱坐標(biāo)和橫坐標(biāo)變量。(3)在Standardized Residual Plots框中選擇 Histogram選項(xiàng)繪制標(biāo)準(zhǔn)化殘差序列的直方圖;選擇Normal probability plot繪制標(biāo)準(zhǔn)化殘差序列的正態(tài)分布累計(jì)概率圖。選擇Produce allpartial plots選項(xiàng)表示依次繪制被解釋變量和各個(gè)解釋變量的散點(diǎn)圖。4、 Save選項(xiàng),該窗口將回歸分析的某些結(jié)果以SPSS變量的形式保存到數(shù)據(jù)編輯窗口中, 并可同時(shí)生成XML格式的文件,便于分析結(jié)果的網(wǎng)絡(luò)發(fā)布。(1)Predicted Values
13、框中:保存非標(biāo)準(zhǔn)化預(yù)測(cè)值、標(biāo)準(zhǔn)化預(yù)測(cè)值、調(diào)整的預(yù)測(cè)值和預(yù)測(cè)值 的均值標(biāo)準(zhǔn)誤差。(2) Distanee框中:保存均值或個(gè)體預(yù)測(cè)值95%(默認(rèn))置信區(qū)間的下限值和上限值。(3)Residual框中:保存非標(biāo)準(zhǔn)化殘差、標(biāo)準(zhǔn)化殘差等。(4) In flue nee Statistics框中:保存剔除第i個(gè)樣本后統(tǒng)計(jì)量的變化量。5、WSL選項(xiàng),采用加權(quán)最小二乘法替代普通最小二乘法估計(jì)回歸參數(shù),并指定一個(gè)變量作 為權(quán)重變量。6.3.5應(yīng)用舉例以高??蒲醒芯繑?shù)據(jù)為例,建立回歸方程研究1、課題總數(shù)受論文數(shù)的影響2、 以課題總數(shù)為被解釋變量,解釋變量為投入人年數(shù)(X2 )、受投入高級(jí)職稱的人年數(shù) (X3 )、
14、投入科研事業(yè)費(fèi)(X4 )、專著數(shù)(X6 )、論文數(shù)(X7 )、獲獎(jiǎng)數(shù)(X8 )。(1)解釋變量采用強(qiáng)制進(jìn)入策略(2)解釋變量采用向后篩選策略讓(3)解釋變量采用逐步篩選策略讓 練習(xí)En ter),并做多重共線性檢測(cè)。SPSS自動(dòng)完成解釋變量的選擇。SPSS自動(dòng)完成解釋變量的選擇。1、為研究收入和支出的關(guān)系,收集1978-2002年我國(guó)的年人均可支配收入和年人均消費(fèi)性支出數(shù)據(jù),研究收入與支出之間是否具有較強(qiáng)的線性關(guān)系。2、以年人均支出和教育數(shù)據(jù)為例,建立回歸方程研究年人均消費(fèi)支出、恩格爾系數(shù)、在外就餐、教育支出、住房人均使用面積受年人均可支配收入的影響。6.4 曲線估計(jì)6.4.1 曲線估計(jì)概述變
15、量間的相關(guān)關(guān)系中, 并不總是表現(xiàn)出線性關(guān)系, 非線性關(guān)系也是極為常見的。 變量之 間的非線性關(guān)系可以劃分為本質(zhì)線性關(guān)系和本質(zhì)非線性關(guān)系。 本質(zhì)線性關(guān)系是指變量關(guān)系形 式上雖然呈非線性關(guān)系, 但可通過(guò)變量變換為線性關(guān)系, 并最終可通過(guò)線性回歸分析建立線 性模型。 本質(zhì)非線性關(guān)系是指變量關(guān)系不僅形式上呈非線性關(guān)系, 而且也無(wú)法變換為線性關(guān) 系。本節(jié)的曲線估計(jì)是解決本質(zhì)線性關(guān)系問(wèn)題的。常見的本質(zhì)線性模型有:21、二次曲線(Quadratic),方程為y01 x2 x ,變量變換后的方程為 y1x2 x 1 ( x 1x 2 )2、復(fù)合曲線(Compound),方程為yx01,變量變換后的方程為 ln
16、( y )3、增長(zhǎng)曲線( Growth ),方程為 y,變量變換后的方程為 ln( y )ln(0 ) ln(1x1x4、對(duì)數(shù)曲線( Logarithmic ),方程為 y ,變量變換后的線性方程為 y5、三次曲線(Cubic ),方程為y,變量變換后的方程為 y06、S曲線(S),方程為 ye變量變換后的方程為 ln( y )07、指數(shù)曲線( Exponential ),方程為 y ,變量變換后的線性方程為 ln( y )01 x 12301x2x3x31x2x13 x 201/x1x11x0eln(0)1x1 ln( x )08、逆函數(shù)(In verse),方程為 y1/x變量變換后的方程
17、為 y1x19、幕函數(shù)(Power),方程為y(x變量變換后的方程為ln(y )ln(0 )1 ln(x )10、邏輯函數(shù)(Logistic ),方程為變量變換后的線性方程為ln( 7ln(0ln(1 ) x )SPSS曲線估計(jì)中,首先,在不能明確究竟哪種模型更接近樣本數(shù)據(jù)時(shí),可在多種可選 擇的模型中選擇幾種模型;然后SPSS自動(dòng)完成模型的參數(shù)估計(jì),并輸出回歸方程顯著性檢驗(yàn)的F值和概率p值、判定系數(shù)R2等統(tǒng)計(jì)量;最后,以判定系數(shù)為主要依據(jù)選擇其中的最 優(yōu)模型,并進(jìn)行預(yù)測(cè)分析等。另外,SPSS曲線估計(jì)還可以以時(shí)間為解釋變量實(shí)現(xiàn)時(shí)間序列的簡(jiǎn)單回歸分析和趨勢(shì)外推分析。642曲線估計(jì)的基本操作可通過(guò)繪
18、制并觀察樣本數(shù)據(jù)的散點(diǎn)圖粗略確定被解釋變量和解釋變量之間的相關(guān)關(guān)系, 為曲線擬合中的模型選擇提供依據(jù)。SPSS曲線估計(jì)的基本操作步驟是:(1)選擇菜單 Analyze Regression Curve Estimation ,出現(xiàn)窗口如下頁(yè)所示 。把被解釋變量選到 Dependent框中。曲線估計(jì)中的解釋變量可以是相關(guān)因素變量也可是時(shí)間變量。如果解釋變量為相關(guān)因素變量,則選擇 Variable選項(xiàng),并把一個(gè)解釋變量指定到Independent框;如果選擇Time參數(shù)則表示解釋變量為時(shí)間變量。在Models中選擇幾種模型。選擇Plot Models選項(xiàng)繪制回歸線;選擇 Display ANOVA table輸出各個(gè)模型的方差分 析表和各回歸系數(shù)顯著性檢驗(yàn)結(jié)果。至此,完成了曲線估計(jì)的操作,SPSS將根據(jù)選擇的模型自動(dòng)進(jìn)行曲線估計(jì),并將結(jié)果顯示到輸出窗口中。643應(yīng)用舉例1、教育支出的相關(guān)因素分析為研究居民家庭教育支出和消費(fèi)性支出之間的關(guān)系,收集到1978年至2002年全國(guó)人均消費(fèi)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 真石漆的施工方案
- 管道陰極保護(hù)施工方案
- 二零二五年度梁上打孔作業(yè)風(fēng)險(xiǎn)控制免責(zé)合同
- 二零二五年度金融服務(wù)合同價(jià)款調(diào)整與信用風(fēng)險(xiǎn)防范
- 二零二五年度武漢房屋租賃合同糾紛處理辦法
- 二零二五年度足療店連鎖經(jīng)營(yíng)授權(quán)管理合同
- 二零二五年度能源消耗監(jiān)控系統(tǒng)維保及節(jié)能服務(wù)合同
- 二零二五年度羊群代放牧與綠色食品生產(chǎn)協(xié)議
- 二零二五年度二零二五年度承重墻拆除工程安全生產(chǎn)責(zé)任承諾書
- 普通高等學(xué)校就業(yè)協(xié)議書(2025年度)-金融服務(wù)業(yè)人才輸送協(xié)議
- 人教版八年級(jí)下冊(cè)英語(yǔ)單詞表
- XX電站接地裝置的熱穩(wěn)定校驗(yàn)報(bào)告(220kV)
- 麗聲北極星分級(jí)繪本第三級(jí)上-Zob-Is-Bored
- 鐵路信號(hào)基礎(chǔ)(第四版) 課件全套 林瑜筠 第1-6章 信號(hào)繼電器 -鐵路信號(hào)系統(tǒng)概述
- 2025年度住宅小區(qū)水電改造與維修一體化服務(wù)合同4篇
- 2025年國(guó)家電投集團(tuán)海南分公司招聘筆試參考題庫(kù)含答案解析
- 2025年春新冀教版英語(yǔ)三年級(jí)下冊(cè)課件 U1L1
- 2025年春新人教版物理八年級(jí)下冊(cè)課件 第九章 壓強(qiáng) 第1節(jié) 壓強(qiáng)
- 2024年國(guó)家公務(wù)員考試行測(cè)真題附解析答案
- 基本藥物制度政策培訓(xùn)課件
- 消化內(nèi)鏡護(hù)理講課
評(píng)論
0/150
提交評(píng)論