相關(guān)分析和回歸分析_第1頁(yè)
相關(guān)分析和回歸分析_第2頁(yè)
相關(guān)分析和回歸分析_第3頁(yè)
相關(guān)分析和回歸分析_第4頁(yè)
相關(guān)分析和回歸分析_第5頁(yè)
已閱讀5頁(yè),還剩24頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

SPSS統(tǒng)計(jì)分析方法及應(yīng)用第七章

相關(guān)分析與回歸分析

1/13/202417.1相關(guān)分析和回歸分析概述7.2相關(guān)分析7.3偏相關(guān)分析7.4線性回歸分析1/13/202421.相關(guān)分析和回歸分析概述客觀事物之間的關(guān)系大致可歸納為兩大類,即函數(shù)關(guān)系:指兩事物之間的一種一一對(duì)應(yīng)的關(guān)系,如商品的銷售額和銷售量之間的關(guān)系。相關(guān)關(guān)系〔統(tǒng)計(jì)關(guān)系〕:指兩事物之間的一種非一一對(duì)應(yīng)的關(guān)系,例如家庭收入和支出、子女身高和父母身高之間的關(guān)系等。相關(guān)關(guān)系又分為線性相關(guān)和非線性相關(guān)。相關(guān)分析和回歸分析都是分析客觀事物之間相關(guān)關(guān)系的數(shù)量分析方法。1/13/202432.相關(guān)分析相關(guān)分析通過(guò)圖形和數(shù)值兩種方式,有效地揭示事物之間相關(guān)關(guān)系的強(qiáng)弱程度和形式?!?〕散點(diǎn)圖它將數(shù)據(jù)以點(diǎn)的的形式畫(huà)在直角坐標(biāo)系上,通過(guò)觀察散點(diǎn)圖能夠直觀的發(fā)現(xiàn)變量間的相關(guān)關(guān)系及他們的強(qiáng)弱程度和方向。1/13/20244〔2〕相關(guān)系數(shù)利用相關(guān)系數(shù)進(jìn)行變量間線性關(guān)系的分析通常需要完成以下兩個(gè)步驟:第一,計(jì)算樣本相關(guān)系數(shù)r;相關(guān)系數(shù)r的取值在-1~+1之間R>0表示兩變量存在正的線性相關(guān)關(guān)系;r<0表示兩變量存在負(fù)的線性相關(guān)關(guān)系R=1表示兩變量存在完全正相關(guān);r=-1表示兩變量存在完全負(fù)相關(guān);r=0表示兩變量不相關(guān)|r|>0.8表示兩變量有較強(qiáng)的線性關(guān)系;|r|<0.3表示兩變量之間的線性關(guān)系較弱第二,對(duì)樣本來(lái)自的兩總體是否存在顯著的線性關(guān)系進(jìn)行推斷。1/13/20245對(duì)不同類型的變量應(yīng)采用不同的相關(guān)系數(shù)來(lái)度量,常用的相關(guān)系數(shù)主要有Pearson簡(jiǎn)單相關(guān)系數(shù)、Spearman等級(jí)相關(guān)系數(shù)和Kendall相關(guān)系數(shù)等。Pearson簡(jiǎn)單相關(guān)系數(shù)〔適用于兩個(gè)變量都是數(shù)值型的數(shù)據(jù)〕。Spearman等級(jí)相關(guān)系數(shù)用來(lái)度量定序變量間的線性相關(guān)關(guān)系。1/13/20246〔3〕計(jì)算相關(guān)系數(shù)的根本操作【分析】--【相關(guān)】--【雙變量】1/13/20247〔4〕相關(guān)分析應(yīng)用舉例為研究高等院校人文社會(huì)科學(xué)研究中立項(xiàng)課題數(shù)會(huì)受哪些因素的影響,收集1999年31個(gè)省市自治區(qū)局部高校有關(guān)社科研究方面的數(shù)據(jù),研究立項(xiàng)課題數(shù)〔當(dāng)年〕與投入的具有高級(jí)職稱的人年數(shù)〔當(dāng)年〕、發(fā)表的論文數(shù)〔上年〕之間是否具有較強(qiáng)的線性關(guān)系。對(duì)該問(wèn)題的研究可以采用相關(guān)分析的方法,首先可繪制矩陣散點(diǎn)圖;其次可以計(jì)算Pearson簡(jiǎn)單相關(guān)系數(shù)。1/13/202481/13/202491/13/2024103.偏相關(guān)分析上節(jié)中的相關(guān)系數(shù)是研究?jī)勺兞块g線性相關(guān)性的,假設(shè)還存在其他因素影響,就相關(guān)系數(shù)本身來(lái)講,它未必是兩變量間線性相關(guān)強(qiáng)弱的真實(shí)表達(dá),往往有夸大的趨勢(shì)。例如,在研究商品的需求量和價(jià)格、消費(fèi)者收入之間的線性關(guān)系時(shí),需求量和價(jià)格之間的相關(guān)關(guān)系實(shí)際還包含了消費(fèi)者收入對(duì)價(jià)格和商品需求量的影響。在這種情況下,單純利用相關(guān)系數(shù)來(lái)評(píng)價(jià)變量間的相關(guān)性顯然是不準(zhǔn)確的,而需要在剔除其他相關(guān)因素影響的條件下計(jì)算變量間的相關(guān)。偏相關(guān)的意義就在于此。1)偏相關(guān)分析和偏相關(guān)系數(shù)1/13/202411偏相關(guān)分析也稱凈相關(guān)分析,它在控制其他變量的線性影響的條件下分析兩變量間的線性關(guān)系,所采用的工具是偏相關(guān)系數(shù)。控制變量個(gè)數(shù)為1時(shí),偏相關(guān)系數(shù)稱一階偏相關(guān);當(dāng)控制兩個(gè)變量時(shí),偏相關(guān)系數(shù)稱為二階偏相關(guān);當(dāng)控制變量的個(gè)數(shù)為0時(shí),偏相關(guān)系數(shù)稱為零階偏相關(guān),也就是簡(jiǎn)單相關(guān)系數(shù)。1/13/2024122)偏相關(guān)分析的根本操作【分析】--【相關(guān)】--【偏相關(guān)】1/13/2024131/13/2024144.線性回歸分析線性回歸分析的內(nèi)容能否找到一個(gè)線性組合來(lái)說(shuō)明一組自變量和因變量的關(guān)系如果能的話,這種關(guān)系的強(qiáng)度有多大,也就是利用自變量的線性組合來(lái)預(yù)測(cè)因變量的能力有多強(qiáng)整體解釋能力是否具有統(tǒng)計(jì)上的顯著性意義在整體解釋能力顯著的情況下,哪些自變量有顯著意義回歸分析的一般步驟確定回歸方程中的解釋變量〔自變量〕和被解釋變量〔因變量〕確定回歸方程對(duì)回歸方程進(jìn)行各種檢驗(yàn)利用回歸方程進(jìn)行預(yù)測(cè)1)線性回歸分析概述1/13/2024152)線性回歸模型一元線性回歸模型的數(shù)學(xué)模型:其中x為自變量;y為因變量;為截距,即常量;為回歸系數(shù),說(shuō)明自變量對(duì)因變量的影響程度。1/13/202416多元線性回歸模型多元線性回歸方程:y=β0+β1x1+β2x2+...+βkxkβ1、β2、βk為偏回歸系數(shù)。β1表示在其他自變量保持不變的情況下,自變量x1變動(dòng)一個(gè)單位所引起的因變量y的平均變動(dòng)。1/13/202417選擇【分析】→【回歸】→【線性】。在左側(cè)變量框中選擇“課題總數(shù)〞將其移動(dòng)到因變量列表中,將自變量“移動(dòng)到自變量下的方格中,如下圖。1/13/2024181/13/2024191/13/202420

從下表可以看出,引入模型的六個(gè)解釋變量只有一個(gè)通過(guò)t檢驗(yàn)。模型整體顯著而單個(gè)系數(shù)大都不能通過(guò)t檢驗(yàn),這正是解釋變量之間存過(guò)多重共線性的常見(jiàn)特征。觀察表中的容差和方差膨脹因子我們可以看出六個(gè)解釋變量的容差都很小接近于0,但它們的VIF都很大,這進(jìn)一步證實(shí)了解釋變量之間存在嚴(yán)重的多重共線性。1/13/2024211)容忍度(Tolerance):容忍度越小,多重共線性越嚴(yán)重。有學(xué)者提出,容忍度小于0.1時(shí),存在嚴(yán)重的多重共線性。2)方差膨脹因子(VIF):等于容忍度的倒數(shù)。顯然,VIF越大,多重共線性問(wèn)題越大。一般認(rèn)為VIF不應(yīng)大于5,對(duì)應(yīng)容忍度的標(biāo)準(zhǔn),也可放寬至不大于10。3)特征值〔Eigenvalue):對(duì)模型中常數(shù)項(xiàng)及所有自變量計(jì)算主成分,如果自變量間存在較強(qiáng)的線性相關(guān)關(guān)系,那么前面的幾個(gè)主成分?jǐn)?shù)值較大,而后面的幾個(gè)主成分較小,甚至接近0。4)條件索引(ConditionIndex):等于最大的主成分與當(dāng)前主成分的比值的算術(shù)平方根。所以第一個(gè)主成分相對(duì)應(yīng)的條件指數(shù)總為1。同樣,如果幾個(gè)條件指數(shù)較大(如大于30),那么提示存在多重共線性。1/13/202422下表給出了方程解釋變量的多重共線性診斷結(jié)果。從特征根上看,最大的特征根遠(yuǎn)遠(yuǎn)大于其他特征根,后3個(gè)條件指數(shù)都大于10,說(shuō)明變量之間確實(shí)存在多重共線性問(wèn)題。從方差比例上看,第6個(gè)特征根解釋了人均論文數(shù)方差的82%,同時(shí)解釋了投入科研事業(yè)費(fèi)方差的65%,說(shuō)明這兩個(gè)變量之間可能存在多重共線性;第7個(gè)特征根同時(shí)解釋了投入人年數(shù)方差的84%、投入高級(jí)職稱的人年數(shù)方差的60%,說(shuō)明這2個(gè)變量之間可能存在多重共線性。1/13/202423為了解決多重共線性帶來(lái)的問(wèn)題,可以使用Backward法篩選變量。得到結(jié)果如下表所示:從模型匯總可以看出方程的擬合優(yōu)度還是比較高的,Backward法篩選變量的過(guò)程如下表,最后我們得到模型6.在模型6中去掉了原有的6個(gè)變量,剩下1個(gè)變量不存在多重共線性了,由此得到線性回歸方程為:課題總數(shù)=-94.524+0.492*投入人年數(shù)1/13/2024241/13/202425

變量間的相關(guān)關(guān)系中,并不總是表現(xiàn)出線性關(guān)系,非線性關(guān)系也是極為常見(jiàn)的。變量之間的非線性關(guān)系可以劃分為本質(zhì)線性關(guān)系和本質(zhì)非線性關(guān)系。本質(zhì)線性關(guān)系是指變量關(guān)系形式上雖然呈非線性關(guān)系,但可通過(guò)變量變換為線性關(guān)系,并最終可通過(guò)線性回歸分析建立線性模型。本質(zhì)非線性關(guān)系是指變量關(guān)系不僅形式上呈非線性關(guān)系,而且也無(wú)法變換為線性關(guān)系。本節(jié)的曲線估計(jì)是解決本質(zhì)線性關(guān)系問(wèn)題的。5.曲線估計(jì)1)曲線估計(jì)概述1/13/202426

SPSS曲線估計(jì)中,首先,在不能明確究竟哪種模型更接近樣本數(shù)據(jù)時(shí),可在多種可選擇的模型中選擇幾種模型;然后SPSS自動(dòng)完成模型的參數(shù)估計(jì),并輸出回歸方程顯著性檢驗(yàn)的F值和概率p值、判定系數(shù)R2等統(tǒng)計(jì)量;最后,以判定系數(shù)為主要依據(jù)選擇其中的最優(yōu)模型,并進(jìn)行預(yù)測(cè)分析等。1/13/202427可通過(guò)繪制并觀察樣本數(shù)據(jù)的散點(diǎn)圖粗略確定被解釋變量和解釋變量之間的相關(guān)關(guān)系,為曲線擬合中的模型選擇提供依據(jù)。SPSS曲線估計(jì)的根本操作步驟是:選擇菜單分析-回歸-曲線估計(jì)。2)曲線估計(jì)的根本操作1/13/202428教育支出的相

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論