第七章 相關(guān)分析課件_第1頁(yè)
第七章 相關(guān)分析課件_第2頁(yè)
第七章 相關(guān)分析課件_第3頁(yè)
第七章 相關(guān)分析課件_第4頁(yè)
第七章 相關(guān)分析課件_第5頁(yè)
已閱讀5頁(yè),還剩11頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

相關(guān)分析一、基本原理任何事物的變化都與其他事物相互聯(lián)系和相互影響的,用于描述事物數(shù)量特征的變量之間也存在一定的關(guān)系。變量之間的關(guān)系歸納起來(lái)可以分為兩種類型:函數(shù)關(guān)系和統(tǒng)計(jì)關(guān)系。第七章相關(guān)分析函數(shù)關(guān)系是一一對(duì)應(yīng)的確定性關(guān)系,比較容易分析和測(cè)度。可是在現(xiàn)實(shí)中,變量之間的關(guān)系往往并不那么簡(jiǎn)單。比如,家庭收入和支出、一個(gè)人所受的教育程度與其收入、子女身高和父母身高等,它們之間確定存在某種關(guān)系,但這些關(guān)系無(wú)法像函數(shù)關(guān)系那樣,能夠用一個(gè)確定的函數(shù)公式來(lái)描述。一個(gè)變量x取一定值時(shí),另一個(gè)變量y的值可能有幾個(gè)。這樣,一個(gè)變量的值不能由另一個(gè)變量的值惟一確定,這種關(guān)系稱為統(tǒng)計(jì)關(guān)系。第七章相關(guān)分析事物之間的統(tǒng)計(jì)關(guān)系不像函數(shù)關(guān)系那樣直接,但通過(guò)對(duì)大量數(shù)據(jù)的觀察和研究,就會(huì)發(fā)現(xiàn)許多變量之間確實(shí)存在著某種統(tǒng)計(jì)關(guān)系,并且有的關(guān)系強(qiáng),有的關(guān)系弱,程度各有差異。如何測(cè)度事物間統(tǒng)計(jì)關(guān)系的強(qiáng)弱程度成為人們關(guān)注的問(wèn)題。衡量事物之間或稱變量之間線性相關(guān)程度的強(qiáng)弱,并用適當(dāng)?shù)慕y(tǒng)計(jì)指標(biāo)表示出來(lái),這個(gè)過(guò)程就是相關(guān)分析。為了能夠更加準(zhǔn)確的描述變量之間的線性相關(guān)程度,可以通過(guò)計(jì)算相關(guān)系數(shù)進(jìn)行相關(guān)分析。相關(guān)系數(shù)是衡量變量之間相關(guān)程度的一個(gè)量值。第七章相關(guān)分析二、主要方法在實(shí)際中,因?yàn)檠芯康哪康牟煌?,變量的類型不同,采用的相關(guān)分析方法也不同。SPSS軟件的相關(guān)模型,有Pearson、Spearman和Kendall

3種子模型。其中Pearson模型用于滿足正態(tài)分布的定量數(shù)據(jù),而對(duì)于不滿足正態(tài)分布的定序、計(jì)數(shù)數(shù)據(jù),則應(yīng)使用Spearman和Kendall相關(guān)模型。不過(guò),Pearson模型是最重要、最基本、最常用的模型。第七章相關(guān)分析三、案例案例一、連續(xù)變量的相關(guān)分析為了研究教育投資與地區(qū)經(jīng)濟(jì)增長(zhǎng)、學(xué)生增長(zhǎng)之間的關(guān)系,某機(jī)構(gòu)調(diào)查了26個(gè)地區(qū)的教育投資與地區(qū)經(jīng)濟(jì)增長(zhǎng)、學(xué)生增長(zhǎng)的數(shù)據(jù),請(qǐng)根據(jù)所得到的數(shù)據(jù)分析其相關(guān)關(guān)系,并得到相關(guān)系數(shù)。第七章相關(guān)分析案例二、等級(jí)變量的相關(guān)分析某班10個(gè)學(xué)生進(jìn)行了數(shù)學(xué)和語(yǔ)文測(cè)驗(yàn),分析數(shù)學(xué)與語(yǔ)文的成績(jī)是否等級(jí)相關(guān)。第七章相關(guān)分析偏相關(guān)分析一、偏相關(guān)分析的概念

相關(guān)分析通過(guò)計(jì)算兩個(gè)變量之間的相關(guān)系數(shù),分析變量間線性相關(guān)的程度。在多元相關(guān)分析中,由于受到其他變量的影響,Pearson相關(guān)系數(shù)只是從表面上反映兩個(gè)變量相關(guān)的性質(zhì),往往不能真實(shí)地反映變量間的線性相關(guān)程度,甚至?xí)o人們?cè)斐上嚓P(guān)的假象。因此在某些場(chǎng)合中,簡(jiǎn)單的Pearson相關(guān)系數(shù)并不是刻劃相關(guān)關(guān)系的本質(zhì)性統(tǒng)計(jì)。所謂偏相關(guān),是指在諸多相關(guān)的變量中,剔除其中的一個(gè)或若干個(gè)變量后,兩個(gè)變量之間的相關(guān)關(guān)系,這樣的兩個(gè)變量之間的相關(guān)系數(shù)叫偏相關(guān)系數(shù)。偏相關(guān)系數(shù)才是真正反映兩個(gè)變量相關(guān)關(guān)系的統(tǒng)計(jì)量。第七章相關(guān)分析

偏相關(guān)分析是指當(dāng)兩個(gè)變量同時(shí)與第三個(gè)變量相關(guān)時(shí),將第三個(gè)變量的影響剔除,只分析另外兩個(gè)變量之間相關(guān)程度的過(guò)程。

例如在研究身高、體重、肺活量3者的相關(guān)關(guān)系時(shí),顯然肺話量與身高,肺活量與體重均存在一定的正相關(guān)關(guān)系。但是當(dāng)我們將體重固定下來(lái),對(duì)相同體重的人分析肺活量與身高的關(guān)系時(shí),是否仍然具有身高超高,肺活量越大正相關(guān)關(guān)系呢?恐怕就不一定了。偏相關(guān)分析用于計(jì)算變量間的偏相關(guān)系數(shù),以利于更準(zhǔn)確地判斷變量之間的相關(guān)關(guān)系和相關(guān)程度。偏相關(guān)的概念在教育科學(xué)、管理科學(xué)、經(jīng)濟(jì)科學(xué)等社會(huì)科學(xué)中有著廣泛的應(yīng)用,而且,正確地使用它對(duì)正確地得出相應(yīng)的結(jié)論至關(guān)重要。第七章相關(guān)分析偏相關(guān)分析案例

某調(diào)查收集了26個(gè)城市的教育投資數(shù)據(jù)、學(xué)生增長(zhǎng)率和城市經(jīng)濟(jì)增長(zhǎng)率,試分析其偏相關(guān)系數(shù)。第七章相關(guān)分析距離相關(guān)分析為了將變量或觀測(cè)量(樣品)進(jìn)行分類,通常使用的一種方法是將樣品視為m維空間的點(diǎn),并在該空間定義點(diǎn)與點(diǎn)之間的距離,將距離較近的點(diǎn)歸為一類,距離較遠(yuǎn)的點(diǎn)應(yīng)視為屬于不同的類。多元統(tǒng)計(jì)中對(duì)距離的定義方法有許多種,而這些定義與變量的數(shù)據(jù)類型有很大關(guān)系,這里僅以間隔測(cè)度的變量的距離定義作簡(jiǎn)要的介紹。第七章相關(guān)分析

用d(I,j)表示第i個(gè)與第J個(gè)樣品之間的處離。

一般要求定義的距離必須滿足4個(gè)條件:①對(duì)—切I,jd(I,j)>=0;②對(duì)—切I,j,d(i,j)=0

樣品i和樣品j的各指標(biāo)值相等;②對(duì)一切I,j,d(i,j)=d(j,i);④對(duì)一切I,j,k有d(i,j)<=d(i,k)+d(k,j)。各種計(jì)算距離的公式,這里從略。第七章相關(guān)分析

另一種方法是用相似系數(shù)來(lái)表示樣品之間的親疏程度。性質(zhì)越接近的樣品,它們之間的相似系數(shù)越接近于1(或—1),而彼此無(wú)關(guān)的樣品之間的相似系數(shù)則越接近于0,將比較相似的樣品歸入一類,不怎么相似的則歸為不同的類。第七章相關(guān)分析相似系數(shù)C(I,j)用來(lái)表明變量Xi與Xj之間的相似程度。一般規(guī)定相似系數(shù)應(yīng)滿足如下關(guān)系:

(1)C(I,j)=±1

Xi=aXj(a<>0,a為一常數(shù));

(2)|C(I,j)|<=1,對(duì)一切i、j成立;

(3)C(I,j)=C(j,i),對(duì)一切i、j成立;

(4)|C(I,j)|越接近于1,表示變量Xi與Xj之間的相似程度越高.|C(I,j)|越接近于0,則表示它們之間的關(guān)系越疏遠(yuǎn)。第七章相關(guān)分析

距離分析是對(duì)觀測(cè)量之間或變量之間相似或不相似的程度的一種測(cè)量。距離相關(guān)分析可用于同一變量?jī)?nèi)部各個(gè)取值間,以考察其相互接近的程度;也可用于變量間,以考察預(yù)測(cè)值對(duì)實(shí)際值的按擬合程度。它有助于分析復(fù)雜的數(shù)據(jù)集合。距離相關(guān)分析根據(jù)統(tǒng)計(jì)量不同,分為兩種:(1)不相似性測(cè)量。通過(guò)計(jì)算樣本之間或變量之間的距離來(lái)表示;(2)相似性測(cè)量

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論