第八章相關(guān)性課件_第1頁
第八章相關(guān)性課件_第2頁
第八章相關(guān)性課件_第3頁
第八章相關(guān)性課件_第4頁
第八章相關(guān)性課件_第5頁
已閱讀5頁,還剩23頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第八章相關(guān)性第八章相關(guān)性18.1引言前面我們研究了描述單一隨機變量的統(tǒng)計方法。這些描述統(tǒng)計量使我們能夠研究一種特定的分布,解釋在這種分布下的某一得分。這些描述統(tǒng)計量代表了所有統(tǒng)計方法的基礎(chǔ)。但同時它們又存在著局限性,因為我們不能運用它們研究兩個或多個隨機變量之間的關(guān)系。所以我們要運用關(guān)聯(lián)性研究來觀察兩個隨機變量是否依照系統(tǒng)的方式單獨變化或者共同變化。如果我們發(fā)現(xiàn)兩個隨機變量之間存在著相關(guān)性,就能利用這一信息來描述甚至很可能做到預(yù)測未來的行為和事件。8.1引言前面我們研究了描述單一隨機變量的統(tǒng)計方法。28.2相關(guān)性的概念相關(guān)性是一個非常強而有效地檢驗兩個或更多變量之間關(guān)系的統(tǒng)計量。它可以回答許多關(guān)于兩變量之間關(guān)系的自然屬性的有趣問題。8.2相關(guān)性的概念相關(guān)性是一個非常強而有效地檢驗兩個3首先相關(guān)系數(shù)告訴我們相關(guān)性的方向。相關(guān)系數(shù)可以是正值也可以是負(fù)值。正值說明隨機變量之間是正相關(guān)關(guān)系;負(fù)值說明是負(fù)相關(guān)關(guān)系。一個正相關(guān)(positivecorrelation)的數(shù)據(jù)集合就是一個隨機變量的較大值對應(yīng)另一個隨機變量的較大值,一個隨機變量的較小值對應(yīng)另一個隨機變量的較小值。一個數(shù)據(jù)集合可能是負(fù)相關(guān)(negativecorrelation)的,那意味著X隨機變量數(shù)值增加,Y隨機變量有減少的趨勢。首先相關(guān)系數(shù)告訴我們相關(guān)性的方向。相關(guān)系數(shù)可以是正值也可以是4r=1.00表示一個嚴(yán)格的正相關(guān)關(guān)系;X隨機變量增加與Y隨機變量的增加嚴(yán)格匹配。相對比,r=-1.00表示一個嚴(yán)格的負(fù)相關(guān);較小的X值與較大的Y值相聯(lián)系,X增加Y減小。注意到相關(guān)性與1.00或-1.00越接近,越多數(shù)據(jù)點落在一條直線上。當(dāng)計算相關(guān)系數(shù)時,我們希望一條直線能夠最好地表達(dá)這些數(shù)據(jù),這條直線表示的是線性關(guān)系(linerrelationship)。r=1.00表示一個嚴(yán)格的正相關(guān)關(guān)系;X隨機變量增加與Y隨機5相關(guān)性分析也使我們能夠檢驗兩個隨機變量相互聯(lián)系的程度。相關(guān)系數(shù)可以從0到1.00。0說明兩個隨機變量之間沒有任何關(guān)系;1.00說明存在可能的最強的關(guān)系。取值與1.00越接近,相關(guān)關(guān)系也就越強。取值為0.85,0.90或者0.96說明相關(guān)關(guān)系越來越強。取值與0越接近,相關(guān)關(guān)系也越弱。取值為0.26,0.15與0.07就是弱相關(guān)系數(shù)的例子。相關(guān)性分析也使我們能夠檢驗兩個隨機變量相互聯(lián)系的程度。相關(guān)系6無論關(guān)系強弱,相關(guān)系數(shù)的取值都可能是正是負(fù)。當(dāng)相關(guān)性r=0.9時,我們可以總結(jié)為兩個隨機變量之間存在強的正相關(guān)關(guān)系。當(dāng)r=-0.9時,仍然可以總結(jié)為存在強的相關(guān)關(guān)系,不過是負(fù)相關(guān)關(guān)系。當(dāng)r=0時,兩個隨機變量之間不存在系統(tǒng)的關(guān)系。無論關(guān)系強弱,相關(guān)系數(shù)的取值都可能是正是負(fù)。當(dāng)相關(guān)性r=0.7雖然相關(guān)性是一個有用的統(tǒng)計量,但它本身并不能讓我們推斷出兩個隨機變量間的因果關(guān)系。在關(guān)聯(lián)性研究中,研究者并不能直接控制任一個隨機變量。因此,說相關(guān)系數(shù)是描述兩個隨機變量在多大程度上相關(guān)更加合適。要假設(shè)存在因果關(guān)系,自變量與依賴它的隨機變量必須相關(guān)且數(shù)據(jù)必須來源于真實實驗。雖然相關(guān)性是一個有用的統(tǒng)計量,但它本身并不能讓我們推斷出兩個88.3其他相關(guān)系數(shù)相關(guān)系數(shù)有很多種。選擇不同的相關(guān)系數(shù)依賴于以下幾個因素:(1)表達(dá)每一個隨機變量時度量尺度的不同類型;(2)潛在分布的屬性(連續(xù)或者離散);(3)分布取值的特點(線性或者非線性)8.3其他相關(guān)系數(shù)相關(guān)系數(shù)有很多種。選擇不同的相關(guān)系9定類數(shù)據(jù):phi系數(shù),biserialr順序數(shù)據(jù):tetrachoric,Spearmanr區(qū)間或比率數(shù)據(jù):Kendall’stau,Pearsonr,多元R定類數(shù)據(jù):phi系數(shù),biserialr10無論你使用哪一種相關(guān)性技術(shù),它們都擁有相同的基本特點:1.兩個或多個度量的集合都獲得于相同的個體(或事件),或者是基于在相同基礎(chǔ)上成對匹配的個體。2.相關(guān)性可以在r=-1.00到r=1.00之間取值。兩個極端值表示隨機變量間的嚴(yán)格關(guān)系,r=0.00表示不存在線性關(guān)系。3.一個較大的相關(guān)關(guān)系本身并不意味著隨機變量間存在因果關(guān)系。無論你使用哪一種相關(guān)性技術(shù),它們都擁有相同的基本特點:118.4計算Pearson乘積矩相關(guān)系數(shù)Pearsonr與z值一個正的較大值的Pearsonr說明每一個個體或者事件在兩個隨機變量上獲得大約相等的z值。換句話說,每一個個體的數(shù)值在X和Y的分布中大致位于相同的位置。在嚴(yán)格的正相關(guān)關(guān)系中(r=1.00),兩個隨機變量中每個個體獲得精確相同的z值。相似地,在嚴(yán)格的負(fù)相關(guān)關(guān)系中,兩個隨機變量中每個個體獲得精確相同的z值,但是符號相反。8.4計算Pearson乘積矩相關(guān)系數(shù)Pearson12Pearson相關(guān)系數(shù)r(Pearsonr):Pearson乘積矩相關(guān)系數(shù)r,表示個體或事件在兩個分布中占據(jù)相同相對位置的程度。Pearson相關(guān)系數(shù)r(Pearsonr):Pears13雖然用z值公式來定義r是一種有效的方法,但在實際應(yīng)用中卻并不可行。想象一下當(dāng)N等于25或者更大時的巨大計算量情況,這在行為研究中是經(jīng)常碰到的。你需要為每一個數(shù)計算z值,然后計算z值的交叉乘積和,再除以數(shù)據(jù)對數(shù)。當(dāng)介紹標(biāo)準(zhǔn)差與方差時,我們提到有兩個公式可以被用來計算相同的統(tǒng)計量。計算式對于計算一個統(tǒng)計量是非常好的,但它對理解這個統(tǒng)計量的含義作用不大。定義式對于理解一個統(tǒng)計量的邏輯是非常有用的,但對于實際的計算價值較小。r的z值公式就是后一種,它幫助我們理解怎樣思考相關(guān)系數(shù),但是不要用它來計算r。一種更加有用且省時的計算r的方法就是RawScore公式,現(xiàn)在我們來看看。雖然用z值公式來定義r是一種有效的方法,但在實際應(yīng)用中卻并不148.5Pearson乘積矩相關(guān)系數(shù):概念的由來弗朗西斯·高爾頓(FrancisGalton)在19世紀(jì)末創(chuàng)立了相關(guān)性的概念。雖然高爾頓首先想到“相關(guān)性”這一指標(biāo)的概念,但是數(shù)學(xué)家卡爾·皮爾遜(KarlPearson)創(chuàng)立了以自己名字命名的統(tǒng)計量的數(shù)學(xué)方法。8.5Pearson乘積矩相關(guān)系數(shù):概念的由來弗朗西斯·高158.6解釋相關(guān)系數(shù)相關(guān)系數(shù)的大小與符號首先要問的問題就是兩個隨機變量是否相互聯(lián)系,它們以何種方式相互聯(lián)系。第二個要問的問題就是相關(guān)系數(shù)的數(shù)值大小。有很多種方法可以用來判斷相關(guān)系數(shù)的數(shù)值大小。第一種方法是按照大多數(shù)行為科學(xué)研究的一般準(zhǔn)則。科恩(Cohen,1998)建議,相關(guān)系數(shù)可以被劃分為“小”、“中”、“大”。8.6解釋相關(guān)系數(shù)相關(guān)系數(shù)的大小與符號16另一種解釋相關(guān)系數(shù)的方法是將它的值平方。相關(guān)系數(shù)的平方r^2被稱為決定系數(shù)(coefficientofdetermination)。決定系數(shù)告訴我們一個隨機變量的方差有多少百分比可以被另一個隨機變量解釋。另一種解釋相關(guān)系數(shù)的方法是將它的值平方。相關(guān)系數(shù)的平方r^217一種理解決定系數(shù)的方法時可以用圖來表示不同的相關(guān)關(guān)系。圓圈代表隨機變量X和Y,當(dāng)X和Y的相關(guān)關(guān)系為0時,兩個圓圈沒有重疊。當(dāng)相關(guān)系數(shù)的值不斷增加時,重疊區(qū)域逐漸增加。兩個隨機變量的決定系數(shù)用兩個圓圈的重疊區(qū)域大小來表示。一種理解決定系數(shù)的方法時可以用圖來表示不同的相關(guān)關(guān)系。圓圈代18現(xiàn)在仍有一些基本的問題還沒有提到和解決?!笆裁唇凶鯴與Y之間有好的相關(guān)關(guān)系?”“怎樣才能知道相關(guān)系數(shù)是否顯著?”這是兩個非常不同的問題。第一個問題與相關(guān)系數(shù)的重要性有關(guān)。當(dāng)研究者們提及相關(guān)系數(shù)的重要性時,他們是想說明相關(guān)系數(shù)幫助他們更好地理解復(fù)雜的現(xiàn)象。相關(guān)系數(shù)的重要性依賴于研究的種類。一個相關(guān)系數(shù)值0.2也許對一位研究者來說非常重要,但對另一位來說不值一提,這完全依賴于數(shù)據(jù)被解釋的條件?,F(xiàn)在仍有一些基本的問題還沒有提到和解決。“什么叫做X與Y之間198.7需要注意的幾點當(dāng)解釋相關(guān)系數(shù)時,有一些地方需要注意。有一些很重要的因素會導(dǎo)致相關(guān)系數(shù)人為地很高或者很低。這些極端值的相關(guān)性有時被稱為假性相關(guān)(spuriouscorrelation),因為它們并不代表隨機變量間真實的關(guān)系,也可能是一些容易引起混淆的因素造成的結(jié)果。有時候一個相關(guān)系數(shù)可能很小或者接近零。一些研究者假設(shè)研究中一個很小的相關(guān)系數(shù)意味著兩個隨機變量之間關(guān)系微弱或者沒有關(guān)系。8.7需要注意的幾點當(dāng)解釋相關(guān)系數(shù)時,有一些地方需要20兩個隨機變量之間缺乏明顯的相關(guān)性可以有很多原因來解釋。同樣很多情況可以導(dǎo)致兩個隨機變量有極強的相關(guān)性,雖然這與它們真實的關(guān)系是無關(guān)的。一位優(yōu)秀的研究者將試圖在做出任何關(guān)于相關(guān)系數(shù)含義的結(jié)論前,為這些不一樣的解釋尋找原因。下面列舉一些會導(dǎo)致假性相關(guān)的原因。兩個隨機變量之間缺乏明顯的相關(guān)性可以有很多原因來解釋。同樣很21隨機變量之間缺乏線性關(guān)系截斷的區(qū)域樣本容量離群點多總體極值因果關(guān)系隨機變量之間缺乏線性關(guān)系228.8相關(guān)性是可靠性的一種度量

心理學(xué)研究中一個非常重要的概念就是可靠性(reliability)??煽啃灾敢环N度量方法能夠產(chǎn)生相同結(jié)果的這種一致性。一種測試如果在標(biāo)準(zhǔn)化條件下進(jìn)行得到一致的結(jié)果,就說它是可靠的??煽啃越?jīng)常用相關(guān)系數(shù)來評估。8.8相關(guān)性是可靠性的一種度量

心理學(xué)研究中一個非常23不要混淆可靠性與有效性的概念。有效性是一種度量手段多大程度上能夠達(dá)到預(yù)先的目的。如果一項測試希望度量拼寫能力,那么需要提供一種較好的評估該能力的手段。如果它是一種解決詞匯問題能力的有效度量,就不能用測度閱讀能力來代替。有效性和可靠性相似,也可以用相關(guān)系數(shù)來評估。一次測試中的數(shù)據(jù)與它的測度數(shù)據(jù)相關(guān)或者與另一測試相關(guān)。如果這種相關(guān)關(guān)系較強,測試就被認(rèn)為是有效的。不要混淆可靠性與有效性的概念。有效性是一種度量手段多大程度上248.9相關(guān)性矩陣有時候我們相信并沒有被證實的事情。例如,我們有這樣的觀念,一個體重超重的兒童必然會成為一個體重超重的成年人。家長們擔(dān)心他們的肥胖小寶貝會變成肥胖青少年。一些肥胖的青少年擔(dān)心他們的一生都將是這樣的情形。但是這樣認(rèn)為有經(jīng)驗根據(jù)嗎?事實是怎樣的?關(guān)聯(lián)性研究經(jīng)常為證實或者否定這種普遍概念提供證據(jù)。你是怎樣認(rèn)為的?兒童時的體重是否為你一生體重的一個可靠指標(biāo)?8.9相關(guān)性矩陣有時候我們相信并沒有被證實的事情。例25研究者使用一種叫做BodyMassIndex(BMI)的方法研究這個有關(guān)一生體重的問題。這個指標(biāo)考慮到體重相對于身高的關(guān)系。出于我們的目的,我們可以將它認(rèn)為是肥胖程度的一種度量。一組測試者被跟蹤調(diào)查40年,他們的體重在不同時間被采集——兒童,青少年,18歲,30歲和40歲。這些不同時間收集到的數(shù)據(jù)彼此相互關(guān)聯(lián)。研究者使用一種叫做BodyMassIndex(BMI268.10定序尺度變量與rs度量結(jié)果是一個順序數(shù)據(jù)。雖然能從排序數(shù)據(jù)中得到Pearsonr,我們還有另外一種乘積矩系數(shù)叫做Spearmanr,rs,或者叫做等級相關(guān)系數(shù)(rankcorrelationcoefficient)。等級數(shù)據(jù)的相關(guān)系數(shù)降低了獲取相關(guān)系數(shù)的計算工作。Spearmanr對于數(shù)據(jù)中一方是順序數(shù)據(jù)而另一方是順序數(shù)據(jù)或者區(qū)間/比例數(shù)據(jù)的情況非常合適。在數(shù)據(jù)偏度較大時,Spearmanr也是相關(guān)性的一種較好

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論