版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
第五章相關(guān)關(guān)系本章目錄第一節(jié)相關(guān)、相關(guān)系數(shù)與散點圖第二節(jié)積差相關(guān)第三節(jié)等級相關(guān)第四節(jié)質(zhì)量相關(guān)第五節(jié)品質(zhì)相關(guān)第六節(jié)相關(guān)系數(shù)的選用與解釋相關(guān)系數(shù)用于描述雙變量數(shù)據(jù)相互之間的關(guān)系。雙變量:對于一個變量X的每一個觀測值X1,X2,…,XN,同時有另一個變量Y的相應(yīng)觀測值Y1,Y2,…,YN與之對應(yīng)。雙變量總體(bivariatepopulation):由成對變量所組成的集合。第一節(jié)相關(guān)、相關(guān)系數(shù)與散點圖一、什么是相關(guān)(一)事物之間的相互關(guān)系因果關(guān)系共變關(guān)系相關(guān)關(guān)系(二)相關(guān)的類別正相關(guān):兩列變量變動方向相同。負(fù)相關(guān):兩列變量變動方向相反。零相關(guān):兩列變量變動方向無一定規(guī)律。二、相關(guān)系數(shù)相關(guān)系數(shù)(coefficientofcorrelation):兩列變量間相關(guān)程度的數(shù)字表現(xiàn)形式,是用來表示相關(guān)關(guān)系強度的指標(biāo)。樣本統(tǒng)計量:r總體參數(shù):ρ相關(guān)系數(shù)的取值:-1≤r≤+1;0≤∣r∣≤11.相關(guān)系數(shù)r的取值范圍介于﹣1.00至+1.00之間,它是一個比率,常用小數(shù)形式表示。2.相關(guān)系數(shù)的“+、﹣”號表示雙變量數(shù)列之間相關(guān)的方向。3.相關(guān)系數(shù)r=+1.00時表示完全正相關(guān),r=﹣1.00時表示完全負(fù)相關(guān);r=0時表示完全獨立。4.相關(guān)系數(shù)取值的大小表示相關(guān)的強弱程度。相關(guān)系數(shù)的性質(zhì)相關(guān)系數(shù)不是由相等單位度量而來的,因此只能比較大小,不能做任何加、減、乘、除運算。在對相關(guān)程度做判定時應(yīng)注意:①要把樣本量大小與相關(guān)系數(shù)取值大小綜合起來考慮;②一般要經(jīng)過統(tǒng)計檢驗方能確定變量之間是否存在顯著的相關(guān);③若是非線性相關(guān)關(guān)系,而用直線相關(guān)計算r值可能很小,但不能說明兩變量關(guān)系不密切。表5-1五名學(xué)生四種測驗的分?jǐn)?shù)學(xué)生測驗分?jǐn)?shù)ABCD11553641022145265100313516610441250671035114968101圖5-1利用數(shù)據(jù)等級一致性說明相關(guān)關(guān)系的圖解三、散點圖散點圖:相關(guān)圖,在平面直角坐標(biāo)系中,以X、Y二列變量中的一列變量(X變量)為橫坐標(biāo),以另一列變量(Y變量)為縱坐標(biāo),把N對數(shù)據(jù)Xi、Yi當(dāng)作同一個平面上的N個點(Xi,Yi),一一描繪在XOY坐標(biāo)系中,所產(chǎn)生的圖形。散點圖通過點的散布形狀和疏密程度來顯示兩個變量的相關(guān)趨勢和相關(guān)程度,能夠?qū)υ紨?shù)據(jù)間的關(guān)系做出直觀而有效的預(yù)測和解釋。第二節(jié)積差相關(guān)一、積差相關(guān)的概念與適用資料積差相關(guān)是英國統(tǒng)計學(xué)家皮爾遜(Pearson)于20世紀(jì)初提出的一種計算相關(guān)的方法,因而被稱為皮爾遜積差相關(guān)(皮爾遜相關(guān)),也稱為積矩相關(guān)(productmomentcorrelation)。積矩X的離均差和Y的離均差二者乘積的總和除以N。積差相關(guān)的適用范圍成對數(shù)據(jù);兩列變量總體都為正態(tài)分布,至少應(yīng)是接近正態(tài)的單峰分布;兩個變量都是連續(xù)數(shù)據(jù),也即兩列數(shù)據(jù)都是測量數(shù)據(jù);兩列變量之間的關(guān)系應(yīng)為線性關(guān)系。積差相關(guān)條件的判斷方法連續(xù)變量:根據(jù)得到數(shù)據(jù)的方式判斷,測量數(shù)據(jù)正態(tài)分布:一般情況下,正常人群的身高、體重、智力水平、心理與教育測驗的結(jié)果,都可按總體正態(tài)分布對待;如果要求比較高,則需要對數(shù)據(jù)進行正態(tài)性檢驗。線性關(guān)系根據(jù)相關(guān)散布圖可判斷兩個變量之間是否線性關(guān)系。二、計算積差相關(guān)系數(shù)的基本公式(一)運用標(biāo)準(zhǔn)差與離均差的計算公式
(二)運用標(biāo)準(zhǔn)分?jǐn)?shù)計算相關(guān)系數(shù)的公式協(xié)方差(covariance):兩個變量離均差乘積的平均數(shù)。(三)原始觀測值計算公式【例5-1】表5-2是10名中學(xué)生身高與體重的測量結(jié)果,問身高與體重的關(guān)系如何?被試編號身高(cm)
X體重(kg)
YX2
Y2XY
1170
502890025008500
2173
452992920257785
3160
4725600220975204155442402519366820
5173502992925008650
6188533534428099964
7178503168425008900
8183493348924018967
9180523240027049360
10165452722520257425∑17254852985252360983891解:用離均差、標(biāo)準(zhǔn)差和標(biāo)準(zhǔn)分?jǐn)?shù)計算相關(guān)系數(shù)的步驟被試身高(X)cm體重(Y)kgxcmykgx2y2xyZXZYZXZY117050-2.51.56.252.25-3.75-0.2550.510-0.1302173450.5-3.50.2512.25-1.750.051-1.190-0.061316047-12.5-1.5156.252.2518.75-1.274-0.5100.650415544-17.5-4.5306.2520.2578.78-1.784-1.5302.7295173500051.50.252.250.750.0510.5100.02661885315.54.5240.2520.2569.751.5801.5302.4177178505.51.530.252.258.250.5610.5100.28681834910.50.5110.250.255.251.0700.1700.1829180527.53.556.2512.2526.250.7651.1900.9101016545-7.5-3.556.2512.2526.25-0.765-1.1900.9101725485962.586.5228.57.919用離均差用標(biāo)準(zhǔn)分?jǐn)?shù)表5-4不同測量單位的數(shù)據(jù)計算相關(guān)系數(shù)比較被試身高cm(X)尺體重kg(Y)斤x尺y斤x2y2xyZXZYZXZY11705.1050100-0.07530.00569-0.225-0.25510.510-0.130217.5.1945900.015-70.000249-0.1050.0510-1.190-0.06131604.804794-0.375-30.140691.125-1.2755-0.5100.65141554.654488-0.525-90.2756814.725-1.7857-1.5302.73251735.19501000.01530.000290.0450.05100.5100.02661885.64534060.46590.2162814.1851.58161.5302.42071785.34501000.16530.027290.4950.56120.1500.28681835.4949980.31510.099210.3151.07140.1700.18291805.40521040.22570.0506491.5750.76531.1900.911101654.954590-0.225-70.0506491.575-0.7653-1.1900.911
51.759700.86634613.717.928相關(guān)系數(shù)三、計算積差相關(guān)系數(shù)的差法公式(一)減差法(二)加差法減差法加差法四、相關(guān)系數(shù)的合并求平均的相關(guān)系數(shù),一般采用Z-r轉(zhuǎn)換法。具體步驟(1)查費舍Z-r轉(zhuǎn)換表,先將各樣本的r轉(zhuǎn)換成費舍Z分?jǐn)?shù)(2)求每一樣本的Z分?jǐn)?shù)之和(3)求平均Z分?jǐn)?shù),即(4)再查費舍Z-r轉(zhuǎn)換表,將轉(zhuǎn)換成相應(yīng)的r值?!纠?-2】表5-6是來自同一總體的三個樣本的相關(guān)系數(shù),求平均相關(guān)系數(shù)。表5-6相關(guān)系數(shù)的合并
樣本nirini
-3Zi(ni
-3)Zi1500.419470.44821.05622640.3902610.412107.5323370.425340.45415.436342144.024第三節(jié)等級相關(guān)適用范圍等級順序的測量數(shù)據(jù);搜集到的數(shù)據(jù)是等距或等比的數(shù)據(jù),但其總體分布不是正態(tài)。由于等級相關(guān)對變量的總體分布不作要求,故等級相關(guān)也稱非參數(shù)的相關(guān)方法。一、斯皮爾曼等級相關(guān)(一)適用資料斯皮爾曼等級相關(guān),常用符號rR或rS表示,有時也稱之為斯皮爾曼ρ系數(shù)。適用范圍適用于只有兩列變量,而且是屬于等級變量性質(zhì)的具有線性關(guān)系的資料,主要用于解決稱名數(shù)據(jù)和順序數(shù)據(jù)的相關(guān)問題。缺點:一組能計算積差相關(guān)的資料若改用等級相關(guān)計算,精確度要差于積差相關(guān)。因此,凡符合計算積差相關(guān)的資料,不要用等級相關(guān)計算。(二)計算公式1.等級差數(shù)法(N<30)2.等級序數(shù)法【例5-3】現(xiàn)有10人的視、聽兩種感覺通道的反應(yīng)時(單位:毫秒),數(shù)據(jù)見下表。問視、聽反應(yīng)時是否具有一致性?表5-7等級相關(guān)系數(shù)計算說明被試聽反應(yīng)時
X視反應(yīng)時YRXRYD=RX-RYD2RXRY117217975243521401622200431521535141654187189880064513918116-52566195220910-119072122101091190816418267-114291491784400161014617033009555548361解:3.有相同等級時計算等級相關(guān)的方法表5-8不同數(shù)目的相同等級對平方和的影響R1R2R3R4R51111242.56.251.52.25242.56.25242.56.251.52.25392.56.25242.56.25394164164162.56.254163029.5282529.5∑R2隨相同等級數(shù)目減少的數(shù)量出現(xiàn)相同等級時,計算等級相關(guān)系數(shù)的公式【例5-4】表5-9是10名學(xué)生的數(shù)學(xué)和語文考試成績,問數(shù)學(xué)與語文成績是否相關(guān)?學(xué)生語文X數(shù)學(xué)YRXRYD=RX-RYD2159474.56-1.52.2523540101000359424.58-3.512.254575563.52.56.255504975246716311007625533.5-0.50.258474288009434298111068572200N=10∑D2=26解:【例5-5】有12名學(xué)生的兩門功課成績評定分?jǐn)?shù),見表5-10。問該兩門功課成績是否具有一致性?學(xué)生成績評定RARBD=RA-RBD2課程A課程B1良良77.5-0.50.252優(yōu)優(yōu)2.53-0.50.253優(yōu)良2.57.5-5254良優(yōu)734165優(yōu)優(yōu)2.53-0.50.256良良77.5-0.50.257中中1111008良優(yōu)734169良中711-41610中良117.53.512.2511優(yōu)優(yōu)2.53-0.50.2512中中111100N=12
∑D2=86.5解:二、肯德爾等級相關(guān)肯德爾等級相關(guān)方法有許多種:有適合兩列等級變量資料的交錯系數(shù)(肯德爾τ相關(guān))和相容系數(shù)(ξ);也有適合多列等級變量資料的肯德爾W系數(shù)和肯德爾U系數(shù)。(一)肯德爾W系數(shù)肯德爾W系數(shù),也稱肯德爾和諧系數(shù),表示多列等級變量相關(guān)程度的一種方法,適用于兩列以上的等級變量。適用資料(1)K個評價者對N件事物或N種作品進行等級評定;(2)一個評價者先后K次評價N件事物或N件作品??系聽枌界定為每一評價對象實際得到的等級總和的變異與被評價對象最大可能變化的等級總和的變異的比值。2.基本公式及計算W值介于0與1之間,計算值都為正值。若表示相關(guān)方向,可從實際資料中進行分析。如果K個評價者意見完全一致,則W=1;若K個評價者的意見存在一定的關(guān)系,但又不完全一致,則0﹤W﹤1;如果K個評價者的意見完全不一致,則W=0?!纠?-6】有10人對紅、橙、黃、綠、青、藍、紫七種顏色按照其喜好程度進行等級評價。其中,最喜歡的等級為1,最不喜歡的等級為7.結(jié)果見表5-11。問這10個人對顏色的愛好是否具有一致性?N=7評價者K=10Ri12345678910紅3523443243331089橙6676757766633969黃5457664454502500綠111222211215225青4344335635401600藍223111132117289紫7765576577623844∑28013516表5-11肯德爾和諧系數(shù)計算說明解:3.有相同等級出現(xiàn)時W的計算【例5-7】五位評分者對七篇作文進行評價,評價等級為1-5,評估結(jié)果見表5-12,試問評分者之間對標(biāo)準(zhǔn)的掌握是否一致?N=7評價者K=5Ri被評作文12345A453.55421.5462.25B111.5216.542.25C2.521.52210.0100D6554525.0625E2.533.52314.0196F5576629.0841G7767734.01156合計1403422.5表5-12有相同等級時肯德爾和諧系數(shù)的計算解:(二)肯德爾U系數(shù)肯德爾U系數(shù)又稱一致性系數(shù),適用于對K個評價者的一致性進行統(tǒng)計分析。1.適用資料若評價者采用對偶比較的方法,即將N件事物兩兩配對,可配成對,然后對每一對中兩事物
進行比較,擇優(yōu)選擇,優(yōu)者記1,非優(yōu)者記0。2.公式及計算rij:對偶比較記錄表中i﹥j(或i﹤j)格中的擇優(yōu)分?jǐn)?shù)。計算步驟:將被評價的事物用符號代表,分別橫行與縱列,這樣可畫成N×N個格子。將每一對事物擇優(yōu)比較的結(jié)果按優(yōu)者記1,非優(yōu)者記0,難以判定記0.5的方法記分,將分?jǐn)?shù)填到相應(yīng)的格子中,這便是rij。兩相同事物不用比較,因此在整個方格中,位于對角線位置的小格空著。在對角線以下每格的次數(shù)記為i﹥j,對角線以上每格的次數(shù)記為i﹤j?!纠?-8】表5-13是根據(jù)表5-11中10個評價者對7種顏色對偶選擇分?jǐn)?shù)整理而成。整理的方法為:如果第一個評價者對7種顏色評定的等級分別為綠色1、藍色2、青色3……。也就是說若用對偶比較,則當(dāng)綠色與其他顏色比較時,都選擇綠,因此在綠色這一行都記為1分;藍色排第二,其意是當(dāng)藍色與其他6種顏色比較時,除綠色之外都選擇藍色……。以此類推。試計算肯德爾U系數(shù)。解:一致性系數(shù)U的取值:若完全一致則U=1,若對角線上下格子中出現(xiàn)的擇優(yōu)分?jǐn)?shù)相同,則一致性最小,但其值不為0。有下面兩種情形:如果K為奇數(shù)時,每格的擇優(yōu)分?jǐn)?shù)為與,均勻分布在對角線上下,這時;若K為偶數(shù)時,則對角線上下每格中的擇優(yōu)分?jǐn)?shù)為,其中。第四節(jié)質(zhì)量相關(guān)適用范圍需要計算相關(guān)的兩列變量一列為等比或等距的測量數(shù)據(jù),另一列是按性質(zhì)劃分的類別,欲求這樣兩列變量的直線相關(guān),稱為質(zhì)量相關(guān)。包括點二列相關(guān)、二列相關(guān)及多列相關(guān)。一、點二列相關(guān)(一)適用資料二分變量(dichotomousvariable):按事物的某一性質(zhì)劃分的只有兩類結(jié)果的變量。二分變量分為真正的二分變量(離散型二分變量)和人為的二分變量。點二列相關(guān)法就是考察兩列觀測值一個為連續(xù)變量(點數(shù)據(jù)),另一個為二分稱名變量(二分型數(shù)據(jù))之間相關(guān)程度的統(tǒng)計方法。點二列相關(guān)多用于評價由是非類測驗題目組成的測驗的內(nèi)部一致性等問題。(二)公式及計算:與二分稱名變量的一個值對應(yīng)的連續(xù)變量的平均數(shù);:與二分稱名變量的另一個值對應(yīng)的連續(xù)變量的平均數(shù);p、q:二分稱名變量兩個值各自所占的比率,p+q=1;st:連續(xù)變量的標(biāo)準(zhǔn)差?!纠?-9】有一是非式選擇測驗,每題選對得2分,共有50題,滿分100分。表5-14是20名學(xué)生在該測驗中的總成績及第5題的選答情況。問這道題與測驗總分的相關(guān)程度如何?表5-14點二列相關(guān)計算數(shù)據(jù)學(xué)生總分第五題學(xué)生總分第五題184對1178對282錯1280錯376錯1392對460錯1494對572錯1596對674錯1688對776錯1790對884對1878錯988對1976錯1090對2074錯解:【例5-10】一個測驗滿分為20分,想了解該測驗結(jié)果與文化程度是否有關(guān),文化程度分為文盲(0)、非文盲(1)。下表是部分被試實驗結(jié)果,試求其相關(guān)系數(shù)。被試測驗總分文化程度被試測驗總分文化程度1201718121918161317191514801014159011806501290解:二、二列相關(guān)(一)適用資料二列相關(guān)(biserialcorrelation)適用的資料是兩列數(shù)據(jù)均屬于正態(tài)分布,其中一列變量為等距或等比的測量數(shù)據(jù),另一列變量為人為劃分的二分變量。(二)公式及計算st、:連續(xù)變量的標(biāo)準(zhǔn)差與平均數(shù);:與二分變量中某一分類對偶的連續(xù)變量的平均數(shù);:與二分變量中另一類對偶的連續(xù)變量的平均數(shù);P:某一分類在所有二分變量中所占的比率;y:標(biāo)準(zhǔn)正態(tài)曲線中p值對應(yīng)的高度,查正態(tài)分布表能得到?!纠?-11】表5-15是108名學(xué)生某個測驗總分分組數(shù)據(jù)和在某道問答題上得分依一定標(biāo)準(zhǔn)將其分為對、錯兩類后的數(shù)據(jù),請問這道問答題的區(qū)分度如何?得分ft某一題目dftdftd2fpdfqd分組fpfq90~224832880~55315451570~161332326426660~191631191916350~231490000040~18810-1-1818-8-1030~15411-2-3060-8-2220~817-3-2472-3-2110~22-4-832-8合計1086345-634246-52表5-15二列相關(guān)的計算解:p=63/108=0.583,q=1-0.583=0.417查正態(tài)分布表,當(dāng)p=0.583時,y=0.39024三、多列相關(guān)(一)適用資料多列相關(guān)(multiserialcorrelation)適合處理兩列正態(tài)變量資料,其中一列為等距或等比的測量數(shù)據(jù),另一列被人為劃分為多種類別,稱為名義變量。(二)公式及計算Pi:每系列的次數(shù)比率;yL:每一名義變量下限的正態(tài)曲線高度,由pi查正態(tài)表給出;yH:每一名義變量上限的正態(tài)曲線高度,由pi查正態(tài)表給出;:與每一名義變量對偶的連續(xù)變量的平均數(shù);st:連續(xù)變量的標(biāo)準(zhǔn)差?!纠?-12】表5-16中的數(shù)據(jù)是140名學(xué)生學(xué)習(xí)能力測驗分?jǐn)?shù)與教師對該部分學(xué)生的評價等級(A、B、C、D)資料。計算能力測驗與教師評價之間的一致性。表5-16四系列相關(guān)的計算解:代入公式第五節(jié)品質(zhì)相關(guān)品質(zhì)相關(guān)用于表示R×C(行×列)表的兩個變量之間的關(guān)聯(lián)程度。適用范圍計數(shù)數(shù)據(jù),而非測量數(shù)據(jù)。品質(zhì)相關(guān)因二因素的性質(zhì)及分類項目的不同,可分為四分相關(guān)、Φ相關(guān)、列聯(lián)表相關(guān)等。一、四分相關(guān)四分相關(guān)(tetrachoriccorrelation)適用于計算兩個變量都是連續(xù)變量,且每一個變量的變化都被人為地分為兩種類型的測量數(shù)據(jù)之間的相關(guān)。(一)適用資料四格表的二因素都是連續(xù)的正態(tài)變量,只是人為將其按一定標(biāo)準(zhǔn)劃分為兩個不同的類別。四格表(二)計算公式計算四格相關(guān)最常用的方法是皮爾遜余弦π法(近似計算法)?!纠?-13】下表所列數(shù)據(jù)是調(diào)查377名學(xué)生兩科測驗成績所得到的結(jié)果,假設(shè)兩科成績的分布為正態(tài),只是人為地將其按一定標(biāo)準(zhǔn)劃分為及格、不及格兩類。四格表解:已知a=124,b=68,c=85,d=100,a+b+c+d=377
二、Φ系數(shù)(一)適用范圍兩個相互關(guān)聯(lián)著的變量分布都是真正的二分變量。Φ系數(shù)可以運用列聯(lián)表計算,因此又稱為列聯(lián)系數(shù)(contingencycoefficient)。(二)計算公式【例5-14】下面是關(guān)于吸煙與患癌癥之間的一組假設(shè)數(shù)據(jù),吸煙狀況(X)分為吸煙者與非吸煙者,用0、1表示,死亡原因(Y)分為因吸煙致癌死亡與其他原因死亡兩種,用0、1表示。試求它們之間的相關(guān)。X:0000
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 歷史遺址展覽館場地租賃合同3篇
- 二手房屋買賣合同精要一覽解讀2篇
- 入園協(xié)議家長與學(xué)校的責(zé)任分配3篇
- 典當(dāng)行業(yè)勞動合同樣本3篇
- 機械課程設(shè)計指導(dǎo)書課本
- 城市煤氣供應(yīng)與需求合同書3篇
- 油麥菜生成課程設(shè)計
- 受托支付合同范本3篇
- 勞動合同存檔期限是多久3篇
- 買房合同格式模板2篇
- 【恰恰食品企業(yè)營運能力存在的問題及優(yōu)化建議分析10000字(論文)】
- 【語文】青島市小學(xué)一年級上冊期末試卷(含答案)
- 【學(xué)生課件】《青少年網(wǎng)絡(luò)安全》班會幻燈片
- 滄源永弄華能100MW茶光互補光伏發(fā)電項目環(huán)評報告
- 紅色澳門回歸紀(jì)念日PPT模板課件
- 2024屆天津市河?xùn)|區(qū)名校七年級數(shù)學(xué)第一學(xué)期期末統(tǒng)考試題含解析
- 股骨Hoffa骨折的手術(shù)入路及手術(shù)技巧課件
- 倉儲業(yè)行業(yè)SWOT分析
- 縣委書記在縣委審計委員會全體會議上的講話
- 2023年版:中國重癥肌無力診斷和治療指南(全文版)
- 平凡之路歌詞全文
評論
0/150
提交評論