版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第七章相關(guān)分析雙變量關(guān)系的描述技術(shù)第七章相關(guān)分析7.1相關(guān)分析的概念和相關(guān)分析過程7.2兩個(gè)變量間的相關(guān)分析7.3偏相關(guān)分析7.4距離分析7.1相關(guān)分析的基本概念與分析過程相關(guān)關(guān)系與相關(guān)分析
事物間的相互關(guān)系可以分為兩種類型:函數(shù)關(guān)系和統(tǒng)計(jì)關(guān)系(相關(guān)關(guān)系)。函數(shù)關(guān)系是一一對(duì)應(yīng)的確定性關(guān)系;統(tǒng)計(jì)關(guān)系則是不穩(wěn)定、不確定的,意味著一個(gè)變量雖然受另外一個(gè)(或一組)變量影響,卻并不由這一個(gè)(或一組)變量完全確定。例如家庭教育消費(fèi)支出與家庭收入之間的關(guān)系就是一種相關(guān)關(guān)系。在復(fù)雜的教育系統(tǒng)中,事物與現(xiàn)象之間的聯(lián)系大多表現(xiàn)為相關(guān)關(guān)系而不是函數(shù)關(guān)系。衡量事物(或變量)之間相關(guān)程度的強(qiáng)弱,并用適當(dāng)?shù)慕y(tǒng)計(jì)指標(biāo)表示出來,這個(gè)過程就是相關(guān)分析。7.1相關(guān)分析的基本概念與分析過程線性相關(guān)分析與相關(guān)系數(shù)
研究?jī)蓚€(gè)變量間線性關(guān)系的程度,稱為線性相關(guān)分析。相關(guān)系數(shù)是描述這種線性關(guān)系程度和方向的統(tǒng)計(jì)量,用r表示。如果變量Y與X間是函數(shù)關(guān)系,則r=1或r=-1;如果變量Y與X間是統(tǒng)計(jì)關(guān)系,則-1<r<1,如果x,y變化的方向一致,則稱為正相關(guān),r>0,如果x,y變化的方向相反,則稱為負(fù)相關(guān),r<0;而r=0表示無線性相關(guān),一般地,|r|>0.95存在顯著性相關(guān);|r|0.8高度相關(guān);0.5|r|<0.8中度相關(guān);0.3|r|<0.5
低度相關(guān);|r|<0.3關(guān)系極弱,認(rèn)為不相關(guān)相關(guān)系數(shù)的值,僅僅是一個(gè)比值。它不是由相等單位度量而來(即不等距),也不是百分比,因此,不能直接作加、減、乘、除運(yùn)算。相關(guān)系數(shù)只能描述兩個(gè)變量之間的變化方向及密切程度,并不能揭示兩者之間的內(nèi)在本質(zhì)聯(lián)系。存在相關(guān)的兩個(gè)變量,也不一定存在因果關(guān)系。散點(diǎn)圖X(丈夫收入);Y(妻子收入)YXP(xi,yi)Y=kkP(xi,yi)+--+共變異數(shù)(協(xié)方差)=+--+散點(diǎn)越集中于1、3象限,共變異數(shù)的和正值越大;散點(diǎn)越集中于2、4象限,共變異數(shù)的和負(fù)值越大;散點(diǎn)越均勻分布于各象限,共變異數(shù)的和越趨近于0。相關(guān)分析的原理若>0,則x與y之間為正相關(guān);若<0,則x與y之間為負(fù)相關(guān);若→0,則x與y之間無相關(guān)關(guān)系。
相關(guān)分析中的可能錯(cuò)誤
相關(guān)系數(shù)r是對(duì)兩個(gè)變量之間線性關(guān)系的簡(jiǎn)單度量,因此當(dāng)r=0時(shí),只表示兩個(gè)變量之間不存在線性相關(guān)關(guān)系,并不說明變量之間沒有任何關(guān)系,比如,它們之間可能存在非線性關(guān)系,如圖(e)就屬于這種情況。
相關(guān)分析中的可能錯(cuò)誤
r的計(jì)算涉及到變量的標(biāo)準(zhǔn)差和協(xié)方差,其數(shù)值大小易受極端值的影響,特別是與自變量x的變化范圍有很大關(guān)系。這時(shí)會(huì)產(chǎn)生兩種情況:—是多數(shù)觀察值不相關(guān)時(shí),個(gè)別極瑞值引起中度相關(guān),如圖8.4(a);二是大多數(shù)觀察值存在線性相關(guān),個(gè)別極端值使觀察數(shù)據(jù)呈非線性相關(guān).如圖8.4(b)。
相關(guān)分析中的可能錯(cuò)誤
在對(duì)兩個(gè)時(shí)間數(shù)列的相關(guān)分析中,r所表現(xiàn)的相關(guān)程度同樣本數(shù)據(jù)的時(shí)間范圍有很大關(guān)系。比如.兩個(gè)現(xiàn)象在某段時(shí)期內(nèi)的相關(guān)關(guān)系為線性的.而整個(gè)發(fā)展過程可能是非線性的,如圖(a);或者在某段時(shí)期內(nèi)無線性關(guān)系,而整個(gè)發(fā)展過程可能存在線性關(guān)系,如圖(b)相關(guān)分析中的可能錯(cuò)誤根據(jù)樣本數(shù)據(jù)計(jì)算的r帶有—定的隨機(jī)性,樣本數(shù)據(jù)越少,隨機(jī)性則越大。對(duì)于不相關(guān)的兩個(gè)變量計(jì)算出的r不—定為0,有時(shí)甚至?xí)芨?。但較大的r值不一定就意味著兩個(gè)變量之間確實(shí)存在著較高的相關(guān);反之,較小的r也不一定就意味著變量之間無相關(guān)關(guān)系,這就是所謂的虛假相關(guān)。為避免出現(xiàn)分析上的錯(cuò)誤,在實(shí)際應(yīng)用r時(shí),必須對(duì)r的顯著性進(jìn)行檢驗(yàn),r在統(tǒng)計(jì)上是否顯著,才是它能否作為變量之間線性關(guān)系度量的依據(jù)。
7.2兩個(gè)變量間的相關(guān)分析1定距—定距尺度的相關(guān):積差相關(guān)
當(dāng)兩個(gè)變量都是正態(tài)連續(xù)變量,而且兩者之間呈線性關(guān)系時(shí),表示這兩個(gè)變量之間的相關(guān)稱為積差相關(guān)(PearsonCor.)。積差相關(guān)的使用條件兩個(gè)變量都是由測(cè)量獲得的連續(xù)性數(shù)據(jù);兩個(gè)變量的總體都是呈正態(tài)分布,或接近正態(tài)分布,至少是單峰的對(duì)稱分布。必須是成對(duì)數(shù)據(jù),而且每對(duì)數(shù)據(jù)之間必須是相互獨(dú)立。兩個(gè)變量之間呈線性關(guān)系。要排除共變因素的影響。樣本容量要大于等于30,計(jì)算出的積差相關(guān)系數(shù)才具有有效意義。2定序—定序尺度的相關(guān):等級(jí)相關(guān)
是指以等級(jí)次序排列或以等級(jí)次序表示的變量之間的相關(guān)。當(dāng)測(cè)量得到的數(shù)據(jù)不是等距或等比數(shù)據(jù),而是具有等級(jí)順序的數(shù)據(jù);或者得到的數(shù)據(jù)是等距或等比數(shù)據(jù),但其所來自的總體分布不是正態(tài)的,不滿足求積差相關(guān)的要求。這時(shí)就要運(yùn)用等級(jí)相關(guān)系數(shù)。它主要包括斯皮爾曼(spearman)二列等級(jí)相關(guān)及肯德爾(Kendall’s)等級(jí)相關(guān).
7.2兩個(gè)變量間的相關(guān)分析斯皮爾曼二列等級(jí)相關(guān)當(dāng)兩個(gè)變量值以等級(jí)次序排列或以等級(jí)次序表示時(shí),兩個(gè)相應(yīng)總體并不一定呈正態(tài)分布,樣本容量也不一定大于30,表示這兩變量之間的相關(guān),稱為等級(jí)相關(guān)。其相關(guān)系數(shù)的計(jì)算公式為
例如:10名高三學(xué)生學(xué)習(xí)潛在能力測(cè)驗(yàn)與自學(xué)能力測(cè)驗(yàn)成績(jī)?nèi)缦卤硭?,問兩者相關(guān)情況如何?學(xué)生序號(hào)學(xué)習(xí)潛在能力自學(xué)能力等級(jí)差數(shù)差數(shù)平方X等級(jí)Y等級(jí)123456789109084767171716968666412355578910325786871092135.57.547.55.5109-110-0.5-2.51-0.52.5-111100.256.2510.256.2511總和18肯德爾和諧系數(shù)(Kendall’stau-b)當(dāng)多個(gè)(兩個(gè)以上)變量值以等級(jí)次序排列或以等級(jí)次序表示,描述這幾個(gè)變量之間的一致性程度的量,稱為肯德爾和諧系數(shù)。它常用來表示幾個(gè)評(píng)定者對(duì)同一組學(xué)生成績(jī)用等級(jí)先后評(píng)定多次之間的一致性程度。無相同等級(jí)的情況當(dāng)同一位評(píng)定者對(duì)所有被評(píng)事物的評(píng)定無相同等級(jí)時(shí),其肯德爾和諧系數(shù)的計(jì)算公式為:例如,4位教師對(duì)6個(gè)學(xué)生作文競(jìng)賽的名次排列次序如表第(2)列所示,問評(píng)定的一致性程度如何?
有相同等級(jí)的情況當(dāng)同一位評(píng)定者對(duì)所有被評(píng)事物的評(píng)定有相同等級(jí)時(shí),其肯德爾和諧系數(shù)的計(jì)算公式為:同一位教師對(duì)5份研究生入學(xué)考試政治試卷根據(jù)標(biāo)準(zhǔn)先后3次等級(jí)評(píng)定結(jié)果如下表所示,問3次評(píng)定結(jié)果的相關(guān)程度如何?3定性—定距尺度的相關(guān):質(zhì)量相關(guān)質(zhì)量相關(guān)是指一個(gè)變量為質(zhì),另一個(gè)變量為量,這兩個(gè)變量之間的相關(guān)。如智商、學(xué)科分?jǐn)?shù)、身高、體重等是表現(xiàn)為量的變量,男與女、優(yōu)與劣、及格與不及格等是表現(xiàn)為質(zhì)的變量。質(zhì)與量的相關(guān)主要包括二列相關(guān)、點(diǎn)二列相關(guān)、多系列相關(guān)。
7.2兩個(gè)變量間的相關(guān)分析二列相關(guān)當(dāng)兩個(gè)變量都是正態(tài)連續(xù)變量.其中一個(gè)變量被人為地劃分成二分變量(如按一定標(biāo)推將屬于正態(tài)連續(xù)變量的學(xué)科考試分?jǐn)?shù)劃分成及格與不及格,錄取與未錄取,把某一體育項(xiàng)目測(cè)驗(yàn)結(jié)果劃分成通過與未通過,達(dá)標(biāo)與末達(dá)標(biāo),把健康狀況劃分成好與差,等等),表示這兩個(gè)變量之間的相關(guān),稱為二列相關(guān)。
二列相關(guān)的使用條件
①兩個(gè)變量都是連續(xù)變量,且總體呈正態(tài)分布,或總體接近正態(tài)分布,至少是單峰對(duì)稱分布。②兩個(gè)變量之間是線性關(guān)系。③二分變量是人為劃分的,其分界點(diǎn)應(yīng)盡量靠近中值。④樣本容量應(yīng)當(dāng)大于80。
二列相關(guān)系數(shù)的計(jì)算公式
例:15名初三畢業(yè)生,其中重點(diǎn)中學(xué)有5人,非重點(diǎn)中學(xué)有10人,其高中入學(xué)考試英語(yǔ)分?jǐn)?shù)如表11.10,問中學(xué)的類別與英語(yǔ)考試成績(jī)的相關(guān)情況如何?
點(diǎn)二列相關(guān)
當(dāng)兩個(gè)變量其中一個(gè)是正態(tài)連續(xù)性變量,另一個(gè)是真正的二分名義變量(例如,男與女,已婚和未婚,色盲與非色盲,生與死,等等),這時(shí),表示這兩個(gè)變量之間的相關(guān),稱為點(diǎn)二列相關(guān)。
例如,18個(gè)五歲男女幼兒擲砂袋(150克)成績(jī)?nèi)缦卤恚瑔栃詣e與投擲成績(jī)的相關(guān)情況如何?
多系列相關(guān)
當(dāng)兩個(gè)變量都是正態(tài)連續(xù)變量,其中一個(gè)變量按不同質(zhì)被人為地分成多種類別(兩類以上)的正態(tài)名義變量。表示正態(tài)連續(xù)變量與多類正態(tài)名義變量之間的相關(guān),稱為多系列相關(guān)。例如,學(xué)生的智商與學(xué)習(xí)努力程度之間的關(guān)系,智商和學(xué)習(xí)努力程度都是正態(tài)連續(xù)變量,但學(xué)習(xí)努力程度被人為地分成“努力”、“中等”、“不努力”三種類別,二者的相關(guān)稱為三系列相關(guān)。又如,不同學(xué)習(xí)成績(jī)的學(xué)生對(duì)某種教學(xué)改革的態(tài)度分為“極其不贊成”、“不贊成。、“不置可否”、“贊成”、“極其贊成”。學(xué)習(xí)成績(jī)與態(tài)度之間的相關(guān)稱五系列相關(guān)。
多系列相關(guān)系數(shù)的計(jì)算公式
4定性—定性尺度的相關(guān):品質(zhì)相關(guān)
兩個(gè)變量都是按質(zhì)劃分成幾種類別,表示這兩個(gè)變量之間的相關(guān)稱為品質(zhì)相關(guān)。如,一個(gè)變量按性別分成男與女,另一個(gè)變量按學(xué)科成績(jī)分成及格與不及格;又如,一個(gè)變量按學(xué)校類別分成重點(diǎn)及非重點(diǎn),另一個(gè)變量按學(xué)科成績(jī)分成優(yōu)、良、中、差,等等。根據(jù)兩個(gè)變量的性質(zhì)及所分類別的多少,分為四分相關(guān)、φ相關(guān)及列聯(lián)相關(guān)。
7.2兩個(gè)變量間的相關(guān)分析四分相關(guān)
當(dāng)兩個(gè)變量都是正態(tài)連
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024污水處理廠運(yùn)營(yíng)合同書(范本)
- 2024幼兒園租房合同協(xié)議書樣本
- 房產(chǎn)抵押擔(dān)保借款合同書范例
- 2024貨船租賃合同范本范文
- 股權(quán)抵押借款合同范文2024年
- 店面租房門面房租房合同協(xié)議
- 商業(yè)鋪?zhàn)赓U合同格式
- 項(xiàng)目合作協(xié)議書模板示例
- 2024居間合同,居間合同范例
- 技術(shù)合作協(xié)議樣式
- 精品堆垛機(jī)安裝指導(dǎo)書
- 前臺(tái)月度績(jī)效考核表(KPI)
- 雞的飼養(yǎng)管理-優(yōu)質(zhì)課件
- 德育課(共19張PPT)
- 歷史幽憤的現(xiàn)代回響——《記念劉和珍君》課堂實(shí)錄
- 化學(xué)微生物學(xué)第7章 微生物轉(zhuǎn)化
- 《少年正是讀書時(shí)》-完整版PPT課件
- 四、貼標(biāo)機(jī)基本調(diào)整法1
- 船舶建造方案
- 35KV集電線路鐵塔組立專項(xiàng)方案
- 不銹鋼管規(guī)格表大全以及理論重量表大全
評(píng)論
0/150
提交評(píng)論