版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第十六章兩等距/比值尺度變項(xiàng)間的相關(guān)壹、本單元目標(biāo)1、解釋散佈圖(scattergram)。2、計(jì)算及解釋斜率(slope)、截距(intercept)、Pearsons及r2。3、找到並說(shuō)明最小平方之迴歸線(theleast-squaresregressionlin)e並用其來(lái)預(yù)測(cè)應(yīng)變項(xiàng)的數(shù)值。4、解釋總變異量(totalvarianee)、已解釋變異量(explainedvarianee),以及未解釋變異量(unexplainedvarianc等概念。5、用迴歸及相關(guān)的技巧來(lái)分析及描述兩個(gè)變項(xiàng)間的關(guān)係。6、從事Pearson啲顯著測(cè)定。嚴(yán)、尸.、亠貳、前言兩等距/比值變項(xiàng)間的相關(guān),通常是稱
2、之為correlation(當(dāng)然我們?nèi)钥捎胊ssociation)o雖然這裡談的變項(xiàng),是用與先前介紹的測(cè)量尺度不同,但是一談到相關(guān),我們還是要問(wèn)相關(guān)是否存在,相關(guān)之強(qiáng)度及相關(guān)方向或趨勢(shì)等三個(gè)主要問(wèn)題。貳、Scattergrams(散佈圖)在前面章節(jié)討論相關(guān)時(shí),第一步要做的是檢查交叉表之百分比的情況。自然,在兩變項(xiàng)是類別或等級(jí)變項(xiàng)時(shí),我們可以這麼做。當(dāng)兩變項(xiàng)都是interval-ratio時(shí),我們就不能看百分比之變化,但我們可以先看兩變項(xiàng)之散佈圖。散佈圖即是以資料中每一個(gè)案在兩變項(xiàng)之分?jǐn)?shù)而建立之坐標(biāo)圖。以書中P.395表15.1之資料為例,可以畫出如圖15.1(P.395)之散佈圖。表15.1之
3、例共有12個(gè)案,每一個(gè)案(家)在小孩人數(shù)及丈夫每週做家事時(shí)間兩變項(xiàng)上各有一值。若以小孩人數(shù)為X,做家事時(shí)間為Y,則每一個(gè)案之X、Y值則為圖15.1中之一點(diǎn)。如您所見(jiàn)圖15.1有清楚的標(biāo)題,X及Y軸亦有軸之標(biāo)題,通常X及Y軸之長(zhǎng)度相等,而其各軸之坐標(biāo)單位則視情況而定。所謂散佈圖即為各(X、Y)值資料點(diǎn)之散佈情況,這些點(diǎn)之散佈情況顯示出兩變項(xiàng)相關(guān)的基本特性。如果我們能畫一條直線盡量穿過(guò)或接近各點(diǎn),則這些特性會(huì)更清楚,這條線可稱為迴歸線(regressionline)。從散佈圖,我們可以先大致看出兩變項(xiàng)相關(guān)是否存在、相關(guān)的強(qiáng)弱,以及相關(guān)的方向。我們也可大致判斷,這兩變項(xiàng)的相關(guān)是否為直線性的(ther
4、elationshipoflinearity)。散佈圖也可用來(lái)從一個(gè)案在一個(gè)變項(xiàng)的分?jǐn)?shù)來(lái)預(yù)測(cè)其在另一變項(xiàng)的分?jǐn)?shù)為何。如果X和Y兩變項(xiàng)有相關(guān)的話,則Y之值應(yīng)隨X值做變化,而散佈圖中每一X值上方之點(diǎn),即可視為Y值之條件分配(conditionaldistribution),即在此X值之情況下,Y值之分配為何。而X及Y無(wú)相關(guān)時(shí),Y值並不會(huì)隨X值變化,在此無(wú)相關(guān)之情況下,其點(diǎn)之散佈會(huì)如P.396之圖15.2之C圖。無(wú)相關(guān)時(shí),迴歸線會(huì)與X軸平行。至於說(shuō)相關(guān)之強(qiáng)度,則可視資料點(diǎn)散佈之範(fàn)圍大小而定,若是散佈之範(fàn)圍愈小,或是愈接近迴歸線,則相關(guān)程度愈強(qiáng),自然要是有一直線能穿過(guò)所有之點(diǎn),自是完全相關(guān)之情況,如圖
5、15.2之A,B皆是。而相關(guān)之方向則視迴歸線與X軸之角度及點(diǎn)之散佈方向而定,要是X分?jǐn)?shù)愈高,丫值亦愈高,自是正相關(guān),反之則為負(fù)相關(guān)。散佈圖中,點(diǎn)之分佈情況並不一定是能用一直線來(lái)接近各點(diǎn),有時(shí),以曲線來(lái)接近各點(diǎn)或許更好。在前者之情況所顯示的是為兩變項(xiàng)間有一直線性關(guān)係(alinearrelationship),而後者則為非直線性或曲線性關(guān)係(anon-linearorcurvilinearrelationship)。在此,只介紹適合直線性關(guān)係之相關(guān)量數(shù),如果發(fā)現(xiàn)曲線關(guān)係,一個(gè)解決的方法是將interval-ratio變項(xiàng)視為等級(jí)變項(xiàng),然後計(jì)算相關(guān)量數(shù)(參考P.397之圖16.3)。參、迴歸及預(yù)測(cè)利
6、用散佈圖及迴歸線,我們也可做預(yù)測(cè)之工作,所謂預(yù)測(cè)(prediction),是猜測(cè)不在資料中之X值會(huì)對(duì)應(yīng)什麼樣的Y值,此預(yù)測(cè)之丫值,是以Y來(lái)表示,此值正是透過(guò)迴歸線來(lái)找。找的方法是先看該(不在資料中之)X值在X軸上是那一點(diǎn),然後畫一垂直線與迴歸線相交,相交那一點(diǎn)再畫一與X軸平行之線,與丫軸相交之點(diǎn),即為丫。現(xiàn)在,最重要的問(wèn)題是,這條迴歸線要怎麼畫,當(dāng)然,最簡(jiǎn)單的方法是用目測(cè),找一條直線儘量接近各點(diǎn),自然,我們有更好的方法。如果我們想要找一條直線儘量靠近各點(diǎn)的話,也就是要找一條線能使各點(diǎn)和此線之距離最短。這條線的找法和以前談過(guò)所有分?jǐn)?shù)與其平均數(shù)之差的平方和為最小有關(guān),即藝(XX)2=minimum
7、而先前也曾提過(guò)每一個(gè)X軸上之X值上方之丫值,可看成是Y之條件性分配,換言之,每一X值之情況下之Y值之分配可有一平均數(shù),這X值下之條件性平均數(shù)(conditionalmean)自與在此X值下之Y值之差的平方和為最小。如果我們找出各不同X值情況下之各條件性之丫的平均數(shù),再將這些(Xi,Yi)的點(diǎn)連成一直線,就必然是一極佳的與各點(diǎn)距離最近的直線了。但天下事通常沒(méi)這麼簡(jiǎn)單的。這些(Xi,Yi)點(diǎn)常不能連成一直線。我們要再退而求其次,要找的是與所有conditionalmeansof丫之點(diǎn)距離最近之直線,這條直線可以下列公式表示,即=a+bX=依變項(xiàng)之分?jǐn)?shù)a=在Y軸上之截距(theYintercept)
8、b=迴歸線之斜率(slope),亦即當(dāng)X之一個(gè)單位改變時(shí),所產(chǎn)生之Y值的改變。X=自變項(xiàng)之分?jǐn)?shù)E(X-X)(YY)這個(gè)公式中之b=2,而(X_X)a=blX這些公式所求出之迴歸線,是用所謂Theleast-squaresmethod(最小平方法)所求得的。這b之求法和X及Y之variances有何關(guān)聯(lián)(請(qǐng)將分子和與分母各除以N)?而a之求法表示出迴歸線及(乂,V)之關(guān)係為何?而b之求法,如用筆算可用下列公式:b=N瓦XY-(瓦X)(瓦Y)22NX(X)由此公式可看出,如X與丫之相關(guān)甚大,則X之一個(gè)單位的變化,可以增加(或減少)相當(dāng)大的丫值,即X對(duì)丫之影響很大,此外,b之值是正還是負(fù),則代表相關(guān)
9、之方向。求得了Y二a+bX之最小平方的迴歸線(Theleast-squaresregressionline)後,即可從各種X值來(lái)預(yù)測(cè)Y值,因?yàn)閅=a+bX(X為不在原來(lái)資料中之X值)要注意的是此種預(yù)測(cè)是一種educatedguesses換言之,除非X與Y有完全相關(guān),不然透過(guò)此迴歸線找到之Y值是最好的預(yù)測(cè),而且若X及丫之相關(guān)愈強(qiáng),則我們可做愈準(zhǔn)確之猜測(cè)。肆、相關(guān)係數(shù)(Thecorrelationcoefficient-Pearson雖然由b可看出X對(duì)丫之影響力及兩變項(xiàng)間相關(guān)之一些情況,但是b(迴歸係數(shù)),並非是在0及間變化,因此要測(cè)量X及丫兩等距變項(xiàng)關(guān)係之弱強(qiáng),通常是用一量數(shù)叫Pearsonrs
10、此量數(shù)是在0及間變化,而遲(X-x)(丫Y)(X-x)2(丫-丫)2分子與求b之公式相同,代表X與Y之共變(covariation),若用筆算,r之計(jì)算為NI:XY(I:X)(I:Y)JNEX2(送X)2N送Y2(瓦丫)2r雖然有在0及間變化之好處,但是其0及間之值的意義卻是只有相對(duì)之意義,但是若將r平方得r2,則此係數(shù)為一coefficientofdetermination,並且有PRE之意義。在此PRE之邏輯是,當(dāng)我們並不知道X之變化時(shí),對(duì)丫值做最佳之猜測(cè),然後再利用X值之消息來(lái)猜丫值。當(dāng)不知X值時(shí),對(duì)Y值之最佳猜測(cè),在等距變項(xiàng)之情況下,自是以猜Y為最佳,因?yàn)樗?Y-Y)2=minimum
11、,亦即猜每一Y值皆為Y時(shí),可以得到最少之猜測(cè)錯(cuò)誤,藝(Y-Y)2即為丫值之totalvariation,p.406之圖15.6中之黑直線即表示以丫值來(lái)猜各丫值之點(diǎn)所犯之錯(cuò)誤,此圖中與X軸平行之線即為代表Y之線,因先不考慮X之變化對(duì)Y的影響,故此圖即可當(dāng)成一個(gè)變項(xiàng)Y之次數(shù)分配圖。而當(dāng)我們利用X值之消息來(lái)再度猜丫值,且利用最小平方迴歸線之方程式來(lái)猜測(cè)時(shí),所猜測(cè)之Y值為Y=a+bX,以此法所得之猜測(cè)錯(cuò)誤以藝(Y2來(lái)表示,此藝(YY2)應(yīng)是最小的,此即最小平方法所得之結(jié)果。換言之,如X與丫無(wú)相關(guān),則此Y=Y(why?)。而X與丫有相關(guān)時(shí),則藝(YY比藝(Y-Y)2還小。如果你將在P.406之圖15.6
12、與P.407之圖15.7重疊,你可看出2一227丫丫八丫丫、丫丫換言之藝(Y丫)2此一totalvariation由兩部分組成。其第一部分藝(YY)2即為得知X後減少猜測(cè)錯(cuò)誤之部分,習(xí)稱explainedvariation,而藝(Y-丫即為在得知X後仍無(wú)法解釋之部分,亦即而r2(Y-丫)2(丫-丫)2unexplainedvariation,ExplainedvariationTotalvariation因此r2乘上100,即為知道X後,totalvariation中能歸諸於知道X之部分(或是為X所解釋)之比例。伍、Pearsonrs之假設(shè)測(cè)定當(dāng)我們由樣本中求得一Pearsons時(shí),需進(jìn)一步求
13、此樣本之相關(guān)係數(shù)是否達(dá)到統(tǒng)計(jì)上之顯著水準(zhǔn),即測(cè)定此相關(guān)關(guān)係是否也存在於得此樣本之母群中。Pearsons之假設(shè)測(cè)定的基本假定如下:步驟一:Model:RandomSamplingLevelofmeasurementisinterval-ratioBivariatenormaldistributionsLinearrelationshipHomoscedasticitySamplingdistributionisnormal上述之基本假定,有幾項(xiàng)是較特別的。其中bivariatenormaldistribution是說(shuō)兩變項(xiàng)之共同分配是常態(tài)的(見(jiàn)圖一,取自/People/hartlaub/MellonProject/Bivariate2.html)BivariateNormalBivariateNormal33(圖一)雙變項(xiàng)常態(tài)分配其次,我們必須要假設(shè)兩變項(xiàng)間之關(guān)係是直線性的第三個(gè)特別之假定是等分散性(homoscedasticity),等分散性是說(shuō)在每一X值下之Y的變異量(varianee)是相同的。也就是說(shuō)Y離散之分配在整條迴歸線上面是相當(dāng)一致的,不會(huì)隨著X值的大小變化,而有不同程度的離散或變異。譬如說(shuō),如果X值愈大(或愈
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 醫(yī)院裝修項(xiàng)目增補(bǔ)協(xié)議模板
- 高端健身館裝修升級(jí)承包
- 籃球館裝修保修期管理策略
- 航海體驗(yàn)旅客安全協(xié)議
- 教育培訓(xùn)用地流轉(zhuǎn)居間合同
- 建筑模板大型運(yùn)輸協(xié)議樣本
- 期中測(cè)試卷(1-4單元)(試題)-2024- 2025學(xué)年六年級(jí)上冊(cè)數(shù)學(xué)人教版
- 裝修功能優(yōu)化補(bǔ)充合同
- 部編版道德與法治六年級(jí)上冊(cè)第四單元《法律保護(hù)我們健康成長(zhǎng)》課件(共6課時(shí))
- 液體化學(xué)品船運(yùn)合同模板
- 麻醉技師的培訓(xùn)和手術(shù)室準(zhǔn)備要求
- 降低會(huì)陰側(cè)切率的PDCA
- 電工(四級(jí))理論知識(shí)考核要素細(xì)目表
- 滬教版一年級(jí)語(yǔ)文上冊(cè)電子課本(五篇)
- 國(guó)土空間規(guī)劃學(xué)課件 第5章 國(guó)土空間分區(qū)
- (完整版)過(guò)程方法知識(shí)介紹
- 第二單元“革命歲月”(主題閱讀)- 六年級(jí)語(yǔ)文上冊(cè)閱讀理解(統(tǒng)編版)
- 天津市和平區(qū)第一中學(xué)2024屆物理高一第一學(xué)期期中聯(lián)考試題含解析
- CASS工藝處理生活污水課程設(shè)計(jì)
- 集體記憶研究的傳播學(xué)取向
- 2022中水北方勘測(cè)設(shè)計(jì)研究限責(zé)任公司校園招聘上岸筆試歷年難、易錯(cuò)點(diǎn)考題附帶參考答案與詳解
評(píng)論
0/150
提交評(píng)論