直線相關(guān)課件_第1頁(yè)
直線相關(guān)課件_第2頁(yè)
直線相關(guān)課件_第3頁(yè)
直線相關(guān)課件_第4頁(yè)
直線相關(guān)課件_第5頁(yè)
已閱讀5頁(yè),還剩29頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

直線相關(guān)直線相關(guān)的掌握要點(diǎn)直線相關(guān)描述了什么問(wèn)題?直線相關(guān)分析的具體步驟是什么?直線相關(guān)分析對(duì)資料有什么要求?如何對(duì)這些要求進(jìn)行檢查或檢驗(yàn)??jī)H用樣本直線相關(guān)系數(shù)能否說(shuō)明相關(guān)程度?總體相關(guān)系數(shù)非常接近1,能否說(shuō)明Y=X?線性相關(guān)例:考察身高與體重的伴隨關(guān)系體重身高線性相關(guān)圖中不是每個(gè)身材較高的對(duì)象必有較重的體重,但大多數(shù)對(duì)象的體重Y與其身高X的變化呈一種伴隨增大或減小的直線變化趨勢(shì),這種現(xiàn)象稱(chēng)為直線相關(guān)??坍?huà)兩個(gè)隨機(jī)變量之間線性相關(guān)程度稱(chēng)為線性相關(guān)(linearcorrelation)線性相關(guān)X和Y伴隨同時(shí)上升或伴隨下降稱(chēng)為線性正相關(guān)(LinearPositiveCorrelation)X和Y無(wú)任何直線伴隨變化趨勢(shì),則稱(chēng)為零相關(guān)

(零線性相關(guān))。X與Y的反方向伴隨直線變化趨勢(shì)稱(chēng)為線性負(fù)相關(guān)(linearnegativecorrelation)線性相關(guān)系數(shù)相關(guān)系數(shù)是描述兩個(gè)變量之間線性相關(guān)的程度和相關(guān)方向的統(tǒng)計(jì)指標(biāo)。

直線相關(guān)系數(shù)(linearcorrelationcoeffiecient),簡(jiǎn)稱(chēng)相關(guān)系數(shù)。線性相關(guān)系數(shù)描述全體研究對(duì)象的兩個(gè)變量之間線性相關(guān)性的相關(guān)系數(shù)稱(chēng)為總體相關(guān)系數(shù),記為

描述樣本資料的兩個(gè)變量之間的線性相關(guān)性的相關(guān)系數(shù)為樣本相關(guān)系數(shù),簡(jiǎn)稱(chēng)相關(guān)系數(shù),記為r樣本相關(guān)系數(shù)的計(jì)算一般而言,總體相關(guān)系數(shù)是未知的,通常用樣本相關(guān)系數(shù)r進(jìn)行估計(jì)。樣本相關(guān)系數(shù)r按下式計(jì)算:上述相關(guān)系數(shù)又稱(chēng)為Pearson相關(guān)系數(shù)相關(guān)系數(shù)性質(zhì)無(wú)量綱取值范圍為-1

1,-1

r

1>0表示正相關(guān);<0表示負(fù)相關(guān);=0表示零相關(guān)。

||越接近1,表示相關(guān)程度越密切||越接近0,表示相關(guān)程度越不密切線性相關(guān)示意圖線性不相關(guān)示意圖實(shí)例分析例:隨機(jī)抽取15名健康成人,測(cè)定血液的凝血酶濃度(毫升)及凝血時(shí)間(秒)。問(wèn):這兩項(xiàng)指標(biāo)是否線性相關(guān)?實(shí)例分析樣本相關(guān)系數(shù)計(jì)算可以簡(jiǎn)化為實(shí)例分析本例:樣本相關(guān)系數(shù)與樣本量樣本相關(guān)系數(shù)r的大小與樣本量有關(guān)。特別n=2,當(dāng)兩個(gè)點(diǎn)的連線不平行于橫軸和縱軸時(shí),r=1或r=-1。樣本相關(guān)系數(shù)大小不能直接評(píng)價(jià)兩個(gè)變量之間的相關(guān)性。通常研究者首先關(guān)心的是=0?相關(guān)系數(shù)的檢驗(yàn)總體相關(guān)系數(shù)=0時(shí),樣本相關(guān)系數(shù)一般不為0(存在抽樣誤差),故需要作假設(shè)檢驗(yàn)。Pearson相關(guān)系數(shù)的假設(shè)檢驗(yàn)要求X和Y服從雙正態(tài)分布。相關(guān)系數(shù)的檢驗(yàn)H0:=0H1:0=0.05檢驗(yàn)統(tǒng)計(jì)量當(dāng)=0為真時(shí),t服從自由度為n-2的t分布,即|t|>t0.05/2,n-2時(shí),拒絕H0:=0可以認(rèn)為兩個(gè)變量呈線性相關(guān)(0)。實(shí)例分析H0:=0H1:0=0.05臨界值t0.05/2,15-2=2.16,|t|>t0.05/2,15-2故拒絕H0:=0,可以認(rèn)為凝血酶濃度y及凝血時(shí)間x呈線性負(fù)相關(guān)(<0)。相關(guān)系數(shù)的95%可信區(qū)間計(jì)算由于0的樣本相關(guān)系數(shù)r呈偏態(tài)分布,故需作z變換,方法如下:其中相關(guān)系數(shù)的95%可信區(qū)間計(jì)算z的95%可信區(qū)間為反變換后的95%可信區(qū)間為

實(shí)例的95%可信區(qū)間計(jì)算Z變換:z的95%可信區(qū)間為Z的反變換的下限為的上限為凝血酶濃度y及凝血時(shí)間x的總體相關(guān)系數(shù)的95%可信區(qū)間為(-0.976,-0.787)實(shí)例的95%可信區(qū)間計(jì)算線性相關(guān)與直線回歸的異同性回歸系數(shù)很大,相關(guān)性很弱回歸系數(shù)很小,相關(guān)性較強(qiáng)線性相關(guān)與直線回歸的異同性回歸系數(shù)刻畫(huà)了X變化一個(gè)單位,Y平均變化多少單位,與相關(guān)性沒(méi)有直接聯(lián)系。即:回歸系數(shù)可以很大,相關(guān)性可以很弱。相關(guān)系數(shù)刻畫(huà)了X與Y的相關(guān)程度,即:X與Y伴隨變化的同步程度,但相關(guān)系數(shù)與X伴隨Y同步變化幅度沒(méi)有之間聯(lián)系。即:回歸系數(shù)可以很小,但同步變化的一致程度很高(相關(guān)程度可以很強(qiáng))。直線相關(guān)分析對(duì)資料的要求由概率論的條件概率公式,得到檢驗(yàn)X和Y服從雙正態(tài)分布的方法如下:以X為自變量,Y為應(yīng)變量作直線回歸。計(jì)算其殘差檢驗(yàn)殘差和自變量X是否均服從正態(tài)分布,并且殘差與x沒(méi)有明顯的伴隨趨勢(shì)。如果殘差和X均服從正態(tài)分布且無(wú)伴隨趨勢(shì),即可推斷X和Y服從雙正態(tài)分布。直線回歸與直線相關(guān)分析的注意點(diǎn)直線回歸的任何結(jié)果都不能推斷x與Y的因果關(guān)系。x與Y相關(guān)分析的結(jié)果不能推斷為x與Y相等關(guān)系或兩個(gè)變量的一致性。一般而言,相關(guān)系數(shù)檢驗(yàn)的無(wú)效假設(shè)為=0,所以P和樣本相關(guān)系數(shù)r的大小都不能推斷總體相關(guān)系數(shù)的大小,只有通過(guò)95%可信區(qū)間才能估計(jì)的范圍。直線相關(guān)和直線回歸小結(jié)直線相關(guān)是刻畫(huà)兩個(gè)變量之間的相關(guān)程度。直線回歸是刻畫(huà)自變量x與應(yīng)變量Y的總體均數(shù)y的線性對(duì)應(yīng)關(guān)系。在直線相關(guān)分析中,兩個(gè)變量都是隨機(jī)變量,且要求服從雙正態(tài)分布。直線相關(guān)和直線回歸小結(jié)在直線回歸分析中,應(yīng)變量Y是隨機(jī)變量,x可以是非隨機(jī)變量也可以是隨機(jī)變量,但即使從研究背景上考察,x是隨機(jī)變量,在直線回歸模型,x的變量值視為普通變量的取值。直線回歸要求固定自變量x,Y服從正態(tài)分布或殘差服從正態(tài)分布,并且自變量X與殘差無(wú)明顯的伴隨變化趨勢(shì)。您對(duì)直線相關(guān)的要點(diǎn)理解嗎?直線相關(guān)描述了什么問(wèn)題?直線相關(guān)分析的具體步驟是什么?直線相關(guān)分析對(duì)資料有什么要求?如何對(duì)這些要求進(jìn)行檢查或檢驗(yàn)??jī)H用樣本直線相關(guān)系數(shù)能否說(shuō)明相關(guān)程度?總體相關(guān)系數(shù)非常接近1,能否說(shuō)明Y=X?思考題某醫(yī)生對(duì)一個(gè)患者進(jìn)行連續(xù)觀察其心跳次數(shù)和體溫,每小時(shí)觀察一次,記錄該對(duì)象的心跳次數(shù)和體溫,共觀察了72小時(shí),為了了解心跳次數(shù)與體溫的關(guān)系,假定散點(diǎn)圖顯示:這些觀察值的點(diǎn)呈直線帶狀態(tài)。請(qǐng)問(wèn):能否作直線回歸分析?或直線相關(guān)分析?為什么?Stata實(shí)現(xiàn)用Stata軟件計(jì)算相關(guān)系數(shù)繪制散點(diǎn)圖

graphxy

計(jì)算Pearson相關(guān)系數(shù),假設(shè)檢驗(yàn)p值

pwcorrxy,sigstar(.05)參考文獻(xiàn)趙耐青主編,十五規(guī)劃教材《醫(yī)學(xué)統(tǒng)計(jì)學(xué)》,高教出版社2004年3月趙耐青主編,《臨床研究設(shè)計(jì)與數(shù)據(jù)分析》,復(fù)旦大學(xué)出版社2005年8月JohnNeter.Appliedlinearstatisticalmodels,fourthedition.WCB:McGrawHill,1996寫(xiě)在最后成功的基礎(chǔ)在于好的學(xué)習(xí)習(xí)慣Thefoundationofsuccessliesingoodhabits33謝謝聆聽(tīng)·學(xué)習(xí)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論