第五章 相關(guān)分析_第1頁
第五章 相關(guān)分析_第2頁
第五章 相關(guān)分析_第3頁
第五章 相關(guān)分析_第4頁
第五章 相關(guān)分析_第5頁
已閱讀5頁,還剩31頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、一、簡單相關(guān)(一、簡單相關(guān)(PearsonPearson相關(guān))相關(guān)) 又稱直線相關(guān)、線性相關(guān)又稱直線相關(guān)、線性相關(guān)二、凈相關(guān)(偏相關(guān))二、凈相關(guān)(偏相關(guān))三、復(fù)相關(guān)三、復(fù)相關(guān)第五章 相關(guān)分析一、相關(guān)分析的功用一、相關(guān)分析的功用 研究隨機變量間的關(guān)系密切程度研究隨機變量間的關(guān)系密切程度二、相關(guān)分析的應(yīng)用二、相關(guān)分析的應(yīng)用 廣泛應(yīng)用于各行各業(yè)廣泛應(yīng)用于各行各業(yè) 如:身高與體重的關(guān)系;如:身高與體重的關(guān)系; 越冬溫度與病蟲害發(fā)生的關(guān)系;越冬溫度與病蟲害發(fā)生的關(guān)系; 農(nóng)作物施肥與增產(chǎn)的關(guān)系等。農(nóng)作物施肥與增產(chǎn)的關(guān)系等。第一節(jié) 簡單相關(guān)表表5.1 為說明兩變量之間的線性關(guān)系而假設(shè)的三組(為說明兩變量之間

2、的線性關(guān)系而假設(shè)的三組(x,y)觀察值觀察值組別組別 變量變量觀觀 察察 值值 平均數(shù)平均數(shù) 平方之和平方之和 第一組第一組 x17 7 1 6 5 3 8 9 3 1y15 9 6 1 3 1 9 4 6 8 第二組第二組 x29 8 7 7 6 5 3 3 1 1y29 9 8 6 6 5 4 3 1 1第三組第三組 x31 1 3 3 5 6 7 7 8 9y39 9 8 6 6 5 4 3 1 10 . 51x0 . 52x0 . 53x2 . 51y 32421x 35021y2 . 52y2 . 53y 32422x 32423x 35022y 35023y三、簡單相關(guān)的散點圖表示

3、三、簡單相關(guān)的散點圖表示第一節(jié) 簡單相關(guān)第一節(jié) 兩隨機變量之間的線性關(guān)系表表5.1 為說明兩變量之間的線性關(guān)系而假設(shè)的三組(為說明兩變量之間的線性關(guān)系而假設(shè)的三組(x,y)觀察值觀察值組別組別 變量變量觀觀 察察 值值 平均數(shù)平均數(shù) 平方之和平方之和 第一組第一組 x17 7 1 6 5 3 8 9 3 1y15 9 6 1 3 1 9 4 6 8 第二組第二組 x29 8 7 7 6 5 3 3 1 1y29 9 8 6 6 5 4 3 1 1第三組第三組 x31 1 3 3 5 6 7 7 8 9y39 9 8 6 6 5 4 3 1 10 . 51x0 . 52x0 . 53x2 . 5

4、1y 32421x 35021y2 . 52y2 . 53y 32422x 32423x 35022y 35023y024681002468100246810024681002468100246810 第一組數(shù)據(jù)第一組數(shù)據(jù) 第二組數(shù)據(jù)第二組數(shù)據(jù) 第三組數(shù)據(jù)第三組數(shù)據(jù) a b c 圖圖5.1 三組假設(shè)數(shù)據(jù)的散點圖三組假設(shè)數(shù)據(jù)的散點圖第一節(jié) 兩隨機變量之間的線性關(guān)系024681002468100246810024681002468100246810 第一組數(shù)據(jù)第一組數(shù)據(jù) 第二組數(shù)據(jù)第二組數(shù)據(jù) 第三組數(shù)據(jù)第三組數(shù)據(jù) a b c 圖圖5.1 三組假設(shè)數(shù)據(jù)的散點圖三組假設(shè)數(shù)據(jù)的散點圖 在第三組數(shù)據(jù)中,隨

5、著x3數(shù)值的增大, y3值有減少的趨勢。 在第二組數(shù)據(jù)中,隨著x2數(shù)值的增大, y2值有增加的趨勢。 在第一組數(shù)據(jù)的散點圖中,各點的位置很分散, x1和y1之間沒有明顯的關(guān)系。 024681002468100246810024681002468100246810 第一組數(shù)據(jù)第一組數(shù)據(jù) 第二組數(shù)據(jù)第二組數(shù)據(jù) 第三組數(shù)據(jù)第三組數(shù)據(jù) a b c 圖圖5.1 三組假設(shè)數(shù)據(jù)的散點圖三組假設(shè)數(shù)據(jù)的散點圖l 在上面的三個散點圖中,分別過各自的中心,即坐在上面的三個散點圖中,分別過各自的中心,即坐 標(標( , )作縱軸線和橫軸線,將各圖分為)作縱軸線和橫軸線,將各圖分為、 、和和等四個象限。等四個象限。xy

6、相關(guān)系數(shù)公式推導(dǎo)相關(guān)系數(shù)公式推導(dǎo)024681002468100246810024681002468100246810 第一組數(shù)據(jù)第一組數(shù)據(jù) 第二組數(shù)據(jù)第二組數(shù)據(jù) 第三組數(shù)據(jù)第三組數(shù)據(jù) a b c 圖圖5.1 三組假設(shè)數(shù)據(jù)的散點圖三組假設(shè)數(shù)據(jù)的散點圖 在第一組數(shù)據(jù)中,四個象限點的分布均勻分散。 在第二組數(shù)據(jù)中,大部分的點分布在和象限。 在第三組數(shù)據(jù)中,大部分的點分布在和象限。相關(guān)系數(shù)公式推導(dǎo)相關(guān)系數(shù)公式推導(dǎo)024681002468100246810024681002468100246810 第一組數(shù)據(jù)第一組數(shù)據(jù) 第二組數(shù)據(jù)第二組數(shù)據(jù) 第三組數(shù)據(jù)第三組數(shù)據(jù) a b c 圖圖5.1 三組假設(shè)數(shù)據(jù)的散

7、點圖三組假設(shè)數(shù)據(jù)的散點圖 不論在哪一幅圖中,有四條規(guī)律是共同的: 第象限的點 0, 0, 0; xxyy)(yyxx 第象限的點 0, 0, 0; xxyy)(yyxx 第象限的點 0, 0, 0; xxyy)(yyxx 第象限的點 0, 0, 0; xxyy)(yyxx相關(guān)系數(shù)公式推導(dǎo)相關(guān)系數(shù)公式推導(dǎo)024681002468100246810024681002468100246810 第一組數(shù)據(jù)第一組數(shù)據(jù) 第二組數(shù)據(jù)第二組數(shù)據(jù) 第三組數(shù)據(jù)第三組數(shù)據(jù) a b c 圖圖5.1 三組假設(shè)數(shù)據(jù)的散點圖三組假設(shè)數(shù)據(jù)的散點圖其中其中 是兩變量的離均差的乘積。如果將各組是兩變量的離均差的乘積。如果將各組數(shù)

8、據(jù)中所有觀察值的離均差的乘積都加起來,可以發(fā)現(xiàn)數(shù)據(jù)中所有觀察值的離均差的乘積都加起來,可以發(fā)現(xiàn))(yyxx離均差乘積和很接近于0離均差乘積和大于0離均差乘積和小于0可見,離均差乘積和能很好地衡量兩個變量之間的線性可見,離均差乘積和能很好地衡量兩個變量之間的線性關(guān)系。記:關(guān)系。記:)()(1yyxxyyxxSPniii相關(guān)系數(shù)公式推導(dǎo)相關(guān)系數(shù)公式推導(dǎo)表表5.1 為說明兩變量之間的線性關(guān)系而假設(shè)的三組(為說明兩變量之間的線性關(guān)系而假設(shè)的三組(x,y)觀察值觀察值組別組別 變量變量觀觀 察察 值值 平均數(shù)平均數(shù) 平方之和平方之和 第一組第一組 x17 7 1 6 5 3 8 9 3 1y15 9 6

9、 1 3 1 9 4 6 8 第二組第二組 x29 8 7 7 6 5 3 3 1 1y29 9 8 6 6 5 4 3 1 1第三組第三組 x31 1 3 3 5 6 7 7 8 9y39 9 8 6 6 5 4 3 1 10 . 51x0 . 52x0 . 53x2 . 51y 32421x 35021y2 . 52y2 . 53y 32422x 32423x 35022y 35023y利用定義,可將上面三組數(shù)據(jù)的離均差乘積和算出為: SP1 (75)(55.2)(15)(85.2) 2 SP2 (95)(95.2)(15)(15.2) 75SP3 (15)(95.2)(95)(15.2)

10、 -74相關(guān)系數(shù)公式推導(dǎo)相關(guān)系數(shù)公式推導(dǎo)協(xié)方差:去除資料的觀測值數(shù)量的影響1、總體資料:2、樣本資料:NyyxxNSPyxCovxyxy)(),(1)(1),(nyyxxnSPyxCovSxyxy相關(guān)系數(shù)公式推導(dǎo)相關(guān)系數(shù)公式推導(dǎo)上述三組樣本的協(xié)方差Sxy1=Cov1=Cov(x1,y1)=2/(10-1) = 0.2222相關(guān)系數(shù)公式推導(dǎo)相關(guān)系數(shù)公式推導(dǎo)Sxy2=Cov2=Cov(x2,y2)=75/(10-1) = 8.333Sxy3=Cov3=Cov(x3,y3)=74/(10-1) = 8.222相關(guān)系數(shù):去除資料的自身變異程度的影響1、總體相關(guān)系數(shù):2、樣本相關(guān)系數(shù):yxxyyxxyS

11、SSSSPyxCov),(相關(guān)系數(shù)公式推導(dǎo)相關(guān)系數(shù)公式推導(dǎo)yxxyyxxySSSSSPSSyxCovr),(第一節(jié) 兩隨機變量之間的線性關(guān)系四、簡單相關(guān)系數(shù)性質(zhì)四、簡單相關(guān)系數(shù)性質(zhì)相關(guān)系數(shù)的定義域:相關(guān)系數(shù)的定義域: 1 1,11相關(guān)系數(shù)是相關(guān)性大小的度量,是沒有單位的量相關(guān)系數(shù)是相關(guān)性大小的度量,是沒有單位的量相關(guān)系數(shù)相關(guān)系數(shù) 為低度相關(guān)為低度相關(guān)相關(guān)系數(shù)相關(guān)系數(shù) 為中度相關(guān)為中度相關(guān)相關(guān)系數(shù)相關(guān)系數(shù) 為高度相關(guān)為高度相關(guān)4 . 0|0 r7 . 0|4 . 0 r1|7 . 0r第一節(jié) 兩隨機變量之間的線性關(guān)系四、簡單相關(guān)系數(shù)性質(zhì)四、簡單相關(guān)系數(shù)性質(zhì)正相關(guān):正相關(guān):0 r =1完全正相關(guān):

12、完全正相關(guān): r = 1負相關(guān):負相關(guān):-1= r 0完全負相關(guān):完全負相關(guān): r = -1不相關(guān):不相關(guān):r = 0表表5.1 為說明兩變量之間的線性關(guān)系而假設(shè)的三組(為說明兩變量之間的線性關(guān)系而假設(shè)的三組(x,y)觀察值觀察值組別組別 變量變量觀觀 察察 值值 平均數(shù)平均數(shù) 平方之和平方之和 第一組第一組 x17 7 1 6 5 3 8 9 3 1y15 9 6 1 3 1 9 4 6 8 第二組第二組 x29 8 7 7 6 5 3 3 1 1y29 9 8 6 6 5 4 3 1 1第三組第三組 x31 1 3 3 5 6 7 7 8 9y39 9 8 6 6 5 4 3 1 10 .

13、 51x0 . 52x0 . 53x2 . 51y 32421x 35021y2 . 52y2 . 53y 32422x 32423x 35022y 35023y如果上例中的是樣本數(shù)據(jù),則它們的相關(guān)系數(shù)分別為:02606. 06 .797421r19772. 06 .7974752r96418. 06 .7974743r練習(xí):求三組數(shù)的相關(guān)系數(shù) 如第如第2組數(shù)據(jù)的相關(guān)系數(shù)組數(shù)據(jù)的相關(guān)系數(shù) r2 =0.97721;所以所以 x2 與與 y2之間有正的高度相關(guān)關(guān)系;之間有正的高度相關(guān)關(guān)系; 如第如第3組數(shù)據(jù)的相關(guān)系數(shù)組數(shù)據(jù)的相關(guān)系數(shù) r3 = 0.96418;所;所以以 x3與與y3 之間有負的高

14、度相關(guān)關(guān)系;之間有負的高度相關(guān)關(guān)系; 如第如第1組數(shù)據(jù)的相關(guān)系數(shù)組數(shù)據(jù)的相關(guān)系數(shù) r1 =0.0261;所以所以 x1 與與 y1之間就幾乎沒有線性相關(guān)關(guān)系。之間就幾乎沒有線性相關(guān)關(guān)系。練習(xí):求三組數(shù)的相關(guān)系數(shù)第一節(jié) 兩隨機變量之間的線性關(guān)系五、相關(guān)系數(shù)顯著性測驗五、相關(guān)系數(shù)顯著性測驗第一步:第一步: 統(tǒng)計假設(shè):統(tǒng)計假設(shè):H H0 0: 0 0,H HA A: 0 01 1、用統(tǒng)計量、用統(tǒng)計量t t檢驗檢驗當(dāng)要使用一個樣本的相關(guān)系數(shù)當(dāng)要使用一個樣本的相關(guān)系數(shù)r r對相應(yīng)的總體相關(guān)系對相應(yīng)的總體相關(guān)系數(shù)數(shù) 進行估計,可以由兩種統(tǒng)計量進行估計,可以由兩種統(tǒng)計量 t t 和和 r r 來實現(xiàn)來實現(xiàn)總

15、體相關(guān)系數(shù)是否為零的假設(shè)。總體相關(guān)系數(shù)是否為零的假設(shè)。相關(guān)系數(shù)顯著性測驗212nrrsrtr212nrsr第二步:計算統(tǒng)計量計算統(tǒng)計量t tdf = n-2抽樣誤差:相關(guān)系數(shù)顯著性測驗第三步:統(tǒng)計推斷統(tǒng)計推斷 1 1、|t|t|t|t0.050.05 推斷相關(guān)不顯著推斷相關(guān)不顯著 2 2、t t0.050.05|t|t|t| t = 18.31 t0.01 3.356推斷推斷x x2 2和和y y2 2相關(guān)達極顯著相關(guān)達極顯著2 2、統(tǒng)計量、統(tǒng)計量r r顯著性測驗顯著性測驗第一步:第一步:作統(tǒng)計假設(shè)作統(tǒng)計假設(shè)第二步:計算統(tǒng)計量計算統(tǒng)計量r r,根據(jù),根據(jù)df = =n-2-2,查相關(guān),查相關(guān)系

16、數(shù)顯著性測驗表,從而獲得系數(shù)顯著性測驗表,從而獲得r r0.050.05和和r r0.010.01 。第三步:第三步:作統(tǒng)計推斷作統(tǒng)計推斷 1 1、|r|r|r|r0.05 0.05 推斷相關(guān)不顯著;推斷相關(guān)不顯著; 2 2、r r0.050.05=|r|r=|r|=|r| = r r0.010.01 推斷相關(guān)達極顯著。推斷相關(guān)達極顯著。第一節(jié) 兩隨機變量之間的線性關(guān)系0:0H0:AH實例:相關(guān)系數(shù)顯著性測驗相關(guān)系數(shù)顯著性測驗根據(jù)自由度根據(jù)自由度df=8df=8,查相關(guān)系數(shù)顯著性測驗表,查相關(guān)系數(shù)顯著性測驗表, ,從而獲得從而獲得 r r0.050.05 = 0.632 = 0.632 r r

17、0.010.01 = 0.765 = 0.765作統(tǒng)計推斷作統(tǒng)計推斷 今今|r|=0.97721 r|r|=0.97721 r0.01 0.01 推斷推斷x x2 2和和y y2 2相關(guān)達極顯著相關(guān)達極顯著計算得:計算得:97721. 0r相關(guān)系數(shù)顯著性測驗相關(guān)系數(shù)顯著性測驗t和和r檢驗是等價的,在檢驗是等價的,在水平下水平下相關(guān)系數(shù)顯著性測驗相關(guān)系數(shù)顯著性測驗22tdftr多個變量間的簡單相關(guān)多個變量間的簡單相關(guān)設(shè)有設(shè)有n個變量個變量x x1 1x xn n,其相關(guān)系數(shù)矩陣:,其相關(guān)系數(shù)矩陣:111212122112121nnnnnnrrxrrxrrxxxx第二節(jié)第二節(jié) 凈相關(guān)(偏相關(guān))凈相

18、關(guān)(偏相關(guān))一級凈相關(guān)一級凈相關(guān)二級凈相關(guān)二級凈相關(guān) 最高級凈相關(guān)最高級凈相關(guān)凈相關(guān):凈相關(guān):用數(shù)學(xué)方法固定其余的變量,消除用數(shù)學(xué)方法固定其余的變量,消除其余變量的影響,只研究指定兩個變量間的其余變量的影響,只研究指定兩個變量間的純相關(guān)關(guān)系。純相關(guān)關(guān)系。 彌補了簡單相關(guān)不能真實地反映兩個變彌補了簡單相關(guān)不能真實地反映兩個變量間的相關(guān)關(guān)系。量間的相關(guān)關(guān)系。一級凈相關(guān)一級凈相關(guān)df = n-3第二節(jié)第二節(jié) 凈相關(guān)凈相關(guān)2232132313123 .1211rrrrrr2232122312132 .1311rrrrrr2132121312231 .2311rrrrrr第二節(jié)第二節(jié) 凈相關(guān)凈相關(guān)二級凈

19、相關(guān)二級凈相關(guān)df = n-422 .3422 .142 .342 .142 .1324.1311rrrrrr23 .2423 .143 .243 .143 .1234.1211rrrrrr22 .3422 .132 .342 .132 .1423.1411rrrrrr第二節(jié)第二節(jié) 凈相關(guān)凈相關(guān)最高級凈相關(guān)最高級凈相關(guān)df = n-m將將m個變量中的個變量中的m-2-2個變量固定,只研究另個變量固定,只研究另外兩個變量的相關(guān)外兩個變量的相關(guān)jjiiijijcccr.mmmmmmrrrrrrrrrR212222111211相關(guān)矩陣相關(guān)矩陣mmmmmmcccccccccRC2122221112111凈相關(guān)系數(shù)的顯著性檢驗凈相關(guān)系數(shù)的顯著性檢驗第二步:計算統(tǒng)計量計算統(tǒng)計量第一步:統(tǒng)計假設(shè)統(tǒng)計假設(shè) H H0 0: ijij. .0 0,H HA A: ijij. .00n為觀測數(shù)據(jù)組數(shù),為觀測數(shù)據(jù)組數(shù),m為相關(guān)變量總個數(shù)為相關(guān)變量總個數(shù)mnrrSrtijijrijrij2.1.凈相關(guān)系數(shù)的顯著性檢驗凈相關(guān)系數(shù)的顯著性檢驗第三步

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論