多維數據的數字特征及相關分析課件_第1頁
多維數據的數字特征及相關分析課件_第2頁
多維數據的數字特征及相關分析課件_第3頁
多維數據的數字特征及相關分析課件_第4頁
多維數據的數字特征及相關分析課件_第5頁
已閱讀5頁,還剩63頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

11.3多維數據的數字特征及相關分析基本內容均值協方差Pearson相關系數Spearman相關系數

p維總體均值向量協方差矩陣相關系數矩陣隨機向量的性質多維正態(tài)分布

觀測數據協方差

Pearson相關矩陣

Spearman相關矩陣proccorr過程實現1.3.1二維數據的數字特征及相關系數1.3.3多維數據的數字特征及相關矩陣1.3.2多維總體的數字特征、相關矩陣及多維正態(tài)分布11.3多維數據的數字特征及相關分析基本內容均值p維總體21.3多維數據的數字特征及相關分析均值協方差Pearson相關系數Spearman相關系數

1.3.1二維數據的數字特征及相關系數21.3多維數據的數字特征及相關分析均值1.3.1二維3復習:數據的分布直方圖、經驗分布函數、QQ圖、莖葉圖nnijiaxaxaaxa)()(11)1(0-3復習:數據的分布直方圖、經驗分布函數、QQ圖、莖葉圖nni4

一.二維總體的數字特征及相關系數

1.3.1二維數據的數字特征及相關系數4一.二維總體的數字特征及相關系數1.3.1二維數5

二維數字特征的性質當X與Y相互獨立時,(3)

(2)(1)1.3.1二維數據的數字特征及相關系數5二維數字特征的性質當X與Y相互獨立時,(3)(2)(16二.觀測數據協方差、相關系數、檢驗

——樣本協方差——樣本協方差矩陣——樣本均值——樣本方差1.3.1二維數據的數字特征及相關系數觀測矩陣—1.3.1二維數據的數字特征及相關系數總體(X,Y)T,樣本

6二.觀測數據協方差、相關系數、檢驗——樣本協方差——樣本7—Pearson相關系數—Pearson相關系數矩陣注:1.Pearson相關系數反映兩隨機變量線性相關強弱,散點圖見書圖1.11.

2.由Schwarz不等式知1.3.1二維數據的數字特征及相關系數二.觀測數據協方差、相關系數、檢驗

3.n充分大時,7—Pearson相關系數—Pearson相關系數矩陣注:18當(X,Y)T

為二維正態(tài)二維隨機變量相關性檢驗觀測數據

假設檢驗

統(tǒng)計量,認為|t|過大,拒絕假設,認為X與Y相關.檢驗p值

給定,當,拒絕H0.認為X與Y相關;否則,不相關.1.3.1二維數據的數字特征及相關系數二.觀測數據協方差、相關系數、檢驗

8當(X,Y)T為二維正態(tài)二維隨機變量相關性檢驗觀測數據91.秩統(tǒng)計量

三.Spearman相關系數秩統(tǒng)計量:

例觀測值-0.8,-3.1,1.1,-5.24.2如-0.8,-3.1,-0.8秩統(tǒng)計量

2,1,3或3,1,2記為2.51,2.5秩統(tǒng)計量規(guī)定:相同觀測值,秩統(tǒng)計量取排序的平均值。1.3.1二維數據的數字特征及相關系數91.秩統(tǒng)計量三.Spearman相關系數秩統(tǒng)計量:10注:當X,Y相關性較強,兩組秩統(tǒng)計量相關性也較強

2.Spearman相關系數秩統(tǒng)計量分別為

Spearman相關系數:

1.3.1二維數據的數字特征及相關系數10注:當X,Y相關性較強,兩組秩統(tǒng)計量相關性也較強2.S11基于Spearman相關系數的假設檢驗統(tǒng)計量檢驗P值1.3.1二維數據的數字特征及相關系數11基于Spearman相關系數的假設檢驗統(tǒng)計量檢驗P值112

四.SAS系統(tǒng)proccorr過程1.3.1二維數據的數字特征及相關系數12四.SAS系統(tǒng)proccorr過程1.3.1二維13

四.SAS系統(tǒng)proccorr過程解:程序dataexamp1_9;inputxy@@;cards;689716389270112568265931911210162123212031530375334622735221305584142292733217185537036287265740;run;proc

corrdata=examp1_9pearsonspearman

cov;/*方差描述性過程,輸出Pearson,Spearman相關矩陣,協方差陣*/run;1.3.1二維數據的數字特征及相關系數13四.SAS系統(tǒng)proccorr過程解:程序1.14例1.9結果輸出

CORR過程

2變量:xy

協方差矩陣S,自由度n-1=19xyx570.45007845.0789y7845.0789112404.2632

簡單統(tǒng)計量

變量N均值標準偏差中位數最小值最大值

x2033.8500023.8841027.000005.0000070.00000y20477.50000335.26745342.0000082.000001125

Spearman相關系數,N=20

當H0:Rho=0時,Prob>|r|xyx1.00000

=0.97366p<.0001y0.973661.00000<.0001

Pearson相關系數,N=20

當H0:Rho=0時,Prob>|r|xyx1.00000=0.97971

相關性顯著

p<.0001y0.979711<.00011.3.1二維數據的數字特征及相關系數14Spearman相關系數,N=2015結果分析:

(1)利用proccorr過程,得

(2)數據的Pearson相關系數(3)數據的Spearman相關系數

檢驗p值均

X與Y的相關性高度顯著.1.3.1二維數據的數字特征及相關系數15結果分析:(1)利用proccorr過程,得(2161.3多維數據的數字特征及相關分析觀測數據協方差

Pearson相關矩陣

Spearman相關矩陣proccorr過程實現1.3.2多維總體的數字特征、相關矩陣及多維正態(tài)分布161.3多維數據的數字特征及相關分析觀測數據協方差1.3171.3.2多維總體數字特征、相關矩陣及正態(tài)分布

一.p維總體的數字特征、相關系數矩陣分布函數p維總體

連續(xù)總體概率密度均值向量:總體協方差矩陣:171.3.2多維總體數字特征、相關矩陣及正態(tài)分布一.18總體相關矩陣:1.3.2多維總體數字特征、相關矩陣及正態(tài)分布18總體相關矩陣:1.3.2多維總體數字特征、相關矩陣及正19二.隨機向量的性質

(1)A—常量矩陣,常向量,則(2)B—常量矩陣1.3.2多維總體數字特征、相關矩陣及正態(tài)分布19二.隨機向量的性質(1)A—常20三.多維正態(tài)分布

1.二維正態(tài)分布及性質其中

1.3.2多維總體數字特征、相關矩陣及正態(tài)分布20三.多維正態(tài)分布1.二維正態(tài)分布及性質其中1.3.212.p維正態(tài)分布——p維正態(tài)分布,密度

—協方差陣—均值向量1.3.2多維總體數字特征、相關矩陣及正態(tài)分布212.p維正態(tài)分布——p維正態(tài)分布,密度—協方差陣—均22(1)線性組合為正態(tài)分布(2)分量為正態(tài)分布

(3)分量獨立不相關

3.多維正態(tài)分布性質1.3.2多維總體數字特征、相關矩陣及正態(tài)分布22(1)線性組合為正態(tài)分布(2)分量為正態(tài)分布(3)分量231.3多維數據的數字特征及相關分析觀測數據協方差

Pearson相關矩陣

Spearman相關矩陣proccorr過程實現1.3.3多維數據的數字特征及相關矩陣231.3多維數據的數字特征及相關分析觀測數據協方差1.324

一.樣本觀測數據的協方差、相關矩陣p維總體:

數據的協方差、方差均值向量樣本協方差矩陣——樣本觀測數據矩陣1.3.3多維數據的數字特征及相關分析24一.樣本觀測數據的協方差、相關矩陣p維總體:均值向量251.3.3多維數據的數字特征及相關分析Pearson相關系數矩陣Spearman相關系數矩陣251.3.3多維數據的數字特征及相關分析Pearson相26

注意:1.原數據的相關系數矩陣即為標準化數據協方差陣.

標準化數據矩陣:2.n充分大時,有

對Xj數據標準化,得標準化數據矩陣;每行為標準化后樣品觀測向量1.3.3多維數據的數字特征及相關分析26注意:1.原數據的相關系數矩陣即為標準化數據協方差27例1.10

測20個3個生理指標:體重(X1)、腰圍(X2)、脈搏(X3);3個訓練指標:引體向上(X4)、仰臥起坐(X5)、跳躍(X6)次數.數據見書表1.2:解:程序:

二.SAS系統(tǒng)proccorr過程data

exam1_10;inputx1-x6;cards;1913650516260156335415225731383368211043;proccorr

data=exam1_10covpearsonspearman;/*調用Corr過程,輸出協方差,Pearson,Spearman相關系數矩陣*/varx1-x6;run;1.3.3多維數據的數字特征及相關分析27例1.10測20個3個生理指標:體重(X1)、腰圍(X28(1)計算觀測數據均值向量、協方差陣、Pearson相關陣

CORR過程

6變量:

x1x2x3x4x5x6

簡單統(tǒng)計量

變量N均值標準偏差中位數最小值最大值

x120178.6000024.69051176.00000138.00000247.00000x22035.400003.2019735.0000031.0000046.00000x32056.100007.2103755.0000046.0000074.00000x4209.450005.2862811.500001.0000017.00000x520145.5500062.56658122.5000050.00000251.00000x62070.3000051.2774754.0000025.00000250.000001.3.3多維數據的數字特征及相關分析28(1)計算觀測數據均值向量、協方差陣、Pearson相29樣本協方差矩陣S

自由度

=19=樣本個數-1

x1x2x3x4x5x6x1

609.6210568.80000-65.11578-50.86316-761.71578-286.50526x2

68.80000010.252632-8.147368-9.347368-129.336842-31.442105x3-65.115789-8.14736851.9894745.742105101.52105312.915789x4

-50.863158-9.3473685.74210527.944737230.107895134.384211x5

-761.715789-129.33684101.521053230.1078953914.576322146.98421x6-286.505263-31.44210512.915789134.384212146.984212629.378951.3.3多維數據的數字特征及相關分析29樣本協方差矩陣S自由度=19=樣本個數-11.330Pearson相關系數矩陣R

Pearson相關系數,N=20

當H0:Rho=0時,Prob>|r|x1x2x3x4x5x6x11.00000=0.87024-0.36576-0.38969-0.49308-0.22630

相關性好

p12<.00010.11280.08940.02720.3374x20.870241.00000-0.35289-0.55223-0.64560-0.19150

<.00010.12700.01160.00210.4186x3-0.36576-0.352891.000000.150650.225040.034930.11280.12700.52610.34010.8838x4-0.38969-0.552230.150651.000000.695730.495760.08940.01160.52610.00070.0262x5-0.49308-0.645600.225040.695731.000000.669210.02720.00210.34010.00070.0013x6-0.22630-0.191500.034930.495760.669211.000000.33740.41860.88380.02620.00131.3.3多維數據的數字特征及相關分析30Pearson相關系數矩陣R1.3.3多維數據的數字特31

Spearman相關系數,N=20

當H0:Rho=0時,Prob>|r|

x1x2x3x4x5x6x11.000000.81423-0.37070-0.38020-0.57774-0.19902

<.00010.10760.09820.00760.4002x20.814231.00000-0.23770-0.54190-0.72473-0.19940<.00010.31290.01360.00030.3993

x3-0.37070-0.237701.000000.136620.179240.098410.10760.31290.56570.44960.6798x4-0.38020-0.541900.136621.000000.656200.322630.09820.01360.56570.00170.1653x5-0.57774-0.724730.179240.656201.000000.695210.00760.00030.44960.00170.0007

x6-0.19902-0.199400.098410.322630.695211.000000.40020.39930.67980.16530.0007(2)Spearman相關矩陣1.3.3多維數據的數字特征及相關分析3132由Pearson相關系數矩陣輸出結果,取顯著水平,則(3)分析各指標間的相關性檢驗值均滿足p>0.1,接受原假設,認為各相應隨機變量對相關性很小,認為0.類似,Pearsman相關系數矩陣的下列檢驗值p>0.11.3.3多維數據的數字特征及相關分析32由Pearson相關系數矩陣輸出結果,取顯著水平333334概念總結(紙質作業(yè)):1.一位數據的數字特征哪些?寫出公式,說明作用.2.說出數據的幾種圖形表示法,正態(tài)性的檢驗方法(統(tǒng)計量、檢驗p值、判斷).3.寫出多維數據的數字特征、多維總體的數字特征及性質、多維正態(tài)分布密度.

作業(yè)1.51.634概念總結(紙質作業(yè)):作業(yè)1.51.6351.3多維數據的數字特征及相關分析基本內容均值協方差Pearson相關系數Spearman相關系數

p維總體均值向量協方差矩陣相關系數矩陣隨機向量的性質多維正態(tài)分布

觀測數據協方差

Pearson相關矩陣

Spearman相關矩陣proccorr過程實現1.3.1二維數據的數字特征及相關系數1.3.3多維數據的數字特征及相關矩陣1.3.2多維總體的數字特征、相關矩陣及多維正態(tài)分布11.3多維數據的數字特征及相關分析基本內容均值p維總體361.3多維數據的數字特征及相關分析均值協方差Pearson相關系數Spearman相關系數

1.3.1二維數據的數字特征及相關系數21.3多維數據的數字特征及相關分析均值1.3.1二維37復習:數據的分布直方圖、經驗分布函數、QQ圖、莖葉圖nnijiaxaxaaxa)()(11)1(0-3復習:數據的分布直方圖、經驗分布函數、QQ圖、莖葉圖nni38

一.二維總體的數字特征及相關系數

1.3.1二維數據的數字特征及相關系數4一.二維總體的數字特征及相關系數1.3.1二維數39

二維數字特征的性質當X與Y相互獨立時,(3)

(2)(1)1.3.1二維數據的數字特征及相關系數5二維數字特征的性質當X與Y相互獨立時,(3)(2)(140二.觀測數據協方差、相關系數、檢驗

——樣本協方差——樣本協方差矩陣——樣本均值——樣本方差1.3.1二維數據的數字特征及相關系數觀測矩陣—1.3.1二維數據的數字特征及相關系數總體(X,Y)T,樣本

6二.觀測數據協方差、相關系數、檢驗——樣本協方差——樣本41—Pearson相關系數—Pearson相關系數矩陣注:1.Pearson相關系數反映兩隨機變量線性相關強弱,散點圖見書圖1.11.

2.由Schwarz不等式知1.3.1二維數據的數字特征及相關系數二.觀測數據協方差、相關系數、檢驗

3.n充分大時,7—Pearson相關系數—Pearson相關系數矩陣注:142當(X,Y)T

為二維正態(tài)二維隨機變量相關性檢驗觀測數據

假設檢驗

統(tǒng)計量,認為|t|過大,拒絕假設,認為X與Y相關.檢驗p值

給定,當,拒絕H0.認為X與Y相關;否則,不相關.1.3.1二維數據的數字特征及相關系數二.觀測數據協方差、相關系數、檢驗

8當(X,Y)T為二維正態(tài)二維隨機變量相關性檢驗觀測數據431.秩統(tǒng)計量

三.Spearman相關系數秩統(tǒng)計量:

例觀測值-0.8,-3.1,1.1,-5.24.2如-0.8,-3.1,-0.8秩統(tǒng)計量

2,1,3或3,1,2記為2.51,2.5秩統(tǒng)計量規(guī)定:相同觀測值,秩統(tǒng)計量取排序的平均值。1.3.1二維數據的數字特征及相關系數91.秩統(tǒng)計量三.Spearman相關系數秩統(tǒng)計量:44注:當X,Y相關性較強,兩組秩統(tǒng)計量相關性也較強

2.Spearman相關系數秩統(tǒng)計量分別為

Spearman相關系數:

1.3.1二維數據的數字特征及相關系數10注:當X,Y相關性較強,兩組秩統(tǒng)計量相關性也較強2.S45基于Spearman相關系數的假設檢驗統(tǒng)計量檢驗P值1.3.1二維數據的數字特征及相關系數11基于Spearman相關系數的假設檢驗統(tǒng)計量檢驗P值146

四.SAS系統(tǒng)proccorr過程1.3.1二維數據的數字特征及相關系數12四.SAS系統(tǒng)proccorr過程1.3.1二維47

四.SAS系統(tǒng)proccorr過程解:程序dataexamp1_9;inputxy@@;cards;689716389270112568265931911210162123212031530375334622735221305584142292733217185537036287265740;run;proc

corrdata=examp1_9pearsonspearman

cov;/*方差描述性過程,輸出Pearson,Spearman相關矩陣,協方差陣*/run;1.3.1二維數據的數字特征及相關系數13四.SAS系統(tǒng)proccorr過程解:程序1.48例1.9結果輸出

CORR過程

2變量:xy

協方差矩陣S,自由度n-1=19xyx570.45007845.0789y7845.0789112404.2632

簡單統(tǒng)計量

變量N均值標準偏差中位數最小值最大值

x2033.8500023.8841027.000005.0000070.00000y20477.50000335.26745342.0000082.000001125

Spearman相關系數,N=20

當H0:Rho=0時,Prob>|r|xyx1.00000

=0.97366p<.0001y0.973661.00000<.0001

Pearson相關系數,N=20

當H0:Rho=0時,Prob>|r|xyx1.00000=0.97971

相關性顯著

p<.0001y0.979711<.00011.3.1二維數據的數字特征及相關系數14Spearman相關系數,N=2049結果分析:

(1)利用proccorr過程,得

(2)數據的Pearson相關系數(3)數據的Spearman相關系數

檢驗p值均

X與Y的相關性高度顯著.1.3.1二維數據的數字特征及相關系數15結果分析:(1)利用proccorr過程,得(2501.3多維數據的數字特征及相關分析觀測數據協方差

Pearson相關矩陣

Spearman相關矩陣proccorr過程實現1.3.2多維總體的數字特征、相關矩陣及多維正態(tài)分布161.3多維數據的數字特征及相關分析觀測數據協方差1.3511.3.2多維總體數字特征、相關矩陣及正態(tài)分布

一.p維總體的數字特征、相關系數矩陣分布函數p維總體

連續(xù)總體概率密度均值向量:總體協方差矩陣:171.3.2多維總體數字特征、相關矩陣及正態(tài)分布一.52總體相關矩陣:1.3.2多維總體數字特征、相關矩陣及正態(tài)分布18總體相關矩陣:1.3.2多維總體數字特征、相關矩陣及正53二.隨機向量的性質

(1)A—常量矩陣,常向量,則(2)B—常量矩陣1.3.2多維總體數字特征、相關矩陣及正態(tài)分布19二.隨機向量的性質(1)A—常54三.多維正態(tài)分布

1.二維正態(tài)分布及性質其中

1.3.2多維總體數字特征、相關矩陣及正態(tài)分布20三.多維正態(tài)分布1.二維正態(tài)分布及性質其中1.3.552.p維正態(tài)分布——p維正態(tài)分布,密度

—協方差陣—均值向量1.3.2多維總體數字特征、相關矩陣及正態(tài)分布212.p維正態(tài)分布——p維正態(tài)分布,密度—協方差陣—均56(1)線性組合為正態(tài)分布(2)分量為正態(tài)分布

(3)分量獨立不相關

3.多維正態(tài)分布性質1.3.2多維總體數字特征、相關矩陣及正態(tài)分布22(1)線性組合為正態(tài)分布(2)分量為正態(tài)分布(3)分量571.3多維數據的數字特征及相關分析觀測數據協方差

Pearson相關矩陣

Spearman相關矩陣proccorr過程實現1.3.3多維數據的數字特征及相關矩陣231.3多維數據的數字特征及相關分析觀測數據協方差1.358

一.樣本觀測數據的協方差、相關矩陣p維總體:

數據的協方差、方差均值向量樣本協方差矩陣——樣本觀測數據矩陣1.3.3多維數據的數字特征及相關分析24一.樣本觀測數據的協方差、相關矩陣p維總體:均值向量591.3.3多維數據的數字特征及相關分析Pearson相關系數矩陣Spearman相關系數矩陣251.3.3多維數據的數字特征及相關分析Pearson相60

注意:1.原數據的相關系數矩陣即為標準化數據協方差陣.

標準化數據矩陣:2.n充分大時,有

對Xj數據標準化,得標準化數據矩陣;每行為標準化后樣品觀測向量1.3.3多維數據的數字特征及相關分析26注意:1.原數據的相關系數矩陣即為標準化數據協方差61例1.10

測20個3個生理指標:體重(X1)、腰圍(X2)、脈搏(X3);3個訓練指標:引體向上(X4)、仰臥起坐(X5)、跳躍(X6)次數.數據見書表1.2:解:程序:

二.SAS系統(tǒng)proccorr過程data

exam1_10;inputx1-x6;cards;1913650516260156335415225731383368211043;proccorr

data=exam1_10covpearsonspearman;/*調用Corr過程,輸出協方差,Pearson,Spearman相關系數矩陣*/varx1-x6;run;1.3.3多維數據的數字特征及相關分析27例1.10測20個3個生理指標:體重(X1)、腰圍(X62(1)計算觀測數據均值向量、協方差陣、Pearson相關陣

CORR過程

6變量:

x1x2x3x4x5x6

簡單統(tǒng)計量

變量N均值標準偏差中位數最小值最大值

x120178.6000024.69051176.00000138.00000247.00000x22035.400003.2019735.0000031.0000046.00000x32056.100007.2103755.0000046.0000074.00000x4209.450005.2862811.500001.0000017.00000x520145.5500062.56658122.5000050.00000251.00000x62070.3000051.2774754.0000025.00000250.000001.3.3多維數據的數字特征及相關分析28(1)計算觀測數據均值向量、協方差陣、Pearson相63樣本協方差矩陣S

自由度

=19=樣本個數-1

x1x2x3x4x5x6x1

609.6210568.80000-65.11578-50.86316-761.71578-286.50526x2

68.80000010.252632-8.147368-9.347368-129.336842-31.442105x3-65.115789-8.14736851.9894745.742105101.52105312.915789x4

-50.863158-9.3473685.74210527.944737230.107895134.384211x5

-761.715789-129.33684101.521053230.1078953914.576322146.98421x6-286.505263-31.44210512.915789134.384212146.984212629.378951.3.3多維數據的數字特征及相關分析29樣本協方差矩陣S自由度=19=樣本個數-11.364Pearson相關系數矩陣R

Pearson相關系數,N=20

當H0:Rho=0時,Prob>|r|x1x2x3x4x5x6x11.00000=0.87024-0.36576-0.38969-0.49308-0.22630

相關性好

p12<.00010.11280.08940.02720.3374x20.870241.00000-0.35289-0.55223-0.64560-0.19150

<.00010.12700.01160.00210.4186x3-0.36576-0.352891.000000.150650.225040.034930.11280.12700.52610.34010.8838x4-0.38969-0.552230.150651.000000.695730.495760.08940.01160.52610.00070.0262x5-0.49308-0.645600.225040.695731.000000.669210.02720.00210.34010.00070.0013x6-0.22630-0.191500.034

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論