應(yīng)用多元分析期末復(fù)習(xí)練習(xí)題_第1頁(yè)
應(yīng)用多元分析期末復(fù)習(xí)練習(xí)題_第2頁(yè)
應(yīng)用多元分析期末復(fù)習(xí)練習(xí)題_第3頁(yè)
應(yīng)用多元分析期末復(fù)習(xí)練習(xí)題_第4頁(yè)
應(yīng)用多元分析期末復(fù)習(xí)練習(xí)題_第5頁(yè)
已閱讀5頁(yè),還剩15頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、多元復(fù)習(xí)1、多元統(tǒng)計(jì)分析是運(yùn)用數(shù)理統(tǒng)計(jì)方法來(lái)解決多指標(biāo)問(wèn)題的理論和方法。2、多元分析研究的是多個(gè)隨機(jī)變量及相關(guān)關(guān)系的統(tǒng)計(jì)總體。3、如果A與B是兩個(gè)PXP維的方陣,則AB與BA有完全相同的特征值。4、隨機(jī)向量X的協(xié)方差矩陣一定是非負(fù)定矩陣。5、若A為P階對(duì)稱矩陣,則存在正交矩陣T與對(duì)角矩陣A,則三者的關(guān)系有A=TA丁。6、設(shè)x是多元向量,服從正太分布即Xa為P維常熟向量,則其線性型aX服從一元正態(tài)分布,即a'xN(ary,7、方差相同的兩個(gè)隨機(jī)變量的差與和是不相關(guān)關(guān)系。8、協(xié)方差和相關(guān)系數(shù)是變量間離散程度的一種變量,并不能刻畫變量間可能存在的關(guān)聯(lián)程度的關(guān)系。9、變量的類型按尺度劃分為間隔

2、變量、有序變量、名義變量類型。10、公共因子方差與特殊因子方差之和為1。11、聚類分析是建立一種分析方法,它將一批樣品或變量按照它們?cè)谛再|(zhì)上的親疏關(guān)系進(jìn)行科學(xué)的分類。12、聚類分析是分析如何對(duì)樣品或變量進(jìn)行量化分析,通常分為Q型聚類和R型聚類。13、聚類分析中Q型聚類是對(duì)樣品進(jìn)行聚類,R型聚類是對(duì)變量進(jìn)行聚類。14、進(jìn)行判別分析時(shí),通常指定一種判別規(guī)則用來(lái)判定新樣品的歸屬,常見的判別準(zhǔn)則有:費(fèi)希爾判別準(zhǔn)則、貝葉斯判別準(zhǔn)則。15、費(fèi)希爾判別法就是要找P個(gè)變量組成的線性判別函數(shù)I使得各組內(nèi)點(diǎn)的離差盡可能接近,而不同組間的點(diǎn)盡可能疏遠(yuǎn)。16、當(dāng)X次則作一行工便口)服從卡方分布,即G-研產(chǎn)正陽(yáng)爐。17

3、、威爾克斯統(tǒng)計(jì)量表達(dá)式:A=喝。葉川18、霍特林統(tǒng)計(jì)量表達(dá)式:T2=冗(手一阿)5y(x-城。19、兩個(gè)變量間的平方馬氏距離:工,y=(x-y:)T-(x-y);總體的馬氏距離:d=ge=(k。20、方差相等的兩個(gè)隨機(jī)變量的關(guān)系:匕3(工二+工,如一工J二021、幾個(gè)變量間服從正態(tài)分布,各自獨(dú)立,樣品的均值向量服從正態(tài)分布。22、從代數(shù)觀點(diǎn)看主成分是P個(gè)原始相關(guān)變量的線性組合。23、變量共同度是指因子載荷矩陣中的第i行元素的平方和|。24、因子分析是指把每個(gè)原始變量分為兩部分因素,一部分是公共因子,另一部分是特殊因子。1、判別分析的目標(biāo)。答:判別分析的目標(biāo)有兩個(gè):一是根據(jù)已知所屬組的樣本給出判

4、別函數(shù),并制定判別規(guī)則,再依此判斷(或預(yù)測(cè))每一新樣品應(yīng)歸屬的組別。另一是用圖形法或代數(shù)法描述各組樣品之間的差異性,盡可能地分離開各組。2、費(fèi)希爾判別的基本思想、目的、主要方法有哪些?答:費(fèi)希爾判別的基本思想是投影(或降維),用幾個(gè)費(fèi)希爾判別函數(shù)或典型變量來(lái)代替P個(gè)原始變量,以達(dá)到降維的目的。并根據(jù)這r個(gè)判別函數(shù)對(duì)樣品的歸屬作出判別或?qū)⒏鹘M分離。各個(gè)判別函數(shù)都具有單位方差,且彼此不相關(guān)。判別函數(shù)的方向并不正交,而作圖時(shí)仍將它們畫成直角坐標(biāo)系,從直觀的幾何圖上進(jìn)行判別,區(qū)別各組,這是費(fèi)希爾判別的重要應(yīng)用。為作圖時(shí)的需要,通常取判別函數(shù)個(gè)數(shù)r=2或3。3、聚類分析與判別分析的區(qū)別與聯(lián)系。答:判別分

5、析和聚類分析都是研究事物分類(或組)的基本方法,但它們卻有著不同的分類目的,彼此之間既有本質(zhì)的區(qū)別又有一定的聯(lián)系。它們的本質(zhì)區(qū)別在于:在于判別分析中,組的數(shù)目是已知的,我們將樣品分配給事先已定義好的組(或類)之一;而聚類分析中,無(wú)論是類的數(shù)目還是類的本身在事先都是未知的。它們的聯(lián)系在于:如果組不是已有的,則對(duì)組的事先了解和形成有時(shí)可以通過(guò)聚類分析探索得到;還有,聚類分析的效果往往也可以通過(guò)由前兩個(gè)(或三個(gè))費(fèi)希爾判別函數(shù)得分產(chǎn)生的散點(diǎn)圖(或旋轉(zhuǎn)圖)從直覺(jué)上進(jìn)行評(píng)估。4、主成分的應(yīng)用分類。答:主成分的應(yīng)用可分為兩類:(1)在一些應(yīng)用中,這些主成分本身就是分析的目標(biāo),此時(shí)需要給(用來(lái)降維的)前幾個(gè)

6、只成分一個(gè)符合實(shí)際背景和意義的解釋,以明白其大致的含義。(2)在更多的另一些應(yīng)用中,主成分只是要達(dá)到目標(biāo)的一個(gè)中間結(jié)果(或步驟),而非目標(biāo)本身。5、主成分與原始變量間的關(guān)系。答(1)主成分保留了原始變量絕大多數(shù)信息。(2)主成分的個(gè)數(shù)遠(yuǎn)遠(yuǎn)少于原始變量的數(shù)目。(3)各個(gè)主成分之間互不相關(guān)。(4)每個(gè)主成分都是原始變量的線性組合。6、因子分析與主成分分析的區(qū)別與聯(lián)系。答:(1)主成分涉及的只是一般的變量變換,它不能作為一個(gè)模型來(lái)描述,本質(zhì)上幾乎不需要任何假定;而因子分析需要構(gòu)造一個(gè)因子模型,并伴隨有幾個(gè)關(guān)鍵性的假定。(2)主成分是原始變量的線性組合;而在因子分析中,原始變量是因子的線性組合,但因子

7、卻一般不能表示為原始變量的線性組合。(3)在主成分分析中,強(qiáng)調(diào)的是用少數(shù)幾個(gè)主成分解釋總方差;而因子分析中,強(qiáng)調(diào)的是用少數(shù)幾個(gè)因子去描述協(xié)方差或相關(guān)關(guān)系。(4)主成分的解釋是唯一的(除非含有相同的特征值或特征向量為相反符號(hào));而因子的解可以有很多,表現(xiàn)的比較靈活(主要體現(xiàn)在因子旋轉(zhuǎn)上)。這種靈活性使得變量在降維后更易得到解釋,這是因子分析比主成分分析更廣泛應(yīng)用的一個(gè)重要原因。(5)主成分不會(huì)因其提取個(gè)數(shù)的改變而變化,但因子分析往往會(huì)隨模型中因子個(gè)數(shù)的不同而變化。1、正交因子模型的不受單位的影響。一、.一、一*.證明:將x的單位做變化,通常是作一變換x=cx,這里的c=dia(gci,C2,.C

8、p),Ci>0,i=1,2,.p.于是*.一一.x=c-cAfc;._*-*令N=cN,A=cA,a=cw,則有:*.*_*x-Af;這個(gè)模型能滿足假定式的假定,即:中)=0*E(名)=0V(f)=I-*_*V(6)=Dcov(f,;)=cov(f,;)c=0一、*.*9*9其中D=diag(二1,二2,*2、*222,,.Op),ai=qDi,i=1,2,.p。因此,單位變換后新的模型仍為正交因子模型。2、正交因子模型的因子載荷是不唯一的。證明:設(shè)T為任意mxm正交矩陣,令A(yù)=AT,f=Tf,則模型x=N+Af+&能表示為x=R+Af+君。.*.因?yàn)椋篍(f)=TE(f)=0_

9、*._.V(f)=TV(f)T=TT=I_*.CoVf,a)=曰f,名)=TE(f,葭)=0'E(f)=0E(a)=0所以仍滿足條件:V(f)=I222、V(;)=D=diag(二1,二2,.:p)cov(f,;)=E(f,;)=0-_-_-_.-_._._.從工=V(Af)+V(s)=AVf)A+V(&=AA+D或x=N+Af+名都可以看出工也F-*可以分解為三=AAD顯然,因子載荷矩陣A不是唯一的。3、性質(zhì)(7)設(shè)XNp(N,工),工>0,則(xN)5(xN)x2(P)。證明:令y=工,xN),于是yNp(0,1)所以丫1。2,丫3.yp獨(dú)立同分布于n(0,1)所以由

10、卡方分布的定義知:12222,、(x-口)二(x-)=yy=yi».Np*(P)X=(兀1,兀2,兀3)'有密度2-2”試證x1x2,x3兩兩獨(dú)立但不,1_.、cf(XiX2,X3)一(11一sinx1sinx2sinx3),0<x1x2,x3<8二3一一0,其他互相獨(dú)立。qQqQ證明:3(x1)=f(x1x2,x3)dx2dx3二二二二,同理:f2(x2)f(x1,x2)3sinx1sinx2sinx3dx2dx31.tsin8二3x12sin10f3M)二MX-"x2dx237Tsinx3dx31-sinx1sinx2sin2二2二318二32x3)

11、dx32sinx1sinx2sinx3dx3同理:f(X1,X3)=從而f(X1,X2)=3(X12(X2),f(X1,X3)=3(X13(X3),f(X2,X3)=f2(X2)f3(X3),f(X1,X2,X3);f1(X1)f2(X2)f3(X3)所以X1,X2,x3兩兩獨(dú)立但不互相獨(dú)立。5、設(shè)P維隨機(jī)向量X的向量和協(xié)方差矩陣分別為科和匯,求證:(1) E(xx)-1(2) E(xAx)=Etr(xxA)l-tr(三A)A一.2.11(3)假設(shè)N=N1,工=仃I和A=I市-試禾ij用(2)的結(jié)果證明E(xAx)/cr2=tr(A)=p一1。證明:(1)工=V(x)=E(x-k)(x-N)=

12、E(xx-x1-x)=E(xx)-所以:E(xx)-1(2)E(xAx)=Etr(xAx)1=Etr(xxA)1=trE(xxA)1=trE(xx)A】=tr(二-)Al-tr(三A)tr(A)=tr(三A)JAJ(3)由(2)知E(xAx)=tr(ZA)+NA,A-1(I=2(1111112(P.所以:E(xAx)2CJ-2tr(三A)_tr(-TA)=tr(A)=tr(I1=tr(I)一gtr(11)=_1._1_P-tr(11)-P-P-P-1PP6、性質(zhì)(3)設(shè)XNP(出工),y=cx+h其中c為rxp維常數(shù)矩陣,b為r維常數(shù)向量則yNr(N+b,c工c)。證明:X任意aeRr,ay=

13、aCx+ab,因?yàn)閤是多元正態(tài)變量,而a'cx是x的一個(gè)線性函數(shù)從而由性質(zhì)(2)的必要性知:aCx是一元正態(tài)變量,所以ay是一元正態(tài)變量;再由性質(zhì)(2)的充分性知:y是一個(gè)r元正態(tài)變量,又由于E(y)=cE(x)+b=cN+bV(y)=cV(x)c=c三c因而:yNr(R十b,cic')7、設(shè)XNP(kI),a為P維常數(shù)向量,則ax-N(aV,aHa)。證明:因?yàn)閄Np(此工),a為P維常數(shù)向量,令y=ay,則有:E(y)=E(ax)=aE(x)=aV(y)=aV(x)a=a三a所以:axN(aU,aZa)8、設(shè)X4(N,工),這里x=仙工32P":2'則從2

14、Jl口仃1仃2仃2/x1-x2=(11)x服從一兀正態(tài)分布。證明:E(X1-X2)=(1,一1)1=匕一也<h2J1仃2丫1"人-1220102-2:二1二21,22_-、即乂1X2NX-2,;1二2-2r-2)300、9、設(shè)XN3(出工),其中工05-1則X2和X3不獨(dú)立,X1和(X2,X3)獨(dú)立。0-11<J證明:因?yàn)閂(X2,X3)00,所以乂2和乂3不獨(dú)立;因?yàn)閂X1,(X2,X3)=0,所以X1和(X2,X3)獨(dú)立。0要求用最短距離法進(jìn)行聚類,并畫出聚類樹形圖。20340一c,-11、已知初始距離D(dlj)4黑4=一11gX1X2120721810310544

15、55432、設(shè)抽取5個(gè)樣品,每個(gè)樣品觀察2個(gè)指標(biāo):X1:您每月大約喝多少啤酒;X2:您對(duì)“飲酒是人生的快樂(lè)這句話的看法如何?觀察數(shù)據(jù)如表所示:請(qǐng)用最短距離法進(jìn)行聚類,并畫出聚類樹形圖。超-1%:設(shè)由GN=i4q-£U8->)ado=口2-2。廣,/-2討6k”jGf7»藥+(,。-7)1肚土各4t-伶-7月土二10.2.cl/4/6,i2,oti4二W皆二氏£,丸4工,G,G>%4小Ga犯。S2衿o國(guó)卜J2中旬&oG5、為破6次囪JiG=0("夕,二m;c:Jg4G/6/§&4/061b&120必修藥環(huán)0G.

16、U忘的'3丁二加冷)d,3,G65rG,Gg(。7Ilfs;oG。團(tuán)搟3»及7g=>yunf令G67(0S*0V,心"43M=心圖>,ck)r=6、32dj二2把6%合并為G6J.J45&廣/&/2Jm=13、把q-Gz/#為彳7也卜產(chǎn)3.除"37|他G60臉為G®為、以力二產(chǎn)g)寺邑掰,日8泰繇為6f7q1一,1G3或辰弋_、k"03、例6.3.1設(shè)有五個(gè)樣品,每個(gè)只測(cè)量了一個(gè)指標(biāo),分別是1、2、6、8、11,使用最短距離法將它們分類。解:記G=1,G2=2,G3=6,G4=8,Gs=11,樣品間采用絕對(duì)值

17、距離。D(0)G1G2G3G4G5G10G210G3540G47620G5109530D(i)G6G3G4G5Gs0G340G4620G59530其中G6=GiUG2d(2)G6G7G5G60G740G5930其中G7=QUG4D(3)G6G8G60G840其中G6=GiUG24、為了研究遼寧省等5省區(qū)某年城鎮(zhèn)居民生活消費(fèi)的分布規(guī)律,根據(jù)調(diào)查資料做類型劃分省份x1X2X3X4X5X6X7X8遼寧7.9039.778.4912.9419.2711.052.0413.29浙江7.6850.3711.3513.3019.2514.592.7514.87河南9.4227.938.208.1416.17

18、9.421.559.76甘肅9.1627.989.019.3215.999.101.8211.35青海10.0628.6410.5210.0516.188.391.9610.81最短距離法樹形圖解:遼寧,G*浙江,G3T河南,G甘肅),G青海采用歐氏距離:=(7,9-7,68)2+(39.77-5037)2+(8.49-1135)-+(12.94-%3.3戶+(19.27-19.25尸+(11.05-14.59)耳(2.04-2,75)H13.29-14.87月。3=11.67/3=13,80114=13.12%產(chǎn)12.80rf23=24.634乂=24.0622354J34=2.235=3.

19、51rf45=2.2112345211.670313.8024.630河南與甘肅的距離最近,先將二者(3和4)合為一類q=Ga,GJ413,1224,06220012.8023.543.512.210一d6i=&3朋=mind3/i4=13.12%=仙)2-皿43小=24066D,=l.25河南、甘甫與青海并為一新類Gt=G6,Gs=Gi9G4,GRd6S=d(3,4)5=miii心心=2.216125013.12024.0611.6702.2112.8023.540”d7i=d(3,451=mindi3,di4,di5=128°由2=%,42=miud23,d24,d25=

20、23.54712Z>3=7012.800G8=G1,G?223.5411.670rf78=mintZ71,tZ72=12.8078Z)4=70812.80河南3甘肅4青海5遼寧1浙江25、例1對(duì)某地區(qū)農(nóng)村的6名2周歲男嬰的身高、胸圍、上半臂圍進(jìn)行測(cè)量得樣本數(shù)據(jù)如表1所示。根據(jù)以往資料該地區(qū)城市2歲男嬰的這三個(gè)指標(biāo)的均值由=(90,58,16),現(xiàn)欲在多元正態(tài)性假定下檢驗(yàn)該地區(qū)農(nóng)村男嬰是否與城市男嬰有相同的均值。這是假設(shè)檢驗(yàn)問(wèn)題:H。:戶如Hi:出表1某地區(qū)農(nóng)村男嬰的體格測(cè)量數(shù)據(jù)編號(hào)身高(cm)胸圍(cm)上半臂圍(cm)17860.616.527658.112.539263.214.54

21、8159.014.058160.815.568459.514.0解:'82.07X=60.2,X%=“511S1=23.13848-8.0、2.2,S1.54.3107-14.62108.946431.600=8.040、0.500-14.621059.7900-37.37608.0400.500、3.1721.3101.3101.900,8.9464'-37.376035.5936,T2=nX咕S,Xi=670.0741=420.445查表得Fo.o1(3,3)=29.5,于是35丁F*13,3=147.5故在顯著性水平“=0.01下,拒絕原假設(shè)Ho,即認(rèn)為農(nóng)村與城市的2周歲

22、男嬰上述三個(gè)指標(biāo)的均值有顯著差異(p=0.002)。1-206、例7.2.1設(shè)x=(xi,X2,X3)的協(xié)方差矩陣為2=-250<002其特征值為:4=5.83,力=2.00,為=0.17相應(yīng)的特征向量為:00.383、0'0.924、-0.924,t2=0,t3=0.38310.000,©000,若只取一個(gè)主成分,則貢獻(xiàn)率為:5.83/(5.83+2.00+0.17)=0.72875=72.875%yi及(丫1,丫2)對(duì)每個(gè)原始變量的貢獻(xiàn)率:i洛pS四)Ph.110.9250.8550.0000.855.一-0.9980.9960.0000.9963nnanEJ-JK

23、_=0.0004.n-t-r"?r-i1.000J1-J*1上LOGO"riTii.f可見,yi對(duì)第三個(gè)變量的貢獻(xiàn)率為零,這是因?yàn)閄3與Xi和X2都不相關(guān),在yi中未包含一點(diǎn)有關(guān)X3的信息,這時(shí)僅取一個(gè)主成分就顯得不夠了,故應(yīng)再取y2,此時(shí)累計(jì)貢獻(xiàn)率為(5.83+2.00)/8=97.875%(yi,y2)對(duì)每個(gè)變量Xi的貢獻(xiàn)率分別為Pi,2=85.5%,p2u,2=99.6%,21,2=100%都比較tWj°,16230'、7、例7.2.2設(shè)x=(Xi,X2,X3)的協(xié)方差矩陣為2=214304100,經(jīng)計(jì)算,2的特征值及特征向量為:入1=109.793,加=6.469,2=0.7380.3050.944t10.0410.120。951)<-0.308

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論