




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、精品文檔多元統(tǒng)計(jì)分析題型一定義、名詞解釋題型二 計(jì)算(協(xié)方差陣、模糊矩陣)題型三解答題一、定義§ 1隨機(jī)向量及其分布一隨機(jī)向量的聯(lián)合分布設(shè)占丿冬.兀是定義在樣本空間O上的左個(gè)隨機(jī)變量,則稱 .丿是”維隨機(jī)向量(或q維隨機(jī)變量).&元函數(shù)尸(可勺*,.1)=尸石§益巧£ .虧稱為夕維隨機(jī)向量(石,石,,® 的聯(lián)合分布函數(shù).如果存在非負(fù)可積函數(shù)/(心“使得尸(片.勺,.邙=J J "J、甘擊謚叫小'則稱維連續(xù)型隨機(jī)向量.稱/(斗心書)為 (石石,可的聯(lián)合分布密度.§ 2 隨機(jī)向量的數(shù)字特征一、隨機(jī)向量的數(shù)學(xué)期望(均值)定義
2、1設(shè)才=(兀衛(wèi)宀/丿,若2,護(hù)存在, 則稱£了 = (£1;.y為jt=(石兀,心y的數(shù)學(xué)期望(向量人設(shè)t=(心)吟,稱為隨機(jī)矩陣,稱zr=(zi;)為隨機(jī)矩陣x 的數(shù)學(xué)期望(矩陣).二、邊緣分布稱護(hù)維隨機(jī)向量(占爲(wèi)的分量構(gòu)成的子向量的概率分 布為(兀兀,引的邊緣分布+設(shè)月維隨機(jī)向量兀芯;y的分布函數(shù)為尺心心 宀),則 關(guān)于遲的邊緣分布函數(shù)為F&X)=鬥石 M Xj-網(wǎng)+00,+c0hXp+a0< +<10)t設(shè)尹維連續(xù)型隨機(jī)向量;y的聯(lián)合分布密度為/(.rp.r2,則關(guān)于£的邊緣分布密度為力(再)=J VJy兀-"弓加,號(hào))心心一!
3、心+1%四r協(xié)方差矩陣的性質(zhì)設(shè)”廠為隨機(jī)向島 / 占為常數(shù)矩陣,則 性質(zhì) 1 C4X.BlyA rbj<-K. J)夕,ffc質(zhì)2£也門=#0 “門/五、協(xié)方差矩陣N的代數(shù)性質(zhì)記 s=2zr,1+三為非負(fù)定矩陣,即對(duì)Vae,有疣芒GAO*記號(hào):若瓦為非負(fù)定矩陣,則記作三乏0,若工為正定矩陣,貝I記作L>0,數(shù)學(xué)期望的性質(zhì)設(shè),尸為師機(jī)矩陣“用為常數(shù)矩陣,則性質(zhì) 1EY) = AKV,性質(zhì) 2 E4XB) = A EX B.性質(zhì) 3=+三. 協(xié)方差矩陣定義2設(shè)*=(占J.兀兒鼻(幾5辺幾若CoAXy 7 = 1, 2,,p, y=L 2.,"存在,則稱«鞏
4、:門=EX-EXY-Eiy為隨機(jī)向量才與尸的協(xié)方差矩陣.當(dāng)C心:門=0時(shí),稱隨機(jī)向量與F不相關(guān).稱CM工-門二©心;.:)* = "為隨機(jī)向-!的協(xié)方差矩陣*顯然,協(xié)方差矩陣是一個(gè)對(duì)稱矩陣*稱用=(q)加為隨機(jī)向量才的相關(guān)陣.由和關(guān)系數(shù)的概念顯然有町m計(jì)CL 2、.p. 最矩距禽法(N Barest iieislibar)考慮m個(gè)樣本構(gòu)成的距離距陣,定義G與q之間的距離為兩糞最近樣品的距離,即2X = min dit.(3-3-29)u耳2血u現(xiàn)在設(shè)G*與気合并為一個(gè)新類記為©,則任意一類G&與務(wù)的距離為= min( min diir min xrx,ex
5、D y盂邑咼u毎專)=血11(50腳).(3-3-30)2”若藝為止定矩陣,則有下述等價(jià)結(jié)論,(1) 2>0 0 3非奇異方陣厶使ZZ(2) L>0c=>3正交矩陣T,使工廠二加賓人."乙). 其中,人>0二12/為瓦的全部特征根.(3) 三> 0 o E的任一主子式均大于零.(4) I > 0 « Va e 嚴(yán)廠有orcz >0 > I .aa = 0o ct = 0 (5) Z>0<=> 0存在且0 ao.§ 3多元總體一、多元總體設(shè)觀測(cè)指標(biāo)為耳衛(wèi).則幾兀;.構(gòu)成一個(gè)左維隨機(jī) 向屋=(耳心丿;兒
6、朮的一切可能取值的全體就構(gòu)成了護(hù)元總 體,仍記作p維隨機(jī)向M丄的概率分布即為所對(duì)應(yīng)總體的概率分布,r 的數(shù)字特征也即為所對(duì)應(yīng)總體的數(shù)字特征.二、樣本觀測(cè)陣設(shè)對(duì)元總體片兀J進(jìn)行了沖次觀測(cè),記為第/次的艦測(cè)結(jié)果(41. 2,;劃,何次的觀測(cè)結(jié)果稱為一個(gè)樣品”如果為也血滿足:(1總申紂必初相互獨(dú)立;(2 )每個(gè)占。均與總體f具有和同的概率分布稱心血兀)為來(lái)自總體的,個(gè)容量為期的簡(jiǎn)單隨機(jī)樣本,仍簡(jiǎn)稱為樣本-稱樣木觀測(cè)值的全體構(gòu)成的矩陣6rV?2”兀|為樣本觀測(cè)陣(資料陣人三、樣本數(shù)7特征1樣木均值(向就)I #記 =-ZV,稱丘=(耳忑.忑y為樣本均值向量./-IH -L '記 切=乞g -兀
7、)( -兀),稱£=為樣本離差陣*3 *樣本協(xié)差陣稱宀齊(士 /沖樣木協(xié)弟陣-4. 樣木相關(guān)陣(ji* 稱R )嚴(yán)尸為樣-本和JJ'i ”宗立1若D的概率密壓胡數(shù)為:則稱乂=罔,屯廠昇卩遵從P元正態(tài)分布,也稱陽(yáng)P元正 態(tài)變量。記為X弘(吩)I工I為協(xié)差陣卩的行列式。一般的止態(tài)分布設(shè)隨機(jī)向量耗=(心兀,卡科具的幣度函數(shù)為/(斗忌沖=(帀5絹耳曲_*(丸一旳£|(丸一妙】 JW< <+«共中* =(軋兀,,£丫的均值為E(x) = (y4Z4,“,丫 協(xié)方差為3 A)2Z=E g “心-“)(齊“X 耳 一“I)3 “X形Z4) (可Pl
8、X幵“J (七一“尸 g貝”已、«Ag “心一弘)©廠糾$精品文檔(考察和個(gè)指標(biāo),均值向量為4 = ( 0 “稱5£=(幾兀、,叫了服從均值為E(X)*協(xié)方差為H的止態(tài)分布。曰J星巨:設(shè)總為加維總體桶* ,協(xié)方差陣為 = ( afJ)r則樣品X=(工”勺,齊”'與總體(7的馬氏距離定義為/ (X, G) = (X - “丫匸' (X - Q%=iHt, d2G)=“二")丫二")=(yF bb二名詞解釋1、多元統(tǒng)計(jì)分析:多元統(tǒng)計(jì)分析是運(yùn)用數(shù)理統(tǒng)計(jì)的方法來(lái)研究多變量(多指標(biāo))問(wèn)題的理 論和方法,是一元統(tǒng)計(jì)學(xué)的推廣 2、聚類分析:是
9、根據(jù)“物以類聚”的道理,對(duì)樣品或指標(biāo)進(jìn)行分類的一種多元統(tǒng)計(jì)分析方 法。將個(gè)體或?qū)ο蠓诸?,使得同一類中的?duì)象之間的相似性比與其他類的對(duì)象的相似性更強(qiáng)。 使類內(nèi)對(duì)象的同質(zhì)性最大化和類間對(duì)象的異質(zhì)性最大化3、隨機(jī)變量:是指變量的值無(wú)法預(yù)先確定僅以一定的可能性(概率)取值的量。它是由于隨機(jī)而獲得的非確定值,是概率中的一個(gè)基本概念。即每個(gè)分量都是隨機(jī)變量的向量為隨機(jī)向 量。類似地,所有元素都是隨機(jī)變量的矩陣稱為隨機(jī)矩陣。4、統(tǒng)計(jì)量:多元統(tǒng)計(jì)研究的是多指標(biāo)問(wèn)題 ,為了了解總體的特征,通過(guò)對(duì)總體抽樣得到代表 總體的樣本,但因?yàn)樾畔⑹欠稚⒃诿總€(gè)樣本上的 ,就需要對(duì)樣本進(jìn)行加工,把樣本的信息濃縮 到不包含未知量
10、的樣本函數(shù)中,這個(gè)函數(shù)稱為統(tǒng)計(jì)量二、計(jì)算題16 2、k 設(shè)X其中=紂尼=-44-1I2試判斷可+ 2屯與花一® 是否獨(dú)立?,、jo 1 -1AM6 -42 Y°:JI 加:d:解:-ro2丿"10-6 -IS-6 16-162040按用片的聯(lián)合分帚再I-16-6lti20-1G20 )故不獨(dú)立口2、答:2、假設(shè)檢驗(yàn)問(wèn)題匸H.、# =險(xiǎn)片陋r-8.o>經(jīng)計(jì)算可得;X-= 2 2、-1的(3107-14.6210ST1=(23J3848)-1 -14.62103.1728 9464-37 37608.9464、-37.376035 5936 j構(gòu)造檢驗(yàn)統(tǒng)計(jì)量:尸
11、=旳(壬-畑)丿(巫-坯)= 6x70.0741=420.445由題目已知熱“(3,) = 295由是di = W3,3)147.5所以在顯著性水平=0.01下,拒絕原設(shè)盡 即認(rèn)為農(nóng)村和城市的2周歲男嚶上述三個(gè) 指標(biāo)的均值有顯著性差異2、對(duì)某地區(qū)農(nóng)村的石名2周旨男翌的身高、胸圉、上半骨圉進(jìn)行測(cè)雖, 得相關(guān)救據(jù)如下根據(jù)以往資料,該地區(qū)城市2周歲男嬰的這三個(gè)指標(biāo)的 均值=(刃現(xiàn)欲在多元正態(tài)性的假定下檢驗(yàn)該地區(qū)農(nóng)村男娶是 否與城市男嬰有相同的均值.務(wù) 2.0廣 43107-14.62108.9461 >丼中乂=60.2=(115.6924)-1-14.62103.172-37 3760、8.9
12、464-37 376035.5936(a = 0.01, oi C,2) = 99.2, Oi 03) =293 屜G4) =16.7)答:4、設(shè)盂=(耳兀.禹,耳)頸(0迄),協(xié)方差陣藝=PP<P(1) 試從匸出發(fā)求X的第一總體主成分'(2)試1可當(dāng)Q取”時(shí)才能4由主成分的貢蕭率達(dá)站加以上.A1一 QP -P-PA 1-P P-P-PA 1 p-PP-p 21=0得特征根*=l + 3p,懈心斯次寸應(yīng)的方程一°-p< -p-p -pA1x?p 人一1,0< p<l-p Y 羽)得灑對(duì)應(yīng)的單位特征向量為g 1故得第-主成分撲"討冷禺+*血(2
13、)第一亍主成分的貢獻(xiàn)率為= ?12>95%雄+4“層+兒4 0 95x4-1得心乏2t_L2fe 0.9333題型三解答題1、簡(jiǎn)述多元統(tǒng)計(jì)分析中協(xié)差陣檢驗(yàn)的步驟答:第一,提出待檢驗(yàn)的假設(shè)和H1;第二,給出檢驗(yàn)的統(tǒng)計(jì)量及其服從的分布;第三,給定檢驗(yàn)水平,查統(tǒng)計(jì)量的分布表,確定相應(yīng)的臨界值,從而得到否定域;第四,根據(jù)樣本觀測(cè)值計(jì)算出統(tǒng)計(jì)量的值,看是否落入否定域中, 以便對(duì)待判假設(shè)做出決策(拒絕或接受)。2、簡(jiǎn)述一下聚類分析的思想答:聚類分析的基本思想, 是根據(jù)一批樣品的多個(gè)觀測(cè)指標(biāo),具體地找出一些能夠度量樣品或指標(biāo)之間相似程度的統(tǒng)計(jì)量,然后利用統(tǒng)計(jì)量將樣品或指標(biāo)進(jìn)行歸類。把相似的樣品或指標(biāo)歸
14、為一類,把不相似的歸為其他類。直到把所有的樣品(或指標(biāo))聚合完畢3、多元統(tǒng)計(jì)分析的內(nèi)容和方法答:1、簡(jiǎn)化數(shù)據(jù)結(jié)構(gòu),將具有錯(cuò)綜復(fù)雜關(guān)系的多個(gè)變量綜合成數(shù)量較少且互不相關(guān)的變量,使研究問(wèn)題得到簡(jiǎn)化但損失的信息又不太多。(1)主成分分析(2)因子分析(3)對(duì)應(yīng)分析等2、分類與判別,對(duì)所考察的變量按相似程度進(jìn)行分類。 (1)聚類分析:根據(jù)分析樣本的各研 究變量,將性質(zhì)相似的樣本歸為一類的方法。 (2)判別分析:判別樣本應(yīng)屬何種類型的統(tǒng)計(jì) 方法。4、系統(tǒng)聚類法基本原理和步驟答:1)先計(jì)算n個(gè)樣本兩兩間的距離2)構(gòu)造n個(gè)類,每個(gè)類只包含一個(gè)樣本3)合并距離最近的兩類為一新類4)計(jì)算新類與當(dāng)前各類的距離5)
15、類的個(gè)數(shù)是否等于 1,如果不等于回到 3在做6)畫出聚類圖7)決定分類個(gè)數(shù)和類5、聚類分析的類型有:答:(1)對(duì)樣本分類,稱為 Q型聚類分析(2)對(duì)變量分類,稱為 R型聚類分析# Q 型聚類是對(duì)樣本進(jìn)行聚類,它使具有相似性特征的樣本聚集在一起,使差異性大的樣本分離開來(lái)。#R型聚類是對(duì)變量進(jìn)行聚類,它使具有相似性的變量聚集在一起,差異性大的變量分離開來(lái),可在相似變量中選擇少數(shù)具有代表性 的變量參與其他分析,實(shí)現(xiàn)減少變量個(gè)數(shù),達(dá)到變量降維的目的。6、簡(jiǎn)述歐氏距離與馬氏距離的區(qū)別和聯(lián)系。4a簡(jiǎn)述歐氏距離與馬氏距離的區(qū)別和聯(lián)系.答I設(shè)p錐空I司RP中的兩點(diǎn)X=(XpX2" Xp);和Y= Y
16、rY2- Yp ; D則歐氏距禽次 二綣-丫孑.歐氏距離的局限有在多元數(shù)據(jù)分忻中,其度重不合理-會(huì)受到煩旬題 中曇岡的斃響°設(shè)2,¥是來(lái)自均值向壘為|d,協(xié)方差為遲的總體G中的卩維樣本.則馬氏K巨離為 1 1DUT)= X-Y Z X-Y n 當(dāng)忑 =【即單位陣時(shí),肌瓦 T)=X Y' XY=満一 Yd鉀歐氏距離.因此,在一宦程度上,歐氏E巨離是馬氏距離的特殊情況.馬氏距離是歐氏距離的推廠.7、試述系統(tǒng)聚類的基本思想。答:系統(tǒng)聚類的基本思想是:距離相近的樣品(或變量)先聚成類,距離相遠(yuǎn)的后聚成類, 過(guò)程一直進(jìn)行下去,每個(gè)樣品(或變量)總能聚到合適的類中。8對(duì)樣品和變
17、量進(jìn)行聚類分析時(shí)所構(gòu)造的統(tǒng)計(jì)量分別是什么?簡(jiǎn)要說(shuō)明為什么這樣構(gòu)造?答:對(duì)樣品進(jìn)行聚類分析時(shí),用距離來(lái)測(cè)定樣品之間的相似程度。因?yàn)槲覀儼裯個(gè)樣本看作p維空間的n個(gè)點(diǎn)。點(diǎn)之間的距離即可代表樣品間的相似度。常用的距離為(-)明氏距琢"3 =血-心嚴(yán)q取不同值,分箱彈(1)絕時(shí)距離(«-巧=X 比e -産/(2)歐氏距離【"巧(3)切比雪夫距離£彳=3 )磯d =出警|*童一1» 兀()馬氏距離八 P C疋4 “広“(二)蘭氏距離咼曲)=(卷-XJ)X_1(X1 -xp對(duì)變壘的相似性,我們更多地妾了解變堡的變化趨勢(shì)或變化方向,因此用相關(guān)性進(jìn)行衛(wèi)璽
18、76;將變堡看作P維空間的向量,一般用(-)相關(guān)系魏9、在進(jìn)行系統(tǒng)聚類時(shí),選擇距離公式應(yīng)遵循哪些原則?如歐氏距離就有非常明確的答:(1)要考慮所選擇的距離公式在實(shí)際應(yīng)用中有明確的意義。 空間距離概念。馬氏距離有消除量綱影響的作用。(2 )要綜合考慮對(duì)樣本觀測(cè)數(shù)據(jù)的預(yù)處理和將要采用的聚類分析方法。如在進(jìn)行聚類分析 之前已經(jīng)對(duì)變量作了標(biāo)準(zhǔn)化處理,則通常就可采用歐氏距離。(3) 要考慮研究對(duì)象的特點(diǎn)和計(jì)算量的大小。樣品間距離公式的選擇是一個(gè)比較復(fù)雜且?guī)в幸欢ㄖ饔^性的問(wèn)題, 我們應(yīng)根據(jù)研究對(duì)象的特點(diǎn)不同做出具體分折。 實(shí)際中,聚類分析前 不妨試探性地多選擇幾個(gè)距離公式分別進(jìn)行聚類,然后對(duì)聚類分析的結(jié)果進(jìn)行對(duì)比分析, 以確定最合適的距離測(cè)度方法。10、歐式距離的優(yōu)點(diǎn)缺點(diǎn) 答:歐式距離(Euclid距離)n個(gè)分量不相關(guān),且具有相當(dāng)?shù)姆?此時(shí)使用歐式距離才合適,且因此需要對(duì)坐標(biāo)加權(quán),化為統(tǒng)優(yōu)點(diǎn):幾何意義明確,簡(jiǎn)單,容易掌握,由于中學(xué)數(shù)學(xué)就已初步接觸,數(shù)學(xué)知識(shí)不多的人也 可以把握它
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 監(jiān)理工作方案
- 醫(yī)療事故撤銷協(xié)議書范本
- 富士智能機(jī)電實(shí)踐心得體會(huì)
- 倉(cāng)庫(kù)招商方案
- 地下倉(cāng)房規(guī)劃方案(3篇)
- 初中暑假.實(shí)踐報(bào)告范文3篇
- 廣告立牌制作方案
- 新屋布置設(shè)計(jì)方案
- 大班健康人的呼吸
- 柴油業(yè)務(wù)對(duì)接方案
- 數(shù)字化管理師復(fù)習(xí)測(cè)試卷附答案
- 甘肅省安全員《B證》考試題庫(kù)及答案
- 數(shù)據(jù)結(jié)構(gòu)C語(yǔ)言版(第2版)嚴(yán)蔚敏人民郵電出版社課后習(xí)題答案
- 消費(fèi)者需求導(dǎo)向的改裝車品牌建設(shè)-洞察分析
- 教育培訓(xùn)機(jī)構(gòu)傭金分配方法
- 《建設(shè)工程監(jiān)理規(guī)范表式》及上海市行業(yè)協(xié)會(huì)在用表
- 《起重機(jī)械安全技術(shù)規(guī)程》(TSG51-2023)知識(shí)培訓(xùn)
- 工業(yè)地產(chǎn)租房合同模板
- 文章之美(2022年遼寧盤錦中考語(yǔ)文試卷議論文閱讀題及答案)
- 湖南省邵陽(yáng)市海誼中學(xué)2024-2025學(xué)年高一上學(xué)期分班考試數(shù)學(xué)試題(原卷版)
- 2024-2030年中國(guó)DevOps工具行業(yè)市場(chǎng)發(fā)展趨勢(shì)與前景展望戰(zhàn)略分析報(bào)告
評(píng)論
0/150
提交評(píng)論