版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、多元統(tǒng)計分析題型一 題型 題型 一、定義定義、名詞解釋計算(協(xié)方差陣、模糊矩陣) 解答題§ 1隨機向量及貝分布一、隨機向量的聯(lián)合分布設耳兀是定義在樣本空間Q上的左個隨機變量,則稱:f;維隨機向量(或Q維隨機變量hP元函數(shù)尸(.巧”.12)=尸;<< .T)稱為左維隨機向量(耳耳J丿的聯(lián)合分布函數(shù).如果存在非負町積函數(shù)/(片 J八使得/Vi" g.號)=Jj : Z 冬- 作同葉施為尸則稱仁I;,/足戸維連續(xù)型隨機向屋,稱/(片心.號)為 的聯(lián)合分布宗度.§ 2隨機向暈的數(shù)字特征-隨機向量的數(shù)學期望(均值)定義1設-I上(片;./,若乩i;)M®
2、; 工./>#/, 則稱ZT二(£;,£1>;已/為=(;/的數(shù)學期望(向吊).i殳(;)",稱工為隨機矩陣,稱日上入尸為隨機矩陣T 的數(shù)學期里(知陣).二、邊緣分布稱維隨機向量(兀兀的分量構成的子向量的概率分 布為(兀兀七y的邊緣分布.設P維隨機向量石j;y的分布函數(shù)為尺斤小“),則 關于£的邊緣分布函數(shù)為£(丫/)=尸/匕S科 = F(+s+®s+coj +s)設維連續(xù)型隨機向量(兀;/的聯(lián)合分布密度為 心,則關于£的邊緣分布密度為力(兀)=匚J匚/(®6心g9)心dgdg dXp.四、協(xié)方差矩陣的
3、性質設,為隨機向量"占為常數(shù)矩陣,則性質2 久£門=aux 五、協(xié)方差矩陣zn的代數(shù)性質1. £為非負定矩陣,即對ba電RP、有ofHa hO.記號:若工為非負定矩陣,則記作30若工為1E定矩陣,則記作£>0.二、數(shù)學期望的性質設工,尸為隨機矩陣,為常數(shù)矩陣,則性質1牲質2G.gU&Q B、性質3gCH = £F + ZT三、協(xié)方差矩陣定義 2 設-1/, r=(j;j;. j;y,若«心;丿;),/=12.P、j=、2.?存在,則稱CH 工門=EX-EXy-E)y= SU 加為隨機向量T與F的協(xié)方差矩陣.當心0=0時,
4、稱隨機向量-T與,不相關.稱兒門=©心0=勿6隨機向ml的協(xié)方差矩陣.顯然,協(xié)方差矩陣是一個對稱矩陣.定義3記=笄罕2稱R=g嚴P為隨機向量-T的相關陣由相關系數(shù)的概念,顯然有/; = !» |訃1"八L 2,P, K短距離法(NearestnejgHwr)考慮和個樣本構成的距離矩陣,定義G與Gj之間的距離為兩類最近樣品的距離,即D* = min d対.(3-3-29)» "N" y現(xiàn)右設G,與G合并為一個新類記為Gy,則任意一類Gg與S的距離為2.若工為正定矩陣,則有下述等價結論.(1)>0 0 3非奇異方陣Z,使Z = 27
5、.EaO o 3正交矩陣r,使廠二如石.®y其中,人m、p.為2的全部特征根.(3) 2 >0 O T的任一主子式均大于零.(4)工 > 0 O Va G RP,有A 0 ,且ala = 0 o a = 0."0 o存在且L >0§ 3多元總體一、多元總體設觀測指標為則嚴構成一個維隨機 向量一UCJ;)',工的一切町能取值的全體就構成了元總 體,仍記作r左維隨機向量丄的概率分布即為所對應總體的概率分布,工 的數(shù)字特征也即為所對應總體的數(shù)字特征.二、樣本觀測陣設對元總體進行了"次觀測,記兒廠(町;2為第/次的觀測結果(,“ 2.“
6、),每次的觀測結果稱為一個樣品如果斗).-1缶J")滿足;(1)心忑2):”)相互獨立;(2)每個一均與總體#具有相同的概率分布.稱心心為來|'|總體T的一個容帰為的簡E隨機樣木,仍 簡稱為樣本.稱樣木觀測值的金體構成的矩陣5托2丐夕>丫22.呵.%2為樣木觀測陣(資料陣).三、樣本數(shù)字特征m片2衛(wèi)J2- %1 樣本均值(向承)=-工勺*稱T =(片:?,忑y為樣木均值向量樣本離差陣» = X(a -£)($ -弓),稱s=(»)E為樣木離差陣3 樣木協(xié)蓉旳 稱呂幾為樣水協(xié)差阻4 樣木相關陣記 =二"l (= 戶L)初'人
7、=0)皿為樣本和關陣.§ 1.3. 1多元正態(tài)分布V' 1L I!定義15 =若卩元隨機向量X=(易耳 - -X)* 的概率密度函數(shù)為=幾""宀&沁嚴兩川弓(心2小bb(EM心)則稱X=(兀亟,兀丁遵從P元正態(tài)分布,也稱炳P元正 態(tài)變量。記為X兒(円遲)|Z|為協(xié)差陣Z的行列式。二、一般的正態(tài)分布設隨機向量x=3,召,©)',若其的密度函數(shù)為/(聲,丐,,x”)=5)胡謂¥ expl(x-/z/Z-'(X-/Z)_8V兀 V+oc其中x=a,七,-»)"的均值為Ez=g、g、A) 協(xié)方并為3
8、“)2(/aX-v, /a)»=£3 “)a Mx® /)(七/)"(七一“XXp 一已)(x _“pX七/a)(Xp 一比y_(幵_“心/)稱x = 3,形,,亠,)服從均值為E(X),協(xié)方差為X的止態(tài)分布。馬氏足巨離定JJJ設總體G為機維總體(考察"2個指標),均值向量為二("1,P 2, ,心,協(xié)方差陣為S = ( a.p,則樣品 X=(xX3,.,x,)'與總體G的馬氏距離定義為2(x,g)=(x -“k(x -/)當= 1時山2(丸0 =(X-")(X-“)_(X-“)2二名詞解釋1、多元統(tǒng)計分析:多元統(tǒng)計
9、分析是運用數(shù)理統(tǒng)計的方法來研究多變量(多指標)問題的理 論和方法,是一元統(tǒng)計學的推廣 2、聚類分析:是根據(jù)“物以類聚”的道理,對樣品或指標進行分類的一種多元統(tǒng)計分析方 法。將個體或對象分類,使得同一類中的對象之間的相似性比與其他類的對象的相似性更強。 使類內對象的同質性最大化和類間對象的異質性最大化3、隨機變量:是指變量的值無法預先確定僅以一定的可能性(概率)取值的量。它是由于隨 機而獲得的非確定值,是概率中的一個基本概念。即每個分量都是隨機變量的向量為隨機向 量。類似地,所有元素都是隨機變量的矩陣稱為隨機矩陣。,把樣本的信息濃縮4、統(tǒng)計量:多元統(tǒng)計研究的是多指標問題 ,為了了解總體的特征,通
10、過對總體抽樣得到代表 總體的樣本,但因為信息是分散在每個樣本上的,就需要對樣本進行加工到不包含未知量的樣本函數(shù)中,這個函數(shù)稱為統(tǒng)計量二、計算題2 '-14"16K設畫心哥峯/爐乩其中尹=(1Q紂尼=-42試判斷® + 2屯與宀-延是否獨立?"01-P5” 2、1000二11力103/4-3< Z0解:F八0 1 -r1 0 0®丿血+ 3工3 ;J 0 2,疋1 + 2工”他Xj 工八1-r-42、91-r00-4-1100022-14102V-6一16203040'10-6-Id、A r 10-d-】G1Id20 >J-16
11、300'2故旳片的聯(lián)合分祐為妝1故不獨立口2、對某地區(qū)農(nóng)村的6名2周歲男嬰的身高、胸圉、上半臂圍進行測雖, 得相關茲據(jù)如下,根據(jù)以往資料,該地區(qū)城市2周歲男嬰的這三個指標的 均值如=(90上乩i&r現(xiàn)欲在峯元IE態(tài)性的假定下檢驗該地區(qū)農(nóng)村男翌是 否與城市男嬰有相同的均值.出 2.0"4.3107-14.6210E9464 =基中x=60.2= (115.6924)-'-14.62103.172-37 376014.5、S.9464-37 376035.5936 丿2、(a=Om.用0102) = 99.2.0103) =295 血mCV) =167)答:2假設
12、檢驗問題r H.&、4=兩R.彈壬氏經(jīng)計算可得,左一處='4.3107=(23.13848)- -14.62108.94642,2廠1J-14.62103 172-37 37608.9464 1-37.376035.5936/構造檢驗統(tǒng)計量:尸=旳(壬-曲ys"(壬-坯)= 6x70.0741 = 420.445由題目己知熱加(3,) = 295由是略=竽竝023) = 147 5所以在顯著性水平=001下,拒絕原設 即認為農(nóng)村和城市的2周歲男嬰上述三個 指標的均值有顯著性差異肛 設X = (Ai,K,禺,耳)協(xié)方差陣£ =QP.P(1) 試從工出發(fā)求X W
13、第一總體王成分M答:A-1-P-P-P-PA 1-P-P-QA -1一P-P一 P-P幾14由=0得特征根為人=打3爐(2) 試問當0取多丸時才能便第一主成分的融率達吧?以上.爲=> =人=1-£fA-l懈?斯對應的方程-p-p-p-p一P-p-pA 1-叩八一口-p幾一 1丿忑2X. ' /得入所對應的單儻特征向量*1 1故得第一主成分2 = * +*局+冷血£ £ £ £(2)第一個主成分的貢獻率為蟲 =1±|£95%A+幾嚴入+兒4得#竺竽二10 933題型三解答題1、簡述多元統(tǒng)計分析中協(xié)差陣檢驗的步驟答
14、:第一,第二,第三,第四,提出待檢驗的假設和H1;給出檢驗的統(tǒng)計量及其服從的分布; 給定檢驗水平,查統(tǒng)計量的分布表,確定相應的臨界值,從而得到否定域;根據(jù)樣本觀測值計算出統(tǒng)計量的值,看是否落入否定域中, 以便對待判假設做出決策(拒絕或接受)。2、簡述一下聚類分析的思想答:聚類分析的基本思想, 是根據(jù)一批樣品的多個觀測指標,具體地找出一些能夠度量樣品或指標之間相似程度的統(tǒng)計量,然后利用統(tǒng)計量將樣品或指標進行歸類。把相似的樣品或指標歸為一類,把不相似的歸為其他類。直到把所有的樣品(或指標)聚合完畢.3、多元統(tǒng)計分析的內容和方法答:1、簡化數(shù)據(jù)結構,將具有錯綜復雜關系的多個變量綜合成數(shù)量較少且互不相
15、關的變量,使研究問題得到簡化但損失的信息又不太多。(1)主成分分析(2)因子分析(3)對應分析等(1)聚類分析:根據(jù)分析樣本的各研(2)判別分析:判別樣本應屬何種類型的統(tǒng)計2、分類與判別,對所考察的變量按相似程度進行分類。 究變量,將性質相似的樣本歸為一類的方法。方法。4、系統(tǒng)聚類法基本原理和步驟答:1)2)3)4)5)6)7)先計算n個樣本兩兩間的距離 構造n個類,每個類只包含一個樣本 合并距離最近的兩類為一新類 計算新類與當前各類的距離 類的個數(shù)是否等于 畫出聚類圖 決定分類個數(shù)和類1,如果不等于回到3在做聚類分析的類型有:答:(1) 對樣本分類,稱為(2) 對變量分類,稱為5、Q型聚類分
16、析R型聚類分析#Q型聚類是對樣本進行聚類,它使具有相似性特征#R型聚類是對變量進行聚類,它使具有 差異性大的變量分離開來,可在相似變量中選擇少數(shù)具有代表性的樣本聚集在一起,使差異性大的樣本分離開來。 相似性的變量聚集在一起,的變量參與其他分析,實現(xiàn)減少變量個數(shù),達到變量降維的目的。6、簡述歐氏距離與馬氏距離的區(qū)別和聯(lián)系。4*1簡述歐氏距離與馬氏距離的區(qū)別和聯(lián)系答I設P錐空闔耐中的兩點x=(XpX2.»xpr和Y=則歐氏距禽為歐氏距離的局限育在多無數(shù)據(jù)分析中,其度童不合理-會受到弼間題 中壘綱的雪響°設瓦Y是來自均值向壘為卜,協(xié)方差為£的總體G中的P維樣本.則馬氏距
17、離為Da ¥)= X-Y Z XY.當忑=【目卩單位陣時,D尿Y)二X Y' X丫=二1人 =即歐氏距離-因此,在一宦程度上,歐氐距離是馬氏距離的特殊情況-馬氏距離是歐氏距離的推廣.7、試述系統(tǒng)聚類的基本思想。答:系統(tǒng)聚類的基本思想是:距離相近的樣品(或變量)先聚成類,距離相遠的后聚成類, 過程一直進行下去,每個樣品(或變量)總能聚到合適的類中。8對樣品和變量進行聚類分析時所構造的統(tǒng)計量分別是什么?簡要說明為什么這樣構造?答:對樣品進行聚類分析時,用距離來測定樣品之間的相似程度。因為我們把n個樣本看作P維空間的n個點。點之間的距離即可代表樣品間的相似度。常用的距離為(-)明氏
18、距庖;Xih X批jt-iq取不同值,分冷P(丄)(2)(3)絕對距離(1)巧0 =工I疋進_産Jt-l *切比雪夫距離(可h也)仏®歐氏距離(二)馬氏距離(三)蘭氏距離心耐)=CX, -xp攏們更多地要了解變壘的變化趨勢或變化方向,因此用相關性進行衛(wèi)壘°對變壘的相佩性,將變堡看作P維空間的向量,一般用()夫角余弦V工兀(二)相關系數(shù) n<1兀兀)q =丄Jz (死-兄)嗔3川-無9、在進行系統(tǒng)聚類時,選擇距離公式應遵循哪些原則?如歐氏距離就有非常明確的答:(1)要考慮所選擇的距離公式在實際應用中有明確的意義。 空間距離概念。馬氏距離有消除量綱影響的作用。(2 )要綜合考慮對樣本觀測數(shù)據(jù)的預處理
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年產(chǎn)00萬噸鋼鐵生產(chǎn)線建設合同
- 2024正式版車輛轉讓合同標準范本
- 土建承包合同范本2024年
- 2024幼兒園合作合同范文
- 上海買房合同書
- 2024個人店鋪出租合同范本
- 2024華碩電腦經(jīng)銷商訂貨單合同大客戶
- 商鋪合作經(jīng)營協(xié)議
- 2024臨時工合同協(xié)議書版臨時工合同范本
- 2024新媒體主播合同
- 部編版語文二年級上冊《語文園地三我喜歡的玩具》(教案)
- 軟件開發(fā)項目驗收方案
- 崗位整合整治與人員優(yōu)化配置實施細則
- 康復治療技術的職業(yè)規(guī)劃課件
- 蜜雪冰城營銷案例分析總結
- 交換機CPU使用率過高的原因分析及探討
- 易制毒化學品安全管理崗位責任分工制度
- 住宿服務免責聲明
- 2023年醫(yī)療機構消毒技術規(guī)范醫(yī)療機構消毒技術規(guī)范
- MOOC 家庭與社區(qū)教育-南京師范大學 中國大學慕課答案
- 構造法與數(shù)列課件高三數(shù)學二輪復習
評論
0/150
提交評論