多元統(tǒng)計(jì)復(fù)習(xí)題附答案_第1頁(yè)
多元統(tǒng)計(jì)復(fù)習(xí)題附答案_第2頁(yè)
多元統(tǒng)計(jì)復(fù)習(xí)題附答案_第3頁(yè)
多元統(tǒng)計(jì)復(fù)習(xí)題附答案_第4頁(yè)
多元統(tǒng)計(jì)復(fù)習(xí)題附答案_第5頁(yè)
已閱讀5頁(yè),還剩7頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、復(fù)習(xí)題原文:答案:4.2 試述判別分析的實(shí)質(zhì)。4.3 簡(jiǎn)述距離判別法的基本思想和方法。4.4 簡(jiǎn)述貝葉斯判別法的基本思想和方法。4.5 簡(jiǎn)述費(fèi)希爾判別法的基本思想和方法。4.6 試析距離判別法、貝葉斯判別法和費(fèi)希爾判別法的異同。4.2 試述判別分析的實(shí)質(zhì)。答:判別分析就是希望利用已經(jīng)測(cè)得的變量數(shù)據(jù),找出一種判別函數(shù),使得這一函數(shù)具有某種最優(yōu)性質(zhì),能把屬于不同類(lèi)別的樣本點(diǎn)盡可能地區(qū)別開(kāi)來(lái)。設(shè)R1,R2,,Rk是p維空間Rp的k個(gè)子集,如果它們互不相交,且它們的和集為,則稱(chēng),為的一個(gè)劃分。判別分析問(wèn)題實(shí)質(zhì)上就是在某種意義上,以最優(yōu)的性質(zhì)對(duì)p維空間構(gòu)造一個(gè)“劃分”,這個(gè)“劃分”就構(gòu)成了一個(gè)判別規(guī)則。

2、4.3 簡(jiǎn)述距離判別法的基本思想和方法。答:距離判別問(wèn)題分為兩個(gè)總體的距離判別問(wèn)題和多個(gè)總體的判別問(wèn)題。其基本思想都是分別計(jì)算樣本與各個(gè)總體的距離(馬氏距離),將距離近的判別為一類(lèi)。兩個(gè)總體的距離判別問(wèn)題設(shè)有協(xié)方差矩陣相等的兩個(gè)總體G和G,其均值分別是?和?2,對(duì)于一個(gè)新的樣品X,要判斷它來(lái)自哪個(gè)總體。計(jì)算新樣品X到兩個(gè)總體的馬氏距離D2(X,G)和D2(X,G),則X,D2(X,G)D2(XG)fX,D2(X,G)>D2(X,G,具體分析,SfiW(X)=a'(X項(xiàng)則判別規(guī)則為'X,W(X)X,W(X)<0I多個(gè)總體的判別問(wèn)題。設(shè)有k個(gè)總體Gi,G2,,Gk,其均

3、值和協(xié)方差矩陣分別是囪,怒,隊(duì)和21r2,,,且4=E2=4=、。計(jì)算樣本到每個(gè)總體的馬氏距離,至IJ哪個(gè)總體的距離最小就屬于哪個(gè)總體。具體分析,D2(X,Go)=(X加稅(X此)i一1取1支一、艮a,Cot2可以取線性判別函數(shù)為w:.(X)=I;.XC:,相應(yīng)的判別規(guī)則為XGi也、出,a=1,2,k。二二1,2,k若W(X)=哨"C:.)4.4 簡(jiǎn)述貝葉斯判別法的基本思想和方法?;舅枷耄涸O(shè)k個(gè)總體G1,G2,Gk,其各自的分布密度函數(shù)f1(x),f2(x),fk(x),假設(shè)k個(gè)總體各自出現(xiàn)的概率k分別為qiQ,,qk,Qi>0,£qi=1。設(shè)將本來(lái)屬于Gi總體的樣

4、品錯(cuò)判到總體Gj時(shí)造成的損失為C(j|i),ii,j=1,2,,k。設(shè)k個(gè)總體Gi,G2,,Gk相應(yīng)的p維樣本空間為R=(R,R2,,Rk)。在規(guī)則R下,將屬于Gi的樣品錯(cuò)判為Gj的概率為則這種判別規(guī)則下樣品錯(cuò)判后所造成的平均損失為則用規(guī)則R來(lái)進(jìn)行判別所造成的總平均損失為貝葉斯判別法則,就是要選擇一種劃分R1,R2,Rk,使總平均損失g(R)達(dá)到極小。kk基本方法:g(R)="qC(j|i)P(j|i,R)i1j1kk令ZqiC(j|i)fi(x)=hj(x),則g(R)=£Rhj(x)dxi4j1jk若有另一劃分R*=(R;,r2,,Rk),g(R*)=£l*h

5、j(x)dxjJRj則在兩種劃分下的總平均損失之差為因?yàn)樵赗i±hi(x)<hj(x)對(duì)一切j成立,故上式小于或等于零,是貝葉斯判別的解。從而得到的劃分R=(R1,R2,Rk)為R=x1Mx)=1minkhji=1,2,,k4.5 簡(jiǎn)述費(fèi)希爾判別法的基本思想和方法。答:基本思'想:從k個(gè)總體中抽取具有p個(gè)指標(biāo)的樣品觀測(cè)數(shù)據(jù),借助方差分析的思想構(gòu)造一個(gè)線性判別函數(shù)系數(shù)U=(U1,U2,,Up)'可使得總體之間區(qū)別最大,而使每個(gè)總體內(nèi)部的離差最小。將新樣品的p個(gè)指標(biāo)值代入線性判別函數(shù)式中求出U(X)值,然后根據(jù)判別一定的規(guī)則,就可以判別新的樣品屬于哪個(gè)總體。4.6

6、試析距離判別法、貝葉斯判別法和費(fèi)希爾判別法的異同。答:費(fèi)希爾判別與距離判別對(duì)判別變量的分布類(lèi)型無(wú)要求。二者只是要求有各類(lèi)母體的兩階矩存在。而貝葉斯判別必須知道判別變量的分布類(lèi)型。因此前兩者相對(duì)來(lái)說(shuō)較為簡(jiǎn)單。 當(dāng)k=2時(shí),若則費(fèi)希爾判別與距離判別等價(jià)。當(dāng)判別變量服從正態(tài)分布時(shí),二者與貝葉斯判別也等價(jià)。 當(dāng)時(shí),費(fèi)希爾判別用作為共同協(xié)差陣,實(shí)際看成等協(xié)差陣,此與距離判別、貝葉斯判別不同。 距離判別可以看為貝葉斯判別的特殊情形。貝葉斯判別的判別規(guī)則是X,W(X)X,W(X)<lnd距離判別的判別規(guī)則是X,W(X)X,W(X)<0二者的區(qū)別在于閾值點(diǎn)。當(dāng)q1=q2,C(1|2)=C(2|1)

7、時(shí),d=1,lnd=0。二者完全相同。4.7 設(shè)有兩個(gè)二元總體和,從中分別抽取樣本計(jì)算得到,假設(shè),試用距離判別法建立判別函數(shù)和判別規(guī)則。樣品X=(6,0)'應(yīng)屬于哪個(gè)總體?解:即樣品X屬于總體5.1 判別分析和聚類(lèi)分析有何區(qū)別?5.2 試述系統(tǒng)聚類(lèi)的基本思想。5.3 對(duì)樣品和變量進(jìn)行聚類(lèi)分析時(shí),所構(gòu)造的統(tǒng)計(jì)量分別是什么?簡(jiǎn)要說(shuō)明為什么這樣構(gòu)造5.5 試述K均值法與系統(tǒng)聚類(lèi)法的異同。5.1 判別分析和聚類(lèi)分析有何區(qū)別?答:即根據(jù)一定的判別準(zhǔn)則,判定一個(gè)樣本歸屬于哪一類(lèi)。具體而言,設(shè)有n個(gè)樣本,對(duì)每個(gè)樣本測(cè)得p項(xiàng)指標(biāo)(變量)的數(shù)據(jù),已知每個(gè)樣本屬于k個(gè)類(lèi)別(或總體)中的某一類(lèi),通過(guò)找出一個(gè)

8、最優(yōu)的劃分,使得不同類(lèi)別的樣本盡可能地區(qū)別開(kāi),并判別該樣本屬于哪個(gè)總體。聚類(lèi)分析是分析如何對(duì)樣品(或變量)進(jìn)行量化分類(lèi)的問(wèn)題。在聚類(lèi)之前,我們并不知道總體,而是通過(guò)一次次的聚類(lèi),使相近的樣品(或變量)聚合形成總體。通俗來(lái)講,判別分析是在已知有多少類(lèi)及是什么類(lèi)的情況下進(jìn)行分類(lèi),而聚類(lèi)分析是在不知道類(lèi)的情況下進(jìn)行分類(lèi)。5.2 試述系統(tǒng)聚類(lèi)的基本思想。答:系統(tǒng)聚類(lèi)的基本思想是:距離相近的樣品(或變量)先聚成類(lèi),距離相遠(yuǎn)的后聚成類(lèi),過(guò)程一直進(jìn)行下去,每個(gè)樣品(或變量)總能聚到合適的類(lèi)中。5.3 對(duì)樣品和變量進(jìn)行聚類(lèi)分析時(shí),所構(gòu)造的統(tǒng)計(jì)量分別是什么?簡(jiǎn)要說(shuō)明為什么這樣構(gòu)造?答:對(duì)樣品進(jìn)行聚類(lèi)分析時(shí),用距

9、離來(lái)測(cè)定1¥品之間的相似程度。因?yàn)槲覀儼裯個(gè)樣本看作p維空間的n個(gè)點(diǎn)。點(diǎn)之間的距離即可代表樣品間的相似度。常用的距離為、一、/、/q、i/q(一)閔可夫斯基距離:dj(q)=(乙Xik-Xjk)k1q取不同值,分為(i)絕對(duì)距離(q=1)(2)歐氏距離(q=2)(3)切比雪夫距離(q=")(二)馬氏距離(三)蘭氏距離對(duì)變量的相似性,我們更多地要了解變量的變化趨勢(shì)或變化方向,因此用相關(guān)性進(jìn)行衡量。將變量看作p維空間的向量,一般用(一)夾角余弦(二)相關(guān)系數(shù)5.5 試述K均值法與系統(tǒng)聚類(lèi)法的異同。答:相同:K均值法和系統(tǒng)聚類(lèi)法一樣,都是以距離的遠(yuǎn)近親疏為標(biāo)準(zhǔn)進(jìn)行聚類(lèi)的。不同:系

10、統(tǒng)聚類(lèi)對(duì)不同的類(lèi)數(shù)產(chǎn)生一系列的聚類(lèi)結(jié)果,而K均值法只能產(chǎn)生指定類(lèi)數(shù)的聚類(lèi)結(jié)果。具體類(lèi)數(shù)的確定,離不開(kāi)實(shí)踐經(jīng)驗(yàn)的積累;有時(shí)也可以借助系統(tǒng)聚類(lèi)法以一部分樣品為對(duì)象進(jìn)行聚類(lèi),其結(jié)果作為K均值法確定類(lèi)數(shù)的參考。6.1 試述主成分分析的基本思想。6.2 主成分分析的作用體現(xiàn)在何處?6.3 簡(jiǎn)述主成分分析中累積貢獻(xiàn)率的具體含義。6.5 試述根據(jù)協(xié)差陣進(jìn)行主成分分析和根據(jù)相關(guān)陣進(jìn)行主成分分析的區(qū)別。6.1 試述主成分分析的基本思想。答:我們處理的問(wèn)題多是多指標(biāo)變量問(wèn)題,由于多個(gè)變量之間往往存在著一定程度的相關(guān)性,人們希望能通過(guò)線性組合的方式從這些指標(biāo)中盡可能快的提取信息。當(dāng)?shù)谝粋€(gè)組合不能提取更多信息時(shí),再考

11、慮第二個(gè)線性組合。繼續(xù)這個(gè)過(guò)程,直到提取的信息與原指標(biāo)差不多時(shí)為止。這就是主成分分析的基本思想。6.2 主成分分析的作用體現(xiàn)在何處?答:一般說(shuō)來(lái),在主成分分析適用的場(chǎng)合,用較少的主成分就可以得到較多的信息量。以各個(gè)主成分為分量,就得到一個(gè)更低維的隨機(jī)向量;主成分分析的作用就是在降低數(shù)據(jù)“維數(shù)”的同時(shí)又保留了原數(shù)據(jù)的大部分信息。6.3 簡(jiǎn)述主成分分析中累積貢獻(xiàn)率的具體含義。答:主成分分析把P個(gè)原始變量Xi,X2,|l,Xp的總方差tr(力分解成了P個(gè)相互獨(dú)立的變量Y,YJH,Yp的方差之和p之。主成分分析的目的是減少變量的個(gè)數(shù),所以一般不會(huì)使用所有p個(gè)主成分的,忽略一些帶有較小方差的主成分將不會(huì)

12、給總方差帶來(lái)太大的影響。這里我們稱(chēng)cpk=kR限為第k個(gè)主成分Yk的貢獻(xiàn)率。第一主成分的貢獻(xiàn)率k4最大,這表明Y=TlX綜合原始變量Xi,X2,|,Xp的能力最強(qiáng),而Y2,YJ|,Yp的綜合能力依次遞減。若只取m(p)個(gè)主成分,則稱(chēng)叫上九/工入為主成分Yi,|l|,Ym的累計(jì)貢獻(xiàn)率,累計(jì)貢獻(xiàn)率表明Y,川,Ym綜合Xi,X2,Hl,Xpkm.k土的能力。通常取m,使得累計(jì)貢獻(xiàn)率達(dá)到一個(gè)較高的百分?jǐn)?shù)(如85%以上)。6.5 試述根據(jù)協(xié)差陣進(jìn)行主成分分析和根據(jù)相關(guān)陣進(jìn)行主成分分析的區(qū)別。答:從相關(guān)陣求得的主成分與協(xié)差陣求得的主成分一般情況是不相同的。從協(xié)方差矩陣出發(fā)的,其結(jié)果受變量單位的影響。主成分

13、傾向于多歸納方差大的變量的信息,對(duì)于方差小的變量就可能體現(xiàn)得不夠,也存在“大數(shù)吃小數(shù)”的問(wèn)題。實(shí)際表明,這種差異有時(shí)很大。我們認(rèn)為,如果各指標(biāo)之間的數(shù)量級(jí)相差懸殊,特別是各指標(biāo)有不同的物理量綱的話,較為合理的做法是使用R代替工對(duì)于研究經(jīng)濟(jì)問(wèn)題所涉及的變量單位大都不統(tǒng)一,采用R代替幣,可以看作是用標(biāo)準(zhǔn)化的數(shù)據(jù)做分析,這樣使得主成分有現(xiàn)實(shí)經(jīng)濟(jì)意義,不僅便于剖析實(shí)際問(wèn)題,又可以避免突出數(shù)值大的變量。7.1 試述因子分析與主成分分析的聯(lián)系與區(qū)別。7.2 因子分析主要可應(yīng)用于哪些方面?7.3 簡(jiǎn)述因子模型中載荷矩陣A的統(tǒng)計(jì)意義。7.4 在進(jìn)行因子分析時(shí),為什么要進(jìn)行因子旋轉(zhuǎn)?最大方差因子旋轉(zhuǎn)的基本思路是

14、什么?7.1 試述因子分析與主成分分析的聯(lián)系與區(qū)別。答:因子分析與主成分分析的聯(lián)系是:兩種分析方法都是一種降維、簡(jiǎn)化數(shù)據(jù)的技術(shù)。兩種分析的求解過(guò)程是類(lèi)似的,都是從一個(gè)協(xié)方差陣出發(fā),利用特征值、特征向量求解。因子分析可以說(shuō)是主成分分析的姐妹篇,將主成分分析向前推進(jìn)一步便導(dǎo)致因子分析。因子分析也可以說(shuō)成是主成分分析的逆問(wèn)題。如果說(shuō)主成分分析是將原指標(biāo)綜合、歸納,那么因子分析可以說(shuō)是將原指標(biāo)給予分解、演繹。因子分析與主成分分析的主要區(qū)別是:主成分分析本質(zhì)上是一種線性變換,將原始坐標(biāo)變換到變異程度大的方向上為止,突出數(shù)據(jù)變異的方向,歸納重要信息。而因子分析是從顯在變量去提煉潛在因子的過(guò)程。此外,主成分

15、分析不需要構(gòu)造分析模型而因子分析要構(gòu)造因子模型。7.2 因子分析主要可應(yīng)用于哪些方面?答:因子分析是一種通過(guò)顯在變量測(cè)評(píng)潛在變量,通過(guò)具體指標(biāo)測(cè)評(píng)抽象因子的統(tǒng)計(jì)分析方法。目前因子分析在心理學(xué)、社會(huì)學(xué)、經(jīng)濟(jì)學(xué)等學(xué)科中都有重要的應(yīng)用。具體來(lái)說(shuō),因子分析可以用于分類(lèi)。如用考試分?jǐn)?shù)將學(xué)生的學(xué)習(xí)狀況予以分類(lèi);用空氣中各種成分的比例對(duì)空氣的優(yōu)劣予以分類(lèi)等等因子分析可以用于探索潛在因素。即是探索未能觀察的或不能觀測(cè)的的潛在因素是什么,起的作用如何等。對(duì)我們進(jìn)一步研究與探討指示方向。在社會(huì)調(diào)查分析中十分常用。因子分析的另一個(gè)作用是用于時(shí)空分解。如研究幾個(gè)不同地點(diǎn)的不同日期的氣象狀況,就用因子分析將時(shí)間因素引起

16、的變化和空間因素引起的變化分離開(kāi)來(lái)從而判斷各自的影響和變化規(guī)律。7.3簡(jiǎn)述因子模型中載荷矩陣A的統(tǒng)計(jì)意義。答:對(duì)于因子模型aiiai2IIIaim因子載荷陣為A=a21a22212m=(A,A2,|H,Am)IIIIIIIIIIIIapiap2IIIapmXi與Fj的協(xié)方差為:m=CovraikFk,Fj)Cov(“,F(xiàn)j)k1二a。X一,若又Xi作標(biāo)準(zhǔn)化處理,=aij,因此aij一方面表示Xi對(duì)Fj的依賴程度;另一方面也反映了變量X對(duì)公共因子F.,一,一一Fj的相對(duì)重要性。m變量共同度h:ai2i=1,2,111,pjiD(Xi)=aMD(Fi)+a22D(F2)+|+30(Fm)+D()=

17、h"+ct2說(shuō)明變量Xi的方差由兩部分組成:第一部分為共同度h:,它描述了全部公共因子對(duì)變量Xi的總方差所作的貢獻(xiàn),反映了公共因子對(duì)變量Xi的影響程度。第二部分為特殊因子易對(duì)變量Xi的方差的貢獻(xiàn),通常稱(chēng)為個(gè)性方差。p而公共因子Fj對(duì)X的貢獻(xiàn)g2=£a2j=1,2,|,m1 1表示同一公共因子Fj對(duì)各變量所提供的方差貢獻(xiàn)之總和,它是衡量每一個(gè)公共因子相對(duì)重要性的一個(gè)尺度。7.4在進(jìn)行因子分析時(shí),為什么要進(jìn)行因子旋轉(zhuǎn)?最大方差因子旋轉(zhuǎn)的基本思路是什么?答:因子分析的目標(biāo)之一就是要對(duì)所提取的抽象因子的實(shí)際含義進(jìn)行合理解釋。但有時(shí)直接根據(jù)特征根、特征向量求得的因子載荷陣難以看出公共

18、因子的含義。這種因子模型反而是不利于突出主要矛盾和矛盾的主要方面的,也很難對(duì)因子的實(shí)際背景進(jìn)行合理的解釋。這時(shí)需要通過(guò)因子旋轉(zhuǎn)的方法,使每個(gè)變量?jī)H在一個(gè)公共因子上有較大的載荷,而在其余的公共因子上的載荷比較小。最大方差旋轉(zhuǎn)法是一種正交旋轉(zhuǎn)的方法,其基本思路為:Ap*其中令A(yù)-Ar(aij)p>m,dj-aij/hidj=2djPypccA的第j列兀素平萬(wàn)的相對(duì)萬(wàn)差可定乂為Vj=£(dj2-di)2pTV二ViV2IIIVm最大方差旋轉(zhuǎn)法就是選擇正交矩陣F,使得矩陣A*所有m個(gè)列元素平方的相對(duì)方差之和達(dá)到最大。8.1 什么是對(duì)應(yīng)分析?它與因子分析有何關(guān)系?8.2 試述對(duì)應(yīng)分析的基

19、本思想8.3 試述對(duì)應(yīng)分析的基本步驟。8.1 什么是相應(yīng)分析?它與因子分析有何關(guān)系?答:相應(yīng)分析也叫對(duì)應(yīng)分析,通常意義下,是指兩個(gè)定性變量的多種水平進(jìn)行相應(yīng)性研究。其特點(diǎn)是它所研究的變量可以是定性的。相應(yīng)分析與因子分析的關(guān)系是:在進(jìn)行相應(yīng)分析過(guò)程中,計(jì)算出過(guò)渡矩陣后,要分別對(duì)變量和樣本進(jìn)行因子分析。因此,因子分析是相應(yīng)分析的基礎(chǔ)。具體而言,()()式表明Zuj為相對(duì)于特征值的關(guān)于因素A各水平構(gòu)成的協(xié)差陣的特征向量。從而建立了相應(yīng)分析中R型因子分析和Q型因子分析的關(guān)系。8.2 試述相應(yīng)分析的基本思想。答:相應(yīng)分析,是指對(duì)兩個(gè)定性變量的多種水平進(jìn)行分析。設(shè)有兩組因素A和B,其中因素A包含r個(gè)水平,

20、因素B包含c個(gè)水平。對(duì)這兩組因素作隨機(jī)抽樣調(diào)查,得到一個(gè)rmc的二維列聯(lián)表,記為k=(kj)r“。要尋求列聯(lián)表列因素A和行因素B的基本分析特征和最優(yōu)列聯(lián)表示。相應(yīng)分析即是通過(guò)列聯(lián)表的轉(zhuǎn)換,使得因素A和因素B具有對(duì)等性,從而用相同的因子軸同時(shí)描述兩個(gè)因素各個(gè)水平的情況。把兩個(gè)因素的各個(gè)水平的狀況同時(shí)反映到具有相同坐標(biāo)軸的因子平面上,從而得到因素A、B的聯(lián)系。8.3 試述相應(yīng)分析的基本步驟。答:(1)建立列聯(lián)表設(shè)受制于某個(gè)載體總體的兩個(gè)因素為A和B,其中因素A包含r個(gè)水平,因素B包含c個(gè)水平。對(duì)這兩組因素作隨機(jī)抽樣調(diào)查,得到一個(gè)rc的二維列聯(lián)表,記為K=(kj)(2)將原始的列聯(lián)資料K=(kij)

21、r無(wú)變換成矩陣Z=(zij)r支,使得zij對(duì)因素A和列因素B具有對(duì)等性。通過(guò)變換得耳=ZZ,1=ZZ(3)對(duì)因素B進(jìn)行因子分析。計(jì)算出2c=ZZ的特征向量及其相應(yīng)的特征向量,計(jì)算出因素B的因子)(4)對(duì)因素A進(jìn)行因子分析。計(jì)算出不=ZZ'的特征向量,及其相應(yīng)的特征向量,計(jì)算出因素A的因子選取因素B的第一、第二公因子選取因素A的第一、第二公因子將B因素的c個(gè)水平(),(),()A因素的r個(gè)水平()()()同時(shí)反應(yīng)到相同坐標(biāo)軸的因子平面上上(6)根據(jù)因素A和因素B各個(gè)水平在平面圖上的分布,描述兩因素及各個(gè)水平之間的相關(guān)關(guān)系。9.1 什么是典型相關(guān)分析?簡(jiǎn)述其基本思想。9.2 什么是典型變

22、量?它具有哪些性質(zhì)?9.3 試分析一組變量的典型變量與其主成分的聯(lián)系與區(qū)別。9.1 什么是典型相關(guān)分析?簡(jiǎn)述其基本思想。答:典型相關(guān)分析是研究?jī)山M變量之間相關(guān)關(guān)系的一種多元統(tǒng)計(jì)方法。用于揭示兩組變量之間的內(nèi)在聯(lián)系。典型相關(guān)分析的目的是識(shí)別并量化兩組變量之間的聯(lián)系。將兩組變量相關(guān)關(guān)系的分析轉(zhuǎn)化為一組變量的線性組合與另一組變量線性組合之間的相關(guān)關(guān)系?;舅枷耄?1)在每組變量中找出變量的線性組合,使得兩組的線性組合之間具有最大的相關(guān)系數(shù)。即:若設(shè)x(1)=(Xi(1),x21),|,xP1)>x=(Xi,x22),|,x:2)是兩組相互關(guān)聯(lián)的隨機(jī)變量,分別在兩組變量中選取若干有代表性的綜合變

23、量Ui、Vi,使是原變量的線性組合。在D(aX(1)=D(b(1)X)=1的條件下,使得P(a(1)'X,b'X)達(dá)到最大。(2)選取和最初挑選的這對(duì)線性組合不相關(guān)的線性組合,使其配對(duì),并選取相關(guān)系數(shù)最大的一對(duì)。(3)如此繼續(xù)下去,直到兩組變量之間的相關(guān)性被提取完畢為此。9.2 什么是典型變量?它具有哪些性質(zhì)?答:在典型相關(guān)分析中,在一定條件下選取系列線性組合以反映兩組變量之間的線性關(guān)系,這被選出的線性組合配對(duì)被稱(chēng)為典型變量。具體來(lái)說(shuō),在右江父可練心及衿工聞今仔仍力戒)伊也1*),b'X)達(dá)到最大,則稱(chēng)a3、b(1)X是X(1)、X的第一對(duì)典型相關(guān)變量。典型變量性質(zhì):典

24、型相關(guān)量化了兩組變量之間的聯(lián)系,反映了兩組變量的相關(guān)程度。1. D(Uk)=1,D(Vk)=1(k=1,2,IH,r)i=0(i=j,i=1,2,|,r)2. Cov(Ui,Vj)=0(i=j)0(jr)9.3 試分析一組變量的典型變量與其主成分的聯(lián)系與區(qū)別。答:一組變量的典型變量和其主成分都是經(jīng)過(guò)線性變換計(jì)算矩陣特征值與特征向量得出的。主成分分析只涉及一組變量的相互依賴關(guān)系而典型相關(guān)則擴(kuò)展到兩組變量之間的相互依賴關(guān)系之中,度量了這兩組變量之間聯(lián)系的強(qiáng)度。4.8某超市經(jīng)銷(xiāo)十種品牌的飲料,其中有四種暢銷(xiāo),三種滯銷(xiāo),三種平銷(xiāo)。下表是這十種品牌飲料的銷(xiāo)售價(jià)格(元)和顧客對(duì)各種飲料的口味評(píng)分、信任度評(píng)

25、分的平均數(shù)。6.8利用主成分分析法,綜合評(píng)價(jià)六個(gè)工業(yè)行業(yè)的經(jīng)濟(jì)效益指標(biāo)。6.10根據(jù)習(xí)題5.10中2003年我國(guó)省會(huì)城市和計(jì)劃單列市的主要經(jīng)濟(jì)指標(biāo)數(shù)據(jù),利用主成分分析法對(duì)這些地區(qū)進(jìn)行分類(lèi)。7.8某汽車(chē)組織欲根據(jù)一系列指標(biāo)來(lái)預(yù)測(cè)汽車(chē)的銷(xiāo)售情況,為了避免有些指標(biāo)間的相關(guān)關(guān)系影響預(yù)測(cè)結(jié)果,需首先進(jìn)行因子分析來(lái)簡(jiǎn)化指標(biāo)系統(tǒng)。下表是抽查歐洲某汽車(chē)市場(chǎng)7個(gè)品牌不同型號(hào)的汽車(chē)的各種指標(biāo)數(shù)據(jù),試用因子分析法找由其簡(jiǎn)化的指標(biāo)系統(tǒng)。4.8某超市經(jīng)銷(xiāo)十種品牌的飲料,其中有四種暢銷(xiāo),三種滯銷(xiāo),三種平銷(xiāo)。下表是這十種品牌飲料的銷(xiāo)售價(jià)格(元)和顧客對(duì)各種飲料的口味評(píng)分、信任度評(píng)分的平均數(shù)。銷(xiāo)售情況產(chǎn)品序號(hào)銷(xiāo)售價(jià)格口味評(píng)分

26、信任度評(píng)分12.258暢銷(xiāo)22.56733.03943.28652.876平銷(xiāo)63.58774.89881.734滯銷(xiāo)92.242102.743根據(jù)數(shù)據(jù)建立貝葉斯判別函數(shù),并根據(jù)此判別函數(shù)對(duì)原樣本進(jìn)行回判?,F(xiàn)有一新品牌的飲料在該超市試銷(xiāo),其銷(xiāo)售價(jià)格為3.0,顧客對(duì)其口味的評(píng)分平均為8,信任評(píng)分平均為5,試預(yù)測(cè)該飲料的銷(xiāo)售情況。解:增加group變量,令暢銷(xiāo)、平銷(xiāo)、滯銷(xiāo)分別為groupl、2、3;銷(xiāo)售價(jià)格為X1,口味評(píng)分為“,信任度評(píng)分為X3,用spss解題的步驟如下:1 .在SPSS窗口中選擇AnalyzerClassifyDiscriminate,調(diào)出判別分析主界面,將左邊的變量列表中的“g

27、roup”變量選入分組變量中,將X1、X、X3變量選入自變量中,并選擇Enterindependentstogether單選按鈕,即使用所有自變量進(jìn)行判別分析。2 .點(diǎn)擊DefineRange按鈕,定義分組變量的取值范圍。本例中分類(lèi)變量的范圍為1到3,所以在最小值和最大值中分別輸入1和3。單擊Continue按鈕,返回主界面。如圖4.1圖4.1判別分析主界面3 .單擊Statistics按鈕,指定輸出的描述統(tǒng)計(jì)量和判別函數(shù)系數(shù)。選中FunctionCoefficients欄中的Fisher's:給出Bayes判別函數(shù)的系數(shù)。(注意:這個(gè)選項(xiàng)不是要給出Fisher判別函數(shù)的系數(shù)。這個(gè)復(fù)選

28、框的名字之所以為Fisher。是因?yàn)榘磁袆e函數(shù)值最大的一組進(jìn)行歸類(lèi)這種思想是由Fisher提出來(lái)的。這里極易混淆,請(qǐng)讀者注意辨別。)如圖4.2。單擊Continue按鈕,返回主界面。圖4.2statistics子對(duì)話框4 .單擊Classify按鈕,彈出classification子對(duì)話框,選中Display選項(xiàng)欄中的Summarytable復(fù)選框,即要求輸出錯(cuò)判矩陣,以便實(shí)現(xiàn)題中對(duì)原樣本進(jìn)行回判的要求。如圖4.3。圖4.3classification對(duì)話框5 .返回判別分析主界面,單擊OK按鈕,運(yùn)行判別分析過(guò)程。1)根據(jù)判別分析的結(jié)果建立Bayes判別函數(shù):Bayes判別函數(shù)的系數(shù)見(jiàn)表4.1

29、。表中每一列表示樣本判入相應(yīng)類(lèi)的Bayes判別函數(shù)系數(shù)。由此可建立判別函數(shù)如下:Group1:Y1=81.84311.689X1+12.297X2+16.76X3Group2:Y2=-94.536-10.707X113.361X217.08X3Group3:Y3=-17.4492.19X14.96X26.44X3將各樣品的自變量值代入上述三個(gè)Bayes判別函數(shù),得到三個(gè)函數(shù)值。比較這三個(gè)函數(shù)值,哪個(gè)函數(shù)值比較大就可以判斷該樣品判入哪一類(lèi)。ClassificationFunctionCoefficientsgroup123x1-11.689-10.707-2.194x212.29713.3614

30、.960x316.76117.0866.447(Constant)-81.843-94.536-17.449Fisher'slineardiscriminantfunctions表4.1BayesJ別函數(shù)系數(shù)根據(jù)此判別函數(shù)對(duì)樣本進(jìn)行回判,結(jié)果如表4.2。從中可以看出在4種暢銷(xiāo)飲料中,有3種被正確地判定,有1種被錯(cuò)誤地判定為平銷(xiāo)飲料,正確率為75%。在3種平銷(xiāo)飲料中,有2種被正確判定,有1種被錯(cuò)誤地判定為暢銷(xiāo)飲料,正確率為66.7%。3#滯銷(xiāo)飲料均正確判定。整體的正確率為80.0%。ClassificationResultsPredictedGroupMembershipgroup123

31、TotalOriginalCount131042120330033%175.025.0.0100.0233.366.7.0100.03.0.0100.0100.0a.80.0%oforiginalgroupedcasescorrectlyclassified.表4.2錯(cuò)判矩陣2)該新飲料的X1=3.0,X2=8,X3=5,將這3個(gè)自變量代入上一小題得到的Baye琲U別函數(shù),Y2的值最大,該飲料預(yù)計(jì)平銷(xiāo)。也可通過(guò)在原樣本中增加這一新樣本,重復(fù)上述的判別過(guò)程,并在classification?對(duì)話框中同時(shí)要求輸出casewiseresults運(yùn)行判別過(guò)程,得到相同的結(jié)果。6.8利用主成分分析法,綜

32、合評(píng)價(jià)六個(gè)工業(yè)行業(yè)的經(jīng)濟(jì)效益指標(biāo)。單位:(億元)行業(yè)名稱(chēng)資產(chǎn)總計(jì)固定資產(chǎn)凈值平均余額產(chǎn)品銷(xiāo)售收入利潤(rùn)總額煤炭開(kāi)采和選業(yè)6917.23032.7683.361.6石油和天然氣開(kāi)采業(yè)5675.93926.2717.533877黑色金屬礦采選業(yè)768.1221.296.513.8有色金屬礦采選業(yè)622.4248116.421.6非金屬礦采選業(yè)699.9291.584.96.2其它采礦業(yè)1.60.50.30解:令資產(chǎn)總計(jì)為X1,固定資產(chǎn)凈值平均余額為X2,產(chǎn)品銷(xiāo)售收入為X3,利潤(rùn)總額為X4,用SPSS寸這六個(gè)行業(yè)進(jìn)行主成分分析的方法如下:1. 在SPSS®口中選擇AnalyzeDataRed

33、uctionFactor菜單項(xiàng),調(diào)出因子分析主界面,并將變量Xi-X5移入Variables框中,其他均保持系統(tǒng)默認(rèn)選項(xiàng),單擊OK按鈕,執(zhí)行因子分析過(guò)程(關(guān)于因子分子在SPSS中實(shí)現(xiàn)的詳細(xì)過(guò)程,參見(jiàn)7.7)。得到如表6.1所示的特征根和方差貢獻(xiàn)率表和表6.2所示的因子載荷陣。第一個(gè)因子就可以解釋86.5%表6.1特征根和方差貢獻(xiàn)率表表6.2因子載荷陣2. 將表6.2中因子載荷陣中的數(shù)據(jù)輸入SPS蹴?yè)?jù)編輯窗口,命名為al。點(diǎn)擊菜單項(xiàng)中的TransformCompute,調(diào)出Computevariable對(duì)話框,在對(duì)話框中輸入等式:z1=a1/SQRT3.46),計(jì)算第一個(gè)特征向量。點(diǎn)擊OK按鈕,

34、即可在數(shù)據(jù)編輯窗口中得到以z1為變量名的第一特征向量。表6.3特征向量矩陣z1x10.509x20.537x30.530x40.413根據(jù)表6.3得主成分的表達(dá)式:3. 再次使用Compute命令,調(diào)出Computevariable對(duì)話框,在對(duì)話框中輸入等式:根據(jù)六個(gè)工業(yè)行業(yè)計(jì)算所的y1的大小可得石油和天然氣開(kāi)采業(yè)的經(jīng)濟(jì)效益最好,煤炭開(kāi)采和選業(yè)其次,接著依次是黑色金屬、非金屬、有色金屬和其他采礦業(yè)。6.10根據(jù)習(xí)題5.10中2003年我國(guó)省會(huì)城市和計(jì)劃單列市的主要經(jīng)濟(jì)指標(biāo)數(shù)據(jù),利用主成分分析法對(duì)這些地區(qū)進(jìn)行分類(lèi)。解:用SPSS1行主成分分析的具體方法參見(jiàn)6.8,分析結(jié)果如下:表6.7特征根和方

35、差貢獻(xiàn)率表表6.8因子載荷陣表6.6特征向量矩陣z1z2x10.290.47x20.280.48x30.14-0.29x40.31-0.37x50.40-0.20x60.40-0.27x70.310.39x80.390.12x90.39-0.24根據(jù)表6.6得主成分的表達(dá)式:分別計(jì)算出以上三項(xiàng)后,利用公式Y(jié)=Y1+Y2得到綜合得分并排序如下表:地區(qū)y1y2y深圳170038.89254204.05197055.90上海70185.8834213.0258638.59廈門(mén)50894.5369593.9356897.04廣州55849.2132174.5848249.65杭州42167.71292

36、44.9838019.51寧波40552.8528367.3436641.30北京45747.3811555.7334771.86南寧45747.3811555.7334771.86天津39597.9021080.5233653.82海口39597.9021080.5233653.82南京36680.7525804.6533189.52青島35237.2714552.4628597.44大連31830.5617629.5327272.03濟(jì)南25149.7316499.3922372.97福州22734.1616326.9720677.45烏魯木齊22284.5415284.6820037.5

37、9沈陽(yáng)23184.9912310.2219694.19武漢23909.279770.5619370.75長(zhǎng)春21524.9514179.2119166.96成都33808.79-17638.7317294.14太原19445.429809.9916352.45鄭州18561.819822.9015756.62蘭州16568.9713769.8015670.44???7666.7011325.7715631.26昆明18494.348579.7215311.75呼和浩特16128.6013359.1015239.59長(zhǎng)沙18845.236252.5414802.98石家莊18229.337399

38、.6214752.99西安16764.154871.9712946.76南昌14598.409288.2012893.83哈爾濱15782.076297.2012737.43合肥14319.858659.4112502.85銀川12865.9710960.0812254.18貴陽(yáng)15339.904138.4811744.24重慶27859.53-22407.6611723.76西寧10450.626144.519068.36南寧11526.862677.298686.15最后的分類(lèi)可以卞!據(jù)最終得分Y的值來(lái)劃分,由于沒(méi)有給出具體的分類(lèi)標(biāo)準(zhǔn),具體分類(lèi)結(jié)果根據(jù)各人的主觀意愿可以有多種答案。可以歸為

39、一類(lèi),屬于文科學(xué)習(xí)能力的指標(biāo);第二個(gè)公共因子在前三個(gè)指標(biāo)上有較大載荷,同樣可以歸為一類(lèi),這三個(gè)指標(biāo)同屬于理科學(xué)習(xí)能力的指標(biāo)。根據(jù)表7.3易得:表7.3因子得分系數(shù)矩陣將每個(gè)學(xué)生的六門(mén)成績(jī)分別代入F1、F2,比較兩者的大小,F(xiàn)1大的適合學(xué)文,F(xiàn)2大的適合學(xué)理。計(jì)算結(jié)果為學(xué)號(hào)是1、16、24的學(xué)生適合學(xué)文,其余均適合學(xué)理。7.8某汽車(chē)組織欲根據(jù)一系列指標(biāo)來(lái)預(yù)測(cè)汽車(chē)的銷(xiāo)售情況,為了避免有些指標(biāo)間的相關(guān)關(guān)系影響預(yù)測(cè)結(jié)果,需首先進(jìn)行因子分析來(lái)簡(jiǎn)化指標(biāo)系統(tǒng)。下表是抽查歐洲某汽車(chē)市場(chǎng)7個(gè)品牌不同型號(hào)的汽車(chē)的各種指標(biāo)數(shù)據(jù),試用因子分析法找出其簡(jiǎn)化的指標(biāo)系統(tǒng)。品牌價(jià)格發(fā)動(dòng)機(jī)功率軸距寬長(zhǎng)軸距料量燃容燃料效率A215001.8140101.267.3172.42.63913.228A284003.2225108.170.3192.93.51717.225A420003.5210114.671.4196.63.85018.022B239901.8150102.

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論