多元統(tǒng)計(jì)復(fù)習(xí)題附問題詳解_第1頁
多元統(tǒng)計(jì)復(fù)習(xí)題附問題詳解_第2頁
多元統(tǒng)計(jì)復(fù)習(xí)題附問題詳解_第3頁
多元統(tǒng)計(jì)復(fù)習(xí)題附問題詳解_第4頁
多元統(tǒng)計(jì)復(fù)習(xí)題附問題詳解_第5頁
已閱讀5頁,還剩21頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、復(fù)習(xí)題原文:復(fù)習(xí)題I TOC o 1-5 h z 試述判別分析的實(shí)質(zhì)8簡述距離判別法的基本思想和方法&簡述貝葉斯判別法的基本思想和方法9.簡述費(fèi)希爾判別法的基本思想和方法10.試折距離判別法、貝葉斯判刑法和費(fèi)希爾判別法胞異同IV某貂市經(jīng)銷十種品牌的飲料,其中有四種暢銷,三種滯銷,三種平銷.下表是這十種品牌飲料的銷售價(jià)格(元)和顧客對各種飲料的口味評分、信任度評分的平均數(shù).12,判別分析和聚類分析有何區(qū)別? 1&l r 2T # E冰成*廿* M 日, c答案:試述判別分析的實(shí)質(zhì)。簡述距離判別法的基本思想和方法。簡述貝葉斯判別法的基本思想和方法。簡述費(fèi)希爾判別法的基本思想和方法。試析距離判別法、

2、貝葉斯判別法和費(fèi)希爾判別法的異同。試述判別分析的實(shí)質(zhì)。答:判別分析就是希望利用已經(jīng)測得的變量數(shù)據(jù),找出一種判別函數(shù),使得這一函數(shù)具有某種最優(yōu)性質(zhì),能把屬于 不同類別的樣本點(diǎn)盡可能地區(qū)別開來。設(shè)R1, R2,,Rk是p維空間R p的k個(gè)子集,如果它們互不相交,且它 們的和集為W,則稱勺,勺為與的一個(gè)劃分。判別分析問題實(shí)質(zhì)上就是在某種意義上,以最優(yōu)的性質(zhì)對p維空間Rp構(gòu)造一個(gè)“劃分”,這個(gè)“劃分”就構(gòu)成了一個(gè)判別規(guī)則。簡述距離判別法的基本思想和方法 答:距離判別問題分為兩個(gè)總體的距離判別問題和多個(gè)總體的判別問題。其基本思想都是分別計(jì)算樣本與各個(gè) 總體的距離(馬氏距離),將距離近的判別為一類。兩個(gè)總

3、體的距離判別問題 設(shè)有協(xié)方差矩陣E相等的兩個(gè)總體G,和任,其均值分別是和切2,對于一個(gè)新的樣品尤要判斷它來自哪個(gè)總體。 計(jì)算新樣品彳到兩個(gè)總體的馬氏距離(用G)和(尢則X e G1 , if (X. Gi) 0 d (X, Gi)X e G2 , Z7? (X. GD C (X, 0,具體分析,=2XT-1 (% - ) + (內(nèi) + %(內(nèi) 一 出)= -2(X-p)a = -2a(X-p)d2(x,g)-d“x,gd= (X-nJ1(X-m)-(x-/)(X-/)=X-X- 2XT,p1 +-(XNX - 2XLh2 +)= 2XT-,(M2-P1) + p;L-,M1-jL-1p2則判別

4、規(guī)則為記 W(X) = a(X_ji)X W(X)NOX eC2 , w (X) o, Z%=1。設(shè)將本來屬于Gj總體的樣品錯(cuò)判到總體G,時(shí)造成的損失為C(jli),i,j = l,2,北。設(shè)k個(gè)總體G,G?,G/相應(yīng)的維樣本空間為R =(6,&,,凡)。在規(guī)則R下,將屬于。的樣品錯(cuò)判為Gj的概率為P(jli,R) = h f,(x)dx i,j = 12,k i , j則這種判別規(guī)則下樣品錯(cuò)判后所造成的平均損失為il R) = C(/ I i)P(jl /,/?)i = 1,2,j-i則用規(guī)則R來進(jìn)行判別所造成的總平均損失為g(R) = %中,/?)i-l= fq,fs(八 i)p(jii,

5、R) i-i y-i貝葉斯判別法則,就是要選擇一種劃分K,R?,使總平均損失g(R)達(dá)到極小?;痉椒ǎ篻(R) = q,c(/li)P(jli,R) /-I1i.1 i-1(工勺,(八 i)fj(x)dx r-l令口C(x) = %(x),則 g(R)= jj(x)dx若有另一劃分內(nèi)R;), g(R6) = Z.%(x)&則在兩種劃分下的總平均損失之差為g(R) g(g) = : J,巾也(X)- % (x)x因?yàn)樵诜采?(x)K%.(x)對一切,成立,故上式小于或等于零,是貝葉斯判別的解。從而得到的劃分R =(&,氏)為人 =1()里叫i = 12 F4.5簡述費(fèi)希爾判別法的基本思想和方法

6、。答:基本思想:從k個(gè)總體中抽取具有個(gè)指標(biāo)的樣品觀測數(shù)據(jù),借助方差分析的思想構(gòu)造一個(gè)線性判別函數(shù)U(X) = itX. +H,X,+. + z/n X =ufX l 1 上 工p P系數(shù)口=(%,2,一、.)可使得總體之間區(qū)別最大,而使每個(gè)總體部的離差最小。將新樣品的個(gè)指標(biāo)值代入線性 判別函數(shù)式中求出(X)值,然后根據(jù)判別一定的規(guī)則,就可以判別新的樣品屬于哪個(gè)總體。4. 6試析距離判別法、貝葉斯判別法和費(fèi)希爾判別法的異同。答:費(fèi)希爾判別與距離判別對判別變量的分布類型無要求。二者只是要求有各類母體的兩階矩存在。而貝葉斯 判別必須知道判別變量的分布類型。因此前兩者相對來說較為簡單。當(dāng)k=2時(shí),若當(dāng)

7、= = *則費(fèi)希爾判別與距離判別等價(jià)。當(dāng)判別變量服從正態(tài)分布時(shí),二者與貝葉斯判別也等 價(jià)。當(dāng)片工”時(shí),費(fèi)希爾判別用Z + Z作為共同協(xié)差陣,實(shí)際看成等協(xié)差陣,此與距離判別、貝葉斯判別不同。距離判別可以看為貝葉斯判別的特殊情形。貝葉斯判別的判別規(guī)則是X 2,W(X)*dX eG2 , W(X)0X eC2 , W (X) X EG1即樣品x屬于總體力判別分析和聚類分析有何區(qū)別?試述系統(tǒng)聚類的基本思想。對樣品和變量進(jìn)行聚類分析時(shí),所構(gòu)造的統(tǒng)計(jì)量分別是什么?簡要說明為什么這樣構(gòu)造5. 5試述K均值法與系統(tǒng)聚類法的異同。1判別分析和聚類分析有何區(qū)別?答:即根據(jù)一定的判別準(zhǔn)則,判定一個(gè)樣本歸屬于哪一類。

8、具體而言,設(shè)有n個(gè)樣本,對每個(gè)樣本測得p項(xiàng)指標(biāo)(變 量)的數(shù)據(jù),已知每個(gè)樣本屬于k個(gè)類別(或總體)中的某一類,通過找出一個(gè)最優(yōu)的劃分,使得不同類別的樣本 盡可能地區(qū)別開,并判別該樣本屬于哪個(gè)總體。聚類分析是分析如何對樣品(或變量)進(jìn)行量化分類的問題。在聚 類之前,我們并不知道總體,而是通過一次次的聚類,使相近的樣品(或變量)聚合形成總體。通俗來講,判別分 析是在已知有多少類及是什么類的情況下進(jìn)行分類,而聚類分析是在不知道類的情況下進(jìn)行分類。試述系統(tǒng)聚類的基本思想。答:系統(tǒng)聚類的基本思想是:距離相近的樣品(或變量)光聚成類,距離相遠(yuǎn)的后聚成類,過程一直進(jìn)行下去,每 個(gè)樣品(或變量)總能聚到合適的

9、美中。對樣品和變量進(jìn)行聚類分析時(shí),所構(gòu)造的統(tǒng)計(jì)量分別是什么?簡要說明為什么這樣構(gòu)造?答:對樣品進(jìn)行聚類分析時(shí),用距離來測定樣品之間的相似程度。因?yàn)槲覀儼裯個(gè)杼本看作p維空間的n個(gè)點(diǎn)。點(diǎn) 之間的距離即可代表樣品間的相似度。常用的距離為(-)閔可夫斯醫(yī)距離:4用)=(%-乂/)|#=1q取不同值,分為(1)絕對距離=1)2(1)=乂-X,*Ar=l(2)歐氏距離=2)4式 2) = (同,-xj產(chǎn)*=1(3)切比雪夫距離(“00)dij) = mxik-Xjk(二)馬氏距離(三)蘭氏距離對變量的相似性,我們更多地要了解變量的變化趨勢或變化方向,因此用相關(guān)性進(jìn)行衡量。將變量看作P維空間的向量,一般用

10、(一)夾甬余弦(二)相關(guān)系數(shù)試述K均值法與系統(tǒng)聚類法的異同。答:相同:K均值法和系統(tǒng)聚類法一樣,都是以距離的遠(yuǎn)近親疏為標(biāo)準(zhǔn)進(jìn)行聚類的。不同:系統(tǒng)聚類對不同的類數(shù)產(chǎn)生一系列的聚類結(jié)果,而K一均值法只能產(chǎn)生指定類數(shù)的聚類結(jié)果。具體類數(shù)的確定,離不開實(shí)踐經(jīng)臉的積累;有時(shí)也可以借助系統(tǒng)聚美法以一部分樣品為對象進(jìn)行聚類,其結(jié)果 作為K均值法確定類數(shù)的參考。1試述主成分分析的基本思想。6.2 主成分分析的作用體現(xiàn)在何處?3簡述主成分分析中累積貢獻(xiàn)率的具體含義。6.5 試述根據(jù)協(xié)差陣進(jìn)行主成分分析和根據(jù)相關(guān)陣進(jìn)行主成分分析的區(qū) 別。6. 1試述主成分分析的基本思想。答:我們處理的問題多是多指標(biāo)變量問題,由于

11、多個(gè)變量之間往往存在著一定程度的相關(guān)性,人們希望能通過線性 組合的方式從這些指標(biāo)中盡可能快的提取信息。當(dāng)?shù)谝粋€(gè)組合不能提取更多信息時(shí),再考慮第二個(gè)線性組合。繼續(xù) 這個(gè)過程,直到提取的信息與原指標(biāo)差不多時(shí)為止。這就是主成分分析的基本思想。6. 2 主成分分析的作用體現(xiàn)在何處?答:一般說來,在主成分分析適用的場合,用較少的主成分就可以得到較多的信息量。以各個(gè)主成分為分量,就得 到一個(gè)更低維的隨機(jī)向量;主成分分析的作用就是在降低數(shù)據(jù)“維數(shù)”的同時(shí)又保留了原數(shù)據(jù)的大部分信息。6.3簡述主成分分析中累積貢獻(xiàn)率的具體含義。答:主成分分析把P個(gè)原始變量X,X?,X。的總方差江四)分解成了 P個(gè)相互獨(dú)立的變量

12、工,匕,,的方差之和 o主成分分析的目的是減少變量的個(gè)數(shù),所以一般不會使用所有p個(gè)主成分的,忽略一些帶有較小方差的主成 分將不會給總方差帶來太大的影響。這里我們稱e=4/與4為第攵個(gè)主成分匕的貢獻(xiàn)率。第一主成分的貢獻(xiàn)率 最大,這表明綜合原始變量X1,X2,Xp的能力最強(qiáng),而打,匕,,Yp的綜合能力依次遞減。若只取加(p) 個(gè)主成分,則稱匕,=之人/次4 為主成分,,工的累計(jì)貢獻(xiàn)率,累計(jì)貢獻(xiàn)率表明X,,匕綜合K,x?,X, 女-I /的能力。通常取團(tuán),使得累計(jì)貢獻(xiàn)率達(dá)到一個(gè)較高的百分?jǐn)?shù)(如85%以上)6.5試述根據(jù)協(xié)差陣進(jìn)行主成分分析和根據(jù)相關(guān)陣進(jìn)行主成分分析的區(qū)別。答:從相關(guān)陣求得的主成分與協(xié)

13、差陣求得的主成分一般情況是不相同的。從協(xié)方差矩陣出發(fā)的,其結(jié)果受變量單 位的影響。主成分傾向于多歸納方差大的變量的信息,對于方差小的變量就可能體現(xiàn)得不夠,也存在“大數(shù)吃小數(shù)” 的問題。實(shí)際表明,這種差異有時(shí)很大。我們認(rèn)為,如果各指標(biāo)之間的數(shù)量級相差懸殊,特別是各指標(biāo)有不同的物 理量綱的話,較為合理的做法是使用R代替Z。對于研究經(jīng)濟(jì)問題所涉及的變量單位大都不統(tǒng)一,采用R代替Z后, 可以看作是用標(biāo)準(zhǔn)化的數(shù)據(jù)做分析,這樣使得主成分有現(xiàn)實(shí)經(jīng)濟(jì)意義,不僅便于剖析實(shí)際問題,又可以避免突出數(shù) 值大的變量。7.1試述因子分析與主成分分析的聯(lián)系與區(qū)別。7. 2因子分析主要可應(yīng)用于哪些方面?7. 3簡述因子模型X

14、 =力丫 + 中載荷矩陣A的統(tǒng)計(jì)意義。7.4在進(jìn)行因子分析時(shí),為什么要進(jìn)行因子旋轉(zhuǎn)?最大方差因子旋轉(zhuǎn)的 基本思路是什么?試述因子分析與主成分分析的聯(lián)系與區(qū)別。答:因子分析與主成分分析的聯(lián)系是:兩種分析方法都是一種降維、簡化數(shù)據(jù)的技術(shù)。兩種分析的求解過程是 類似的,都是從一個(gè)協(xié)方差陣出發(fā),利用特征值、特征向量求解。因子分析可以說是主成分分析的姐妹篇,將主成 分分析向前推進(jìn)一步便導(dǎo)致因子分析。因子分析也可以說成是主成分分析的逆問題。如果說主成分分析是將原指標(biāo) 綜合、歸納,那么因子分析可以說是將原指標(biāo)給予分解、演繹。因子分析與主成分分析的主要區(qū)別是:主成分分析本質(zhì)上是一種線性變換,將原始坐標(biāo)變換到變

15、異程度大的方 向上為止,突出數(shù)據(jù)變異的方向,歸納重要信息。而因子分析是從顯在變量去提煉潛在因子的過程。此外,主成分 分析不需要構(gòu)造分析模型而因子分析要構(gòu)造因子模型。因子分析主要可應(yīng)用于哪些方面?答:因子分析是一種通過顯在變量測評潛在變量,通過具體指標(biāo)測評抽象因子的統(tǒng)計(jì)分析方法。目前因子分析在心 理學(xué)、社會學(xué)、經(jīng)濟(jì)學(xué)等學(xué)科中都有重要的應(yīng)用。具體來說,因子分析可以用于分類。如用考試分?jǐn)?shù)將學(xué)生的學(xué) 習(xí)狀況予以分類;用空氣中各種成分的比例對空氣的優(yōu)劣予以分類等等因子分析可以用于探索潛在因素。即是探 索未能觀察的或不能觀測的的潛在因素是什么,起的作用如何等e對我們進(jìn)一步研究與探討指示方向。在社會調(diào)查 分

16、析中十分常用。因子分析的另一個(gè)作用是用于時(shí)空分解。如研究幾個(gè)不同地點(diǎn)的不同日期的氣象狀況,就用因 子分析將時(shí)間因素引起的變化和空間因素引起的變化分離開來從而判斷各自的影響和變化規(guī)律。7. 3簡述因子模型X = AY + 中載荷矩陣A的統(tǒng)計(jì)意義。答:對于因子模型X, =6+02巴+傳與+。加耳 +與i = 1,2, .a2 abn因子載荷陣為A = % % =(ApA2,.Mwi) 41aP2”.X,與尸的協(xié)方差為:mCov( xr.,Fj) = Cov( Z aik 鼻 +)in=Cov( Z aik & ,) + Cov(馬,5) AM二a v若對X,作標(biāo)準(zhǔn)化處理,”產(chǎn)戶與,因此 %一方面表

17、示Xj對5的依賴程度;另一方面也反映了變量X對公共因子 “,的相對重要性。m變量共同度6=ZGi = l,2,p1。區(qū).)=%。(石)+ *。(乃)+ - + *夕(月”)+。(0)=廳+。:說明變量X,的方差由兩部分組成:第一部分為 共同度后,它描述了全部公共因子對變量X,的總方差所作的貢獻(xiàn),反映了公共因子對變量X,的影響程度。第二部 分為特殊因子與對變量X,的方差的貢獻(xiàn),通常稱為個(gè)性方差。而公共因子號對X的貢獻(xiàn)g;=之娠j = l,2,,加表示同一公共因子與對各變量所提供的方差貢獻(xiàn)之總和,它是衡量每一個(gè)公共因子相對重要性的一個(gè)尺度。7.4 在進(jìn)行因子分析時(shí),為什么要進(jìn)行因子旋轉(zhuǎn)?最大方差因

18、子旋轉(zhuǎn)的基本思路是什么?答:因子分析的目標(biāo)之一就是要對所提取的抽象因子的實(shí)際含義進(jìn)行合理解釋。但有時(shí)直接根據(jù)特征根、特征向量 求得的因子載荷陣難以看出公共因子的含義。這種因子模型反而是不利于突出主要矛盾和矛盾的主要方面的,也很 難對因子的實(shí)際背景進(jìn)行合理的解釋。這時(shí)需要通過因子旋轉(zhuǎn)的方法,使每個(gè)變量僅在一個(gè)公共因子上有較大的載 荷,而在其余的公共因子上的載荷比較小。最大方差旋轉(zhuǎn)法是一種正交旋轉(zhuǎn)的方法,其基本思路為:ldll d12 dim A -/l - : AI% % dpm其中令A(yù) =Ar = q)pxm, 4)=%4 4 =3工p的第j列元素平方的相對方差可定義為匕=_L(g_7,)2p

19、 i-i丫=匕+匕+囁最大方差旋轉(zhuǎn)法就是選擇正交矩陣T,使得矩陣A所有m個(gè)列元素平方的相對方差之和達(dá)到最大。什么是對應(yīng)分析?它與因子分析有何關(guān)系?2試述對應(yīng)分析的基本思想。試述對應(yīng)分析的基本步驟。8. 1什么是相應(yīng)分析?它與因子分析有何關(guān)系?答:相應(yīng)分析也叫對應(yīng)分析,通常意義下,是指兩個(gè)定性變量的多種水平進(jìn)行相應(yīng)性研究。其特點(diǎn)是它所研究 的變量可以是定性的。相應(yīng)分析與因子分析的關(guān)系是:在進(jìn)行相應(yīng)分析過程中,計(jì)算出過渡矩陣后,要分別對變量和樣本進(jìn)行因子 分析。因此,因子分析是相應(yīng)分析的基礎(chǔ)。具體而言,L(Z%) =Ay (Zu/)式表明為相對于特征值乙的關(guān)于因 素A各水平構(gòu)成的協(xié)差陣的特征向量。

20、從而建立了相應(yīng)分析中R型因子分析和Q型因子分析的關(guān)系。8. 2試述相應(yīng)分析的基本思想。答:相應(yīng)分析,是指對兩個(gè)定性變量的多種水平進(jìn)行分析。設(shè)有兩組因素A和B,其中因素A包含r個(gè)水平,因 素B包含c個(gè)水平。對這兩組因素作隨機(jī)抽樣調(diào)查,得到一個(gè),XC的二維列聯(lián)表,記為K =(勺)。要尋求列聯(lián) 表列因素A和行因素B的基本分析特征和最優(yōu)列聯(lián)表示。相應(yīng)分析即是通過列聯(lián)表的轉(zhuǎn)換,使得因素A和因素B 具有對等性,從而用相同的因子軸同時(shí)描述兩個(gè)因素各個(gè)水平的情況。把兩個(gè)因素的各個(gè)水平的狀況同時(shí)反映到具有相同坐標(biāo)軸的因子平面上,從而得到因素A、B的聯(lián)系。8.3試述相應(yīng)分析的基本步驟。答:(1)建立列聯(lián)表設(shè)受制于

21、某個(gè)載體總體的兩個(gè)因素為A和8,其中因素A包含,個(gè)水平,因索8包含c個(gè)水平。對這兩組因索作 隨機(jī)抽樣調(diào)查,得到一個(gè)rxc的二維列聯(lián)表,記為*=(晶)火,(2)將原始的列聯(lián)資料K=(kij) r c變換成矩陣Z=(zij) r c,使得zij對因素A和列因素B具有對等性。通kv Z=過變換“ 耐。得=ZZ, Er=ZZ(3)對因素B進(jìn)行因子分析。計(jì)算出=ZZ的特征向量%,及其相應(yīng)的特征向量口計(jì)算出因素B的因子(% 2U)=(瓦”,網(wǎng),2,匹總)(4)對因素A進(jìn)行因子分析。計(jì)算出E, =ZZ的特征向量乙,乙,4n及其相應(yīng)的特征向量/,?,計(jì)算出因素A的因子(匕,乙匕“)=也叫選取因素B的第一、第二

22、公因子內(nèi),“2選取因素A的第一、第二公因子看“2將 B 因素的 c 個(gè)水平, ,21,22),(cl,c2)A因素的r個(gè)水平11,心)(嗔1,%)匕”蘇同時(shí)反應(yīng)到相同坐標(biāo)軸的因子平面上上(6)根據(jù)因素A和因素B各個(gè)水平在平面圖上的分布,描述兩因素及各個(gè)水平之間的相關(guān)關(guān)系。什么是典型相關(guān)分析?簡述其基本思想。什么是典型變量?它具有哪些性質(zhì)?試分析一組變量的典型變量與其主成分的聯(lián)系與區(qū)別。1什么是典型相關(guān)分析?簡述其基本思想。答:典型相關(guān)分析是研究兩組變量之間相關(guān)關(guān)系的一種多元統(tǒng)計(jì)方法。用于揭示兩組變量之間的在聯(lián)系。典型 相關(guān)分析的目的是識別弁量化兩組變量之間的聯(lián)系。將兩組變量相關(guān)關(guān)系的分析轉(zhuǎn)化為

23、一組變量的線性組合與另一 組變量線性組合之間的相關(guān)關(guān)系。基本思想:(1)在每組變量中找出變量的線性組合,使得兩組的線性組合之間具有最大的相關(guān)系數(shù)。即:若設(shè)X=(X?,X;),X?)、X=(X,是兩組相互關(guān)聯(lián)的隨機(jī)變量,分別在兩組變量中選 取若干有代表性的綜合變量Ui、Vi,使是原變量的線性組合。4=4取?+姆欠?+.+嘮X;)Wx 匕=邛乂+城貨+4X* =b(f)X(2)在O(aX)= O(b”X)=1的條件下,使得p(aX,b“)X)達(dá)到最大。(2)選取和最初挑選的這對線性 組合不相關(guān)的線性組合,使其配對,并選取相關(guān)系數(shù)最大的一對。(3)如此繼續(xù)下去,直到兩組變量之間的相關(guān)性被提取完畢為此

24、。9.2什么是典型變量?它具有哪些性質(zhì)?答:在典型相關(guān)分析中,在一定條件下選取系列線性組合以反映兩組變量之間的線性關(guān)系,這被選出的線性組合配 對被稱為典型變量。具體來說,X=(X;D,X;D,X” X=(X),X;2),xf)Uj=q a 1 X)+, + 與 Xp = a Av =4+*x+ +”)x 2ax在)(aX)=O(b”X)=1的條件下,使得p(aX,bX)達(dá)到最大,則稱aX)、bX是X(,)、 X的第一對典型相關(guān)變量。典型變量性質(zhì):典型相關(guān)量化了兩組變量之間的聯(lián)系,反映了兩組變量的相關(guān)程度。. ?!?= 1,。(匕)=1 (攵=1,2,j)CY“(q,Uj) = O, CYw (

25、憶匕)=0 (以力4工0 (i = ),i = l,2,.,r).。1,,匕)=。(i 芋 j)0(jr)9.3試分析一組變量的典型變量與其主成分的聯(lián)系與區(qū)別。答:一組變量的典型變量和其主成分都是經(jīng)過線性變換計(jì)算矩陣特征值與特征向量得出的。主成分分析只涉及一組 變量的相互依賴關(guān)系而典型相關(guān)則獷展到兩組變量之間的相互依賴關(guān)系之中,度量了這兩組變量之間聯(lián)系的強(qiáng)度。4.8某趣市經(jīng)銷十種品牌的飲料,其中有四種暢銷,三種滯銷,三種平銷。 下表是這十種品牌飲料的銷售價(jià)格(元)和顧客對各種飲料的口味評分、 信任度評分的平均數(shù)。6. 8利用主成分分析法,綜合評價(jià)六個(gè)工業(yè)行業(yè)的經(jīng)濟(jì)效益指標(biāo)。6.10根據(jù)習(xí)題5.

26、10中2003年我國省會城市和計(jì)劃單列市的主要經(jīng)濟(jì)指 標(biāo)數(shù)據(jù),利用主成分分析法對這些地區(qū)進(jìn)行分類。7.8某汽車組織欲根據(jù)一系列指標(biāo)來預(yù)測汽車的銷售情況,為了避免有些 指標(biāo)間的相關(guān)關(guān)系影響預(yù)測結(jié)果,需首先進(jìn)行因子分析來簡化指標(biāo)系統(tǒng)。 下表是抽查歐洲某汽車市場7個(gè)品牌不同型號的汽車的各種指標(biāo)數(shù)據(jù),試 用因子分析法找出其簡化的指標(biāo)系統(tǒng)。4.8某超市經(jīng)銷十種品牌的飲料,其中有四種場銷,三種滯銷,三種平銷。下表是這十種品牌飲料的銷售價(jià)格(元) 和顧客對各種飲料的口味評分、信任度評分的平均數(shù)。銷售情況產(chǎn)品序號銷售價(jià)格口味評分信任度評分12.258暢銷22.56733.03943.28652.876平銷63

27、.58774.89881.734滯銷92.242102.743(1)根據(jù)數(shù)據(jù)建立貝葉斯判別函數(shù),并根據(jù)此判別函數(shù)對原樣本進(jìn)行回判。(2)現(xiàn)有一新品牌的飲料在該超市試銷,其銷售價(jià)格為3.0,顧客對其口味的評分平均為8,信任評分平均為5, 試預(yù)測該飲料的銷售情況。解:增加group變量,令暢銷、平銷、滯銷分別為groups 2、3:銷售價(jià)格為尤,口味評分為X2,信任度評分為 X3,用spss解題的步驟如下:.在SPSS窗口中選擇Ana I yze- CI ass i f y-D i scr i m i nate,調(diào)出判別分析主界面,將左邊的變量列表 中的“group”變量選入分組變量中,將Xi、X

28、z、X3變量選入自變量中,并選擇Enter independents together 單選按鈕,即使用所有自變量進(jìn)行判別分析。.點(diǎn)擊Define Range按鈕,定義分組變量的取值國。本例中分類變量的圍為1到3,所以在最小值和最 大值中分別揄入1和3。單擊Continue按鈕,返回主界面。如圖4. 1圖4.1判別分析主界面.單擊Statistics按鈕,指定揄出的描述統(tǒng)計(jì)量和判別函數(shù)系數(shù)選中Function Coefficients欄 中的Fisher s:給出Bayes判別函數(shù)的系數(shù)。(注意:這個(gè)選項(xiàng)不是要給出Fisher判別函數(shù)的系數(shù)。這 個(gè)復(fù)選框的名字之所以為Fished s,是因?yàn)榘?/p>

29、判別函數(shù)值最大的一組進(jìn)行歸類這種思想是由Fisher提 出來的。這里極易混淆,請讀者注意辨別。)如圖4.2。單擊Continue按鈕,返回主界面。圖4. 2 stat i st ics子對話框.單擊Classify按鈕,彈出classification子對話框,選中Display選項(xiàng)欄中的Summary table復(fù) 選框,即要求揄出錯(cuò)判矩陣,以便實(shí)現(xiàn)題中對原樣本進(jìn)行回判的要求。如圖4. 3。圖 4. 3 class if icat ion 對話框.返回判別分析主界面,單擊0K按鈕,運(yùn)行判別分析過程,1)根據(jù)判別分析的結(jié)果建立Bayes判別函數(shù):Bayes判別函數(shù)的系數(shù)見表4. 1 o表中每一

30、列表示樣本判入相應(yīng)類的Bayes判別函數(shù)系數(shù)。由此可建立判別函數(shù)如下:Groupl :yi = -81.843-11.689% 1 + 12.297X2 + 16.761X3Group2 :Y2 = -94.536-10.707X 1 +13.361X2 + 17.086X3Groups :Y3 = -17.449- 2.194X1+4.960X2+6.447X3將各樣品的自變量值代入上述三個(gè)Bayes判別函數(shù),得到三個(gè)函數(shù)值。比較這三個(gè)函數(shù)值,哪個(gè)函數(shù)值比較大就可 以判斷該樣品判入哪一類。Classification Function Coeffioientsgroup123x1-11.68

31、9-10. 707-2. 194x212.29713. 3614. 960 x316. 76117. 0866. 447(Constant)-81.843-94. 536-17. 449Fisher * s I inear di scr iminant functions表4.1Bayes判別函數(shù)系數(shù)根據(jù)此判別函數(shù)對樣本進(jìn)行回判,結(jié)果如表4.2。從中可以看出在4種暢銷飲料中,有3種被正確地判定,有1種被錯(cuò) 誤地判定為平銷飲料,正確率為753 在3種平銷飲料中,有2種被正確判定,有1種被錯(cuò)誤地判定為暢銷飲料,正確 率為66.7%。3種滯銷飲料均正確判定。整體的正確率為80.0機(jī)Classific

32、ation Results1groupPredicted Group MembershipTotal123Or iginal Count131042120330033%175.025.0.0100.0233.366.7.0100.03.0.0100.0100.0a. 80.0% of original grouped cases correctly classified.表4.2錯(cuò)判矩陣2)該新飲料的Xl = 3.0, X2 = 8, X3 = 5,將這3個(gè)自變量代入上一小題得到的Bayes判別函數(shù),丫2的值最大, 該飲料預(yù)計(jì)平銷。也可通過在原樣本中增加這一新樣本,重復(fù)上述的判別過程,并在cl

33、assification子對話框 中同時(shí)要求輸出casewise results,運(yùn)行判別過程,得到相同的結(jié)果。8利用主成分分析法,綜合評價(jià)六個(gè)工業(yè)行業(yè)的經(jīng)濟(jì)效益指標(biāo)。單位:(億元)行業(yè)名稱資產(chǎn)固定資產(chǎn)凈產(chǎn)品銷利潤總計(jì)值平均余額售收入總額原炭開采和選業(yè)6917.23032. 7683.361.6石油和天然氣開采業(yè)5675. 93926. 2717.533877黑色金屬礦采選業(yè)768. 1221.296.513.8有色金屬礦采選業(yè)622.4248116.421.6非金屬礦采選業(yè)699.9291.584.96.2其它采礦業(yè)1.60.50.30解:令資產(chǎn)總計(jì)為X1,固定資產(chǎn)凈值平均余額為X2,產(chǎn)品銷

34、售收入為X3,利泗總額為X4,用SPSS對這六個(gè)行業(yè)進(jìn) 行主成分分析的方法如下:. 在SPSS窗口中選擇AnalyzeTData ReductionTFactor菜單項(xiàng),調(diào)出因子分析主界面,并將變量X1X$移入Variables框中,其他均保持系統(tǒng)默認(rèn)選項(xiàng),單擊0K按鈕,執(zhí)行因子分析過程(關(guān)于因子分子在SPSS 中實(shí)現(xiàn)的詳細(xì)過程,參見7.7)。得到如表6.1所示的特征根和方差貢獻(xiàn)率表和表6. 2所示的因子載荷陣。第一個(gè)因子就可以解釋86. 5%表6.1特征根和方差貢獻(xiàn)率表解釋的總方差能錯(cuò)初始特林值程即平方和錢人合計(jì)有差的%累祖先合計(jì)方差的%累積%12343.460 .537 .002 .000

35、86.49913.434.060.00786.49999.93399.993100.0003.46086,49986.499表6.2因子載荷陣成份矩陣成份1x1.947X2.999x3,986X4,769.將表6.2中因子載荷陣中的數(shù)據(jù)揄入SPSS數(shù)據(jù)編輯窗口,命名為H。點(diǎn)擊菜單項(xiàng)中的TransformTCompute, 調(diào)出Compute variable對話框,在對話框中榆入等式:z1=a1 / S0RT3. 46),計(jì)算第一個(gè)特征向量。點(diǎn)擊OK按鈕,即可在數(shù)據(jù)編輯窗口中得到以ZI為變量名的 第一特征向量。表6.3特征向量矩陣z1x10. 509x20. 537x30. 530 x40.

36、413根據(jù)表6. 3得主成分的表達(dá)式:Yl= 0.509X 1+0.537X2+0.530X3+0.413X4.再次使用Compute命令,調(diào)出Compute variable對話框,在對話框中輸入等式:yl = 0.509*xl + 0.537*x2 + 0.53*x3 + 0.413*x4根據(jù)六個(gè)工業(yè)行業(yè)計(jì)算所的y1的大小可得石油和天然氣開采業(yè)的經(jīng)濟(jì)效益最好,煤炭開采和選業(yè)其次,接著依次 是黑色金屬、非金屬、有色金屬和其他采礦業(yè)。6. 10根據(jù)習(xí)題5. 10中2003年我國省會城市和計(jì)劃單列市的主要經(jīng)濟(jì)指標(biāo)數(shù)據(jù),利用主成分分析法對這些地區(qū)進(jìn) 行分類。解:用SPSS進(jìn)行主成分分析的具體方法參

37、見6. 8,分析結(jié)果如下:表6.7特征根和方差貢獻(xiàn)率表解釋的總方差“船初始特征值棉取平方和載入合計(jì)方差的先累租合計(jì)方差的%累積15.05856.19956.1995.05856.19956.19922.39026.55182.7502.39026.55182.7503.8149.04191.7904.3413.78495.5755.2482.75998.3336,1001.10899.4417,027.30499.7448.020.21999.9649.003.0361 00.000表6.8因子載荷陣成附持陣口成份12X1.655.722X2.629.736X3.315-.444X4.694-

38、.571若.908-.302義6.894-.419)c7.687.607x8.883.180z9.882-.370表6.6特征向量能陣z1z2x10. 290. 47x20. 280. 48x30. 14-0. 29x40.31-0. 37x50. 40-0. 20 x60. 40-0. 27x70.310. 39x80. 390. 12x90. 39-0. 24根據(jù)表6. 6得主成分的表達(dá)式:K1 = 0.29X1 + 0.28X2+0.14X3+0.31X4+0.4X5-0.4X6+0.31X7 + 0.39X8+0.39X9Y2 = O.47X1+0.48X2-0.29X3-0.37X4

39、-0.2X5-0.27X6+0.39X7+0.12X8-0.24X9分別計(jì)算出以上三項(xiàng)后,利用公式丫 =工丫2得到綜合得分并排序如下表:5? 2?地區(qū)yiy2y170038.89254204. 05197055. 9070185.8834213.0258638. 5950894. 5369593.9356897. 0455849. 2132174. 5848249. 6542167. 7129244.9838019.5140552.8528367. 3436641.3045747. 3811555.7334771.8645747. 3811555.7334771.8639597. 902108

40、0.5233653. 8239597. 9021080.5233653. 8236680. 7525804. 6533189.5235237. 2714552.4628597. 4431830.5617629.5327272. 0325149. 7316499.3922372. 9722734. 1616326. 9720677. 45烏魯木齊22284. 5415284.6820037. 5923184. 9912310.2219694. 1923909.279770. 5619370. 7521524. 9514179.2119166. 9633808.79-17638. 7317294.

41、 1419445.429809.9916352.4518561.819822. 9015756. 6216568.9713769.8015670. 4417666. 7011325.7715631.2618494. 348579.7215311.75呼和浩特16128. 6013359.1015239. 5918845.236252.5414802. 9818229.337399. 6214752. 9916764. 154871.9712946. 7614598.409288.2012893. 8315782.076297. 2012737. 4314319.858659. 4112502.

42、 8512865.9710960.0812254. 1815339.904138.4811744. 2427859.53-22407. 6611723. 7610450. 626144.519068.3611526. 862677. 298686. 15最后的分類可以根據(jù)最終得分Y的值來劃分,由于沒有給出具體的分類標(biāo)準(zhǔn),具體分類結(jié)果根據(jù)各人的主觀意愿可 以有多種答案??梢詺w為一類,屬于文科學(xué)習(xí)能力的指標(biāo);第二個(gè)公共因子在前三個(gè)指標(biāo)上有較大載荷,同樣可以歸為一類,這三 個(gè)指標(biāo)同屬于理科學(xué)習(xí)能力的指標(biāo)。根據(jù)表7.3易得:Fl = 0.064X 1 + 0.085X2 + 0.137X3 + 0.3

43、32X4 + 0.378X5 + 0.432X6F2 = 0.439X1+0.400X2+0.484X3+0.014X4+0.073X5+0.169X6表7.3因子得分系數(shù)矩陣成份得分系數(shù)蛭陣成份12x1.064.439x2.085.400 x3.137.484x4.332-.014x5.378.073x6.432.169將每個(gè)學(xué)生的六門成績分別代入F1、F2,比較兩者的大小,F(xiàn)1大的適合學(xué)文,F(xiàn)2大的適合學(xué)理。計(jì)算結(jié)果為學(xué)號是1、16、24的學(xué)生適合學(xué)文,其余均適合學(xué)理。7.8某汽車組織欲根據(jù)一系列指標(biāo)來預(yù)測汽車的銷售情況,為了避免有些指標(biāo)間的相關(guān)關(guān)系影響預(yù)測結(jié)果,需首先 進(jìn)行因子分析來簡化

44、指標(biāo)系統(tǒng)。下表是抽查歐洲某汽車市場7個(gè)品牌不同型號的汽車的各種指標(biāo)數(shù)據(jù),試用因子分析法找出其簡化的指標(biāo)系統(tǒng)。品牌價(jià)格發(fā)動機(jī)功率軸距寬長軸距燃料 容量燃料 效率A215001.8140101.267.3172.42.63913.228A284003.2225108. 170.3192.93.51717.225A420003.5210114.671. 4196.63.85018.022B239901.8150102.668.2178.02.99816.427B339502.8200108.776.1192.03.56118.522B620004.2310113.074.0198.23.90223.721C269902.5170107.368.4176.03. 17916.626C334002.8193107.368.5176.03. 19716.624C389002.8193111.470.9188.03.47218.525D219753.

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論