多元統(tǒng)計(jì)分析及R語(yǔ)言建??荚嚲韄第1頁(yè)
多元統(tǒng)計(jì)分析及R語(yǔ)言建??荚嚲韄第2頁(yè)
多元統(tǒng)計(jì)分析及R語(yǔ)言建??荚嚲韄第3頁(yè)
多元統(tǒng)計(jì)分析及R語(yǔ)言建??荚嚲韄第4頁(yè)
多元統(tǒng)計(jì)分析及R語(yǔ)言建??荚嚲韄第5頁(yè)
已閱讀5頁(yè),還剩3頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、-. z.- - - z -多元統(tǒng)計(jì)分析及R語(yǔ)言建??荚囋嚲斫處熖顚懻n程名稱:_多元統(tǒng)計(jì)分析_授課教師:_王斌會(huì)_ 考試時(shí)間:_ _年_月_日課程類別必修 選修 考試方式開卷 閉卷 試卷類別(A、B) A 共 8 頁(yè)考生填寫學(xué)院(校) 專業(yè)班(級(jí))*題號(hào)一二三四五六七八九十總分得分得分評(píng)閱人一、簡(jiǎn)答題共5小題,每題6分,共30分1. 常用的多元統(tǒng)計(jì)分析方法有哪些?1多元正態(tài)分布檢驗(yàn)2多元方差-協(xié)方差分析3聚類分析4判別分析5主成分分析6因子分析7對(duì)應(yīng)分析8典型相關(guān)性分析 9定性數(shù)據(jù)建模分析10路徑分析又稱多重回歸、聯(lián)立方程11構(gòu)造方程模型12聯(lián)合分析13多變量圖表示法14多維標(biāo)度法2. 簡(jiǎn)單相

2、關(guān)分析、復(fù)相關(guān)分析和典型相關(guān)分析有何不同?并舉例說(shuō)明之。簡(jiǎn)單相關(guān)分析:簡(jiǎn)單相關(guān)分析是研究現(xiàn)象之間是否存在*種依存關(guān)系,并對(duì)具體有依存關(guān)系的現(xiàn)象探討其相關(guān)方向以及相關(guān)程度,是研究隨機(jī)變量之間的相關(guān)關(guān)系的一種統(tǒng)計(jì)方法。例如,以*、Y分別記小學(xué)生的數(shù)學(xué)與語(yǔ)文成績(jī),感興趣的是二者的關(guān)系如何,而不在于由*去預(yù)測(cè)Y。復(fù)相關(guān)分析;研究一個(gè)變量 *0與另一組變量 (*1,*2,,*n)之間的相關(guān)程度。例如,職業(yè)聲望同時(shí)受到一系列因素收入、文化、權(quán)力的影響,則這一系列因素的總和與職業(yè)聲望之間的關(guān)系,就是復(fù)相關(guān)。復(fù)相關(guān)系數(shù)R0.12n的測(cè)定,可先求出 *0對(duì)一組變量*1,*2,*n的回歸直線,再計(jì)算*0與用回歸直

3、線估計(jì)值憫之間的簡(jiǎn)單直線回歸。復(fù)相關(guān)系數(shù)為R0.12n的取值圍為0R0.12n1。復(fù)相關(guān)系數(shù)值愈大,變量間的關(guān)系愈密切。典型相關(guān)分析就是利用綜合變量對(duì)之間的相關(guān)關(guān)系來(lái)反映兩組指標(biāo)之間的整體相關(guān)性的多元統(tǒng)計(jì)分析方法。它的根本原理是:為了從總體上把握兩組指標(biāo)之間的相關(guān)關(guān)系,分別在兩組變量中提取有代表性的兩個(gè)綜合變量U1和V1分別為兩個(gè)變量組中各變量的線性組合,利用這兩個(gè)綜合變量之間的相關(guān)關(guān)系來(lái)反映兩組指標(biāo)之間的整體相關(guān)性。3. 試說(shuō)明主成分分析和因子分析不同點(diǎn)和一樣之處。主成分分析和因子分析的一樣之處1.都可以降維、分析多個(gè)變量的根本構(gòu)造2.因子分析是主成分分析的進(jìn)一步推廣。主成分分析可被視為一種

4、固定效應(yīng)的因子分析,是因子分析的特列3.都是利用變量之間的相關(guān)性將它們進(jìn)展分類4.主成分分析中,各個(gè)主成分之間互不相關(guān);因子分析中,公因子之間不相關(guān)、特殊因子之間不相關(guān)、公因子與特殊因子之間不相關(guān)主成分分析和因子分析的區(qū)別1、因子分析中是把變量表示成各因子的線性組合,而主成分分析中則是把主成分表示成個(gè)變量的線性組合。2、主成分分析的重點(diǎn)在于解釋個(gè)變量的總方差,而因子分析則把重點(diǎn)放在解釋各變量之間的協(xié)方差。3、主成分分析中不需要有假設(shè)(assumptions),因子分析則需要一些假設(shè)。因子分析的假設(shè)包括:各個(gè)共同因子之間不相關(guān),特殊因子specificfactor之間也不相關(guān),共同因子和特殊因子

5、之間也不相關(guān)。4、主成分分析中,當(dāng)給定的協(xié)方差矩陣或者相關(guān)矩陣的特征值是唯一的時(shí)候,的主成分一般是獨(dú)特的;而因子分析中因子不是獨(dú)特的,可以旋轉(zhuǎn)得到不同的因子。1、因子分析中是把變量表示成各因子的線性組合,而主成分分析中則是把主成分表示成個(gè)變量的線性組合。4. 判別分析以及Fisher判別和Bayes判別的根本思想是什么?判別分析:根據(jù)判別中的組數(shù),可以分為兩組判別分析和多組判別分析;根據(jù)判別函數(shù)的形式,可以分為線性判別和非線性判別;根據(jù)判別式處理變量的方法不同,可以分為逐步判別、序貫判別等;根據(jù)判別標(biāo)準(zhǔn)不同,可以分為距離判別、Fisher判別、Bayes判別法等Fisher判別法;通過(guò)將多維數(shù)

6、據(jù)投影到*一方向上,使得投影之后類與類之間盡可能分開,然后再尋找適宜的判別準(zhǔn)則。Bayes判別法:假設(shè)對(duì)象的先驗(yàn)概率和先驗(yàn)條件概率,而后得到后驗(yàn)概率,由后驗(yàn)概率作出判別。5. 指出綜合評(píng)價(jià)中指標(biāo)的標(biāo)準(zhǔn)化方法及其優(yōu)缺點(diǎn)和有哪些綜合評(píng)價(jià)方法。標(biāo)準(zhǔn)化方法(1)主成分分析法。主成分分析是多元統(tǒng)計(jì)分析的一個(gè)分支。是將其分量相關(guān)的原隨機(jī)向量,借助于一個(gè)正交變換,轉(zhuǎn)化成其分量不相關(guān)的新隨機(jī)向量,并以方差作為信息量的測(cè)度,對(duì)新隨機(jī)向量進(jìn)展降維處理。再通過(guò)構(gòu)造適當(dāng)?shù)膬r(jià)值函數(shù),進(jìn)一步做系統(tǒng)轉(zhuǎn)化。(2)數(shù)據(jù)包絡(luò)分析法。它是創(chuàng)立人以其名字命名的DEA模型CR模型。DEA法不僅可對(duì)同一類型各決策單元的相對(duì)有效性做出評(píng)價(jià)

7、與排序,而且還可進(jìn)一步分析各決策單元非DE有效的原因及其改良方向,從而為決策者提供重要的管理決策信息。(3)模糊評(píng)價(jià)法。模糊評(píng)價(jià)法奠基于模糊數(shù)學(xué)。它不僅可對(duì)評(píng)價(jià)對(duì)象按綜合分值的大小進(jìn)展評(píng)價(jià)和排序,而且還可根據(jù)模糊評(píng)價(jià)集上的值按最大隸屬度原則去評(píng)定對(duì)象的等級(jí)。綜合評(píng)價(jià)方法1、計(jì)分法2、綜合指數(shù)法3、Topsis法 4、秩和比(RSR)法5、層次分析(AHP)法6、模糊評(píng)價(jià)方法7、多元統(tǒng)計(jì)分析方法8、灰色系統(tǒng)評(píng)價(jià)方法得分評(píng)閱人二、證明題共1小題,共20分設(shè)y= a1*1+ a2*2 +ap*pa *,其中a =(a1,a2,ap),* =(*1,*2,*p),求主成分就是尋找*的線性函數(shù)a *使相

8、應(yīng)的方差到達(dá)最大,即Var(a *) = a a 到達(dá)最大,且a a =1,此處為*的協(xié)方差陣。設(shè)的特征根為。試證明下面性質(zhì):1y=U*,UU=I,這里U為*的協(xié)方差陣的特征向量單位化的組成的正交陣。2y的各分量之間是互不相關(guān)的。3y的p個(gè)分量是按方差大小、由大到小排列的。4y的協(xié)方差陣為對(duì)角陣。5,這里 = (ii)pp6證明123:設(shè)的特征向量為U= (u1,u2,up),則UU=I,即U為一正交陣,且= UU= U diag()U=uiui因此a a=a uiui a=(a ui) (aui)=(a ui)2于是a a(a ui)2=(a U) (a U)=a UUa=a a=應(yīng)取時(shí),u

9、1u1= u1u1=故y1= u *就是第一主成分,其方差最大,Var(y1) = Var(u1 *) =同理,Var(yi) = Var(ui *) =另外,Cov(yi, yj)= Cov(ui *, uj *)= uiuj= uiuj= ui uj=0,i因此,有上述可得變量*的主成分是以的特征向量為系數(shù)的線性組合,且主成分y之間互不相關(guān),y的p個(gè)分量是按方差大小、由大到小排列的。性質(zhì)123得證。性質(zhì)4可有123得到。證明性質(zhì)5:由U=,則有= UU于是=tr()=tr(UU)= tr(UU)= tr()=證明性質(zhì)6:6由前面的證明得知令ej=()為單位向量,則*j= ej*,yi= u

10、i *所以,Cov(yi, *j)= Cov(ui *, ej*)= ejD(*) ui= ej ui= ej ui= uij故性質(zhì)6得證得分評(píng)閱人三、運(yùn)算題共3小題,共20分下面左表為五個(gè)觀察值,兩個(gè)變量的數(shù)據(jù),右表為用歐氏距離計(jì)算的距離矩陣,*1*21572713324655661. 10分寫出用R語(yǔ)言分析的命令 (1) 請(qǐng)將數(shù)據(jù)*1和*2寫入R向量中:*1=c(5,7,3,6,6);*1*2=c(7,1,2,5,6);*2 (2) 寫出繪制上面散點(diǎn)圖的R命令:*1=c(5,7,3,6,6);*1*2=c(7,1,2,5,6);*2plot(*1,*2) (3) 寫出繪制系統(tǒng)聚類圖的R命令

11、:*=data.frame(*1,*2);*D=dist(*,diag=TRUE,upper=TRUE);Dhc=hclust(D,plete);hcplot(hc)25分 (1) 寫出計(jì)算下面絕對(duì)距離陣的R命令:*1=c(5,7,3,6,6)*2=c(7,1,2,5,6)*=data.frame(*1,*2);*D=dist(*,diag=TRUE,upper=TRUE,p=1);D1 2 3 4 51 0 8 7 3 22 8 0 5 5 63 7 5 0 6 74 3 5 6 0 15 2 6 7 1 02試在圖中標(biāo)出這些距離3.5分試用最長(zhǎng)距離法對(duì)其進(jìn)展聚類分析,畫出聚類圖,并按二類、

12、三類進(jìn)展分類第一步:計(jì)算距離陣*=data.frame(*1,*2);*D=dist(*,diag=TRUE,upper=TRUE);D第二步:進(jìn)展系統(tǒng)聚類最長(zhǎng)距離法hc=hclust(D,plete);hc第三步:畫出聚類圖1按二類進(jìn)展分類plot(hc);rect.hclust(hc,2)2按三類進(jìn)展分類plot(hc);rect.hclust(hc,3)得分評(píng)閱人四、案例分析題共2小題,共30分我們知道,財(cái)政收入與國(guó)民生產(chǎn)總值和稅收等經(jīng)濟(jì)指標(biāo)有密切的依存關(guān)系。今收集了我國(guó)改革開放以來(lái)財(cái)政收入(y:百億元),國(guó)民生產(chǎn)總值 (*1:百億元),稅收(*2:百億元),進(jìn)出口貿(mào)易總額(*3:百億元

13、),經(jīng)濟(jì)活動(dòng)人口(*4:百萬(wàn)人)的局部數(shù)據(jù),見下表所示,分析財(cái)政收入和國(guó)民生產(chǎn)總值、稅收、進(jìn)出口貿(mào)易總額、經(jīng)濟(jì)活動(dòng)人口之間的關(guān)系。表1 財(cái)政收入多因素分析數(shù)據(jù)y*1*2*3*4199131.4948216.62529.901772.258660.91199234.8337266.51932.969191.196667.82199343.4895345.60542.553112.710674.68199452.1810466.70051.2688203.819681.35199562.4220574.94960.3804234.999688.55199674.0799668.50569.0982

14、241.338697.65199786.5114731.42782.3404269.672708.00199898.7595769.67292.628268.577720.871999114.4408805.794106.8258298.963727.912000133.9523882.281125.8151392.742739.922001163.8604943.464153.0138421.933744.322002189.03641203.327176.3645513.782753.602003217.15251358.228200.1731704.835760.752004263.96

15、471598.783241.6568955.391768.232005316.49291832.174287.78541169.218778.772006387.60202119.235348.04351409.714782.442007513.21782495.299456.21971667.402786.452008613.30353006.700542.19621778.8983790.481. 根本統(tǒng)計(jì)分析和R語(yǔ)言命令15分(1) 如果將該數(shù)據(jù)存入到一個(gè)文本文件reg.t*t中,寫出將該文本數(shù)據(jù)讀入數(shù)據(jù)框dat中的R命令:dat=read.table(reg.t*t,header=T)

16、 (1分)(2) 如果將該數(shù)據(jù)拷貝到剪切板中,寫出將該數(shù)據(jù)讀入數(shù)據(jù)框dat中的R命令:dat=read.table(clipboard,header=T) (1分)(3) 寫出提取2000年數(shù)據(jù)的R命令:dat10, (1分)寫出提取稅收(*2)數(shù)據(jù)的R命令:dat,5 (1分)寫出提取2001年至2008年經(jīng)濟(jì)活動(dòng)人口(*4)數(shù)據(jù)的R命令:dat11:18,5 (1分)(4) 寫出計(jì)算財(cái)政收入統(tǒng)計(jì)量的R命令:summary(y) (2分) Min. 1st Qu. Median Mean 3rd Qu. Ma*. 31.49 65.34 124.20 188.70 252.30 613.30

17、(5) 寫出計(jì)算下面相關(guān)陣R命令:cor(dat) (2分) y *1 *2 *3 *4y 1.0000 0.9924 0.9999 0.9874 0.8736*1 0.9924 1.0000 0.9938 0.9883 0.9126 *2 0.9999 0.9938 1.0000 0.9881 0.8811*3 0.9874 0.9883 0.9881 1.0000 0.8807*4 0.8736 0.9126 0.8811 0.8807 1.0000(6) 寫出計(jì)算下面回歸系數(shù)的R命令:fm=lm(y*1+*2+*3+*4,data=dat);fm(2分)Coefficients:(Int

18、ercept) *1 *2 *3 *4 84.62030 0.00207 1.16908 -0.00305 -0.13391(7) 寫出計(jì)算下面檢驗(yàn)的R命令: summary(fm) (2分)Coefficients: Estimate Std. Error t value Pr(|t|) (Intercept) 84.62030 12.74442 6.64 1.6e-05 *1 0.00207 0.00491 0.42 0.68 *2 1.16908 0.02113 55.32 2e-16 *3 -0.00305 0.00367 -0.83 0.42 *4 -0.13391 0.01969

19、-6.80 1.3e-05 *-Signif. codes: 0 * 0.001 * 0.01 * 0.05 . 0.1 1 Residual standard error: 1.18 on 13 degrees of freedomMultiple R-squared: 0.999, Adjusted R-squared: 0.998 F-statistic: 8.87e+04 on 4 and 13 DF, p-value: |t|) (Intercept) 82.10361 9.04442 9.078 1.76e-07 *2 1.16768 0.00385 303.331 2e-16 *4 -0.12945 0.01318 -9.818 6.36e-08 *-Signif. codes: 0 * 0.001 * 0.01 * 0.05 . 0.1 1 Residual standard error: 1.126 on 15 degrees of freedomMultiple R-squared: 1, Adjusted R-squared: 1 F-statistic: 1.94

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論