




已閱讀5頁,還剩3頁未讀, 繼續(xù)免費閱讀
版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
練習題一、 填空題1人們通過各種實踐,發(fā)現(xiàn)變量之間的相互關系可以分成(相關)和(不相關)兩種類型。多元統(tǒng)計中常用的統(tǒng)計量有:樣本均值、樣本方差、樣本協(xié)方差和樣本相關系數(shù)。2總離差平方和可以分解為(回歸離差平方和)和(剩余離差平方和)兩個部分,其中(回歸離差平方和)在總離差平方和中所占比重越大,則線性回歸效果越顯著。3回歸方程顯著性檢驗時通常采用的統(tǒng)計量是(SR/p)/SE/(n-p-1)。4偏相關系數(shù)是指多元回歸分析中,(當其他變量固定時,給定的兩個變量之間的)的相關系數(shù)。5Spss中回歸方程的建模方法有(一元線性回歸、多元線性回歸、嶺回歸、多對多線性回歸)等。6主成分分析是通過適當?shù)淖兞刻鎿Q,使新變量成為原變量的(線性組合),并尋求(降維)的一種方法。7主成分分析的基本思想是(設法將原來眾多具有一定相關性(比如P個指標),重新組合成一組新的互相無關的綜合指標來替代原來的指標)。8主成分表達式的系數(shù)向量是(相關系數(shù)矩陣)的特征向量。9樣本主成分的總方差等于(1)。10在經(jīng)濟指標綜合評價中,應用主成分分析法,則評價函數(shù)中的權數(shù)為(方差貢獻度)。主成分的協(xié)方差矩陣為(對稱)矩陣。主成分表達式的系數(shù)向量是(相關矩陣特征值)的特征向量。11SPSS中主成分分析采用(analyzedata reductionfacyor)命令過程。12因子分析是把每個原始變量分解為兩部分因素,一部分是(公共因子),另一部分為(特殊因子)。13變量共同度是指因子載荷矩陣中(第i行元素的平方和)。14公共因子方差與特殊因子方差之和為(1)。15聚類分析是建立一種分類方法,它將一批樣品或變量按照它們在性質(zhì)上的(親疏程度)進行科學的分類。16Q型聚類法是按(樣品)進行聚類,R型聚類法是按(變量)進行聚類。17Q型聚類統(tǒng)計量是(距離),而R型聚類統(tǒng)計量通常采用(相關系數(shù))。18六種Q型聚類方法分別為(最長距離法)、(最短距離法)、(中間距離法)、(類平均法)、(重心法)、(離差平方和法)。19快速聚類在SPSS中由(k-均值聚類(analyzeclassifyk means cluster)過程實現(xiàn)。20判別分析是要解決在研究對象已(已分成若干類)的情況下,確定新的觀測數(shù)據(jù)屬于已知類別中哪一類的多元統(tǒng)計方法。21用判別分析方法處理問題時,通常以(判別函數(shù))作為衡量新樣本點與各已知組別接近程度的指標。22進行判別分析時,通常指定一種判別規(guī)則,用來判定新樣本的歸屬,常見的判別準則有(Fisher準則)、(貝葉斯準則)。23類內(nèi)樣本點接近,類間樣本點疏遠的性質(zhì),可以通過(類與類之間的距離)與(類內(nèi)樣本的距離)的大小差異表現(xiàn)出來,而兩者的比值能把不同的類區(qū)別開來。這個比值越大,說明類與類間的差異越(類與類之間的距離越大 ),分類效果越(好 )。24Fisher判別法就是要找一個由p個變量組成的(線性判別函數(shù)),使得各自組內(nèi)點的(離差)盡可能接近,而不同組間點的盡可能疏遠。二、簡答題1、簡述復相關系數(shù)與偏相關系數(shù)。答:復相關系數(shù):又叫多重相關系數(shù)。復相關是指因變量與多個自變量之間的相關關系。例如,某種商品的需求量與其價格水平、職工收入水平等現(xiàn)象之間呈現(xiàn)復相關關系。偏相關系數(shù):又叫部分相關系數(shù)。部分相關系數(shù)反映校正其它變量后某一變量與另一變量的相關關系。偏相關系數(shù)是指多元回歸分析中,當其他變量固定后,給定的兩個變量之間的的相關系數(shù)。偏相關系數(shù)的假設檢驗等同于偏回歸系數(shù)的t檢驗。 復相關系數(shù)的假設檢驗等同于回歸方程的方差分析。2、簡述逐步回歸分析方法的具體實施步驟。答:逐步回歸過程如下:1) 自變量的剔除;2) 重新進行少一個自變量的多元線性回歸分析;3) 重新進行多一個自變量的多元線性回歸分析;4)重新進行上述步驟,直至無法再刪除和再引入自變量為止。3、提取樣本主成分的原則。答:主成分個數(shù)提取原則為主成分對應的特征值大于1的前m個主成分。特征值在某種程度上可以被看成是表示主成分影響力度大小的指標,如果特征值小于1,說明該主成分的解釋力度還不如直接引入一個原變量的平均解釋力度大,因此,一般可以用特征值大于1作為納入標準。4、簡述系統(tǒng)聚類法的基本思想及主要步驟。答:系統(tǒng)聚類的基本思想是:距離相近的樣品(或變量)先聚成類,距離相遠的后聚成類,過程一直進行下去,每個樣品(或變量)總能聚到合適的類中。系統(tǒng)聚類過程是:假設總共有n個樣品(或變量),第一步將每個樣品(或變量)獨自聚成一類,共有n類;第二步根據(jù)所確定的樣品(或變量)“距離”公式,把距離較近的兩個樣品(或變量)聚合為一類,其它的樣品(或變量)仍各自聚為一類,共聚成n-1類;第三步將“距離”最近的兩個類進一步聚成一類,共聚成n-2類;,以上步驟一直進行下去,最后將所有的樣品(或變量)全聚成一類,也簡稱聚集法。還有與以上方法相反的稱分解法。5、簡述快速聚類(k均值聚類)的基本思想及主要步驟。答:基本思想:1.一個樣品分配給最近中心(均值)的類中,將所有樣品分成k個初始類。2.通過歐式距離將每個樣品劃入離中心最近的類中,并對得到樣品或失去樣品的類重新計算中心坐標。3.重復步驟2,直到所有樣品都不能再分配時為止。6、判別分析的分類。答:判別分析是多元統(tǒng)計分析中用于判別樣本所屬類型的一種統(tǒng)計分析方法。判別分析按判別的組數(shù)來分,有兩組判別分析和多組判別分析;按區(qū)分不同總體所用的數(shù)學模型來分,有線性判別和非線性判別;按判別對所處理的變量方法不同,有逐步判別、序貫判別等;按判別準則不同,有距離判別、貝葉斯判別(Bayes)、費歇(Fisher)判別等。7、簡述Fisher判別規(guī)則及具體判別步驟。答:Fisher判別法的基本思想:從多個總體(類)抽取一定的樣本,借助方差分析的思想,建立p個指標的線性判別函數(shù),把待判樣品代入線性判別函數(shù),然后與臨界值比較,就可判樣品屬于哪個類。Fisher判別法的具體算法步驟:由Fisher線性判別式求解向量的步驟:把來自兩類訓練樣本集X分成和兩個子集X1和X2。由,計算。由計算各類的類內(nèi)離散度矩陣 ,i=1,2。計算類內(nèi)總離散度矩陣。計算的逆矩陣。由求解。三、計算題1.現(xiàn)收集了92組合金鋼中的碳含量x及強度y,且求得:(1)求y關于x的一元線性回歸方程;(2)求y與x的相關系數(shù);(3)列出對方程作顯著性檢驗的方差分析表;(4)在x=0.1時,求的點估計。2. 某地區(qū)通過一個樣本容量為722的調(diào)查數(shù)據(jù)得到勞動力受教育年數(shù)的一個回歸方程為 式中,為勞動力受教育年數(shù),為勞動力家庭中兄弟姐妹的個數(shù),與分別為母親與父親受到教育的年數(shù)。問(1)若與保持不變,為了使預測的受教育水平減少一年,需要增加多少?(2)請對的系數(shù)給予適當?shù)慕忉尅#?)如果兩個勞動力都沒有兄弟姐妹,但其中一個的父母受教育的年數(shù)均為12年,另一個的父母受教育的年數(shù)均為16年,則兩人受教育的年數(shù)預期相差多少年3下表給出一二元模型的回歸結(jié)果。方差來源平方和(SS)自由度(d.f.)來自回歸(ESS)65965來自殘差(RSS)總離差(TSS)6604214求:(1)樣本容量是多少?RSS是多少?ESS和RSS的自由度各是多少?(2)和?(3)檢驗假設:解釋變量總體上對有無影響。你用什么假設檢驗?為什么?4在一項研究中,測量了376只雞的骨骼,并利用相關系數(shù)矩陣進行主成分分析,見下表:Y1Y2Y3Y4Y5Y6頭長x1頭寬x2肱骨x3尺骨x4股骨x5脛骨x60.350.330.440.440.430.440.530.700.190.250.280.220.76-0.64-0.05-0.02-0.06-0.05-0.050.000.530.480.510.48-0.040.000.190.150.670.700.000.040.590.630.480.15特征值4.570.710.410.170.080.06(1) 計算前三個主成分各自的貢獻率和累積貢獻率。(2) 對于y4,y5,y6的方差很小這一點,你怎樣對實際情況作出推斷。解:5在一項對楊樹的性狀的研究中,測定了20株楊樹樹葉,每個葉片測定了四個變量:葉長(x1),2/3處寬(x2),1/3處寬(x3),1/2處寬(x4)。這四個變量的相關系數(shù)矩陣的特征根和標準正交特征向量分別為:寫出四個主成分,計算它們的貢獻率。解:各自的主成分為:Z1=0.1485X1-0.5735X2-0.5577X3-0.5814X4Z2=0.9544X1-0.0984X2+0.2695X3+0.0824X4Z3=0.2516X1+0.7733X2-0.5589X3-0.1624X4Z4=-0.0612X1+0.2519X2+0.5513X3-0.7930X4則各自的貢獻率為:W1=2.920/(2.920+1.024+0.049+0.007)=0.73W2=1.024/(2.920+1.024+0.049+0.007)=0.256W2=0.049/(2.920+1.024+0.049+0.007)=0.01225W2=0.007/(2.920+1.024+0.049+0.007)=0.001756對紐約股票市場上的五種股票的周回升率x1,x2,x3,x4,x5進行了主成分分析,其中x1,x2,x3分別表示三個化學工業(yè)公司的股票回升率,x4,x5表示兩個石油公司的股票回升率,主成分分析是從相關系數(shù)矩陣出發(fā)進行的,前兩個特征根和對應的標準正交特征向量為: (1) 計算這兩個主成分的方差貢獻率。解:各自的主成分為:Z1=0.464X1+0.457X2+0.470X3+0.421X4+0.421X5Z2=0.240X1+0.509X2+0.260X3-0.526X4-0.582X5則各自的貢獻率為:W1=2.587/(2.587+0.809)=0.762W2=0.809/(2.587+0.809)=0.238(2) 能否對這兩個主成分的意義作一個合理的解釋,并給兩個主成分命名。答:解釋:由SPSS抽取的兩個主成分,其特征值分別為2.857和0.809,。根據(jù)主成分分析得知:各自的貢獻率為W1=76.2%,W2=23.8%。由此可知,第一個主成分對變量(股票回升率)影響較大。命名:一、化學工業(yè)公司股票回升率 二、石油公司股票回升率7、下面給出了八個樣品的兩個指標數(shù)據(jù)樣指標12345678X1X2244701311239511214316使用按動態(tài)聚類法進行聚類,采用歐氏距離(取1、3、7號樣本為聚點)。解: 四、上機操作會進行回歸、聚類、因子、主成分、判別分析基本操作,上級題目隨機抽取。請指出下面SPSS軟件操作分別代表多元統(tǒng)計分析中什么分析:(1) AnalysisRegr
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024-2030全球鼓泡流化床鍋爐行業(yè)調(diào)研及趨勢分析報告
- 2024-2030全球全碳化硅功率模塊行業(yè)調(diào)研及趨勢分析報告
- 2024年全球及中國帶套囊加強型氣管插管行業(yè)頭部企業(yè)市場占有率及排名調(diào)研報告
- 2025年高壓雙筒打氣筒行業(yè)深度研究分析報告
- 科技計劃項目合作合同8篇
- 2025年個人地產(chǎn)交易合同標準文本
- 2025年化妝品零售加盟合同規(guī)范
- 大型酒店租賃合同范本與大學代理商業(yè)助學貸款借款合同7篇
- 項目借款合同正規(guī)版樣板7篇
- 【代銷合同】個人代銷合同8篇
- (全)電梯安全風險管控清單
- 山東省高院量刑指導意見實施細則
- 教科版五年級科學下冊全套測試卷
- 環(huán)境規(guī)劃與管理第二章理論基礎
- TD-T 1040-2013 土地整治項目制圖規(guī)范
- 《數(shù)字影像設計與制作》統(tǒng)考復習題庫(匯總版)
- 成人有創(chuàng)機械通氣氣道內(nèi)吸引技術操作
- “雙減”下初中道德與法治分層作業(yè)設計研究 論文
- 發(fā)熱待查病例討論優(yōu)秀課件
- 第一章《原子結(jié)構與性質(zhì)》測試題 高二化學人教版(2019)選擇性必修2
- GB/T 24353-2022風險管理指南
評論
0/150
提交評論