




下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、二名詞解釋 1、多元統(tǒng)計分析:多元統(tǒng)計分析是運用數(shù)理統(tǒng)計的方法來研究多變量(多指標(biāo))問題的理 論和方法,是一元統(tǒng)計學(xué)的推廣 2、聚類分析:是根據(jù)“物以類聚”的道理,對樣品或指標(biāo)進(jìn)行分類的一種多元統(tǒng)計分析方 法。將個體或?qū)ο蠓诸?,使得同一類中的對象之間的相似性比與其他類的對象的相似性更強(qiáng)。 使類內(nèi)對象的同質(zhì)性最大化和類間對象的異質(zhì)性最大化 3、隨機(jī)變量: 是指變量的值無法預(yù)先確定僅以一定的可能性(概率)取值的量。它是由于隨 機(jī)而獲得的非確定值,是概率中的一個基本概念。即每個分量都是隨機(jī)變量的向量為隨機(jī)向 量。類似地,所有元素都是隨機(jī)變量的矩陣稱為隨機(jī)矩陣。 4、統(tǒng)計量:多元統(tǒng)計研究的是多指標(biāo)問題
2、 ,為了了解總體的特征,通過對總體抽樣得到代表 總體的樣本,但因為信息是分散在每個樣本上的 ,就需要對樣本進(jìn)行加工,把樣本的信息濃縮 到不包含未知量的樣本函數(shù)中,這個函數(shù)稱為統(tǒng)計量 二、計算題 16 V 2 設(shè)乂 =滬訂弘3,功其中以=6刀遼=-*4-1 2 T 試判斷可+盹與5 一門是否獨立? I河J 解: X 71 -心;心丹7 +細(xì)貝 IU -6 -16? 三1620 -16 2040 2 10-6-1 滬 阪劃的聯(lián)合分市為場( 1 7 -0 Id 20 ) -3, 廠2040丿 故不獨立- 2.對某地區(qū)農(nóng)村的6名2周羽男嬰的身高,胸圍,上半臂圍進(jìn)行測量 得相關(guān)救摒如下,根據(jù)以往資料”該
3、地區(qū)城市2同歲男嬰的這三個指標(biāo)的 墳值壓= 第二,給出檢驗的統(tǒng)計量及其服從的分布; 第三,給定檢驗水平,查統(tǒng)計量的分布表,確定相應(yīng)的臨界值,從而得到否定域; 第四,根據(jù)樣本觀測值計算出統(tǒng)計量的值,看是否落入否定域中, 以便對待判假設(shè)做出決策 (拒絕或接受)。 2、簡述一下聚類分析的思想 答:聚類分析的基本思想, 是根據(jù)一批樣品的多個觀測指標(biāo),具體地找出一些能夠度量樣品 或指標(biāo)之間相似程度的統(tǒng)計量,然后利用統(tǒng)計量將樣品或指標(biāo)進(jìn)行歸類。把相似的樣品或指 標(biāo)歸為一類,把不相似的歸為其他類。直到把所有的樣品(或指標(biāo))聚合完畢 3、多元統(tǒng)計分析的內(nèi)容和方法 答:1、簡化數(shù)據(jù)結(jié)構(gòu),將具有錯綜復(fù)雜關(guān)系的多個
4、變量綜合成數(shù)量較少且互不相關(guān)的變量, 使研究問題得到簡化但損失的信息又不太多。(1)主成分分析(2)因子分析(3)對應(yīng)分析 等 2、分類與判別,對所考察的變量按相似程度進(jìn)行分類。 (1)聚類分析:根據(jù)分析樣本的各研 究變量,將性質(zhì)相似的樣本歸為一類的方法。 (2)判別分析:判別樣本應(yīng)屬何種類型的統(tǒng)計 方法。 4、系統(tǒng)聚類法基本原理和步驟 答: 1)先計算n個樣本兩兩間的距離 2)構(gòu)造n個類,每個類只包含一個樣本 3)合并距離最近的兩類為一新類 4)計算新類與當(dāng)前各類的距離 5)類的個數(shù)是否等于 1,如果不等于回到 3在做 6)畫出聚類圖 7)決定分類個數(shù)和類 5、聚類分析的類型有: 答: (1
5、)對樣本分類,稱為 Q型聚類分析 (2)對變量分類,稱為 R型聚類分析# Q 型聚類是對樣本進(jìn)行聚類,它使具有相似性特征 的樣本聚集在一起,使差異性大的樣本分離開來。#R型聚類是對變量進(jìn)行聚類,它使具有 相似性的變量聚集在一起,差異性大的變量分離開來,可在相似變量中選擇少數(shù)具有代表性 的變量參與其他分析,實現(xiàn)減少變量個數(shù),達(dá)到變量降維的目的。 6、簡述歐氏距離與馬氏距離的區(qū)別和聯(lián)系。 4.1簡述歐氏距離與馬氏距離時區(qū)別和聯(lián)系. 答=設(shè)p維空閭射中的兩懸1=的血“ XJ 和YPYr-YP D則歐氏距離為 歐氏距離的局隈有在魴元數(shù)據(jù)分析中,其度董不合理.會受到買際間題 中童綱的覚響. 設(shè)X,T是來
6、自均值向重為|J,協(xié)方差為z的總體G中的卩維樣本.則馬氏距離溝 1 1 DtK, Y)= X-Y ; Z X-Y 當(dāng)広 二【即單位陣時陰 Y)=X-Y X-Y = =YJ-即歐氏距離 因此,在一定程度上,歐氏距離是馬氏距離的特殊情況,馬氏距離是歐氏厲的推廣. 7、試述系統(tǒng)聚類的基本思想。 答:系統(tǒng)聚類的基本思想是:距離相近的樣品(或變量)先聚成類,距離相遠(yuǎn)的后聚成類, 過程一直進(jìn)行下去,每個樣品(或變量)總能聚到合適的類中。 8對樣品和變量進(jìn)行聚類分析時所構(gòu)造的統(tǒng)計量分別是什么?簡要說明為什么這樣構(gòu) 造? 答:對樣品進(jìn)行聚類分析時,用距離來測定樣品之間的相似程度。因為我們把n個樣本看作 p維空
7、間的n個點。點之間的距離即可代表樣品間的相似度。常用的距離為 q取不同他,分尚? (1) 絶汨跆禽(1)巧-V |疋議-乂話 (3) 歐氏距離(u 令(2) =(乂 3 1/2 切出雪夫跖離(叼=沖)日卩8=J - ()馬氏距離 (三)里時巨離 心M-xp 我們更多地要了辭變雖的變化趨勢或變化向.因此用相呆性進(jìn)行衝晝“ 対變星的相說性. 捋變壘書ftp維空間的向遠(yuǎn).一股用 )夾用余弦h上 (-)柜董系數(shù) CO E 0 -丘“-和” 9、在進(jìn)行系統(tǒng)聚類時,選擇距離公式應(yīng)遵循哪些原則? 答:(1)要考慮所選擇的距離公式在實際應(yīng)用中有明確的意義。如歐氏距離就有非常明確的 空間距離概念。馬氏距離有消除
8、量綱影響的作用。 (2 )要綜合考慮對樣本觀測數(shù)據(jù)的預(yù)處理和將要采用的聚類分析方法。如在進(jìn)行聚類分析 之前已經(jīng)對變量作了標(biāo)準(zhǔn)化處理,則通常就可采用歐氏距離。 (3)要考慮研究對象的特點和計算量的大小。樣品間距離公式的選擇是一個比較復(fù)雜且?guī)?有一定主觀性的問題, 我們應(yīng)根據(jù)研究對象的特點不同做出具體分折。 實際中,聚類分析前 不妨試探性地多選擇幾個距離公式分別進(jìn)行聚類, 然后對聚類分析的結(jié)果進(jìn)行對比分析, 以 確定最合適的距離測度方法。 10、歐式距離的優(yōu)點缺點 EC式距筈(Eurlii距盟) 對建仇-訶嚴(yán) 優(yōu)點:幾何意義明確,簡單,容易掌握,由于中學(xué)數(shù)學(xué)就已初步接觸,數(shù)學(xué)知識不多的人也 可以把握它的基本含義。 缺點:從統(tǒng)計學(xué)的角度看,使用歐式距離要求一個向量的n個分量不相關(guān),且具有相當(dāng)?shù)姆?差,或者說各個坐標(biāo)對歐式距離的貢獻(xiàn)同等且變差大小相同,此時使用歐式距離才合適,且 效果良好,否則就不能如實反映情況且容易導(dǎo)致錯誤的結(jié)論。因此需要對坐標(biāo)加權(quán),化為統(tǒng) 計距離 11、模糊聚類分析的實質(zhì)和基本原理 答:模糊聚類分析的實質(zhì)就是根據(jù)研究對象本身的屬性而構(gòu)造模糊矩陣,在此基礎(chǔ)上根據(jù)一 定的隸屬度來確定其分類關(guān)系
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 五金制品行業(yè)跨境電商市場細(xì)分領(lǐng)域競爭態(tài)勢與機(jī)遇分析報告
- 兒童樂園項目資金來源與使用計劃詳解
- 企業(yè)如何通過數(shù)字工具提升市場競爭力
- 打造具有影響力的教育領(lǐng)導(dǎo)者形象
- 基于多媒體技術(shù)的辦公效率提升策略研究
- 打造沉浸式學(xué)習(xí)體驗虛擬現(xiàn)實在醫(yī)學(xué)教育中的實踐
- 市政管網(wǎng)建設(shè)項目公共關(guān)系管理與溝通策略
- 化工園區(qū)建設(shè)項目工程監(jiān)理與質(zhì)量控制機(jī)制
- 豆類種植土壤健康管理與修復(fù)考核試卷
- 生態(tài)保護(hù)與音樂節(jié)活動考核試卷
- (PQCDSM)生產(chǎn)現(xiàn)場改善與安全生產(chǎn)管理
- 中外貨物買賣合同FOB條款
- 廣東深圳光明新區(qū)渣土受納場12·20-特別重大滑坡事故調(diào)查報告
- 2022年05月四川省度綿陽市公開遴選公務(wù)員考試參考題庫答案詳解
- T-ZAQ 10116-2023 新時代基層理論宣講0576 工作法操作規(guī)范
- (完整word版)新《中華頌》朗誦稿
- 香云紗的材料與工藝
- 帶電工作絕緣手套CE認(rèn)證EN 60903
- 硫磺安全技術(shù)說明書MSDS
- 我和植物共成長向日葵種植日記課件
- 海南大學(xué)國際教育學(xué)院招考聘用勞務(wù)派遣人員2人模擬檢測試卷【共1000題含答案解析】
評論
0/150
提交評論