多元統(tǒng)計(jì)分析基礎(chǔ)知識(shí)_第1頁(yè)
多元統(tǒng)計(jì)分析基礎(chǔ)知識(shí)_第2頁(yè)
多元統(tǒng)計(jì)分析基礎(chǔ)知識(shí)_第3頁(yè)
多元統(tǒng)計(jì)分析基礎(chǔ)知識(shí)_第4頁(yè)
多元統(tǒng)計(jì)分析基礎(chǔ)知識(shí)_第5頁(yè)
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、精選優(yōu)質(zhì)文檔-傾情為你奉上非約束排序聚類分析的目的在于尋找數(shù)據(jù)的間斷性,那么排序的目的在于尋找數(shù)據(jù)的連續(xù)性。排序的重要目的之一是生成可視化的排序圖,非約束排序只是描述性方法,不存在統(tǒng)計(jì)檢驗(yàn)評(píng)估排序結(jié)果顯著性的問題。約束排序需要對(duì)排序結(jié)果進(jìn)行顯著性檢驗(yàn)。非約束排序的方法、和主成分分析(principal component analysis,PCA):基于特征向量的排序方法。分析對(duì)象是原始的定量數(shù)據(jù)。排序圖展示樣方之間的歐氏距離。對(duì)應(yīng)分析(correspondence analysis,CA):分析對(duì)象必須是頻度或類頻度、同量綱的非負(fù)數(shù)據(jù)。排序圖展示行(對(duì)象)或列(變量)之間的卡方距離。在生態(tài)學(xué)

2、中主要用于分析物種數(shù)據(jù)。主坐標(biāo)分析(principal coordinate analysis,PCoA):分析對(duì)象為距離矩陣,而非原始的樣方-變量矩陣表格。非度量多維尺度分析(nonmetric multidimensional scaling,NMDS):與前面三種排序方法不同,不是基于特征向量提取的排序方法。嘗試先預(yù)先設(shè)定數(shù)量的排序軸去排序?qū)ο?,目?biāo)是保持這些對(duì)象排位關(guān)系(ordering relationship)不變。聚類分析聚類分析將個(gè)體或?qū)ο蠓诸?,使得同一類中的?duì)象之間的相似性比與其他類的對(duì)象的相似性更強(qiáng)。其目的在于使類內(nèi)對(duì)象的同質(zhì)性最大化和類與類間對(duì)象的異質(zhì)性最大化。相似樣品(

3、或指標(biāo))的集合稱為類聚類分析方法:1、系統(tǒng)聚類法。2、模糊聚類法。3、K-均值法。4、有序樣品的聚類。5、分解法。6、加入法。當(dāng)各指標(biāo)的測(cè)量值相差較大時(shí),先將數(shù)據(jù)標(biāo)準(zhǔn)化,然后用標(biāo)準(zhǔn)化后的數(shù)據(jù)計(jì)算距離。聚類分析是一種探索性分析,而非統(tǒng)計(jì)檢驗(yàn)。影響聚類結(jié)果的因素包括聚類方法本身和用于聚類分析的關(guān)聯(lián)系數(shù)的選擇。因此選擇與分析目標(biāo)一致的方法非常重要。判別分析回歸模型一般用來預(yù)測(cè)和解釋度量變量,但是對(duì)于非度量變量,一般的多元回歸不適合解決此類問題。判別分析適用于被解釋變量是非度量變量的情形。判別分析的基本要求:分組類型在兩組以上;每組案例的規(guī)模必須至少在一個(gè)以上;解釋變量必須是可測(cè)量的,這樣才能夠計(jì)算其

4、平均值和方差,使其能合理地應(yīng)用于統(tǒng)計(jì)函數(shù)。判別分析的前提假設(shè):1、每一個(gè)判別變量(解釋變量)不能是其他判別變量的線性組合,即不能存在多重共線性的問題;2、各組變量的協(xié)方差矩陣相等;3、各判別變量遵從多元正態(tài)分布。貝葉斯判別貝葉斯(Bayes)統(tǒng)計(jì)的思想是:假定對(duì)研究的對(duì)象已有一定的認(rèn)識(shí),常用先驗(yàn)概率分布來描述這種認(rèn)識(shí),然后我們?nèi)〉靡粋€(gè)樣本,用樣本來修正已有的認(rèn)識(shí)(先驗(yàn)概率分布),得到后驗(yàn)概率分布,各種統(tǒng)計(jì)推斷都通過后驗(yàn)概率分布來進(jìn)行。將貝葉斯思想用于判別分析,就得到貝葉斯判別。費(fèi)歇判別費(fèi)歇判別的思想是投影,將k組p維數(shù)據(jù)投影到某一個(gè)方向,使得組與組之間的投影盡可能地分開。主成分分析主成分分析(

5、principal components analysis) 霍特林1933年提出主成分分析是利用降維的思想,在損失很少信息的前提下,把多個(gè)指標(biāo)轉(zhuǎn)化為幾個(gè)綜合指標(biāo)的多元統(tǒng)計(jì)方法。通常把轉(zhuǎn)化生成的綜合指標(biāo)稱為主成分,其中每個(gè)主成分都是原始變量的線性組合,且各個(gè)主成分之間互不相關(guān),使得主成分比原始變量具有某些更優(yōu)越的性能。主成分分析的主要思想:在保留原始變量盡可能多的信息的前提下達(dá)到降維的目的,從而簡(jiǎn)化問題的復(fù)雜性并抓住問題的主要矛盾。對(duì)于度量單位不同的指標(biāo)或取值范圍彼此差異非常大的指標(biāo),不直接由其協(xié)方差矩陣出發(fā)進(jìn)行主成分分析,而應(yīng)該考慮將數(shù)據(jù)標(biāo)準(zhǔn)化。主成分分析不要求數(shù)據(jù)來自于正態(tài)總體。主成分分析

6、方法適用于變量之間存在較強(qiáng)相關(guān)性的數(shù)據(jù),一般認(rèn)為,當(dāng)原始數(shù)據(jù)大部分變量的相關(guān)系數(shù)都小于0.3時(shí),運(yùn)用主成分分析不會(huì)取得很好的效果。對(duì)原始變量存在多重共線性的問題時(shí),在應(yīng)用主成分分析方法時(shí)一定要慎重。如果得到的樣本協(xié)方差矩陣(或相關(guān)陣)最小的特征根接近于零,這就意味著中心化以后的原始變量之間存在著多重共線性,即原始變量存在著不可忽視的重疊信息。應(yīng)該注意對(duì)主成分的解釋,或者考慮對(duì)最初納入分析的指標(biāo)進(jìn)行篩選。因子分析因子分析(factor analysis)因子分析模型是主成分分析的推廣,它也是利用降維的思想,由研究原始變量的相關(guān)矩陣內(nèi)部的依賴關(guān)系出發(fā),把一些具有錯(cuò)綜復(fù)雜關(guān)系的變量歸結(jié)為少數(shù)幾個(gè)綜合

7、因子的一種多變量統(tǒng)計(jì)分析方法。因子分析的基本思想根據(jù)相關(guān)性大小把原始變量分組,使得同組內(nèi)的變量之間相關(guān)性較高,而不同組的變量間的相關(guān)性則較低。每組變量代表一個(gè)基本結(jié)構(gòu),并用一個(gè)不可觀測(cè)的綜合變量表示,這個(gè)基本結(jié)構(gòu)就稱為公共因子。另一部分是與公共因子無關(guān)的特殊因子。因子分析的步驟:1、根據(jù)研究問題選取原始變量;2、對(duì)原始變量進(jìn)行標(biāo)準(zhǔn)化并求其相關(guān)陣,分析變量之間的相關(guān)性;3、求解初始公共因子及因子載荷矩陣;4、因子旋轉(zhuǎn);5、計(jì)算因子得分;6、根據(jù)因子得分值進(jìn)行進(jìn)一步分析。對(duì)應(yīng)分析對(duì)應(yīng)分析同樣是利用降維的思想來達(dá)到簡(jiǎn)化數(shù)據(jù)結(jié)構(gòu)的目的,不過,與因子分析不同的是,它同時(shí)對(duì)數(shù)據(jù)表中的行與列進(jìn)行處理,尋求以

8、低維圖形表示數(shù)據(jù)表中行與列的關(guān)系。對(duì)應(yīng)分析的一大特點(diǎn)就是可以在一張二維圖上同時(shí)表示出兩類屬性變量的各種狀態(tài),以直觀地描述原始數(shù)據(jù)結(jié)構(gòu)。對(duì)應(yīng)分析廣泛應(yīng)用于對(duì)由屬性變量構(gòu)成的列聯(lián)表數(shù)據(jù)的研究。(定類尺度或定序尺度)有關(guān)概念:行剖面:指當(dāng)行變量A的取值固定為i時(shí),變量B各個(gè)狀態(tài)相對(duì)出現(xiàn)的概率情況。列剖面:指當(dāng)屬性變量B取值為j時(shí),屬性變量A的不同取值的條件概率。距離:加權(quán)的歐式距離??倯T量:n個(gè)點(diǎn)與其重心的加權(quán)歐式距離之和稱為行剖面集合n 的總慣量,記為II 總慣量的概念類似于主成分分析或因子分析中方差總和的概念。對(duì)應(yīng)分析方法也適用于定距尺度與定比尺度的數(shù)據(jù)。對(duì)應(yīng)分析要求數(shù)據(jù)陣中每一個(gè)數(shù)據(jù)都是大于或等于零的。對(duì)應(yīng)分析只能用圖形的方式提示變量之間的關(guān)系,但不能給出具體的統(tǒng)計(jì)量來度量這種相關(guān)程度,這容易使研究者在運(yùn)用對(duì)應(yīng)分析時(shí)得出主觀性較強(qiáng)的結(jié)論。典型相關(guān)分析典型相關(guān)分析(canonical correlation analysis)是研究?jī)山M變量之間相關(guān)關(guān)系的多元分析方法。典型相關(guān)分析研究?jī)山M變量間整體的線性相關(guān)關(guān)系,它是將每一組變量作為一個(gè)整體來進(jìn)行研究,而不是分析每一組變量?jī)?nèi)部的各個(gè)變量。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論