多元統(tǒng)計(jì)分析簡介課件_第1頁
多元統(tǒng)計(jì)分析簡介課件_第2頁
多元統(tǒng)計(jì)分析簡介課件_第3頁
多元統(tǒng)計(jì)分析簡介課件_第4頁
多元統(tǒng)計(jì)分析簡介課件_第5頁
已閱讀5頁,還剩59頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

多元統(tǒng)計(jì)分析簡介1.聚類分析2判別分析3主成分分析4.典型相關(guān)分析1.聚類分析聚類分析又稱群分析,它是研究分類問題的種多元統(tǒng)計(jì)方法。所謂類,通俗地說,就是指相似元素的集合。那么要將相似元素聚為一類,通常選取元素的許多共同指標(biāo),然后通過分析元素的指標(biāo)值來分辨元素間的差距,從而達(dá)到分類的目的。聚類分析可以分為:Q型(樣品分類)分類、R型(指標(biāo)分類)分類。這里介紹的是Q型(樣品分類)分類。1.聚類分析聚類分析前的預(yù)處理步驟1)確定聚類類型:對樣品聚類稱Q型聚類;對變量聚類稱R型聚類。2)數(shù)據(jù)預(yù)處理原因:實(shí)際應(yīng)用所使用的樣本資料中,由于不同的變量具有不同的計(jì)量單位(或量綱),并且具有不同的數(shù)量級,為了使具有不同計(jì)量單位和數(shù)量級的數(shù)據(jù)能夠放在一起進(jìn)行比較分析,通常都要對數(shù)據(jù)進(jìn)行變換處理。常用方法有:中心化變換;規(guī)格化變換(極差正規(guī)化);標(biāo)準(zhǔn)化變換;對數(shù)變換等1.聚類分析3)研究樣品之間的關(guān)系。通常有兩種方法:相似系數(shù)。性質(zhì)相近的相似系數(shù)的絕對值越接近于1,彼此不相關(guān)的相似系數(shù)的絕對值越接近于0常用相似系數(shù)有:夾角余弦;相關(guān)系數(shù);指數(shù)相似系數(shù);非參數(shù)方法燈計(jì)算距離。將樣品看作P維空間的一點(diǎn),通過計(jì)算不同樣品的距離,距離越接近的點(diǎn)歸為一類,距離遠(yuǎn)的點(diǎn)歸為不同類。常用距離有:明科夫斯基距離;歐氏距離;絕對值距離;切比雪夫距離;蘭氏距離;馬氏距離。4)計(jì)算距離矩陣或相似性系數(shù)矩陣D。1.聚類分析聚類分析的一般步驟(Q型分類)1每個(gè)樣本獨(dú)自成類,G2={X;}i=1,2,n2)由距離矩陣或相似性系數(shù)矩陣D,找到當(dāng)前最小的Dp并將類G1G合為一類得到一個(gè)新類G={G;、G3)從新計(jì)算類間的距離,得到新的矩陣D。4)重復(fù)第2步直到全部合為一類。1.聚類分析進(jìn)行聚類分析時(shí),由于對類與類之間的距離的定義和理解不同,并類的過程中又會產(chǎn)生不同的聚類方法。常用的系統(tǒng)聚類方法有8種:最短距離法;最長距離法;中間距離法;重心法類平均法;可變類平均法;可變法;離差平方和法2判別分析判別分析方法最初應(yīng)用于考古學(xué),例如要根據(jù)挖掘出來的人頭蓋骨的各種指標(biāo)來判別其性別年齡等近年來,在生物學(xué)分類,醫(yī)療診斷,地質(zhì)找礦,石油鉆探,天氣預(yù)報(bào)等許多領(lǐng)域,判別分析方法已經(jīng)成為一種有效的統(tǒng)計(jì)推斷方法。判別分析是一種在一些已知研究對象用某種方法已經(jīng)分成若千類的情況下,確定新的樣品的觀測數(shù)據(jù)屬于哪一類的統(tǒng)計(jì)分析方法2判別分析為了能識別待判斷的對象x=(x1,x2”…,xm)是屬于已知類A1,A2,中的哪一類?事先必須要有一個(gè)一般規(guī)則,一旦知道了x的值,便能根據(jù)這個(gè)規(guī)則立即作出判斷,稱這樣的一個(gè)規(guī)則為判別規(guī)則(用于衡量待判對象與各已知類別接近程度的方法準(zhǔn)則)。判別規(guī)則往往通過的某個(gè)函數(shù)來表達(dá),我們把它稱為判別函數(shù),記作Wi;x)常用的方法有:距離判別法、Fisher判別法、貝葉斯判別法、逐步判別法2判別分析Bayes判別法Bayes判別法的基本思想:總是假設(shè)對所研究的對象已有一定的認(rèn)識,計(jì)算新給樣品屬于各總體的條件概率P(G1x0),(i=1,.k),比較這個(gè)概率的大小,然后將新樣品判歸為來自概率最大的總體。2判別分析設(shè)有總體G1(=12,…,k),G具有概率密度函數(shù)f(x)。并且根據(jù)以往的統(tǒng)計(jì)分析,知道G1出現(xiàn)的概率為q。即當(dāng)樣本x發(fā)生時(shí),求他屬于某類的概率。由

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論