Chap聚類分析和判別分析實(shí)用學(xué)習(xí)教案_第1頁(yè)
Chap聚類分析和判別分析實(shí)用學(xué)習(xí)教案_第2頁(yè)
Chap聚類分析和判別分析實(shí)用學(xué)習(xí)教案_第3頁(yè)
Chap聚類分析和判別分析實(shí)用學(xué)習(xí)教案_第4頁(yè)
Chap聚類分析和判別分析實(shí)用學(xué)習(xí)教案_第5頁(yè)
已閱讀5頁(yè),還剩22頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、會(huì)計(jì)學(xué)1Chap聚類分析和判別分析實(shí)用聚類分析和判別分析實(shí)用(shyng)第一頁(yè),共27頁(yè)。二、分類二、分類1.樣品聚類(樣品聚類(Q型聚類):對(duì)型聚類):對(duì)n個(gè)觀測(cè)對(duì)象個(gè)觀測(cè)對(duì)象(duxing)(觀察單位)進(jìn)行聚類。(觀察單位)進(jìn)行聚類。2.變量聚類(變量聚類(R型聚類):對(duì)型聚類):對(duì)m個(gè)觀測(cè)指標(biāo)(變個(gè)觀測(cè)指標(biāo)(變量)聚類。量)聚類。第1頁(yè)/共27頁(yè)第二頁(yè),共27頁(yè)。三、描述指標(biāo)三、描述指標(biāo): 相似性系數(shù)(相似性系數(shù)(similarity coefficient) 1.樣品聚類(樣品聚類(Q型)型) 計(jì)量計(jì)量(jling): Pearson r 等級(jí)等級(jí): Spearman rs 計(jì)數(shù)計(jì)數(shù)

2、: 列聯(lián)系數(shù)列聯(lián)系數(shù) c 2.變量聚類(變量聚類(R型)型) 計(jì)量計(jì)量(jling): 歐氏、馬氏距歐氏、馬氏距離離 等級(jí)等級(jí): 數(shù)量化數(shù)量化歐氏、馬氏歐氏、馬氏 計(jì)數(shù)計(jì)數(shù): 列聯(lián)系數(shù)列聯(lián)系數(shù) c 第2頁(yè)/共27頁(yè)第三頁(yè),共27頁(yè)。四、四、 聚類方法聚類方法 1.有序樣品聚類有序樣品聚類: 大小順序,同類樣品必須相鄰大小順序,同類樣品必須相鄰(xin ln)。Hb2.模糊聚類模糊聚類: 屬性屬性模糊矩陣模糊矩陣分類。三好、優(yōu)分類。三好、優(yōu)干干3.快速聚類(快速聚類(Quick cluster,K-均值聚類均值聚類K-Means Cluster,逐步聚類),逐步聚類) : L19-1大大nk類類

3、k個(gè)中心(均值)個(gè)中心(均值)歸類(最小距離歸類(最小距離原則)。原則)。 4.系統(tǒng)聚類系統(tǒng)聚類: L19-2 n類類縮類(相近原則)縮類(相近原則)k類(目標(biāo))類(目標(biāo))第3頁(yè)/共27頁(yè)第四頁(yè),共27頁(yè)。學(xué)生編號(hào)測(cè)驗(yàn)項(xiàng)目常識(shí) 算術(shù) 理解 填圖 積木 譯碼 1 14 13 28 14 22 392 10 14 15 14 34 353 11 12 19 13 24 394 7 7 7 9 20 235 13 12 24 12 26 386 19 14 22 16 23 377 20 16 26 21 38 698 9 10 14 9 31 469 9 8 15 13 14 4610 9 9 1

4、2 10 23 46【例【例19-1】某小學(xué)】某小學(xué)10名名9歲男學(xué)生六個(gè)項(xiàng)目的智力歲男學(xué)生六個(gè)項(xiàng)目的智力(zhl)測(cè)驗(yàn)得分如表測(cè)驗(yàn)得分如表19-1所示,用所示,用Q型聚類對(duì)這型聚類對(duì)這10名學(xué)生的智力名學(xué)生的智力(zhl)狀態(tài)進(jìn)行分類。狀態(tài)進(jìn)行分類。第4頁(yè)/共27頁(yè)第五頁(yè),共27頁(yè)?!維PSS操作】樣品聚類,可用快速聚類法。操作】樣品聚類,可用快速聚類法。建立建立6列列10行的數(shù)據(jù)文件行的數(shù)據(jù)文件L19-1.sav:以常識(shí)、算術(shù)、:以常識(shí)、算術(shù)、理解理解(lji)、填圖、積木、譯碼為變量名。、填圖、積木、譯碼為變量名。Analyze Classify K-Means Cluster,所有變量

5、入,所有變量入Variables;將;將“Number of Clusters:2 改為改為 3 (智力(智力分上中下分上中下3類)類) Options , ANOVA table、 Cluster information for each case Continue OK第5頁(yè)/共27頁(yè)第六頁(yè),共27頁(yè)。第6頁(yè)/共27頁(yè)第七頁(yè),共27頁(yè)。第7頁(yè)/共27頁(yè)第八頁(yè),共27頁(yè)。(上中下3類智力只在填圖和譯碼的平均分上差別有統(tǒng)計(jì)學(xué)意義,即填圖和譯碼可作為(zuwi)聚類變量)第8頁(yè)/共27頁(yè)第九頁(yè),共27頁(yè)?!纠纠?9-2】 L19-1.sav:按測(cè)試項(xiàng)目進(jìn)行:按測(cè)試項(xiàng)目進(jìn)行聚類分析。聚類分析。

6、變量聚類,采用系統(tǒng)變量聚類,采用系統(tǒng)(xtng)聚類法。聚類法。Analyze Classify Hierarchical Cluster(系統(tǒng)(系統(tǒng)(xtng)聚類分析),所有聚類分析),所有變量入變量入Variable(s), Variables(變量(變量聚類)聚類)Plots,Dendrogram(樹(shù)狀圖,(樹(shù)狀圖,顯示每步合并的聚類與系數(shù)的值)顯示每步合并的聚類與系數(shù)的值)ContinueOK 第9頁(yè)/共27頁(yè)第十頁(yè),共27頁(yè)。第10頁(yè)/共27頁(yè)第十一頁(yè),共27頁(yè)。第11頁(yè)/共27頁(yè)第十二頁(yè),共27頁(yè)。第12頁(yè)/共27頁(yè)第十三頁(yè),共27頁(yè)。二、步驟二、步驟(bzhu) 第13頁(yè)/共2

7、7頁(yè)第十四頁(yè),共27頁(yè)。三、三、 方法:按判別準(zhǔn)則方法:按判別準(zhǔn)則(zhnz)1. Fisher判別法判別法(典則判別典則判別canonical discriminant) : 用于兩類判別(用于兩類判別(g=2)。)。 L19-3 金標(biāo)準(zhǔn)金標(biāo)準(zhǔn) A、B兩類兩類:m個(gè)觀測(cè)指標(biāo)個(gè)觀測(cè)指標(biāo),nA、nB例例判別界值判別界值Yc(YA+YB)/2判別規(guī)則:個(gè)體判別規(guī)則:個(gè)體YiYc A類;類; YiYc B類;類; YiYc 任一類。任一類。第14頁(yè)/共27頁(yè)第十五頁(yè),共27頁(yè)。2. Bayes判別法判別法 :多類判別(多類判別(g2) 。 先驗(yàn)概率先驗(yàn)概率用用Bayes公式構(gòu)造公式構(gòu)造(guzo)判

8、別判別函數(shù)函數(shù)計(jì)算個(gè)體屬于各類別的后驗(yàn)概率計(jì)算個(gè)體屬于各類別的后驗(yàn)概率按按后驗(yàn)概率值最大并超過(guò)后驗(yàn)概率的臨界值進(jìn)后驗(yàn)概率值最大并超過(guò)后驗(yàn)概率的臨界值進(jìn)行歸類。行歸類。 第15頁(yè)/共27頁(yè)第十六頁(yè),共27頁(yè)。四、四、 判別效果的考核判別效果的考核判別函數(shù)必須通過(guò)驗(yàn)證才能應(yīng)用判別函數(shù)必須通過(guò)驗(yàn)證才能應(yīng)用 。1.訓(xùn)練樣本回代法訓(xùn)練樣本回代法 :用建立判別函數(shù)用建立判別函數(shù)的訓(xùn)練樣本進(jìn)行回代的訓(xùn)練樣本進(jìn)行回代錯(cuò)判概率。偏錯(cuò)判概率。偏低。低。2.樣本二分法樣本二分法 :將已知類別的大將已知類別的大n隨隨機(jī)分成大小兩部分機(jī)分成大小兩部分大的部分大的部分 (85)建立判別函數(shù),小的用于驗(yàn)證建立判別函數(shù),小的

9、用于驗(yàn)證錯(cuò)判錯(cuò)判概率。概率。 3.刀切法(刀切法(jackknife交叉考核法)交叉考核法) :n個(gè)個(gè)逐個(gè)擱置逐個(gè)擱置(gzh)對(duì)其余的對(duì)其余的n-1個(gè)個(gè)個(gè)體進(jìn)行判別分析,求出判別規(guī)則,個(gè)體進(jìn)行判別分析,求出判別規(guī)則,對(duì)擱置對(duì)擱置(gzh)的個(gè)體進(jìn)行考核,共的個(gè)體進(jìn)行考核,共n次,次,假陽(yáng)性率、假陰性率、總錯(cuò)假陽(yáng)性率、假陰性率、總錯(cuò)誤率和誤率和ROC曲線等。曲線等。第16頁(yè)/共27頁(yè)第十七頁(yè),共27頁(yè)?!纠纠?9-3】經(jīng)名老中醫(yī)辯證為實(shí)】經(jīng)名老中醫(yī)辯證為實(shí)熱、虛寒兩種證型的熱、虛寒兩種證型的14例功能性子例功能性子宮出血患者皮質(zhì)醇含量宮出血患者皮質(zhì)醇含量(hnling)(g/dl)和淋巴細(xì)胞

10、轉(zhuǎn)化率()和淋巴細(xì)胞轉(zhuǎn)化率(%)資)資料見(jiàn)表料見(jiàn)表19-2。建立對(duì)兩種證型進(jìn)行鑒別診斷的建立對(duì)兩種證型進(jìn)行鑒別診斷的判別函數(shù)。判別函數(shù)。某功能性子宮出血就診者,皮質(zhì)某功能性子宮出血就診者,皮質(zhì)醇含量醇含量(hnling)為為18.0g/dl,淋,淋巴細(xì)胞轉(zhuǎn)化率為巴細(xì)胞轉(zhuǎn)化率為65%。判斷是何證。判斷是何證型。型。第17頁(yè)/共27頁(yè)第十八頁(yè),共27頁(yè)。第18頁(yè)/共27頁(yè)第十九頁(yè),共27頁(yè)。第19頁(yè)/共27頁(yè)第二十頁(yè),共27頁(yè)。根據(jù)Wilks統(tǒng)計(jì)量最小化法,可認(rèn)為(rnwi)皮質(zhì)醇判別更有意義。 第20頁(yè)/共27頁(yè)第二十一頁(yè),共27頁(yè)。Wilks 值=0.036,P=0.000,這個(gè)(zh ge)

11、典則判別函數(shù)有統(tǒng)計(jì)學(xué)意義。 標(biāo)準(zhǔn)化典則判別函數(shù)式為(判斷各變量(binling)影響的大小): 分類=0.924皮質(zhì)醇+0.331淋巴細(xì)胞 第21頁(yè)/共27頁(yè)第二十二頁(yè),共27頁(yè)。各類別重心(zhngxn)位置 。 非標(biāo)準(zhǔn)化典則判別函數(shù)式為(計(jì)算觀察(gunch)對(duì)象的判別函數(shù)值): 辨證分型=0.661皮質(zhì)醇+0.137淋巴細(xì)胞21.447 第22頁(yè)/共27頁(yè)第二十三頁(yè),共27頁(yè)。第23頁(yè)/共27頁(yè)第二十四頁(yè),共27頁(yè)。Fisher線性判別函數(shù):實(shí)熱證實(shí)熱證=11.601皮質(zhì)醇皮質(zhì)醇+11.725淋巴細(xì)胞淋巴細(xì)胞558.679 虛寒證虛寒證=5.265皮質(zhì)醇皮質(zhì)醇+10.408淋巴細(xì)胞淋巴細(xì)

12、胞353.095 第24頁(yè)/共27頁(yè)第二十五頁(yè),共27頁(yè)。某就診者:皮質(zhì)醇18.0(g/dl),淋巴細(xì)胞65(%),判別(pnbi)是何證型:非標(biāo)準(zhǔn)化:分類=0.66118.0+0.1376521.4470.6440,應(yīng)判為虛寒證型。Fisher判別(pnbi)函數(shù):實(shí)熱證=11.60118+11.72565558.679412.264虛寒證=5.26518+10.40865353.095418.195因?qū)崯嶙C虛寒證,應(yīng)判為虛寒證型。第25頁(yè)/共27頁(yè)第二十六頁(yè),共27頁(yè)。 五、五、 注意事項(xiàng)注意事項(xiàng)1.訓(xùn)練樣本訓(xùn)練樣本(yngbn)是關(guān)鍵是關(guān)鍵 : 代表性,原始分代表性,原始分類必須正確無(wú)誤類必須正確無(wú)誤 。2.判別指標(biāo)要適當(dāng)判別指標(biāo)要

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論