版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、會(huì)計(jì)學(xué)1Chap聚類分析和判別分析實(shí)用聚類分析和判別分析實(shí)用(shyng)第一頁(yè),共27頁(yè)。二、分類二、分類1.樣品聚類(樣品聚類(Q型聚類):對(duì)型聚類):對(duì)n個(gè)觀測(cè)對(duì)象個(gè)觀測(cè)對(duì)象(duxing)(觀察單位)進(jìn)行聚類。(觀察單位)進(jìn)行聚類。2.變量聚類(變量聚類(R型聚類):對(duì)型聚類):對(duì)m個(gè)觀測(cè)指標(biāo)(變個(gè)觀測(cè)指標(biāo)(變量)聚類。量)聚類。第1頁(yè)/共27頁(yè)第二頁(yè),共27頁(yè)。三、描述指標(biāo)三、描述指標(biāo): 相似性系數(shù)(相似性系數(shù)(similarity coefficient) 1.樣品聚類(樣品聚類(Q型)型) 計(jì)量計(jì)量(jling): Pearson r 等級(jí)等級(jí): Spearman rs 計(jì)數(shù)計(jì)數(shù)
2、: 列聯(lián)系數(shù)列聯(lián)系數(shù) c 2.變量聚類(變量聚類(R型)型) 計(jì)量計(jì)量(jling): 歐氏、馬氏距歐氏、馬氏距離離 等級(jí)等級(jí): 數(shù)量化數(shù)量化歐氏、馬氏歐氏、馬氏 計(jì)數(shù)計(jì)數(shù): 列聯(lián)系數(shù)列聯(lián)系數(shù) c 第2頁(yè)/共27頁(yè)第三頁(yè),共27頁(yè)。四、四、 聚類方法聚類方法 1.有序樣品聚類有序樣品聚類: 大小順序,同類樣品必須相鄰大小順序,同類樣品必須相鄰(xin ln)。Hb2.模糊聚類模糊聚類: 屬性屬性模糊矩陣模糊矩陣分類。三好、優(yōu)分類。三好、優(yōu)干干3.快速聚類(快速聚類(Quick cluster,K-均值聚類均值聚類K-Means Cluster,逐步聚類),逐步聚類) : L19-1大大nk類類
3、k個(gè)中心(均值)個(gè)中心(均值)歸類(最小距離歸類(最小距離原則)。原則)。 4.系統(tǒng)聚類系統(tǒng)聚類: L19-2 n類類縮類(相近原則)縮類(相近原則)k類(目標(biāo))類(目標(biāo))第3頁(yè)/共27頁(yè)第四頁(yè),共27頁(yè)。學(xué)生編號(hào)測(cè)驗(yàn)項(xiàng)目常識(shí) 算術(shù) 理解 填圖 積木 譯碼 1 14 13 28 14 22 392 10 14 15 14 34 353 11 12 19 13 24 394 7 7 7 9 20 235 13 12 24 12 26 386 19 14 22 16 23 377 20 16 26 21 38 698 9 10 14 9 31 469 9 8 15 13 14 4610 9 9 1
4、2 10 23 46【例【例19-1】某小學(xué)】某小學(xué)10名名9歲男學(xué)生六個(gè)項(xiàng)目的智力歲男學(xué)生六個(gè)項(xiàng)目的智力(zhl)測(cè)驗(yàn)得分如表測(cè)驗(yàn)得分如表19-1所示,用所示,用Q型聚類對(duì)這型聚類對(duì)這10名學(xué)生的智力名學(xué)生的智力(zhl)狀態(tài)進(jìn)行分類。狀態(tài)進(jìn)行分類。第4頁(yè)/共27頁(yè)第五頁(yè),共27頁(yè)?!維PSS操作】樣品聚類,可用快速聚類法。操作】樣品聚類,可用快速聚類法。建立建立6列列10行的數(shù)據(jù)文件行的數(shù)據(jù)文件L19-1.sav:以常識(shí)、算術(shù)、:以常識(shí)、算術(shù)、理解理解(lji)、填圖、積木、譯碼為變量名。、填圖、積木、譯碼為變量名。Analyze Classify K-Means Cluster,所有變量
5、入,所有變量入Variables;將;將“Number of Clusters:2 改為改為 3 (智力(智力分上中下分上中下3類)類) Options , ANOVA table、 Cluster information for each case Continue OK第5頁(yè)/共27頁(yè)第六頁(yè),共27頁(yè)。第6頁(yè)/共27頁(yè)第七頁(yè),共27頁(yè)。第7頁(yè)/共27頁(yè)第八頁(yè),共27頁(yè)。(上中下3類智力只在填圖和譯碼的平均分上差別有統(tǒng)計(jì)學(xué)意義,即填圖和譯碼可作為(zuwi)聚類變量)第8頁(yè)/共27頁(yè)第九頁(yè),共27頁(yè)?!纠纠?9-2】 L19-1.sav:按測(cè)試項(xiàng)目進(jìn)行:按測(cè)試項(xiàng)目進(jìn)行聚類分析。聚類分析。
6、變量聚類,采用系統(tǒng)變量聚類,采用系統(tǒng)(xtng)聚類法。聚類法。Analyze Classify Hierarchical Cluster(系統(tǒng)(系統(tǒng)(xtng)聚類分析),所有聚類分析),所有變量入變量入Variable(s), Variables(變量(變量聚類)聚類)Plots,Dendrogram(樹(shù)狀圖,(樹(shù)狀圖,顯示每步合并的聚類與系數(shù)的值)顯示每步合并的聚類與系數(shù)的值)ContinueOK 第9頁(yè)/共27頁(yè)第十頁(yè),共27頁(yè)。第10頁(yè)/共27頁(yè)第十一頁(yè),共27頁(yè)。第11頁(yè)/共27頁(yè)第十二頁(yè),共27頁(yè)。第12頁(yè)/共27頁(yè)第十三頁(yè),共27頁(yè)。二、步驟二、步驟(bzhu) 第13頁(yè)/共2
7、7頁(yè)第十四頁(yè),共27頁(yè)。三、三、 方法:按判別準(zhǔn)則方法:按判別準(zhǔn)則(zhnz)1. Fisher判別法判別法(典則判別典則判別canonical discriminant) : 用于兩類判別(用于兩類判別(g=2)。)。 L19-3 金標(biāo)準(zhǔn)金標(biāo)準(zhǔn) A、B兩類兩類:m個(gè)觀測(cè)指標(biāo)個(gè)觀測(cè)指標(biāo),nA、nB例例判別界值判別界值Yc(YA+YB)/2判別規(guī)則:個(gè)體判別規(guī)則:個(gè)體YiYc A類;類; YiYc B類;類; YiYc 任一類。任一類。第14頁(yè)/共27頁(yè)第十五頁(yè),共27頁(yè)。2. Bayes判別法判別法 :多類判別(多類判別(g2) 。 先驗(yàn)概率先驗(yàn)概率用用Bayes公式構(gòu)造公式構(gòu)造(guzo)判
8、別判別函數(shù)函數(shù)計(jì)算個(gè)體屬于各類別的后驗(yàn)概率計(jì)算個(gè)體屬于各類別的后驗(yàn)概率按按后驗(yàn)概率值最大并超過(guò)后驗(yàn)概率的臨界值進(jìn)后驗(yàn)概率值最大并超過(guò)后驗(yàn)概率的臨界值進(jìn)行歸類。行歸類。 第15頁(yè)/共27頁(yè)第十六頁(yè),共27頁(yè)。四、四、 判別效果的考核判別效果的考核判別函數(shù)必須通過(guò)驗(yàn)證才能應(yīng)用判別函數(shù)必須通過(guò)驗(yàn)證才能應(yīng)用 。1.訓(xùn)練樣本回代法訓(xùn)練樣本回代法 :用建立判別函數(shù)用建立判別函數(shù)的訓(xùn)練樣本進(jìn)行回代的訓(xùn)練樣本進(jìn)行回代錯(cuò)判概率。偏錯(cuò)判概率。偏低。低。2.樣本二分法樣本二分法 :將已知類別的大將已知類別的大n隨隨機(jī)分成大小兩部分機(jī)分成大小兩部分大的部分大的部分 (85)建立判別函數(shù),小的用于驗(yàn)證建立判別函數(shù),小的
9、用于驗(yàn)證錯(cuò)判錯(cuò)判概率。概率。 3.刀切法(刀切法(jackknife交叉考核法)交叉考核法) :n個(gè)個(gè)逐個(gè)擱置逐個(gè)擱置(gzh)對(duì)其余的對(duì)其余的n-1個(gè)個(gè)個(gè)體進(jìn)行判別分析,求出判別規(guī)則,個(gè)體進(jìn)行判別分析,求出判別規(guī)則,對(duì)擱置對(duì)擱置(gzh)的個(gè)體進(jìn)行考核,共的個(gè)體進(jìn)行考核,共n次,次,假陽(yáng)性率、假陰性率、總錯(cuò)假陽(yáng)性率、假陰性率、總錯(cuò)誤率和誤率和ROC曲線等。曲線等。第16頁(yè)/共27頁(yè)第十七頁(yè),共27頁(yè)?!纠纠?9-3】經(jīng)名老中醫(yī)辯證為實(shí)】經(jīng)名老中醫(yī)辯證為實(shí)熱、虛寒兩種證型的熱、虛寒兩種證型的14例功能性子例功能性子宮出血患者皮質(zhì)醇含量宮出血患者皮質(zhì)醇含量(hnling)(g/dl)和淋巴細(xì)胞
10、轉(zhuǎn)化率()和淋巴細(xì)胞轉(zhuǎn)化率(%)資)資料見(jiàn)表料見(jiàn)表19-2。建立對(duì)兩種證型進(jìn)行鑒別診斷的建立對(duì)兩種證型進(jìn)行鑒別診斷的判別函數(shù)。判別函數(shù)。某功能性子宮出血就診者,皮質(zhì)某功能性子宮出血就診者,皮質(zhì)醇含量醇含量(hnling)為為18.0g/dl,淋,淋巴細(xì)胞轉(zhuǎn)化率為巴細(xì)胞轉(zhuǎn)化率為65%。判斷是何證。判斷是何證型。型。第17頁(yè)/共27頁(yè)第十八頁(yè),共27頁(yè)。第18頁(yè)/共27頁(yè)第十九頁(yè),共27頁(yè)。第19頁(yè)/共27頁(yè)第二十頁(yè),共27頁(yè)。根據(jù)Wilks統(tǒng)計(jì)量最小化法,可認(rèn)為(rnwi)皮質(zhì)醇判別更有意義。 第20頁(yè)/共27頁(yè)第二十一頁(yè),共27頁(yè)。Wilks 值=0.036,P=0.000,這個(gè)(zh ge)
11、典則判別函數(shù)有統(tǒng)計(jì)學(xué)意義。 標(biāo)準(zhǔn)化典則判別函數(shù)式為(判斷各變量(binling)影響的大小): 分類=0.924皮質(zhì)醇+0.331淋巴細(xì)胞 第21頁(yè)/共27頁(yè)第二十二頁(yè),共27頁(yè)。各類別重心(zhngxn)位置 。 非標(biāo)準(zhǔn)化典則判別函數(shù)式為(計(jì)算觀察(gunch)對(duì)象的判別函數(shù)值): 辨證分型=0.661皮質(zhì)醇+0.137淋巴細(xì)胞21.447 第22頁(yè)/共27頁(yè)第二十三頁(yè),共27頁(yè)。第23頁(yè)/共27頁(yè)第二十四頁(yè),共27頁(yè)。Fisher線性判別函數(shù):實(shí)熱證實(shí)熱證=11.601皮質(zhì)醇皮質(zhì)醇+11.725淋巴細(xì)胞淋巴細(xì)胞558.679 虛寒證虛寒證=5.265皮質(zhì)醇皮質(zhì)醇+10.408淋巴細(xì)胞淋巴細(xì)
12、胞353.095 第24頁(yè)/共27頁(yè)第二十五頁(yè),共27頁(yè)。某就診者:皮質(zhì)醇18.0(g/dl),淋巴細(xì)胞65(%),判別(pnbi)是何證型:非標(biāo)準(zhǔn)化:分類=0.66118.0+0.1376521.4470.6440,應(yīng)判為虛寒證型。Fisher判別(pnbi)函數(shù):實(shí)熱證=11.60118+11.72565558.679412.264虛寒證=5.26518+10.40865353.095418.195因?qū)崯嶙C虛寒證,應(yīng)判為虛寒證型。第25頁(yè)/共27頁(yè)第二十六頁(yè),共27頁(yè)。 五、五、 注意事項(xiàng)注意事項(xiàng)1.訓(xùn)練樣本訓(xùn)練樣本(yngbn)是關(guān)鍵是關(guān)鍵 : 代表性,原始分代表性,原始分類必須正確無(wú)誤類必須正確無(wú)誤 。2.判別指標(biāo)要適當(dāng)判別指標(biāo)要
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年項(xiàng)目合作成本確認(rèn)書(shū)
- 2025年北師大新版必修2生物上冊(cè)階段測(cè)試試卷
- 2025年浙科版九年級(jí)科學(xué)上冊(cè)階段測(cè)試試卷
- 2024年項(xiàng)目招標(biāo)代理協(xié)議3篇
- 2025年人教A版必修1地理下冊(cè)階段測(cè)試試卷
- DB34-4337-2023 家具制造業(yè)大氣污染物排放標(biāo)準(zhǔn)
- DB32-T 4884-2024 人工濕地污水處理技術(shù)規(guī)程
- 2025年度新型建筑材料集中采購(gòu)合同6篇
- 2025年北師大版四年級(jí)英語(yǔ)上冊(cè)月考試卷
- 醫(yī)院對(duì)賬平臺(tái)技術(shù)方案
- 住院醫(yī)師規(guī)范化培訓(xùn)年度眼科學(xué)習(xí)總結(jié)
- 醫(yī)療事故處理?xiàng)l例【精美醫(yī)學(xué)課件】
- 2024年首都機(jī)場(chǎng)集團(tuán)公司招聘筆試參考題庫(kù)含答案解析
- 自動(dòng)化電氣控制方案
- 泌尿外科利用PDCA循環(huán)降低持續(xù)膀胱沖洗患者膀胱痙攣的發(fā)生率品管圈QCC成果匯報(bào)
- 加油站涉恐風(fēng)險(xiǎn)評(píng)估報(bào)告
- 2 汽車維修檔案管理制度范文精簡(jiǎn)處理
- 工貿(mào)企業(yè)重大事故隱患判定標(biāo)準(zhǔn)培訓(xùn)PPT
- 2023年外交學(xué)院招考聘用筆試題庫(kù)含答案解析
- 農(nóng)學(xué)技能高考【種植類】復(fù)習(xí)題庫(kù)大全-2、《植物生產(chǎn)與環(huán)境》-上(單選多選題)
評(píng)論
0/150
提交評(píng)論