版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、機(jī)器學(xué)習(xí)聚類匯報(bào)人:楊光1. 1. 聚類任務(wù)聚類任務(wù)有一天老板給你一堆數(shù)據(jù),然后他說,你給我分類(聚類)出來21. 1. 聚類任務(wù)聚類任務(wù)聚類算法是一種無監(jiān)督學(xué)習(xí),我們區(qū)分監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)的方法是看IN數(shù)據(jù)有無標(biāo)簽(Label)。31. 1. 聚類任務(wù)聚類任務(wù)4 在實(shí)際工作中,我們需要處理很多數(shù)據(jù),標(biāo)簽獲取需要極大的人工工作量。1. 1.聚類任務(wù)聚類任務(wù)引言聚類算法會(huì)將數(shù)據(jù)集中的樣本劃分成為若干個(gè)通常不相交的子集,每一個(gè)子集我們稱之為“簇”。在聚類過程自動(dòng)形成簇結(jié)構(gòu)后,我們會(huì)發(fā)現(xiàn)每個(gè)簇里會(huì)存在一些潛在的概念,比如“黃種人”、“白種人”,“女性”、“男性”,這些是我們事先未知的,這些概念也是
2、由使用者來把握和命名的。51. 1.聚類任務(wù)聚類任務(wù)引言62. 2.性能度量性能度量引言目標(biāo):目標(biāo):盡量使聚類結(jié)果的“簇內(nèi)相似度高” 且“簇間相似度低”兩類指標(biāo):兩類指標(biāo):7外部指標(biāo):與某個(gè)“參考模型”比較內(nèi)部指標(biāo):直接考察聚類結(jié)果(不利用參考模型)2. 2.性能度量性能度量引言外部指標(biāo):外部指標(biāo): 82. 2.性能度量性能度量引言92. 2.性能度量性能度量引言10內(nèi)部指標(biāo):內(nèi)部指標(biāo): 2. 2.性能度量性能度量引言113. 3.距離計(jì)算距離計(jì)算引言距離度量dist(.,.)需要滿足一些性質(zhì):12非負(fù)性: dist( xi, xj)0同一性: dist( xi, xj)=0當(dāng)且僅當(dāng)xi=xj
3、對(duì)稱性: dist( xi, xj)= dist( xj, xi)直遞性: dist( xi, xj) dist( xi, xk)+dist( xk, xj)3. 3.距離計(jì)算距離計(jì)算引言閔可夫斯基距離:閔可夫斯基距離:當(dāng)給定樣本我們最常用的是“閔可夫斯基距離” p1時(shí),“閔可夫斯基距離”公式滿足上述4個(gè)性質(zhì)。p=1時(shí),“閔可夫斯基距離”即“曼哈頓距離”。p=2時(shí),“閔可夫斯基距離”即“歐氏距離”。133. 3.距離計(jì)算距離計(jì)算引言有序?qū)傩裕?,2,3閔可夫斯基距離無序?qū)傩裕猴w機(jī),火車,輪船 VDM143. 3.距離計(jì)算距離計(jì)算引言153. 3.距離計(jì)算距離計(jì)算引言164.4.原型聚類原型聚類
4、 k-meansk-means引言174.4.原型聚類原型聚類 k-meansk-means引言184.4.原型聚類原型聚類 k-meansk-means引言194.4.原型聚類原型聚類 k-meansk-means引言204.4.原型聚類原型聚類 LVQLVQ引言214.4.原型聚類原型聚類 LVQLVQ引言224.4.原型聚類原型聚類 LVQLVQ引言234.4.原型聚類原型聚類 LVQLVQ引言244.4.原型聚類原型聚類 LVQLVQ引言255. 5.密度聚類密度聚類引言265. 5.密度聚類密度聚類引言275. 5.密度聚類密度聚類引言285. 5.密度聚類密度聚類引言295. 5.密度聚類密度聚類引言305. 5.密度聚類密度聚類引言316. 6.層次聚類層次聚類引言32給定聚類簇Ci,Cj,可以通過下面的式子來計(jì)算距離:6. 6.層次聚類層次聚類引言336. 6.層次聚類層次聚類引言34以西瓜數(shù)據(jù)集4.0為例,令A(yù)GNES算法一直執(zhí)行到所有樣本出現(xiàn)在同一個(gè)簇中,即k=1,可以得到下面這個(gè)樹狀圖9.126. 6.層次聚
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 絕句教案范文集錦6篇
- 教師個(gè)人工作計(jì)劃2022年
- 大班春節(jié)教案
- 項(xiàng)目管理部門工作計(jì)劃范文
- 保溫材料生產(chǎn)項(xiàng)目投資計(jì)劃書
- 2022公共衛(wèi)生工作計(jì)劃10篇
- 護(hù)理專業(yè)自我鑒定10篇
- 年度工作總結(jié)合集15篇
- 網(wǎng)絡(luò)創(chuàng)新課程設(shè)計(jì)
- 基督山伯爵讀書筆記15篇
- 電信業(yè)務(wù)運(yùn)營與服務(wù)規(guī)范
- 室性心動(dòng)過速
- 報(bào)考中級(jí)會(huì)計(jì)的從事會(huì)計(jì)工作年限證明模板
- 滅火器、消防栓安全檢查表
- 收費(fèi)站突發(fā)事件應(yīng)急預(yù)案(10篇)
- 2024年-2025年公路養(yǎng)護(hù)工理論知識(shí)考試題及答案
- 地 理世界的聚落 課件-2024-2025學(xué)年七年級(jí)地理上學(xué)期(湘教版2024)
- 建筑施工安全檢查標(biāo)準(zhǔn)JGJ59-2011
- (完整)注冊(cè)安全工程師考試題庫(含答案)
- 2024秋期國家開放大學(xué)《可編程控制器應(yīng)用實(shí)訓(xùn)》一平臺(tái)在線形考(形成任務(wù)7)試題及答案
- 虛假信息的傳播與倫理
評(píng)論
0/150
提交評(píng)論