![機器學習-聚類_第1頁](http://file3.renrendoc.com/fileroot_temp3/2022-3/7/40ba692e-fb83-4665-9fcb-0cd576c0adb3/40ba692e-fb83-4665-9fcb-0cd576c0adb31.gif)
![機器學習-聚類_第2頁](http://file3.renrendoc.com/fileroot_temp3/2022-3/7/40ba692e-fb83-4665-9fcb-0cd576c0adb3/40ba692e-fb83-4665-9fcb-0cd576c0adb32.gif)
![機器學習-聚類_第3頁](http://file3.renrendoc.com/fileroot_temp3/2022-3/7/40ba692e-fb83-4665-9fcb-0cd576c0adb3/40ba692e-fb83-4665-9fcb-0cd576c0adb33.gif)
![機器學習-聚類_第4頁](http://file3.renrendoc.com/fileroot_temp3/2022-3/7/40ba692e-fb83-4665-9fcb-0cd576c0adb3/40ba692e-fb83-4665-9fcb-0cd576c0adb34.gif)
![機器學習-聚類_第5頁](http://file3.renrendoc.com/fileroot_temp3/2022-3/7/40ba692e-fb83-4665-9fcb-0cd576c0adb3/40ba692e-fb83-4665-9fcb-0cd576c0adb35.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、機器學習聚類匯報人:楊光1. 1. 聚類任務聚類任務有一天老板給你一堆數(shù)據(jù),然后他說,你給我分類(聚類)出來21. 1. 聚類任務聚類任務聚類算法是一種無監(jiān)督學習,我們區(qū)分監(jiān)督學習和無監(jiān)督學習的方法是看IN數(shù)據(jù)有無標簽(Label)。31. 1. 聚類任務聚類任務4 在實際工作中,我們需要處理很多數(shù)據(jù),標簽獲取需要極大的人工工作量。1. 1.聚類任務聚類任務引言聚類算法會將數(shù)據(jù)集中的樣本劃分成為若干個通常不相交的子集,每一個子集我們稱之為“簇”。在聚類過程自動形成簇結(jié)構(gòu)后,我們會發(fā)現(xiàn)每個簇里會存在一些潛在的概念,比如“黃種人”、“白種人”,“女性”、“男性”,這些是我們事先未知的,這些概念也是
2、由使用者來把握和命名的。51. 1.聚類任務聚類任務引言62. 2.性能度量性能度量引言目標:目標:盡量使聚類結(jié)果的“簇內(nèi)相似度高” 且“簇間相似度低”兩類指標:兩類指標:7外部指標:與某個“參考模型”比較內(nèi)部指標:直接考察聚類結(jié)果(不利用參考模型)2. 2.性能度量性能度量引言外部指標:外部指標: 82. 2.性能度量性能度量引言92. 2.性能度量性能度量引言10內(nèi)部指標:內(nèi)部指標: 2. 2.性能度量性能度量引言113. 3.距離計算距離計算引言距離度量dist(.,.)需要滿足一些性質(zhì):12非負性: dist( xi, xj)0同一性: dist( xi, xj)=0當且僅當xi=xj
3、對稱性: dist( xi, xj)= dist( xj, xi)直遞性: dist( xi, xj) dist( xi, xk)+dist( xk, xj)3. 3.距離計算距離計算引言閔可夫斯基距離:閔可夫斯基距離:當給定樣本我們最常用的是“閔可夫斯基距離” p1時,“閔可夫斯基距離”公式滿足上述4個性質(zhì)。p=1時,“閔可夫斯基距離”即“曼哈頓距離”。p=2時,“閔可夫斯基距離”即“歐氏距離”。133. 3.距離計算距離計算引言有序?qū)傩裕?,2,3閔可夫斯基距離無序?qū)傩裕猴w機,火車,輪船 VDM143. 3.距離計算距離計算引言153. 3.距離計算距離計算引言164.4.原型聚類原型聚類
4、 k-meansk-means引言174.4.原型聚類原型聚類 k-meansk-means引言184.4.原型聚類原型聚類 k-meansk-means引言194.4.原型聚類原型聚類 k-meansk-means引言204.4.原型聚類原型聚類 LVQLVQ引言214.4.原型聚類原型聚類 LVQLVQ引言224.4.原型聚類原型聚類 LVQLVQ引言234.4.原型聚類原型聚類 LVQLVQ引言244.4.原型聚類原型聚類 LVQLVQ引言255. 5.密度聚類密度聚類引言265. 5.密度聚類密度聚類引言275. 5.密度聚類密度聚類引言285. 5.密度聚類密度聚類引言295. 5.密度聚類密度聚類引言305. 5.密度聚類密度聚類引言316. 6.層次聚類層次聚類引言32給定聚類簇Ci,Cj,可以通過下面的式子來計算距離:6. 6.層次聚類層次聚類引言336. 6.層次聚類層次聚類引言34以西瓜數(shù)據(jù)集4.0為例,令AGNES算法一直執(zhí)行到所有樣本出現(xiàn)在同一個簇中,即k=1,可以得到下面這個樹狀圖9.126. 6.層次聚
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度中式烤鴨技藝傳承學員收費合作合同
- 2025年度花卉苗木種植與旅游觀光融合合同
- 2025年度教育培訓行業(yè)數(shù)字化轉(zhuǎn)型咨詢與服務合同協(xié)議
- 蘇人教版道德與法治八年級上冊7.2《合作有智慧》聽課評課記錄
- 2025年度智能機器人制造合作合同范本
- 深度探索與橫向擴展-以某企業(yè)為例的實踐案例分享
- 2025年度人工智能教育與人才培養(yǎng)股權(quán)分配合同范本
- 2025年度職業(yè)培訓基地共建與運營管理合同書
- 部編版八年級歷史(下)全冊復習聽課評課記錄(含教學反思)
- 生態(tài)農(nóng)業(yè)與環(huán)境保護教育普及
- 2025年汽車零部件項目可行性研究報告
- (一診)畢節(jié)市2025屆高三第一次診斷性考試 英語試卷(含答案)
- 2025福建新華發(fā)行(集團)限責任公司校園招聘30人高頻重點提升(共500題)附帶答案詳解
- 油氣長輸管道檢查標準清單
- 山東鐵投集團招聘筆試沖刺題2025
- 小學二年級100以內(nèi)連加連減豎式計算練習題
- 圖像敘事的跨學科視野-洞察分析
- 2025年天津市政集團公司招聘筆試參考題庫含答案解析
- 急性缺血性卒中再灌注治療指南2024解讀
- 暑假假期安全教育(課件)-小學生主題班會
- 2025年中考英語總復習:閱讀理解練習題30篇(含答案解析)
評論
0/150
提交評論