第一二章聚類國家級課程講義_第1頁
第一二章聚類國家級課程講義_第2頁
第一二章聚類國家級課程講義_第3頁
第一二章聚類國家級課程講義_第4頁
第一二章聚類國家級課程講義_第5頁
已閱讀5頁,還剩222頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

模式識別1★相關(guān)學科●統(tǒng)計學●概率論●線性代數(shù)(矩陣計算)●形式語言●人工智能●圖像處理●計算機視覺等等2講授課程內(nèi)容及安排第一章引論 第二章聚類分析第三章判別域代數(shù)界面方程法 第四章統(tǒng)計判決 第五章學習、訓練與錯誤率估計 第六章最近鄰方法第七章特征提取和選擇 上機實習 3第一章引論1.1概述1.2特征矢量和特征空間1.3隨機矢量的描述1.4正態(tài)分布4概念模式識別(PatternRecognition):確定一個樣本的類別屬性(模式類)的過程,即把某一樣本歸屬于多個類型中的某個類型。樣本(Sample):一個具體的研究(客觀)對象。如患者,某人寫的一個漢字,一幅圖片等。模式(Pattern):對客體(研究對象)特征的描述(定量的或結(jié)構(gòu)的描述),是取自客觀世界的某一樣本的測量值的集合(或綜合)。5特征(Features):能描述模式特性的量(測量值)。在統(tǒng)計模式識別方法中,通常用一個矢量表示,稱之為特征矢量,記為

模式類(Class):具有某些共同特性的模式的集合。概念6模式識別的例子計算機自動診斷疾病:獲取情況(信息采集)

測量體溫、血壓、心率、血液化驗、X光透射、B超、心電圖、CT等盡可能多的信息,并將這些信息數(shù)字化后輸入電腦。當然在實際應(yīng)用中要考慮采集的成本,這就是說特征要進行選擇的。運行在電腦中的專家系統(tǒng)或?qū)S贸绦蚩梢苑治鲞@些數(shù)據(jù)并進行分類,得出正?;虿徽5呐袛?,不正常情況還要指出是什么問題。7對象空間模式空間特征空間類型空間各類空間(Space)的概念模式采集:從客觀世界(對象空間)到模式空間的過程稱為模式采集。特征提取和特征選擇:由模式空間到特征空間的變換和選擇。類型判別:特征空間到類型空間所作的操作。模式識別三大任務(wù)81.1概述-模式識別系統(tǒng)數(shù)據(jù)采集特征提取二次特征提取與選擇分類識別待識對象識別結(jié)果通常在采集信息過程中,還要去除所獲取信息中的噪聲,增強有用的信息等工作。這種使信息純化的處理過程叫做信息的預(yù)處理。分類識別是根據(jù)事先確定的分類規(guī)則對前面選取的特征進行分類(即識別)。通常能描述對象的元素很多,為節(jié)約資源和提高處理速度,有時更為了可行性,在滿足分類識別正確率要求的條件下,按某種準則盡量選用對正確分類識別作用較大的特征。使得用較少的特征就能完成分類識別任務(wù)。預(yù)處理這個環(huán)節(jié)的內(nèi)容很廣泛,與要解決的具體問題有關(guān),例如,從圖象中將汽車車牌的號碼識別出來,就需要先將車牌從圖像中找出來,再對車牌進行劃分,將每個數(shù)字分別劃分開。做到這一步以后,才能對每個數(shù)字進行識別。以上工作都應(yīng)該在預(yù)處理階段完成。數(shù)字化——比特流91.1概述-模式識別系統(tǒng)數(shù)據(jù)采集特征提取二次特征提取與選擇分類識別待識對象識別結(jié)果數(shù)據(jù)采集特征提取改進分類識別規(guī)則二次特征提取與選擇訓練樣本改進采集提取方法改進特征提取與選擇制定改進分類識別規(guī)則人工干預(yù)正確率測試101.1概述-模式識別系統(tǒng)模式識別系統(tǒng)的主要環(huán)節(jié):特征提?。?符號表示,如長度、波形、。。。特征選擇: 選擇有代表性的特征,能夠正確分類學習和訓練:利用已知樣本建立分類和識別規(guī)則分類識別: 對所獲得樣本按建立的分類規(guī)則進行分類識別11紙幣識別器對紙幣按面額進行分類

面額

1.1概述-系統(tǒng)實例5元10元20元50元100元121.1概述-系統(tǒng)實例 長度(mm)寬度(mm) 5元 136 63 10元 141 70 20元 146 70 50元 151 70 100元 156 77131.1概述-系統(tǒng)實例 磁性 金屬條位置(大約) 5元 有 54/82 10元 有 54/87 20元 有 57/89 50元 有 60/91 100元 有 63/93145元10元20元50元100元12345678反射光波形151.描1概述俯-系萌統(tǒng)實竄例數(shù)據(jù)們采集僻、特附征提袋?。洪L度過、寬移度、亮磁性塌、磁翅性的第位置派,光竭反射煙亮度誦、光宴透射歸亮度侍等等特征許選擇沈:長度趴、磁投性及孕位置女、反益射亮紗度分類遷識別能:確定冠紙幣凝的面貿(mào)額及趟真?zhèn)?61.顆1概述菌-系鳴統(tǒng)實洪例訓練條集:是一騎個已白知樣酸本集躁,在雨監(jiān)督匯學習聯(lián)方法底中,詠用它序來開輔發(fā)出略模式稠分類樸器。測試喘集:在設(shè)蛾計識遼別和棋分類孔系統(tǒng)月時沒協(xié)有用欺過的迅獨立頁樣本余集。系統(tǒng)歐評價預(yù)原則利:為了攜更好桿地對點模式豎識別獨系統(tǒng)存性能贈進行股評價端,必厚須使決用一艇組獨路立于夜訓練芝集的敬測試軌集對濃系統(tǒng)炸進行身測試殊。17例:汽車帆車牌戀識別從攝陜像頭熟獲取防包含覺車牌蘿的彩珍色圖壁象車牌稿定位女和獲符取字符岔分割共和識恨別輸入圖象特征提取粗略定位分割字符確定類型精細定位識別、輸出1819201.酸1概述葉-模姨式識僵別的炎基本甘方法一、扯統(tǒng)計贏模式濟識別二、尖句法估模式忽識別三、澡模糊疏模式坊識別四、凍人工餃神經(jīng)乖網(wǎng)絡(luò)園法五、干人工寺智能罰方法211.耐1概述束-模邁式識臟別的廁基本考方法一、殃統(tǒng)計犧模式拉識別模式注描述她方法貴:特征卻向量模式蝕判定組:模式掌類用損條件們概率率分布P(欄X/i)表示,m類就競有m個分逮布,暑然后剩判定紗未知支模式燦屬于乓哪一脹個分象布。221.覽1概述殲-模齊式識從別的句基本僚方法一、曲統(tǒng)計河模式棚識別理論未基礎(chǔ)定:概率孔論,徒數(shù)理穴統(tǒng)計主要松方法蕉:線性躺、非艱線性蛛分類估、Ba禍ye術(shù)s決策敵、聚蝕類分惱析主要鈔優(yōu)點香:1)比季較成傅熟2)能借考慮尺干擾卸噪聲均等影移響3)識像別模高式基偽元能趁力強主要撫缺點叼:1)對糕結(jié)構(gòu)解復(fù)雜您的模察式抽素取特爛征困歐難2)不鴿能反酬映模咐式的駛結(jié)構(gòu)狠特征染,難仔以描好述模割式的們性質(zhì)3)難徹以從膀整體安角度癥考慮扮識別襲問題231.揚1概述屑-模烏式識集別的犁基本愿方法二、動句法遇模式碧識別模式叼描述俱方法蹦:符號造串,滔樹,續(xù)圖模式弱判定托:是一到種語迅言,史用一桑個文拘法表督示一叢個類隙,m類就甚有m個文肯法,嗚然后販判定響未知賠模式吳遵循葉哪一綁個文真法。24例2:如飼下圖贊中一脅幅圖余形,竹要識悔別圖礎(chǔ)中的打物體而,選采用句饞法模訂式識部別方剖法.1.室1概述蜜-模氣式識釀別的冰基本周方法25解:圖形微結(jié)構(gòu)欄復(fù)雜您,首系先應(yīng)賢分解此為簡制單的退子圖憐(背星景、淡物體運)。昨構(gòu)證成一逃個多全級樹烘結(jié)構(gòu)毀:1.術(shù)1概述嗓-模涉式識迷別的掌基本憲方法26在學載習過察程中隔,確場定基懸元與怠基元行之間毒的關(guān)督系,反推斷容出生糕成景畝物的蘇方法佛。判決炊過程洲中,堆首先弄提取澤基元疼,識洪別基要元之崖間的苦連接田關(guān)系白,使伙用推摟斷的傭文法倦規(guī)則晉做句拆法分在析。危若分豬析成室立,蛾則判舅斷輸遺入的罩景物鈔屬于出相應(yīng)走的類由型。1.我1概述麗-模弊式識建別的儲基本罩方法27理論失基礎(chǔ)越:形式校語言燒,自古動機遭技術(shù)主要熊方法繞:自動滲機技嘩術(shù)、CY車K剖析盒算法流、Ea鄭rl扒y算法敗、轉(zhuǎn)渾移圖思法主要煮優(yōu)點:1)識駁別方小便,好可以延從簡憐單的避基元趕開始魔,由份簡至學繁。2)能沫反映元模式延的結(jié)投構(gòu)特果征,光能描量述模國式的忠性質(zhì)萄。3)對尤圖象詠畸變滅的抗囑干擾久能力械較強惕。主要岸缺點共:當存珠在干貨擾及請噪聲庫時,脊抽取哲特征尺基元臂困難食,且吐易失奪誤。1.支1概述粒-模劈燕式識燈別的汽基本峰方法281.緩1概述甜-模猶式識通別的平基本堅方法三、傳模糊傲模式蘇識別模式斜描述敏方法愿:模糊境集合A=享{(a,a),今(b,b),利..脖.帝(n,n)}模式剃判定積:是一呈種集午合運傻算。垂用隸駛屬度嫂將模燙糊集迷合劃半分為扛若干蘋子集年,m類就苦有m個子架集,漠然后易根據(jù)言擇近著原則寶分類招。29理論拍基礎(chǔ)雪:模糊乖數(shù)學主要膽方法差:模糊陳統(tǒng)計礎(chǔ)法、耀二元薦對比棍排序嫁法、揮推理彼法、灣模糊教集運劍算規(guī)回則、棚模糊脂矩陣主要漿優(yōu)點:短由于初隸屬停度函痰數(shù)作鳴為樣舒本與夕模板眼間相資似程我度的窄度量年,故箏往往陰能反處映整災(zāi)體的奴與主皇體的俘特征尋,從梯而允否許樣單本有所相當漸程度倚的干炒擾與越畸變贊。主要丸缺點運:準確特合理嫌的隸高屬度亡函數(shù)涌往往瞎難以杠建立腦,故冒限制揮了它麥的應(yīng)系用。1.鵲1概述門-模處式識萬別的比基本休方法301.標1概述棟-模當式識戴別的聲基本精方法四、混人工療神經(jīng)宏網(wǎng)絡(luò)久法模式嫁描述互方法徑:以不行同活存躍度霜表示徒的輸旬入節(jié)家點集記(神榴經(jīng)元販)模式受判定秘:是一涉?zhèn)€非膽線性莫動態(tài)叮系統(tǒng)援。通滔過對搏樣本昆的學嗚習建瞞立起腐記憶增,然匆后將娘未知率模式初判決逆為其彩最接阿近的肚記憶列。31理論疲基礎(chǔ)遍:神經(jīng)羅生理嚷學,昨心理糾學主要未方法打:BP模型屢、HO驅(qū)P模型輸、高徒階網(wǎng)主要灶優(yōu)點:拋可處調(diào)理一棚些環(huán)午境信沾息十蠅分復(fù)退雜,逮背景涉知識欣不清億楚,召推理江規(guī)則讀不明稼確的帶問題數(shù)。允趨許樣棚本有童較大愁的缺背損、醒畸變抬。主要柱缺點抖:模型貸在不斥斷豐志富與隱完善秤中,駐目前佩能識亭別的暈?zāi)J綔愵愡€粗不夠四多。1.洲1概述痕-模丟式識崖別的孤基本久方法321.怒1概述闊-模破式識貿(mào)別的掩基本煎方法五、加邏輯根推理潑法(猾人工嗓智能掃法)模式貓描述板方法亮:字符濁串表楊示的蘇事實模式斧判定吼:是一甚種布細爾運芝算?;瑥氖录皩嵆隼伟l(fā)運番用一站系列泉規(guī)則株,推伍理得菜到不借同結(jié)嫌果,m個類速就有m個結(jié)惡果。33理論胸基礎(chǔ)剃:演繹率邏輯掉,布饅爾代棕數(shù)主要纏方法困:產(chǎn)生鳳式推逃理、味語義任網(wǎng)推攻理、然框架晴推理主要觸優(yōu)點:捏已建辯立了厘關(guān)于察知識兩表示感及組估織,底目標留搜索貴及匹捷配的龍完整有體系撞。對聞需要為眾多菠規(guī)則濾的推嘩理達饅到識冶別目法標確隔認的親問題意,有遍很好逃的效研果。主要繳缺點女:當樣乎本有么缺損范,背坑景不刻清晰蘆,規(guī)搭則不南明確儀甚至主有歧獵義時罵,效史果不克好。1.嘉1概述期-模災(zāi)式識滔別的廈基本緩方法341.票1概述絕-模醫(yī)式識獻別的牲發(fā)展運簡史19卻29年G.Ta耐us融ch掉ek發(fā)明紡閱讀棚機絨,能堤夠閱拔讀0-拒9的數(shù)鼓字。30年代Fi去sh游er提出鮮統(tǒng)計喊分類售理論密,奠淹定了另統(tǒng)計咬模式寄識別田的基以礎(chǔ)。50年代No尊amCh這em慣sk鼻y提出躬形式泡語言養(yǎng)理論——傅京自蓀提虛出句多法/結(jié)構(gòu)浪模式鹿識別捕。60年代L.煌A.舅Za摔de紛h提出袖了模滅糊集東理論娘,模什糊模廳式識化別方趁法得葬以發(fā)鋼展和恥應(yīng)用磚。351.考1概述份-模祥式識也別的和發(fā)展香簡史80年代以Ho握pf謎ie嘩ld網(wǎng)、BP網(wǎng)為尊代表陽的神驕經(jīng)網(wǎng)么絡(luò)?;I型導禽致人診工神摘經(jīng)元查網(wǎng)絡(luò)循復(fù)活兼,并票在?,F(xiàn)式識引別得緊到較胞廣泛繼的應(yīng)巨用。90年代小樣霞本學晶習理具論,姨支持虎向量素機也熔受到擠了很距大的企重視組。361.犬1概述舍-模臣式識抹別的泛應(yīng)用(舉例)生物陰學自動對細胞傅學、滾染色害體特比性研冷究、雀遺傳因研究天文該學天文脾望遠娃鏡圖務(wù)像分付析、膜自動腎光譜御學經(jīng)濟秤學股票痕交易禮預(yù)測撈、企坦業(yè)行鞠為分拔析醫(yī)學心電駐圖分阻析、彎腦電蒜圖分暴析、菠醫(yī)學陜圖像躲分析371.圣1概述長-主客要實指用系謝統(tǒng)舉沉例文字嘴識別奇(Ch郊ar帆ac起te移r錄Re讀co纖gn斧it血io報n)OC章R(Op專ti郊ca愛l你Ch絨ar銹ac廊te付r糧Re夾co腦gn扮it描io哀n)智能乖交通曉(In如te睛ll輸ig辮en構(gòu)t忙Tr居af信fi蠟c)車牌匙、車奶型。語音像識別櫻(Sp餐ee邪ch配r嗚ec每og習ni恐ti焦on)翻譯蛋機,帆身份逮識別孩等目標兼識別AT翅R(Au且to園ma娛icTa袋rg奴et辯R宏ec西og仰ni基ti購on)38391.詠2特征否矢量初和特堂征空異間401.廊3隨機肢矢量梳的描惜述隨機傘矢量芒:在模舞式識瞧別過赤程中園,要趙對許攏多具攜體對蔬象進永行測錄量,慘以獲遙得許梢多次雜觀測消值。每次短觀測隸值不思一定掩相同小,所郵以對林許多駁對象嚷而言性,各織個特也征分似量都工是隨雄機變雕量,伴即許墻多對就象的揪特征梳向量教在n維空互間中揚呈隨喂機性及分布眾,稱模為隨坑機矢夸量。411.問3隨機大矢量殃的描委述(一)隨機承矢量臨的分職布函款數(shù):設(shè)烤為澤隨機鞋矢量泳,為確嘗定性贈矢量忽。隨機灑矢量維的聯(lián)研合概枝率分義布函紡數(shù)定聯(lián)義為席:式中們表喬示括姑號中狡事件測同時度發(fā)生飼的概勺率。421.崇3隨機此矢量首的描渣述(一)隨機最矢量共的分師布函劈燕數(shù):隨機嘩矢量溫的始聯(lián)合肺概率拐密度聽函數(shù)州定義煎為:431.陣3隨機平矢量做的描廚述441.半3隨機蛾矢量合的描痕述xp(間x))(1wxp)(2wxp451.注3隨機仇矢量儉的描衡述461.倍3隨機冤矢量壯的描蘋述(二)隨機肚矢量貴的數(shù)驕字特烈征:其中掌,榮的分咬量:式中,是的第個分量的邊緣密度。隨機矢量的均值矢量的各分量是相應(yīng)的各隨機分量的均值。471.掉3隨機者矢量島的描疾述(二)隨機璃矢量越的數(shù)蓮字特句征:⑵盼條件紹期望在模岡式識努別中介,經(jīng)訓常以兩類別鵲作追為條剪件,栽在這做種情尖況下健隨機磨矢量盲的條蔥件期訊望矢達量定袖義為481.您3隨機譽矢量黨的描液述隨機洋矢量俱的自白協(xié)方斷差矩敘陣表泉征各房誠分量秋圍繞圣其均括值的沙散布駱情況辦及各賤分量倡間的麥相關(guān)茶關(guān)系桂,其妻定義寨為:(二)隨機才矢量排的數(shù)賓字特炮征:⑶扮協(xié)方被差矩沸陣491.漿3隨機己矢量崗的描捕述501.腔3隨機確矢量村的描遇述511.終3隨機慎矢量王的描坡述(二)隨機斷矢量講的數(shù)肥字特昨征:⑷忌相關(guān)動系數(shù)由布竄尼亞被科夫蛇斯基簡不等荷式知:相關(guān)般系數(shù)丘矩陣騰定義康為:521.智3隨機轎矢量擔的描弱述531.恥3隨機申矢量幫的描賽述541.衰3隨機敘矢量誕的描虹述551.比3隨機誰矢量麗的描躬述561.鍋4正態(tài)圍分布571.立4正態(tài)禮分布(1)一衣維隨授機變博量的冒正態(tài)卡分布581.踢4正態(tài)斥分布591.跡4正態(tài)汪分布(2)隨志機矢前量的權(quán)正態(tài)盜分布正態(tài)董分布便隨機舉矢量的概統(tǒng)率密霉度函示數(shù)定損義為傾:601.帝4正態(tài)占分布611.蕉4正態(tài)覺分布(2)二創(chuàng)維隨婚機變杠量的燥正態(tài)蛇分布621.寨4正態(tài)內(nèi)分布63范例木板圖象51煉2×病51煉2d=撇3長度紋理亮度c=慨2松木\樺木維數(shù)無限有限/很大R有限d不大c總結(jié)良:模丹式識繭別過非程d<串<R姓<無限模式采集模式空間特征提取/選擇類型空間分類特征空間客觀世界待識別對象識別過程錯誤概率檢測制定分類的判決規(guī)則特征提取/選擇方法校正學習過程采集方法校正已知對象預(yù)處理64試證無明,迎對于辛正態(tài)凝分布雅,不傍相關(guān)榜與獨緊立是燈等價并的。試證謝明,郊多元筐正態(tài)齊隨機卡矢量毅的線哨性變甚換仍描為多瞇元正途態(tài)隨懇機矢孩量。試證棕明,踐多元甚正態(tài)腔隨機科矢量X的分嚴量的旁線性臉組合龍是一糊正態(tài)乞隨機菌變量寺。習題65第二閉章喇聚壇類分摘析(C候lu技st陜er保in彩g切An鮮al屢ys槍is櫻)2.晉1聚類棍分析房誠的概者念2.福2模式逼相似狡性測所度2.失3類的些定義存與類穴間距孫離2.媽4聚類立的算邪法662.館1聚類糕分析景的概皮念一、煙聚類匪分析丈的基玻本思首想★相似蒙的歸猜為一妖類?!锬J浇o相似你性的恒度量團和聚著類算攏法?!餆o監(jiān)收督分癢類(Un限su旅pe呢rv青is滲ed)。二、蘋特征爹量的澤類型★物理流量--詢--撐(重量繼、長始度、怕速度)★次序橫量--胳--登(等級豈、技嫁能、漠學識)★名義纏量--走--酸(性別座、狀寧態(tài)、股種類)第二刮章聚聚海類分均析67三、放方法話的有竄效性取決融于分協(xié)類算耍法和任特征耕點分毯布情演況的逢匹配欄。2.紋1聚類補分析搶的概膏念2w2W1w1W2x1xb分類父無效喜時的府情況1.特征揭選取不當使分迎類無詞效。第二善章少聚譯類分頃析68三、有方法旅的有態(tài)效性取決蛛于分袖類算豆法和犁特征囑點分盼布情跌況的慰匹配才。2.金1聚類損分析最的概煎念分類耐無效勵時的學情況2.特征壁選取不足可能喚使不王同類填別的揪模式營判為彎一類馬。2w2W1w1W2x1x3w3W第二宵章械聚鐘類分刑析69三、蠅方法希的有繭效性取決丈于分濕類算觸法和貴特征刑點分法布情抵況的榮匹配寫。2.追1聚類糧分析石的概比念分類尤無效壟時的失情況3.特征至選取過多可能敗無益筑反而龍有害,增加牙分析置負擔巷并使背分析罵效果蒜變差誦。2w2W1w1W2x1xb第二藏章行聚謀類分后析70三、原方法氣的有瘡效性取決句于分珍類算殘法和衡特征側(cè)點分蹦布情蓋況的原匹配像。2.榆1聚類休分析粘的概亞念分類并無效寨時的健情況4.量綱勞選取衣不當統(tǒng)。第二戀章戶聚藍類分貸析71三、柴方法這的有植效性取決姥于分鑒類算痰法和仰特征剪點分社布情袖況的口匹配蘆。2.鎮(zhèn)1聚類痛分析民的概虛念分類值無效駱時的孫情況4.量綱史選取捕不當換。第二脹章怨聚腐類分獄析72三、雕方法拔的有叮效性取決舒于分賀類算園法和差特征鐘點分蹈布情占況的棗匹配去。2.險1聚類趁分析烏的概痕念分類弊無效耀時的量情況4.量綱替選取蹤蝶不當仔。第二前章犧聚土類分束析73下列難是一根些動涂物的徑名稱祖:羊基(sh輕ee范p)道狗跟(do罰g)藍鯊緒(bl種ue般s彎ha說rk)雞蜥蜴輩(li對za趴rd)毒蛇業(yè)(vi種pe懂r)獨貓長(ca新t)麻雀孫(sp腫ar姐ro恢w)破海鷗寨(se擠ag謝ul畫l)金魚根(go丹ld巧f論is敞h)奪緋鯢唱鰹(re異d-開mu富ll伸et)落蛙膚(fr造og)要對沃這些濾動物恥進行權(quán)分類息,則第不同耳的特勿征有警不同貌的分鞏法:特征壩選取超不同觀對聚響類結(jié)絮果的銷影響第二嬸章辱聚澤類分名析74特征受選取哪不同暗對聚舉類結(jié)名果的縮慧影響羊,狗,貓藍鯊蜥蜴,毒蛇,麻雀,海鷗,金魚,緋鯢碌鰹,青蛙(a涌)按繁辦衍后柳代的毀方式潑分哺乳速動物非哺蜜乳動捏物第二法章誦聚秀類分畏析75金魚罰緋集鯢鰹便藍冰鯊羊,狗,貓蜥蜴,毒蛇澡麻睬雀,海鷗可青蛙(b滾)按肺是仙否存逮在分無肺有肺特征束選取括不同完對聚壓類結(jié)鋪果的彎影響第二丘章翼聚露類分蝴析76青蛙羊,狗,貓文蜥蜴,毒蛇瞧麻攻雀,海鷗金魚搭緋私鯢鰹報藍鯊(c瞧)按生活孩環(huán)境分陸地水里兩棲特征卡選取采不同棋對聚旬類結(jié)上果的召影響第二帽章偷聚鋼類分兆析77藍鯊金魚窄緋社鯢鰹蜥蜴,毒蛇抱麻滋雀,海鷗充青蛙羊,狗,貓(d捷)按繁衍發(fā)后代察方式鑼和肺發(fā)是否膀存在分非哺銹乳且下有肺哺乳粒且無姨肺哺乳偽且有諷肺非哺努乳且臥無肺特征禿選取鑼不同純對聚蓋類結(jié)情果的映影響第二鉛章毯聚膚類分躁析78距離臂測度搖不同,聚類漏結(jié)果惡也不薪同數(shù)據(jù)者的粗是聚類勤是兩碰類,細聚尚類為4類第二楊章共聚短類分鉆析79綜上脅可見:選擇快什么誕特征綠?選擇錦多少憶個特案征?選擇覺什么臘樣的寨量綱奧?選擇飾什么叉樣的造距離浴測度似?這些呈對分順類結(jié)狡果都極會產(chǎn)停生極佛大影痰響。第二恨章纖聚截類分臣析80聚類號過程桂遵循廢的基肢本步規(guī)驟一、房誠特征忍選擇(f董ea避tu絲式re箭s旁el比ec靜ti屠on叮)盡可運能多懷地包詢含任敗務(wù)關(guān)概心的累信息二、梅近鄰頸測度(p飛ro優(yōu)xi涼mi穩(wěn)ty誰m來ea雅su唇re淘)定量闊測定燥兩特險征如瞇何“果相似嫩”或甘“不繞相似抖”三、廉聚類喬準則患(cl挖us纖te石ri刷ng吧c窩ri陷te雀ri礙on)以蘊禁涵在弓數(shù)據(jù)禍集中梳類的高類型侵為基駁礎(chǔ)四、達聚類遼算法煌(cl兼us蟻te柳ri偶ng弱a依lg稻or繳it鈴hm)按近積鄰測圖度和嚼聚類旋準則晨揭示夾數(shù)據(jù)滲集的充聚類踐結(jié)構(gòu)五、端結(jié)果腥驗證狐(va旬li種da懲ti帥on紅o內(nèi)f絹th話e傾re梨su興lt花s)常用日逼近儀檢驗待驗證醉聚類墳結(jié)果建的正滲確性六、既結(jié)果插判定航(in礦te帆rp紐奉re性ta兼ti桂on未o躬f劣th勵e蒙re畜su驢lt臂s)由專涉家用進其他探方法朽判定青結(jié)果咱的正黑確性81聚類牧應(yīng)用維的四根個基挎本方坐向一、喚減少條數(shù)據(jù)許多亭時候刊,當仔數(shù)據(jù)壯量N很大飼時,呢會使汪數(shù)據(jù)父處理累變得待很費沉力。壇因此扒可使庸用聚怎類分醬析的你方法代將數(shù)憤據(jù)分厘成幾完組可瓦判斷州的聚和類m(m<沈<N)來工處理演,每狀一個酬類可誼當作處獨立狐實體延來對猴待。堡從這球個角桌度看哈,數(shù)皂據(jù)被大壓縮劍了。第二賤章捉聚舟類分怕析82二、眠假說襲生成在這域種情眼況下芝,為連了推位導出厘數(shù)據(jù)貌性質(zhì)霜的一疫些假委說,幟對數(shù)梢據(jù)集蜂進行根聚類扶分析燦。因切此,旁這里晚使用里聚類釣作為膀建立郊假說赴的方盞法,讓然后領(lǐng)用其奧他數(shù)女據(jù)集運驗證影這些艇假說踏。聚類勤應(yīng)用緩的四功個基稻本方幟向第二低章壓聚恰類分博析83聚類霞應(yīng)用牲的四認個基棒本方或向三、辜假說液檢驗用聚祖類分感析來醉驗證默指定冬假說覆的有破效性老。例如瞇:考潤慮這尾樣的懲假說“大馳公司質(zhì)在海深外投菠資”。要驗槍證這究個假遲說是藏否正促確,其就要我對大均公司弟和有銹代表座性的秒公司許按規(guī)謙模、寇海外伸活躍著度、躍成功漢完成呀項目老的能到力等旺進行史聚類扭分析辰。從茅而來雄支持餡這個終假說售。第二弊章造聚襖類分敞析84四、爺基于烏分組栽的預(yù)餡測對現(xiàn)吼有數(shù)身據(jù)進患行聚環(huán)類分濕析,護形成沈模式響的特惰征,驚并用敬特征勒表示蔑聚類握,接澡下來鑄,對跳于一伍個未向知模性式,偽就可血以用竭前面廣的聚品類來前確定射是哪鮮一類機?聚類葡應(yīng)用講的四描個基總本方紋向例如更:考圣慮被終同種保疾病醒感染莫的病館人數(shù)犬據(jù)集杜。先按易聚類明分析墊進行屠分類泊,然參后對省新的慘病人準確定斬他適菜合的距聚類播,從恭而判暑斷他寧病情戒。第二甚章樣聚嫩類分眼析852.場2模式特相似啦性測憂度用于威描述搜各模菌式之扁間特績征的喝相似挑程度●距違離膝測痛度●相頌似亞測煌度●匹征配斑測落度第二由章功聚數(shù)類分撥析862.廁2模式烈相似村性測厘度一、豆距離堵測度(差值肆測度)測度使基礎(chǔ)吃:兩個鏈矢量累矢端竿的距石離測度慚數(shù)值澤:兩矢電量各挺相應(yīng)擇分量窗之差籍的函倚數(shù)。時,等號成立;⑴,當且僅當⑵⑶第二右章仆聚勇類分此析872.失2模式解相似祖性測廣度常用光的距涼離測孤度有趙:1.歐氏(E步uc纏li帳de決an丑)距離第二低章劃聚唱類分并析882.回2模式臘相似膝性測涉度4.明氏(Mi景nk宣ow魯sk浸i)距離(2胡-2甩-4擊)2.絕對鼠值距歸離(街坊逝距離笛或Ma領(lǐng)nh肯at在ta仔n距離)如(2掌-2白-2瘋)3.切氏(Ch礙eb畜ys摩he趴v)距離(2呀-2處-3密)第二墊章秘聚愈類分傘析892.裹2模式督相似縱性測責度第二送章謠聚個類分輸析902.等2模式減相似殃性測偷度5.馬氏(Ma鋸ha與la脖no廚bi忘s)距離注意左!馬氏文距離鞋對一境切非帳奇異令線性妄變換堂都是熊不變州的,鋼這說肌明它乖不受糞特征俗量綱栗選擇且的影僻響,疑并且貌是平弓移不勞變的甲。上面頃的V的含昌義是擱這個聰矢量湯集的塔協(xié)方寄差陣版的統(tǒng)宇計量扶,故絮馬氏廢距離借加入撲了對析特征蜓的相限關(guān)性業(yè)的考辦慮。第二國章戲聚塌類分歇析912.楚2模式捐相似鞠性測果度第二俊章儀聚細類分焦析9293現(xiàn)金鳴識別渣例子(歐氏得平均抽距離)數(shù)據(jù)岔樣本蔑介紹果:10個文朽本文增件文件餐名:rm言b0約0.現(xiàn)tx棄t……禮rm胡b0允9.事tx對t每個痛文件鹽有4個幣顯種的跟數(shù)據(jù)疤,分巾別是縫:10灑0圓、50圓、20圓、10圓每個堂幣種斗有新項舊兩松種版買本,4個方萄向,扔故有8個數(shù)隱據(jù)塊零:如10韻0圓的8個數(shù)夢據(jù)塊薦:da業(yè)ta看10喇0a掃,d效at封a1廳00分b,競da應(yīng)ta餅10頑0c穴,d莖at豎a1育00玻d—抬—老版da及ta集10咳0e紹,d皇at岸a1灶00乓f,簡da御ta局10論0g武,d擴at揪a1緩00轎h—輝—新版每個首數(shù)據(jù)值塊有8個傳潑感器成數(shù)據(jù)油:傳感謹器1,傳梢感器2,……,傳感喪器8每個衣傳感裕器有60個采恢樣數(shù)誤據(jù):數(shù)據(jù)1,數(shù)孟據(jù)2,……,數(shù)額據(jù)6094現(xiàn)金律識別高例子Eu擇cl凝id妖en=1尊5.捧00革00始00Ma議nh押at今ta穿n=亂33傍.0僑00洋00衣0Ch焰eb扶ys蓋he殿v=1軋1.騰00引00貼00Mi魂nk閘ow尸sk發(fā)i=1妻1.缺03神94普49槳——各m=擊810絞0元A面第1個樣耕本第10點和20點的艷距離X:(7圍5,罪7述6,邀10括1,挽8緒3,胃10百2,耳9宏6,考9霜1,天8遵2)Y:(7飾0,榮7最4,租9繡0,捕7碰6,唱9煙9,鑄9桌6,劍9拜0,戰(zhàn)8撈6)X-柳Y:5,獲2,客1解1,薦7,嗓3,召0,藍1,勤-丟4距離翼測度rm擔bd識is95現(xiàn)金娃識別閑例子—歐式場平均島距離10京0a浴--窄10演0a領(lǐng):(除2醬.6獸5,劣49繡.6輸6)做2蒜4.黃4110癥0a躺--注10栽0b菌:(激16斃.3譽7,叔55姑.8科7)賀3毫3.周9710盼0a蚊--傲10睛0c面:(托3眾.8瓦7,躲58邁.3并4)賤2訂9.哭4110武0a善--到10箭0d鐮:(絨6猛.8服6,喝53剩.7濃4)倚3燥3.沫0410霧0a狐--給10們0e云:(膽3芳.8弱7,架62靠.1尊2)競2宇7.脆5110萌0a斧--心10階0f還:(城13執(zhí).6循0,丸67宋.6敘1)繪3趣4.描6710戒0a好--逆10硬0g只:(正11倒.4伙0,錦68適.5調(diào)6)稍3鞋2.句2710萌0a捆--撐10便0h預(yù):(濾11添.2濃7,遮68葉.6這1)亦3然4.純4310插0a覺--饒5伯0a梯:(括18鏟.7暢6,健76溪.2瘦0)呼4頑0.基7210歉0a桌--懂2壺0a平:(防13濁.2眼3,誤81揀.2累8)訊4箭2.嗎8710瞇0a指--蝦1崖0a姨:(宋12析.4魯5,衣90州.9糧1)婚5趟4.念9996現(xiàn)金霸識別紡例子10晴0圓A面的謹馬式富矩陣SW為:43禾.5希53烤.9竟64蔑.8渴52內(nèi).752孤.752擺.3贈46手.8達37茶.953義.9浪1磚32認.0笨1澡37偽.5績1記07柱.8塌59獎.6創(chuàng)74鋒.0蓬52辨.1以31獻.564晨.8級1旁37避.5察1鋒65鮮.9詳1延24秋.1輝74屢.6攪84說.1陸67母.6炮37服.152姥.7倘1例07叉.8牛1隆24公.1女1閘05泰.5嘗57煩.5慚67閥.2昌54誰.5狐35今.252繪.7是59樸.6卡74旦.6挽57奧.5藏76絞.2磨71勇.7凈65脆.8鍛57貞.952刃.3錦74耳.0雹84悲.1肯67載.2至71斃.7陽73采.1噴62肅.8旅55樸.046返.8焦52婚.1島67狠.6種54照.5仙65灘.8穴62毒.8守59裹.6步51導.937倚.9義31爬.5討37勸.1植35馳.2森57微.9義55歉.0胃51進.9坊54圖.797現(xiàn)金餓識別拴例子SW的逆緊矩陣午為:0.晌3叉-吳0.偷0亦0.勵1六-澡0.宣1-0及.1-0珍.1-0他.2輝0泥.2-0度.0杜0濤.3惠-0吐.1-0擇.10.并1漢-敘0.霜6學0.畢3表0.燈20.曬1助-蘋0.弊1趟0.拼3巨-顆0.限1月-誘0.忘0優(yōu)-康0.受2帳-引0.慘3廁0.褲4-0嘴.1-0仙.1-0短.10.習2崗0.粒1飯0.朝3撤-拍0.稻1撓-縣0.稍2-0拔.1徒0牲.1垃-0霜.0利0篩.1趨0莫.7裁-0隱.7箱-0砌.4蘿0尋.2-0耗.1蹦-0被.6竹-0膽.2宴0威.3凝-0被.7巧2詳.2復(fù)-0廳.0淋-1云.0-0扛.2灰0羨.3籠-0橫.3愉-0醒.1趕-0使.4移-0家.0來1凍.2壯-0蜘.50.調(diào)20.對20.概4伶-立0.慈2葬0.呀2床-席1.稀0幼-后0.欣5鞋1.像098現(xiàn)金攏識別世例子—馬式餡平均悠距離10航0a欺:相(熱7.更46疾,桌8豎0.掙05椅)懸39陪.7鋒310和0b以:肢(2阿6.符75捐,閥17沃9.辣86塔)腫91雖.8梁910權(quán)0c成:渴(1話4.橫50六,腿23慕1.輩44嗓)停1賀03超.7尸610覺0d華:瀉(1姨1.久69它,駛15紋5.惹28蘆)貪78于.5他810舟0e召:域(經(jīng)5.引65旁,2囑96峰8.斬84粗)須2爺47鈔.4園210故0f嫁:誕(3錢9.組19區(qū),2湯19錦1.貼91罩)罰1笛08寨.1浴010瘋0g滅:隨(1初0.悶68零,2搖87孝5.首99浪)努2色65秤.1奏610松0h極:扶(砌9.銜41宇,2虎67電3.岔54籮)洽1盛07此.5晌650共a:密(常22右.7結(jié)8,星2定21澡.0塔7)窩10題1.現(xiàn)4120倍a:事(切22蠟.5蓮1,壘3歸43美.2供6)倦16變2.己9010衣a:四(位20肚.9夢3,戶9縮慧75啦.6趨7)罰25榮6.甩3899現(xiàn)金料識別臘例子—馬式攪平均餐距離a:團39衫.7蘆3濱1漸01督.4遠1龍1鑰62萌.9逐0竹2毯56此.3奴8b:注91艱.8腫9溝2間30墻.2汁5稠2恒88童.6哲9齡6壇59啞.4稼7c:恒1餅03偉.7北6稿1答35級.9刊4怒2絨57綠.5申7生7番24諒.9絞6d:國78個.5軋8份1旦71雁.1每0針3沙30遼.9呢7棟6號75考.9論0e:自2連47梳.4業(yè)2饑4勞43敘.4想6反3勻33欲.9旺3骨2揮18誘.7醉1f:猶1跟08洪.1負0寬3咳28永.1沉1鏟3搏05弱.1快9政6典07診.5耗1g:茄2輔65敢.1充6呢9踢56手.5退8跡8赤18儲.8沒3規(guī)3憐48舒.4擠2h:火1播07衣.5擾6有3欠39粉.6嫂4竊3鵝87央.1嫌0妥6宇28狹.8乳810游0圓50圓20圓10圓其中閑馬式座矩陣剖為10孕0圓A面的詢,上膝面是示各面淹到10吊0圓A面的袍均值賴點的惠平均噴馬式攀距離繳。10懶0現(xiàn)金窩識別椅例子——來10前0圓A面的練傳感總器1到其悶它各造面?zhèn)鳁澑衅?的街欠坊距襲離10壯12.吃2模式愧相似鐵性測慮度二、相似測度測度基礎(chǔ):以兩矢量的方向是否相近作為考慮的基礎(chǔ),矢量長度并不不重要。設(shè)1.角度相似系數(shù)(夾角余弦)(2-2-11)注意燈:坐致標系椒的旋禍轉(zhuǎn)和尸尺度餐的縮檢放是蟻不變屯的,但對嶺一般塔的線頭形變形換和萬坐標去系的附平移傷不具難有不增變性嶼。10佛2現(xiàn)金包識別隔例子——襖10慮0圓A面?zhèn)髂酶衅?與其冷它各降面的剪相似趕系數(shù)10宋32.約2模式證相似聯(lián)性測墊度二、肅相似師測度2.相關(guān)直系數(shù)它實貝際上錯是數(shù)妙據(jù)中鹽心化敲后的究矢量野夾角蜂余弦勺。(2恢-2宰-1椒2)10術(shù)4現(xiàn)金域識別姿例子——陣10播0圓A面?zhèn)髁舾衅?與其筑它各厘面的綢相關(guān)套系數(shù)10撲52.托2模式濫相似叮性測談度二、什相似逢測度3.指數(shù)柳相似老系數(shù)(2體-2抄-1諷3)式中芝為踢相應(yīng)山分量鑰的協(xié)智方差蕩,裕為矢打量維蛇數(shù)。雄它不顆受量浩綱變逢化的絨影響擠。10舞6現(xiàn)金料識別逼例子——裁10校0圓A面?zhèn)鳉v感器1與其雕它各掙面的則相關(guān)薯系數(shù)10挖72.斬2模式栗相似思性測蝕度當特在征只絮有兩貍個狀露態(tài)(0,1)時些,常杜用匹仆配測粗度。0表示兵無此收特征1表示建有此磚特征例。故弦稱之析為二值擾特征。對于追給定環(huán)的x和y中的各某兩迫個相墳應(yīng)分譜量xi與yj若xi=1貢,yj=1,則黎稱xi與yj是(1割-1支)匹配;若xi=1杠,yj=0,則棵稱xi與yj是(1偏-0乒)匹配糾;舍若xi=0滋,yj=1,則戀稱xi與yj是(0莫-1借)匹配而;蠟若xi=0脾,yj=0,則閣稱xi與yj是(0禽-0隆)匹配減。二、短匹配符測度10朱82.解2模式金相似再性測過度10食92.剛2模式糟相似待性測艙度三、寨匹配進測度(1恒)T倆an閣im礙ot爬o測度11吐0例2.烤2.今2可以病看出樹,它撤等于共同彼具有陽的特竿征數(shù)衡目與分塌別具趙有的皂特征篇種類鏈總數(shù)沉之比很。這秋里只溜考慮(1腫-1夸)匹配漸而不嘴考慮(0湖-0貴)匹配耗。設(shè)則2.今2模式睛相似各性測沃度11狂1現(xiàn)金問識別植例子——額10悠0圓A面尿與其山它各歐面的文匹配訊系數(shù)Ta鏡ni除mo蠟to11暴22.堅2模式拋相似擴性測佩度三、糖匹配畏測度(2辜)Ra給o測度注:(1揪-1拜)匹配詳特征畏數(shù)目憑和所糾選用峽的特歲征數(shù)諷目之臟比。11確3現(xiàn)金明識別們例子——胸10殺0圓A面愈與其究它各須面的亞匹配義系數(shù)Ra編o11房誠42.化2模式漏相似筋性測俱度三、他匹配坦測度(3搞)簡單恒匹配阿系數(shù)注:岔上式嚇分子摟為(1叔-1辦)匹配筑特征豆數(shù)目硬與(0迷-0痛)匹配薄特征病數(shù)目蔑之和掀,分欄母為甩所考鉛慮的革特征緒數(shù)目挪。11嚇5現(xiàn)金垃識別班例子——庫10易0圓A面丑與其拼它各笨面的別匹配模系數(shù)Si溪mp惑le11詞62.艷2模式法相似低性測章度三、父匹配立測度(4挽)拔Di險ce系數(shù)(5虜)Ku廈lz務(wù)in搬sk區(qū)y系數(shù)11沃7現(xiàn)金蠟識別志例子——爹10竹0圓A面皇與其腰它各激面的跨匹配窯系數(shù)di纖ce11研8現(xiàn)金床識別被例子——倒10欄0圓A面撞與其肺它各眠面的蜂匹配值系數(shù)Ku貿(mào)lz才in咳sk獅y11閉9作業(yè)P4竿4:綢2撕.1辣,號2陡.312武02·共3類的點定義葡與類插間距脈離2.遭3.戶1類的肆定義定義黑之1設(shè)集夫合S中任珠意元恭素xi與yj間的抬距離dij有dijh其中h為給件定的演閥值米,稱S對于冶閥值h組成寬一類發(fā)。類的決定義益有很噸多種勉,類鑒的劃殿分具考有人主為規(guī)識定性司,這瓶反映在尋定義罰的選氧取及概參數(shù)報的選譯擇上捕。一廈個分戒類結(jié)府果的聚優(yōu)劣反最后以只能穿根據(jù)移實際跨來評茶價。書中攪的其期它定抄義方擦法請漏大家紐奉自行夫參考銹學習12儀12·略3類的亭定義謊與類描間距寒離2.沸3.粱2類間暢距離更測度下方法⑴勤最碎近距化離法⑵餓最拆遠距忘離法⑶晌中禽間距巷離法⑷稅重騾心距縣離法⑸頑平塔均距栗離法⑹吐離鏟差平竭方和菌法12桑22·哨3類的共定義我與類順間距單離2.伏3.奇2類間吸距離池測度錯方法⑴最近齊距離魔法⑵啞最起遠距悲離法⑶章中謙間距匯離法⑷偉重項心距凱離法⑸鉤平比均距摩離法⑹喘離來差平鴨方和炒法式中表示和之間的距離。12邁3現(xiàn)金辯識別勿例子——開10劉0圓A面痕與其棚它各會面的存最小照距離12農(nóng)42·防3類的父定義孔與類需間距莊離2.所3.黑2類間筐距離環(huán)測度棕方法⑴研最傲近距庫離法⑵最遠瞇距離航法⑶楊中道間距丹離法⑷旋重繪心距跪離法⑸幼平赤均距防離法⑹峰離收差平秤方和發(fā)法式中表示和之間的距離。12彩5現(xiàn)金突識別委例子——鞋10娛0圓A面也與其呢它各腔面的計最大確距離12什62·扎3類的俱定義粉與類稈間距械離2.甜3.弟2類間扭距離四測度星方法⑴鬧最討近距頌離法⑵留最仙遠距齡離法⑶中間眨距離肢法⑷魚重深心距處離法⑸緒平嶺均距牛離法⑹僅離污差平矩方和散法pwqwkwpqkpqDkqDklDkpDlw12玻72·喘3類的善定義瘡與類員間距蛾離2.弦3.羅2類間嶼距離砌測度必方法⑴嬌最盤近距零離法⑵語最范遠距眠離法⑶啄中耗間距蒜離法⑷重心疫距離踩法⑸吹平箏均距炮離法⑹捆離木差平狹方和鹽法np,nq分別猾為類wp和wq的樣腸本個哥數(shù)12昏82·忍3類的糧定義某與類優(yōu)間距乎離2.黃3.逆2類間翁距離角測度雁方法⑴嚴最敬近距陪離法⑵李最揭遠距籮離法⑶居中說間距友離法⑷曬重座心距屢離法⑸平均希距離帶法⑹危離跟差平股方和饑法12爺9現(xiàn)金院識別兵例子——樸10側(cè)0圓A面夠與其帥它各禾面的悄平均次距離13宿02·忍3類的移定義渣與類聰間距翅離2.模3.紋2類間娛距離蹦測度掃方法⑴浩最槽近距畏離法⑵招最欄遠距疊離法⑶送中湊間距摩離法⑷帖重半心距竊離法⑸瞇平重均距守離法⑹離差環(huán)平方秩和法分別長為對帖應(yīng)類咳的重延心類內(nèi)跑離差誘平方烏和遞推音公式站為:13撒1最近距離法

1/2

1/2

0

-1/2最遠距離法

1/2

1/2

0

1/2中間距離法

1/2

1/2

-1/4

0重心距離法

0平均距離法

0

0可變平均法

0可變法

0離差平方和法

013捐22·悄3類的棍定義籮與類謊間距箏離2.簡3.服3聚類側(cè)的準綠則函隙數(shù)判別炕分類奇結(jié)果目好壞尾的一考般標戴準:類內(nèi)豪距離孝小,去類間薪距離幕大。某些桿算法敞需要州一個杯能對光分類袍過程騙或分巷類結(jié)皇果的優(yōu)蝦劣進榨行評素估的剩準則耍函數(shù)授。如侵果聚溉類準齊則函通數(shù)選擇我得好歇,聚仔類質(zhì)搶量就儀會高側(cè)。聚灑類準腐則往隊往是員和類的輪定義穩(wěn)有關(guān)材的,慢是類籠的定蠟義的蛙某種鳥體現(xiàn)揪。13梯32.柏3.芹3聚類狼的準社則函廈數(shù)一、西類內(nèi)隔距離斧準則設(shè)有正待分卷類的衣模式癥集邁在嗚某種順相似賞性測限度基拐礎(chǔ)上饅被劃還分為前類于,類內(nèi)技距離縣準則搜函數(shù)拖定義逗為:(表示旨類通的模頁式均蘆值矢廣量。)(2商-3沫-2澤0)2·毯3類的半定義餃與類只間距剛離13罵42·建3類的煎定義孕與類鄭間距穿離13捷5加權(quán)言類內(nèi)鳳距離杜準則:(2-3-22)(2-3-23)式中,表示類內(nèi)任兩個模式距離個組合數(shù),所以表示類內(nèi)表示類先驗概率的估計──頻率。平方和,共有兩模式間的均方距離。N為待分類模式總數(shù),13格62·巖3類的搞定義享與類器間距捉離13睛7加權(quán)基類間愿距離侮準則:對于兩類問題,類間距離有時取(2-3-26)和的關(guān)系是(2-3-27)(2-3-25)13搞82·走3類的聰定義省與類筒間距洋離13拼9

的類內(nèi)離差陣定義為

(2-3-28)2·踐3類的陽定義論與類拆間距簡離式中為類的模式均值矢量

(2-3-29)14轟014夜1例2.暈3胳.1證明招:2·鹽3類的叢定義璃與類喬間距收離14裹2聚類崗的基搜本目僻的是握使券或。利祖用線測形代英數(shù)有傻關(guān)矩相陣的疾跡和袍行列含式的數(shù)性質(zhì),可以室定義訴如下4個聚扔類的霉準則燭函數(shù):2·絡(luò)3類的紗定義診與類幅間距腥離14精32·酷3類的仗定義甲與類胳間距茅離由它先們的奪構(gòu)造蕉可以哨看出倚,為系得到腰好的良聚類坑結(jié)果先,應(yīng)墾該使兄它們婚盡量套的大寺。這腰類準嬸則也廊大量好用在獻特征喚提取夠和選笑擇中枝。14債42·緣瑞3類的絞定義嬸與類鉆間距惜離J1雁=杜7雷.6幟08恢86厘J2潔=招0燃.0孟01淋03陡97J3鞏=造15瓦.6迷08績9木J4靈=帥62承.9咸11潑6用紙溝幣數(shù)扶據(jù)計施算獲粗得的插結(jié)果啦:14估5作業(yè)P4無4:賠2沈.4仁,款2.鐮5,港2缸.614趣62·烈4聚類淺的算娃法2.糠4.杯1聚類鈴的技馳術(shù)方鳥案聚類賭分析道有很摟多具瘦體的愧算法,有的識比較反簡單,有的弓相對伸復(fù)雜許和完偉善,但歸帥納起枯來就教是三嬸大類:1、按釘最小塔距離佛原則斥簡單跪聚類垃方法2、按遭最小枕距離苦原則釋進行弱兩類扮合并皂的方緩法3、依訂據(jù)準卻則函襲數(shù)動僑態(tài)聚法類方列法14躬72·通4聚類邪的算戒法(1粘)簡單煙聚類瓜方法針對寄具體稻問題還確定元相似速性閾跟值,乖將模期式到北各聚糠類中繼心間叔的距計離與耳閾值劃比較猶,當歌大于禁閾值兇時該茂模式溫就作肝為另聚一類杜的類廈心,開小于烈閾值買時按漫最小穴距離皮原則斯將其授分劃驗到某繡一類悶中。這類吊算法借運行般中模格式的吃類別搞及類偵的中底心一迅旦確否定將新不會煎改變段。14退82·妨4聚類枝的算扮法首先飾視各勤模式裂自成最一類,然后既將距控離最蛾小的雜兩類該合并覆成一窄類,不斷杠地重峽復(fù)這放個過攪程,違直到勺成為寺兩類校為止碑。(2學)按最慢小距辣離原殊則進舅行兩勢類合養(yǎng)并的臟方法這類薦算法宋運行盾中,朗類心瞇不斷蝕地修洞正,范但模爬式類袍別一量旦指冷定后律就不紀再改足變,能就是出模式臣一旦便劃為先一類委后就尺不再延被分越劃開去,這淚類算彈法也廚稱為憲譜系邁聚類壟法。14別92·鋼4聚類慘的算殘法(3勿)依據(jù)斤準則嫂函數(shù)腦動態(tài)民聚類前法設(shè)定塑一些跟分類抽的控岔制參自數(shù),殿定義趣一個蘋能表曉征聚溫類結(jié)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論