版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
TableofContents8.1
基本概念特征選擇與提取是模式識(shí)別中重要而困難的一個(gè)環(huán)節(jié):分析各種特征的有效性并選出最有代表性的特征是模式識(shí)別系統(tǒng)設(shè)計(jì)的關(guān)鍵步驟。降低特征維數(shù)在很多情況下是有效設(shè)計(jì)分類器的重要課題。計(jì)算上更易實(shí)現(xiàn)。消除特征間的相關(guān)性,使新特征更有利于分類。引言數(shù)據(jù)獲取預(yù)處理特征提取
與選擇分類決策分類器
設(shè)計(jì)信號(hào)空間特征空間xa8.1.1三大類特征三大類特征:物理、結(jié)構(gòu)和數(shù)學(xué)特征物理和結(jié)構(gòu)特征:易于為人的直覺感知,但有時(shí)難于定量描述,因而不易用于機(jī)器判別。數(shù)學(xué)特征:易于用機(jī)器定量描述和判別,如基于統(tǒng)計(jì)的特征。討論的重點(diǎn)是根據(jù)學(xué)習(xí)樣本來選擇和提取數(shù)學(xué)特征,而物理和結(jié)構(gòu)特征的測(cè)量與分析涉及研究對(duì)象本身的物理規(guī)律。引言8.1.2有關(guān)特征的基本概念特征形成(acquisition):信號(hào)獲取或測(cè)量→原始測(cè)量,其值域稱為測(cè)量空間:對(duì)象表示x=測(cè)量空間的點(diǎn)原始特征:通過基本計(jì)算產(chǎn)生基本特征y實(shí)例:數(shù)字圖象中的各像素灰度值人體的各種生理指標(biāo)原始測(cè)量和原始特征分析:原始測(cè)量不能反映對(duì)象(類別)本質(zhì)高維原始特征不利于分類器設(shè)計(jì):計(jì)算量大,數(shù)據(jù)冗余,樣本分布十分稀疏。引言特征的選擇與提取兩類提取有效信息、壓縮特征空間的方法:特征提取和特征選擇特征提取(extraction):用映射(或變換)的方法把高維原始特征變換為較少的新特征。特征選擇(selection)
:從原始特征中挑選出一些最有代表性、分類性能最好的特征。特征的選擇與提取與具體問題有很大關(guān)系,目前沒有理論能給出對(duì)任何問題都有效的特征選擇與提取方法。引言特征的選擇與提取舉例細(xì)胞圖像自動(dòng)分類:原始測(cè)量:(正常與異常)細(xì)胞的數(shù)字圖像原始特征(特征的形成,找到一組代表細(xì)胞性質(zhì)的特征):細(xì)胞面積,胞核面積,形狀系數(shù),光密度,核內(nèi)紋理,核漿比等等壓縮特征:原始特征的維數(shù)仍很高,需壓縮以便于分類特征選擇:挑選最有分類信息的特征,方法有:專家知識(shí),數(shù)學(xué)方法特征提?。簲?shù)學(xué)變換,消除特征之間的相關(guān)性。傅立葉變換或小波變換用PCA方法作特征壓縮引言8.2基于類別可分性判據(jù)的特征提取特征提取:用映射(或變換)的方法把高維原始特征變換為較少的新特征。線性變換:特征有效性=類別可分性
類別可分性判據(jù)J:衡量不同特征及其組合對(duì)分類是否有效的定量準(zhǔn)則基于可分性判據(jù)的特征提取,就是求最優(yōu)變換W*基于距離可分性判據(jù)的特征提取樣本類間
離散度矩陣樣本類內(nèi)
離散度矩陣類間可分離性判據(jù)可分性判據(jù)8.3主成分分析方法特征提?。河糜成洌ɑ蜃儞Q)的方法把高維原始特征變換為較少的新特征主成分分析PCA(PrincipleComponentAnalysis)方法:K.Pearson提出,從一組特征中計(jì)算出一組按重要性排列的新特征,它們是原特征的線性組合,并且相互之間不相關(guān)。第一主成分變換特征
提取構(gòu)造拉格朗日函數(shù):第一主成分變換特征
提取最優(yōu)解推廣特征
提取數(shù)據(jù)中大部分信息集中在較少的幾個(gè)主成分上根據(jù)給定的比例,選擇適當(dāng)數(shù)目的主成分作為樣本的新特征8.4K-L(Karhunen-Loeve)變換特征提取:
用映射(或變換)的方法把高維原始特征變換為較少的新特征K-L(Karhunen-Loeve)變換:
特征降維變換后,不能完全地表示原有的對(duì)象,信息總會(huì)有損失。希望找到一種信息能量最為集中的的變換方法,使降維后信息損失最小。最優(yōu)正交線性變換。K-L變換(展開)離散K-L變換:對(duì)(隨機(jī))向量x用確定的完備正交歸一向量組(系)uj展開特征
提取組合系數(shù)有限項(xiàng)K-L展開的均方誤差用有限項(xiàng)估計(jì)x
:該估計(jì)的均方誤差:特征
提取記矩陣則求解最小均方誤差正交基用Lagrange乘子法,得到:結(jié)論:以相關(guān)矩陣R的d個(gè)本征向量為基向量來展開x時(shí),其均方誤差為:K-L變換:當(dāng)取矩陣R的d個(gè)最大本征值對(duì)應(yīng)的本征向量來展開x時(shí),其截?cái)嗑秸`差,在所有用d維正交坐標(biāo)系展開中最小。這d個(gè)本征向量組成的正交坐標(biāo)系稱作x所在的D維空間的d維K-L變換坐標(biāo)系,x在K-L坐標(biāo)系上的展開系數(shù)向量y稱作x的K-L變換特征
提取K-L變換的表示K-L變換的向量展開表示:K-L變換的矩陣表示:特征
提取K-L變換的性質(zhì)K-L變換是信號(hào)的最佳壓縮表示,誤差最小。y的相關(guān)矩陣是對(duì)角矩陣,即各分量互不相關(guān)。特征
提取K-L坐標(biāo)系將相關(guān)函數(shù)矩陣對(duì)角化K-L坐標(biāo)系將相關(guān)函數(shù)矩陣對(duì)角化,即通過K-L變換消除原有向量x的各分量間的相關(guān)性,從而有可能去掉那些帶有較少信息的分量以達(dá)到降低特征維數(shù)的目的。特征
提取K-L變換圖解x1x2u2u1二次
曲線方程標(biāo)準(zhǔn)二次
曲線方程特征
提取等概率密度軌跡K-L變換的數(shù)據(jù)壓縮例解以2x1變換為例,有兩個(gè)本證向量,取變換矩陣U=[u1],則x的K-L變換y為:
y=UTx=u1Tx=y1變換的能量損失為特征
提取未知類別樣本的K-L變換常用總體樣本的協(xié)方差矩陣C=E[(x-μ)(x-μ)T]
進(jìn)行K-L變換,K-L坐標(biāo)系U=[u1,u2,...,ud]按照C的本征值的下降次序選擇。例:設(shè)一樣本集的協(xié)方差矩陣是:
求最優(yōu)2x1特征提取器U
解答:計(jì)算特征值及特征向量[V,D]=eig(C);
特征值D=[24.736,2.263]T,特征向量:
由于λ1>λ2,故最優(yōu)2x1特征提取器
此時(shí)的K-L變換式為:特征
提取8.5
討論特征的選擇與提取是模式識(shí)別中重
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 高校教師薪酬績效考核管理制度
- 青少年發(fā)展中心學(xué)困生輔導(dǎo)制度
- 公共服務(wù)領(lǐng)域道德宣傳活動(dòng)方案
- 吉林大學(xué)《量子力學(xué)ⅡA》2021-2022學(xué)年第一學(xué)期期末試卷
- 2025年高考生物總復(fù)習(xí)分類訓(xùn)練:細(xì)胞工程與胚胎工程(原卷)
- 跨國企業(yè)合作協(xié)議書
- 房地產(chǎn)項(xiàng)目備案流程工作總結(jié)
- 科技公司董事聘任協(xié)議書
- 2025屆高考化學(xué)一輪復(fù)習(xí)第五章物質(zhì)結(jié)構(gòu)元素周期律第14講元素周期表元素周期律練習(xí)含解析新人教版
- 2024年內(nèi)地居民離婚登記常見問題解答
- 河南省南陽市2023-2024學(xué)年高一上學(xué)期期中數(shù)學(xué)試題含答案
- 統(tǒng)編語文四年級(jí)上冊(cè)第六單元教材解讀及集體備課
- 期中模擬檢測(cè)(試題) 2024-2025學(xué)年四年級(jí)上冊(cè)數(shù)學(xué)北師大版
- 乙醇鈉團(tuán)體標(biāo)準(zhǔn)
- 2023年國家公務(wù)員錄用考試《行測(cè)》副省級(jí)卷-解析
- 2024人教新版七年級(jí)上冊(cè)英語單詞英譯漢默寫表
- 2024年上海市普通高中學(xué)業(yè)水平等級(jí)性考試(物理)附試卷分析
- 教育機(jī)構(gòu)線上教育平臺(tái)建設(shè)方案
- 五年級(jí)語文上冊(cè)第四單元綜合素質(zhì)達(dá)標(biāo)作業(yè)
- 第02講:內(nèi)容概括(講解)-2024年中考語文記敘文閱讀講與練(全國)原卷版
- 2024年高考政治考試題海南卷及參考答案
評(píng)論
0/150
提交評(píng)論