




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第七章特征m個(gè)特征中選擇m1m1m(人為選擇、算法選擇將m個(gè)特征變?yōu)閙2個(gè)新特 ---二次特
m2
mm特征選擇與提取的任務(wù)是找出一組對(duì)分類最好的特征評(píng)價(jià)準(zhǔn)則Jij
Jij
J
0,J
0,J
J
c1 c
ni
(j)nJDn
k
l
,
xkx
i,
x(j)x
j,
1,,n
PiPj(xkxlxkxl(xk,xl
x)T
xl JD 定義
mi1ni1n
niik
xkx
mcc
SbccSb
Swc c
(i)
Sw
nikn
ii JD
J1trSwSbJ2 SwbwbSbSwJ3SbSwJ4
wJ5
SbSwSwSbSwSw S S
21 2S21
gp(x|1
p(x|2),1,P2Jpp(x|1p(x|2)0xJp完全不
Jp(x|1完全
p(x|2),xJpJB
p(x|1)p(x|2)21112Chernoff12
0JBJcln
ps(x|
)p1s(x|
s0.5Jc
J1PeP(1)P(2)2expJB1
p(x|
)p(x|
p(x|1)2 2
p(x| 1tr1 1
2I 1T11
21若21
(兩類協(xié)方差陣相等8JB
JD
1
2
JMMahalanobisp(x,i)
p(x|1)P(ix與ip(x,i)
p(xp(ip(x)
p(x|ix不能提供對(duì)分類ipxp(x|iJi
gp(x|i
p(x),P(i補(bǔ)充幾種常見的概率距離準(zhǔn)則(J和概率相關(guān)性準(zhǔn)則(IJclnIcln
ps(x|)p1s(x|i ps(x|)p1si JBlnIBln
p(x|1)p(x|2p(x|i)
p(x|1)
|2
p(x|i)
2 p(x) 散度 p(x|
)p(x|
p(x|1)2 2
p(x|ID
p(x|i)
p(x|i)dxp(x)JP
p(x|
p(x|
1 IP
p(x|i
JL
p(x|
)1
p(x|
p(x)1JK
p(x|1)P1p(x|2)P2
A事件的不確定性大(熵大A事件的觀察所提供的信息量大。把各類i看作一系列事把后驗(yàn)概率P(i|xx上出現(xiàn)ix能確定i,則對(duì)i0——x如從x完全不能確定i,則對(duì)i的觀察信息量大,熵大——x
HJc
|
|J1,,1cc①cc
c 0
P,,
1,,1
c ②
JcP1,,Pc
③④
JcP1,,PcJc1P1,,Pc⑤
|x⑥分枝性(綜合性)Shannon
ccH22
|x)log
|
H21
cc
P(
|
Je
H(x)p(x)dx
X1,,Xn
X~N(,2XABXAB
Y Y~N
,2 2
(n1)S
(m1)S
Y mn2thenulH0
X
H1
X
H2
XH3
Xt-
tXYsP1 ssP1
XtestD維特征中選取d維(dD
D組合數(shù)CdD
(Dd
D=100,d=2,C=4950D=100,d=3,C=161700D=100,d=10,C=1.73103e+13D=100,d=50,C=1.00891e+29D=1000,d=2,C=499500D=10000,d=2,C=4.9995e+07搜索方 從底向上X0從頂向下X0dDd很小(組合數(shù)較少)
X1X
Xi,
J(X1)
J(X2)
J(XiJ1,J2,J3,J4,J5,JC,JB,JD都滿足這一條按照一定的順序?qū)⑺锌赡艿慕M合排成前提:準(zhǔn)則函數(shù)單調(diào)性(J是估計(jì)值節(jié)約計(jì)算與④dD2時(shí)最經(jīng)搜索到葉結(jié)點(diǎn)后,更新BJ
B如已回溯到頂(根)JBDd412 =4 =12SFS法(SequentialForwardSelection:順序前進(jìn),前向貫序)SFS法l=d(SBS法(順序后退,后向貫序)SBS法r(6)L-R法(增lr法lr個(gè)特征(lr)rl個(gè)特征(lr)(7)L-R法((ZlZr法增l分成Zl步進(jìn)行,減r分成Zr----進(jìn)化計(jì)算(Evolutionary“GeneticAlgorithmsaregoodattakinglarge,potentiallyhugesearchspacesandnavigatingthem,lookingforoptimalcombinationsofthings,solutionsyoumightnototherwisefindina ----SalvatoreMangano1960-1970’s,JohnH.Holland,aPh.D.studentinU.JohnHenryHolland,AdaptationinNaturalandArtificialSystems,MITPress,1975用遺傳算法進(jìn)行特征選擇(Dd個(gè)D二值字符串m(01001…0110101),共CdD適應(yīng)度(fitness)函數(shù):f(m 選擇概率模型:pfm初始化,t=0,隨機(jī)地產(chǎn)生一個(gè)包含L個(gè)的種群M(0計(jì)算當(dāng)前種群M(t)中每一條的適應(yīng)度f(m按照選擇概率p(f(m))對(duì)種群中的進(jìn)行采樣由采樣出的繁下一代,組成下一代的種群M(t+1重組 突變r(jià)eversion,transposition,Two-StepProcedureTwo-StepProcedureFeatureselection(withsomestand-alonecriteria,likeclass-separationcriteriaorstatisticscriteria)Classification(usingselectedRecursiveProcedure(wrapperClassification(withallFeatureselection(accordingtoclassificationperformance)Classification(usingtheselectedfeatures)例如:R-SVM(SVM)和SVM-RFE(SVM遞歸特征剔除1°2°3°
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 保山室外透水地坪施工方案
- 信息工作發(fā)言稿
- 銀行表態(tài)發(fā)言稿
- 2025年薄膜包衣粉合作協(xié)議書
- 領(lǐng)導(dǎo)比賽總結(jié)發(fā)言稿
- 班主任交流會(huì)發(fā)言稿
- 數(shù)學(xué)競(jìng)賽發(fā)言稿
- 生日會(huì)發(fā)言稿
- 年度財(cái)務(wù)匯報(bào)
- 軍訓(xùn)發(fā)言稿高一
- 安徽省縣域?qū)W前教育普及普惠督導(dǎo)評(píng)估指標(biāo)體系
- 第二章-英國(guó)學(xué)前教育
- 樂沛LOTSPLAY德國(guó)HABA邏輯思維課程介紹手冊(cè)
- 瘧原蟲鏡檢技術(shù)-血片制作、染色及瘧原蟲形態(tài)鑒別課件
- 2例不良事件根因分析
- GB 1523-2013綿羊毛
- 2004年考研英語(yǔ)一真題及答案
- 劉半農(nóng)《教我如何不想她》課件
- 前行第07節(jié)課(僅供參考)課件
- 博弈論與信息經(jīng)濟(jì)學(xué)課件
- 界面砂漿檢測(cè)報(bào)告
評(píng)論
0/150
提交評(píng)論