版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、分類器的評估張英張英混淆矩陣與分類準(zhǔn)確率多分類問題多分類問題的混淆矩陣的混淆矩陣預(yù)測結(jié)果類預(yù)測結(jié)果類c1c2ck總總實(shí)實(shí)際際類類c1c2ck總總n準(zhǔn)確率準(zhǔn)確率誤分類率誤分類率分類模型的評價指標(biāo)1. 準(zhǔn)確率與誤分類率準(zhǔn)確率與誤分類率準(zhǔn)確率準(zhǔn)確率 =(tp+tn) )/(tp+fn+fp+tn)誤分類率誤分類率=(fn+fp)/(tp+fn+fp+tn)真正率(靈敏度)真正率(靈敏度) =tp/(tp+fn)真負(fù)率(特指度)真負(fù)率(特指度) =tn/(fp+tn) 假正率假正率 =fp/(fp+tn) 假負(fù)率假負(fù)率 =fn/(tp+fn)二分類問題二分類問題的混淆矩陣的混淆矩陣預(yù)測結(jié)果類預(yù)測結(jié)果類
2、+-總總實(shí)實(shí)際際類類+ tp fntp+fn- fp tnfp+tn總總tp+fpfn+tntp+fn+fp+tn不平衡分布類二類分類問題的混淆矩陣預(yù)測結(jié)果類+10-90實(shí)際類+5+(tp)3+-(fn)2-95-+(fp)7(tn)88誤分類率:誤分類率:9% 真正率:真正率:60%評估指標(biāo)評估指標(biāo)2. 精度精度 P=tp / (tp+fp) 3. 召回率(真正率、靈敏召回率(真正率、靈敏度)度) R=tp/(tp+fn)4.FSCORE 精度和召回率精度和召回率 的調(diào)和均值:的調(diào)和均值:召回率和精度的權(quán)重相同:召回率和精度的權(quán)重相同: F = 2RP/(R+P)將召回率的權(quán)重設(shè)為精度的將召
3、回率的權(quán)重設(shè)為精度的倍倍:二分類問題的二分類問題的混淆矩陣混淆矩陣預(yù)測結(jié)果類預(yù)測結(jié)果類+-總總實(shí)實(shí)際際類類+ tp fntp+fn- fp tnfp+tn總總tp+fpfn+tntp+fn+fp+tn評估指標(biāo)二分類問二分類問題的誤分題的誤分類代價類代價預(yù)測結(jié)果類預(yù)測結(jié)果類+-總總實(shí)際實(shí)際類類+C(+,+) C(+,-) C(+,+)*TP+C(+,-)*FN-C(-,+) C(-,-) C(-,+)*FP+C(-,-)*TN誤分類代價誤分類代價 (成本或收益)(成本或收益) 誤分類代價對稱誤分類代價對稱C(+,+)=C(-,-)=0C(+,-)=C(-,+)=1誤分類代價不對稱誤分類代價不對稱
4、關(guān)注預(yù)測為正類 成本角度 收益角度二分類問題的二分類問題的混淆矩陣混淆矩陣預(yù)測結(jié)果類預(yù)測結(jié)果類+-總總實(shí)實(shí)際際類類+ tp fntp+fn- fp tnfp+tn預(yù)測性能評估指標(biāo)的選擇預(yù)測性能評估指標(biāo)的選擇 平衡分布類,對稱誤分類代價 準(zhǔn)確率、誤分類率,精度誤分類率,精度 不平衡分布類,對稱誤分類代價 精度,召回率,精度,召回率,F(xiàn)SCORE 不對稱誤分類代價 成本或收益成本或收益模型評估方法Hold方法方法將數(shù)據(jù)分成訓(xùn)練集和驗(yàn)證(測試)集,一般按照將數(shù)據(jù)分成訓(xùn)練集和驗(yàn)證(測試)集,一般按照2:1比例劃分,以驗(yàn)證集指標(biāo)進(jìn)行評估;比例劃分,以驗(yàn)證集指標(biāo)進(jìn)行評估;多次隨機(jī)采樣多次隨機(jī)采樣進(jìn)行進(jìn)行N
5、次上述(次上述(1)的隨機(jī)采樣,然后計算)的隨機(jī)采樣,然后計算N個測個測試精度的平均值試精度的平均值自助法(自助法(bootstrap)(最常用的(最常用的.632自助法)自助法)進(jìn)行進(jìn)行N次有放回的均勻采樣,獲得的數(shù)據(jù)集作為訓(xùn)次有放回的均勻采樣,獲得的數(shù)據(jù)集作為訓(xùn)練集,原數(shù)據(jù)集中未被抽中的其它觀測形成驗(yàn)證練集,原數(shù)據(jù)集中未被抽中的其它觀測形成驗(yàn)證集??芍貜?fù)集??芍貜?fù)K次,計算準(zhǔn)確率:次,計算準(zhǔn)確率:模型評估方法交叉驗(yàn)證交叉驗(yàn)證 數(shù)據(jù)集小的時候,可將數(shù)據(jù)集分成數(shù)據(jù)集小的時候,可將數(shù)據(jù)集分成K個不相個不相交的等大數(shù)據(jù)子集,每次將交的等大數(shù)據(jù)子集,每次將K-1個數(shù)據(jù)集作為訓(xùn)個數(shù)據(jù)集作為訓(xùn)練集,將練
6、集,將1個數(shù)據(jù)集作為驗(yàn)證(測試)集,得個數(shù)據(jù)集作為驗(yàn)證(測試)集,得到到K個測試精度,然后計算個測試精度,然后計算K個測試指標(biāo)的平均個測試指標(biāo)的平均值。值。留一交叉驗(yàn)證:留一交叉驗(yàn)證:K=N;分層交叉驗(yàn)證:每個部分中保持目標(biāo)變量的分分層交叉驗(yàn)證:每個部分中保持目標(biāo)變量的分布。布。不同分類器預(yù)測準(zhǔn)確度差異的顯不同分類器預(yù)測準(zhǔn)確度差異的顯著性檢驗(yàn)著性檢驗(yàn) T檢驗(yàn)(自由度為檢驗(yàn)(自由度為K-1)以交叉驗(yàn)證為例(以交叉驗(yàn)證為例(k為驗(yàn)證集觀測分折數(shù)):為驗(yàn)證集觀測分折數(shù)):相同驗(yàn)證集:相同驗(yàn)證集:不同驗(yàn)證集:不同驗(yàn)證集:分類器預(yù)測準(zhǔn)確度分類器預(yù)測準(zhǔn)確度置信區(qū)間置信區(qū)間分類器預(yù)測分類器預(yù)測真正真正準(zhǔn)確度
7、準(zhǔn)確度p=其中:N:驗(yàn)證集觀測個數(shù); acc:基于當(dāng)前驗(yàn)證集分類器的準(zhǔn)確度;ROC曲線(receiver operating characteristic) 曲線下方面積越大,模型越好,即曲線與曲線下方面積越大,模型越好,即曲線與y軸正向的夾角越小軸正向的夾角越小越好。越好。真正率真正率假正率假正率二分類問題二分類問題的混淆矩陣的混淆矩陣預(yù)測結(jié)果類預(yù)測結(jié)果類+-總總實(shí)實(shí)際際類類+ tp fntp+fn- fp tnfp+tn總總tp+fpfn+tntp+fn+fp+tn制作ROC曲線驗(yàn)證集共有驗(yàn)證集共有10個觀測,其中正類(個觀測,其中正類(P類)類)5個,負(fù)類(個,負(fù)類(N類)類)5個個將驗(yàn)
8、證集各觀測按照預(yù)測為正類的概率降序排列,每個觀測計算對應(yīng)將驗(yàn)證集各觀測按照預(yù)測為正類的概率降序排列,每個觀測計算對應(yīng)的真正率和假正率,形成一個點(diǎn)。的真正率和假正率,形成一個點(diǎn)。提升圖假定:假定: 目標(biāo)變量的取值為目標(biāo)變量的取值為GOOD 和和BAD N 為驗(yàn)證集觀測個數(shù);為驗(yàn)證集觀測個數(shù); RGOOD為驗(yàn)證集目標(biāo)變量取為驗(yàn)證集目標(biāo)變量取 值為值為GOOD的觀測個數(shù);的觀測個數(shù); p_good為驗(yàn)證集目標(biāo)變量為驗(yàn)證集目標(biāo)變量 預(yù)測為預(yù)測為GOOD的概率值;的概率值;驗(yàn)證集的混驗(yàn)證集的混淆矩陣淆矩陣預(yù)測預(yù)測結(jié)果類結(jié)果類goodbad總總實(shí)實(shí)際際類類good tp fnRGOODbad fp tnR
9、bad總總N繪制提升圖1.將驗(yàn)證集各觀測按照將驗(yàn)證集各觀測按照p_good降序排列降序排列,等分成等分成10組。組。2.以以10個分組為橫坐標(biāo)個分組為橫坐標(biāo) 以下指標(biāo)分別為縱坐標(biāo):以下指標(biāo)分別為縱坐標(biāo):%response:每組中實(shí)際為:每組中實(shí)際為GOOD的觀測個數(shù)占本組總的觀測個數(shù)占本組總個數(shù)的比例個數(shù)的比例;%captured response:每組中實(shí)際為每組中實(shí)際為GOOD的觀測個數(shù)的觀測個數(shù)占占RGOOD的比例的比例;%cumulative response:前面各組中實(shí)際為前面各組中實(shí)際為GOOD的觀測的觀測個數(shù)占前面各組總個數(shù)的比例個數(shù)占前面各組總個數(shù)的比例%cumulative
10、 captured response:前面各組中實(shí)際為前面各組中實(shí)際為GOOD的觀測個數(shù)占的觀測個數(shù)占RGOOD的比例。的比例。lift value=使用模型以后的使用模型以后的% response/ 不使用任何模不使用任何模型進(jìn)行決策的型進(jìn)行決策的% response提升圖某公司發(fā)送了某公司發(fā)送了1000封廣告郵件,有封廣告郵件,有200個客戶響應(yīng)了郵件(即由于個客戶響應(yīng)了郵件(即由于收到郵件而在該公司產(chǎn)生了消費(fèi)行為)。每個收到郵件而在該公司產(chǎn)生了消費(fèi)行為)。每個10分位(分位(100個觀測)的個觀測)的響應(yīng)者個數(shù)根據(jù)對驗(yàn)證數(shù)據(jù)集的計算得到。響應(yīng)者個數(shù)根據(jù)對驗(yàn)證數(shù)據(jù)集的計算得到。決策閾值選擇 根據(jù)每個觀測預(yù)測為每個目標(biāo)類的根據(jù)每個觀測預(yù)測為每個目標(biāo)類的概率決定該觀測的目標(biāo)類值。概率決定該觀測的目標(biāo)類值。 對二分類:對二分類: 理論閾值理論閾值p=1/(1+1/B) B=C(-,+)/C(+,-)根據(jù)提升圖和實(shí)際業(yè)務(wù)背景選擇根據(jù)提升圖和實(shí)際業(yè)務(wù)背景選擇合適的分組比例。合適的分組比例。 根據(jù)分組比例決定最終決策閾根據(jù)分組比例決定最終決策閾值。值。提高分類準(zhǔn)確率技術(shù)組合分類組合分類方法 有放回抽樣產(chǎn)生多個樣本 裝袋:多數(shù)表決決定最終結(jié)果 提升(ada boost) 隨機(jī)森林:多顆決策樹,隨機(jī)屬性選擇組合方法 聯(lián)合方法
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024版樣機(jī)試制合作協(xié)議
- 2024年出租車租車合同模板
- 懷孕期間夫妻分手協(xié)議
- 城市軌道交通工程建筑信息模型(BIM)分類與編碼標(biāo)準(zhǔn)
- 建筑行業(yè)標(biāo)準(zhǔn)腳手架租賃合同
- 2024項(xiàng)目投資合同撰寫要點(diǎn)
- 購買混凝土合同范本
- 生物中圖版自主訓(xùn)練:第三單元第一章第一節(jié)遺傳物質(zhì)的發(fā)現(xiàn)
- 簡單的賠償協(xié)議書2024年
- 2024屆畢業(yè)生就業(yè)協(xié)議書樣本
- 小學(xué)語文人教三年級上冊 群文閱讀《奇妙的中心句》
- 大數(shù)據(jù)和人工智能知識考試題庫600題(含答案)
- 2023年上海機(jī)場集團(tuán)有限公司校園招聘筆試題庫及答案解析
- 鏡頭的角度和方位課件
- 污水處理常用藥劑簡介知識講解課件
- 五年級上冊英語課件-Unit 1《My future》第1課時牛津上海版(三起) (共28張PPT)
- 光交接箱施工規(guī)范方案
- 氣溫和降水學(xué)案
- 普及人民代表大會制度知識競賽試題庫(1000題和答案)
- 國家電網(wǎng)公司施工項(xiàng)目部標(biāo)準(zhǔn)化管理手冊(2021年版)線路工程分冊
- 《汽車低壓線束設(shè)計規(guī)范》
評論
0/150
提交評論