分類器的評估_第1頁
分類器的評估_第2頁
分類器的評估_第3頁
分類器的評估_第4頁
分類器的評估_第5頁
已閱讀5頁,還剩17頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、分類器的評估張英張英混淆矩陣與分類準確率多分類問題多分類問題的混淆矩陣的混淆矩陣預測結果類預測結果類c1c2ck總總實實際際類類c1c2ck總總n準確率準確率誤分類率誤分類率分類模型的評價指標1. 準確率與誤分類率準確率與誤分類率準確率準確率 =(tp+tn) )/(tp+fn+fp+tn)誤分類率誤分類率=(fn+fp)/(tp+fn+fp+tn)真正率(靈敏度)真正率(靈敏度) =tp/(tp+fn)真負率(特指度)真負率(特指度) =tn/(fp+tn) 假正率假正率 =fp/(fp+tn) 假負率假負率 =fn/(tp+fn)二分類問題二分類問題的混淆矩陣的混淆矩陣預測結果類預測結果類

2、+-總總實實際際類類+ tp fntp+fn- fp tnfp+tn總總tp+fpfn+tntp+fn+fp+tn不平衡分布類二類分類問題的混淆矩陣預測結果類+10-90實際類+5+(tp)3+-(fn)2-95-+(fp)7(tn)88誤分類率:誤分類率:9% 真正率:真正率:60%評估指標評估指標2. 精度精度 P=tp / (tp+fp) 3. 召回率(真正率、靈敏召回率(真正率、靈敏度)度) R=tp/(tp+fn)4.FSCORE 精度和召回率精度和召回率 的調(diào)和均值:的調(diào)和均值:召回率和精度的權重相同:召回率和精度的權重相同: F = 2RP/(R+P)將召回率的權重設為精度的將召

3、回率的權重設為精度的倍倍:二分類問題的二分類問題的混淆矩陣混淆矩陣預測結果類預測結果類+-總總實實際際類類+ tp fntp+fn- fp tnfp+tn總總tp+fpfn+tntp+fn+fp+tn評估指標二分類問二分類問題的誤分題的誤分類代價類代價預測結果類預測結果類+-總總實際實際類類+C(+,+) C(+,-) C(+,+)*TP+C(+,-)*FN-C(-,+) C(-,-) C(-,+)*FP+C(-,-)*TN誤分類代價誤分類代價 (成本或收益)(成本或收益) 誤分類代價對稱誤分類代價對稱C(+,+)=C(-,-)=0C(+,-)=C(-,+)=1誤分類代價不對稱誤分類代價不對稱

4、關注預測為正類 成本角度 收益角度二分類問題的二分類問題的混淆矩陣混淆矩陣預測結果類預測結果類+-總總實實際際類類+ tp fntp+fn- fp tnfp+tn預測性能評估指標的選擇預測性能評估指標的選擇 平衡分布類,對稱誤分類代價 準確率、誤分類率,精度誤分類率,精度 不平衡分布類,對稱誤分類代價 精度,召回率,精度,召回率,F(xiàn)SCORE 不對稱誤分類代價 成本或收益成本或收益模型評估方法Hold方法方法將數(shù)據(jù)分成訓練集和驗證(測試)集,一般按照將數(shù)據(jù)分成訓練集和驗證(測試)集,一般按照2:1比例劃分,以驗證集指標進行評估;比例劃分,以驗證集指標進行評估;多次隨機采樣多次隨機采樣進行進行N

5、次上述(次上述(1)的隨機采樣,然后計算)的隨機采樣,然后計算N個測個測試精度的平均值試精度的平均值自助法(自助法(bootstrap)(最常用的(最常用的.632自助法)自助法)進行進行N次有放回的均勻采樣,獲得的數(shù)據(jù)集作為訓次有放回的均勻采樣,獲得的數(shù)據(jù)集作為訓練集,原數(shù)據(jù)集中未被抽中的其它觀測形成驗證練集,原數(shù)據(jù)集中未被抽中的其它觀測形成驗證集??芍貜图?。可重復K次,計算準確率:次,計算準確率:模型評估方法交叉驗證交叉驗證 數(shù)據(jù)集小的時候,可將數(shù)據(jù)集分成數(shù)據(jù)集小的時候,可將數(shù)據(jù)集分成K個不相個不相交的等大數(shù)據(jù)子集,每次將交的等大數(shù)據(jù)子集,每次將K-1個數(shù)據(jù)集作為訓個數(shù)據(jù)集作為訓練集,將練

6、集,將1個數(shù)據(jù)集作為驗證(測試)集,得個數(shù)據(jù)集作為驗證(測試)集,得到到K個測試精度,然后計算個測試精度,然后計算K個測試指標的平均個測試指標的平均值。值。留一交叉驗證:留一交叉驗證:K=N;分層交叉驗證:每個部分中保持目標變量的分分層交叉驗證:每個部分中保持目標變量的分布。布。不同分類器預測準確度差異的顯不同分類器預測準確度差異的顯著性檢驗著性檢驗 T檢驗(自由度為檢驗(自由度為K-1)以交叉驗證為例(以交叉驗證為例(k為驗證集觀測分折數(shù)):為驗證集觀測分折數(shù)):相同驗證集:相同驗證集:不同驗證集:不同驗證集:分類器預測準確度分類器預測準確度置信區(qū)間置信區(qū)間分類器預測分類器預測真正真正準確度

7、準確度p=其中:N:驗證集觀測個數(shù); acc:基于當前驗證集分類器的準確度;ROC曲線(receiver operating characteristic) 曲線下方面積越大,模型越好,即曲線與曲線下方面積越大,模型越好,即曲線與y軸正向的夾角越小軸正向的夾角越小越好。越好。真正率真正率假正率假正率二分類問題二分類問題的混淆矩陣的混淆矩陣預測結果類預測結果類+-總總實實際際類類+ tp fntp+fn- fp tnfp+tn總總tp+fpfn+tntp+fn+fp+tn制作ROC曲線驗證集共有驗證集共有10個觀測,其中正類(個觀測,其中正類(P類)類)5個,負類(個,負類(N類)類)5個個將驗

8、證集各觀測按照預測為正類的概率降序排列,每個觀測計算對應將驗證集各觀測按照預測為正類的概率降序排列,每個觀測計算對應的真正率和假正率,形成一個點。的真正率和假正率,形成一個點。提升圖假定:假定: 目標變量的取值為目標變量的取值為GOOD 和和BAD N 為驗證集觀測個數(shù);為驗證集觀測個數(shù); RGOOD為驗證集目標變量取為驗證集目標變量取 值為值為GOOD的觀測個數(shù);的觀測個數(shù); p_good為驗證集目標變量為驗證集目標變量 預測為預測為GOOD的概率值;的概率值;驗證集的混驗證集的混淆矩陣淆矩陣預測預測結果類結果類goodbad總總實實際際類類good tp fnRGOODbad fp tnR

9、bad總總N繪制提升圖1.將驗證集各觀測按照將驗證集各觀測按照p_good降序排列降序排列,等分成等分成10組。組。2.以以10個分組為橫坐標個分組為橫坐標 以下指標分別為縱坐標:以下指標分別為縱坐標:%response:每組中實際為:每組中實際為GOOD的觀測個數(shù)占本組總的觀測個數(shù)占本組總個數(shù)的比例個數(shù)的比例;%captured response:每組中實際為每組中實際為GOOD的觀測個數(shù)的觀測個數(shù)占占RGOOD的比例的比例;%cumulative response:前面各組中實際為前面各組中實際為GOOD的觀測的觀測個數(shù)占前面各組總個數(shù)的比例個數(shù)占前面各組總個數(shù)的比例%cumulative

10、 captured response:前面各組中實際為前面各組中實際為GOOD的觀測個數(shù)占的觀測個數(shù)占RGOOD的比例。的比例。lift value=使用模型以后的使用模型以后的% response/ 不使用任何模不使用任何模型進行決策的型進行決策的% response提升圖某公司發(fā)送了某公司發(fā)送了1000封廣告郵件,有封廣告郵件,有200個客戶響應了郵件(即由于個客戶響應了郵件(即由于收到郵件而在該公司產(chǎn)生了消費行為)。每個收到郵件而在該公司產(chǎn)生了消費行為)。每個10分位(分位(100個觀測)的個觀測)的響應者個數(shù)根據(jù)對驗證數(shù)據(jù)集的計算得到。響應者個數(shù)根據(jù)對驗證數(shù)據(jù)集的計算得到。決策閾值選擇 根據(jù)每個觀測預測為每個目標類的根據(jù)每個觀測預測為每個目標類的概率決定該觀測的目標類值。概率決定該觀測的目標類值。 對二分類:對二分類: 理論閾值理論閾值p=1/(1+1/B) B=C(-,+)/C(+,-)根據(jù)提升圖和實際業(yè)務背景選擇根據(jù)提升圖和實際業(yè)務背景選擇合適的分組比例。合適的分組比例。 根據(jù)分組比例決定最終決策閾根據(jù)分組比例決定最終決策閾值。值。提高分類準確率技術組合分類組合分類方法 有放回抽樣產(chǎn)生多個樣本 裝袋:多數(shù)表決決定最終結果 提升(ada boost) 隨機森林:多顆決策樹,隨機屬性選擇組合方法 聯(lián)合方法

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論