![sklearn計算混淆矩陣_第1頁](http://file4.renrendoc.com/view/1bd782809528e105788a6053a3b6d8fd/1bd782809528e105788a6053a3b6d8fd1.gif)
![sklearn計算混淆矩陣_第2頁](http://file4.renrendoc.com/view/1bd782809528e105788a6053a3b6d8fd/1bd782809528e105788a6053a3b6d8fd2.gif)
![sklearn計算混淆矩陣_第3頁](http://file4.renrendoc.com/view/1bd782809528e105788a6053a3b6d8fd/1bd782809528e105788a6053a3b6d8fd3.gif)
![sklearn計算混淆矩陣_第4頁](http://file4.renrendoc.com/view/1bd782809528e105788a6053a3b6d8fd/1bd782809528e105788a6053a3b6d8fd4.gif)
下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
sklearn計算混淆矩陣混淆矩陣是對于分類算法的評價方法之一,通常用來展示算法的預測結(jié)果與實際結(jié)果之間的關(guān)系。在sklearn中提供了計算混淆矩陣的方法,下面我們來詳細介紹一下。
1.什么是混淆矩陣
混淆矩陣又稱為誤差矩陣(ErrorMatrix)或是分類矩陣(ConfusionMatrix),是一種針對分類模型的評價方法。主要用于表示分類算法的預測結(jié)果與真實結(jié)果之間的對應關(guān)系,其中表格中每一行代表真實的類別,每一列代表預測的類別。
混淆矩陣通常是一個n×n的矩陣,其中n表示類別數(shù)量。對于二分類問題,通常是一個2×2的矩陣,其中矩陣的四個元素分別代表“真正例”、“假反例”、“假正例”和“真反例”。
2.混淆矩陣的計算方法
在sklearn中提供了計算混淆矩陣的方法,即`confusion_matrix(y_true,y_pred,labels=None,sample_weight=None)`,其中參數(shù)的含義如下:
-`y_true`:真實的標簽數(shù)組;
-`y_pred`:模型預測的標簽數(shù)組;
-`labels`:一個列表,包含了所有可能的類別標簽;
-`sample_weight`:每個樣本的權(quán)重。
下面是一個使用混淆矩陣的簡單示例:
```python
fromsklearn.metricsimportconfusion_matrix
y_true=[1,1,0,1,0,0,1]#真實的標簽數(shù)組
y_pred=[1,0,0,1,0,1,1]#預測的標簽數(shù)組
labels=[0,1]#類別標簽數(shù)組
#計算混淆矩陣
cm=confusion_matrix(y_true,y_pred,labels)
print(cm)
```
輸出結(jié)果:
```
[[21]
[13]]
```
其中,第一行代表真實標簽為0的樣本,第二行代表真實標簽為1的樣本,第一列代表模型預測為0的樣本,第二列代表模型預測為1的樣本。例如,第一個元素2代表真實標簽為0的樣本中,有2個被預測為0,1個被預測為1。
3.混淆矩陣的指標
混淆矩陣可以計算出一系列評價指標,用于評估分類算法的性能,包括準確率、召回率、精確率和F1值等。
-準確率(Accuracy):指分類器正確分類的樣本占總樣本的比例,計算公式為:$$Accuracy=\frac{TP+TN}{TP+FP+FN+TN}$$其中,TP表示真正例,TN表示真反例,F(xiàn)P表示假正例,F(xiàn)N表示假反例。
-召回率(Recall):指分類器正確識別出的正樣本占所有正樣本的比例,計算公式為:$$Recall=\frac{TP}{TP+FN}$$
-精確率(Precision):指分類器正確識別出的正樣本占所有被分類為正樣本的樣本的比例,計算公式為:$$Precision=\frac{TP}{TP+FP}$$
-F1值(F1-score):是精確率和召回率的調(diào)和平均值,計算公式為:$$F1=2\cdot\frac{Precision\cdotRecall}{Precision+Recall}$$
sklearn中提供了計算準確率、召回率、精確率和F1值的方法,即`metrics`模塊下的`accuracy_score`、`recall_score`、`precision_score`和`f1_score`方法,使用方法與`confusion_matrix`類似。
```python
fromsklearn.metricsimportaccuracy_score,recall_score,precision_score,f1_score
y_true=[1,1,0,1,0,0,1]#真實的標簽數(shù)組
y_pred=[1,0,0,1,0,1,1]#預測的標簽數(shù)組
#計算準確率、召回率、精確率和F1值
acc=accuracy_score(y_true,y_pred)
rec=recall_score(y_true,y_pred)
pre=precision_score(y_true,y_pred)
f1=f1_score(y_true,y_pred)
print("Accuracy:",acc)
print("Recall:",rec)
print("Precision:",pre)
print("F1-score:",f1)
```
輸出結(jié)果:
```
Accuracy:0.7142857142857143
Recall:0.75
Precision:0.75
F1-scor
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年國內(nèi)旅游合作合同標準格式
- 2025年企業(yè)與股東資金互助協(xié)議
- 2025年保險賠付責任權(quán)益協(xié)議
- 2025年官方版復婚雙方解除婚姻策劃協(xié)議書
- 2025年人力資源與組織績效評估合同
- 2025年度人工智能策劃投資協(xié)議書
- 2025年古建筑保護工程進度申請監(jiān)管協(xié)議
- 2025年二手房產(chǎn)一次性付款交易合同模板
- 2025年債券交易委托策劃協(xié)議書
- 2025年度店鋪租賃協(xié)議標準格式
- 最新變態(tài)心理學課件
- 《民航飛機自動飛行控制系統(tǒng)》課件合集
- 工程洽商記錄表格
- 橋梁施工常見問題及預防控制要點(PPT,46)
- 中俄文一般貿(mào)易合同范本
- 2021最新版三年級下冊生命-生態(tài)-安全教案
- 【自考練習題】石家莊學院概率論與數(shù)理統(tǒng)計真題匯總(附答案解析)
- 市政管道頂管施工技術(shù)的發(fā)展歷史(45頁)
- 依戀理論之母嬰依戀
- 電氣CAD-電氣圖基本知識
- 混合痔的治療PPT課件
評論
0/150
提交評論