機(jī)器學(xué)習(xí)模型的可解釋性算法的概念及其重要意義

上傳人：w*** IP屬地：天津上傳時(shí)間：2022-09-12 格式：DOCX 頁數(shù)：7 大?。?20.36KB 積分：15 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩2頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、機(jī)器學(xué)習(xí)模型的可解釋性算法的概念及其重要意義目前很多機(jī)器學(xué)習(xí)模型可以做出非常好的預(yù)測，但是它們并不能很好地解釋他們是如何進(jìn)行預(yù)測的，很多數(shù)據(jù)科學(xué)家都很難知曉為什么該算法會(huì)得到這樣的預(yù)測結(jié)果。這是非常致命的，因?yàn)槿绻覀儫o法知道某個(gè)算法是如何進(jìn)行預(yù)測，那么我們將很難將其前一道其它的問題中，很難進(jìn)行算法的debug。本文介紹目前常見的幾種可以提高機(jī)器學(xué)習(xí)模型的可解釋性的技術(shù)，包括它們的相對優(yōu)點(diǎn)和缺點(diǎn)。我們將其分為下面幾種：PartialDependencePlot(PDP)；IndividualConditionalExpectation(ICE)PermutedFeatureImportanc

2、eGlobalSurrogateLocalSurrogate(LIME)ShapleyValue(SHAP)六大可解釋性技術(shù)01PartialDependencePlot(PDP)PDP是十幾年之前發(fā)明的，它可以顯示一個(gè)或兩個(gè)特征對機(jī)器學(xué)習(xí)模型的預(yù)測結(jié)果的邊際效應(yīng)。它可以幫助研究人員確定當(dāng)大量特征調(diào)整時(shí)，模型預(yù)測會(huì)發(fā)生什么樣的變化。X.-=P43P&01002QOQ0203006ra上面圖中，軸表示特征的值，軸表示預(yù)測值。陰影區(qū)域中的實(shí)線顯示了平均預(yù)測如何隨著值的變化而變化。PDP能很直觀地顯示平均邊際效應(yīng)，因此可能會(huì)隱藏異質(zhì)效應(yīng)。例如，一個(gè)特征可能與一半數(shù)據(jù)的預(yù)測正相關(guān)，與另一半數(shù)據(jù)負(fù)相關(guān)。

3、那么PDP圖將只是一條水平線。02IndividualConditionalExpectation(ICE)ICE和PDP非常相似，但和PDP不同之處在于，PDP繪制的是平均情況，但是ICE會(huì)顯示每個(gè)實(shí)例的情況。ICE可以幫助我們解釋一個(gè)特定的特征改變時(shí)，模型的預(yù)測會(huì)怎么變化。ICEtmodel.XQDD5A-CL06如上圖所示，與PDP不同，ICE曲線可以揭示異質(zhì)關(guān)系。但其最大的問題在于：它不能像PDP那樣容易看到平均效果，所以可以考慮將二者結(jié)合起來一起使用。03PermutedFeatureImportancePermutedFeatureImportance的特征重要性是通過特征值打亂后

4、模型預(yù)測誤差的變化得到的。換句話說，PermutedFeatureImportance有助于定義模型中的特征對最終預(yù)測做出貢獻(xiàn)的大小。Feature_ImportaritefmodeLX.yFarlur|irparunos-VZIF3fo-QjG04-04)2XOO口畑CKO4Cig0-00如上圖所示，特征f2在特征的最上面，對模型的誤差影響是最大的，fl在shuffle之后對模型卻幾乎沒什么影響，生息的特征則對于模型是負(fù)面的貢獻(xiàn)。04GlobalSurrogateGlobalSurrogate方法采用不同的方法。它通過訓(xùn)練一個(gè)可解釋的模型來近似黑盒模型的預(yù)測。首先，我們使用經(jīng)過訓(xùn)練的黑盒模型

5、對數(shù)據(jù)集進(jìn)行預(yù)測；然后我們在該數(shù)據(jù)集和預(yù)測上訓(xùn)練可解釋的模型。訓(xùn)練好的可解釋模型可以近似原始模型，我們需要做的就是解釋該模型。注：代理模型可以是任何可解釋的模型：線性模型、決策樹、人類定義的規(guī)則等。Prediction使用可解釋的模型來近似黑盒模型會(huì)引入額外的誤差，但額外的誤差可以通過R平方來衡量。由于代理模型僅根據(jù)黑盒模型的預(yù)測而不是真實(shí)結(jié)果進(jìn)行訓(xùn)練，因此全局代理模型只能解釋黑盒模型，而不能解釋數(shù)據(jù)。05LocalSurrogate(LIME)LIME(LocalInterpretableModel-agnosticExplanations)和globalsurrogate是不同的，因?yàn)樗?/p>

6、嘗試解釋整個(gè)模型。相反，它訓(xùn)練可解釋的模型來近似單個(gè)預(yù)測。LIME試圖了解當(dāng)我們擾亂數(shù)據(jù)樣本時(shí)預(yù)測是如何變化的。上面左邊的圖像被分成可解釋的部分。然后，LIME通過“關(guān)閉”一些可解釋的組件(在這種情況下，使它們變灰)來生成擾動(dòng)實(shí)例的數(shù)據(jù)集。對于每個(gè)擾動(dòng)實(shí)例，可以使用經(jīng)過訓(xùn)練的模型來獲取圖像中存在樹蛙的概率，然后在該數(shù)據(jù)集上學(xué)習(xí)局部加權(quán)線性模型。最后，使用具有最高正向權(quán)重的成分來作為解釋。06ShapleyValue(SHAP)ShapleyValue的概念來自博弈論。我們可以通過假設(shè)實(shí)例的每個(gè)特征值是游戲中的“玩家”來解釋預(yù)測。每個(gè)玩家的貢獻(xiàn)是通過在其余玩家的所有子集中添加和刪除玩家來衡量的。一名球員的ShapleyValue是其所有貢獻(xiàn)的加權(quán)總和。Shapley值是可加的，局部準(zhǔn)確的。如果將所有特征的Shapley值加起來，再加上基值，即預(yù)測平均值，您將得到準(zhǔn)確的預(yù)測值。這是許多其他方法所沒有的功能。frodelQHJlpPTRAIIO=3該圖顯示了每個(gè)特征的Shapley值，表示將模型結(jié)果從基礎(chǔ)值推到最終預(yù)

人人文庫> 全部分類> 圖紙下載 > 畢業(yè)設(shè)計(jì)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

機(jī)器學(xué)習(xí)模型的可解釋性算法的概念及其重要意義

文檔簡介

溫馨提示

最新文檔

評論

機(jī)器學(xué)習(xí)模型的可解釋性算法的概念及其重要意義

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔