確定性因子理論3_第1頁
確定性因子理論3_第2頁
確定性因子理論3_第3頁
確定性因子理論3_第4頁
確定性因子理論3_第5頁
已閱讀5頁,還剩9頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第二章第二章 確定性因子理論(確定性因子理論(the Theory of Certainty Factors)確定性因子理論,也被稱為確定性因子,確定性因子方法。使用確定性因子處理不確定性的方法,最初是為專家系統(tǒng) MYCIN 開發(fā)的。正象 PROSPECTOR 所處理的地質(zhì)問題那樣,醫(yī)療診斷問題也幾乎總是受不確定性所支配。醫(yī)療診斷與地質(zhì)勘探之間的主要差異是,關(guān)于礦物的所有假說的數(shù)目是很有限的,然而關(guān)于所有醫(yī)療診斷與地質(zhì)勘探之間的主要差異是,關(guān)于礦物的所有假說的數(shù)目是很有限的,然而關(guān)于所有可能疾病的假說卻是很多很多的??赡芗膊〉募僬f卻是很多很多的。貝葉斯定理在醫(yī)療診斷中的準(zhǔn)確使用取決于要知道許多

2、概率值。例如,在給定某些證據(jù)的前提下,貝葉斯定理可用于決定某患者 Pa 得的某一具體的疾?。?(2.1)P D EP E DP DP EP E DP DP E DP Diiiiijjj(|)( |)()()( |)()( |)()其中,關(guān)于 j 的求和遍及所有的疾病,Di表示第 i 種疾病,E 是與 Di有關(guān)的證據(jù),P(Di)是在未獲得任何證據(jù)之前患者 Pa 得疾病 Di的先驗(yàn)概率,P(E|Di)是在假設(shè)疾病 Di存在的前提下患者 Pa 顯現(xiàn)出證據(jù) E的條件概率。 要想確定出所有這些概率值,并且所有這些被確定出的概率值又都是相互一致的,通常是極其困難的,甚至是不可能的。實(shí)際上,證據(jù)是趨向于一件

3、件積累的。實(shí)際上,證據(jù)是趨向于一件件積累的。表達(dá)增量證據(jù)的一個(gè)貝葉斯定理的方便形式是 (2.2)P D EP EDEP D EP EDEP DEiiijjj(| )(|)(|)(|)(|)211211其中,E2是添加到現(xiàn)存證據(jù)體 E1的新證據(jù),由于 E2的添加產(chǎn)生了新證據(jù), . EEE12盡管公式 (2.2) 是精確的,但是,式中的所有概率值通常是不知道的。并且,隨著證據(jù)積聚的數(shù)量的增多,所需的概率值的數(shù)量會(huì)增加得更多,就是說情況會(huì)變得更糟。1 信任和不信任(信任和不信任(Belief and Disbelief)伴隨醫(yī)學(xué)專家出現(xiàn)的另一個(gè)問題是信任與不信任之間的關(guān)系。乍看起來,因?yàn)轱@然不信任簡

4、單的是信任的反面,由此得出似乎這一問題并不重要。但事實(shí)上,概率論要求 即 .P HPH()()1P HPH()() 1對(duì)于依賴于證據(jù) E 的后驗(yàn)假說 H,有 (2.3)P H EPH E(| )(| ) 1然而,當(dāng)建造 MYCIN 的知識(shí)工程們開始訪問醫(yī)學(xué)專家時(shí),知識(shí)工程們發(fā)現(xiàn)內(nèi)科醫(yī)生極其不愿意用公式 (2.3) 的形式去陳述他們(或她們)的知識(shí)。例如,讓我們考慮下述的一條 MYCIN 規(guī)則(Shortliffe,85)IF (1) 微生物的染色體是革蘭氏陽性,并且(2) 微生物的結(jié)構(gòu)是球菌,并且(3) 微生物的生長形態(tài)是鏈狀的THEN 有一個(gè)強(qiáng)度為 0.7 的參考性證據(jù)說明該微生物的類別是鏈

5、球菌這條規(guī)則可寫成后驗(yàn)概率形式0.7 (2.4) P H EEE(|)123其中,Ei (i =1,2,3)對(duì)應(yīng)前件的三個(gè)模式。建造 MYCIN 的知識(shí)工程們又發(fā)現(xiàn)即使當(dāng)一個(gè)內(nèi)科醫(yī)學(xué)專家同意了公式 (2.4) ,但他們對(duì)下述的概率結(jié)果卻予以拒絕0.7 = 0.3 (2.5)PH EEE(|) 1231內(nèi)科專家不同意式 (2.5) 說明數(shù)字 0.7 和 0.3 是信任的似然性度量,而不是信任的概率值。這個(gè)基本問題是:P( H | E ) 蘊(yùn)涵了 E 和 H 之間的原因和結(jié)果關(guān)系,但 E 和 H 之間也許沒有或者不一定有原因與結(jié)果關(guān)系。如果 E 和 H 之間有原因和結(jié)果關(guān)系,并且 公式 P( H

6、| E ) = 1P( H | E ) 是正確的,那么就蘊(yùn)涵著:E 和 H 之間也有原因和結(jié)果關(guān)系。由于概率論的這些問題導(dǎo)致肖特里夫(Shortliffe,1975 年)研究表達(dá)不確定性的其它方式. MYCIN 方法的基礎(chǔ)是從卡納普(Carnap,1950 年)的確認(rèn)理論導(dǎo)出的確定因子理論。 卡納普將概率區(qū)分成兩類。一類是與可重復(fù)事件相聯(lián)系的通常所說的概率。第二類概率被稱之為認(rèn)知概率(epistemic probability) 。又因?yàn)樗谀骋唬ɑ蚰承┳C據(jù)確認(rèn)一個(gè)假說,所以又被稱之為確認(rèn)程度(the degree of confirmation) 。第二種類型的概率是信任的似然度(性)的

7、另一個(gè)例子。2 信任和不信任的度量信任和不信任的度量在 MYCIN 中,確認(rèn)度最初被定義為確定因子,它是信任和不信任之間的差。CF( H , E) = MB( H , E)MD( H , E) 其中,CF 是在證據(jù) E 存在前提下關(guān)于 H 的確定因子,MB 是由于 E 之存在所引起的關(guān)于 H的信任增長的度量,MD 是由于 E 之存在所引起的關(guān)于 H 的不信任增長的度量。這確定因子是結(jié)合信任和不信任成為一個(gè)數(shù)(單個(gè)數(shù))的一種方式。結(jié)合信任和不信任成為一個(gè)數(shù)能被用于按重要性排列假說。例如,如果一個(gè)患者有支持幾種可能疾病的某些癥狀,則具有最高 CF的疾病應(yīng)該是通過排定檢測首先來加以研究的疾病。信任和

8、不信任之度量通過概率被定義的 (2.6)否則如果)(0,1max)()(,)|(max 1,0max)(1),()|(HPHPHPEHPHPEHMBEHMB (2.7)否則如果)(0,1min)()(,)|(min 1,0min)(1),()|(HPHPHPEHPHPEHMDEHMD把 1 和 0 分別寫成 max 1 , 0 和 min 1 , 0 是為了公式(2.6) 和 (2.7) 之間具有對(duì)稱性。要想把 MB 之公式變成 MD 之公式,只須將 MB 之公式中的 max 換成 min . 由公式(2.6) 和 (2.7) 可得到表 1 中所列的結(jié)論: 表 1結(jié) 論MB , MD , CF

9、 的取值假說肯定為真,即 P(H | E) = 1MB = 1 , MD = 0 , CF = 1假說肯定為假,即 P(H | E) = 1MB = 0 , MD = 1 , CF = -1缺乏證據(jù),P(H | E) = P(H)MB = 0, MD = 0 , CF = 0下圖 1 給出了和之間的關(guān)系:)E|H(CF)E|H(P 0MB 與 MD 滿足互斥律。因?yàn)橥粋€(gè)證據(jù) E 不可能同時(shí)既增長了對(duì)假設(shè) H 的信任,又增長了對(duì)假設(shè) H 的不信任,所以我們有互斥律:當(dāng) MBH , E 0 時(shí),必有 MDH , E = 0 ; 當(dāng) MDH , E 0 時(shí),必有 MBH , E = 0 ;注意,由

10、 MB 和 MD 之定義,有 . 由互斥律可導(dǎo)出 CF 與 MB 和 MD 之間0MD,0MB的關(guān)系:0)E,H(CF00)E,H(CF)E,H(CFE,HMB若若 E,HMD0)E,H(CF)E,H(CF0)E,H(CF0若若確定性因子 CF 指出了基于某(或某些)證據(jù)的一個(gè)假說的純的信任. CF 取正值意味著證據(jù)支持假說,因?yàn)?MB MD . CF 等于 1 意味著證據(jù)肯定地證明了假說. CF 等于零的情況是:由 CF = MBMD = 0(zero), 推知 MB = MD = 0,就是說沒有任何證據(jù)存在。 由 CF = MBMD = 0 能否推出:MB = MD 0 ?CF 取負(fù)值意味

11、著證據(jù)贊同否定假說,因?yàn)?MB MD . 對(duì)此的另一種解釋是:不信任一個(gè)假說的理由多于信任它的理由。例如,CF = - 0.7 意味著不信任不信任比信任大 0.7 . CF = 0.7 意味著信任信任比不信任大 0.7 . 0+11P(H|E)1P(H)CF(H|E)圖 1 之間的關(guān)系)E|H(P)E|H(CF和確定性因子(Certainty Factor)允許專家在沒有提交關(guān)于一個(gè)假說的不信任(一個(gè)數(shù)值)的時(shí)候,去表達(dá)一個(gè)信任值,正如CF( H , E)CF( H , E) = 0 (2.8)這意味著:當(dāng)證據(jù) E 用程度 CF( H | E) 確認(rèn)了一個(gè)假說 H 時(shí),關(guān)于假說 H 的確認(rèn)程度

12、 卻不是 1 CF( H | E),就是說這不是概率論所期待的。概率論所期待的恰恰是CF( H , E)CF( H , E) = 1公式 (2.8) 說明了證據(jù)以量 Q 支持一個(gè)假說 H 的同時(shí),又以相同的量 Q 減少了對(duì)假說 H 的支持,以致于 CF( H , E) 與 CF( H , E) 之和為零。例:當(dāng)某學(xué)生的最后一門課程的成績?yōu)锳時(shí),他能否獲得學(xué)位?H 表示能獲得學(xué)位,E 表示最后一門課程的成績?yōu)锳CF(H , E) = 0.70 CF(H , E) = 0.70 (2.9)公式(2.9) 意味著: 如果他的最后一門課程的成績?yōu)锳 ,他有 70 % 的把握獲得學(xué)位; 如果他的最后一門

13、課程的成績?yōu)锳 ,他有 70 %的把握得不到學(xué)位。注意 70 % 的發(fā)生是因?yàn)榇_定性因子被定義在區(qū)間 -1 , +1 上,即 -1 CF(H , E) +1,其中0(zero)意味著證據(jù)不存在。3 不確定性因子的計(jì)算不確定性因子的計(jì)算不確定性因子的值也稱為不確定性值。 證據(jù)的不確定性的描述證據(jù)的不確定性的描述令 e 代表與 E 有關(guān)的所有證據(jù),把 e 和 E 分別看成一條虛擬規(guī)則的前提和結(jié)論,即,注意:這里 CF(E , e) 是 E 當(dāng)前的不確定性值,而不是規(guī)則強(qiáng)度。這正是稱其為虛Ee)e,E(CF擬規(guī)則的原因。 當(dāng) E 肯定為真時(shí),有 CF(E , e) = 1; 當(dāng) E 肯定為假時(shí),有

14、CF(E , e) = 1; 當(dāng)初始對(duì) E 無知時(shí),即用戶還未獲得與 E 有關(guān)的任何證據(jù) e 時(shí),有 CF(E , e) = 0; 當(dāng) E 以某種程度為真時(shí),有 0 CF(E , e) 1; 當(dāng) E 以某種程度為假時(shí),有1 CF(E , e) 0.2 ,可見規(guī)則 R1 滿足觸發(fā)條件,這里的 0.2 表示規(guī)則觸發(fā)閾值。為何設(shè)置規(guī)則觸發(fā)閾值?規(guī)則 R1 后件(或結(jié)論)的不確定性:CF(H , e) = CF(E , e)CF(H , E) = 0.30.7 = 0.21 兩條后件相同之規(guī)則的結(jié)論的不確定性值的綜合兩條后件相同之規(guī)則的結(jié)論的不確定性值的綜合 (2.11)1),(),()(),(),(

15、),(, ),(min1),(),(1),(),()(),(),(0; )(),()(),(),(),(),(),(; )(),()(),(),(),(),(),()&,(21212121212121212121212121eHCFeHCFBeeHCFeHCFeHCFeHCFeHCFeHCFeHCFeHCFBeeHCFeHCFBeeHCFBeeHCFeHCFeHCFeHCFeHCFBeeHCFBeeHCFeHCFeHCFeHCFeHCFeeHCF且當(dāng)且當(dāng)且當(dāng)且當(dāng)如果另有一條滿足觸發(fā)條件的規(guī)則 R2,其后件也是 H,并且 e* 表示與規(guī)則 R2 之前件中的證據(jù)相關(guān)的所有證據(jù),CF(H ,

16、 e* ) = 0.5,那么可用公式 (2.11) 計(jì)算 CF(H , e) = 0.21 和 CF(H , e* ) = 0.5 的綜合結(jié)果:CF(H , e & e* ) = CF(H , e) +CF(H , e* )CF(H , e)CF(H , e* ) = 0.710.105 = 0.605顯然,公式 (2.11) 具有可交換性,即CF(H , e1 & e2) = CF(H , e2 & e1),在被綜合(或組合)的結(jié)論相同的一組規(guī)則中,兩兩綜合次序與綜合結(jié)果無關(guān)。.4 MYCIN 的不確定性值(或不確定性因子)計(jì)算的封閉性的不確定性值(或不確定性因子)計(jì)

17、算的封閉性CF-1 , +1,顯然只須對(duì)公式 (2.11) 證明封閉性。證明: 假設(shè)有兩條規(guī)則 IF E1 THEN H CF(H , E1) 和 IF E2 THEN H CF(H , E2) ,e1和 e2分別表示與 E1和 E2相關(guān)的所有證據(jù)。a. CF(H , e1) 0 且 CF(H , e2)0CF(H , e1 & e2) = CF(H , e1)CF(H , e2)CF(H , e1)CF(H , e2) = CF(H , e1)(1CF(H , e2)CF(H , e2) 1CF(H , e2)CF(H , e2) = 1因?yàn)?CF(H , e1)CF(H , e2)

18、 CF(H , e2) ,所以 CF(H , e1)CF(H , e2)CF(H , e1)CF(H , e2) CF(H , e1)CF(H , e2)CF(H , e2) 0有 0 CF(H , e1 & e2) 1b. CF(H , e1) 0 且 CF(H , e2) 0CF(H , e1 & e2) = CF(H , e1)CF(H , e2)CF(H , e1)CF(H , e2) = (|CF(H , e1)|CF(H , e2)|CF(H , e1)|CF(H , e2)|)故由a. 可知 -1 CF(H , e1 & e2) 0c. CF(H , e1

19、)CF(H , e2) = -1由公式 (2.1.12) ,可知 CF(H , e1 & e2) = 0d. CF(H , e1)CF(H , e2) 0 并且 |CF(H , e1)CF(H , e2)| 1不妨令 CF(H , e1) 0d1. 假定 |CF(H , e1)| |CF(H , e2)| CF HeeCF HeCF HeCF He(,&)(,)(,)(,),122111顯然有011211CF HeCF HeCF He(,)(,)(,)d2. 假定 |CF(H , e1)| |CF(H , e2)| CF HeeCF HeCF HeCF HeX(,&)(

20、,)(,)(,),121221當(dāng)|CF(H , e1)| = |CF(H , e2)| 時(shí),X = 0;當(dāng)|CF(H , e1)| = 1 時(shí),X = -1;故有 -1 X 0 . 證畢 5 確定性因子的困難確定性因子的困難雖然 MYCIN 在疾病診斷方面取得了很大的成功,但是在確定性因子的理論方面卻存在著一些困難。它的主要優(yōu)點(diǎn)是不確定性的計(jì)算簡單,信任和不信任清晰地被分開,能表達(dá)無知,CF 也很直觀、容易被理解。確定性因子存在的主要困難:有時(shí)確定性因子方法得到的 CF 值和條件概率值相反。例例,如果P(H1 ) = 0.8 P(H2 ) = 0.2 P(H1 | E) = 0.9 P(H2

21、| E) = 0.8那么,我們有 CF(H1 , E) = 0.5 和 CF(H2 , E) = 0.75 . 確定性因子方法的一個(gè)意圖是用確定性因子方法的一個(gè)意圖是用 CF 值來排列,比方說疾病假說的次序,但是具有較高條件概率值來排列,比方說疾病假說的次序,但是具有較高條件概率的假說卻有較低的的假說卻有較低的 CF 值,這是明顯是一個(gè)矛盾。值,這是明顯是一個(gè)矛盾。在 MYCIN 中,未要求(從而不能保證)任一個(gè)推理鏈中的任意兩條規(guī)則的確定性因子(規(guī)則強(qiáng)度)間是概率獨(dú)立的。某一個(gè)(任意一個(gè))推理鏈中的任意兩條規(guī)則是: , eICF I e( , ) IHCF H I(, ) 那么,通常有 P(

22、H | e) P(H | I )P(I | e ),其中 I 是基于證據(jù) e 的該推理鏈中的一個(gè)中間假說(或假設(shè))。但是,在 MYCIN 中就認(rèn)為有下式成立:P(H | e) = P(H | I )P(I | e ) ()在上述問題存在的情況下,MYCIN 還能取得如此的成功,主要是因?yàn)楸容^短的推理鏈和比較簡單的假設(shè)(或假說)緣故。值得慶幸的是,在實(shí)際應(yīng)用中相當(dāng)數(shù)量的問題是能滿足“比較短的推理鏈和比較簡單的假設(shè)”的要求的。事實(shí)上,亞當(dāng)斯(Adams,1985 年)具體說明了確定性因子理論實(shí)際上是標(biāo)準(zhǔn)概率論的近似。實(shí)際應(yīng)用問題常常具有較短的推理鏈,決不是說實(shí)際問題的解決只需實(shí)際應(yīng)用問題常常具有較

23、短的推理鏈,決不是說實(shí)際問題的解決只需一步推理,一般說來,不是很復(fù)雜的問題推理鏈大約不超過一步推理,一般說來,不是很復(fù)雜的問題推理鏈大約不超過5步(推理樹大約在步(推理樹大約在5層)層) 。第三章第三章 基于確定性因子模型的專家系統(tǒng)的驗(yàn)證基于確定性因子模型的專家系統(tǒng)的驗(yàn)證1 引引 言言 專專家家系系統(tǒng)統(tǒng)( Expert System, ES)是是一一個(gè)個(gè)智智能能程程序序,它它能能對(duì)對(duì)那那些些需需要要專專家家知知識(shí)識(shí)才才能能解解決決的的應(yīng)應(yīng)用用問問題題,包包括括應(yīng)應(yīng)用用難難題題,提提供供權(quán)權(quán)威威專專家家水水平平的的解解答答。ES 是一種智能化的計(jì)算機(jī)程序系統(tǒng),因此,在 ES 的建造過程中對(duì)一些技

24、術(shù)細(xì)節(jié)必須加以認(rèn)真考慮。 作為一種基于知識(shí)的系統(tǒng),ES 必須具有一定數(shù)量的、高水平的應(yīng)用領(lǐng)域知識(shí),而這些知識(shí)必須能夠反映出權(quán)權(quán)威威專專家家解解決決問問題題的的特特點(diǎn)點(diǎn)和和經(jīng)經(jīng)驗(yàn)驗(yàn)。一般說來,在建造 ES 之初,需要知識(shí)工程師和領(lǐng)域?qū)<业拿芮泻献?,一方面?quán)威領(lǐng)域?qū)<腋鶕?jù)所要解決的領(lǐng)域問題的特點(diǎn),總結(jié)和整理領(lǐng)域知識(shí),和知識(shí)工程師一起完成領(lǐng)域問題求解建模領(lǐng)域問題求解建模,另一方面知識(shí)工程師要構(gòu)建(或選用合適的)知識(shí)表示和問題求解的形式化模型。知知識(shí)識(shí)的的質(zhì)質(zhì)量量和和豐豐富富程程度度對(duì)對(duì)于于ES 的的性性能能影影響響很很大大,所所以以對(duì)對(duì)知知識(shí)識(shí)進(jìn)進(jìn)行行有有效效的的評(píng)評(píng)價(jià)價(jià)和和檢檢測測,是是 ES 建

25、建造造的的關(guān)關(guān)鍵鍵步步驟驟之之一一。 在人類的認(rèn)知和推理過程中,無論是對(duì)一個(gè)事實(shí)(或曰命題、證據(jù))的描述,還是對(duì)一條規(guī)則的刻畫,都具有不確定性和 / 或模糊性, 所以 ES 需要具有處理不確定性和 / 或模糊性問題的能力。 本文的討論主要面對(duì)具有不確定性的領(lǐng)域問題。迄今為止有代表性的不確定性處理模型主要有MYCIN 模型、PROSPECTER 模型、證據(jù)理論模型和貝葉斯網(wǎng)等等。確定性因子理論(Certainty Factor Theory) ,也被稱為確定性因子,確定性因子方法,斯坦福確定性因子代數(shù)(The Stanford Certainty Factor Algebra)等。70 年代中期

26、斯坦福大學(xué)的肖特里夫(Shortliffe)等人為建造專家系統(tǒng) MYCIN,開展了處理不確定性的方法 確定性因子理論的研究 2 . 一方面,盡管在確定性因子的理論方面存在著一些困難,但由于其不確定性值的計(jì)算簡單,信任和不信任清晰地被分開,能表達(dá)無知,CF(Certainty Factor)很直觀、容易被領(lǐng)域?qū)<依斫?,并且MYCIN 在診斷等方面的應(yīng)用中又取得了很大成功,所以基于確定性因子采用產(chǎn)生式規(guī)則表達(dá)知識(shí)的專家系統(tǒng)一直有著廣泛的應(yīng)用。 另一方面,在確定性因子理論研究和基于確定性因子理論的專家系統(tǒng)的建造方面仍然有一些重要的技術(shù)細(xì)節(jié)被忽略,并且在已開發(fā)的一些專家系統(tǒng)中還存在著錯(cuò)誤,如果這些問題

27、不予以認(rèn)真解決,那么對(duì)專家系統(tǒng)研究、建造和應(yīng)用都有較大的副面影響。由此,本本文文打打算算以以不不確確定定性性處處理理方方法法和和知知識(shí)識(shí)表表示示形形式式分分別別采采用用確確定定性性因因子子理理論論和和產(chǎn)產(chǎn)生生式式規(guī)規(guī)則則的的專專家家系系統(tǒng)統(tǒng)(簡簡稱稱為為基基于于確確定定性性因因子子的的專專家家系系統(tǒng)統(tǒng) 或或 MYCIN 類類專專家家系系統(tǒng)統(tǒng))為為例例 ,側(cè)重研究:如何測試、評(píng)價(jià)已開發(fā)的基于確定性因子的專家系統(tǒng)。2 測試、評(píng)價(jià)內(nèi)容測試、評(píng)價(jià)內(nèi)容本文打算重點(diǎn)測試、評(píng)價(jià)基于確定性因子的專家系統(tǒng)的推理機(jī)和知識(shí)庫。對(duì)推理機(jī)的測試、評(píng)價(jià)內(nèi)容主要包括不確定性計(jì)算(或曰不確定性處理模型) ,推理控制策略,不確

28、定性計(jì)算、推理控制策略和知識(shí)表達(dá)的關(guān)系,推理效率和準(zhǔn)確性,不確定性計(jì)算模型的敏感性分析等。對(duì)知識(shí)庫的測試、評(píng)價(jià)主要包括知識(shí)庫的一致性、完備性,規(guī)則的質(zhì)量,循環(huán)推理鏈,規(guī)則之間的約束關(guān)系等。這里應(yīng)指出的是本文所選擇的測試、評(píng)價(jià)內(nèi)容是不完備的,只是較好地覆蓋了應(yīng)重點(diǎn)測試和評(píng)價(jià)的條款。2.1 推推理理機(jī)機(jī)的的測測試試與與評(píng)評(píng)價(jià)價(jià) 1 - 7 1. 不確定性值計(jì)算的封閉性不確定性值計(jì)算的封閉性 對(duì)于一個(gè)不確定性處理模型,其不確定性值計(jì)算的封閉性必須被證明。特別對(duì)于新提出的模型,這一問題是絕對(duì)不能缺少的。MYCIN 的確定性因子模型的封閉性已有證明,故本文不再討論 。2. 測試證據(jù)(或事實(shí))閾值測試證據(jù)

29、(或事實(shí))閾值 測試要點(diǎn):證證據(jù)據(jù)的的存存在在閾閾值值,證證據(jù)據(jù)的的不不存存在在閾閾值值,證證據(jù)據(jù)的的無無知知閾閾值值; 測試方法: 檢查技術(shù)報(bào)告中是否明確設(shè)定了證據(jù)的三種閾值,若設(shè)定了則評(píng)價(jià)閾值的設(shè)定是否合理; 檢查程序?qū)崿F(xiàn)是否與技術(shù)報(bào)告相一致: 通過分析相應(yīng)的算法判斷; 通過合適的例子進(jìn)行檢測。 合理設(shè)定證據(jù)閾值的例子在不確定性的意義下,說某證據(jù) E 趨向于存在,是指該證據(jù)(或該事實(shí))的不確定性值達(dá)到或超過某一指定的閾值。在專家系統(tǒng)和知識(shí)庫的建造中應(yīng)認(rèn)真設(shè)定證據(jù)的存在閾值。對(duì)于 MYCIN 系統(tǒng),一般說來:一個(gè)證據(jù)的信度值大于等于 0.2 則說該證據(jù)趨向于存在(在閾值意義下,簡稱存在) ,

30、一個(gè)證據(jù)的信度值小于等于 0.2 則說該證據(jù)趨向于不存在(在閾值意義下,簡稱不存在) ,一個(gè)證據(jù)的信度值在 0.2 與 0.2 之間則說對(duì)該證據(jù)趨向于無知(在閾值意義下,簡稱無知) 。迄今為止,有關(guān)文獻(xiàn)僅僅提到規(guī)則觸發(fā)閾值 2 。 證據(jù)閾值是證據(jù)存在閾值、證據(jù)不存在閾值證據(jù)閾值是證據(jù)存在閾值、證據(jù)不存在閾值和對(duì)證據(jù)無知閾值的總稱。和對(duì)證據(jù)無知閾值的總稱。證據(jù)閾值可由下式表達(dá):3. 規(guī)則觸發(fā)閾值規(guī)則觸發(fā)閾值 2 測試要點(diǎn): 規(guī)則觸發(fā)閾值 測試方法: 檢查技術(shù)報(bào)告是否明確設(shè)定了規(guī)則觸發(fā)閾值,若設(shè)定了則評(píng)價(jià)閾值的設(shè)定是否合理; 檢查程序?qū)崿F(xiàn)的是否和技術(shù)報(bào)告相一致: 通過分析相應(yīng)的算法進(jìn)行判斷; 使用

31、合適的例子進(jìn)行檢測。 規(guī)則觸發(fā)閾值合理設(shè)定的例子 為了避免誤差較大的觀點(diǎn)被傳播,應(yīng)設(shè)定規(guī)則觸發(fā)閾值,一般可設(shè)為規(guī)則觸發(fā)閾值,一般可設(shè)為0. 2 0. 3 . 規(guī)則被觸發(fā)的條件是:規(guī)則前件的不確定性值大于等于規(guī)則觸發(fā)閾值(當(dāng)觸發(fā)閾值大于零時(shí))或小于等于規(guī)則觸發(fā)閾值(當(dāng)觸發(fā)閾值小于零時(shí)) 。 證據(jù)閾值和規(guī)則觸發(fā)閾值的設(shè)定,一方面提高了系統(tǒng)的推理效率,另一方面也避免了誤差(因傳證據(jù)閾值和規(guī)則觸發(fā)閾值的設(shè)定,一方面提高了系統(tǒng)的推理效率,另一方面也避免了誤差(因傳播所導(dǎo)致)的擴(kuò)大化播所導(dǎo)致)的擴(kuò)大化 。 4. 檢查是否選用了正確的綜合(或曰組合)公式檢查是否選用了正確的綜合(或曰組合)公式 1 2 趨向

32、于肯定無知趨向于趨向于否定 0.2 0.2 , 2 . 0 2 . 0 ),(EECF 任意前件中諸證據(jù)相互獨(dú)立的兩條規(guī)則,若其前件不同但其后件相同,且它們的后件都是假設(shè)或任意前件中諸證據(jù)相互獨(dú)立的兩條規(guī)則,若其前件不同但其后件相同,且它們的后件都是假設(shè)或中間假設(shè),則稱這兩條規(guī)則具有中間假設(shè),則稱這兩條規(guī)則具有綜合關(guān)系綜合關(guān)系。 在實(shí)際生活中如果人們對(duì)同一問題的看法不一致時(shí),一般應(yīng)遵循少數(shù)服從多數(shù)的原則一般應(yīng)遵循少數(shù)服從多數(shù)的原則。這一原則應(yīng)體現(xiàn)在規(guī)則的綜合公式中。例如,若某綜合節(jié)點(diǎn) H 匯集了三路證據(jù),其中有兩路證據(jù)支持 H,另有一路證據(jù)反對(duì) H,并且這三路證據(jù)對(duì) H 的支持強(qiáng)度或反對(duì)強(qiáng)度基

33、本相同,并假定以 H 為后件的三條規(guī)則都滿足規(guī)則觸發(fā)條件,那么綜合的結(jié)果就好象三路證據(jù)中僅僅有一路支持 H 的證據(jù)存在一樣。 兩條前件不同,后件(一個(gè)假設(shè)或中間假設(shè),也稱為結(jié)論或中間結(jié)論)相同之規(guī)則的結(jié)論的不確定性值的正確綜合公式為:)&,(21eeHCF;且當(dāng);且當(dāng);且當(dāng);且當(dāng)1),(),(0),(),(),(,),(min1),(),(1),(),(0),(),(00),(0),(),(),(),(),(0),(0),(),(),(),(),(212121212121212121212121eHCFeHCFeHCFeHCFeHCFeHCFeHCFeHCFeHCFeHCFeHCFeH

34、CFeHCFeHCFeHCFeHCFeHCFeHCFeHCFeHCFeHCFeHCFeHCFeHCF4.3.2.1.公式中的作為分母,保證了少數(shù)服從多數(shù)少數(shù)服從多數(shù) 成立。| ),(| , | ),(|min121eHCFeHCF5. 綜合節(jié)點(diǎn)的匹配沖突消解綜合節(jié)點(diǎn)的匹配沖突消解在與或樹中,具有綜合關(guān)系的多條( 2 條)規(guī)則之后件,一個(gè)假設(shè)或中間假設(shè), 被稱做(與或樹中的)一個(gè)綜合節(jié)點(diǎn)綜合節(jié)點(diǎn)。假定以某一個(gè)綜合節(jié)點(diǎn)為后件的規(guī)則有 N 條,且有 M 條規(guī)則滿足了規(guī)則觸發(fā)條件,M N,那么推理機(jī)必須確保這 M 條規(guī)則依序被執(zhí)行,就是說這就是說這 M 條規(guī)則中只要有一條規(guī)條規(guī)則中只要有一條規(guī)則則 R

35、* 被執(zhí)行,那么其余的被執(zhí)行,那么其余的 M 1 條規(guī)則就要緊接著條規(guī)則就要緊接著 R* ,一條緊接著一條地被執(zhí)行,一條緊接著一條地被執(zhí)行。檢查方法:1. 分析推理機(jī)算法;2. 使用合適的例子進(jìn)行測試。6. 敏感性分析敏感性分析 4 6 分析、測試一棵與或樹的諸葉節(jié)點(diǎn)的不確定性值的變化對(duì)根節(jié)點(diǎn)的不確定性值的影響,以確定輸出對(duì)輸入變化的敏感程度,較好的不確定性計(jì)算模型既不應(yīng)該太敏感,也不應(yīng)該過于遲鈍。檢測方法: 給出分析不確定性模型的方法; 選擇合適的數(shù)據(jù)組進(jìn)行測試。2.2 知識(shí)庫的測試與評(píng)價(jià)知識(shí)庫的測試與評(píng)價(jià) 2 7 1. 規(guī)則強(qiáng)度閾值規(guī)則強(qiáng)度閾值 檢查知識(shí)庫中的規(guī)則是否符合規(guī)定的規(guī)則強(qiáng)度閾值

36、; 按下面的表格獲取知識(shí)庫中關(guān)于規(guī)則強(qiáng)度的統(tǒng)計(jì)數(shù)據(jù)規(guī)則強(qiáng)度值區(qū)間 XT , T+ ( T+ ,T+2 ( T+m ,1(規(guī)則強(qiáng)度值屬于區(qū)間 X 的規(guī)則數(shù)) (規(guī)則總數(shù)) 表表 1 表中 T(一般 0. 5)為知識(shí)庫中的規(guī)則強(qiáng)度閾值, 為統(tǒng)計(jì)步長 在表 1 的基礎(chǔ)上給出知識(shí)有效性的定量或定性評(píng)價(jià)。 2. 規(guī)則強(qiáng)度誤差范圍規(guī)則強(qiáng)度誤差范圍 6 檢查知識(shí)庫中的規(guī)則強(qiáng)度是否都符合規(guī)定的誤差范圍; 按下面的表格獲取知識(shí)庫中關(guān)于規(guī)則強(qiáng)度誤差范圍的統(tǒng)計(jì)數(shù)據(jù) 規(guī)則強(qiáng)度誤差分正誤差 + I 和副誤差 I( I 0) ,規(guī)則強(qiáng)度一般可表為 I I,就是說規(guī)則強(qiáng)度可在區(qū)間 I I,I + I 中取任意值,I 實(shí)質(zhì)上

37、是規(guī)則強(qiáng)度的最可能取值。規(guī)則強(qiáng)度相對(duì)誤差(簡稱為相對(duì)誤差)定義為:( I)/ I,可表為 I X% . 用相對(duì)誤差表示規(guī)則強(qiáng)度的例子,某規(guī)則的規(guī)則強(qiáng)度 0.9 10% ,其含義是該規(guī)則的規(guī)則強(qiáng)度可在區(qū)間 0.8 , 1.0 中取任意值。一般說來,相對(duì)誤差不能超過 20%,并且規(guī)則強(qiáng)度的取值范圍自然必須局限于 1,1之間。規(guī)則強(qiáng)度相對(duì)誤差 Y5%10%15%20%(規(guī)則強(qiáng)度相對(duì)誤差為 Y的規(guī)則數(shù))(規(guī)則總數(shù))表 2 知識(shí)庫中,規(guī)則強(qiáng)度誤差分別為 5%,10%,15% 和 20% 時(shí)的規(guī)則數(shù) 在表 2 的基礎(chǔ)上給出基于規(guī)則強(qiáng)度誤差分布的知識(shí)質(zhì)量的定量或定性評(píng)價(jià)。 3. 檢查具有綜合關(guān)系的規(guī)則檢查具

38、有綜合關(guān)系的規(guī)則檢查知識(shí)庫中具有綜合關(guān)系的規(guī)則之前件是否是獨(dú)立的 任意具有綜合關(guān)系的兩條規(guī)則之前件必須是獨(dú)立的,即它們所包含的證據(jù)(或曰事實(shí))之間是獨(dú)立差錯(cuò)的獨(dú)立差錯(cuò)的,即產(chǎn)生錯(cuò)誤或誤差的原因不具有相關(guān)性。例子: Rule1: if A AND B AND C then X I1; Rule2: if U AND V AND W then X I2; 集合 S1 = A,B,C 中的任一個(gè)證據(jù)與集合 S2 = U,V,W 中的任一個(gè)證據(jù)之間必須是獨(dú)獨(dú)立差錯(cuò)的立差錯(cuò)的。顯然,應(yīng)該有 S1 S2 = .檢查方法: 通過分析具有綜合關(guān)系的規(guī)則進(jìn)行檢查 ; 與系統(tǒng)建造者(特別是領(lǐng)域?qū)<遥┙徽劊私馐欠?/p>

39、按上述理解進(jìn)行知識(shí)獲取和 ES 建造。 4. 知識(shí)庫的一致性、完備性的部分檢查知識(shí)庫的一致性、完備性的部分檢查 4.1 一致性的部分檢查一致性的部分檢查 4.1.1 檢查內(nèi)容檢查內(nèi)容A)知識(shí)庫中諸規(guī)則的強(qiáng)度值應(yīng)該是一致的;B)在知識(shí)庫建造過程中,確保每條規(guī)則前件的證據(jù)集是完備的通常是不現(xiàn)實(shí)的,也是不必要的,實(shí)際上每條規(guī)則前件中包含的都是一些比較重要的證據(jù), “比較重要”應(yīng)該有統(tǒng)一的標(biāo)準(zhǔn);C)規(guī)則間約束關(guān)系的檢查規(guī)則間約束關(guān)系的檢查在專家系統(tǒng)知識(shí)庫中,若同時(shí)存在下述兩條規(guī)則: Rule1: IF A AND B THEN X I1; I1為為 Rule1 的規(guī)則強(qiáng)度的規(guī)則強(qiáng)度 Rule2: IF

40、 A AND B AND C THEN X I2; I2為為 Rule2 的規(guī)則強(qiáng)度的規(guī)則強(qiáng)度 這兩條規(guī)則的后件相同,并且規(guī)則 Rule1 前件中所包含的證據(jù)是另外一條規(guī)則 Rule2 前件中所包含的證據(jù)的真子集,則規(guī)則強(qiáng)度 I2必須大于規(guī)則強(qiáng)度 I1 . 當(dāng)證據(jù) A, B, C 同時(shí)存在時(shí),推理機(jī)必須保證只觸發(fā) Rule2,而不能觸發(fā)規(guī)則 Rule1 . 另外一種解決方案是,把 Rule1 改寫成如下形式: Rule1: IF A AND B AND C THEN X I1D)在知識(shí)庫中下述兩條規(guī)則是不相容的(矛盾的): Rule1: IF A THEN X I1; I1為為 Rule1 的

41、規(guī)則強(qiáng)度的規(guī)則強(qiáng)度 Rule2: IF A THEN X I2; I2為為 Rule2 的規(guī)則強(qiáng)度的規(guī)則強(qiáng)度 就是說知識(shí)庫中,不允許這樣的兩條規(guī)則同時(shí)存在。E) 概念檢查前件包含證據(jù)的邏輯或Rule:IF A AND (B OR C) THEN X I; I 為為 Rule 的規(guī)則強(qiáng)度的規(guī)則強(qiáng)度 當(dāng) B 和 C 都存在時(shí),規(guī)則 Rule 不等價(jià)于如下的兩條規(guī)則 Rule1 和 Rule2: Rule1:IF A AND B THEN X I Rule2:IF A AND C THEN X I 當(dāng) B 和 C 都存在時(shí):若 ,則推理機(jī)執(zhí)行 Rule1,屏蔽 Rule2 ;若),(),(cCCFb

42、BCF,則推理機(jī)執(zhí)行 Rule2,屏蔽 Rule1 ;若,則推理機(jī)執(zhí)),(),(cCCFbBCF),(),(cCCFbBCF行且僅執(zhí)行 Rule1,或者推理機(jī)執(zhí)行且僅執(zhí)行 Rule2 . 4.1.2 檢查方法:檢查方法:由領(lǐng)域?qū)<遗c知識(shí)工程師進(jìn)行檢查。 4.2 完備性的部分檢查完備性的部分檢查要想使一個(gè)知識(shí)庫中所包含的規(guī)則集是完備的,這通常是不可能的,要證明一個(gè)知識(shí)庫所包含的規(guī)則集是否完備是更不可能的。這里所說的完備性系指在某個(gè)領(lǐng)域?qū)<宜芴峁┑闹R(shí)范圍內(nèi),知識(shí)庫中所包含的規(guī)則集是否有多余的規(guī)則,是否缺少規(guī)則。a. 葉節(jié)點(diǎn)、中間假設(shè)節(jié)點(diǎn)、假設(shè)節(jié)點(diǎn)的定義葉節(jié)點(diǎn):初始證據(jù)節(jié)點(diǎn)(不確定性值由用戶給出

43、) ;中間假設(shè)節(jié)點(diǎn):一些中間的結(jié)論或假設(shè)(其不確定性值由推理得出) ;假設(shè)節(jié)點(diǎn):是推理樹的根節(jié)點(diǎn),即最終的推理結(jié)果(其不確定性值由推理得出)。b. 檢查要點(diǎn):所有葉節(jié)點(diǎn)都沒有子節(jié)點(diǎn),中間假設(shè)節(jié)點(diǎn)既有父節(jié)點(diǎn),又有子節(jié)點(diǎn),假設(shè)節(jié)點(diǎn)肯定無父節(jié)點(diǎn);從根節(jié)點(diǎn)出發(fā)的任意一條路徑都能到達(dá)葉節(jié)點(diǎn);從任意中間假設(shè)節(jié)點(diǎn)或葉節(jié)點(diǎn)出發(fā),都有路徑到達(dá)根節(jié)點(diǎn)。c. 檢查方法:c1. 領(lǐng)域?qū)<遗c知識(shí)工程師進(jìn)行檢查;c2. 畫出或由程序畫出知識(shí)庫中規(guī)則的與或樹。 5. 循環(huán)規(guī)則鏈的檢查循環(huán)規(guī)則鏈的檢查 設(shè)計(jì)算法進(jìn)行檢查,或者通過畫出所有的與或樹進(jìn)行檢查。 6. 推理最大層數(shù)的檢查推理最大層數(shù)的檢查 合理的推理層數(shù)為 2 5

44、層。2.3 測試不確定性計(jì)算是否正確測試不確定性計(jì)算是否正確 2 3 5 7 1. 測試?yán)郎y試?yán)?1 在此例子中假定被測系統(tǒng)的證據(jù)閾值為 0. 2 ,規(guī)則觸發(fā)閾值為 0. 2 . 部分規(guī)則集 RULE1: IF E1 THEN H1 (0.9) RULE2: IF E2 THEN H1 (0.8)RULE3: IF E3 THEN H1 (0.9) RULE4: IF E4 AND E5 THEN E1 (0.9)RULE5: IF E6 AND(E7 OR E8)THEN E3 (1.0)RULE6: IF E9 THEN H (0.9) RULE7: IF H1 THEN H (0.9)

45、部分規(guī)則集組成的與或樹圖中的矩形節(jié)點(diǎn)表示葉節(jié)點(diǎn),橢圓形節(jié)點(diǎn)表示中間假設(shè)節(jié)點(diǎn)或假設(shè)節(jié)點(diǎn),缺角矩形節(jié)點(diǎn)表示證據(jù)間的邏輯或關(guān)系。為方便計(jì),我們用矩形框或橢圓形框中的符號(hào)表示相應(yīng)節(jié)點(diǎn)的名字,例如節(jié)點(diǎn) E7,節(jié)點(diǎn) H1,等等。圖中,節(jié)點(diǎn) H1 和節(jié)點(diǎn) H 都是綜合節(jié)點(diǎn),并且是僅有的兩個(gè)綜合節(jié)點(diǎn)。 本例除提供手工計(jì)算外,還可用于檢驗(yàn)專家系統(tǒng)的推理機(jī)和知識(shí)庫,因?yàn)椴淮_定性值的計(jì)算不僅與不確定性值的計(jì)算方法有關(guān),而且與規(guī)則的使用順序(規(guī)則匹配沖突消解)和知識(shí)庫中規(guī)則的 0.9 0.8 0.9圖 1 一個(gè)與或樹的例 0.90.9 0.9HE9H11AND 0.9E1E5E4AND 1. 0E3 0.3 0.8ORE8E7E60.90.90.80.8E2“表達(dá)”有關(guān)。 測試測試 1.1 輸入數(shù)據(jù): 相關(guān)的所有證據(jù)表示與相關(guān)的所有證據(jù)和表示與相關(guān)的所有證據(jù)和表示與,相關(guān)的所有證據(jù)表示與94876354122,EEEEEEEEEEE 9 . 0),(,8 . 0),(,3 . 0),(9 . 0),(,8 . 0),(,9 . 0),(,8 . 0),(49383736151422EECFEECFEECFEECFEECFEECFEECF按正確順序手工

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論