計算機,人工智能和信息技術_第1頁
計算機,人工智能和信息技術_第2頁
計算機,人工智能和信息技術_第3頁
計算機,人工智能和信息技術_第4頁
計算機,人工智能和信息技術_第5頁
已閱讀5頁,還剩17頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、計算機,人工智能和信息技術在不完備信息系統(tǒng)中的知識獲取:一種粗糙集方法Yee Leung a,*, Wei-Zhi Wu b,c, Wen-Xiu Zhang ba香港香港中文大學地理和資源管理部,環(huán)境政策和資源管理中心和地球信息科學聯(lián)合實驗 室b中國陜西西安西安交通大學自然科學學院信息與系統(tǒng)科學研究所,郵編710049c中國浙江舟山浙江海洋學院信息學院,郵編316004摘要本文闡述了用粗糙集理論在不完備信息系統(tǒng)中的知識獲取。不完備系統(tǒng)中的相似類的概 念被首次提出。兩種不同的分區(qū),上,下近似,為了在不完備決策表中的確定的關聯(lián)規(guī)則的 采集于是形成。一類“某些最佳的”和另一類“最佳的關聯(lián)”決策規(guī)則

2、被生成。與每一個決 策規(guī)則有關的兩個新的量化措施,“隨機確定性因素”和“隨機覆蓋因子”被進一步提出來 解釋在不完備決策表中的規(guī)則的條件和判定部分的關系。在此類表中最佳規(guī)則的描述和歸納 的減少也被驗證。1.介紹Pawlak(1982)提出的粗糙集理論是一個表現(xiàn)不足的和不完整的特點的信息智能系統(tǒng)研 究的集合論的延伸。使用在粗糙集理論中上,下近似的概念,隱藏在信息系統(tǒng)中的知識可能 是被拆開的并以決策規(guī)則的形式被表達。上,下近似的經(jīng)典定義,有時被叫做Pawlak粗糙近似,最初和涉及到被假設為一個等價 關系(自反,對稱和傳遞)(Pawlak, 1982, 1991)的不可識別性關系一起被引入。這種模式在

3、 完整信息系統(tǒng)和完整決策表中的數(shù)據(jù)分析是有用的。Pawlak的粗糙近似可推廣到“異”運算 關系(Greco 等,2001;Slowinski and Vanderpooten, 1997, 2000;Wu and Zhang,2002;Yao, 1998) Pawlak粗糙集模型的延伸可能能用于推理和在不完整的信息系統(tǒng)和不完整的決策表中的知 識獲取(D embczynski等,2002; Greco 等,1999; Grzymala-Busse, 1991; Kryszkiewicz, 1998a,b, 1999a,b, 2001b; Kryszkiewicz and Rybinski, 19

4、98, 2000; Leung and Li, 2003; Lingars and Yao, 1998)。一個上,下近似更普遍的定義,稱為模糊上,下近似,能被模糊關系定義并能被應 用到模糊信息系統(tǒng)(see 等 Bodjanova, 1987; Dubois and Prade, 1990; Hong 等,2000; Korvin 等,1998; Wu 等,2003a,b)。當粗糙集近似值被用來從一個假設的信息系統(tǒng)提取判定規(guī)則,判定規(guī)則的兩種類型則可 以推導。基于判定類的下級近似值,某些信息能被發(fā)現(xiàn)并且某些規(guī)則可以被提出,然而通過 使用判定類的上級近似值,不確定或部分確定的信息被發(fā)現(xiàn)或關聯(lián)規(guī)則可

5、能被歸納出。很多 使用粗糙集理論的途徑已經(jīng)被提出,用來從采用決策表的數(shù)據(jù)集促進決策規(guī)則。Chan和 Grzymala-Busse (1994), Grzymala-Busse (1992), Skowron (1993), Skowron 和 Rauszer (1992), Slezak (1996), Stefanowski (1998), Stefanowski 和 Vanderpooten(1994), Ziarko (1993),例如,使用不同的方法來歸納出完全決策表中的決策規(guī)則。Greco等 (1999), Grzymala-Busse (1991), Kryszkiewicz (1

6、998a,b, 1999a, 2001b),Kryszkiewicz和Rybinski (2000),用粗糙集模型的擴展名來推導不完全信息系統(tǒng)中的缺失 的數(shù)值。Lingras和Yao (1998)用粗糙集模型的兩種概括通過不完整數(shù)據(jù)庫來生成概率規(guī)則 而不是Pawlak提出的粗糙集模型用完全決策表產(chǎn)生的概率規(guī)則。其他研究者,如Slowinski和 Stefanowski (1994), Hong等(2000),和Korvin等(1998),用粗糙集模型來處理模糊和定 量數(shù)據(jù)。由于涉及到一些基本的要求,許多類型的屬性約簡和決策規(guī)則在粗糙集研究中已經(jīng)被提出。 例如Kryszkiewicz (2001

7、a,b)調(diào)查,比較和證明知識減少的經(jīng)典粗糙集類型的靜態(tài)關系。通過 使用差別矩陣和布爾推理技術,許多方法已經(jīng)被提出來計算知識的減少并在有條件的對象屬 性值可能缺失的不完全決策表中獲得最佳的正確的,確定的和合適的決策規(guī)則(Skowron, 1993; Skowron 和 Rauszer, 1992;Kryszkiewicz, 1998a,b, 1999a, 2001b; Kryszkiewicz 和 Rybinski, 1998, 2000)。Leung和Li (2003)使用最大一致的數(shù)據(jù)塊技術的概念來獲取不完整 信息系統(tǒng)中的規(guī)則。對于關于提取自完全決策表中的規(guī)則的不確定,兩個被叫做確定性和覆蓋

8、面因素的重要量化 措施已經(jīng)被提出。它們被視為兩個滿足貝葉斯定理沒有先后概率的經(jīng)典概率(Pawlak, 2001)。 這兩個數(shù)量可以被用于分析一個規(guī)則條件和決策部分的關系。然而在不完全決策表中這個問 題更為復雜,因為所有的初級集的類別不再是一個分區(qū)而是一個論述領域的覆蓋面。由于現(xiàn)實生活中不完全信息系統(tǒng)的蔓生的存在,一個新的知識獲取(按規(guī)則)方法成為 需要。本文的目的是建造一個新的不完全系統(tǒng)的粗糙集模型,其中集和描述符都可以估計。 通過使用上,下近似,我們表明所有不完全決策表中的確定的關聯(lián)規(guī)則都可以被解決。參照 不同要求,一類適合于一致描述符德“最佳的確定的決策規(guī)則”和另一類適合于不一致描述 符的

9、“最佳的關聯(lián)規(guī)則”也被得到。對于不確定的測量,我們提出兩種新的叫做“隨機確定 因素”和“隨機覆蓋因素”的適合于每個提取自決策規(guī)則德量化措施。于另外兩個眾所周知 的量化措施可靠性和覆蓋范圍因素一起,不完全決策表中規(guī)則的條件和決策部分的關系能被 分析。為了幫助我們的討論,我們首先在第二節(jié)中介紹信息系統(tǒng)和決策表中的基本概念。然后 粗糙集的基本概念和相關概念在第三節(jié)被提出以形成一個在不完全信息系統(tǒng)中規(guī)則獲取的 基礎。隨后決策規(guī)則的不確定事物的措施在第四節(jié)中被檢查。在第五和第六節(jié),我們分別討 論描述符的減少和最佳的決策規(guī)則的歸納法。然后我們用總結和展望進一步研究結束這篇論 文。在附錄中提供屬性證明和命題

10、以供參考。信息系統(tǒng)和決策表信息系統(tǒng)(IS)的概念在它們的屬性方面為對象的表示法提供了一個便利的基礎。一個完 整的信息系統(tǒng)(CIS),S是一對(U,AT)其中U是一個叫做論述域的對象的非空有限集,AT是一 個屬性的非空有限集,例如/:.對于任何即; .x)其中Va被叫做屬性域a。當一個信息系統(tǒng)中的一些屬性的精確值不知道,即丟失或部分知道,那么這種系統(tǒng) 被成為不完全信息系統(tǒng)(IIS)并且仍然被表示,沒有被=(U; AT)混淆。這種情況可以用 屬性值函數(shù)a被定義為一個從U映射到幕集Va的集基礎的信息系統(tǒng)。例如,缺少的值a(x)能用 所有適合屬性的可能值來代表,即險(乂) = Va ;并且如果a(x)

11、是部分知道的,例如,我們知道 a(x)不是,值那么a(x)的值被指定為,.孚。決策表(DT)是一個:1的信息系統(tǒng),其中和d是所謂決策的完全屬性,A所謂有條件的屬性集。如果(U,AT)是一個完整的信息系統(tǒng),那么代表了 一個完全決策表(CDT),如果(U,AT)是一個不完全信息系統(tǒng),那么代表了一個不完全決 策表(I DT)。在以下的討論中,符號 和分別表示邏輯連接詞“和”(合取)和“或”(分離)。U的幕集 用;表示。任何屬性值對(a, v), 一 =被稱為極微的屬性。任何極微 屬性或不同極微的屬性被稱為描述符。讓t成為一個描述符,t中出現(xiàn)的屬性集被表示為A(t)。t中出現(xiàn)極微屬性的數(shù)目即長度的描述

12、符用L(t)表示。如果(a, v)是一個t中出現(xiàn)的極微屬性, 我們簡單的表示為 。擁有描述符t的對象的集被稱為t的支持,并且被表示為H,即一-: - 。如果t和s是兩個極微屬性,那么它能被說I.II讓t和s成為兩個描述符。如果對于所有(a, v) t,我們有(a, v) s,即,t是s中發(fā)生的極微 屬性的一個子集構成的,那么我們說t包含s或s包含于等于t,并被表示為, 0廠.。我 們用(或)表示所有包含(或包含于)t的描述符。如梟是,中發(fā)生的極微屬性的一個真 子集構成的那么我們說t真包含s或s真包含于t并被表示為或,-。這能被 二,二上-,和-是部分順序的關系檢驗。特性1. 巾I I如果 f,

13、我們表示DES(A) / U is 偵,descriptor and |/| 豐 0對于任何;:”, 如果A(t)=A,那么t被稱為一個全描述符。表示lDES(A) ,丘 DESA) : r is a full A descriptor顯然E.L-假設W 并且x U,我們表示fdes4 (x) - te ides (A): xe |4|對于任何.,.、,讓我們定義一個被叫做在不完全決策表中中t的廣義決策的函 數(shù)如下:照)=dbh 炸 1141、任何(d,w),將被稱為t的廣義決策描述符。如果表1(其中card)是集合)的基數(shù),那么我們說數(shù)據(jù)符t是相容的, 否則它是不相容的。如果表card1適用

14、于任何-.、.、,那么我們說不完全決策表是相容的,否則它是不相容的。特性2,假設前是不完全決策表w Vd, and t DES(AT).。那么-1 = -即 一 -以即例1.表1給出一個不完全決策表迎* 的例子,其中U=x1,x2, . . .,x7, AT=a,b是有條件的屬性集并且d是一個決策屬性,a,b和d分別代表收縮壓,舒張壓和血壓。Va=H, N, L, Vb=H, N, L, Vd=H, N, L,其中H,N和L分別代表高,正常和低。這能從表1得到(% H) A (a, L) A (如L), (a, L) A 色N).FDES(AT - (ff,N) A(Z,N),(a,N) A(

15、*,H),(a,H) A(b,N),(a,H) A(b,H),(ffjL A(fr,L), ()N).忡- (a. H) A (加N),N) A (如 N).Table IExemplary IDTUabd網(wǎng)NN(1LNNII巧(NJIN心任tLL叫NJIIINH可IIX7(L,NNL粗糙集和相關概念假設/- *是一個完全信息系統(tǒng)。對于任何a AT,和v Va,如果a(x)=a(y)=v,即二那么x和y被稱為有與屬性a有關的不可分辨關系。此外,如果二八 x,y U,對象x和y被稱為用關于A的不可分辨關系,當且僅當存在如 -=,或相當于a(x)=a(y) 對于a A成立。假設一;,:- - -

16、-。因此,RA的關系把全集U分為叫做等價類的不相交子集,并且結果用形成了一個U的分區(qū)的U/A表示。等價類包括x用xA表示,即- ,: 、 。在U/A中的分區(qū)被稱為基礎集。考慮到系統(tǒng)中的描述符xA的對象是不可識別的。給出一個任意的集合可能無 法用U/A中的等價類精確描述X。在這個例子中,有人也許會用上,下近似來描*:紂0E:此 AA(X) - xeu: Anx 豐 0).下近似里是和確定性屬于X的對象德集合,然而上近似1 、是可能屬于X的對象 的集合。既然RA是等價的,X的近似能被等價表示為(Yao, 1998; Zhang等,2001):A0) - U虬:Mx M 豐 0因此,相當于說U的一個

17、元素必然屬于X,如果所有它的等價元素屬于X,反之它可能 屬于X如果至少一個它的等價元素屬于X。(里)是分區(qū)U/A中X代表,或簡單說相 關于A德Pawlak粗糙集。在上,下近似發(fā)現(xiàn)后,粗糙集理論被用于獲取確定的和可能的規(guī)則, 例如 Greco 等 (2001), Lin 和 Yao (1996), Pawlak (1991, 2001), Stefanowski (1998), Stefanowski 和 Vanderpooten (1994), Tsumoto (1998),等。假設S=(U,AT)是一個不完全信息系統(tǒng)。對于任何a AT和v 2如果即 那么x和y被稱為有類似關系相關于屬性a。此

18、外,如果: 對象x和y被稱為有類似關系相關于 A當且僅當存在t FDES(A)即-二,。 這些關系如此把全知分為幾個可能重疊的子集,并且結果用U/A表示,其中 形成U的一個覆蓋。這能用F 很容易指出。在覆蓋中包括x的集合被叫做相關于A的相似類并用A(x)表示,即。在U/A覆蓋中的集合: -.被稱為初級。備注1. 一般來說,x的相似集不是全集的子集,而是全集的字集的一個無窮集。因此這里介 紹的定義是和Kryszkiewicz (1998a, 1999a)和Lingras和 Yao (1998)介紹的不同的。例2.在例1中由于相同的值H適用于存在于x2, x5,和x6的屬性a,對象x2, x5 和

19、x6共享一個相似關系,因此屬于a的相同類。A的覆蓋和AT=a,b能用如下得出:t/0=|(%N)|,|S,H)|,|(%L)|一西為,坷為,與,一0&,_存點了,U/AT =|(%N A 0N)|, |3N) A 0, H)| . |S,H) A 0,N)|, |(%H)八(奴H)|,|(%L)/0L)| , HU。八0,N)| -xhx2,xx7,xx6,x2.x5,x5,x6,x4,x1.可以很容易得到a(x2)=x1,x2,x3,x6,x7,x2,x5,x6。對縱2對存在于不止一個a初 集中。假設二且二堅。X相關于A的上,下近似分別用和,表示,表示如下: 蟲X) = |E|:陽|匚同*陽

20、擊頁x) = |r| 511 nx 豐隊 e fdes(a)顯然*八.中的要素能用屬性集a分為集合x關于充分肯定的項,而! -中的要素能用屬性A分為X關于部分肯定的項。i -L類被稱為X相關于A的邊界并用BNA(X).表示。備注2.不同于Kryszkiewicz (1998a, 1999a)介紹的不完全信息系統(tǒng)中德近似集,我們這里定義 的近似集不是全集的子集而是一個全集的子集的無窮集。假設s=(d,w) DES(d)且 t FDES(A),如果 -1 (I ;),那么我們稱t 為s的一個下近似(上近似)描述符。所有的下(上)近似描述符用.(、)表示。并 且,如果I I -I L那么破稱為s相關

21、于A的邊界描述符。所有s相關于A的邊界描述符 用 BNDESA(s)表示。用這種方法我們不但能粗略估計集合而且能粗略估計描述符(程式)。性質(zhì)3如下表現(xiàn)了決策類的近似能用廣義決策的平均來表示。性質(zhì)3.假設、一:是一個不完全決策表,w Vd, t DES(AT), 二那 么()邳|0洲|) = |啡 teFDESA), 0(0= iH彳做洌|)=的|: teFDES(A we 0(0,0) 4(d 曜旭物ES(K);知尸仲,(4) A(dw)= FDES( AY類似于性質(zhì)3的性質(zhì)也已經(jīng)被Kryszkiewicz and Rybinski (1998, 2000)得到。例3.在例1中假設。這能計算出

22、:時=| (地 H)| 伐為,w(x)= |(耳 N)|, |(%H)| = 工T由聞小也那境也0) |(冬 H) A 0,H)| . |(% H) A 0,N)| 為,&,追,,行(罰= |(%N)A0N)|, |(aN)A0H)|H)A0H)|, |(aTH)A(d,N)|=為,的,工為為為,在, 工務孫,力,在,徵*罰ISN)八(如N)| 、 |(%N)八 0H)| 也球同時也1(4 H) = (aTH)A(b,H),(a7H) A (N)7有(X H) (N)八(代 N),(q N)八 0,H), (%H)八(A H),(% H)八 0 N), 州必&(d,H) - (地 N) A 0

23、,N),0,N)八 WH).決策規(guī)則的定量措施隱藏在不完全決策表: ;!:中的知識也許是以決策規(guī)則:;,其中 -:.二且一 :.,的形式被發(fā)現(xiàn)和表達的,t和s分別叫規(guī)則的條件和決策部分。我們會說對象不完全決策表中x u支持規(guī)則一、:-當且僅當二M I在決策部分和單一決策值一起的規(guī)則;r將被稱為明確的,反之被稱為不明確的。很多關于決策規(guī)則的量化措施已經(jīng)在粗糙集理論中被提出和研究。它們每個都獲得規(guī)則 的不同特點。大多數(shù)這方面問題的研究集中在完全決策表中(Pawlak, 2001; Slowinski和 Stefanowski, 1994; Tsumoto, 1998; Yao 和 Zhong, 1

24、999)。然而在不完全決策表中這更復雜, 因為在完全信息系統(tǒng)中所有AT初級的無窮集:形成一個決策的全集的分區(qū),然而在不完全信息系統(tǒng)中:-TLL.L形成一個決策全集的覆蓋。在本 節(jié)中,新的關于不完全決策表中決策規(guī)則的量化措施被提出。一些現(xiàn)有的措施被檢查并和新 的措施比較。在以下的討論中,,將是不完全信息系統(tǒng),且t DES(AT)。兩個基本數(shù)量和描述符一個關于描述符t的基本數(shù)量被稱為中t的相關率,并被表示為(Yao and Zhong,1999)G(t) -card(| ?| )/card(7)。t的相關率反映了論術的全集中對于描述符支持的相關規(guī)模。這個數(shù)量也許被看做是支持t的論述的全集中的一個隨

25、機選擇對象的概率。我們現(xiàn)在定義另一個關于描述符t的基本數(shù)量叫做在如下中t的隨機概率: &WII)F如$咨成cwd(|r|)t的隨機概率是全描述符比t小的發(fā)生概率和中全描述符的發(fā)生概率的比值。這個數(shù)量可能會被視為一個隨機選擇的全描述符比FDES(AT )中小的概率。顯然如果臼FDES(AT),那么因此、&(/)_ 1iFDS(,AT由于形成一個論述全集的覆蓋,通常我們得到2砌ItFDES(AT只有當是一個完全決策表這個不等式才能變成等式。在這種情況下,我們得到G(t)=RG(t)對于所有 m 1L。4.2 .確定性因素對于每個確定的決策規(guī)則.,在不完全決策表中,我們聯(lián)合一個在中叫做確定性因素的規(guī)

26、則的量化措施,這是(Pawlak, 2001)定義的card(|)Cert 5) C?(/ A j)/G(l)A溢的數(shù)量表現(xiàn)了支持s也支持t的對象的基數(shù)比,中支持s的對象的基數(shù)。如 果*1國,那么,中支持s的對象(100a)%也支持t。在不完全決策表中,這能解釋 為如果一個對象有決策描述符s那么對象有決策描述符的概率是a。由于形成一個論述的全集的覆蓋,那么一般我們有Cor (t $) 1 ti=FDlAT當是一個完全決策表,Cor(t s) L現(xiàn)在我們定義兩個關于不完全決策表中決策規(guī)則的新的量化措施。4.4.隨機確定因素量化措施E card(|Z|n |)E card(Hdl)t E fDl-

27、StAT被叫做中,決策規(guī)則的隨機確定因素。記 f數(shù)量反映了條件描述符t決定決 策部分S的可靠度。如果.,=a,那么全描述符的(100a)%比t小引發(fā)決策s?;蛘撸?如果t發(fā)生在決策規(guī)則的條件部分,那么決策符忌的概率是a。如果;.!,、,那么Rcer(t 一對一Cer(t同時我們有、一 (刈用)L 認任 DES (AT)這能用如果,是完全決策表,那么規(guī)則.的隨機確定因素就和規(guī)則的確定因素 樣來驗證。4.5 .隨機覆蓋因素量化措施聯(lián)系規(guī)則I,S=(d,W),E cardWIIW同)E card(|r|n|NI)被叫做的隨機覆蓋因素。不同于確定因素,了:反映了條件t實際上引發(fā)決策S 的可靠度。因此隨

28、機覆蓋因素也許能被用于解釋不完全決策表中決策方面,即,它給出已制 成的決策的原因。如果 - .,那么s關于可靠度a應歸于t能被解釋。特別是如果 那么我們說決策s完全被描述符t決定。這能簡單表示為caid(| n M)RcorU 用一;.rE 瑚(|門I國11F FDES(AT尤其如果,那么(- card(|f | n M)同時我們得到Reov(t s) 1.tEFDS(AT當不完全決策表退化為一個完全決策表,決策一 的隨機覆蓋因素退化為覆蓋因素,即不完全決策表中描述符的減少5.1.描述符的約簡假設=(U; AT)是一個不完全信息系統(tǒng)。假設二且L*。描述符被叫做中t的約簡描述符,即十1 E,且

29、I E在這種情況下,I, ,被叫做中A關于t的約簡。在不完全信息系統(tǒng)中t的所有約簡描 述符的集合用redes(t)表示。備注3.描述符的約簡使我們能用更少的必須的極小屬性來劃分對象。這可以看出描述符的 約簡是描述符包含t保持t的相同支持。也就是說,描述符t的約簡是在保存了的相同支持的 順序的空間二 的極大元素。例4.在例1中能計算出redese (a,N)A(a,N)= (a,N)A(b,N)被對象x1; x2; x3; x7支持, redese (a,N)A(b,H)= (a,N)A(b,H)被對象x3; x6支持, redese (a,H)A(b,N)= (a,H)A(b,N)被對象x2;

30、 x5支持, redese( a,H)A( b,H)= ( a,H)A( b,H)被對象x5; x6支持, redese( a,L)A( b,L)= ( b,L)被對象x4支持,redese (a, L) A (b, N) )= (a, L) A (b, N) 被對象x7支持.描述符的相對約簡在這部分中,我們介紹兩個在不完全決策表中描述符的相對約簡:廣義決策約簡和決 策約簡。5.2.1.描述符的廣義決策約簡假設=(U,AT U d是一個不完全決策表且 m”七。描述符指中t的廣義決策約簡,即.:,且一 一一, 。在這種情況下,、.指的是中AT相關于t的廣義決策約簡。所有中t的廣義決 策約簡的集合

31、用gdre(t)表示。描述符指的是中t的最佳廣義約簡描述符,即是一個極小數(shù)如是中的 一個廣義決策約簡描述符。中t的所有最佳廣義決策約簡描述符的集合用ogdre(t)表示。然而,t的最佳廣義決策約簡描述符是一個包含的描述符,有最小長度描述符且保持t的相同廣義決策。5.2.2描述符的決策約簡假設W 是一個不完全決策表且 fm.f:。描述符-J且,-=、,使得滿足強,其中.被稱為t的決策分布并被表示為card(|/|m |(乩列|) 心槌雙|,|)在這種情況下,指中AT相關于伯勺決策約簡。中t的所有決策約簡的集 合用mdre(t)表示。能觀察到如果.是怕勺決策約簡,那么描述符指的是中t的一個最佳的決

32、策約簡,即是一個滿足.是中的決策約簡的極小數(shù)。所有中t的最佳的決策約簡的集合用omdre(t)表示。因此t的一個最佳的決策約簡是一個包含t的描述符,有極小描述長度且保物的相同決策分布。不完全決策表中決策規(guī)則的介紹在粗糙集研究中很多種屬性約簡和決策結果已經(jīng)被提出。例如Kryszkiewicz (2001a)已經(jīng) 制定了在矛盾的完全決策表中知識約簡的傳統(tǒng)類型之間的關系。在本部分中,我們通過使用 在矛盾的完全決策表中的描述符的約簡研究了規(guī)則約簡。我們用規(guī)則約簡來覆蓋所有論述全 集中的對象。廣義決策約簡和決策約簡被用來處理一致和不一致的數(shù)據(jù)。根據(jù)兩個不同基 本要求它們能被用在不完全決策表中的最佳確定的

33、和關聯(lián)規(guī)則建設上。6.1.決策規(guī)則的類型假設是一個不完全決策表,。決策規(guī)則指不完全決策表中成立的即二.。當是成立 的,我們用代替表示。決策規(guī)則;一廠指不完全決策表中確定的即它是明確的和成立的。:一;指不完全決策表中的關聯(lián)規(guī)則即它是明確的且I I I I ;-:;指不完全決策表中的不精確的關聯(lián)規(guī)則即它是明確的,不成立的,但MrM卻確定的決策規(guī)則.“.“.,指不完全決策表中最佳廣義決策規(guī)則即t是中的一個最佳廣義決策約簡描述符。不精確的關聯(lián)規(guī)則.:.“.“.,指不完全決策表中最佳的廣義決策規(guī)則不精確的關聯(lián)規(guī)則.“.“.,指不完全決策表中最佳的決策規(guī)則即t是中最佳的決策約簡描述符。應當指出,對于一個最

34、佳的確定的決策規(guī)則,t是中最佳的廣義決策約簡 描述符和最佳的決策約簡描述符。使用相關于不完全決策表中有條件的屬性集合的每個決策類的上,下近似,所有來自不 完全決策表的成立的,確定的,關聯(lián)規(guī)則能被表現(xiàn)。命題1.假設是不完全決策表且那么“Ml eat(|時|)一 區(qū)刃r工-命題項:則一是不完全二.、是明確二是且 ; 那 么 決 策 規(guī)貝0r 在.二中是確定的。命題3.假設, ;-是不完全決策表。如果是明確的,且 仁 ;那么那么決策規(guī)則在. 七 仃-七- 仃-、中是關聯(lián)規(guī)則。命題4.假設 3:是不完全決策表。如果.是明確的,C 且; 那么那么決策規(guī)則-? 在 頃、:、中是不確切的關聯(lián)規(guī)則。下列命題表

35、明明確的決策規(guī)則類型也能用規(guī)則確定因素的方法表示。命題5.假設,土且Z ,:那么(1)一,.是一個確定規(guī)則即頃一 L(2),-是一個關聯(lián)規(guī)則即(3廣一,是一個不確定的關聯(lián)規(guī)則即“廠.二.:最佳的確定的決策規(guī)則這能很容易觀察到最佳的確定的決策規(guī)則是在,中規(guī)則的條件部分中有最小描述長度確定和論述全集中最大的支持的決策規(guī)則。性質(zhì)4.如果二:那么;一 -因此,最佳確定決策規(guī)則也許被認為是一個用戶規(guī)定的閾值其中t是DES(AT)中的最大元素和部分順序關系如決策規(guī)則是確定的。最佳關聯(lián)決策規(guī)則的兩種類型如果一.是一個不精確的關聯(lián)規(guī)則,即,且I,那么我們能從6.1部分看出這和最佳的關聯(lián)規(guī)則的兩種類型是關聯(lián)的,

36、一個是最佳廣義規(guī)則,另一個是最佳 決策規(guī)則。在不完全決策表中的最佳廣義規(guī)則是一個不精確的關聯(lián)規(guī)則,其中條件部分是不完 全決策表中的一個最佳的廣義決策約簡描述符。這可以看出最佳廣義決策規(guī)則是在規(guī)則 的條件部分有極小描述長度不精確的關聯(lián)規(guī)則來保持中一些全描述符的相同廣義決策。 應當指出的是,盡管SE項是中的最佳廣義規(guī)則,也可能存在描述符即 是確定的。不完全決策表中的最佳決策規(guī)則是一個不精確的關聯(lián)規(guī)則,其中條件部分是不完 全決策表中最佳決策約簡描述符。可以看出最佳決策規(guī)則是有極小描述長度來保持 中一些全描述符的相同決策分布的不精確關聯(lián)規(guī)則。而且,如果.是中最 佳決策規(guī)則,那么;.一,-;:是對于二的

37、不精確關聯(lián)規(guī)則。性質(zhì)5,如果 .、是不精確的關聯(lián)規(guī)則,且;-;,那么一 uL是不精確的關聯(lián)規(guī)則。因此我們從性質(zhì)5知道最佳的決策規(guī)則能被當做一個用戶確定的閾值,其 中t是一個DES(AT)中關于在對于需求的規(guī)則主題的條件部分集合的部分順序關系二的有 中的一些全描述符的相同分布的極小元素。性質(zhì) 6. 、。例5.在例1中我們能用4個表1中的量化措施得到所有最佳確定的和關聯(lián)規(guī)則。最佳確定決策規(guī)則是Cer Cov Rcer Rcov 1114/6 r”(堡 L)n(d,L) 1112/3最佳決策規(guī)則是CerCorRcerReovF(%N)A0,Nt(N)2/412/42/3r4 : (fl, N)八(&

38、,N) 一 (/H)1/41/31/41/6為:(N)八億,N)r (4L)1/41/21/41/3n:WN)A(,H)T(N)1/21/211/37 -(外 N) A (如 H) 一 (山 H)1/21/21/21/6從第一個規(guī)則r1我們能得出以下結論:有正常收縮壓和正常舒張壓的對象百分之五十有正常血壓。如果對象有正常的血壓,那 么對象有正常收縮壓和正常舒張壓的概率是一。如果條件是正常收縮壓和正常舒張壓,那么 血壓是正常的概率是0.50。正常血壓取決于正常收縮壓和正常舒張壓的可靠度是2/3。其他規(guī)則也有類似解釋。從兩個正確的決策規(guī)則得到的五個最佳;決策規(guī)則r8 : (oN) A 0,N =

39、(rf.N) V (d, H) V (d, L)5 3, N)八仇 H) =L N1 V H)最佳廣義規(guī)則是CerCorRcerRear2/513/62/3*0N)-(4H)2/52/32/62/61/51/21/61/3命(兒 N)-(d,N)2/512/72/3攵(兒 N) 一(d,H)2/52/33/73/61/51/22/72/31/31/21/41/32/32/33/43/6規(guī)則的解釋近似于規(guī)則. L7.結論在這篇論文中我們制定了在不完全信息系統(tǒng)和不完全決策表中知識獲取的研究的總體 框架。不同于只能近似集合的標準的粗糙集模型和廣義的粗糙集模型,擬議的粗糙集途徑使 我們能近似估計不止集

40、合,還有描述符。用這些近似,準確,確定和關聯(lián)規(guī)則,從矛盾的不 完全決策表中可以推導。一種描述符的約簡和描述符的相對約簡已近被提出來滿足兩中不同 需求,即有極小描述長度和保持描述符的相同廣義決策的廣義決策約簡,反之有極小描述長 度和保持描述符的相同決策分布的;決策約簡。基于描述符的相對約簡,最佳確定和最佳關 聯(lián)規(guī)則已經(jīng)被得到。兩個新的量化措施,隨機確定因素和隨機覆蓋因素,已經(jīng)被提出用來獲 取不同特點的規(guī)則。由于不完全決策系統(tǒng)是比完全決策系統(tǒng)更復雜的,不完全信息系統(tǒng)中的 不同需求下的知識獲取研究是必要的。對于今后的研究,提出的途徑能被推廣到更一般和復 雜的信息系統(tǒng)如不完全模糊信息系統(tǒng)。感謝作者要感

41、謝無名介紹者提出的寶貴的意見的建議。改項目是由香港研究資助理事會的香 港中文大學專項補助資金4362/00H,中國國家973計劃(no. 2002CB312200),中國國家自然科 學基金會(no. 60373078),和中國博士后科學基金會(no.2003034409)資助的。附錄A.性質(zhì)和命題的證明性質(zhì)1的證明.假設i三L I,即對于所有,我們能得到 - 0對于任何,由于;我們得到。因此對于任何, ,即I性質(zhì)2的證明.L由于M ,我們得到d(x)=w,* M,因此,/二。應該被注意的是 F* 表示。 因此,一.。應該被注意的是,一 即 d(x)=w,對于所有I三胃成立。因此,對于所有- l

42、-l-,我們得到,即。(2廣 .由于H七.,我們能選擇 1-1 -:10這表示存在】三口滿足 d(y)=w。因此 一.一。由于 ,那么存在- I !滿足w=d(x),因此 I:。由此可知M 士性質(zhì)3的證明.和(3)能從性質(zhì)2的(1)直接推導,(2)和(4)能從性質(zhì)2的(2)直接得到。命題1的證明.應該注意的是E !,-即。那么二-即 心;。因此 是真命題. 。因此命題1是真命題。命題2的證明.這能直接從命題1獲得。命題3的證明.應該注意的是I即”。因此 |f|n |團| # 0 and ? FDESAT(t IklleWJdkll)是可能的 1:!;因此命題3是真命題。命題4的證明.這能從命題

43、2, 3, 5直接得到。命題5的證明.-(4)能直接從命題1 - 4分別得到。性質(zhì)4的證明.應該注意的是即二.。由于=;.,我們從性質(zhì)1得到, M 。因此.二.二.即一 0性質(zhì)5的證明.應該注意的是是一個不精確關聯(lián)規(guī)則即l-l I - -I 且I。由于*,我們從性質(zhì)1得到u二。因此-,二.且l-l . I- -I,即;是一個不精確關聯(lián)規(guī)則。性質(zhì)6的證明.只需要證明Ik II c II V(511實際上,對于任何 I ;1 ,假設w0=d(y),即I : “I :1 ,那么. l:; r -藥滿足咐5 V心卬,衲參考文獻Bodjanova, S, 1987. Approximation of a

44、 fuzzy concepts in decision making. Fuzzy Sets andSystems 85, 23 - 29.Chan, C.C., Grzymala-Busse, J.W., 1994. On the two local inductive algorithms: PRISM andLEM2. Foundations of Computing andDecision Sciences 19, 185 - 204.Dembczynski, K., Greco, S., Slowinski, R, 2002. Methodology of rough-set-bas

45、ed classificationand sorting with hierarchical structureof attributes and criteria. Control and Cybernetics 31 (4), 891 - 920.Dubois, D., Prade, H, 1990. Rough fuzzy sets and fuzzy rough sets. International Journal ofGeneral Systems 17, 191 - 208.Greco, S., Matarazzo, B., Slowinski, R, 1999. Handlin

46、g missing values in rough set analysis of multi-attribute and multi-criteria decision problems. In: Zhong, N., Skowron, A., Ohsuda, S. (Eds.), New directions in rough sets, data mining, and granular-softcomputing, Lecture Notes in Artificial Intelligence, vol. 1711. Springer-Verlag, Berlin, pp. 146

47、- 157.Greco, S., Matarazzo, B., Slowinski, R., 2001. Rough sets theory for multicriteria decision analysis. European Journal of OperationalResearch 129, 1 - 47.Grzymala-Busse, J.W., 1991. On the unknown attribute values in learning from examples. In:Proceedings of the ISMIS-91, SixthInternational Sy

48、mposium on Methodologies for Intelligent Systems Lecture Notes in ArtificialIntelligence, vol. 542. SpringerVerlag, New York, pp. 368- 377.Grzymala-Busse, J.W., 1992. LERSa system for learning from examples based on rough sets. In:Slowinski, R. (Ed.), IntelligentDecision Support Handbook of Applicat

49、ions and Advances of the Rough Sets Theory. KluwerAcademic Publishers, Dordrecht,pp. 3 - 18.Hong, T.P., Wang, T.T., Wang, S.L., 2000. Knowledge acquisition from quantitative data using therough-set theory. Intelligent DataAnalysis 4, 289 - 304.Korvin, A., de McKeegan, C., Kleyle, R., 1998. Knowledge

50、 acquisition using rough sets when membership values are fuzzy sets.Journal of Intelligent and Fuzzy Systems 6, 237 - 244.Kryszkiewicz, M., 1998a. Rough set approach to incomplete information systems. Information Sciences 112, 39 - 49.Kryszkiewicz, M., 1998b. Properties of incomplete information sys

51、tems in the framework of rough sets. In: Polkowski, L., Skowron, A.(Eds.), Rough Sets in Knowledge Discovery, vol. 1. Physica-Verlag, Heidelberg, pp. 422- 450.Kryszkiewicz, M, 1999a. Rules in incomplete information systems. Information Sciences 113, 271 - 292.Kryszkiewicz, M, 1999b. Association rule

52、s in incomplete databases. In: Zhong, N., Zhou, L. (Eds.), Methodologies for knowledgediscovery and data mining: Proceedings of Third Pacific-Asia Conference, PAKDD-99, Lecture Notes in Computer Science, vol.1574. Springer-Verlag, Berlin, pp. 84- 93.Kryszkiewicz, M., 2001a. Comparative study of alte

53、rnative types of knowledge reduction in inconsistent systems. International Journalof Intelligent Systems 16, 105 - 120.Kryszkiewicz, M., 2001b. Rough sets approach to rules generation from incomplete information systems The Encyclopedia ofComputer Sciences and Technology, vol. 44. Marcel Dekker Inc

54、., New York, pp. 319- 346.Kryszkiewicz, M., Rybinski, H., 1998. Incompleteness aspects in rough sets approach. In:Proceedings of JCISA98, Raleigh, NC, USA,vol. 2, pp. 371 - 374.Kryszkiewicz, M., Rybinski, H., 2000. Data mining in incomplete information systems from rough sets perspective. In: Polkow

55、ski, L.,Tsumoto, S., Lin, T.Y (Eds.), Rough Set Methods and Applications, New Developments inKnowledge Discovery andInformation Systems. Physica-Verlag, Heidelberg, pp. 567- 580.Leung, Y., Li, D., 2003. Maximal consistent block technique for rule acquisition in incomplete information systems. Inform

56、ationSciences 153, 85 - 106.Lin, T.Y, Yao, Y.Y., 1996. Mining soft rules using rough sets and neighborhoods. In: Proceedings of the Symposium on Modelling,Analysis and Simulation, Computational Engineering in Systems Applications (CESAA96), IMASCS Multiconference, Lille,France, July 9 - 12, 1996, pp

57、. 1095 - 1100.Lingras, P.J., Yao, YY., 1998. Data mining using extensions of the rough set model. Journal of theAmerican Society for InformationScience 49, 415 - 422.Pawlak, Z., 1982. Rough sets. International Journal of Computer and Information Science 11, 341 - 356.Pawlak, Z., 1991. Rough sets: Th

58、eoretical Aspects of Reasoning about Data. Kluwer Academic Publishers, Boston.Pawlak, Z., 2001. Drawing conclusions from datathe rough set way. International Journal of Intelligent Systems 16, 3-11.Y. Leung et al. / European Journal of Operational Research 168 (2006) 164 - 180 179Skowron, A., 1993.

59、Boolean reasoning for decision rules generation. In: Komorowski, J., Ras, Z.(Eds.), Methodologies for IntelligentSystems, Lecture Notes in Artificial Intelligence, vol. 689. Springer-Verlag, Berlin, pp. 295- 305.Skowron, A., Rauszer, C., 1992. The discernibility matrices and functions in information

60、 systems.In: Slowinski, R. (Ed.), IntelligentDecision Support, Handbook of Applications and Advances of Rough Set Theory. Kluwer Academic Publishers, Dordrecht, pp. 331 - 362.Slezak, D., 1996. Approximate reducts in decision tables. In: Proceedings of IPMUA96, Granada, Spain, vol. 3, pp. 1159 - 1164

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論