計(jì)算機(jī),人工智能和信息技術(shù).doc_第1頁
計(jì)算機(jī),人工智能和信息技術(shù).doc_第2頁
計(jì)算機(jī),人工智能和信息技術(shù).doc_第3頁
計(jì)算機(jī),人工智能和信息技術(shù).doc_第4頁
計(jì)算機(jī),人工智能和信息技術(shù).doc_第5頁
已閱讀5頁,還剩17頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

計(jì)算機(jī),人工智能和信息技術(shù)在不完備信息系統(tǒng)中的知識(shí)獲?。阂环N粗糙集方法Yee Leung a,*, Wei-Zhi Wu b,c, Wen-Xiu Zhang ba香港香港中文大學(xué)地理和資源管理部,環(huán)境政策和資源管理中心和地球信息科學(xué)聯(lián)合實(shí)驗(yàn)室b中國(guó)陜西西安西安交通大學(xué)自然科學(xué)學(xué)院信息與系統(tǒng)科學(xué)研究所,郵編710049c中國(guó)浙江舟山浙江海洋學(xué)院信息學(xué)院,郵編316004摘要本文闡述了用粗糙集理論在不完備信息系統(tǒng)中的知識(shí)獲取。不完備系統(tǒng)中的相似類的概念被首次提出。兩種不同的分區(qū),上,下近似,為了在不完備決策表中的確定的關(guān)聯(lián)規(guī)則的采集于是形成。一類“某些最佳的”和另一類“最佳的關(guān)聯(lián)”決策規(guī)則被生成。與每一個(gè)決策規(guī)則有關(guān)的兩個(gè)新的量化措施,“隨機(jī)確定性因素”和“隨機(jī)覆蓋因子”被進(jìn)一步提出來解釋在不完備決策表中的規(guī)則的條件和判定部分的關(guān)系。在此類表中最佳規(guī)則的描述和歸納的減少也被驗(yàn)證。1. 介紹Pawlak(1982)提出的粗糙集理論是一個(gè)表現(xiàn)不足的和不完整的特點(diǎn)的信息智能系統(tǒng)研究的集合論的延伸。使用在粗糙集理論中上,下近似的概念,隱藏在信息系統(tǒng)中的知識(shí)可能是被拆開的并以決策規(guī)則的形式被表達(dá)。上,下近似的經(jīng)典定義,有時(shí)被叫做Pawlak粗糙近似,最初和涉及到被假設(shè)為一個(gè)等價(jià)關(guān)系(自反,對(duì)稱和傳遞))(Pawlak, 1982, 1991)的不可識(shí)別性關(guān)系一起被引入。這種模式在完整信息系統(tǒng)和完整決策表中的數(shù)據(jù)分析是有用的。Pawlak的粗糙近似可推廣到“異”運(yùn)算關(guān)系(Greco 等, 2001;Slowinski and Vanderpooten, 1997, 2000;Wu and Zhang,2002;Yao, 1998)。Pawlak粗糙集模型的延伸可能能用于推理和在不完整的信息系統(tǒng)和不完整的決策表中的知識(shí)獲?。―embczynski等, 2002; Greco等, 1999; Grzymala-Busse, 1991; Kryszkiewicz, 1998a,b, 1999a,b, 2001b; Kryszkiewicz and Rybinski, 1998, 2000; Leung and Li, 2003; Lingars and Yao, 1998)。一個(gè)上,下近似更普遍的定義,稱為模糊上,下近似,能被模糊關(guān)系定義并能被應(yīng)用到模糊信息系統(tǒng)(see 等 Bodjanova, 1987; Dubois and Prade, 1990; Hong 等, 2000; Korvin 等, 1998; Wu 等, 2003a,b)。當(dāng)粗糙集近似值被用來從一個(gè)假設(shè)的信息系統(tǒng)提取判定規(guī)則,判定規(guī)則的兩種類型則可以推導(dǎo)?;谂卸惖南录?jí)近似值,某些信息能被發(fā)現(xiàn)并且某些規(guī)則可以被提出,然而通過使用判定類的上級(jí)近似值,不確定或部分確定的信息被發(fā)現(xiàn)或關(guān)聯(lián)規(guī)則可能被歸納出。很多使用粗糙集理論的途徑已經(jīng)被提出,用來從采用決策表的數(shù)據(jù)集促進(jìn)決策規(guī)則。Chan 和 Grzymala-Busse (1994), Grzymala-Busse (1992), Skowron (1993), Skowron 和 Rauszer (1992), Slezak (1996), Stefanowski (1998), Stefanowski 和 Vanderpooten(1994), Ziarko (1993),例如,使用不同的方法來歸納出完全決策表中的決策規(guī)則。Greco 等 (1999), Grzymala-Busse (1991), Kryszkiewicz (1998a,b, 1999a, 2001b),Kryszkiewicz 和 Rybinski (2000), 用粗糙集模型的擴(kuò)展名來推導(dǎo)不完全信息系統(tǒng)中的缺失的數(shù)值。Lingras 和 Yao (1998)用粗糙集模型的兩種概括通過不完整數(shù)據(jù)庫來生成概率規(guī)則而不是Pawlak提出的粗糙集模型用完全決策表產(chǎn)生的概率規(guī)則。其他研究者,如Slowinski 和 Stefanowski (1994), Hong 等 (2000), 和 Korvin 等 (1998),用粗糙集模型來處理模糊和定量數(shù)據(jù)。由于涉及到一些基本的要求,許多類型的屬性約簡(jiǎn)和決策規(guī)則在粗糙集研究中已經(jīng)被提出。例如Kryszkiewicz (2001a,b)調(diào)查,比較和證明知識(shí)減少的經(jīng)典粗糙集類型的靜態(tài)關(guān)系。通過使用差別矩陣和布爾推理技術(shù),許多方法已經(jīng)被提出來計(jì)算知識(shí)的減少并在有條件的對(duì)象屬性值可能缺失的不完全決策表中獲得最佳的正確的,確定的和合適的決策規(guī)則(Skowron, 1993; Skowron 和 Rauszer, 1992;Kryszkiewicz, 1998a,b, 1999a, 2001b; Kryszkiewicz 和 Rybinski, 1998, 2000)。Leung 和 Li (2003)使用最大一致的數(shù)據(jù)塊技術(shù)的概念來獲取不完整信息系統(tǒng)中的規(guī)則。對(duì)于關(guān)于提取自完全決策表中的規(guī)則的不確定,兩個(gè)被叫做確定性和覆蓋面因素的重要量化措施已經(jīng)被提出。它們被視為兩個(gè)滿足貝葉斯定理沒有先后概率的經(jīng)典概率(Pawlak, 2001)。這兩個(gè)數(shù)量可以被用于分析一個(gè)規(guī)則條件和決策部分的關(guān)系。然而在不完全決策表中這個(gè)問題更為復(fù)雜,因?yàn)樗械某跫?jí)集的類別不再是一個(gè)分區(qū)而是一個(gè)論述領(lǐng)域的覆蓋面。由于現(xiàn)實(shí)生活中不完全信息系統(tǒng)的蔓生的存在,一個(gè)新的知識(shí)獲?。ò匆?guī)則)方法成為需要。本文的目的是建造一個(gè)新的不完全系統(tǒng)的粗糙集模型,其中集和描述符都可以估計(jì)。通過使用上,下近似,我們表明所有不完全決策表中的確定的關(guān)聯(lián)規(guī)則都可以被解決。參照不同要求,一類適合于一致描述符德“最佳的確定的決策規(guī)則”和另一類適合于不一致描述符的“最佳的關(guān)聯(lián)規(guī)則”也被得到。對(duì)于不確定的測(cè)量,我們提出兩種新的叫做“隨機(jī)確定因素”和“隨機(jī)覆蓋因素”的適合于每個(gè)提取自決策規(guī)則德量化措施。于另外兩個(gè)眾所周知的量化措施可靠性和覆蓋范圍因素一起,不完全決策表中規(guī)則的條件和決策部分的關(guān)系能被分析。為了幫助我們的討論,我們首先在第二節(jié)中介紹信息系統(tǒng)和決策表中的基本概念。然后粗糙集的基本概念和相關(guān)概念在第三節(jié)被提出以形成一個(gè)在不完全信息系統(tǒng)中規(guī)則獲取的基礎(chǔ)。隨后決策規(guī)則的不確定事物的措施在第四節(jié)中被檢查。在第五和第六節(jié),我們分別討論描述符的減少和最佳的決策規(guī)則的歸納法。然后我們用總結(jié)和展望進(jìn)一步研究結(jié)束這篇論文。在附錄中提供屬性證明和命題以供參考。2. 信息系統(tǒng)和決策表信息系統(tǒng)(IS)的概念在它們的屬性方面為對(duì)象的表示法提供了一個(gè)便利的基礎(chǔ)。一個(gè)完整的信息系統(tǒng)(CIS),S是一對(duì)(U,AT),其中U是一個(gè)叫做論述域的對(duì)象的非空有限集,AT是一個(gè)屬性的非空有限集,例如a:對(duì)于任何 即x) 其中Va被叫做屬性域a。當(dāng)一個(gè)信息系統(tǒng)中的一些屬性的精確值不知道,即丟失或部分知道,那么這種系統(tǒng)被成為不完全信息系統(tǒng)(IIS)并且仍然被表示,沒有被=(U; AT)混淆。這種情況可以用屬性值函數(shù)a被定義為一個(gè)從U映射到冪集Va的集基礎(chǔ)的信息系統(tǒng)。例如,缺少的值a(x)能用所有適合屬性的可能值來代表,即a(x) = Va;并且如果a(x)是部分知道的,例如,我們知道a(x)不是,值那么a(x)的值被指定為。決策表(DT)是一個(gè)的信息系統(tǒng),其中和d是所謂決策的完全屬性,AT是所謂有條件的屬性集。如果(U,AT)是一個(gè)完整的信息系統(tǒng),那么代表了一個(gè)完全決策表(CDT),如果(U,AT)是一個(gè)不完全信息系統(tǒng),那么代表了一個(gè)不完全決策表(IDT)。在以下的討論中,符號(hào)和分別表示邏輯連接詞“和”(合取)和“或”(分離)。U的冪集用表示。任何屬性值對(duì)(a, v),被稱為極微的屬性。任何極微屬性或不同極微的屬性被稱為描述符。讓t成為一個(gè)描述符,t中出現(xiàn)的屬性集被表示為A(t)。t中出現(xiàn)極微屬性的數(shù)目即t長(zhǎng)度的描述符用L(t)表示。如果(a, v)是一個(gè)t中出現(xiàn)的極微屬性,我們簡(jiǎn)單的表示為。擁有描述符t的對(duì)象的集被稱為t的支持,并且被表示為,即。如果t和s是兩個(gè)極微屬性,那么它能被說 和。讓t和s成為兩個(gè)描述符。如果對(duì)于所有(a, v)t,我們有(a, v)s,即,t是s中發(fā)生的極微屬性的一個(gè)子集構(gòu)成的,那么我們說t包含s或s包含于等于t,并被表示為or。我們用( 或)表示所有包含(或包含于)t的描述符。如果t是s中發(fā)生的極微屬性的一個(gè)真子集構(gòu)成的那么我們說t真包含s或s真包含于t并被表示為或 。這能被和是部分順序的關(guān)系檢驗(yàn)。特性1.如果,我們表示 對(duì)于任何, 如果A(t)=A,那么t被稱為一個(gè)全描述符。表示 顯然假設(shè)并且xU,我們表示 對(duì)于任何,讓我們定義一個(gè)被叫做在不完全決策表中中t的廣義決策的函數(shù)如下: 任何(d,w),將被稱為t的廣義決策描述符。如果表(其中card )是集合)的基數(shù),那么我們說數(shù)據(jù)符t是相容的,否則它是不相容的。如果表card 適用于任何,那么我們說不完全決策表是相容的,否則它是不相容的。特性2.假設(shè)是不完全決策表wVd, and tDES(AT).。那么即即例1.表1給出一個(gè)不完全決策表的例子,其中U=x1,x2, . . .,x7, AT=a,b是有條件的屬性集并且d是一個(gè)決策屬性,a,b和d分別代表收縮壓,舒張壓和血壓。Va=H, N, L, Vb=H, N, L, Vd=H, N, L,其中H,N和L分別代表高,正常和低。這能從表1得到 3. 粗糙集和相關(guān)概念假設(shè)是一個(gè)完全信息系統(tǒng)。對(duì)于任何aAT, 和 vVa,如果a(x)=a(y)=v,即那么x和y被稱為有與屬性a有關(guān)的不可分辨關(guān)系。此外,如果 x,yU,對(duì)象x和y被稱為用關(guān)于A的不可分辨關(guān)系,當(dāng)且僅當(dāng)存在如或相當(dāng)于a(x)=a(y) 對(duì)于aA成立。假設(shè)。因此,RA的關(guān)系把全集U分為叫做等價(jià)類的不相交子集,并且結(jié)果用形成了一個(gè)U的分區(qū)的U/A表示。等價(jià)類包括x用xA表示,即。在U/A中的分區(qū)被稱為基礎(chǔ)集??紤]到系統(tǒng)中的描述符xA的對(duì)象是不可識(shí)別的。給出一個(gè)任意的集合可能無法用U/A中的等價(jià)類精確描述X。在這個(gè)例子中,有人也許會(huì)用上,下近似來描述X: 下近似是和確定性屬于X的對(duì)象德集合,然而上近似是可能屬于X的對(duì)象的集合。既然RA是等價(jià)的,X的近似能被等價(jià)表示為(Yao, 1998; Zhang 等, 2001): 因此,相當(dāng)于說U的一個(gè)元素必然屬于X,如果所有它的等價(jià)元素屬于X,反之它可能屬于X如果至少一個(gè)它的等價(jià)元素屬于X。()是分區(qū)U/A中X代表,或簡(jiǎn)單說相關(guān)于A德Pawlak粗糙集。在上,下近似發(fā)現(xiàn)后,粗糙集理論被用于獲取確定的和可能的規(guī)則,例如Greco 等 (2001), Lin 和 Yao (1996), Pawlak (1991, 2001), Stefanowski (1998), Stefanowski 和 Vanderpooten (1994), Tsumoto (1998), 等。假設(shè)S=(U,AT)是一個(gè)不完全信息系統(tǒng)。對(duì)于任何aAT 和 vVa如果即那么x和y被稱為有類似關(guān)系相關(guān)于屬性a。此外,如果對(duì)象x和y被稱為有類似關(guān)系相關(guān)于A當(dāng)且僅當(dāng)存在tFDES(A)即。這些關(guān)系如此把全集U分為幾個(gè)可能重疊的子集,并且結(jié)果用U/A表示,其中形成U的一個(gè)覆蓋。這能用 很容易指出。在覆蓋中包括x的集合被叫做相關(guān)于A的相似類并用A(x)表示,即。在U/A覆蓋中的集合被稱為初級(jí)。備注1. 一般來說,x的相似集不是全集的子集,而是全集的字集的一個(gè)無窮集。因此這里介紹的定義是和Kryszkiewicz (1998a, 1999a) 和 Lingras 和 Yao (1998)介紹的不同的。例2. 在例1中由于相同的值H適用于存在于x2, x5, 和 x6的屬性a,對(duì)象x2, x5和 x6共享一個(gè)相似關(guān)系,因此屬于a的相同類。A的覆蓋和AT=a,b能用如下得出: 可以很容易得到a(x2)=x1,x2,x3,x6,x7,x2,x5,x6。對(duì)象x2對(duì)存在于不止一個(gè)a初集中。假設(shè)且。X相關(guān)于A的上,下近似分別用和表示,表示如下: 顯然。中的要素能用屬性集A分為集合X關(guān)于充分肯定的項(xiàng),而中的要素能用屬性A分為X關(guān)于部分肯定的項(xiàng)。類被稱為X相關(guān)于A的邊界并用BNA(X).表示。備注2.不同于Kryszkiewicz (1998a, 1999a)介紹的不完全信息系統(tǒng)中德近似集,我們這里定義的近似集不是全集的子集而是一個(gè)全集的子集的無窮集。假設(shè)s=(d,w)DES(d) 且 tFDES(A), 如果 (),那么我們稱t為s的一個(gè)下近似(上近似)描述符。所有s的下(上)近似描述符用()表示。并且,如果那么t被稱為s相關(guān)于A的邊界描述符。所有s相關(guān)于A的邊界描述符用BNDESA(s)表示。用這種方法我們不但能粗略估計(jì)集合而且能粗略估計(jì)描述符(程式)。性質(zhì)3如下表現(xiàn)了決策類的近似能用廣義決策的平均來表示。性質(zhì)3. 假設(shè)是一個(gè)不完全決策表,wVd, tDES(AT), 那么類似于性質(zhì)3的性質(zhì)也已經(jīng)被Kryszkiewicz and Rybinski (1998, 2000)得到。例3. 在例1中假設(shè)。這能計(jì)算出: 同時(shí) 4. 決策規(guī)則的定量措施隱藏在不完全決策表中的知識(shí)也許是以決策規(guī)則:, 其中 且,的形式被發(fā)現(xiàn)和表達(dá)的,t和s分別叫規(guī)則的條件和決策部分。我們會(huì)說對(duì)象不完全決策表中xU支持規(guī)則當(dāng)且僅當(dāng)。在決策部分和單一決策值一起的規(guī)則將被稱為明確的,反之被稱為不明確的。很多關(guān)于決策規(guī)則的量化措施已經(jīng)在粗糙集理論中被提出和研究。它們每個(gè)都獲得規(guī)則的不同特點(diǎn)。大多數(shù)這方面問題的研究集中在完全決策表中(Pawlak, 2001; Slowinski 和Stefanowski, 1994; Tsumoto, 1998; Yao 和 Zhong, 1999)。然而在不完全決策表中這更復(fù)雜,因?yàn)樵谕耆畔⑾到y(tǒng)中所有AT初級(jí)的無窮集形成一個(gè)決策的全集的分區(qū),然而在不完全信息系統(tǒng)中形成一個(gè)決策全集的覆蓋。在本節(jié)中,新的關(guān)于不完全決策表中決策規(guī)則的量化措施被提出。一些現(xiàn)有的措施被檢查并和新的措施比較。在以下的討論中,將是不完全信息系統(tǒng),且tDES(AT)。4.1.兩個(gè)基本數(shù)量和描述符一個(gè)關(guān)于描述符t的基本數(shù)量被稱為中t的相關(guān)率,并被表示為(Yao and Zhong,1999) 。t的相關(guān)率反映了論術(shù)的全集中對(duì)于描述符t支持的相關(guān)規(guī)模。這個(gè)數(shù)量也許被看做是支持t的論述的全集中的一個(gè)隨機(jī)選擇對(duì)象的概率。我們現(xiàn)在定義另一個(gè)關(guān)于描述符t的基本數(shù)量叫做在如下中t的隨機(jī)概率: t的隨機(jī)概率是全描述符比t小的發(fā)生概率和中全描述符的發(fā)生概率的比值。這個(gè)數(shù)量可能會(huì)被視為一個(gè)隨機(jī)選擇的全描述符比FDES(AT)中t小的概率。顯然如果tFDES(AT),那么 因此 由于形成一個(gè)論述全集的覆蓋,通常我們得到 只有當(dāng)是一個(gè)完全決策表這個(gè)不等式才能變成等式。在這種情況下,我們得到G(t)=RG(t)對(duì)于所有。4.2.確定性因素對(duì)于每個(gè)確定的決策規(guī)則,在不完全決策表中,我們聯(lián)合一個(gè)在中叫做確定性因素的規(guī)則的量化措施,這是(Pawlak, 2001)定義的 。的數(shù)量表現(xiàn)了支持s也支持t的對(duì)象的基數(shù)比中支持s的對(duì)象的基數(shù)。如果,那么中支持s的對(duì)象(100a)%也支持t。在不完全決策表中,這能解釋為如果一個(gè)對(duì)象有決策描述符s那么對(duì)象有決策描述符的概率是a。由于形成一個(gè)論述的全集的覆蓋,那么一般我們有 當(dāng)是一個(gè)完全決策表, 現(xiàn)在我們定義兩個(gè)關(guān)于不完全決策表中決策規(guī)則的新的量化措施。4.4. 隨機(jī)確定因素量化措施 被叫做中決策規(guī)則的隨機(jī)確定因素。數(shù)量反映了條件描述符t決定決策部分s的可靠度。如果=a,那么全描述符的(100a)%比t小引發(fā)決策s?;蛘?,如果t發(fā)生在決策規(guī)則的條件部分,那么決策符是s的概率是a。如果,那么 。同時(shí)我們有 。這能用如果是完全決策表,那么規(guī)則的隨機(jī)確定因素就和規(guī)則的確定因素一樣來驗(yàn)證。4.5.隨機(jī)覆蓋因素量化措施聯(lián)系規(guī)則,s=(d,w), 被叫做的隨機(jī)覆蓋因素。不同于確定因素,反映了條件t實(shí)際上引發(fā)決策s的可靠度。因此隨機(jī)覆蓋因素也許能被用于解釋不完全決策表中決策方面,即,它給出已制成的決策的原因。如果,那么s關(guān)于可靠度a應(yīng)歸于t能被解釋。特別是如果,那么我們說決策s完全被描述符t決定。這能簡(jiǎn)單表示為 尤其如果,那么 同時(shí)我們得到 當(dāng)不完全決策表退化為一個(gè)完全決策表,決策的隨機(jī)覆蓋因素退化為覆蓋因素,即。5. 不完全決策表中描述符的減少5.1. 描述符的約簡(jiǎn)假設(shè)=(U; AT)是一個(gè)不完全信息系統(tǒng)。假設(shè)且。描述符被叫做中t的約簡(jiǎn)描述符,即 ,且。在這種情況下,被叫做中A關(guān)于t的約簡(jiǎn)。在不完全信息系統(tǒng)中t的所有約簡(jiǎn)描述符的集合用redes(t)表示。備注3. 描述符的約簡(jiǎn)使我們能用更少的必須的極小屬性來劃分對(duì)象。這可以看出描述符t的約簡(jiǎn)是描述符包含t保持t的相同支持。也就是說,描述符t的約簡(jiǎn)是在保存了t的相同支持的順序的空間的極大元素。例4. 在例1中能計(jì)算出 redese(a,N)(a,N))= (a,N)(b,N)被對(duì)象x1; x2; x3; x7支持, redese(a,N)(b,H))= (a,N)(b,H)被對(duì)象x3; x6支持, redese(a,H)(b,N))= (a,H)(b,N)被對(duì)象x2; x5支持, redese(a,H)(b,H))= (a,H)(b,H)被對(duì)象x5; x6支持, redese(a,L)(b,L))= (b,L)被對(duì)象x4支持, redese(a,L)(b,N))= (a,L)(b,N)被對(duì)象x7支持.5.2. 描述符的相對(duì)約簡(jiǎn)在這部分中,我們介紹兩個(gè)在不完全決策表中描述符的相對(duì)約簡(jiǎn):廣義決策約簡(jiǎn)和決策約簡(jiǎn)。5.2.1. 描述符的廣義決策約簡(jiǎn)假設(shè)=(U,AT U d是一個(gè)不完全決策表且。描述符指中t的廣義決策約簡(jiǎn),即 ,且。在這種情況下,指的是中AT相關(guān)于t的廣義決策約簡(jiǎn)。所有中t的廣義決策約簡(jiǎn)的集合用gdre(t)表示。描述符指的是中t的最佳廣義約簡(jiǎn)描述符,即是一個(gè)極小數(shù)如是中的一個(gè)廣義決策約簡(jiǎn)描述符。中t的所有最佳廣義決策約簡(jiǎn)描述符的集合用ogdre(t)表示。然而,t的最佳廣義決策約簡(jiǎn)描述符是一個(gè)包含t的描述符,有最小長(zhǎng)度描述符且保持t的相同廣義決策。5.2.2 描述符的決策約簡(jiǎn)假設(shè)是一個(gè)不完全決策表且。描述符指中t的決策約簡(jiǎn),即 且,使得滿足,其中被稱為t的決策分布并被表示為 在這種情況下,指中AT相關(guān)于t的決策約簡(jiǎn)。中t的所有決策約簡(jiǎn)的集合用mdre(t)表示。能觀察到如果是t的決策約簡(jiǎn),那么。描述符指的是中t的一個(gè)最佳的決策約簡(jiǎn),即是一個(gè)滿足是中的決策約簡(jiǎn)的極小數(shù)。所有中t的最佳的決策約簡(jiǎn)的集合用omdre(t)表示。因此t的一個(gè)最佳的決策約簡(jiǎn)是一個(gè)包含t的描述符,有極小描述長(zhǎng)度且保持t的相同決策分布。6. 不完全決策表中決策規(guī)則的介紹在粗糙集研究中很多種屬性約簡(jiǎn)和決策結(jié)果已經(jīng)被提出。例如Kryszkiewicz (2001a)已經(jīng)制定了在矛盾的完全決策表中知識(shí)約簡(jiǎn)的傳統(tǒng)類型之間的關(guān)系。在本部分中,我們通過使用在矛盾的完全決策表中的描述符的約簡(jiǎn)研究了規(guī)則約簡(jiǎn)。我們用規(guī)則約簡(jiǎn)來覆蓋所有論述全集中的對(duì)象。廣義決策約簡(jiǎn)和決策約簡(jiǎn)被用來處理一致和不一致的數(shù)據(jù)。根據(jù)兩個(gè)不同基本要求它們能被用在不完全決策表中的最佳確定的和關(guān)聯(lián)規(guī)則建設(shè)上。6.1. 決策規(guī)則的類型假設(shè)是一個(gè)不完全決策表,。l 決策規(guī)則指不完全決策表中成立的即。當(dāng)是成立的,我們用代替表示。l 決策規(guī)則指不完全決策表中確定的即它是明確的和成立的。l 指不完全決策表中的關(guān)聯(lián)規(guī)則即它是明確的且。l 指不完全決策表中的不精確的關(guān)聯(lián)規(guī)則即它是明確的,不成立的,但。l 確定的決策規(guī)則,指不完全決策表中最佳廣義決策規(guī)則即t是中的一個(gè)最佳廣義決策約簡(jiǎn)描述符。l 不精確的關(guān)聯(lián)規(guī)則,指不完全決策表中最佳的廣義決策規(guī)則即t是中最佳的廣義決策約簡(jiǎn)描述符。l 不精確的關(guān)聯(lián)規(guī)則,指不完全決策表中最佳的決策規(guī)則即t是中最佳的決策約簡(jiǎn)描述符。應(yīng)當(dāng)指出,對(duì)于一個(gè)最佳的確定的決策規(guī)則,t是中最佳的廣義決策約簡(jiǎn)描述符和最佳的決策約簡(jiǎn)描述符。使用相關(guān)于不完全決策表中有條件的屬性集合的每個(gè)決策類的上,下近似,所有來自不完全決策表的成立的,確定的,關(guān)聯(lián)規(guī)則能被表現(xiàn)。命題1. 假設(shè)是不完全決策表且那么 決策規(guī)則在中是成立的。命題2. 假設(shè)是不完全決策表。如果是明確的,且;那么決策規(guī)則在中是確定的。命題3. 假設(shè)是不完全決策表。如果是明確的,且;那么那么決策規(guī)則在中是關(guān)聯(lián)規(guī)則。命題4. 假設(shè)是不完全決策表。如果是明確的,且;那么那么決策規(guī)則在中是不確切的關(guān)聯(lián)規(guī)則。下列命題表明明確的決策規(guī)則類型也能用規(guī)則確定因素的方法表示。命題5. 假設(shè)且那么(1) 是一個(gè)確定規(guī)則即。(2) 是一個(gè)關(guān)聯(lián)規(guī)則即。(3) 是一個(gè)不確定的關(guān)聯(lián)規(guī)則即。6.2. 最佳的確定的決策規(guī)則這能很容易觀察到最佳的確定的決策規(guī)則是在中規(guī)則的條件部分中有最小描述長(zhǎng)度確定和論述全集中最大的支持的決策規(guī)則。性質(zhì)4. 如果且那么因此,最佳確定決策規(guī)則也許被認(rèn)為是一個(gè)用戶規(guī)定的閾值其中t是DES(AT)中的最大元素和部分順序關(guān)系如決策規(guī)則是確定的。6.3. 最佳關(guān)聯(lián)決策規(guī)則的兩種類型如果是一個(gè)不精確的關(guān)聯(lián)規(guī)則,即,且,那么我們能從6.1部分看出這和最佳的關(guān)聯(lián)規(guī)則的兩種類型是關(guān)聯(lián)的,一個(gè)是最佳廣義規(guī)則,另一個(gè)是最佳決策規(guī)則。在不完全決策表中的最佳廣義規(guī)則是一個(gè)不精確的關(guān)聯(lián)規(guī)則,其中條件部分是不完全決策表中的一個(gè)最佳的廣義決策約簡(jiǎn)描述符。這可以看出最佳廣義決策規(guī)則是在規(guī)則的條件部分有極小描述長(zhǎng)度不精確的關(guān)聯(lián)規(guī)則來保持中一些全描述符的相同廣義決策。應(yīng)當(dāng)指出的是,盡管是中的最佳廣義規(guī)則,也可能存在描述符即是確定的。不完全決策表中的最佳決策規(guī)則是一個(gè)不精確的關(guān)聯(lián)規(guī)則,其中條件部分是不完全決策表中最佳決策約簡(jiǎn)描述符??梢钥闯鲎罴褯Q策規(guī)則是有極小描述長(zhǎng)度來保持中一些全描述符的相同決策分布的不精確關(guān)聯(lián)規(guī)則。而且,如果是中最佳決策規(guī)則,那么是對(duì)于的不精確關(guān)聯(lián)規(guī)則。性質(zhì)5. 如果是不精確的關(guān)聯(lián)規(guī)則,且,那么是不精確的關(guān)聯(lián)規(guī)則。因此我們從性質(zhì)5知道最佳的決策規(guī)則能被當(dāng)做一個(gè)用戶確定的閾值,其中t是一個(gè)DES(AT)中關(guān)于在對(duì)于需求的規(guī)則主題的條件部分集合的部分順序關(guān)系的有中的一些全描述符的相同分布的極小元素。性質(zhì)6. 。例5. 在例1中我們能用4個(gè)表1中的量化措施得到所有最佳確定的和關(guān)聯(lián)規(guī)則。最佳確定決策規(guī)則是 最佳決策規(guī)則是 從第一個(gè)規(guī)則r1我們能得出以下結(jié)論:有正常收縮壓和正常舒張壓的對(duì)象百分之五十有正常血壓。如果對(duì)象有正常的血壓,那么對(duì)象有正常收縮壓和正常舒張壓的概率是一。如果條件是正常收縮壓和正常舒張壓,那么血壓是正常的概率是0.50。正常血壓取決于正常收縮壓和正常舒張壓的可靠度是2/3。其他規(guī)則也有類似解釋。從兩個(gè)正確的決策規(guī)則得到的五個(gè)最佳決策規(guī)則 最佳廣義規(guī)則是規(guī)則的解釋近似于規(guī)則。7. 結(jié)論在這篇論文中我們制定了在不完全信息系統(tǒng)和不完全決策表中知識(shí)獲取的研究的總體框架。不同于只能近似集合的標(biāo)準(zhǔn)的粗糙集模型和廣義的粗糙集模型,擬議的粗糙集途徑使我們能近似估計(jì)不止集合,還有描述符。用這些近似,準(zhǔn)確,確定和關(guān)聯(lián)規(guī)則,從矛盾的不完全決策表中可以推導(dǎo)。一種描述符的約簡(jiǎn)和描述符的相對(duì)約簡(jiǎn)已近被提出來滿足兩中不同需求,即有極小描述長(zhǎng)度和保持描述符的相同廣義決策的廣義決策約簡(jiǎn),反之有極小描述長(zhǎng)度和保持描述符的相同決策分布的決策約簡(jiǎn)?;诿枋龇南鄬?duì)約簡(jiǎn),最佳確定和最佳關(guān)聯(lián)規(guī)則已經(jīng)被得到。兩個(gè)新的量化措施,隨機(jī)確定因素和隨機(jī)覆蓋因素,已經(jīng)被提出用來獲取不同特點(diǎn)的規(guī)則。由于不完全決策系統(tǒng)是比完全決策系統(tǒng)更復(fù)雜的,不完全信息系統(tǒng)中的不同需求下的知識(shí)獲取研究是必要的。對(duì)于今后的研究,提出的途徑能被推廣到更一般和復(fù)雜的信息系統(tǒng)如不完全模糊信息系統(tǒng)。感謝作者要感謝無名介紹者提出的寶貴的意見的建議。改項(xiàng)目是由香港研究資助理事會(huì)的香港中文大學(xué)專項(xiàng)補(bǔ)助資金4362/00H,中國(guó)國(guó)家973計(jì)劃(no. 2002CB312200),中國(guó)國(guó)家自然科學(xué)基金會(huì)(no. 60373078),和中國(guó)博士后科學(xué)基金會(huì)(no.2003034409)資助的。附錄A. 性質(zhì)和命題的證明性質(zhì)1的證明. 假設(shè),即對(duì)于所有,我們能得到。對(duì)于任何,由于我們得到。因此對(duì)于任何 ,即。性質(zhì)2的證明. (1) .由于,我們得到d(x)=w,,因此,。應(yīng)該被注意的是表示。因此,。應(yīng)該被注意的是即d(x)=w,對(duì)于所有成立。因此,對(duì)于所有,我們得到,即。(2) . 由于,我們能選擇。這表示存在滿足d(y)=w。因此。由于,那么存在滿足w=d(x),因此。由此可知。性質(zhì)3的證明. (1) 和 (3)能從性質(zhì)2的(1)直接推導(dǎo),(2) 和 (4)能從性質(zhì)2的(2)直接得到。命題1的證明. 應(yīng)該注意的是即。那么即。因此 是真命題。因此命題1是真命題。命題2的證明. 這能直接從命題1獲得。命題3的證明. 應(yīng)該注意的是即。因此 是可能的因此命題3是真命題。命題4的證明. 這能從命題2,3,5直接得到。命題5的證明. (1)(4)能直接從命題14分別得到。性質(zhì)4的證明. 應(yīng)該注意的是即。由于,我們從性質(zhì)1得到。因此即。性質(zhì)5的證明. 應(yīng)該注意的是是一個(gè)不精確關(guān)聯(lián)規(guī)則即且。由于,我們從性質(zhì)1得到。因此且,即是一個(gè)不精確關(guān)聯(lián)規(guī)則。性質(zhì)6的證明. 只需要證明 實(shí)際上,對(duì)于任何,假設(shè)w0=d(y),即,那么滿足 參考文獻(xiàn)Bodjanova, S., 1987. Approximation of a fuzzy concepts in decision making. Fuzzy Sets and Systems 85, 2329.Chan, C.C., Grzymala-Busse, J.W., 1994. On the two local inductive algorithms: PRISM and LEM2. Foundations of Computing andDecision Sciences 19, 185204.Dembczynski, K., Greco, S., Slowinski, R., 2002. Methodology of rough-set-based classification and sorting with hierarchical structureof attributes and criteria. Control and Cybernetics 31 (4), 891920.Dubois, D., Prade, H., 1990. Rough fuzzy sets and fuzzy rough sets. International Journal of General Systems 17, 191208.Greco, S., Matarazzo, B., Slowinski, R., 1999. Handling missing values in rough set analysis of multi-attribute and multi-criteriadecision problems. In: Zhong, N., Skowron, A., Ohsuda, S. (Eds.), New directions in rough sets, data mining, and granular-softcomputing, Lecture Notes in Artificial Intelligence, vol. 1711. Springer-Verlag, Berlin, pp. 146157.Greco, S., Matarazzo, B., Slowinski, R., 2001. Rough sets theory for multicriteria decision analysis. European Journal of OperationalResearch 129, 147.Grzymala-Busse, J.W., 1991. On the unknown attribute values in learning from examples. In: Proceedings of the ISMIS-91, SixthInternational Symposium on Methodologies for Intelligent Systems Lecture Notes in Artificial Intelligence, vol. 542. Springer-Verlag, New York, pp. 368377.Grzymala-Busse, J.W., 1992. LERSa system for learning from examples based on rough sets. In: Slowinski, R. (Ed.), IntelligentDecision SupportHandbook of Applications and Advances of the Rough Sets Theory. Kluwer Academic Publishers, Dordrecht,pp. 318.Hong, T.P., Wang, T.T., Wang, S.L., 2000. Knowledge acquisition from quantitative data using the rough-set theory. Intelligent DataAnalysis 4, 289304.Korvin, A., de McKeegan, C., Kleyle, R., 1998. Knowledge acquisition using rough sets when membership values are fuzzy sets.Journal of Intelligent and Fuzzy Systems 6, 237244.Kryszkiewicz, M., 1998a. Rough set approach to incomplete information systems. Information Sciences 112, 3949.Kryszkiewicz, M., 1998b. Properties of incomplete information systems in the framework of rough sets. In: Polkowski, L., Skowron, A.(Eds.), Rough Sets in Knowledge Discovery, vol. 1. Physica-Verlag, Heidelberg, pp. 422450.Kryszkiewicz, M., 1999a. Rules in incomplete information systems. Information Sciences 113, 271292.Kryszkiewicz, M., 1999b. Association rules in incomplete databases. In: Zhong, N., Zhou, L. (Eds.), Methodologies for knowledgediscovery and data mining: Proceedings of Third Pacific-Asia Conference, PAKDD-99, Lecture Notes in Computer Science, vol.1574. Springer-Verlag, Berlin, pp. 8493.Kryszkiewicz, M., 2001a. Comparative study of alternative types of knowledge reduction in inconsistent systems. International Journalof Intelligent Systems 16, 105120.Kryszkiewicz, M., 2001b. Rough sets approach to rules generation from incomplete information systems The Encyclopedia ofComputer Sciences and Technology, vol. 44. Marcel Dekker Inc., New York, pp. 319346.Kryszkiewicz, M., Rybinski, H., 1998. Incompleteness aspects in rough sets approach. In: Proceedings of JCIS98, Raleigh, NC, USA,vol. 2, pp. 371374.Kryszkiewicz, M., Rybinski, H., 2000. Data mining in incomplete information systems from rough sets perspective. In: Polkowski, L.,Tsumoto, S., Lin, T.Y. (Eds.), Rough Set Methods and Applications, New Developments in Knowledge Discovery andInformation Systems. Physica-Verlag, Heidelberg, pp. 567580.Leung, Y., Li, D., 2003. Maximal consistent block technique for rule acquisition in incomplete information systems. InformationSciences 153, 85106.Lin, T.Y., Yao, Y.Y., 1996. Mining soft rules using rough sets and neighborhoods. In: Proceedings of the Symposium on Modelling,Analysis and Simulation, Computational Engineering in Systems Applications (CESA96), IMASCS Multiconference, Lille,France, July 912, 1996, pp. 10951100.Lingras, P.J., Yao, Y.Y., 1998. Data mining using extensions of the rough set model. Journal of the American Society for InformationScience 49, 415422.Pawlak, Z., 1982. Rough sets. International Journal of Computer and Information Science 11, 341356.Pawlak, Z., 1991. Rough sets: Theoretical Aspects of Reasoning about Data. Kluwer Academic Publishers, Boston.Pawlak, Z., 2001. Drawing conclusions from datathe rough set way. International Journal of Intelligent Systems 16, 311.Y. Leung et al. / European Journal of Operational Research 168 (2006) 164180 179Skowron, A., 1993. Boolean reasoning for decision rules generation. In: Komorowski, J., Ras, Z. (Eds.), Methodologies for IntelligentSystems, Lecture Notes in Artificial Intelligence, vol. 689. Springer-Verlag, Berlin, pp. 295305.Skowron, A., Rauszer, C., 1992. The discernibility matrices and functions in information systems. In: Slowinski, R. (Ed.), IntelligentDecision Support, Handbook of Applications and Advances of Rough Set Theory. Kluwer Academic Publishers, Dordrecht, pp.331362.Slezak, D., 1996. Approximate reducts in decision tables. In: Proceedings of IPMU96, Granada, Spain, vol. 3, pp. 11591164.Slowinski, R., Stefanowski, J., 1994. Handling various types of uncertainty in the rough set approach. In: Ziarko, W. (Ed.), RoughSets, Fuzzy Sets and Knowledge Discovery. Springer-Verlag, Berlin, British Computer Society, London, pp. 366376.Slowinski, R., Vanderpooten, D., 1997. Similarity relation as a basis for rough approximations. In: Wang, P.P. (Ed.), Advances inMachine Intelligence and Soft-Computing, vol. 6. Duke University Press, Durham, NC, pp. 1733.S

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論