




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、高級人工智能第十一章粗 糙 集Rough Set 史忠植中科院計算所7/24/20221內容提要一、概述二、知識分類三、知識的約簡四、決策表的約簡五、粗糙集的擴展模型六、粗糙集的實驗系統(tǒng)七、粒度計算簡介7/24/20222一、 概述 現(xiàn)實生活中有許多模糊現(xiàn)象并不能簡單地用真、假值來表示如何表示和處理這些現(xiàn)象就成為一個研究領域。早在1904年謂詞邏輯的創(chuàng)始人就提出了模糊(Vague)一詞,他把它歸結到邊界線上,也就是說在全域上存在一些個體既不能在其某個子集上分類,也不能在該子集的補集上分類。 7/24/20223模糊集 1965年,Zadeh提出了模糊集,不少理論計算機科學家和邏輯學家試圖通過這
2、一理論解決的模糊概念,但模糊集理論采用隸屬度函數(shù)來處理模糊性,而根本的隸屬度是憑經(jīng)驗或者由領域專家給出,所以具有相當?shù)闹饔^性。 7/24/20224粗糙集的提出 20世紀80年代初,波蘭的Pawlak針對的邊界線區(qū)域思想提出了粗糙集Rough Set他把那些無法確認的個體都歸屬于邊界線區(qū)域,而這種邊界線區(qū)域被定義為上近似集和下近似集之差集。由于它有確定的數(shù)學公式描述,完全由數(shù)據(jù)決定,所以更有客觀性 。7/24/20225粗糙集的研究 粗糙集理論的主要優(yōu)勢之一是它不需要任何預備的或額外的有關數(shù)據(jù)信息。自提出以來,許多計算機科學家和數(shù)學家對粗糙集理論及其應用進行了堅持不懈的研究,使之在理論上日趨完
3、善,特別是由于20世紀80年代末和90年代初在知識發(fā)現(xiàn)等領域得到了成功的應用而越來越受到國際上的廣泛關注。7/24/20226粗糙集的研究 1991年波蘭Pawlak教授的第一本關于粗糙集的專著?Rough Sets:Theoretical Aspects of Reasoning about Data ?和1992年主編的關于粗糙集應用及其與相關方法比較研究的論文集的出版,推動了國際上對粗糙集理論與應用的深入研究。1992年在波蘭Kiekrz召開了第1屆國際粗糙集討論會。從此每年召開一次與粗糙集理論為主題的國際研討會。 7/24/20227研究現(xiàn)狀分析2001年5月在重慶召開了“第1屆中國R
4、ough集與軟計算學術研討會,邀請了創(chuàng)始人Z. Pawlak教授做大會報告;2002年10月在蘇州第2屆中國粗糙集與軟計算學術研討會2003年5月在重慶 第3屆中國粗糙集與軟計算學術研討會2004年10月中下旬在浙江舟山召開第4屆中國粗糙集與軟計算學術研討會2005年8月1日至5日在鞍山科技大學召開第五屆中國Rough集與軟計算學術研討會CRSSC20052006第六屆中國粗糙集與軟計算學術研討會在 浙江師范大學7/24/20228研究現(xiàn)狀分析2007年粗糙集與軟計算、Web智能、粒計算聯(lián)合學術會議, 山西大學2021年第8屆中國粗糙集與軟計算學術會議、第2屆中國Web智能學術研討會、第2屆中
5、國粒計算學術研討會聯(lián)合學術會議CRSSC-CWI-CGrC2021, 河南師范大學 中科院計算所、中科院自動化所、重慶郵電學院、南昌大學、西安交通大學、山西大學、合肥工業(yè)大學、北京工業(yè)大學 、上海大學7/24/20229研究現(xiàn)狀分析曾黃麟. 粗集理論及其應用(修訂版). 重慶: 重慶大學出版社, 1998劉清. Rough Set及Rough推理. 北京: 科學出版社, 2001張文修等. Rough Set理論與方法. 北京: 科學出版社, 2001王國胤. Rough Set理論與知識獲取. 西安: 西安交通大學出版社, 2001史忠植. 知識發(fā)現(xiàn). 北京: 清華大學出版社, 2002苗奪
6、謙/王國胤/劉清/林早陽/姚一 豫. 粒計算-過去現(xiàn)在與展望. 科學出版社, 20077/24/202210二、 知識分類根本粗糙集理論認為知識就是人類和其他物種所固有的分類能力。例如,在現(xiàn)實世界中關于環(huán)境的知識主要說明了生物根據(jù)其生存觀來對各種各樣的情形進行分類區(qū)別的能力。每種生物根據(jù)其傳感器信號形成復雜的分類模式,就是這種生物的根本機制。分類是推理、學習與決策中的關鍵問題。因此,粗糙集理論假定知識是一種對對象進行分類的能力。這里的“對象是指我們所能言及的任何事物,比方實物、狀態(tài)、抽象概念、過程和時刻等等。即知識必須與具體或抽象世界的特定局部相關的各種分類模式聯(lián)系在一起,這種特定局部稱之為所
7、討論的全域或論域(universe)。對于全域及知識的特性并沒有任何特別假設。事實上,知識構成了某一感興趣領域中各種分類模式的一個族集(family),這個族集提供了關于現(xiàn)實的顯事實,以及能夠從這些顯事實中推導出隱事實的推理能力。7/24/202211二、 知識分類 為數(shù)學處理方便起見,在下面的定義中用等價關系來代替分類。一個近似空間(approximate space)或知識庫定義為一個關系系統(tǒng)或二元組 K=(U,R) 其中U 為空集是一個被稱為全域或論域(universe)的所有要討論的個體的集合,R是U上等價關系的一個族集。 7/24/202212二、 知識分類 設PR,且P ,P中所有
8、等價關系的交集稱為P上的一種不可區(qū)分關系(indiscernbility relation)或稱難區(qū)分關系,記作IND(P),即 xIND(p)= xR RP 注意,IND(P)也是等價關系且是唯一的。7/24/202213二、 知識分類 給定近似空間K=(U, R),子集XU稱為U上的一個概念(concept),形式上,空集也視為一個概念;非空子族集PR所產(chǎn)生的不清楚關系IND(P)的所有等價類關系的集合即U/IND(P),稱為根本知識(basic knowledge),相應的等價類稱為根本概念(basic concept);特別地,假設關系QR,那么關系Q就稱為初等知識(elementar
9、y knowledge),相應的等價類就稱為初等概念(elementary concept)。 一般用大寫字母P,Q,R等表示一個關系,用大寫黑體字母P,Q,R等表示關系的族集;xR或R(x)表示關系R中包含元素xU的概念或等價類。為了簡便起見,有時用P代替IND(P)。 根據(jù)上述定義可知,概念即對象的集合,概念的族集分類就是U上的知識,U上分類的族集可以認為是U上的一個知識庫,或說知識庫即是分類方法的集合。7/24/202214二、 知識分類 粗糙集理論與傳統(tǒng)的集合理論有著相似之處,但是它們的出發(fā)點完全不同。傳統(tǒng)集合論認為,一個集合完全是由其元素所決定,一個元素要么屬于這個集合,要么不屬于這
10、個集合,即它的隸屬函數(shù)X(x)0,1。模糊集合對此做了拓廣,它給成員賦予一個隸屬度,即X(x)0,1,使得模糊集合能夠處理一定的模糊和不確定數(shù)據(jù),但是其模糊隸屬度確實定往往具有人為因素,這給其應用帶來了一定的不便。而且,傳統(tǒng)集合論和模糊集合論都是把隸屬關系作為原始概念來處理,集合的并和交就建立在其元素的隸屬度max和min操作上,因此其隸屬度必須事先給定傳統(tǒng)集合默認隸屬度為1或0。在粗糙集中,隸屬關系不再是一個原始概念,因此無需人為給元素指定一個隸屬度,從而防止了主觀因素的影響。7/24/202215Information Systems/TablesIS is a pair (U, A)U
11、is a non-empty finite set of objects.A is a non-empty finite set of attributes such that for every is called the value set of a. Age LEMSx 16-30 50 x2 16-30 0 x3 31-45 1-25x4 31-45 1-25x5 46-60 26-49x6 16-30 26-49x7 46-60 26-497/24/202216Decision Systems/TablesDS: is the decision attribute (instead
12、of one we can consider more decision attributes).The elements of A are called the condition attributes. Age LEMS Walkx 16-30 50 yes x2 16-30 0 no x3 31-45 1-25 nox4 31-45 1-25 yesx5 46-60 26-49 nox6 16-30 26-49 yesx7 46-60 26-49 no7/24/202217Issues in the Decision Table相同或不可區(qū)分的對象可能被表示屢次The same or i
13、ndiscernible objects may be represented several times.有些屬性可能是多余的 Some of the attributes may be superfluous.7/24/202218不可區(qū)分性IndiscernibilityThe equivalence relation A binary relation which is reflexive (xRx for any object x) , symmetric (if xRy then yRx), and transitive (if xRy and yRz then xRz). The
14、 equivalence class of an element consists of all objects such that xRy.7/24/202219不可區(qū)分性Indiscernibility (2)Let IS = (U, A) be an information system, then with any there is an associated equivalence relation: where is called the B-indiscernibility relation.If then objects x and x are indiscernible fr
15、om each other by attributes from B.The equivalence classes of the B-indiscernibility relation are denoted by 7/24/202220不可區(qū)分性實例 IndiscernibilityThe non-empty subsets of the condition attributes are Age, LEMS, and Age, LEMS.IND(Age) = x1,x2,x6, x3,x4, x5,x7IND(LEMS) = x1, x2, x3,x4, x5,x6,x7IND(Age,L
16、EMS) = x1, x2, x3,x4, x5,x7, x6. Age LEMS Walkx 16-30 50 yes x2 16-30 0 no x3 31-45 1-25 nox4 31-45 1-25 yesx5 46-60 26-49 nox6 16-30 26-49 yesx7 46-60 26-49 no7/24/202221概念的邊界 知識的粒度性是造成使用已有知識不能精確地表示某些概念的原因。這就產(chǎn)生了所謂的關于不精確的“邊界思想。著名哲學家Frege認為“概念必須有明確的邊界。沒有明確邊界的概念,將對應于一個在周圍沒有明確界線的區(qū)域。粗糙集理論中的模糊性就是一種基于邊界的概
17、念,即一個不精確的概念具有模糊的不可被明確劃分的邊界。為刻畫模糊性,每個不精確概念由一對稱為上近似與下近似的精確概念來表示,它們可用隸屬函數(shù)定義7/24/202222粗糙集的根本定義知識的分類觀點 粗糙集理論假定知識是一種對對象進行分類的能力。而知識必須與具體或抽象世界的特定局部相關的各種分類模式聯(lián)系在一起,這種特定局部稱之為所討論的全域或論域(universe)。為數(shù)學處理方便起見,在下面的定義中用等價關系來代替分類。7/24/202223粗糙集的根本定義定義1 一個近似空間(approximate space)(或知識庫)定義為一個關系系統(tǒng)(或二元組)K=(U, R),其中U(為空集)是一
18、個被稱為全域或論域(universe)的所有要討論的個體的集合,R是U上等價關系的一個族集。定義2 設PR,且P ,P中所有等價關系的交集稱為P上的一種不清楚關系(indiscernbility relation)或稱不可區(qū)分關系,記作IND(P)7/24/202224粗糙集的根本定義 定義3 給定近似空間K=(U, R),子集XU稱為U上的一個概念(concept),形式上,空集也視為一個概念;非空子族集PR所產(chǎn)生的不清楚關系IND(P)的所有等價類關系的集合即U/IND(P),稱為根本知識(basic knowledge),相應的等價類稱為根本概念(basic concept);特別地,假
19、設關系QR,那么關系Q就稱為初等知識(elementary knowledge),相應的等價類就稱為初等概念(elementary concept)。7/24/202225上近似、下近似和邊界區(qū)域定義5:X的下近似:R*(X)=x:(xU) (xRX ) X的上近似:R*(X)=x:(xU) (xRX )X的邊界區(qū)域:BNR(X)=R*(X)R*(X) 假設BNR(X) ,那么集合X就是一個粗糙概念。下近似包含了所有使用知識R可確切分類到X的元素,上近似那么包含了所有那些可能是屬于X的元素。概念的邊界區(qū)域由不能肯定分類到這個概念或其補集中的所有元素組成。POSR(X)=R*(X)稱為集合X的R
20、-正區(qū)域,NEGR(X)=UR*(X)稱為集合X的R-反區(qū)域。 7/24/202226Lower & Upper Approximations (2) Lower Approximation:Upper Approximation:7/24/202227新型的隸屬關系 傳統(tǒng)集合論中,一個元素的隸屬函數(shù)X(x)0,1。而粗糙集理論中,X(x)0,1 定義4 設XU且xU,集合X的粗糙隸屬函數(shù)(rough membership function) 定義為 其中R是不清楚關系,R(x)=xR=y:(yU)(yRx)=1當且僅當xRX 0當且僅當xRX =0當且僅當xRX= 7/24/202228隸屬
21、關系顯然有 0,1。我們可以看到,這里的隸屬關系是根據(jù)已有的分類知識客觀計算出來的,可以被解釋為一種條件概率,能夠從全域上的個體加以計算,而不是主觀給定的。7/24/202229集近似實例 Set ApproximationLet W = x | Walk(x) = yes. The decision class, Walk, is rough since the boundary region is not empty. Age LEMS Walkx 16-30 50 yes x2 16-30 0 no x3 31-45 1-25 nox4 31-45 1-25 yesx5 46-60 26
22、-49 nox6 16-30 26-49 yesx7 46-60 26-49 no7/24/202230集近似實例 Set Approximation (2)yesyes/nonox1,x6x3,x4x2, x5,x7AW7/24/202231UsetU/RR : subset of attributesLower & 集近似圖示ns7/24/202232Lower & Upper Approximations(3) X1 = u | Flu(u) = yes = u2, u3, u6, u7 RX1 = u2, u3 = u2, u3, u6, u7, u8, u5X2 = u | Flu(
23、u) = no = u1, u4, u5, u8 RX2 = u1, u4 = u1, u4, u5, u8, u7, u6The indiscernibility classes defined by R = Headache, Temp. are u1, u2, u3, u4, u5, u7, u6, u8.7/24/202233Lower & Upper Approximations (4)R = Headache, Temp.U/R = u1, u2, u3, u4, u5, u7, u6, u8X1 = u | Flu(u) = yes = u2,u3,u6,u7X2 = u | F
24、lu(u) = no = u1,u4,u5,u8RX1 = u2, u3 = u2, u3, u6, u7, u8, u5RX2 = u1, u4 = u1, u4, u5, u8, u7, u6u1u4u3X1X2u5u7u2u6u87/24/202234例1: 設有一知識庫K=U,p,q,r其中U=x1,x2,x3,x4,x5,x6,x7,x8且U/p=x1,x4,x5,x2,x8,x3,x6,x7U/q=x1,x3,x5,x6,x2,x4 ,x7,x8 U/r=x1,x5,x6,x2,x7,x8,x3,x4 那么x1p=x1 ,x4 ,x5x1q= x1 ,x3 ,x5 。假設P=p,q
25、,r那么IND(P)= x1,x5,x2,x8,x3,x4,x6,x7 對于U上的子集X1=x1,x4,x7可得到P* X1=x4x7=x4 ,x7P* X1=x1 ,x5x4x7=x1 ,x4 ,x5 ,x77/24/202235近似度Accuracy of Approximation where |X| denotes the cardinality of Obviously If X is crisp with respect to B. If X is rough with respect to B.7/24/202236近似性質Properties of Approximations
26、impliesand7/24/202237近似性質Properties of Approximations (2)where -X denotes U - X.7/24/202238三、 知識的約簡一般約簡 定義6 設R是等價關系的一個族集,且設RR。假設IND(R)=IND(RR),那么稱關系R在族集R之中是可省的(dispensable)否那么就是不可省的。假設族集R中的每個關系R都是不可省的那么稱族集R是獨立的(independent)否那么就是依賴的或非獨立的。 定義7 假設QP是獨立的并且IND(Q)=IND(P)那么稱Q是關系族集P的一個約簡(reduct) 。在族集P中所有不可省
27、的關系的集合稱為P的核(core) 以CORE(P)來表示。 顯然,族集P有多個約簡約簡的不唯一性。 定理1 族集P的核等于P的所有約簡的交集。即CORE(P)=RED(P) 7/24/202239例2:取前面的例1假設P=p,q,r那么IND(P)=x1 ,x5,x2 ,x8,x3,x4,x6,x7IND(P-p)=x1 ,x5,x2 ,x7 ,x8,x3,x4,x6IND(P)所以p是不可省的同理可得q、r是可省的。這樣由p,q,r三個等價關系組成的集合和p,q、p,r定義了相同的不清楚關系。又IND(p,q)IND(p) IND(pq)IND(q)那么p,q和p, r就是P的約簡而且p是
28、P的核也就是說p是絕對不能省的 7/24/202240相對約簡定義8 設P和Q是全域U上的等價關系的族集,所謂族集Q的P-正區(qū)域(P-positive region of Q),記作POSP(Q)= P*(X) 族集Q的P-正區(qū)域是全域U的所有那些使用分類U/P所表達的知識,能夠正確地分類于U/Q的等價類之中的對象的集合。定義9 設P和Q是全域U上的等價關系的族集,RP。假設POSIND(P)(IND(Q)=POSIND(P-R)(IND(Q) 那么稱關系R在族集P中是Q-可省的否那么稱為Q-不可省的如果在族集P中的每個關系R都是Q-不可省的那么稱P關于Q是獨立的否那么就稱為是依賴的。 7/2
29、4/202241相對約簡定義10 SP稱為P的Q-約簡(Q-reduct)當且僅當S是P的Q-獨立的子族集且POSS(Q)=POSP(Q);族集P中的所有Q-不可省的初等關系的集合稱為族集P的Q-核(Q-core)記作COREQ(P) 。下面的定理是定理1的拓廣。定理2 族集P的Q-核等于族集P的所有Q-約簡的交集。即COREQ(P)=REDQ(P)其中REDQ(P)是族集P的所有Q-約簡的族集。7/24/202242知識的依賴性知識的依賴性可形式定義如下:定義11 設K=(U, R)是一個近似空間,P, QR。1) 知識Q依賴于知識P或知識P可推導出知識Q,當且僅當IND(P)IND(Q)記
30、作PQ;2) 知識P和知識Q是等價的當且僅當PQ且QP即IND(P)=IND(Q)記作P= Q,明顯地,P=Q當且僅當IND(P)=IND(Q);3) 知識P和知識Q是獨立的,當且僅當PQ且QP均不成立,記作PQ。7/24/202243知識的依賴性依賴性也可以是局部成立的也就是從知識P能推導出知識Q的一局部知識,或者說知識Q只有一局部依賴于知識P的。局部依賴性局部可推導性可以由知識的正區(qū)域來定義?,F(xiàn)在我們形式地定義局部依賴性。定義12 設K=(U, R)是一個知識庫P, QR我們稱知識Q以依賴度k(0 k 1)依賴于知識P記作PkQ當且僅當k=P(Q)=card(POSP(Q)/card(U)
31、 (6.8)(1) 假設k=1那么稱知識Q完全依賴于知識P,P1Q也記成PQ;(2) 假設0k1那么稱知識Q局部依賴于知識P;(3) 假設k=0那么稱知識Q完全獨立于與知識P。7/24/202244四、 決策表的約簡決策表 決策表是一類特殊而重要的知識表達系統(tǒng),它指當滿足某些條件時,決策行為應當怎樣進行。多數(shù)決策問題都可以用決策表形式來表示,這一工具在決策應用中起著重要的作用。 決策表可以定義如下: S=(U, A)為一信息系統(tǒng),且C, DA是兩個屬性子集,分別稱為條件屬性和決策屬性,且CD=A,CD=,那么該信息系統(tǒng)稱為決策表,記作T=(U, A, C, D)或簡稱CD決策表。關系IND(C
32、)和關系IND(D)的等價類分別稱為條件類和決策類。 7/24/202245身高性別視力錄取e1高男差否e2高女一般是e3高男好是e4矮男差否e5矮女一般是e6矮男好是表1 一決策表 身高、性別、視力為條件屬性,錄取為決策屬性 7/24/202246決策規(guī)那么 決策表中的每一行對應諸如 形式的決策規(guī)那么,和分別稱為決策規(guī)那么的前驅和后繼 。當決策表S中決策規(guī)那么為真時,我們說該決策規(guī)那么是S中一致的,否那么說該決策規(guī)那么是S中不一致的。假設決策規(guī)那么是S中一致的,相同的前驅必導致相同的后繼;但同一種后繼不一定必需是同一前驅產(chǎn)生的。 如表1第一行對應決策規(guī)那么: 身高(高)性別(男)視力(差)
33、錄取(否) 7/24/202247決策表的一致性命題1當且僅當 CD,決策表T=(U, A, C, D)是一致的。由命題1,很容易通過計算條件屬性和決策屬性間的依賴程度來檢查一致性。當依賴程度等于1時,我們說決策表是一致的,否那么不一致。7/24/202248決策表的分解 命題2 每個決策表T=(U, A, C, D)都可以唯一分解為兩個決策表T1=(U1, A, C, D)和T2=(U2, A, C, D),這樣使得表T1中C1D和T2中C0D。這里U1=POSC(D),U2=BNC(X),XU|IND(D)。 由命題2可見,假設我們已計算出條件屬性的依賴度,假設表的結果不一致,即依賴度小于
34、1,那么由命題2可以將表分解成兩個子表:其中一個表完全不一致,依賴度為0;另一個表那么完全一致,依賴度為1。當然,只有依賴度大于0且不等于1時,這一分解才能進行。7/24/202249表2 不一致決策表 a、b、c為條件屬性,d、e為決策屬性 1、5產(chǎn)生不一致Ua b c d e123456781 0 2 2 00 1 1 1 22 0 0 1 11 1 0 2 21 0 2 0 12 2 0 1 12 1 1 1 20 1 1 0 17/24/202250表3 完全一致的決策表Ua b c d e34672 0 0 1 11 1 0 2 22 2 0 1 12 1 1 1 2表4 完全不一致
35、的決策表Ua b c d e12581 0 2 2 00 1 1 1 21 0 2 0 10 1 1 0 17/24/202251一致決策表的約簡在我們制定決策時是否需要全部的條件屬性,能否進行決策表的約簡。約簡后的決策表具有與約簡前的決策表相同的功能,但是約簡后的決策表具有更少的條件屬性。一致決策表的約簡步驟如下:(1) 對決策表進行條件屬性的約簡,即從決策表中消去某一列;(主要研究點)(2) 消去重復的行;(3) 消去每一決策規(guī)那么中屬性的冗余值。 7/24/202252條件屬性的約簡提出了清楚矩陣,使核與約簡等概念的計算較為簡單,主要思想:設S=(U,A)為一個知識表示系統(tǒng),其中U =x
36、1,x2,xn,xi為所討論的個體,i=1,2,n,A =a1,a2,am,aj為個體所具有的屬性,j=1,2,m。知識表達系統(tǒng)S的清楚矩陣M(S)=cijnn,其中矩陣項定義如下: cij=aA:a(xi)a(xj),i,j=1,2,n因此cij是個體xi與xj有區(qū)別的所有屬性的集合7/24/202253清楚矩陣對應的核與約簡核就可以定義為清楚矩陣中所有只有一個元素的矩陣項的集合,即 CORE(A)=aA:cij=(a),對一些i,j 相對于集合包含關系運算而言,假設屬性集合BA是滿足以下條件 Bcij,對于M(S)中的任一非空項cij的一個最小屬性子集,那么稱屬性集合BA是A的一個約簡。換
37、言之,約簡是這樣的最小屬性子集,它能夠區(qū)分用整個屬性集合A可區(qū)分的所有對象。 7/24/202254Skowron的約簡方法對于每一個清楚矩陣M(S)對應唯一的清楚函數(shù)fM(S)Discernibility Function,它的定義如下:信息系統(tǒng)S的清楚函數(shù)fM(S)是一個有m-元變量a1, am(aiA,i=1,m)的布爾函數(shù),它是cij的合取,cij是矩陣項cij中的各元素的析取,1j0, C(X, Y)=0 當card(x)=0。C(X, Y)表示把集合X歸類于集合Y的誤分類度,即有C(X, Y)100%的元素歸類錯誤。顯然,C(X, Y)=0時有XY。如此,可事先給定一錯誤分類率(0
38、0.5),基于上述定義,我們有XY,當且僅當C(X, Y)。 7/24/202264可變精度粗糙集模型在此根底上,設U為論域且R為U上的等價關系,U/R=A=X1, X2, , Xk ,這樣,可定義集合X的-下近似為RX=Xi (XiX, i=1, 2, , k)或 RX=Xi (C(Xi, X), i=1, 2, , k),并且RX稱為集合X的-正區(qū)域,集合X的-上近似為RX=Xi (C(Xi, X)1, i=1, 2, , k),這樣,-邊界區(qū)域就定義為:BNRX=Xi (C(Xi, X)1);-負區(qū)域為:NEGRX=Xi (C(Xi, X)1)。以此類推,我們還可以定義-依賴、-約簡等與
39、傳統(tǒng)粗糙集模型相對應的概念。 7/24/202265相似模型 在數(shù)據(jù)中存在缺失的屬性值的時候在數(shù)據(jù)庫中很普遍,不清楚關系或等價關系無法處理這種情形。為擴展粗糙集的能力,有許多作者提出了用相似關系來代替不清楚關系作為粗糙集的根底。 在使用相似關系代替粗糙集的不清楚關系后,最重要的變化就是相似類不再形成對集合的劃分了,它們之間是相互重疊的。類似于等價類,可以定義相似集,即所有和某各元素x在屬性集合B上相似的集合SIMb(x)。值得注意的是SIMb(x)中的元素不一定屬于同一決策類, 因此還需要定義相似決策類,即相似集對應的決策類集合。 7/24/202266基于粗糙集的非單調邏輯 自粗糙集理論提出
40、以來,粗糙集理論的研究者都很重視它的邏輯研究,試圖通過粗糙集建立粗糙邏輯,也相應地發(fā)表了一系列的粗糙邏輯方面的論文 。7/24/202267與其它數(shù)學工具的結合 和由此提出了Rough Fuzzy Set和Fuzzy Rough Set的概念 和-Buss認為,粗糙集理論可以看作證據(jù)理論的根底。并在粗糙集理論的框架上重新解釋了證據(jù)理論的根本概念,特別是用上近似和下近似的術語解釋了信念(belief)和似然(plausibility)函數(shù),進而討論了兩者之間的互補問題。 7/24/202268六、粗糙集的實驗系統(tǒng)在過去幾年中,建立了不少基于粗糙集的KDD系統(tǒng),其中最有代表性的有LERS、ROSE
41、、KDD-R等。1LERSLERS(Learning from examples based on Rough Set)系統(tǒng)是美國Kansas大學開發(fā)的基于粗糙集的實例學習系統(tǒng)。它是用Common Lisp在VAX9000上實現(xiàn)的。LERS已經(jīng)為NASA的Johnson空間中心應用了兩年。此外,LERS還被廣泛地用于環(huán)境保護、氣候研究和醫(yī)療研究 7/24/202269六、粗糙集的實驗系統(tǒng)2ROSE波蘭Poznan科技大學基于粗糙集開發(fā)了ROSE(Rough Set data Explorer), 用于決策分析。 它是Rough Das & Rough Class系統(tǒng)的新版,其中RoughDas
42、執(zhí)行信息系統(tǒng)數(shù)據(jù)分析任務,RoughClass支持新對象的分類,這兩個系統(tǒng)已經(jīng)在許多實際領域中得到應用。 3KDDRKDD-R是由加拿大的Regina大學開發(fā)的基于可變精度粗糙集模型,采用知識發(fā)現(xiàn)的決策矩陣方法開發(fā)了KDD-R系統(tǒng),這個系統(tǒng)被用來對醫(yī)學數(shù)據(jù)分析,以此產(chǎn)生病癥與病證之間新的聯(lián)系,另外它還支持電信工業(yè)的市場研究。 7/24/202270七、粒度計算粒度計算從廣義上來說是一種看待客觀世界的世界觀和方法論。 粒度計算的根本思想就是使用粒而不是對象為計算單元,使用粒、粒集以及粒間關系進行計算或問題求解。7/24/202271粒度計算1997年Lotfi A. Zadeh 提出了粒度的概念
43、,他認為在人類認知中存在三種概念:粒度,組織與因果關系。從直觀的來講,?;婕暗綇恼w到局部的分解,而組織卻是從局部到整體的集成,而因果關系涉及原因與結果之間的聯(lián)系。對一個事物的粒化就是以可分辨性、相似性、鄰近性與功能性集聚有關的事物。粒度計算是信息處理的一種新的概念和計算范式,覆蓋了所有有關粒度的理論、方法、技術和工具的研究,主要用于處理不確定的、模糊的、不完整的和海量的信息。粗略地講,一方面它是模糊信息粒度理論、粗糙集理論、商空間理論、區(qū)間計算等的超集,另一方面是粒度數(shù)學的子集。具體地講,但凡在分析問題和求解問題中,應用了分組、分類、聚類以及層次化手段的一切理論與方法均屬于粒度計算的范疇。
44、信息粒度在粒度計算,詞計算,感知計算理論和精化自然語言中都有反映 7/24/202272粒度計算的必要性從哲學的角度看 Yager和Filev指出“人類已經(jīng)形成了世界就是一個粒度的觀點以及 “人們觀察、度量、定義和推理的實體都是粒度 。信息粒是一種抽象,它如同數(shù)學中的“點、“線、“面一樣,在人類的思維和活動中占有重要地位。從人工智能的角度看 張鈸院士指出“人類智能的公認特點,就是人們能從極不相同的粒度上觀察和分析同一問題。人們不僅能在不同粒度的世界上進行問題求解,而且能夠很快地從一個粒度世界跳到另一個粒度的世界,往返自如,毫無困難。這種處理不同世界的能力,正是人類問題求解的強有力的表現(xiàn) 。7/
45、24/202273粒度計算的必要性從優(yōu)化論的角度來看 粒度計算的理論與方法在觀念上突破了傳統(tǒng)優(yōu)化思想的束縛,不再以數(shù)學上的精確解為目標,即:需要的是很好地理解和刻畫一個問題,而不是沉溺于那些用處不大的細節(jié)信息上。粒度計算的方法不要求目標函數(shù)和約束函數(shù)的連續(xù)性與凸性,甚至有時連解析表達式都不要求,而且對計算中數(shù)據(jù)的不確定性也有很強地適應能力,計算速度也快,這些優(yōu)點使粒度計算具有更廣泛地應用前景,所以,粒度計算理論的研究對推動優(yōu)化領域的開展極其重要。 7/24/202274粒度計算的必要性從問題求解的角度看 用粒度計算的觀點來分析解決問題顯得尤為重要,這樣就不用局限于具體對象的細節(jié)。除此之外,將復雜問題劃分為一系列更容易管理和更小的子任務,可以降低全局計算代價。 從應用技術的角度看 圖像處理、語音與字符識別等,是計算機多媒體的核心技術。這些信息處理質量的好壞直接依賴于分割的方法和技術,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 河塘清淤分層施工方案
- 鏡面水景管線施工方案
- 彩繪鋁塑板幕墻施工方案
- 安全標準化發(fā)布案例
- 課題開題報告:基礎學科建設與基礎學科人才培養(yǎng)模式研究
- 課題開題報告:湖北省留守兒童關愛工作體制機制研究
- 課題開題報告:紅色故事培育大學生正確黨史觀“四個協(xié)同”模式的創(chuàng)新與實踐
- 肝癌手術病人的護理
- 肺結核并氣胸病人的護理
- 五金零售企業(yè)ESG實踐與創(chuàng)新戰(zhàn)略研究報告
- 《住院患者身體約束的護理》團體標準解讀課件
- DZ∕T 0213-2020 礦產(chǎn)地質勘查規(guī)范 石灰?guī)r、水泥配料類(正式版)
- 2024年黑龍江建筑職業(yè)技術學院單招職業(yè)適應性測試題庫全面
- MOOC 跨文化交際通識通論-揚州大學 中國大學慕課答案
- GB/T 28799.2-2020冷熱水用耐熱聚乙烯(PE-RT)管道系統(tǒng)第2部分:管材
- 2023-瑞幸咖啡vi手冊
- 10000中國普通人名大全
- 項目章程模板范文
- 耳尖放血療法治療高血壓病技術
- 泰山產(chǎn)業(yè)領軍人才工程系統(tǒng)
- 輪扣架支模體系材料量計算
評論
0/150
提交評論