


下載本文檔
版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、基于關系數(shù)據(jù)庫的模式匹配技術研究< 摘 要隨著 網(wǎng)絡 技術的 發(fā)展 ,信息處理需要對大量的、異構的數(shù)據(jù)源的數(shù)據(jù)進行統(tǒng)一存取,多源異構數(shù)據(jù)的集成問題就顯得十分重要。而模式匹配是數(shù)據(jù)集成領域的一個基本技術。文章提出一種解決關系數(shù)據(jù)庫語義沖突問題的模式匹配技術,以實現(xiàn)異構數(shù)據(jù)的共享與互操作。 關鍵詞 數(shù)據(jù)集成;模式匹配;語義沖突 1 引言 隨著 計算 機及網(wǎng)絡技術的快速發(fā)展,網(wǎng)絡上的各種信息以指數(shù)級爆炸性增長,成為了一個巨大的信息
2、庫,同時各 企業(yè) 單位開發(fā)了大量的軟硬件平臺各異的應用系統(tǒng),在各種應用系統(tǒng)下又積累了豐富的數(shù)據(jù)資源。這樣就形成了成千上萬個異構的數(shù)據(jù)源,多為傳統(tǒng)的關系數(shù)據(jù)庫數(shù)據(jù)。這些數(shù)據(jù)資源由于軟硬件平臺各異、數(shù)據(jù)模型各異而形成了異構數(shù)據(jù),使各數(shù)據(jù)源間的互操作變得復雜。為了更好地利用這些異構信息,以及不造成 企業(yè) 應用系統(tǒng)的重復建設和數(shù)據(jù)資源的浪費,模式匹配技術吸引了眾多關注。本文針對模式匹配過程中存在的語義沖突進行分類,并提出了相應的解決策略,以達到異構數(shù)據(jù)源的共享和互操作。2 模式匹配中的沖突問題 在數(shù)據(jù)集成領域中,由于數(shù)據(jù)源系統(tǒng)多是獨立開發(fā),數(shù)據(jù)源是相對自
3、治的,因此描述數(shù)據(jù)的數(shù)據(jù)模型或存儲結構經(jīng)常會出現(xiàn)模式的不一致,數(shù)據(jù)源的自治性和數(shù)據(jù)源模式的異構性使數(shù)據(jù)源在共享和互操作上存在了語義沖突。這些正是模式匹配的焦點問題,它們形式上的性質使得人們很容易想到要用模式匹配去解決邏輯、語義和知識的描述問題。 對于描述模式匹配中的語義沖突有兩種較有代表性的分類4。第一種分類將沖突分為異類沖突、命名沖突、語義沖突和結構沖突。第二種分類主要是對第一類異類沖突概念的一個細致的改進,但和其它分類仍有細微的不同,它把異類沖突看作是語義不一致的一類(如語義沖突),把沖突分為命名沖突、域沖突、元數(shù)據(jù)沖突、結構沖突、屬性丟失和硬件/軟件不
4、同。 模式匹配是一項復雜而繁重的任務,所能集成的數(shù)據(jù)源越來越多,上述沖突情況也會越來越普遍,想解決所有的模式?jīng)_突是不現(xiàn)實的。本文主要解決關系數(shù)據(jù)模式之間的語義沖突。3 模式匹配中的語義沖突 本文所提出的模式匹配方法是根據(jù)關系數(shù)據(jù)庫的特點設計的。關系數(shù)據(jù)庫中關系的基本單位是屬性,屬性本身就包含著語義信息,因此異構數(shù)據(jù)源語義相似性就圍繞著數(shù)據(jù)源模式中的屬性來進行,并在匹配的過程中解決異構數(shù)據(jù)源模式之間的一系列語義沖突。3.1 語義匹配體系結構 本文提出的語義匹配體系結
5、構采用數(shù)據(jù)集成中的虛擬法數(shù)據(jù)集成系統(tǒng)的典型體系結構,采用將局部模式匹配到全局模式的語義匹配體系結構,自下而上地建立全局模式。首先進行模式轉化,消除因各種局部數(shù)據(jù)模式之間的差異所帶來的影響,解決各種局部模式之間的語義沖突等,然后在轉化后的模式的基礎上進行模式匹配,其主要手段是提供各數(shù)據(jù)源的虛擬的集成視圖。 數(shù)據(jù)仍保存在各數(shù)據(jù)源上,集成系統(tǒng)僅提供一個虛擬的集成視圖和對該集成視圖的查詢的處理機制。系統(tǒng)能自動地將用戶對集成模式的查詢請求轉換成對各異構數(shù)據(jù)源的查詢。在這種體系結構中,中間層根本不實際存儲數(shù)據(jù),當客戶端發(fā)出查詢請求時,僅是簡單地將查詢發(fā)送到適當?shù)臄?shù)據(jù)源上
6、。由于該方法不需要重復存儲大量數(shù)據(jù),并能保證查詢到最新的數(shù)據(jù),因此比較適合于高度自治、集成數(shù)量多且更新變化快的異構數(shù)據(jù)源集成。 本文中的語義匹配的體系結構如圖1所示。3.2 關系數(shù)據(jù)庫模式中語義沖突問題分類及其解決策略 大多數(shù)數(shù)據(jù)庫系統(tǒng)提供了一套概念結構來對現(xiàn)實世界的數(shù)據(jù)進行建模。每一個概念結構被認為是一個類型,它可以是一種復雜類型或一種基本類型。類型和它所表示的數(shù)據(jù)間的聯(lián)系就稱為語義3。 在關系數(shù)據(jù)庫中,一個關系模式是一個有序對(R,c),其中R為模式所指向的關系(表)的名
7、稱,而c則為具有不同名稱的屬性的有限集。同時,屬性也是一個有序對(N,D),其中N為屬性的名稱,而D則為一個域。可以看出關系模式的基本單位是屬性。屬性本身就包含著語義信息,因此模式語義相似性就圍繞模式中的屬性來進行,并在模式匹配的過程中解決異構數(shù)據(jù)庫模式之間的一系列語義沖突。圖 1 語義匹配體系結構 根據(jù)語義的定義,在關系數(shù)據(jù)庫系統(tǒng)中,語義系統(tǒng)是由模式、模式的屬性、模式中屬性之間的聯(lián)系和模式間的屬性之間的聯(lián)系構成。這里將語義分為3級:模式級、屬性級和實例級。下面將異構模式中存在的語義沖突問題進行了分類,并闡述了各種語義沖突的解決策略: 1 2 下一頁 【內(nèi)容導航】 第1頁:基于關系數(shù)據(jù)庫的模式匹配
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 派送花束活動方案
- 醫(yī)院質量管理目標體系構建與實施路徑
- 2025屆邢臺市柏鄉(xiāng)縣三上數(shù)學期末考試模擬試題含解析
- 行政管理經(jīng)濟法概論試題及答案集錦
- 2025年中級經(jīng)濟師復習重點試題及答案
- 掌握公共關系學的思維方式試題及答案
- 2025年市政工程項目實踐試題及答案
- 防范惡劣天氣安全教育
- 林業(yè)有害生物防治協(xié)議
- 心理學社會現(xiàn)象分析試題集
- 【課件】第13課宗教的象征-歐洲中世紀美術課件-高中美術人教版(2019)美術鑒賞
- 田家炳先生課件
- 紅金大氣商務風領導歡迎會PPT通用模板
- 最新高考前20天勵志主題班會課件
- 《現(xiàn)代管理學》全套課件
- 地下水環(huán)境影響評價工作分級與技術要求
- DB64-T 1686-2020 風電場專業(yè)氣象服務規(guī)程-(高清可復制)
- 動物生物技術(課件)
- 個人有關事項報告表(全)
- 南昌航空大學?;招?/a>
- 廣東省中山市2021-2022學年八年級下學期期末水平測試道德與法治試卷
評論
0/150
提交評論