基于XML及其數(shù)據(jù)過濾的高速信息查詢系統(tǒng)的設(shè)計_第1頁
基于XML及其數(shù)據(jù)過濾的高速信息查詢系統(tǒng)的設(shè)計_第2頁
基于XML及其數(shù)據(jù)過濾的高速信息查詢系統(tǒng)的設(shè)計_第3頁
基于XML及其數(shù)據(jù)過濾的高速信息查詢系統(tǒng)的設(shè)計_第4頁
基于XML及其數(shù)據(jù)過濾的高速信息查詢系統(tǒng)的設(shè)計_第5頁
已閱讀5頁,還剩1頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、基于XML及其數(shù)據(jù)過濾的高速信息查詢系統(tǒng)的設(shè)計摘要隨著信息時代的到來,人們查詢需要的信息變得越來越繁瑣。本文那么是從當(dāng)前信息查詢系統(tǒng)的一些缺點入手,提出了一種通過XL及其數(shù)據(jù)過濾相結(jié)合的方法來構(gòu)造一種高速信息查詢系統(tǒng),并且給出了相關(guān)的實現(xiàn)技術(shù)和關(guān)鍵局部XL數(shù)據(jù)過濾的實現(xiàn)方法。關(guān)鍵詞XL;數(shù)據(jù)過濾;信息查詢;XQuery隨著網(wǎng)絡(luò)的迅速開展和信息的爆炸式增長,人們需要在繁多的數(shù)據(jù)中尋找所需的信息變得越來越困難,因此,信息查詢系統(tǒng)的研究與開展成為一個熱點問題。然而,當(dāng)前的信息查詢系統(tǒng)存在一些普遍的缺陷與弱點:信息查詢存在盲目性和偶爾性,缺乏明確的目的,查詢效率低、查詢速度慢、不能找到有效數(shù)據(jù);并且在

2、當(dāng)前研究的一些高效的信息查詢系統(tǒng)多是基于查詢語言的優(yōu)化或查詢策略的改變。本文那么從具有可伸縮性的路由機(jī)制入手介紹了一種基于XL及其數(shù)據(jù)過濾的高速信息查詢系統(tǒng)設(shè)計方案。本系統(tǒng)采用三層構(gòu)造:即界面層、中間層和數(shù)據(jù)層。其構(gòu)造如圖1所示:圖1(1)界面層即信息查詢的目的信息輸入層和查詢結(jié)果的輸出層。它可以采用網(wǎng)絡(luò)閱讀器作為用戶的交互界面。(2)中間層將輸入的查詢目的轉(zhuǎn)化為XL文檔中將查詢要求轉(zhuǎn)化為XQuery表達(dá)式為了更好的發(fā)揮XL的特性,我們采用XQuery作為信息查詢語言,然后通過XL數(shù)據(jù)過濾從將多種異構(gòu)數(shù)據(jù)庫集成的XL文檔中將眾多的查詢信息通過不同的數(shù)據(jù)過濾策略查找出我們要查詢的信息,并將查詢結(jié)

3、果通過XL文檔返回給界面層。(3)數(shù)據(jù)層由于當(dāng)前數(shù)據(jù)庫的類型、品牌和運行平臺各不一樣,我們需要將各種不同的數(shù)據(jù)進(jìn)展整合來形成一種異構(gòu)數(shù)據(jù)庫集成的XL文檔來供XL數(shù)據(jù)過濾從中查詢信息。(1)XL隨著EB效勞的廣泛應(yīng)用,為了更好的描繪信息數(shù)據(jù),XL的重要性也越來越突出,XL憑借其平臺無關(guān)性以及同各種數(shù)據(jù)庫數(shù)據(jù)格式的簡便轉(zhuǎn)化等優(yōu)越性讓其成為了當(dāng)前網(wǎng)絡(luò)信息傳輸?shù)闹匾d體。(2)XQuery語言XL查詢技術(shù)的開展也伴隨著XL技術(shù)的廣泛應(yīng)用而開展。各種XL查詢語言相繼問世,例如早期的XL-QL、XQL、UnQL,后來的Quilt、Xpath以及XQuery。XQuery語言是當(dāng)前普遍應(yīng)用的一種基于XL的數(shù)

4、據(jù)查詢和查詢的語言。XQuery是在Quilt根底上開展起來的語言。在3的竭力推動和各界的大力支持下,XQuery逐漸在這些語言中脫穎而出成為事實上的工業(yè)標(biāo)準(zhǔn)。XQuery語言的根本構(gòu)造是表達(dá)式,它由關(guān)鍵詞、符號、操作數(shù)構(gòu)成。XQuery表達(dá)式的形式包括:途徑表達(dá)式、元素構(gòu)造符、FLE表達(dá)式、算子和函數(shù)表達(dá)式、條件表達(dá)式、限定表達(dá)式、列表表達(dá)式、數(shù)據(jù)類型表達(dá)式。(3)數(shù)據(jù)層中基于XL的異構(gòu)數(shù)據(jù)庫信息集成由于XL文檔和數(shù)據(jù)庫數(shù)據(jù)在構(gòu)造上存在很多差異。XL文檔是嵌套的多層次構(gòu)造、數(shù)據(jù)長度和類型都不規(guī)那么,數(shù)據(jù)間的關(guān)系通過父元素與子元素的嵌套形式實現(xiàn);關(guān)系型數(shù)據(jù)庫中的數(shù)據(jù)是以二維表的形式存在,數(shù)據(jù)間

5、的關(guān)系通過主外鍵的方式表達(dá)。因此在數(shù)據(jù)轉(zhuǎn)化過程中可以采用XL與數(shù)據(jù)庫形式的映射機(jī)制。XL信息存入關(guān)系數(shù)據(jù)庫需要利用XLShea與關(guān)系模型的對應(yīng)關(guān)系,將XL文檔轉(zhuǎn)化為關(guān)系數(shù)據(jù)庫。它包括兩種方法:一種是將XL文件作為數(shù)據(jù)庫的表的一個字段列入一段中作為一個LB對象存入。另一種方法是將XL文件拆分,將其屬性、元素等分別作為字段存儲到數(shù)據(jù)庫中,并保持原來數(shù)據(jù)之間的關(guān)系。第一種方式雖然保存了XL的構(gòu)造,但是它將XL作為一個字段直接存入數(shù)據(jù)庫的表中,但在查詢過程中由于沒有使用關(guān)系數(shù)據(jù)庫的優(yōu)勢,因此查詢效率很低。第二種方法將XL文檔進(jìn)展拆分,再作為表格的字段存入表中,這種方式很好的保存了原有關(guān)系數(shù)據(jù)庫字段之間

6、的關(guān)系,可以利用關(guān)系數(shù)據(jù)庫的查詢工具有效的進(jìn)步查詢效率。本文采用的就是第二種轉(zhuǎn)化方式,下面給出了一段代碼采用此方式的映射構(gòu)造圖:?xlversin=1.0?ATALGDTITLEEpire/TITLEARTISTBb/ARTISTPRIE10.90/PRIEYEAR1985/YEAR/DDTITLEHide/TITLEARTISTTylr/ARTISTPRIE9.90/PRIEYEAR1988/YEAR/DDTITLEHits/TITLEARTISTDlly/ARTISTPRIE9.70/PRIEYEAR1982/YEAR/D/ATALG映射后形成的表如下:TITLEARTISTPRIEYEA

7、REpireBb10.901985HideTylr9.901988HitsDlly9.701982從上述映射構(gòu)造表我們也可以看出采用XL文件拆分法的轉(zhuǎn)化方式非常有利于應(yīng)用關(guān)系數(shù)據(jù)庫中的SQL語句進(jìn)展查詢。對于不同的XL數(shù)據(jù)需要定義不同的過濾策略和方法,并且要充分利用查詢語言和查詢途徑的特點來充分的過濾XL數(shù)據(jù)來進(jìn)步查詢效率。對于查詢語言XQuery來說,選擇正確的優(yōu)化方法改寫XQuery表達(dá)式可有效的進(jìn)步查詢效率;為了更好的進(jìn)步查詢效率可以通過網(wǎng)絡(luò)路由管理XQuery表達(dá)式的優(yōu)化,并且通過設(shè)計良好的網(wǎng)絡(luò)路由策略實現(xiàn)并行優(yōu)化機(jī)制,不但進(jìn)步了查詢性能也進(jìn)步了查詢速度。詳細(xì)的XL數(shù)據(jù)過濾的模型構(gòu)造如

8、圖2所示:圖2XL數(shù)據(jù)過濾基于XL數(shù)據(jù)過濾的工作步驟如下:1將界面層用戶輸入的查詢目的信息即查詢懇求用XL查詢語言XQuery表達(dá)式表示出來。2通過XL查詢解釋器將XQuery表達(dá)式進(jìn)展合理的轉(zhuǎn)化與分析,并且選擇恰當(dāng)?shù)穆酚蓴?shù)據(jù)過濾策略對轉(zhuǎn)化為XL文檔的數(shù)據(jù)庫信息通過SQL語句查詢。在此過程中基于XL路由的數(shù)據(jù)過濾策略通過網(wǎng)絡(luò)傳輸中的路由器的搭配的不同而產(chǎn)生了兩種數(shù)據(jù)過濾策略。一種策略是數(shù)據(jù)共享策略:每個XL路由器都完全管理XQuery表達(dá)式,負(fù)載平衡器根據(jù)負(fù)載平衡策略把XL文檔分配給唯一的XL路由器,XL路由器根據(jù)其相應(yīng)的索引構(gòu)造使用匹配算法找到相應(yīng)的XQuery表達(dá)式。其構(gòu)造如圖3所示。圖3

9、數(shù)據(jù)共享策略另一種策略是過濾共享策略:每個路由器都平等的共享XQuery表達(dá)式,并且管理一套各不一樣的XQuery表達(dá)式,所有路由器都參與XL文檔的過濾。其構(gòu)造如圖4:圖4過濾共享策略這兩種策略都是采用了并行機(jī)制,由多個多層索引構(gòu)造組織的XL路由器過濾時間和空間消耗。第一種策略能增大并行處理文件的個數(shù)。第二種策略能最小化過濾延時時間。3將SQL查詢的結(jié)果轉(zhuǎn)化成XL文檔。4將XL文檔中的查詢結(jié)果通過界面層呈現(xiàn)給用戶。本文從當(dāng)前信息查詢系統(tǒng)的一些缺點入手,提出了一種新穎的基于XL并且通過路由搭配實現(xiàn)并行優(yōu)化進(jìn)展數(shù)據(jù)過濾的方法來構(gòu)造一種高速信息查詢系統(tǒng),并且給出了相關(guān)的實現(xiàn)技術(shù)和關(guān)鍵局部XL數(shù)據(jù)過濾的實現(xiàn)方法。當(dāng)然該系統(tǒng)的設(shè)計也存在缺乏,例如數(shù)據(jù)過濾策略以及查詢過程中SQL語句優(yōu)化方法的靈敏選擇設(shè)定方面還存在缺陷,因此,在將來的工作中,將對這些方面進(jìn)展更深化的研究。1甄玉剛,劉璐瑩,康建初.基于XL的異構(gòu)數(shù)據(jù)庫集成系統(tǒng)構(gòu)架與開發(fā).計算機(jī)工程.2022.12蔣桂梅,宋陽秋.XL查詢語言XQuery及其查詢優(yōu)化.福建電腦.2022.83王士賢

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論