版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、基于XML及其數(shù)據(jù)過濾的高速信息查詢系統(tǒng)的設(shè)計摘要隨著信息時代的到來,人們查詢需要的信息變得越來越繁瑣。本文那么是從當(dāng)前信息查詢系統(tǒng)的一些缺點入手,提出了一種通過XL及其數(shù)據(jù)過濾相結(jié)合的方法來構(gòu)造一種高速信息查詢系統(tǒng),并且給出了相關(guān)的實現(xiàn)技術(shù)和關(guān)鍵局部XL數(shù)據(jù)過濾的實現(xiàn)方法。關(guān)鍵詞XL;數(shù)據(jù)過濾;信息查詢;XQuery隨著網(wǎng)絡(luò)的迅速開展和信息的爆炸式增長,人們需要在繁多的數(shù)據(jù)中尋找所需的信息變得越來越困難,因此,信息查詢系統(tǒng)的研究與開展成為一個熱點問題。然而,當(dāng)前的信息查詢系統(tǒng)存在一些普遍的缺陷與弱點:信息查詢存在盲目性和偶爾性,缺乏明確的目的,查詢效率低、查詢速度慢、不能找到有效數(shù)據(jù);并且在
2、當(dāng)前研究的一些高效的信息查詢系統(tǒng)多是基于查詢語言的優(yōu)化或查詢策略的改變。本文那么從具有可伸縮性的路由機(jī)制入手介紹了一種基于XL及其數(shù)據(jù)過濾的高速信息查詢系統(tǒng)設(shè)計方案。本系統(tǒng)采用三層構(gòu)造:即界面層、中間層和數(shù)據(jù)層。其構(gòu)造如圖1所示:圖1(1)界面層即信息查詢的目的信息輸入層和查詢結(jié)果的輸出層。它可以采用網(wǎng)絡(luò)閱讀器作為用戶的交互界面。(2)中間層將輸入的查詢目的轉(zhuǎn)化為XL文檔中將查詢要求轉(zhuǎn)化為XQuery表達(dá)式為了更好的發(fā)揮XL的特性,我們采用XQuery作為信息查詢語言,然后通過XL數(shù)據(jù)過濾從將多種異構(gòu)數(shù)據(jù)庫集成的XL文檔中將眾多的查詢信息通過不同的數(shù)據(jù)過濾策略查找出我們要查詢的信息,并將查詢結(jié)
3、果通過XL文檔返回給界面層。(3)數(shù)據(jù)層由于當(dāng)前數(shù)據(jù)庫的類型、品牌和運行平臺各不一樣,我們需要將各種不同的數(shù)據(jù)進(jìn)展整合來形成一種異構(gòu)數(shù)據(jù)庫集成的XL文檔來供XL數(shù)據(jù)過濾從中查詢信息。(1)XL隨著EB效勞的廣泛應(yīng)用,為了更好的描繪信息數(shù)據(jù),XL的重要性也越來越突出,XL憑借其平臺無關(guān)性以及同各種數(shù)據(jù)庫數(shù)據(jù)格式的簡便轉(zhuǎn)化等優(yōu)越性讓其成為了當(dāng)前網(wǎng)絡(luò)信息傳輸?shù)闹匾d體。(2)XQuery語言XL查詢技術(shù)的開展也伴隨著XL技術(shù)的廣泛應(yīng)用而開展。各種XL查詢語言相繼問世,例如早期的XL-QL、XQL、UnQL,后來的Quilt、Xpath以及XQuery。XQuery語言是當(dāng)前普遍應(yīng)用的一種基于XL的數(shù)
4、據(jù)查詢和查詢的語言。XQuery是在Quilt根底上開展起來的語言。在3的竭力推動和各界的大力支持下,XQuery逐漸在這些語言中脫穎而出成為事實上的工業(yè)標(biāo)準(zhǔn)。XQuery語言的根本構(gòu)造是表達(dá)式,它由關(guān)鍵詞、符號、操作數(shù)構(gòu)成。XQuery表達(dá)式的形式包括:途徑表達(dá)式、元素構(gòu)造符、FLE表達(dá)式、算子和函數(shù)表達(dá)式、條件表達(dá)式、限定表達(dá)式、列表表達(dá)式、數(shù)據(jù)類型表達(dá)式。(3)數(shù)據(jù)層中基于XL的異構(gòu)數(shù)據(jù)庫信息集成由于XL文檔和數(shù)據(jù)庫數(shù)據(jù)在構(gòu)造上存在很多差異。XL文檔是嵌套的多層次構(gòu)造、數(shù)據(jù)長度和類型都不規(guī)那么,數(shù)據(jù)間的關(guān)系通過父元素與子元素的嵌套形式實現(xiàn);關(guān)系型數(shù)據(jù)庫中的數(shù)據(jù)是以二維表的形式存在,數(shù)據(jù)間
5、的關(guān)系通過主外鍵的方式表達(dá)。因此在數(shù)據(jù)轉(zhuǎn)化過程中可以采用XL與數(shù)據(jù)庫形式的映射機(jī)制。XL信息存入關(guān)系數(shù)據(jù)庫需要利用XLShea與關(guān)系模型的對應(yīng)關(guān)系,將XL文檔轉(zhuǎn)化為關(guān)系數(shù)據(jù)庫。它包括兩種方法:一種是將XL文件作為數(shù)據(jù)庫的表的一個字段列入一段中作為一個LB對象存入。另一種方法是將XL文件拆分,將其屬性、元素等分別作為字段存儲到數(shù)據(jù)庫中,并保持原來數(shù)據(jù)之間的關(guān)系。第一種方式雖然保存了XL的構(gòu)造,但是它將XL作為一個字段直接存入數(shù)據(jù)庫的表中,但在查詢過程中由于沒有使用關(guān)系數(shù)據(jù)庫的優(yōu)勢,因此查詢效率很低。第二種方法將XL文檔進(jìn)展拆分,再作為表格的字段存入表中,這種方式很好的保存了原有關(guān)系數(shù)據(jù)庫字段之間
6、的關(guān)系,可以利用關(guān)系數(shù)據(jù)庫的查詢工具有效的進(jìn)步查詢效率。本文采用的就是第二種轉(zhuǎn)化方式,下面給出了一段代碼采用此方式的映射構(gòu)造圖:?xlversin=1.0?ATALGDTITLEEpire/TITLEARTISTBb/ARTISTPRIE10.90/PRIEYEAR1985/YEAR/DDTITLEHide/TITLEARTISTTylr/ARTISTPRIE9.90/PRIEYEAR1988/YEAR/DDTITLEHits/TITLEARTISTDlly/ARTISTPRIE9.70/PRIEYEAR1982/YEAR/D/ATALG映射后形成的表如下:TITLEARTISTPRIEYEA
7、REpireBb10.901985HideTylr9.901988HitsDlly9.701982從上述映射構(gòu)造表我們也可以看出采用XL文件拆分法的轉(zhuǎn)化方式非常有利于應(yīng)用關(guān)系數(shù)據(jù)庫中的SQL語句進(jìn)展查詢。對于不同的XL數(shù)據(jù)需要定義不同的過濾策略和方法,并且要充分利用查詢語言和查詢途徑的特點來充分的過濾XL數(shù)據(jù)來進(jìn)步查詢效率。對于查詢語言XQuery來說,選擇正確的優(yōu)化方法改寫XQuery表達(dá)式可有效的進(jìn)步查詢效率;為了更好的進(jìn)步查詢效率可以通過網(wǎng)絡(luò)路由管理XQuery表達(dá)式的優(yōu)化,并且通過設(shè)計良好的網(wǎng)絡(luò)路由策略實現(xiàn)并行優(yōu)化機(jī)制,不但進(jìn)步了查詢性能也進(jìn)步了查詢速度。詳細(xì)的XL數(shù)據(jù)過濾的模型構(gòu)造如
8、圖2所示:圖2XL數(shù)據(jù)過濾基于XL數(shù)據(jù)過濾的工作步驟如下:1將界面層用戶輸入的查詢目的信息即查詢懇求用XL查詢語言XQuery表達(dá)式表示出來。2通過XL查詢解釋器將XQuery表達(dá)式進(jìn)展合理的轉(zhuǎn)化與分析,并且選擇恰當(dāng)?shù)穆酚蓴?shù)據(jù)過濾策略對轉(zhuǎn)化為XL文檔的數(shù)據(jù)庫信息通過SQL語句查詢。在此過程中基于XL路由的數(shù)據(jù)過濾策略通過網(wǎng)絡(luò)傳輸中的路由器的搭配的不同而產(chǎn)生了兩種數(shù)據(jù)過濾策略。一種策略是數(shù)據(jù)共享策略:每個XL路由器都完全管理XQuery表達(dá)式,負(fù)載平衡器根據(jù)負(fù)載平衡策略把XL文檔分配給唯一的XL路由器,XL路由器根據(jù)其相應(yīng)的索引構(gòu)造使用匹配算法找到相應(yīng)的XQuery表達(dá)式。其構(gòu)造如圖3所示。圖3
9、數(shù)據(jù)共享策略另一種策略是過濾共享策略:每個路由器都平等的共享XQuery表達(dá)式,并且管理一套各不一樣的XQuery表達(dá)式,所有路由器都參與XL文檔的過濾。其構(gòu)造如圖4:圖4過濾共享策略這兩種策略都是采用了并行機(jī)制,由多個多層索引構(gòu)造組織的XL路由器過濾時間和空間消耗。第一種策略能增大并行處理文件的個數(shù)。第二種策略能最小化過濾延時時間。3將SQL查詢的結(jié)果轉(zhuǎn)化成XL文檔。4將XL文檔中的查詢結(jié)果通過界面層呈現(xiàn)給用戶。本文從當(dāng)前信息查詢系統(tǒng)的一些缺點入手,提出了一種新穎的基于XL并且通過路由搭配實現(xiàn)并行優(yōu)化進(jìn)展數(shù)據(jù)過濾的方法來構(gòu)造一種高速信息查詢系統(tǒng),并且給出了相關(guān)的實現(xiàn)技術(shù)和關(guān)鍵局部XL數(shù)據(jù)過濾的實現(xiàn)方法。當(dāng)然該系統(tǒng)的設(shè)計也存在缺乏,例如數(shù)據(jù)過濾策略以及查詢過程中SQL語句優(yōu)化方法的靈敏選擇設(shè)定方面還存在缺陷,因此,在將來的工作中,將對這些方面進(jìn)展更深化的研究。1甄玉剛,劉璐瑩,康建初.基于XL的異構(gòu)數(shù)據(jù)庫集成系統(tǒng)構(gòu)架與開發(fā).計算機(jī)工程.2022.12蔣桂梅,宋陽秋.XL查詢語言XQuery及其查詢優(yōu)化.福建電腦.2022.83王士賢
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 育林合同范本
- 個人門面出租協(xié)議合同范本
- 企業(yè)會員服務(wù)合同范本
- 2024-2030年中國改裝救護(hù)車市場投資潛力及未來發(fā)展戰(zhàn)略研究研究報告
- 2024-2030年中國搖臂點焊機(jī)行業(yè)市場發(fā)展趨勢與前景展望戰(zhàn)略分析報告
- 2024-2030年中國振動測試系統(tǒng)行業(yè)市場發(fā)展趨勢與前景展望戰(zhàn)略分析報告
- 2024-2030年中國擬薄水鋁石行業(yè)現(xiàn)狀動態(tài)及需求趨勢預(yù)測報告
- 2024-2030年中國護(hù)眼燈市場銷售模式與可持續(xù)發(fā)展戰(zhàn)略分析報告
- 2024-2030年中國抗阻滯劑行業(yè)市場發(fā)展趨勢與前景展望戰(zhàn)略研究報告
- 2024-2030年中國抗磨劑行業(yè)競爭剖析及營銷推廣策略研究研究報告
- (完整word版)英語四級單詞大全
- CISG-聯(lián)合國國際貨物銷售合同公約(中英文對照)
- 托馬斯—基爾曼沖突方式
- 新一代大學(xué)英語(提高篇)視聽說教程1答案(第一單元)(1)1頁
- 付款通知書模板
- 開、停車前安全條件確認(rèn)檢查表(共1頁)
- 廢水在線監(jiān)測設(shè)備比對監(jiān)測PPT
- 變形監(jiān)測作業(yè)指導(dǎo)書1
- 萬科物業(yè)九大服務(wù)細(xì)節(jié)
- 商務(wù)英語之就餐英語
- 題庫2便利店服務(wù)技能
評論
0/150
提交評論