




已閱讀5頁,還剩63頁未讀, 繼續(xù)免費閱讀
(計算機應(yīng)用技術(shù)專業(yè)論文)基于xml的異構(gòu)數(shù)據(jù)集成研究及應(yīng)用.pdf.pdf 免費下載
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
摘要 摘要 隨著計算機技術(shù)特別是i n t e m e t 技術(shù)的迅猛發(fā)展,各個行業(yè)、單位、機構(gòu)或 部門內(nèi)部都逐步實現(xiàn)了業(yè)務(wù)、信息的計算機管理。在企業(yè)內(nèi)部,由于部門間相 對獨立,構(gòu)建系統(tǒng)時缺乏統(tǒng)一的規(guī)劃和標準,所以造成了現(xiàn)有的應(yīng)用系統(tǒng)是分 散、異構(gòu)、封閉的系統(tǒng),相互之間不能共享信息,形成了一個個“信息孤島 。 企業(yè)應(yīng)用集成e a i ( e n t e r p r i s ea p p l i c a t i o ni n t e g r a t i o n ) 是解決這一問題的方法之 一。e a i 使得各應(yīng)用信息系統(tǒng)相互連接,并進行數(shù)據(jù)交換、通信、加工處理,以 減輕業(yè)務(wù)過程信息障礙。通過對不同的信息系統(tǒng)及不同業(yè)務(wù)單元的集成和優(yōu)化, 在機構(gòu)范圍內(nèi)或整個系統(tǒng)范圍內(nèi)實現(xiàn)業(yè)務(wù)過程整合。w e bs p h e r e 是當前比較成 功的應(yīng)用集成手段,但費用較高。對于中小型生產(chǎn)企業(yè)而言,集成深入程度一 般到數(shù)據(jù)層,這樣可以繞過業(yè)務(wù)邏輯,直接對企業(yè)數(shù)據(jù)進行操作,并且只要將 不同應(yīng)用系統(tǒng)問需要溝通部分的信息進行集成就可以。這樣不但集成成本減少, 而且實施難度也較低。 本文首先對數(shù)據(jù)集成涉及的相關(guān)技術(shù)進行深入研究。分析了目前流行的數(shù) 據(jù)集成產(chǎn)品。按照不同的實現(xiàn)技術(shù),將數(shù)據(jù)集成方法分為三類,即數(shù)據(jù)轉(zhuǎn)換方 法、數(shù)據(jù)聚合方法以及析取、轉(zhuǎn)換和裝載( e x t r a c t 、t r a n s f o r ma n dh a d ,e t l ) 方 法。對每種數(shù)據(jù)集成方法進行了深入研究,總結(jié)了各種方法的應(yīng)用領(lǐng)域及特點。 然后,借鑒數(shù)據(jù)轉(zhuǎn)換方法以及e t l 方法的數(shù)據(jù)集成實現(xiàn)思想,結(jié)合目前中小企 業(yè)數(shù)據(jù)集成的需求,提出基于j a v a 和x m l 技術(shù)實現(xiàn)異構(gòu)數(shù)據(jù)交換集成的通用 解決方案,對該方案進行了詳細設(shè)計。該集成方案簡單易行,共同部分可以只 是一些x m l 文檔,對于這些文檔的管理只需存儲提取就可以了,投入資金也不 多。各系統(tǒng)仍然按照原來的方式運行,包括數(shù)據(jù)的存儲提取,只是在需要進行 信息交流時通過中間件技術(shù)把本地數(shù)據(jù)庫數(shù)據(jù)轉(zhuǎn)換成x m l 數(shù)據(jù)文件或者進行相 反的轉(zhuǎn)換即可。最后,依據(jù)該方案實現(xiàn)了河南省電力企業(yè)內(nèi)應(yīng)用系統(tǒng)間的數(shù)據(jù) 共享交互系統(tǒng)?,F(xiàn)已投入使用,實現(xiàn)了異構(gòu)系統(tǒng)數(shù)據(jù)的共享,消除了“信息孤 島 ,顯著提高了工作效率,取得了很好的應(yīng)用效果。 關(guān)鍵詞:異構(gòu)數(shù)據(jù)數(shù)據(jù)集成數(shù)據(jù)抽取d o ms a x a b s t r a c t 一一一 a b s t r a c t w i t ht h er a p i dd e v e l o p m e n to fc o m p u t e r t e c h n o l o g i e s ,e s p e c i a l l yi ni i l t e m e t a s p e c t ,l o t so fm a n a g e m e n ti n f o r m a t i o ns y s t e m sb a s e do nc o m p u t e rt e c h n o l o g i e s h a v e b e e n a c c o m p l i s h e d i na l m o s te v e r yo r g a n i z a t i o n d u e t os o m er e l a t i v e l n d e p e n d e n c eb e t w e e nd e p a r t m e n t si ne n t e r p r i s e ,a n ds h o r to fc o n s o l i d a t e dp l a na n d s t a n d a r dw h e nd e s i g n i n ga p p l i c a t i o ns y s t e m s ,t h e r em u s tb es o m ei n f 6 n n a t i o ni s l a n d s i nt h ea p p l i c a t i o ns y s t e m s ,w h i c ha r es e p a r a t e ,h e t e r o g e n o u s ,o b t u r a t e da n d u n s h a r e d e a ii so n eo fm e t h o d st os o l v et h e p r o b l e m e a ic a nh e l pc o n n e c ti n f o m a t i o n s y s t e m s ,e x c h a n g ed a t aa n dd e a lw i t hi n f o r m a t i o nb e t w e e na l lk i n d so fa p p l i c a t i o n m f o r m a t i o ns y s t e m s ,t or e l i e v ei n f o r m a t i o no b s t a c l e si nb u s i n e s sp r o c e s s t h r o u g h i n t e g r a t i n ga n do p t i m i z i n gd i f f e r e n ta p p l i c a t i o ns y s t e m sa n dd i 骶r e n tb u s i n e s su n i t s t h es c o p eo fe n t e r p r i s eb u s i n e s so rs u p p l yc h a i n sw i l lg e tc o n f o r m i t y w e b s p h e r ei s r e l a t i v e l ys u c c e s s f u la p p l i c a t i o nw a y , b u ti tc o s t sm o r a sf a ra st h es m a l la n d m e d i u me n t e r p r i s e sa r ec o n c e m e d ,t h ei n t e g r a t i o nl e v e lw i l l a l w a y sb ec o n s i d e r e da t d a t al a y e r , s ot h a ti tc a nd i r e c t l ya c c e s sd a t aa n da v o i d l o g i c a lb u s i n e s s ,m o r e o v e r i t ,s l o w e rc o s ta n dl e s sd i f f i c u l tt oi n t e g r a t ea n dp e r f o r m ,i fo n l yt os t r e s st h ei n f b n n a t i o n r e s o u r c e sn e e d e db e t w e e nt h ed i f f e r e n ta p p l i c a t i o n s y s t e m s t h i sp a p e rs t a r t sf r o mt h ed e e pr e s e a r c ht od a t ai n t e g r a t i o ni n v o l v e d t e c h n o l o g i e s t y p i c a l l y , t h ec u r r e n t l yp o p u l a rd a t ai n t e g r a t i o np r o d u c t sa r ea n a l y z e d ,a c c o r d i n gt 0 d i f f e r e n tr e a l i z a t i o nt e c h n o l o # e s ,t h e r ea r et h r e ei n t e g r a t i o nm e t h o d s ,i n c l u d i n gd a t a t r a n s l b r m a t i o n ,d a t aa g g r e g a t i o na n de t l t h e nw er e s e a r c he a c hm e t h o df u r t h e r a n dc o n c l u d et h e i ra p p l i c a t i o nf i e l d sa n d c h a r a c t e r i s t i c s f u r t h e r m o r e ,r e f e 幣n gt o 廿1 e i d e a so fd a t at r a n s f o r ma n de t la b o u td a t a i n t e g r a t i o n ,a c c o r d i n gt os m a l la n d m e d i u me n t e r p r i s e s n e e d s ,ab a s e do nj a v aa n dx m l s o l u t i o ni sp u tf o r w a r da n d d e s i g n e dc a r e f u l l y t h es o l u t i o ni ss i m p l ea n df e a s i b l e ,t h ec o m m o np a r t sb e t w e e n d i f f e r e n ts y s t e m sa r ex m l d o c u m e n t st h a tc a nb ea c c e s s e da n ds t o r e dw i t hl o w c o s t a 1 1 s y s t e m sm na s u s u a l ,i n c l u d i n ga c c e s s i n ga n ds t o r i n gd a t a o n l yw h e n c o m m u n i c a t i o no c c u r s ,t h ed a t a b a s ei n f o r m a t i o n a n dx m ld o c u m e n t sw i l lb e t r a n s f o r m e de a c ho t h e rb yt h em i d d l e w a r e f i n a l l y , w ed e v e l o p e dad a t a i n t e g r a t i o n a n de x c h a n g es y s t e ma c c o r d i n gt h i ss c h e m ef o re l e c t r i cp o w e r e n t e r p r i s ei nh e n a n i l a b s t r a c t p r o v i n c e ,w h i c hh a sb e e np u ti n t op r a c t i c e ,a c c o m p l i s h i n gi n f o r m a t i o ne x c h a n g e b e t w e e nh e t e r o g e n e o u ss y s t e m s ,a v o i d i n gi n f o r m a t i o ni s l a n d s ,o b v i o u s l yi m p r o v i n g e f f i c i e n c ya n dt a k i n gf a v o r a b l ee f f e c t k e yw o r d s :h e t e r o g e n e o u sd a t a d a t ai n t e g r a t i o nd a t ae x t r a c t i o nd o ms a x i i i 南開大學學位論文原創(chuàng)性聲明 本人鄭重聲明:所呈交的學位論文,是本人在導(dǎo)師指導(dǎo)下,進行 研究工作所取得的成果。除文中已經(jīng)注明引用的內(nèi)容外,本學位論文 的研究成果不包含任何他人創(chuàng)作的、己公開發(fā)表或者沒有公開發(fā)表的 作品的內(nèi)容。對本論文所涉及的研究工作做出貢獻的其他個人和集 體,均已在文中以明確方式標明。本學位論文原創(chuàng)性聲明的法律責任 由本人承擔。 學位論文作 亡l 一 b石0d,鈕加易年 簽 沙 豁 沙 南開大學學位論文版權(quán)使用授權(quán)書 本人完全了解南開大學關(guān)于收集、保存、使用學位論文的規(guī)定, 同意如下各項內(nèi)容:按照學校要求提交學位論文的印刷本和電子版 本;學校有權(quán)保存學位論文的印刷本和電子版,并采用影印、縮印、 掃描、數(shù)字化或其它手段保存論文;學校有權(quán)提供目錄檢索以及提供 本學位論文全文或者部分的閱覽服務(wù);學校有權(quán)按有關(guān)規(guī)定向國家有 關(guān)部門或者機構(gòu)送交論文的復(fù)印件和電子版:在不以贏利為目的的前 提下,學??梢赃m當復(fù)制論文的部分或全部內(nèi)容用于學術(shù)活動。 學位論文作者簽名: 乏蔓 砂嘞擴 - - - 一- - - 一- - 一一- - 一_ - - - _ - - - - - 一一- - - - - - - - - - - - - - - - - - e - l - - - - - 一一一一 2 卯巧年月 經(jīng)指導(dǎo)教師同意,本學位論文屬于保密,在年解密后適用 本授權(quán)書。 指導(dǎo)教師簽名:學位論文作者簽名: 解密時間:年 月日 各密級的最長保密年限及書寫格式規(guī)定如下: 第一章緒論 第一章緒論 第一節(jié)課題背景 隨著計算機技術(shù),特別是i n t e m e t 技術(shù)的迅猛發(fā)展,許多行業(yè)、單位或機構(gòu)、 部門內(nèi)部都逐步實現(xiàn)了業(yè)務(wù)、信息的計算機化管理。在企業(yè)實施信息化進程中, 由于企業(yè)內(nèi)各部門的業(yè)務(wù)和功能歸屬不同,以及各企業(yè)信息化水平存在差異等 原因,造成企業(yè)擁有許多相互隔離的、由不同核心技術(shù)構(gòu)建的信息服務(wù)和管理 系統(tǒng)。系統(tǒng)中數(shù)據(jù)的表示不同,數(shù)據(jù)交流效果極差,形成“信息孤島 ,從而使 得企業(yè)內(nèi)以及企業(yè)間的協(xié)作效率與效果很不理想。 “信息孤島”帶來的不良影響大致可以分為以下幾個方面【1 1 : ( 1 ) 數(shù)據(jù)的一致性無法保證 彼此孤立的系統(tǒng)要順利運行,必須對相同的數(shù)據(jù)重復(fù)輸入,將一個系統(tǒng)中 的統(tǒng)計結(jié)果和計算結(jié)果輸入到另一個系統(tǒng)中,使得大量的信息資源不能充分發(fā) 揮應(yīng)有的作用,效率低下。由于數(shù)據(jù)來源的口徑不一,不僅增加了不必要的額 外勞動,而且經(jīng)常造成數(shù)據(jù)不一致、不正確,使得企業(yè)領(lǐng)導(dǎo)面對不同來源報表 中不一致的數(shù)據(jù)而無所適從,成為阻礙信息化進一步發(fā)展的障礙。 ( 2 ) 信息及時共享、反饋難 如果企業(yè)中“信息孤島 現(xiàn)象嚴重,系統(tǒng)之間既不能有效實現(xiàn)信息共享, 又影響業(yè)務(wù)的順利執(zhí)行。由此所造成的信息共享、反饋難使信息化作用無法得 到有效體現(xiàn)。 ( 3 ) 影響操作和決策支持 “信息孤島”的存在難免導(dǎo)致一套系統(tǒng)一套賬戶和密碼,每個需要操作計 算機的人員要記住多個賬戶、登錄口令,經(jīng)常需要從一個系統(tǒng)退出再進入另一 個系統(tǒng),給操作帶來不便。企業(yè)主管需要站在企業(yè)全局把握生產(chǎn)、經(jīng)營情況, 需要在產(chǎn)、供、銷的一體化的基礎(chǔ)上對企業(yè)人、財、物進行統(tǒng)籌管理,而孤立 的信息系統(tǒng)無法有效地提供跨部門、跨系統(tǒng)的綜合性的信息。企業(yè)管理者要求 隨時可得到市場、財務(wù)、人力資源等實時的信息,迅速調(diào)動、消化企業(yè)資源以 反映市場需求。在“信息孤島 普遍存在的情況下,各類數(shù)據(jù)不能形成有價值 的信息,局部的信息不能提升為管理知識,決策支持只能是空談。 ( 4 ) 影響信息化的集團化 第一章緒論 行業(yè)化應(yīng)用,制約企業(yè)電子商務(wù)發(fā)展。在互聯(lián)網(wǎng)發(fā)展的今天,信息化已經(jīng) 開始從企業(yè)應(yīng)用向網(wǎng)絡(luò)化的集團應(yīng)用、行業(yè)應(yīng)用推進。在網(wǎng)絡(luò)環(huán)境下,企業(yè)作 為集團總部或行業(yè)大系統(tǒng)的一個個節(jié)點,為集團總部或行業(yè)總部及時提供生產(chǎn)、 經(jīng)營的指標數(shù)據(jù),構(gòu)建集團應(yīng)用、行業(yè)應(yīng)用的神經(jīng)系統(tǒng)。如果在企業(yè)節(jié)點上附 著的是相互孤立的單元,這樣的神經(jīng)末稍不能為總部的大腦及時提供信息,集 團信息化和行業(yè)信息化也就成了無本之木、無源之水。 從總體上看,我國企業(yè)目前普遍缺乏對r r 系統(tǒng)在企業(yè)應(yīng)用的整體觀念,對 信息化工作缺乏總體規(guī)劃,前期的系統(tǒng)咨詢論證也不夠充分。實踐中更加關(guān)注 某一個業(yè)務(wù)環(huán)節(jié)或者某一個管理功能的信息化,注重單元技術(shù)和短期效益,應(yīng) 用系統(tǒng)實施分散,整體集成和溝通程度不高。隨著企業(yè)信息化建設(shè)的不斷深入, 企業(yè)所用的軟件系統(tǒng)也將越來越多。盡管這些系統(tǒng)關(guān)注于不同的領(lǐng)域,但相互 之間在功能上有相互交叉和連接的地方,系統(tǒng)間的集成最終將成為一個大問題, 跨系統(tǒng)的應(yīng)用也將成為巨大的困局。 。 企業(yè)應(yīng)用集成e a i ( e n t e r p r i s e a p p l i c a t i o n i n t e g r a t i o n ) 是解決這一問題的方法 之一。美國著名的r r 媒體i t t o o l b o x 對e a i 的定義是:“通過硬件、軟件、標準 和業(yè)務(wù)過程的結(jié)合,實現(xiàn)兩個或多個企業(yè)應(yīng)用系統(tǒng)的無縫集成,使它們能夠統(tǒng) 一運作 。即e a i 使得各應(yīng)用信息系統(tǒng)相互連接,并進行數(shù)據(jù)交換、通信、加工 處理,以減輕業(yè)務(wù)過程信息障礙。通過對不同的信息系統(tǒng)及不同業(yè)務(wù)單元的集 成和優(yōu)化,在企業(yè)范圍內(nèi)或整個供應(yīng)鏈范圍內(nèi)實現(xiàn)業(yè)務(wù)過程整合。w e b s p h e r e 等 是當前比較成功的應(yīng)用集成手段,但費用較高。對于中小型生產(chǎn)企業(yè)而言,集 成深入程度一般到數(shù)據(jù)層集成,其繞過業(yè)務(wù)邏輯,直接對企業(yè)數(shù)據(jù)進行操作, 且一般只要將不同應(yīng)用系統(tǒng)間需要溝通部分的信息進行集成,這樣一來不但集 成成本減少,而且實施難度也較低。 所以,借鑒已有數(shù)據(jù)集成方法的思想及其先進的實現(xiàn)技術(shù),尋求一種適合 于中小企業(yè)數(shù)據(jù)集成的有效解決方案很有現(xiàn)實意義。 第二節(jié)研究現(xiàn)狀 目前,企業(yè)數(shù)據(jù)集成有許多成型產(chǎn)品。例如國外的b e a l i q u i dd a t a ,b u s i n e s s o b j e c t sd a t ai n t e g r a t o r ,國內(nèi)的數(shù)據(jù)集成中間件o n c e d i 、東方通科技集成中間件 t o n g i n t e g r a t o r 等。這些中間件利用i n t r a n e t 或i n t e r n e t 進行數(shù)據(jù)集成,為數(shù)據(jù)庫、 2 第一章緒論 文件系統(tǒng)以及應(yīng)用程序等異構(gòu)數(shù)據(jù)源提供包含提供、轉(zhuǎn)換、傳輸和存儲等操作 的數(shù)據(jù)集成服務(wù)2 】【3 】【4 】【5 1 。 按照不同的實現(xiàn)技術(shù),集成方法可以分為三類:數(shù)據(jù)轉(zhuǎn)換方法、數(shù)據(jù)倉庫 法和虛擬法。 1 數(shù)據(jù)轉(zhuǎn)換方法 一種傳統(tǒng)的數(shù)據(jù)集成方法,相對于其他方法來說,技術(shù)上較為簡單,比較容 易實現(xiàn),目前在很多領(lǐng)域仍然是一種主要的數(shù)據(jù)集成方法。數(shù)據(jù)轉(zhuǎn)換方法通過轉(zhuǎn) 換工具在數(shù)據(jù)庫之間進行模式映射,將一個數(shù)據(jù)庫中的數(shù)據(jù)復(fù)制、轉(zhuǎn)換為另一個 數(shù)據(jù)庫中的數(shù)據(jù),從而實現(xiàn)數(shù)據(jù)庫之間的集成。 2 數(shù)據(jù)倉庫法 在客戶端與數(shù)據(jù)源之間增加一層,稱為數(shù)據(jù)倉庫,用于存儲來自各數(shù)據(jù)源 的待集成數(shù)據(jù),系統(tǒng)提供對這個數(shù)據(jù)倉庫的查詢機制。這種體系結(jié)構(gòu)的優(yōu)點是 既可用于數(shù)據(jù)集成,又可用于決策支持查詢。該方法存在的問題是,當信息源 的數(shù)據(jù)發(fā)生變化時,數(shù)據(jù)倉庫中的數(shù)據(jù)也要作相應(yīng)的修改。因此,這種間接訪 問方式的缺點是數(shù)據(jù)更新不及時,數(shù)據(jù)重復(fù)存儲。這種體系結(jié)構(gòu)通常需要一些 新的技術(shù),如有效的數(shù)據(jù)加載和增量更新維護等。 3 虛擬法 該方法使用了與數(shù)據(jù)倉庫法完全不同的結(jié)構(gòu)。數(shù)據(jù)仍保存在各數(shù)據(jù)源上, 集成系統(tǒng)僅提供一個虛擬的集成視圖和對該集成模式的查詢請求轉(zhuǎn)化成對各異 構(gòu)數(shù)據(jù)源的查詢。該方法亦稱為中介器( m e d i a t o r ) 法。在這種體系結(jié)構(gòu)中,中間 層根本不實際存儲數(shù)據(jù),當客戶端發(fā)出查詢請求時,m e d i a t o r 僅是簡單地將查詢 發(fā)送到適當?shù)臄?shù)據(jù)源上。由于該方法不需要重復(fù)存儲大量數(shù)據(jù),并能保證查詢 到最新的數(shù)據(jù),由此比較適合于高度自治、集成數(shù)據(jù)多、且更新變化快的異構(gòu) 數(shù)據(jù)源集成。虛擬體系結(jié)構(gòu)中所使用的技術(shù)與傳統(tǒng)的數(shù)據(jù)服務(wù)器中的技術(shù)有著 根本的不同,相對于數(shù)據(jù)處理技術(shù)來說,該方法中的技術(shù)將涉及到更多的查詢 上的代數(shù)操作。首先,m e d i a t o r 應(yīng)當確定出哪個數(shù)據(jù)源對給定的查詢有用,當需 集成的數(shù)據(jù)源巨大時,這一問題是非常重要的;其次,一旦確定了有關(guān)的數(shù)據(jù) 源,m e d i a t o r 應(yīng)當執(zhí)行源到源的查詢變換,該過程有時稱為查詢重寫。當從兩個 或多個數(shù)據(jù)源抽取數(shù)據(jù)時,m e d i a t o r 還需生成一個全局的執(zhí)行計劃,以確定以何 種順序?qū)?shù)據(jù)源進行查詢7 】【8 】【9 1 。無論采用何種體系結(jié)構(gòu),異構(gòu)數(shù)據(jù)源集成的 首要任務(wù)是要為集成系統(tǒng)設(shè)計一個公共模型,以對來自異構(gòu)數(shù)據(jù)源的各種數(shù)據(jù) 3 第一章緒論 轉(zhuǎn)換成集成系統(tǒng)能進一步處理的統(tǒng)一格式;另外還必須定義公共模型上的基本 運算。若采用虛擬法,還必須實現(xiàn)公共模型上的操作到各種數(shù)據(jù)源操作的自動 轉(zhuǎn)換。 目前,由于x m l 良好的可靠性與互操作性,確保了網(wǎng)絡(luò)中信息的傳輸與交 互,加上x m l 是基于w e b 工作設(shè)計的,更適合于網(wǎng)絡(luò)化環(huán)境,因此在電子商 務(wù)時代b 2 b 的商業(yè)模式得到廣泛應(yīng)用。x m l 的可擴展性和自描述性更讓其在數(shù) 據(jù)描述和信息共享方面有著天然的優(yōu)勢。其標記可根據(jù)需求由企業(yè)自由定制, 有極大的靈活性,可形成針對行業(yè)特點的不同標記集。x m ls c h e m a 支持許多復(fù) 雜的數(shù)據(jù)類型,引入原型和命名空間概念,可隨意擴充等,使得其不但編寫簡 單,而且內(nèi)容充實完整,可以給出x m l 文檔詳細明確的定義。由s c h e m a 定義 約束的x m l 文檔,有效性更加嚴格,內(nèi)容結(jié)構(gòu)更加嚴謹??傊瑇 m l 的結(jié)構(gòu) 性、可擴展性、自描述性、簡單性等多種特性,使之表示數(shù)據(jù)的方式真正做到 了獨立于應(yīng)用系統(tǒng),不受任何特殊的軟件或者硬件平臺限制,并且這些數(shù)據(jù)能 重復(fù)使用,簡單易懂,成為交換各種結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化信息的良好 方式。 此外,x m l 本身突出表現(xiàn)數(shù)據(jù)結(jié)構(gòu)和語義的特點,使其自然地與數(shù)據(jù)庫結(jié) 合在一起。一旦將x m l 數(shù)據(jù)文件與數(shù)據(jù)庫表關(guān)系關(guān)聯(lián)起來,不但可以保留關(guān)系 數(shù)據(jù)庫表的結(jié)構(gòu)信息,還可以利用x m l 文檔的優(yōu)勢在網(wǎng)絡(luò)及數(shù)據(jù)庫間交換數(shù)據(jù), 并解決不同數(shù)據(jù)庫系統(tǒng)及數(shù)據(jù)關(guān)系、語義定義等數(shù)據(jù)表達方面的差異,如對應(yīng) 關(guān)系中字段內(nèi)容不同、字段命名不同、數(shù)據(jù)類型不同等。這將較好地解決企業(yè) 應(yīng)用系統(tǒng)問信息資源集成的分布和異構(gòu)等問題,使得數(shù)據(jù)交換的手段更為透明, 并為e a i 的發(fā)展提供了有效手段【l o l 。 第三節(jié)課題目標 本課題首先對目前存在的數(shù)據(jù)集成解決方案進行深入研究,分析各種方案 的實現(xiàn)原理及特點。在此基礎(chǔ)上,借鑒其中的原理及實現(xiàn)技術(shù),針對中小型企 業(yè)內(nèi)部信息系統(tǒng)數(shù)據(jù)交互共享的需求,設(shè)計一種簡單通用的數(shù)據(jù)集成解決方案。 最后,對該方案進行具體實現(xiàn),解決河南省電力企業(yè)信息系統(tǒng)間數(shù)據(jù)集成的需 求,實現(xiàn)系統(tǒng)間數(shù)據(jù)交互共享。實現(xiàn)的抽取轉(zhuǎn)換系統(tǒng)要靈活通用,使得在各個 電力企業(yè)的工程實施中,只需根據(jù)企業(yè)實際情況對該抽取轉(zhuǎn)換系統(tǒng)進行簡單配 4 第一章緒論 置修改即可滿足其數(shù)據(jù)共享應(yīng)用的需求。 第四節(jié)論文結(jié)構(gòu) 在緒論之后,本文的第二章將詳細介紹實現(xiàn)數(shù)據(jù)集成抽取交換系統(tǒng)涉及到 的相關(guān)技術(shù)及其發(fā)展歷程。第三章對目前各種數(shù)據(jù)集成解決方案進行研究。第 四章提出適合于中小企業(yè)數(shù)據(jù)集成的解決方案。第五章提出工程需求,依據(jù)第 四章的解決方案設(shè)計開發(fā)異構(gòu)數(shù)據(jù)集成交換系統(tǒng)。第六章將對實現(xiàn)的系統(tǒng)進行 測試。本文最后一章第七章將對所有的工作進行總結(jié),然后對未來的工作進行 展望。 第五節(jié)本文的研究成果 對目前流行的數(shù)據(jù)集成產(chǎn)品進行了分析研究,按照不同的實現(xiàn)技術(shù),將數(shù) 據(jù)集成方法分為三類,即數(shù)據(jù)轉(zhuǎn)換方法、數(shù)據(jù)聚合方法以及e t l 方法。對每種 數(shù)據(jù)集成方法進行了深入研究,總結(jié)了各種方法的應(yīng)用領(lǐng)域及特點。 借鑒現(xiàn)有數(shù)據(jù)集成解決方案的優(yōu)秀思想以及先進實現(xiàn)技術(shù),結(jié)合中小企業(yè) 數(shù)據(jù)集成的實際情況,提出了基于x m l 的異構(gòu)數(shù)據(jù)交換集成解決方案,并對該 方案進行了詳細設(shè)計。該方案應(yīng)用x m ls c h e m a 建立信息交換模型,采用x m l 文檔作為系統(tǒng)間底層的信息交換載體。低成本地進行數(shù)據(jù)轉(zhuǎn)換與集成,更大范 圍地實現(xiàn)數(shù)據(jù)共享和更有效地利用信息資源,最終實現(xiàn)異構(gòu)系統(tǒng)間自動、平滑 的信息交換過程。 依據(jù)該模型開發(fā)了河南省電力企業(yè)異構(gòu)系統(tǒng)間數(shù)據(jù)抽取交換系統(tǒng)。通過對 該系統(tǒng)的測試及在河南省電力企業(yè)的實際運行,驗證了它完全可以實現(xiàn)異構(gòu)系 統(tǒng)間數(shù)據(jù)的有效抽取及交換。完成了異構(gòu)系統(tǒng)間數(shù)據(jù)的共享,消除了“信息孤 島 。 最后,在對該方案設(shè)計及系統(tǒng)實現(xiàn)總結(jié)的基礎(chǔ)上,提出一種將來可以采用 的更為徹底的數(shù)據(jù)集成解決方案采用x m l 數(shù)據(jù)庫的數(shù)據(jù)集成解決方案。 5 第二章相關(guān)技術(shù) 第二章相關(guān)技術(shù) 第一節(jié)x m l 2 1 1x m l 的發(fā)展 1 s g m l 計算機作為以文本為主的人與人之間交流的便利工具,其應(yīng)用遍及工作、 生活中的每個角落。但是,各種計算機所用的格式不同造成它們之間不具有互 換性,用某種系統(tǒng)處理的數(shù)據(jù)不能用于其它系統(tǒng);同時,人們也期待對電子化 的信息進行檢索。國際標準化組織意識到數(shù)據(jù)移植性的重要,于1 9 8 6 年1 2 月 制定了文檔記述的標準一s g m l ( s t a n d a r dg e n e r a l i z e dm a r k u pl a n g u a g e ,標準通 用標記語言) 。該標準闡述了與特定的字處理軟件或文本處理系統(tǒng)無關(guān)的,將文 檔的內(nèi)容部分和顯示、印刷時必要的格式排版信息部分分開記述的方法。由于 s g m l 文檔的結(jié)構(gòu)被明確記述,程序可解析它,所以,依s g m l 規(guī)則記述的文 檔,可在不同的系統(tǒng)之間以不同的方法進行交換和處理,其結(jié)果也大大地方便 了數(shù)據(jù)的管理和利用。 一個s g m l 語言程序由三部分組成,即語法定義、文件類型定義和文件實 例。語法定義,定義了文件類型定義和文件實例的語法結(jié)構(gòu);文件類型定義, 定義了文件實例的結(jié)構(gòu)和組成結(jié)構(gòu)的元素類型,d t d 中定義了標記的含義,因 而s g m l 的語法是可以擴展的;文件實例是s g m l 語言程序的主體部分。 s g m l 被廣泛地應(yīng)用在很多地方,因為其利用文件類型定義來指定文件的 結(jié)構(gòu),來描述s g m l 的標記以及文件的格式,所以我們就可以將文件自由地轉(zhuǎn) 成我們要的格式。而不管你轉(zhuǎn)換成什么樣的格式,它都可以讓這個文件呈現(xiàn)出 一致的外觀,也正是因為如此,才讓相當多企業(yè)使用s g m l 來管理它們內(nèi)部的 文件,并使其他的公司只要了解了s g m l 的規(guī)范,就可將它們的文件解析出同 樣的結(jié)果。這是一個相當重要的特性,也就是我們常說的“跨平臺”性。因此 s g m l 具有以下優(yōu)點: 不依賴于平臺,可容易地進行文檔交換; 文檔格式與內(nèi)容互相獨立的通用化置標; 數(shù)據(jù)擴展性帶來了應(yīng)用程序的可獨立性; 6 第二章相關(guān)技術(shù) 著者和編輯者明確易懂的格式。 但是s g m l 存在著缺陷:規(guī)范過于詳盡、相關(guān)標準之間的關(guān)系不易了解、 開發(fā)成本高。由于開發(fā)上的困難,因此s g m l 不能夠直接用于企業(yè)數(shù)據(jù)共享。 2 h t m l 隨著i n t e m e t 的快速發(fā)展,許多用戶通過i n t e r n e t 進行信息交換,i n t e r n e t 上 的信息交換的革命也提上日程。在當今網(wǎng)絡(luò)應(yīng)用中,例如電子商務(wù)、數(shù)字圖書 館、遠程教育等應(yīng)用領(lǐng)域,文檔的共享成為最重要的問題之一。然而,s g m l 的設(shè)計早于w e b 的出現(xiàn),故在網(wǎng)絡(luò)環(huán)境下,s g m l 不能直接應(yīng)用。作為從s g m l 衍生而來的在網(wǎng)絡(luò)上應(yīng)用的標記語言h t m l 登上了歷史舞臺。 h t m l 即超文本標記語言是由w 3 c 制定的,最早的版本是在1 9 9 3 年推出 的h t m l l 0 。h t m l 最大的魅力,在于利用超鏈接的方式,將包含著圖、文、 多媒體的網(wǎng)頁呈現(xiàn)在瀏覽器上,只要點擊超鏈接,就可以鏈接到不同的網(wǎng)頁, 而網(wǎng)頁又相互關(guān)聯(lián),這將整個互聯(lián)網(wǎng)的信息聯(lián)系在了一起。 h t m l 的優(yōu)點:編寫簡單、跨平臺、強大的信息展示能力。 h t m l 的缺陷: ( 1 ) 缺少延伸的空間 s g m l 具有可擴展性,而h t m l 本身就是一種規(guī)定好了的語言。語法簡單, 易于掌握,但可擴展性方面差一些。 ( 2 ) 只著重于數(shù)據(jù)的顯示 h t m l 是w 3 c 為了在w e b 上顯示信息而制定的,所以,它的定位放在為 了展示、表達某些信息上。因此,在h t m l 的語法下,數(shù)據(jù)的內(nèi)容和顯示方式 結(jié)合在一起,計算機無法識別出具體的數(shù)據(jù)。 ;( 3 ) 缺乏一致的規(guī)格 雖然h t m l 并沒有平臺上的問題,可是,由于h t m l 在制定的時候并不像 s g m l 那么嚴謹,它注重在顯示數(shù)據(jù)的能力上。不同的瀏覽器廠商就有時會做 出不同的h t m l 標記,這樣就會導(dǎo)致兼容性的問題。, 由于h t m l 并不完美,它只是一種表達的技術(shù),它并不能揭示h t m lt a g 中數(shù)據(jù)的意義。這樣,x m l 應(yīng)運而生。 3 x m l x m l 為e x t e n s i b l em a r k u pl a n g u a g e 的簡稱,即可擴展標記語言。x m l 是以一種簡單、標準、可擴充的方式,將各種信息如文本、表格以及圖形等以 7 第二章相關(guān)技術(shù) 原始數(shù)據(jù)的方式儲存。但在儲存的過程中,加入一些可供識別的標記。根據(jù)這 些可供識別的標記,在網(wǎng)絡(luò)上的服務(wù)器或客戶端設(shè)備可將信息內(nèi)容做進一步的 處理,從而得到所需的信息。 x m l 并非原創(chuàng)語言,它與h t m l 一樣都是根據(jù)s g m l 的標準衍生制定出 來的,融合了s g m l 的數(shù)據(jù)兼容性與h t m l 的簡單標記法,使得它能夠提供一 套簡單易懂、高效的程序語法。 x m l 的優(yōu)點: ( 1 ) 擴展性 雖然x m l 與h t m l 一樣都是標記語言,但它卻不只特定應(yīng)用于網(wǎng)頁上, 而是可以自由地創(chuàng)造新的標記來配合應(yīng)用。這使得x m l 的應(yīng)用層面有無限的擴 展性,可以說是一種超語言?;谶@一特點,x m l 不只在網(wǎng)絡(luò)上有更多發(fā)揮空 間,對諸如文件數(shù)據(jù)庫或多媒體數(shù)據(jù)庫等復(fù)雜的數(shù)據(jù)系統(tǒng)也提供了很好的解決 方案。 ( 2 ) 簡單易懂 x m l 文檔是以文本方式來表示,不是二進制碼,所以利用一般的編輯器就 可以編輯修改,而且表達的方式非常直觀。 ( 3 ) 不同平臺間的信息傳遞 企業(yè)信息化的過程中,引入了許多彼此獨立的信息系統(tǒng)。隨著企業(yè)之間競 爭的加劇和企業(yè)信息化進程的加快,各系統(tǒng)間的信息共享勢在必行。在x m l 尚 未出現(xiàn)時,不同系統(tǒng)間的信息共享比較困難,一般都需要特別為系統(tǒng)與系統(tǒng)之 間編寫軟件來使彼此的信息能夠正確地傳遞,若之后系統(tǒng)需要更新或改動部分 軟件,可能會造成系統(tǒng)間不兼容的問題。 當x m l 出現(xiàn)之后,它為不同系統(tǒng)之間提供了一個溝通的平臺,充當信息傳 遞的媒介。由于x m l 本身簡單易讀,能將不同類型的文件數(shù)據(jù),諸如文本、圖 片以及特殊定義的對象等標記為x m l 格式,所以只要在要互相傳遞信息的系統(tǒng) 上都裝有x m l 的解析器,就可以解析標記過的數(shù)據(jù),得到正確的信息。 ( 4 )國際化 x m l 支持多語種文件與u n i c o d e ,在開始設(shè)計x m l 時,設(shè)計者便考慮到信 息的流通不應(yīng)該只受限于一個國家或是一個區(qū)域,隨著i n t e m e t 在全世界的普及, 將一份文件能夠以多種不同語言來呈現(xiàn),是x m l 必須擁有的能力,所以便將 x m l 建立在u n i c o d e 之上。 8 第二章相關(guān)技術(shù) 4 x m l 與h t m l 的主要區(qū)別 ( 1 ) x m l 是被設(shè)計用來描述數(shù)據(jù)的,而h t m l 是被設(shè)計用來顯示數(shù)據(jù)的。 ( 2 ) x m l 是可擴展的,允許用戶自定義自己的標記和自己的文檔結(jié)構(gòu);在 h t m l 中所有的標記和文檔結(jié)構(gòu)都是預(yù)先定義的,用戶只能使用標準的h t m l 標記。 ( 3 ) x m l 是h t m l 的一種補充,x m l 不是h t m l 的一種替代品??梢?使用x m l 來描述網(wǎng)站所需數(shù)據(jù)和網(wǎng)站的結(jié)構(gòu),而使用h t m l 來格式化和顯示 這些數(shù)據(jù)。 總體來講,s g m l 是一個語言模板,它可以描述其他具有具體語義的語言。 h t m l 是s g m l 的一個實例,它的文檔類型定義( d t d ) 作為標準被固定下來, 因此,h t m l 不能作為定義其他標記語言的元語言。它的語言遵照s g m l 規(guī)范, 并且定義其中每個標記的具體含義。x m l 是s g m l 的一個精簡子集,它也是一 個語言模板。嚴格地講,x m l 還是s g m l 。與h t m l 不同的是,x m l 有d t d , 因而也可以作為元語言來定義其他文件系統(tǒng)。 2 1 2x m l 相關(guān)技術(shù) 1 符合規(guī)則的x m l 文件 x m l 提供了一些特定的規(guī)則,x m l 文件必須符合這些規(guī)則,才可以被稱作 “w e l l f o r m e d ”,也就是符合規(guī)則的文件。對于不符合規(guī)則的x m l 文件,解析 器會拒絕處理這樣的文件。 2 x m l 三要素 雖然x m l 有許多部分,但是只需要了解其中的三個就可以了解它是怎樣工 作的。它們是文檔類型定義d t d ,也就是x m l 的布局語言;可擴展的樣式語 言x s l ,也就是x m l 的樣式表語言;可擴展鏈接語言x l l 。 ( 1 ) 文檔類型定義介紹 d t d 規(guī)定文檔的邏輯結(jié)構(gòu)。它可以定義文檔的語法,而文檔的語法反過來 能夠讓x m l 語法分析程序確認某張頁面標記使用的合法性。d t d 定義頁面的 元素、元素的屬性以及元素和屬性之間的關(guān)系。 s c h e m a 是伴隨著x m l l 0 規(guī)范的制訂而推出的。x m ls c h e m a 是d t d 之 后第二代用來描述x m l 文件的標準。是用來對x m l 進行文檔類型定義的語言, 用來規(guī)定x m l 文檔的數(shù)據(jù)類型及組織方式,同時還是豐富的元數(shù)據(jù)資源。x m l 9 第二章相關(guān)技術(shù) s c h e m a 擁有許多類似d t d 的準則,但又要比d t d 更為強大一些【1 3 1 。 ( 2 ) 可擴展的樣式語言介紹 x s l 是用于規(guī)定x m l 文檔樣式的語言。x s l 能使w e b 瀏覽器改變文檔的 表示法【1 4 】。x s l 能使w e b 瀏覽器直接根據(jù)用戶的不同需求改變文檔的顯示法。 例如,不需要與服務(wù)器進行交互通信,就可以改變數(shù)據(jù)的顯示順序。通過變換 樣式表,可以展開或折疊文檔。基于x m l 的網(wǎng)站除了運行速度更快、更易使用 外,而且對用戶也是透明的。 解析x m l 文檔,就不得不對x s l 進行處理。這是因為x s l 是x m l 的樣 式表語言,定義了x m l 的語法規(guī)范。一個x s l 樣式表集合了一系列設(shè)計規(guī)則, 用于從x m l 文件中抽取信息,并將其轉(zhuǎn)換成h t m l 、x m l 或其它格式的文檔。 ( 3 ) 可擴展鏈接語言介紹 x l l 支持目前w e b 上己有的簡單鏈接,并且將進一步擴展鏈接,包括結(jié)束 死鏈接的間接鏈接以及可以從服務(wù)器中僅查詢某個元素的相關(guān)部分的連接符 “ ”。 3 x m l 解析器 簡單來講,一個x m l 解析器就是一段可以讀入x m l 文檔并分析其結(jié)構(gòu)的 代碼。目前,廣泛使用的解析器主要有:m m 公司的x m l 4 j ,m i c r o s o f t 公司的 m s x m l ,o r a c l e 公司的x m lp a r s e rf o rj a v a 和s u n 公司的p r o j e c tx 。就針對 x m l 標準的支持程序而言,其中當屬s u n 公司的解析器表現(xiàn)最為出色。 j a v a 為解析及轉(zhuǎn)換x m l 文檔提供了一套標準的a p i 。該a p i 的設(shè)計獨立于 任何特定的x m l 處理器實現(xiàn)。2 0 0 2 年夏天s u n 發(fā)布了j a v ax m l 包。其中包 括了x e r c e s 2 的參考版,將其作為它的默認x m l 解析器,并且將x a l a n 作為它 的默認x s l t 引擎。 ( 1 ) s a x 解析器 s a x 是一個基于事件的x m l 文檔解析標準。與a w t 中的事件驅(qū)動機制相 類似,s a x 通過事件驅(qū)動來識別x m l 文檔的內(nèi)容,即當它在x m l 文檔中發(fā)現(xiàn) 特殊符號時,它就會觸發(fā)相關(guān)的事件。由于s a x 的這一特性,使應(yīng)用程序開發(fā) 人員可以在相應(yīng)的事件中寫入特定的處理代碼。 s a x 以序列的形式處理文檔,不需要在內(nèi)存中建立整個文檔的樹型結(jié)構(gòu), 因此與d o m 相比,s a x 對內(nèi)存的需求要少得多,可認為是一個輕量級的接口 集合。圖2 1 是s a x 解析x m l 文檔的流程。 1 0 第二章相關(guān)技術(shù) x m l 文 卜_ 弋竺) - s a x 事件 j 應(yīng)用程序 檔報告 j壙 圖2 1s a x 解析x m l 文檔流程 ( 2 ) d o m 解析器 d o m 是w 3 c 發(fā)展的瀏覽x m l 文檔的一種標準a p i ,其不僅提供了對存儲 在內(nèi)存中的x m l 文檔的一個完整表示,也提供了隨機訪問整個文檔的方法。因 此,可將d o m 看作為一個標準的連接文檔和應(yīng)用程序或腳本語言的結(jié)構(gòu)體系, d o m 提供給用戶一個接口以裝載、定位、操作和序列化x m l 文檔。如圖2 2 所示,c s s 是級聯(lián)樣式單,儲存并控制元素的顯示樣式,例如字體、顏色等; s c r i p t 腳本控制元素如何動作,例如利用條件控制語句對元素進行不同的操作 等;而d o m 則作為腳本和對象的通信平臺,并將結(jié)果提交給瀏覽器。 圖2 2d o m 解析x m l 文檔流程 通過d o m ,用戶能夠把文檔看成是一個有結(jié)構(gòu)的信息樹,而不僅僅是簡單 的文本流。這樣應(yīng)用程序或腳本即使不知道x m l 的語義細節(jié)也能夠方便的操作 結(jié)構(gòu)。d o m 包含兩個關(guān)鍵的抽象:一是樹狀層次,二是表示文檔內(nèi)容和結(jié)構(gòu)的 節(jié)點集合。樹狀層次包括了所有這些節(jié)點,節(jié)點本身也可以包含其它的節(jié)點, 這就使得開發(fā)人員能夠通過這個層次結(jié)構(gòu)找到并修改特定節(jié)點的信息。d o m 把 節(jié)點看成是一個通常的對象,這樣就有可能創(chuàng)建一個腳本來裝載一個文檔,然 后遍歷所有的節(jié)點,顯示感興趣的節(jié)點的信息。 ( 3 ) s a x 和d o m 的比較 第二章相關(guān)技術(shù) d o m 操作x m l 文檔時,首先讀取該文檔,然后將其分割成單個的對象( 例 如元素、屬性、注釋等) ,再在內(nèi)存中創(chuàng)建一個關(guān)于該文檔的樹結(jié)構(gòu)。d o m 解 析方式使得開發(fā)人員能夠反復(fù)使用該文檔信息,但當文檔很大時,所需消耗的 內(nèi)存空間就非??捎^。而s a x 不會因為x m l 文檔尺寸的增大而增加到內(nèi)存的 需求,因此其對內(nèi)存的需求比d o m 小得多。然而,正因為s a x 解析器沒有將 整個文檔存放到內(nèi)存中,因此其不能隨機的定位到文檔的特定部分,也不能實 現(xiàn)復(fù)雜的搜索。開發(fā)人員在處理過程中也必須按順序處理信息。s a x 允許用戶 在任何時候終止對x m l 文檔的解析,這使得處理文檔的部分信息成為可能。在 得到某些特定信息后,就可終止解析。這一特性使得系統(tǒng)資源得到極大的優(yōu)化 1 5 1 1 6 。 2 1 3x m l 的應(yīng)用 作為互聯(lián)網(wǎng)的新技術(shù),x m l 的應(yīng)用非常廣泛,滲透了各行各業(yè),歸納起來 可分為四類: 。 ( 1 ) 客戶需要與不同的數(shù)據(jù)源進行交互 應(yīng)用于客戶需要與不同的數(shù)據(jù)源進行交互時。數(shù)據(jù)可能來自不同的數(shù)據(jù)庫, 他們都有各自不同的復(fù)雜格式。但客戶與這些數(shù)據(jù)庫間只通過一種標準語言進 行交互,那就是x m l 。由于x m l 的自定義性及可擴展性,它足以表達各種類 型的數(shù)據(jù)??蛻羰盏綌?shù)據(jù)后可以進行處理,也可以在不同數(shù)據(jù)庫間進行傳遞。 總之,在這類應(yīng)用中,x m l 解決了數(shù)據(jù)的統(tǒng)一接口問題。但是,與其他的數(shù)據(jù) 傳遞標準不同的是,x m l 并沒有定義數(shù)據(jù)文件中數(shù)據(jù)出現(xiàn)的具體規(guī)范,而是在 數(shù)據(jù)中附加t a g 來表達數(shù)據(jù)的邏輯結(jié)構(gòu)和含義。這使x m l 成為一種程序能自動 理解的規(guī)范。 ( 2 ) 將大量運算負荷分布在客戶端 應(yīng)用于將大量運算負荷分布在客戶端,即客戶可根據(jù)自己的需求選擇和制 作不同的應(yīng)用程序以處理數(shù)據(jù),而服務(wù)器只須發(fā)出同一個x m l 文件。如果按傳 統(tǒng)的“客戶服務(wù)器工作方式,客戶向服務(wù)器發(fā)出不同的請求,服務(wù)器分別予 以響應(yīng),這不僅加重服務(wù)器本身的負荷,而且網(wǎng)絡(luò)管理者還須事先調(diào)查各種不 同的用戶需求以做出相應(yīng)不同的程序,但假如用戶的需求繁雜而多變,則仍然 將所有業(yè)務(wù)邏輯集中在服務(wù)器端是不合適的,因為服務(wù)器端的編程人員可能來 不及滿足眾多的應(yīng)用需求,也來不及跟上需求的變化,雙方都很被動。應(yīng)用x m l 1 2 第二章相關(guān)技術(shù) 則將處理數(shù)據(jù)的主動權(quán)交給了客戶,服務(wù)器所作的只是盡可能完善、準確地將 數(shù)據(jù)封裝進x m l 文件中,正是各取所需、各司其職。x m l 的自解釋性使客戶 端在收到數(shù)據(jù)的同時也理解數(shù)據(jù)的邏輯結(jié)構(gòu)與含義,從而使廣泛、通用的分布 式計算成為可能i l7 1 。 ( 3 ) 將同一數(shù)據(jù)以不同的面貌展現(xiàn)給不同的用戶 應(yīng)用于將同一數(shù)據(jù)以不同的面貌展現(xiàn)給不同的用戶。它類似于同一個劇本, 我們可以用電視劇、電影、話劇、動畫片等不同形式表現(xiàn)出來。這一應(yīng)用將會 為網(wǎng)絡(luò)用戶界面?zhèn)€性化、風格化的發(fā)展鋪平道路。 ( 4 ) 應(yīng)用于網(wǎng)絡(luò)代理 應(yīng)用于網(wǎng)絡(luò)代理對所取得的信息進行編輯、增減以適應(yīng)個人用戶的需要。 有些客戶取得數(shù)據(jù)并不是為了直接使用而是為了根據(jù)需要組織自己的數(shù)據(jù)庫。 例如,教育部建立一個龐大的題庫,考試時將題庫中的題目取出若干組成試卷, 再將試卷封裝進x m l 文件,接下來便是最精彩部分,在各個學校讓其通過一個 過濾器,濾掉所有的答案,再發(fā)送到各個考生面
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- GB/T 43710-2025科學數(shù)據(jù)安全審計要求
- 養(yǎng)殖庫房出售合同范本
- 單位鍋爐人員合同范本
- 個體工商合同范本
- 專業(yè)白蟻防治服務(wù)合同范本
- 養(yǎng)老機構(gòu)銷售合同范本
- 醫(yī)療設(shè)備議標合同范本
- 化工鋼材采購合同范例
- 介紹費協(xié)議合同范本
- 勞務(wù)派遣合同勞動合同范本
- 《綠色建筑設(shè)計原理》課件
- 中醫(yī)館裝修合同范本
- 光伏電站小EPC規(guī)定合同范本
- 2024年01月江蘇2024年昆山鹿城村鎮(zhèn)銀行第三期校園招考筆試歷年參考題庫附帶答案詳解
- 《直播銷售》課件-項目一 認識直播與直播銷售
- 建筑工程安全與管理
- 2025年南京科技職業(yè)學院高職單招數(shù)學歷年(2016-2024)頻考點試題含答案解析
- 2025年內(nèi)蒙古機電職業(yè)技術(shù)學院高職單招職業(yè)技能測試近5年??及鎱⒖碱}庫含答案解析
- 2024年05月齊魯銀行總行2024年社會招考筆試歷年參考題庫附帶答案詳解
- 浙江省紹興市2024-2025學年高一上學期期末調(diào)測英語試題(無答案)
- 幼兒園開學教師安全知識培訓(xùn)
評論
0/150
提交評論