




已閱讀5頁,還剩53頁未讀, 繼續(xù)免費(fèi)閱讀
(論文)XML+DTD到關(guān)系模式的映射研究.pdf 免費(fèi)下載
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
四川師范大學(xué) 碩士學(xué)位論文 XML DTD到關(guān)系模式的映射研究 姓名:于光 申請學(xué)位級別:碩士 專業(yè):計(jì)算機(jī)軟件與理論 指導(dǎo)教師:楊春 20060405 刪J IJ 師范大學(xué)碩I i 學(xué)位論文 X M L D T D 到關(guān)系模式的映射研究 計(jì)算機(jī)軟件與理論專業(yè) 研究生于光指導(dǎo)教師楊春 可擴(kuò)展標(biāo)記語言( e X t e n s i b l eM a r k u pL a n g u a g e ,簡稱X M L ) 是一門新興的 面向l n i e r n e l 應(yīng)用的標(biāo)記語言,目前己迅速發(fā)展成為w e b 和數(shù)據(jù)交換的一種新 標(biāo)準(zhǔn)。X M L 數(shù)據(jù)的海量出現(xiàn)使得如何有效地對X M L 數(shù)據(jù)進(jìn)行存儲和管理成為 研究熱點(diǎn)。利用現(xiàn)有關(guān)系數(shù)據(jù)庫的存儲管理、并發(fā)控制、恢復(fù)、版本機(jī)制等技 術(shù)可以有效地存儲和管理X M L 數(shù)據(jù)。 本文首先介紹了X M L 的相關(guān)技術(shù)領(lǐng)域,對X M L 文檔的各種存儲方法作了 一些簡要比較,并著重研究了X M LD T D 到關(guān)系模式的映射。通過分析有關(guān) X M L 關(guān)系存儲的經(jīng)典算法可以發(fā)現(xiàn),現(xiàn)有的X M L 到關(guān)系數(shù)據(jù)庫的映射算法大 多J I 考慮內(nèi)容和結(jié)構(gòu)的映射,而很少考慮X M L 所蘊(yùn)含的語義。然而語義信息 刈。卜數(shù)據(jù)的存儲模式設(shè)計(jì)、查詢優(yōu)化和更新異常檢查等問題是十分重要的,因 f J l “ 女H 果D T D 中蘊(yùn)含函數(shù)依賴,在進(jìn)行映射時(shí)予以考慮可以帶來很多便利。 本文試圖提出一種保持函數(shù)依賴的映射策略,在進(jìn)行內(nèi)容和結(jié)構(gòu)映射的同 時(shí)保持函數(shù)依賴。依據(jù)X M L 函數(shù)依賴定義,找出D T D 中所蘊(yùn)含的函數(shù)依賴, 撮終利用改進(jìn)的內(nèi)嵌算法F D - - l n l i n i n g 實(shí)現(xiàn)了從X M L 到關(guān)系數(shù)據(jù)庫的保持函 數(shù)依賴的映射。F D - - l n l i n i n g 方法不僅考慮了D T D 的內(nèi)容和結(jié)構(gòu)還考慮了 D T D 所蘊(yùn)含的函數(shù)依賴,對D T D 中蘊(yùn)含的其它語義約束也進(jìn)行了分析,給出 了保持部分語義約束的方法。最后對本映射策略的完整性進(jìn)行了分析。 關(guān)鍵詞:X M L :D T D :函數(shù)依賴:語義;映射:關(guān)系 四川師范大學(xué)碩士學(xué)位論文 A B S T R A C T X M U e X t e n s i b l eM a r k u pL a n g u a g e ) i s an e wm a r k u pl a n g u a g ef o ri n t e r n e t a p p l i c a t i o n ,a n dn o w i t so n eo ft h en e ws t a n d a r d so fw e ba n dd a t ae x c h a n g e A l o n g w i t ht h em a s s p r o d u c i n go fX M L d a t a ,h o wt os t o r ea n dm a n a g et h eX M L d a t a e f f i c i e n t l yb e c o m e sah o t s p o ti nt h es t u d yo fX M Ls t o r a g es t r a t e g y T e c h n o l o g yo f s t o r a g ea n dm a n a g e m e n t ,p a r a l l e lc o n t r o l ,r e c o v e r y , a n dv e r s i o nm e c h a n i s mo ft h e e x i s t i n gr e l a t i o nd a t a b a s ec a nb eu s e dt oe f f i c i e n t l ys t o r ea n dm a n a g eX M L d a t a I n t h i st h e s i s ,f i e l dr e l a t e dt oX M Lw a si n t r o d u c e da tf i r s t ,t h e nt h ee x i s t i n g s t o r a g es t r a t e g i e sw e r ec o m p a r e d ,a n da tl a s tt h em a p p i n go fX M L D T Dt or e l a t i o n a l s c h e m aw a sd i s c u s s e di np a r t i c u l a r I ng e n e r a ls t o r a g es t r a t e g i e so fX M L d a t a ,o n l y c o n t e n t sa n ds t r u c t u r e so fX M Ld a t aw e r ec o n s i d e r e d ,w i t ht h es e m a n t i ci n f o r m a t i o n n e g l e c t e d H o w e v e r , s e m a n t i ci n f o r m a t i o no fX M L d a t ai so fm u c hs i g n i f i c a n c ef o r d e s i g no fs t o r a g ep a t t e r n ,q u e r yo p t i m i z i n ga n da b n o r m i t yc h e c k i n gi nu p d a t i n g i f t h e r ei ss o m ef u n c t i o n a l d e p e n d e n c e i n D T D ,m a p p i n gw i t hc o n s i d e r i n g t h e f u n c l i o n a ld e p e n d e n c em a yb r i n gm u c hc o n v e n i e n c e W et r i e dt Op r o v i d eam a p p i n gs t r a t e g yw i t hf u n c t i o n a ld e p e n d e n c yp r e s e r v e d i nt h i st h e s i s A c c o r d i n gt Ot h ed e f i n i t i o no fX M Lf u n c t i o n a ld e p e n d e n c yc o n t a i n e d i nD T Dw a sf o u n do u t ,a n dm o d i f i e di n l i n i n gs t r a t e g y ( F D - i n l i n i n g ) w a sa d o p t e dt o m a pX M L t or e l a t i o n a ls c h e m a F o rF D i n l i n i n g ,n o to n l yt h ec o n t e n ta n ds t r u c t u r e , b u ta l s oI h ef u n c t i o n a l d e p e n d e n c yo fD T Dw e r ec o n s i d e r e d O t h e r s e m a n t i c i n f o r m a t i o nc o n t a i n e di nD T Dw a sa l s oa n a l y z e d ,a n dm e t h o dt op r e s e r v es e m a n t i c r e s t r i c t i o nw a sp r o v i d e da sw e l l F i n a l l y ,i n t e g r i t yo ft h em a p p i n gs t r a t e g yh a d b e e n e v a l I I a l e d K e y w o r d s :X M L ;D T D ;f u n c t i o n a ld e p e n d e n c y ;s e m a n t i c s ;m a p p i n g ;r e l a t i o n a l s c h e m a 拉! J 川帥范大學(xué)碩士學(xué)位論文 1 前言 1 1 問題的提出及其研究意義 隨著I n t e r n e t 的高速發(fā)展,人們要求對I n t e m e t 上的數(shù)據(jù)進(jìn)行深層次的處 理。而現(xiàn)有的H T M L 語言的局限性越來越明顯地暴露出來,它不具備大規(guī)模 W E B 應(yīng)用所需的可擴(kuò)展性、結(jié)構(gòu)化等特性。于是,一種新型的標(biāo)記語言X M L 應(yīng)運(yùn)而生。X M L ( e X t e n s i b l eM a r k u pL a n g u a g e 可擴(kuò)展標(biāo)記語言) 是W 3 C ( W o r l d W i d eW e bC o n s o r t i u m 互聯(lián)網(wǎng)聯(lián)盟) 提出的一套用于W e b 網(wǎng)絡(luò)上的數(shù)據(jù)和文檔 結(jié)構(gòu)的通用標(biāo)記語言。X M L 能實(shí)現(xiàn)平臺無關(guān)性,即與數(shù)據(jù)的存儲平臺無關(guān),與 表示數(shù)據(jù)的模型無關(guān),使得X M L 成為一種很好的數(shù)據(jù)交換格式。W 3 C 的原意 足用X M L 來解決H T M L 信息的不確定性和網(wǎng)站之間的數(shù)據(jù)交流問題,但隨著 它的應(yīng)用深入,特別是與J a v a 語言相結(jié)合,在軟件開發(fā)、網(wǎng)站運(yùn)營、移動互聯(lián) 等方面逐漸呈現(xiàn)出它的優(yōu)秀性能。盡管超文本標(biāo)記語言( H T M L ) 是目前創(chuàng)建 W e b 頁最常用的語言,但是H T M L 在保存信息方面的能力很有限。與之相反, X M L 卻有著巨大的伸縮性與靈活性,它具有極其靈活的語法,允許真實(shí)地描述 各種類型的信息。可擴(kuò)展標(biāo)記語言X M L 將逐漸取代H T M L 而成為互聯(lián)上的主 要表示和交換工具。 隨著X M L 數(shù)掘的海量出現(xiàn),如何有效地存儲和查詢這些X M L 數(shù)據(jù)就成為 目前值得研究的一個(gè)重要問題。數(shù)據(jù)庫系統(tǒng)具有強(qiáng)大的數(shù)據(jù)操作和處理能力, 特別足關(guān)系數(shù)據(jù)庫技術(shù)已經(jīng)相當(dāng)成熟,應(yīng)用也極其廣泛,是目前的主流。把關(guān) 系數(shù)據(jù)庫強(qiáng)大的數(shù)據(jù)操縱能力以與X M L 強(qiáng)大的數(shù)據(jù)表達(dá)能力相結(jié)合是存儲管 理X M L 數(shù)據(jù)一種切實(shí)可行又很有前景的方式。相對于關(guān)系數(shù)據(jù)庫中用平面關(guān) 系表來存儲數(shù)據(jù)來曉,X M L 文檔是一種比較復(fù)雜的樹型結(jié)構(gòu),而且關(guān)系數(shù)據(jù)庫 也不能很好的支持X M L 中的一些本質(zhì)關(guān)系,如層次、順序、包含等。同時(shí)X M L 還蘊(yùn)涵很多語義,特別是數(shù)據(jù)依賴,在映射時(shí)也要予以考慮。因此,怎樣在關(guān) 系數(shù)據(jù)庫中有效的存儲X M L 文檔,既能保持X M L 文檔的內(nèi)容和結(jié)構(gòu),又能保 持其語義約束特別是函數(shù)依賴成為一個(gè)難題。 許多大的數(shù)據(jù)庫廠商都將它們的視線轉(zhuǎn)移到X M L 上,并宣稱在它們的新 產(chǎn)品中提供對X M L 技術(shù)的支持。O r a c l e 早在1 9 9 9 年就率先推出支持X M L 的 產(chǎn)品。雖然目前已經(jīng)出現(xiàn)了各種支持X M L 的數(shù)據(jù)庫產(chǎn)品,但是關(guān)系型數(shù)據(jù)庫 不能很好地支持結(jié)構(gòu)化置標(biāo)語言中一些本質(zhì)的關(guān)系( 如層次、順序和包含等) , 1 四川師范大學(xué)碩士學(xué)位論文 所以在丌發(fā)中仍然存在很多問題。目前X M L 文檔的有效存儲還面臨許多困難 ( 如模式轉(zhuǎn)換、結(jié)構(gòu)變動和查詢效率等問題) ,對其圓滿解決還有很長的路要走。 1 2 國內(nèi)外的研究現(xiàn)狀 X M L 文檔數(shù)據(jù)屬于半結(jié)構(gòu)化數(shù)據(jù),將它存放在面向?qū)ο髷?shù)據(jù)庫或原生 X M L 數(shù)據(jù)庫中是非常自然的。但是,面向?qū)ο髷?shù)據(jù)庫、原生數(shù)據(jù)庫技術(shù)還不夠 成熟完善,限制了其應(yīng)用范圍。而采用關(guān)系數(shù)據(jù)庫存放X M L 文檔有幾個(gè)優(yōu)勢: 首先,同面向?qū)ο髷?shù)掘庫和原生X M L 數(shù)據(jù)庫相比,關(guān)系數(shù)據(jù)庫具有數(shù)據(jù)結(jié)構(gòu) 化、最低冗余度、較高的程序與數(shù)據(jù)獨(dú)立性、易于擴(kuò)充、易于編制應(yīng)用程序等 優(yōu)點(diǎn)。關(guān)系數(shù)據(jù)庫已經(jīng)相當(dāng)成熟,能夠提供對大量數(shù)據(jù)進(jìn)行高效存耿,是目前 最為流行的數(shù)據(jù)庫( 如S Q L S e r v e r 、D B 2 、o r a c l e 等都是第三代的關(guān)系數(shù)據(jù)庫) 。 如果X M L 數(shù)據(jù)也以關(guān)系的形式存放,利用關(guān)系數(shù)據(jù)庫現(xiàn)有的存儲管理、并發(fā) 控制、恢復(fù)、版本機(jī)制等技術(shù)可以有效地對數(shù)據(jù)進(jìn)行統(tǒng)一管理。利用關(guān)系數(shù)據(jù) 庫存儲X M L 數(shù)據(jù),以及如何充分發(fā)揮關(guān)系數(shù)據(jù)庫成熟的數(shù)據(jù)管理技術(shù)優(yōu)勢己 成為目前的研究熱點(diǎn)之一。 目前用關(guān)系數(shù)據(jù)庫存儲X M L 數(shù)據(jù)存在多種不同的方法,主要可分為獨(dú)立于 文檔的存儲方法和依賴于文檔的存儲方法。采用獨(dú)立于文檔的存儲方法,不需 要D r D ,但關(guān)系中存儲的數(shù)掘缺乏語義。典型的獨(dú)立于文檔的存儲方法如F l o r e c u 和K o s s m a n l 6J 提出的兩種將X M L 文檔映射為關(guān)系數(shù)據(jù)庫的E d g e 和B i n a r y 方法 及其6 個(gè)變種。依賴于文檔的存儲方法即基于D T D ( D o c u m e n tT y p eD e f i n i t i o n , 文檔類型定義) 的關(guān)系映射,利用這種方法得到關(guān)系模式具有一定的語義。典 型的依賴于文檔的存儲方法如文獻(xiàn) 7 中給出的將D T D 映射為關(guān)系模式的三種 方法:J 本內(nèi)聯(lián)技術(shù)、共享內(nèi)聯(lián)技術(shù)和混合內(nèi)聯(lián)技術(shù)。但在這些典型的映射算 法中很少考慮X M L 所蘊(yùn)涵的語義約束,特別是函數(shù)依賴。目前國內(nèi)在此領(lǐng)域 也基于以上依賴于文檔的方法進(jìn)行了一些有益的改進(jìn)1 4 。 1 _ 3 本研究的思路及方法 目前依賴于文檔的X M L 數(shù)據(jù)存儲方法主要基于X M LS c h e m a 與D T D ,S c h e m a 是D T D 的擴(kuò)展,X M LS c h e m a 雖然功能強(qiáng)大,但過于復(fù)雜,因此在實(shí)際應(yīng)用中D T D 是X M I 文檔使用最多和應(yīng)用最成熟的模式。 2 叫川I 師范大學(xué)碩上學(xué)位論文 通常X M L 存儲的是半結(jié)構(gòu)化數(shù)據(jù),要想存儲到關(guān)系數(shù)據(jù)庫中必須把它轉(zhuǎn)化為 符合關(guān)系數(shù)據(jù)庫的行一列結(jié)構(gòu)。除此以外,X M L 還蘊(yùn)含語義,現(xiàn)有的X M L :至I J 關(guān)系數(shù) 據(jù)庫的映射算法大多只考慮內(nèi)容和結(jié)構(gòu)的映射,很少考慮X M L 所蘊(yùn)含的語義,而 語義信息對數(shù)據(jù)的存儲模式設(shè)計(jì)、查詢優(yōu)化、更新異常檢查等來說是十分重要 的。如果D T D 中蘊(yùn)含函數(shù)依賴,則進(jìn)行映射時(shí)應(yīng)予以考慮。 本文提出一種保持函數(shù)依賴的X M LD T D 到關(guān)系模式的映射策略,首先根據(jù)參 考文獻(xiàn) 1 中基于D T D 的X M L 函數(shù)依賴的概念,找出D T D 中所蘊(yùn)涵的函數(shù)依賴, 然后對符合規(guī)則的元素應(yīng)用F D 1 n l i n i n g 方法進(jìn)行內(nèi)聯(lián)。最后分析D T D 中所蘊(yùn)涵 的語義約束,并對這些語義約束進(jìn)行處理,使得到的關(guān)系模式保持這些語義約 柬。 F D I n l i n i n g 方法在A b d e l a z i z : l J O a k a s h a 等人于2 0 0 5 年提出的新的內(nèi)聯(lián)方法 1 2 】基礎(chǔ)上進(jìn)行改進(jìn)得到,既保持了文檔內(nèi)容和結(jié)構(gòu),又保持T D T D 所蘊(yùn)涵的函 數(shù)依賴?,F(xiàn)有的算法一般是為每一個(gè)元素創(chuàng)建一個(gè)關(guān)系,這樣造成文檔碎片的 形成。F D l n l i n i n g 算法中只為符合下列條件的元素創(chuàng)建關(guān)系,并把( 0 ,1 ) 及 ( 1 ,1 ) 約束中子元素屬性,作為父元素的屬性看待,不為子元素創(chuàng)建關(guān)系。 從而盡量避免了文檔碎片的形成。 本文按以下章節(jié)進(jìn)行組織: 第一章為緒論,主要簡單介紹本課題的研究意義,國內(nèi)外的研究現(xiàn)狀以及 本課題的研究思路和研究方法等; 第二章為x M L 及其相關(guān)技術(shù),主要簡單介紹X M L 的基礎(chǔ)知識和X M L 的一 些相關(guān)技術(shù)規(guī)范: 第三章為X M L 文檔的存儲方法,詳細(xì)介紹了當(dāng)前已經(jīng)存在的X M L 的存儲方 法,著重介紹了基于關(guān)系的X M 疇儲的經(jīng)典方法; 第四章為保持函數(shù)依賴映射策略的設(shè)計(jì),提出了一種保持X M L 函數(shù)依賴的映 射策略,既保持了x M L 的內(nèi)容和結(jié)構(gòu),也保持了其所蘊(yùn)含的函數(shù)依賴。對X M L 中 的其它語義也進(jìn)行了分析并給出了映射方法,最后進(jìn)行了完整性分析,并與共 享內(nèi)聯(lián)方法進(jìn)行了比較: 第血章為基于X M L 的查詢,包括X M L 的查詢語言,將x M L 的查詢語言轉(zhuǎn) 換為基于關(guān)系的查詢語言S O L 的方法,以及查詢結(jié)果的返回,分析了基于關(guān)系 數(shù)據(jù)庫的X M L 查詢過程。 3 四川師范人學(xué)預(yù)士學(xué)位論文 2 X M L 及其相關(guān)技術(shù) W o r l dW i d eW e b 是最近幾年I n t e m e t 上最具生命力的一種應(yīng)用,由于它操 作簡單而又功能強(qiáng)大,不僅能夠傳輸文本數(shù)據(jù),而且可以進(jìn)行聲音、圖像、多 媒體等數(shù)據(jù)的傳輸,因此受到越來越多的用戶的喜愛。隨著W e b 文件變得越來 越大越復(fù)雜,W e b 內(nèi)容的提供商已經(jīng)開始感受到普通的H T M L ( 超文本標(biāo)記語 言) 已經(jīng)無法提供用于大規(guī)模商業(yè)出版所需要的擴(kuò)展性、結(jié)構(gòu)和數(shù)據(jù)檢查功能 以及文件數(shù)據(jù)傳輸能力。 為了滿足商業(yè)W e b 出版的需要,解決W e b 技術(shù)在新的頒布式文件處理領(lǐng) 域的應(yīng)用需求,W 3 C 開發(fā)了一種可擴(kuò)展的標(biāo)記語言,這就是X M L ,以用于那 些目前H T M L 無法滿足需求的應(yīng)用。 2 1X M L 的產(chǎn)生與發(fā)展 X M L 同H T M L 一樣,都來自S t a n d a r dG e n e r a l i z e dM a r k u pL a n g u a g e ,即標(biāo) 準(zhǔn)通用標(biāo)記語言,簡稱S G M L 。早在W e b 未發(fā)明之前,S G M L 就早已作為文檔 描述和輸出的標(biāo)記語言存在多年。它最先是為文本處理而設(shè)計(jì)的。S G M L 十分 龐大,既不容易學(xué),又不容易使用,在計(jì)算機(jī)上實(shí)現(xiàn)也十分困難。鑒于這些因 素,W e b 的發(fā)明者歐洲核子物理研究中心的研究人員根據(jù)當(dāng)時(shí)( 1 9 8 9 年1 計(jì)算機(jī)技術(shù)的能力,提出了H T M L 語言。H T M L 只使用S G M L 中很小一部分 標(biāo)記。為了便于在計(jì)算機(jī)上實(shí)現(xiàn),H T M L 規(guī)定的標(biāo)記是固定的,即H T M L 語法 是不可擴(kuò)展的,它可以不包含D T D ( 文檔類型定義) 。H T M L 這種固定的語法 使它簡單易學(xué),在計(jì)算機(jī)上丌發(fā)H T M L 的瀏覽器也十分容易。正是由于H T M L 的簡單性,使W e b 技術(shù)從計(jì)算機(jī)界走向全社會,走向千家萬戶,使W e b 的發(fā) 腱如同中天。I n t e r n e t 提供了世界范田內(nèi)網(wǎng)絡(luò)互連和通信功能,到目前為止,幾 乎所有的W e b 頁面都是用H T M L 編寫的。H T M L 簡單易學(xué)又通用,句法簡明 緊湊,加上其擴(kuò)充的表格、幀、腳本等功能,使它得以在W e b 主頁上大顯身手。 盡管H T M L 在人機(jī)界面方面很成功,但卻非常不利于機(jī)器之間的相互交流與信 息傳遞。其不足具體體現(xiàn)在難以擴(kuò)展、交互性差、語義性差以及單向的超鏈接 等方面。 X M L 和H T M L 一樣是S G M L 的一個(gè)優(yōu)化子集。X M L 是W 3 C 制定的用于 拙述數(shù)據(jù)文檔中數(shù)據(jù)的組織和安排結(jié)構(gòu)的語言。它類似于H T M L ,但X M L 關(guān) d 四川師范人學(xué)碗上學(xué)位論文 注的不是數(shù)掘在瀏覽器中如何布局和顯示,而是關(guān)注于怎么樣描述數(shù)據(jù)內(nèi)容的 組織和結(jié)構(gòu)以便數(shù)據(jù)在網(wǎng)絡(luò)上進(jìn)行交流和處理。 但是隨著W e b 應(yīng)用的越來越廣泛,H T M L 的弱點(diǎn)也越來越明顯了,主要包 括一下5 個(gè)方面。鏈路丟失后不能自動糾正;動態(tài)內(nèi)容需要下載的部件太 多;搜索時(shí)間長;H T M L 缺乏對雙字節(jié)或多國文字的支持;H T M L 的可 擴(kuò)展性差。 近年來,隨著W e b 的應(yīng)用越來越廣泛和深入,人們漸漸覺得H T M L 不夠 用了,H T M L 過于簡單的語法嚴(yán)重地阻礙了用它來表現(xiàn)復(fù)雜的形式。盡管H T M L 推出了一個(gè)又一個(gè)新版本,已經(jīng)有了腳本、表格、幀等功能,但始終滿足不了 不斷增長的需求。另一方面,這幾年來計(jì)算機(jī)技術(shù)的發(fā)展也十分迅速,己經(jīng)可 以實(shí)現(xiàn)更為復(fù)雜的W e b 瀏覽器,所以開發(fā)一種新的W e b 頁面語言既是必要的, 也是可行的。有人建議直接使用S G M L 作為W e b 語言,這固然能解決H T M L 遇到的I 蚓難。但是S G M L 太龐大了,用戶使用不方便。而且,要全面實(shí)現(xiàn)S G M L 的瀏覽器就非常困難,于是人們自然會想到僅僅使用S G M L 的子集,使新的語 言既方便使用又實(shí)現(xiàn)容易。正是在這種形勢下,W e b 標(biāo)準(zhǔn)化組織W 3 C 建議使 用一種精簡的S G M L 版本x M L 應(yīng)運(yùn)而生了。 2 2 X M L 的特性 X M L 的優(yōu)勢之一是它允許各個(gè)組織、個(gè)人建立適合自己需要的標(biāo)記集合, 并且這些標(biāo)記可以迅速地投入使用。這一特征使得X M L 可以在電子商務(wù)、政 府文檔、司法、出版、c A D c A M 、保險(xiǎn)機(jī)構(gòu)、廠商和中介組織信息交換等領(lǐng) 域中一展身手,針對不同的系統(tǒng)、廠商提供各具特色的獨(dú)立解決方案。X M L 的最大優(yōu)點(diǎn)在于它的數(shù)據(jù)存儲格式不受顯示格式的制約。一般來說,一篇文檔 包括三個(gè)要素:數(shù)據(jù)、結(jié)構(gòu)以及顯示方式。對于H T M L 來說,顯示方式內(nèi)嵌在 數(shù)捌t ,p ,這樣在創(chuàng)建文本時(shí),要時(shí)時(shí)考慮輸出格式,如果因?yàn)樾枨蟛煌枰?對同樣的內(nèi)容進(jìn)行不同風(fēng)格的顯示時(shí),要從頭創(chuàng)建一個(gè)全新的文檔,重復(fù)工作 量很大。此外H T M L 缺乏對數(shù)據(jù)結(jié)構(gòu)的描述,對于應(yīng)用程序理解文檔內(nèi)容、抽 取語義信息都有諸多不便。X M L 把文檔的三要素獨(dú)立開來,分別處理。首先把 顯示格式從數(shù)據(jù)內(nèi)容中獨(dú)立出來,保存在樣式單文件( S t y l eS h e e t ) 中,這樣如 果需要改變文檔的顯示方式,只要修改樣式單文件就行了。X M L 的自我描述性 E 四J I l 師范人學(xué)碩士學(xué)位論文 質(zhì)能夠很好地表現(xiàn)許多復(fù)雜的數(shù)掘關(guān)系,使得基于X M L 的應(yīng)用程序可以在 X M L 文件中準(zhǔn)確高效地搜索相關(guān)的數(shù)據(jù)內(nèi)容,忽略其他不相關(guān)部分。X M L 還 有其他許多優(yōu)點(diǎn),比如它有利于不同系統(tǒng)之間的信息交流,完全可以充當(dāng)網(wǎng)際 語言,并有希望成為數(shù)據(jù)和文檔交換的標(biāo)準(zhǔn)機(jī)制??傮w說來,X M L 主要具有以 下一些重要特性: 第一,可擴(kuò)展性。X M L 讓使用者創(chuàng)建和使用他們自己的標(biāo)記而不是H T M L 的有限詞匯表,可擴(kuò)展性是至關(guān)重要的,企業(yè)可以為電子商務(wù)和供應(yīng)鏈集成等 應(yīng)用X M L 定義自己的標(biāo)已語言,甚至特定的行業(yè)也可以一起來定義該領(lǐng)域的 特殊的標(biāo)記語言作為該領(lǐng)域信息共享與數(shù)據(jù)交換的基礎(chǔ)。 第二,靈活性。X M L 提供了一種結(jié)構(gòu)化的數(shù)據(jù)表示方式,使得用戶界面 分離于結(jié)構(gòu)化數(shù)據(jù)。在X M L 中可以使用樣式表如X S U e X t e n s i b l eS t y l e s h e e t L a n g u a g e ,擴(kuò)展樣式表語言) 、C S S 2 ( C a s c a d i n gS t y l eS h e e t sL e v e l2 ,層疊樣式 表第2 進(jìn)階) 將數(shù)據(jù)呈現(xiàn)到瀏覽器中。 第三,自描述性。X M L 文檔通常包含一個(gè)文檔類型聲明,因而文檔是自描 述的,不僅人能讀懂X M L 文檔,計(jì)算機(jī)也能處理。X M L 文檔中的數(shù)據(jù)可以被 任何能夠?qū) M L 數(shù)據(jù)進(jìn)行解析的應(yīng)用所提取、分析、處理,并以所需格式顯 示,X M L 表示數(shù)據(jù)的方式真正做到了獨(dú)立予應(yīng)用系統(tǒng)并且這些數(shù)據(jù)能重復(fù)使 用。 第四,簡明性。X M L 只有S G M L 約2 0 的復(fù)雜性,但具有S G M L 約8 0 的功能。同完整S G M L 的相比,X M L 簡單得多、易學(xué)、易用,并且易實(shí)現(xiàn)。 第五,結(jié)構(gòu)化。H T M I 。不支持表達(dá)數(shù)據(jù)庫結(jié)構(gòu)或面向?qū)ο蟮姆旨壗Y(jié)構(gòu)所需 要的深層結(jié)構(gòu),X M L 至少是結(jié)構(gòu)化的。在結(jié)構(gòu)化信息的組成要素中D T D 或X M L S c h e m a 是一個(gè)很重要的組成部分。它規(guī)定了資料的格式規(guī)范并且用這種規(guī)范來 剝資料進(jìn)行解釋。X M L 自帶一個(gè)X M L 語法分析器。語法分析器使用D T D 或 S c h e m a 米確定一個(gè)文件是否是有效的或結(jié)構(gòu)化的。結(jié)構(gòu)化信息的優(yōu)點(diǎn)是允許不 同倍式的資料可以相互交換。用戶可以使用結(jié)構(gòu)化X M L 文件作為一種中介體 實(shí)現(xiàn)兩種數(shù)掘庫之間的靈活轉(zhuǎn)換。 第六,交互性。據(jù)W 3 C 的X M L 工作組主席J o nB o s a k 稱:用戶需要同 W e b 上的應(yīng)用交互操作,以及這種通過H T M L 很難實(shí)現(xiàn)的交互就是為什么X M L 需要存在的重要的原因。X M L 支持交互性,用戶可以自己制訂和設(shè)計(jì)應(yīng)用X M L 6 四川師范大學(xué)碩士學(xué)位論文 的文件格式,而不必須在使用固定的H T M L 格式,能得到比H T M L 更豐富的 語法和更多的功能。 第七,語義性強(qiáng)。X M L 可以自行設(shè)計(jì)有意義的標(biāo)記便于異構(gòu)系統(tǒng)之間的數(shù) 據(jù)交換和信息檢索。實(shí)現(xiàn)機(jī)器與機(jī)器之間的信息交換。 第八,純文本。幾乎任何工具都可以創(chuàng)建和編輯X M L ,使得程序可以更簡 單讀寫它。從而提供了從小配置文件到企業(yè)級數(shù)據(jù)倉庫的可擴(kuò)展性。 第九,可格式化??蓴U(kuò)展樣式語言X S L 可以指定如何顯示數(shù)據(jù)。數(shù)掘和顯 示分離。可以為同一數(shù)據(jù)指定不同的樣式表用于不同的輸出。 第十,很強(qiáng)的連接能力。X l i n k 可以定義雙向連接,多目標(biāo)連接,擴(kuò)展連 接和兩個(gè)文檔之I B J 的連接。 第十一,與平臺無關(guān)。X M L 對格式的定義嚴(yán)格,具有層次結(jié)構(gòu)而且與廠商 和平臺無關(guān),X M L 文檔可無須任何更改直接移植到其他平臺上。 當(dāng)然,X M L 作為一個(gè)新建立的標(biāo)準(zhǔn),還有許多不足之處:它在強(qiáng)調(diào)了數(shù)據(jù) 結(jié)構(gòu)的同時(shí),語義表達(dá)能力上略顯不足。另外,X M L 的有些技術(shù)尚未形成統(tǒng)一 的標(biāo)準(zhǔn),充分支持X M L 的應(yīng)用處理程序還不多,甚至瀏覽器對X M L 的支持也 是有限的。盡管如此,我們?nèi)匀豢梢灶A(yù)言,隨著人們對X M L 認(rèn)識的逐漸深入, X M L 必將成為網(wǎng)絡(luò)技術(shù)不可缺少的一員。 2 3X M L 模式語言 X M L 模式語言就是用來定義X M L 的詞匯表和文檔結(jié)構(gòu)的語言。X M L 的 一系列特性如可擴(kuò)展性、結(jié)構(gòu)化和自描述性等都要用X M L 模式定義語言來體 現(xiàn)。X M L 文檔本身可以看作是數(shù)據(jù)庫中的數(shù)據(jù)區(qū),X M L 模式可以看成是數(shù)據(jù) 庫模式。把X M L 映射到關(guān)系數(shù)據(jù)庫時(shí),就是把X M L 文檔的模式映射為關(guān)系數(shù) 據(jù)庫中的關(guān)系模式。然后把X M L 文檔存儲到關(guān)系數(shù)據(jù)庫的表中。所以我們必 須熟悉X M L 模式定義語言。X M L 模式定義語言有X M L D a t a 、文檔內(nèi)容描述 ( D C D ) 、面向?qū)ο蟮腦 M L 模式( S O X ) 、文檔類型定義( D T D ) 、X M L 大綱 ( X M L S c h e m a ) 等。后兩種模式定義語言是W 3 C 所推薦的標(biāo)準(zhǔn),下文將予以 詳細(xì)介紹。 2 3 1 文檔類型定義( D T D ) 四川師范大學(xué)碩士學(xué)位論文 首先,文檔類型定義是從S G M L 繼承過來的,是W 3 C 委員會推薦的X M L 模式定義語言之一,是目前用的最多的X M L 模式定義語言,其它定義可以看 作對它的替代和擴(kuò)展。 X M L l 0 提供了一種機(jī)制文檔類型定義給你定義自己的詞匯表,并將 D T D 作為規(guī)范的一部分。D T D 使用正規(guī)的語法來定義X M L 文檔的結(jié)構(gòu)和允許 值以上下文文法無關(guān)的方式描述文檔中元素和屬性問的嵌套關(guān)系,使用t ( 表 示0 個(gè)或多個(gè)) ,+ ( 表示1 或多個(gè)) ,? ( 表示0 個(gè)或1 個(gè)) 和I ( 表示選擇) 等操作符描述元素和子元素間的關(guān)系。D T D 描述中的所有值均被假定為字符 串,除非由關(guān)鍵字A N Y 定義( 此時(shí),值類型可以是任意的文檔片段) 。一個(gè)元 素可以由多個(gè)子元素或?qū)傩詠矶x。其中,I D 和I D R E F 是兩種特殊的屬性類 型。一個(gè)元素至多只能有一個(gè)I D 屬性,而一個(gè)I D 屬性唯一標(biāo)識了一個(gè)元素, 一個(gè)元素的I D 屬性可以被同一文檔中的另一個(gè)元素的I D R E F 屬性引用。I D R E F 屬性沒有類型。D T D 描述中沒有根的模仿,符合于一個(gè)D T D 描述的X M L 文 檔的要結(jié)點(diǎn)可以為D T D 中的任意一個(gè)元素。下面用D T D 描述的一個(gè)簡單的例 子。 D T D 樣例定義了一個(gè)實(shí)驗(yàn)室的文檔類型。一個(gè)l a b o r a t o r y 元素有一個(gè)子元 R 心川I 幣范火學(xué)碩士學(xué)位論文 素l a b n a m e :0 或多個(gè)子元素m e m b e r 。一個(gè)p r o j e c t 有一個(gè)子元素p r o j n a m e :0 或多個(gè)m e m b e r :0 或多個(gè)p u b l i c a t i o n 子元素。M e m b e r 由一個(gè)子元素n a m e :0 個(gè)或一個(gè)e m a i l ;0 或多個(gè)p u b l i c a t i o n ;0 或多個(gè)p r o j e c t 子元素和m e m b e r l D 屬 性構(gòu)成。這里的m e m b e r l D 屬性由關(guān)鍵字# R E Q U I R E 描述,表示每一個(gè)m e m b e r 必須有一個(gè)m e m b e r l D 屬性。P u b l i c a t i o n 又由0 或多個(gè)a u t h o r ,一個(gè)t i t l e 和一個(gè) y e a r 子元素定義。期貨元素都為原子元素,被定義為文本串# P C D A T A 。關(guān)于 X M L 和D T D 規(guī)范的詳細(xì)描述見W 3 C 的相關(guān)標(biāo)準(zhǔn)( h t t p :w w w w 3 c o r g X M L ) 。 2 32X M LS c h e m a W 3 CX M L 模式工作組在1 9 9 9 年1 2 月1 7 日約定了兩部分關(guān)于X M L 模式 的工作草案。它們用X M L 語法寫成,允許使用多個(gè)命名空間,它提供強(qiáng)大的 內(nèi)容分類。而且它們是X M L l 0D T D 功能的超集。1 9 9 9 年1 2 月1 7 日的工作 草案被分成兩部分:結(jié)構(gòu)和數(shù)據(jù)類型。 1 結(jié)構(gòu)部分 處理元素和屬性的描述和聲明。那里提供的材料允許X M L 設(shè)計(jì)者指定復(fù) 雜的元素結(jié)構(gòu)及設(shè)定這些元素內(nèi)容數(shù)值的約束。這些描述部分可以在 h ! 地;! 型型:型3 1 :! ! g 衛(wèi)B 叢墮! ! ! h 墮i :! f 上找到。 我們能用D T D 定義的每一件事在X M L 模式的結(jié)構(gòu)部分得到了解釋。X M L 模式是由X M L 語法寫成,結(jié)構(gòu)是指我們能用來定義標(biāo)記的X M L 命令。當(dāng)然, 這意味著X M L 模式實(shí)際上只是X M L 的另一個(gè)應(yīng)用( 一個(gè)為了定義X M L 文檔 類的詞匯表) ,并且正是如此而擁有了一個(gè)模式可以來描述它自己。 于是規(guī)范的結(jié)構(gòu)部分是定義模式的元素和屬性出現(xiàn)的地方。更重要的是, 元素的內(nèi)容模型在這里得到描述。內(nèi)容模型明確的描述了允許的元素內(nèi)部結(jié)構(gòu), - - - ;f d 是X M L 模式的核心。 2 編寫模式 一個(gè)模式由導(dǎo)言,不定數(shù)量的定義和聲明組成。下面幾部分介紹這些定義。 ( 1 ) 導(dǎo)言 在根元素模式可找到導(dǎo)言。這一定至少包含屬性的三部分信息: t a r g e t N S :它是正在使用的模式的命名空間和U R l 。 v e r s i o n :用來指定模式的版本。 9 凹川師范人學(xué)碗:L 學(xué)位論文 x m l n s :為X M L 模式規(guī)范提供命名空間。 可選的f i n a l D e f a u l ! 和e x a c t D e f a u l t ,為兩種后面將要常涉及的 擴(kuò)展提供缺省值。它可能包括轉(zhuǎn)出和轉(zhuǎn)入,包括結(jié)構(gòu)。 ( 2 ) 聲明 X M LS c h e m a 的聲明由元素聲明、屬性和屬性組聲明、簡單類型聲明等組 成。在此不逐一進(jìn)行介紹。 2 4 文檔型X M L 文檔與數(shù)據(jù)型X M L 文檔 按照X M L 文件的結(jié)構(gòu)可以將其分為數(shù)據(jù)型的X M L 文檔和文檔型的X M L 文檔,下面簡單進(jìn)行對比: 表2 1 文檔型X M L 文檔與數(shù)據(jù)型X M L 文檔的比較 數(shù)據(jù)型X M L 文檔文檔型X M L 文檔 文檔結(jié)構(gòu)數(shù)據(jù)型的X M L 文檔由非常規(guī)則的文檔型的X M L 文檔具有不規(guī)則的 結(jié)構(gòu)它的特點(diǎn)是規(guī)則的結(jié)構(gòu)禾清結(jié)構(gòu),而且數(shù)據(jù)的粒度也比較人。 晰的內(nèi)容特點(diǎn)是包含了不規(guī)則的結(jié)構(gòu),火鏈 原始數(shù)據(jù)和火量的混合內(nèi)容。 元素順序 元索之間層次比較重要,而同一層元素之間的順序往往非常重要( 這 次問的順序關(guān)系并不重要。點(diǎn)很好理解,因?yàn)橐晕臋n為中心的 X M L 文檔是給人閱讀的) 對丁X H T M L不包括或很少包括經(jīng)常包括 片斷的包括 針對對象 數(shù)據(jù),弘的X M L 文檔通常是為機(jī)器主要針對的對象是人 毆計(jì)的也就是說主要是方便機(jī)器 進(jìn)行處理 主要川造常剛米在數(shù)據(jù)庫之間傳遞數(shù)據(jù)文檔型的X M L 文檔主要川于( 服務(wù) 器) s e r v e r 和( 客服端) c l i e n t 之間 傳遞數(shù)據(jù) J J 途舉例比如芙丁銷售訂單或者是銷售發(fā)票 具體的例子如二| 本,電子郵件,廣 的X M L 文檔告等等。 四川師范大學(xué)碩士學(xué)位論文 2 5X M L 語言的相關(guān)規(guī)范 2 5 1X M L 文檔的鏈接功能 作為一種W e b 語言,X M L 的鏈接能力是非常強(qiáng)大的??蓴U(kuò)展鏈接語言X L L ( e X t e n s i b l eL i n k i n gL a n g u a g e ) 是專為X M L 文檔設(shè)計(jì)的。X L L 分為兩部分:X M L 鏈接語言X l i n kf X M L L i n k i n gL a n g u a g e ) 和X M L 指針語言X p o i n t e r ( X M L P o i n t e r L a n g u a g e ) 。X M L 中的鏈接可以分為簡單鏈接和擴(kuò)展鏈接,簡單鏈接功能相當(dāng) 于H T M L 中的 標(biāo)記。X M L 允許用戶根據(jù)需要在同一文檔中加入不同的具 有自己獨(dú)有屬性的鏈接元素,這充分體現(xiàn)了X M L 的靈活性和可擴(kuò)展性。擴(kuò)展 鏈接是X l i n k 為支持多方向多目的鏈接而提出的,與簡單鏈接不同,它可以有 多個(gè)目標(biāo)。多方向鏈接是指鏈接的操作可以從任一個(gè)鏈接資源開始。X M L 為支 持多方向鏈接,允許鏈接元素本身處于鏈接資源之外。鏈接資源可以是X M L 文檔中的任何元素,也可以是整個(gè)文檔。由于鏈接元素本身處于鏈接資源之外, 因此這種鏈接可以自由組織多個(gè)文檔之間的關(guān)系。當(dāng)然H T M L 也可以通過在所 有文檔中加 來實(shí)現(xiàn)同樣的功能,但若要對這些關(guān)系進(jìn)行修改,H T M L 需要 修改所有文檔,而外部鏈接只要修改一個(gè)文檔中的一個(gè)鏈接元素就可以了,顯 然要比H T M L 方便得多。X p o i n t e r 用組成定位器的定位項(xiàng)指定資源,可以包 含單一的定位器,定位器可以包含絕對、相對、范圍和字符串匹配定位項(xiàng)。 X p o i n t e r 提供對X M L 文檔的內(nèi)部結(jié)構(gòu)( 如一個(gè)字符串或選擇的一個(gè)段落) 的定 位。X l i n k 提供功能強(qiáng)大的鏈接方法,可以在文檔之間建立單向或多向的復(fù)雜 鏈接關(guān)系,還有注釋鏈接、概要鏈接、擴(kuò)展鏈接集等多種鏈接功能,這些鏈接 功能相對于H T M L 都有很大的增強(qiáng)。X l i n k 不僅支持H T M L 的單向鏈接,還支 持多目的、多方向鏈接,它甚至還允許鏈接單獨(dú)提出來存放在數(shù)據(jù)庫中,或者 是單獨(dú)的文檔中。 2 5 2X M L 文檔的解析 對X M L 的操作依賴于對X M L 文檔的正確解析。X M L 解析器要分離出 X M L 文檔中所有的標(biāo)簽、元素、屬性和文字內(nèi)容,解析結(jié)果要體現(xiàn)X M L 文檔 所隱含的層次結(jié)構(gòu)。X M L 的解析需要為用戶提供一套可操作的接口,根據(jù)接口 類型的不同,X M L 的解析可分為基于事件的解析和基于樹結(jié)構(gòu)的解析?;?1 l 四川I9 r l i 范大學(xué)碩士學(xué)位論文 事件的解析只根據(jù)用戶的應(yīng)用要求返回結(jié)果,結(jié)果只有用戶所需要的元素以及 它的屬性和內(nèi)容或其他的一些元素信息,因此在解析過程中不用首先映射出整 個(gè)文檔的結(jié)構(gòu),對用戶不需要的元素也不用記憶,這種解析比較簡單而且適于 用較小的內(nèi)存空間來解析較大的文檔。基于事件的A P I 的代表是S A X ,S A X 是一個(gè)非盈利的程序員組建議的X M LA P I 標(biāo)準(zhǔn),它是基于流的、以事件處理 方式工作的模型,它將分析X M L 文檔時(shí)所遇到的某些事件和數(shù)據(jù)的通知通過 回凋函數(shù)報(bào)告給應(yīng)用程序。而基于樹結(jié)構(gòu)的解析將X M L 文檔映射為一個(gè)類似 于樹的結(jié)構(gòu),用戶可以從中獲得文檔中所有的元素、屬性和內(nèi)容以及它們之間 的關(guān)系,并能通過這樣的樹對文檔的結(jié)構(gòu)和內(nèi)容進(jìn)行動態(tài)地修改?;跇浣Y(jié)構(gòu) 的A P I 的代表是D O M ,D O M 是由W 3 C 所制定的與平臺、語言無關(guān)的程序接 l 二I ,它提供了動態(tài)訪問和更新文檔的內(nèi)容、結(jié)構(gòu)與風(fēng)格的手段??梢杂肈 O M 對文檔做進(jìn)一步地處理,并將處理的結(jié)果更新到表示頁面。D O Ml e v e l I 己于 1 9 9 8 年l O 月推出,它包括核心、H T M L 和X M L 三部分。D O M 的核心部分提 供了能表示結(jié)構(gòu)化文檔的一組低層的基本接口集,并定義了用來表示X M L 文 檔的擴(kuò)展接口。H T M L 和X M L 部分提供了高層的接口,可以作為更方便的文 檔視圖。D O M 規(guī)范由對象和方法組成,通過它們,程序員可以更容易、更直 接地對特定類型的文檔進(jìn)行訪問和操作。由上可以看出,D O M 是基于樹形結(jié) 構(gòu)的W 3 C 推薦的A P I 標(biāo)準(zhǔn),而S A X 是事件驅(qū)動的A P I 標(biāo)準(zhǔn),它們適用于不同 的場合,在實(shí)際應(yīng)用中要根據(jù)具體的情況加以選擇。D O M 適合結(jié)構(gòu)化編輯X M L 文檔,例如排序、記錄移動和與其他應(yīng)用共享X M L 文檔等情形,S A X 效率高, 適合處理大文檔,執(zhí)行與文檔結(jié)構(gòu)無關(guān)的任務(wù),提取特定節(jié)點(diǎn)內(nèi)容等。而D O M 是整體裝入和處理X M L 文檔,因此對系統(tǒng)資源的占用很大,效率低,速度慢。 采用D O M 模型對于S e r v e r 端帶來的代價(jià)不可忽略。而對于S A X 來說,D O M 的很多工作它很難完成,例如排序、移動等。因?yàn)樗鄙賹τ赬 M L 文檔的整 體視圖。 2 5 3X M L 文檔的顯示 X M L 的一個(gè)最重要的特征是把內(nèi)容和顯示格式分開。這樣做帶來很大的好 處,可以讓不同的用戶按照各自希望的格式顯示同一X M L 文檔的內(nèi)容,這也 就意味看X M L 文檔本身并沒有關(guān)于格式方面的信息。為X M L 文檔提供格式信 1 2 創(chuàng)川師范入學(xué)碩士學(xué)位論文 息的是樣式表,樣式表可以控制文件內(nèi)容在顯示時(shí)的版面風(fēng)格,如頁面的邊距、 各式標(biāo)題及文字的字體、顏色、對齊方式等。對同一份X M L 文檔使用不同的 樣式表就可以得到不同的輸出效果,這特別適合于將文檔表示在不同的場合, 如顯示、打印、出版等。適用于X M L 文檔的樣式表語言有層疊樣式表C S S ( C a s c a d i n gS t y l eS h e e t sL e v e l ) 和可擴(kuò)展樣式表語言X S U e X t e n s i b l eS t y l e s h e e t l a n g u a n g ) 。C S S 是一種比較簡單的樣式表語言,既可以用于H T M L 文檔,也可 以用于X M L 文檔。C S S 用簡單的語法描述元素的顯示格式,決定了頁面的視 覺外觀,但是不會改變源文檔的結(jié)構(gòu)。而X S L 是專為X M L 設(shè)計(jì)的樣式表語言, 它使用X M L 的語法,但綜合了D S S S L ( D o c u m e n tS t y l ea n dS e m a n t i c s S p e c i f i c a t i o nL a n g u a g eS G M L 文件的樣式表) 和C S S 的特點(diǎn)。X S L 的優(yōu)勢在于 它可以用于轉(zhuǎn)換,當(dāng)然X S L 也可以把X M L 文檔轉(zhuǎn)換為H T M L 格式。而且同一 個(gè)樣式表可以用于多個(gè)具有相似樹結(jié)構(gòu)的文檔。處理X S L 樣式表的是X S L 樣 式表處理器,樣式表處理器接受一個(gè)X M L 文檔或數(shù)據(jù),以及X S L 樣式表,輸 出特定樣式的顯示,其顯示格式根據(jù)X S L 樣式表確定。這個(gè)處理過程分兩步進(jìn) 行,首先,從X M L 源樹構(gòu)建一裸結(jié)果樹,這一步稱為樹轉(zhuǎn)換。然后,翻譯結(jié) 果樹,產(chǎn)_ i 所需的顯示。這一步稱為格式化,通過大量的定樣命令F O ( F o r m a t t i n g O b j e c t ) 完成。X S L T 是將一種X M L 文檔轉(zhuǎn)換為另一種的語言。這意味著它提 供了單源X M L 數(shù)掘的機(jī)制,可以在W e b 頁面中創(chuàng)建由用戶動態(tài)更改的豐富視 圖,明以為目標(biāo)通信過濾數(shù)據(jù)。X S L T 對于業(yè)務(wù)規(guī)則編碼已經(jīng)足夠強(qiáng)大。它可 以從數(shù)據(jù)生成圖形( 不僅僅是W e b 頁面) ,它甚至可以處理與其他服務(wù)器的通 信,以及在X S L T 自身內(nèi)部生成適當(dāng)?shù)南?。另一方面,X S L T 也稱為基于模 扳的語言,它允許將某種模式映射到源文檔中,而源文檔的輸出是用X M L 、 H T M L 或純文本書寫的。使用X S L T 可以將X M L 文檔的結(jié)構(gòu)轉(zhuǎn)換為不同的X M L 文檔,例如可以更改X M L 文檔的順序、添加或刪除元素、執(zhí)行條件測試或者 用元素的集合進(jìn)行迭代。 2 6X M L 的相關(guān)應(yīng)用及使用前景 2 6 1 X M L 的相關(guān)應(yīng)用 作為互聯(lián)網(wǎng)的新技術(shù),X M L 的應(yīng)用非常廣泛,可以說X M L 已經(jīng)滲透到了 瓦聯(lián)網(wǎng)的各個(gè)角落。下面主要列舉其幾個(gè)經(jīng)典應(yīng)用: 1 3 四川師范大學(xué)碩士學(xué)位論文 1 、電子商務(wù) 電子商務(wù)就是利用電子手段尤其是互聯(lián)網(wǎng)進(jìn)行商務(wù)活動。從技術(shù)上說,電 子商務(wù)是通過互聯(lián)網(wǎng)傳輸和交換商務(wù)數(shù)據(jù),并能根據(jù)商務(wù)數(shù)據(jù)進(jìn)行人工或自動 處理。X M L 的可擴(kuò)展性和自相容性等特點(diǎn),使它成為電子商務(wù)活動中數(shù)據(jù)交換 的有力工具。 2 、網(wǎng)絡(luò)出版 網(wǎng)絡(luò)出版自從出現(xiàn)以來,用于信息發(fā)布的主要是H T M L 技術(shù),但是這種方 式在跨媒體出版時(shí)遇到了
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 當(dāng)代教育實(shí)踐與教學(xué)研究 官網(wǎng)
- 移植后口腔黏膜炎防治與管理
- 闌尾炎疾病簡介
- 2025至2030中國機(jī)器人噴射混凝土系統(tǒng)行業(yè)發(fā)展趨勢分析與未來投資戰(zhàn)略咨詢研究報(bào)告
- 2025至2030中國服裝包裝膠袋行業(yè)深度研究及發(fā)展前景投資評估分析
- 2025至2030中國曝氣攪拌機(jī)行業(yè)發(fā)展趨勢分析與未來投資戰(zhàn)略咨詢研究報(bào)告
- 品牌餐飲企業(yè)食材采購合作協(xié)議
- 2025至2030中國旋蓋機(jī)行業(yè)發(fā)展態(tài)勢及趨勢預(yù)測分析報(bào)告
- 2025至2030中國敏感牙膏行業(yè)發(fā)展趨勢分析與未來投資戰(zhàn)略咨詢研究報(bào)告
- 2025至2030中國托盤蓋行業(yè)發(fā)展趨勢分析與未來投資戰(zhàn)略咨詢研究報(bào)告
- DG-TJ08-2433A-2023 外墻保溫一體化系統(tǒng)應(yīng)用技術(shù)標(biāo)準(zhǔn)(預(yù)制混凝土反打保溫外墻)
- 教師法制教育培訓(xùn)課件
- 眾包物流模式下的資源整合與分配
- 鐵路貨運(yùn)流程課件
- 四川省成都市成華區(qū)2023-2024學(xué)年七年級上學(xué)期期末數(shù)學(xué)試題(含答案)
- 慢性硬膜下血腫護(hù)理要點(diǎn)大揭秘
- 管工基礎(chǔ)知識培訓(xùn)課件
- 成人氣管切開拔管中國專家共識解讀
- “微”力量微博營銷
- 2022-2023學(xué)年山東省菏澤市成武縣人教版四年級下冊期末考試數(shù)學(xué)試卷(解析版)
- 浙江省舟山市2024屆數(shù)學(xué)高一第二學(xué)期期末質(zhì)量跟蹤監(jiān)視試題含解析
評論
0/150
提交評論