XML技術精品課件_第1頁
XML技術精品課件_第2頁
XML技術精品課件_第3頁
XML技術精品課件_第4頁
XML技術精品課件_第5頁
已閱讀5頁,還剩46頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第三講

XML技術山東大學管理學院教學講義第二部分

數據結構與模式定義

DTD1創(chuàng)建新標記語言XML的精髓:基于信息描述的、能夠體現數據信息之間邏輯關系的、可以確保文件的易讀性和易搜索性的“自定義標記”語言。通過文檔類型定義(DTD)或Schema來定義新的標記語言(也叫標記集)。DTD或Schema提供了語法規(guī)定,XML文檔要與DTD或Schema相比較,這一過程稱為合法性檢驗。如果文檔符合DTD或Schema中的約束,這個文檔就是有效的。與DTD不同,XMLSchema本身也是一份XML文件,它用來定義另一份XML的文件格式、結構、數據類型等。2一、Well-formedv.s.Valid

XML一個Well-FormedXMLdocument:正確包含嵌套在其他元素中的元素有唯一的根元素遵循XML元素命名慣例遵循XML屬性引用規(guī)則所有特殊字符被正確回避一個合法的(Valid)XMLdocument遵守XML語法規(guī)則遵守相應DTD(或Schema)文件規(guī)范的XML文檔

有效的XML,一定是格式良好的XML。而反之,格式良好的XML不一定是有效的XML。3二、DTD的基本概念DTD描述了一個標記語言的語法和詞匯表,也就是說定義了文件的整體結構以及文件的語法。一個XML文件必須遵守文件類型定義DTD(DocumentTypeDefinition)的規(guī)定。一個DTD文檔包含元素的定義規(guī)則、元素間關系的定義規(guī)則、元素可使用的屬性、可使用的實體或符號規(guī)則。DTD規(guī)定了一個語法分析器包含解釋一個“有效的”XML文件所需要知道的所有規(guī)則的細節(jié)。DTD文件也是一個ASCII的文本文件,后綴名為.dtd。4二、DTD的基本概念DTD用來描述XML文檔的結構,一個DTD文檔包含:元素(ELEMENT)的定義規(guī)則元素之間的關系規(guī)則屬性(ATTLIST)的定義規(guī)則可使用的實體(ENTITY)或符號(NOTATION)規(guī)則DTD文檔與XML文檔實例的關系。類與對象數據庫表結構與數據記錄有了DTD,XML文件可以攜帶一個自身格式的描述。有了DTD,不同應用可使用一個通用DTD來交換數據。應用程序可以使用一個標準DTD校驗從外部世界接受來的XML數據是否有效??梢允褂肈TD校驗自己的XML數據。5三、如何生成一個DTD文檔(1/4)DTD文檔的聲明及引用內部DTD文檔

<!DOCTYPE根元素[定義內容]>外部DTD文檔

<!DOCTYPE根元素SYSTEM"DTD文件路徑">內外部DTD文檔結合

<!DOCTYPE根元素SYSTEM"DTD文件路徑"

[定義內容]>使用公有DTD<!DOCTYPE根元素PUBLIC“DTD名稱”“外部DTD的URL”>6三、如何生成一個DTD文檔(2/4)<?xmlversion='1.0'encoding='gb2312'?><!DOCTYPEpoem[

<-----------------根元素的名稱poem<!ELEMENTpoem(author,title,content)>

<----------子元素的名稱及順序<!ELEMENTauthor(#PCDATA)>

<------------------子元素的數據類型<!ELEMENTtitle(#PCDATA)><!ELEMENTcontent(#PCDATA)>]>

<---------------------------------------結束標簽<poem><author>王維</author><title>鹿柴</title><content>空山不見人,但聞人語聲。返景入深林,復照青苔上。

</content></poem>注意:例中的定義關鍵字一定要大寫,如DOCTYPE、ELEMENT、#PCDATA,且元素名稱與數據類型之間也要有空格。內部DTD示例7三、如何生成一個DTD文檔(3/4)<?xmlversion='1.0'encoding='gb2312'?><!DOCTYPEpoemSYSTEM"ex2.dtd"><poem> <author>王維</author> <title>鹿柴</title> <content>

空山不見人,但聞人語聲。返景入深林,復照青苔上。

</content></poem><?xmlversion="1.0"encoding="gb2312"?><!ELEMENTpoem(author,title,content)><!ELEMENTauthor(#PCDATA)><!ELEMENTtitle(#PCDATA)><!ELEMENTcontent(#PCDATA)>外部DTD示例ex2.dtd8三、如何生成一個DTD文檔(4/4)<?xmlversion='1.0'encoding='gb2312'?><!DOCTYPEpoemSYSTEM"ex3.dtd"[

<!ELEMENTpoem(author,title,content)> <!ELEMENTcontent(#PCDATA)>]><poem> <author>王維</author> <title>鹿柴</title> <content>

空山不見人,但聞人語聲。返景入深林,復照青苔上。

</content></poem><?xmlversion='1.0'encoding='gb2312'?><!ELEMENTauthor(#PCDATA)><!ELEMENTtitle(#PCDATA)>內部和外部DTD示例ex3.dtd9三、如何生成一個DTD文檔(4/4)使用公有DTD還存在一種外部DTD,它由權威機構制訂,提供給特定行業(yè)或公眾使用。使用關鍵字PUBLIC引用這一類公開使用的DTD。引用格式為:<!DOCTYPE根元素PUBLIC“DTD名稱”“外部DTD的URL”>其用法和SYSTEM基本相同,只是多了個DTD名稱。10四、元素的定義(1/14)語法

<!ELEMENT

NAME

CONTENTSPEC>關鍵字元素名稱EMPTY-該元素不能包含子元素和文本,但可以有屬性(空元素)ANY-該元素可以包含任何在DTD中定義的元素和文本內容#PCDATA-可以包含任何字符數據,但不能在其中包含子元素純元素類型--只包含子元素,并且這些子元素外沒有文本混合類型--包含子元素和文本數據的混合體,具體定義。元素類型11EMPTY示例--空元素<!ELEMENT

人EMPTY><家庭> <人名字="皮諾曹“性別="男"年齡="6"/></家庭><家庭> <人>皮諾曹</人> <人><大人>皮諾曹爸爸</大人></人></家庭>四、元素的定義(2/14)√×12四、元素的定義(3/14)ANY示例(1/2)元素可以出現任何內容

<!ELEMENT

人ANY><家庭> <人>皮諾曹</人> <人><大人>皮諾曹爸爸</大人></人></家庭>將根元素設為ANY類型后,元素出現的次數和順序不受限制。13四、元素的定義(4/14)ANY示例(2/2)形式良好但不合法(沒有<書>元素的定義)<!DOCTYPE書架[<!ELEMENT書架ANY>

]><書架><書>XML實用教程</書></書架>形式良好且合法<!DOCTYPE書架[<!ELEMENT書架ANY>]><書架>XML實用教程</書架>14#PCDATA示例包含可解析的字符數據,即非標記文本,但它不能包含自己的子元素

<!ELEMENT

人(#PCDATA)><家庭> <人性別="男"年齡="6">皮諾曹</人></家庭><家庭> <人><大人>皮諾曹爸爸</大人></人></家庭>√×四、元素的定義(5/14)15四、元素的定義(6/14)

子元素內容只能出現在元素類型聲明中規(guī)定的子元素定義子元素時與順序無關示例:書架的定義:<?xmlversion=”1.0”Standalone=”yes”encoding=”GB2312”?><!DOCTYPE書架[<!ELEMENT書架(書)*><!ELEMENT書(書名,作者,價格,出版社)><!ELEMENT書名(#PCDATA)><!ELEMENT作者(姓名,地址)><!ELEMENT姓名(#PCDATA)><!ELEMENT價格(#PCDATA)><!ELEMENT出版社(地址,郵編)><!ELEMENT地址(#PCDATA)><!ELEMENT郵編(#PCDATA)>]>“書架”包括“書”子元素,“書”又包括書名、‘作者“、‘價格”、“出版社”這些子元素。而“作者”又包括了“姓名”、“地址”這些子元素。“出版社”又包括了“地址”、“郵編”這些子元素。16四、元素的定義(7/14)混合類型示例指可以有字符數據和子元素的混合體

<!ELEMENT作者(姓名,電話,EMAIL,#PCDATA)*><作者><姓名>丁力</姓名><電話>(010)64535265</電話><EMAIL>dingli@</EMAIL>作者丁力的聯(lián)系方式</作者>說明:以上只是示意性的,“姓名”、“電話”、“EMAIL”這些子元素沒有定義17四、元素的定義(8/14)符號用途示例示例說明()用來給元素分組,每組可重復出現(古龍|金庸|梁羽生),(王朔|余杰),毛毛分成三組|在列出的對象中選擇一個(男|女)表示“男”或者“女”必須出現,兩者選一+該對象最少出現一次,可以出現多次(1或多次)(成員+)表示成員必須出現,而且可以出現多個成員*該對象允許出現零次到任意多次(0到多次)(愛好*)愛好可以出現零次到多次?該對象可不出現,也可以出現,但只能出現一次(0到1次)(黨員?)“黨員”可以出現,也可以不出現,如果出現的話,最多只能出現一次,對象必須按指定的順序出現(西瓜,蘋果,香蕉)表示西瓜、蘋果、香蕉必須出現,并且按這個順序出現修飾符號-子元素的定義和控制18四、元素的定義(9/14)修飾符號-子元素的定義和控制控制子元素出現的順序

<!ELEMENT作者(姓名,(地址|E-mail)?)><!ELEMENT姓名(#PCDATA)><!ELEMENT地址(#PCDATA)><!ELEMENTE-mail(#PCDATA)><作者><姓名>張三</姓名><地址>浙江杭州</地址></作者><作者><姓名>張三</姓名><地址>浙江杭州</地址><E-mail>zhangsan@163.net</E-mail></作者>√×19四、元素的定義(10/14)修飾符號-子元素的定義和控制“,”分隔表示“與”,要求子元素嚴格遵從順序要求出現,而且不能缺少。

<!ELEMENT作者(姓名,地址)><!ELEMENT姓名(#PCDATA)><!ELEMENT地址(#PCDATA)><作者><姓名>張三</姓名><地址>浙江杭州</地址></作者><作者><地址>浙江杭州</地址><姓名>張三</姓名></作者>√×20四、元素的定義(11/14)修飾符號-子元素的定義和控制用“空格”表示無順序要求,元素可自由出現。<!ELEMENT作者(姓名地址)><!ELEMENT姓名(#PCDATA)><!ELEMENT地址(#PCDATA)><作者><姓名>張三</姓名><地址>浙江杭州</地址></作者><作者><地址>浙江杭州</地址><姓名>張三</姓名></作者>√√21四、元素的定義(12/14)修飾符號-子元素的定義和控制成組元素:子元素可以使用括號并為一組。<!ELEMENT作者(姓名,地址)+><!ELEMENT姓名(#PCDATA)><!ELEMENT地址(#PCDATA)><作者><姓名>張三</姓名><地址>浙江杭州</地址><姓名>李四</姓名><地址>山東濟南</地址></作者>√22四、元素的定義(13/14)修飾符號-子元素的定義和控制字符“?”說明一個子元素是可選的,它可以出現,也可以不出現。<!ELEMENT作者(姓名地址?))><!ELEMENT姓名(#PCDATA)><!ELEMENT地址(#PCDATA)><作者><姓名>張三</姓名><地址>浙江杭州</地址></作者><作者><姓名>張三</姓名></作者>√√23四、元素的定義(14/14)修飾符號-子元素的定義和控制“*”表示該元素可以出現任意次,即零次或多次?!埃北硎驹撛刂辽僖霈F一次,即一次或多次。示例:書架的定義:<?xmlversion=”1.0”encoding=”GB2312”?><!DOCTYPE書架[<!ELEMENT書架(書)*><!ELEMENT書(書名,作者+,價格,出版社)>

……………]>24五、屬性的定義語法<!ATTLIST

元素名稱 屬性名稱類型屬性特點

…...>CDATA

ID

IDREF/IDREFS

NMTOKEN/NMTOKENS

Enumerated

ENTITY/ENTITIES

NOTATION

NOTATION(enumerated)#REQUIRED

#IMPLIED

#FIXEDvalue

Defaultvalue25五、屬性的定義屬性類型-CDATA屬性值可以是任何字符(包括數字和中文)<!ATTLIST木偶

姓名CDATA#REQUIRED

><木偶姓名="皮諾曹"/>

<木偶姓名="PiNuocao"/>

<木偶姓名="123"/>請注意:這里的CDATA與第一部分CDATA的區(qū)別,

#PCDATA與CDATA的區(qū)別26五、屬性的定義屬性類型-NMTOKEN/NMTOKENSNMTOKEN要求屬性是合法的XML名字,屬性值必須是英文字母、數字、句號、破折號、下劃線或冒號(不能是中文?。?。NMTOKENS與NMTOKEN類似,包含多個由空格分隔的字符。<?xmlversion="1.0"encoding="gb2312"?><!DOCTYPEpoems[<!ELEMENTpoems(title,content)><!ELEMENTtitle(#PCDATA)><!ATTLISTtitleauthorNMTOKEN

#REQUIRED><!ELEMENTcontent(#PCDATA)>]><poems><titleauthor="杜甫">八陣圖</title><content>

功蓋三分國,名成八陣圖。江流石不轉,遺恨失吞吳。

</content></poems><?xmlversion="1.0"encoding="gb2312"?><!DOCTYPEpoems[<!ELEMENTpoems(title,content)><!ELEMENTtitle(#PCDATA)><!ATTLISTtitleauthorNMTOKEN#REQUIRED><!ELEMENTcontent(#PCDATA)>]><poems><titleauthor=“Dufu">八陣圖</title><content>

功蓋三分國,名成八陣圖。江流石不轉,遺恨失吞吳。

</content></poems>×√27五、屬性的定義屬性類型-ID表明該屬性的取值必須是唯一的。<!ELEMENT公司職員ANY>

<!ATTLIST公司職員

編號ID#REQUIRED

姓名CDATA#REQUIRED

><公司職員編號="Z001"姓名="張三"/><公司職員編號="Z002"姓名="李四"/><公司職員編號="Z001"姓名="張三"/><公司職員編號="Z001"姓名="李四"/>√×28五、屬性的定義屬性類型-IDREF/IDREFSIDREF屬性的值指向文檔中其它地方聲明的ID類型的值。IDREFS同IDREF,但是可以具有由空格分開的多個引用。<!ELEMENT家庭(人+)>

<!ELEMENT人EMPTY>

<!ATTLIST人

relIDID#REQUIRED

parentIDIDREFS#IMPLIED

nameCDATA#REQUIRED

><家庭>

<人relID=“P_1”name=“父親”/>

<人relID=“P_2”name=“母親”/>

<人relID=“P_3”parentID=“P_1P_2”name=“兒子”/>

</家庭>空格29五、屬性的定義屬性類型-Enumerated事先定義好一些值,屬性的值必須在所列出的值的范圍內,“Enumerated”不出現在定義中。<!ATTLISTperson

婚姻狀態(tài)(single|married|divorced|widowed)#IMPLIED

性別(男|女)#REQUIRED>30五、屬性的定義屬性類型-NOTATION(1/3)Notation主要是用來表明文檔中需要來自外部源的數據,而該數據XML解析器是不能進行解析的,需要外部的應用程序進行處理。如各種格式的二進制文件(比如圖形文件、聲音文件等)Notation類型使用前必須有Notation聲明Notation聲明的語法格式為:

<!NOTATION格式名SYSTEM處理程序的URI>31五、屬性的定義屬性類型-NOTATION(2/3enumerated)屬性的值必須匹配NOTATION名稱列表中的某個名稱。<!NOTATIONmpegSYSTEM"mplayer.exe">

<!NOTATIONjpegSYSTEM"netscape.exe">

<!ATTLISTmedia

playerNOTATION(mpeg|jpeg)#REQUIRED>屬性類型定義NOTATION聲明元素名屬性名32五、屬性的定義屬性類型-NOTATION(3/3)下面的例子為“視頻”元素指定了兩種可選設備,一種是RealPlayer.exe,用來播映.rm文件,另一種則用來播放GIF圖像。<?xmlversion=”1.0”encoding=”GB2312”standalone=”yes”?><!DOCTYPE文件[<!ELEMENT文件ANY><!ELEMENT視頻EMPTY>

<!ATTLIST視頻演示設備NOTATION(rm|gif)#REQUIRED><!NOTATIONrmSYSTEM“RealPlayer.exe”><!NOTATIONgifSYSTEM“Image/gif”>]><文件><視頻演示設備=”rm”/></文件>33五、屬性的定義屬性的特點-#REQUIRED元素的所有實例都必須有該屬性的值(NOTNULL)語法:<!ATTLIST元素名屬性名屬性類型#REQUIRED>DTD示例:<!ATTLISTpersonnumberCDATA#REQUIRED>XML示例:<personnumber="5677"/>34五、屬性的定義屬性的特點-#IMPLIED元素的實例中可以忽略該屬性(NULL)。語法:

<!ATTLIST元素名屬性名屬性類型#IMPLIED>DTD示例:<!ATTLISTcontactfaxCDATA#IMPLIED>XML示例:<contactfax="555-667788"/>或<contact/>35五、屬性的定義屬性的特點-#FIXEDvalue元素實例中該屬性的值必須為指定的固定值。語法:<!ATTLIST元素名屬性名類型#FIXED"value">DTD示例:<!ATTLISTsendercompanyCDATA#FIXED"Microsoft">XML示例:<sendercompany="Microsoft"/>36五、屬性的定義屬性的特點-Defaultvalue為屬性提供一個默認的值,在XML可使用該默認值或指定一新值。語法:<!ATTLIST元素名屬性名類型"value">DTD示例:<!ATTLISTpaymenttypeCDATA"check">XML示例:<payment/>表明payment的type屬性為"check"37六、屬性的定義-實體屬性類型-ENTITY/ENTITIESENTITY類型的屬性的值必須對應一個在DTD文檔內聲明的實體。ENTITIES類型的屬性的值與ENTITY類似,不同的是可以包含多個由空格分開的實體。實體引用前必須定義實體分類一般實體(通用實體)內部實體外部實體參數實體內部實體外部實體38六、屬性的定義-實體內部一般實體由實體名和及實體內容字符串構成,XML解析器可以解析。在內部或外部DTD中聲明,在XML的元素或屬性值中引用。語法:定義方式為:<!ENTITY實體名“實體值”>引用方式為:&實體名;

DTD示例:<!ENTITYwriter"DonaldDuck."><!ENTITYcopyright"CopyrightW3Schools.">XML示例:<author>&writer;©right;</author>39六、屬性的定義-實體外部一般實體外部一般實體的內容位于系統(tǒng)其他地方(由URI指定)。在內部或外部DTD中聲明,在XML的元素或屬性值中引用。語法:

<!ENTITY實體名SYSTEM"URI/URL">DTD示例:

<!ENTITYwriterSYSTEM

"/entities/entities.dtd">

<!ENTITYcopyrightSYSTEM

"/entities/entities.dtd">XML示例:

<author>&writer;©right;</author>40六、屬性的定義-實體內部參數實體該實體不是在具體XML實例化文檔中使用,而是在DTD文檔內部被使用。定義如下的參數實體:

<!ENTITY%地址“街道,城市,郵編,國家”>

<!ENTITY%sample“<!ELEMENTex(#PCDAT)>”>在DTD內部通過“%實體名;”來引用它們:

<!ELEMENT聯(lián)系(人名,電話,%地址;)>

%sample;<!ELEMENT聯(lián)系(人名,電話街道,城市,郵編,國家)>

<!ELEMENTex(#PCDAT)>41六、屬性的定義-實體外部參數實體類似于外部一般實體與內部一般實體的區(qū)別。實體的內容不在實體定義處,而是在系統(tǒng)其他地方,內容應符合DTD規(guī)范定義實例:

<!ENTITY%地址SYSTEM"http://somewebsite/somecategory/something.dtd">在DTD內部引用格式:

%地址;“%地址;”相當于一個普通的元素(ELEMENT)。42六、屬性的定義-實體各類實體比較類型一般(通用)實體參數實體使用場合用在XML文檔中用在DTD中元素和屬性的聲明中聲明

方式內部<!ENTITY實體名"文本內容"><!ENTITY%實體名"文本內容">外部<!ENTITY實體名SYSTEM"外部文件URL地址"><!ENTITY%實體名SYSTEM"外部文件URL地址">引用方式&實體名;%實體名;43六、屬性的定義-實體屬性類型ENTITY/ENTITIES應用舉例<?xmlversion="1.0"encoding="gb2312"?><!DOCTYPElibrary[ <!ELEMENTlibrary(number,img)> <!ELEMENTnumber(#PCDATA)> <!ELEMENTimgEMPTY> <!ATTLISTimgsrcENTITIES#REQUIRED> <!ENTITYpicSYSTEM"pic1.gif">]><library> <number>A001</number> <imgsrc="&pic;"/></library>44七、分析完整的DTD文檔,寫XML實例<!DOCTYPENEWSPAPER[

<!ELEMENTNEWSPAPER(ARTICLE+)><!ELEMENTARTICLE(HEADLINE,BYLINE,LEAD,BODY,NOTES)><!ELEMENTHEADLINE(#PCDATA)><!ELEMENTBYLINE(#PCDATA)><!ELEMENTLEAD(#PCDATA)><!ELEMENTBODY(#PCDATA)><!ELEMENTNOTES(#PCDATA)>

<!ATTLISTARTICLEAUTHORCDATA#REQUIRED><!ATTLISTARTICLEEDITORCDATA#IMPLIED><!ATTLISTARTICLEDATECDATA#IMPLIED><!ATTLISTARTICLEEDITIONCDATA#IMPLIED><!ENTITYNEWSPAPER"VervetLogicTimes"><!ENTITYPUBLISHER"VervetLogicPress"><!ENTITYCOPYRIGHT"Copyright1998VervetLogicPress">]>45八、分析XML實例,寫DTD文檔<?xmlversion="1.0"encoding="GB2312"?><學生名冊> <學生學號="1"> <姓名>張三</姓名> <性別>男</性別> <年齡>20</年齡> </學生> <學生學號="2"> <姓名>李四</姓名> <性別>女</性別> <年齡>19</年齡> </學生> <

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論