版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
目錄 4 6 6 10 10 11 12 14 15 17 19 20 23 24 25 27 28 31 32 32 3315 34 35 38 39 41 42 43 44 46 46 483) 48 49元– 50 53 53 57 58 59 60 62 63 64 65 67 67 69 691. 693. 69 70 71 72 76 77 79 81 81 82 83 84 852013年5月,美國國家安全局前外聘員工愛德華·斯諾登(EdwardSnowden)MetaPhone項(xiàng)目是斯坦福大學(xué)法學(xué)院互聯(lián)網(wǎng)與社會研究中心(StanfordLawSchoolCenterforInternetandSociety)的研究人員于2013年年底進(jìn)行的一項(xiàng)研究,旨在重現(xiàn)美國國家安是根據(jù)亞里士多德的著作集《形而上學(xué)》(Metaphysics)特別創(chuàng)造的一個(gè)詞。盡管亞里作品集之中,以示它們是《物理學(xué)》(Physics)的延續(xù)或討論超脫于這一主題的內(nèi)容。數(shù)據(jù),只不過我們現(xiàn)在所謂的“元數(shù)據(jù)”在歷史上被稱為“圖書館目錄信息”(informationinthelibrarycatalog)。卷錄是一套卷軸。如果你曾經(jīng)在猶太教會堂里讀過《妥拉》 ,就會知道卷歷(SimchatTorah)的節(jié)假日都是為了慶?!锻桌氛b經(jīng)即將結(jié)束、一切要重新來過。如目錄往往被名副其實(shí)地稱為“排架表”(shelflist)。物如其名,它是排架上的書籍列表,法國人在大革命前后發(fā)明了卡片式目錄(cardcatalog)后,圖書館目錄的發(fā)展向前邁了一圖表 是“地圖非疆域”(Themapisnottheterritory),但人們往往認(rèn)為這是馬歇爾·麥克盧漢的法。小說《白鯨》(MobyDick)·麥爾維爾(HermanMelville),其內(nèi)容感謝圖書管理員對描述原則(principlesofdescription)的研究,使得如今人人都能將這些對于信息系統(tǒng)來說尤為如此。在互聯(lián)網(wǎng)出現(xiàn)之前,如果人們對赫爾曼麥爾維爾的生平感只要簡單地上網(wǎng)搜索就能了解信息對象。網(wǎng)絡(luò)搜索能為人們帶來遠(yuǎn)遠(yuǎn)超出預(yù)期的信息對象。在網(wǎng)上搜索赫爾曼麥爾維爾傳記能找到上千條搜索結(jié)果,我用一生的時(shí)間也許都無法處理如此之多的信息。相關(guān)性(vn)是一個(gè)極為主觀的概念,因此難以捉摸。即使我們要明確表達(dá)的問題相同,但是什么與你相關(guān)、什么信息能滿足你的信息需求也許完全不同于與我相關(guān)的信有任何在世的繼承人,但是我們兩個(gè)人都會在網(wǎng)上搜索赫爾曼麥爾維爾傳記。具體的斷。圖書館找一本赫爾曼麥爾維爾的傳記,搜索到的成功概率(假設(shè)你當(dāng)?shù)氐膱D書館里有這樣一本書)取決于主題領(lǐng)域是否有記錄標(biāo)識出包含赫爾曼麥爾維爾文字的一種或多種資源,以及是否對這本書屬于傳記進(jìn)行了一些說明。就像我們之前給出的地圖的比喻一樣,目錄中對信息對象的簡化表達(dá)必須包括能幫助你發(fā)現(xiàn)相關(guān)資源的數(shù)據(jù)。T.S.艾略特(T.S.Eliot)的詩作《巖石》(TheRock)(Whereisthewisdomwehavelostinknowledge?)(Whereistheknowledgewehavelostin或者思考過它。我們并不習(xí)慣以這種方式思考信息對象,而是習(xí)慣把信息對象看作是書部分。然而,對于火星探測器發(fā)回地球的信息流或者一本用盧紹錫德語(uhood)寫成的書(或者是以其他任何你既不會說也不會讀的語言寫成的書……錫德語,那真的十分抱歉)些含義而已,但是如果不經(jīng)過某些處理,你就無法了解這些含義。數(shù)據(jù)是潛在信息,類似于潛在能量一樣,兩者都需要付出努力才能釋放出來?!},例如,天然存在的事物實(shí)際上并不能稱為主題。雷尼爾山(MountRainier)是關(guān)于什一條陳述包含三個(gè)部分。首先,我們需要有描述內(nèi)容的主語,即資源。例如,《蒙娜麗莎》畫像。其次,我們要在資源和其他事物之間建立起一種關(guān)系類別(稱之為謂語)例如,資源有創(chuàng)造者。最后,我們還有表述與資源關(guān)系的另一個(gè)賓語圖實(shí)體。例如,在列奧納多達(dá)芬奇創(chuàng)作了《蒙娜麗莎》·達(dá)·芬奇是述的實(shí)體,而賓語則是用于描述主語的另一個(gè)實(shí)體。當(dāng)我們在第六章中討論“描述資源的框架(即目前大多數(shù)元數(shù)據(jù)構(gòu)建時(shí)所依據(jù)的數(shù)據(jù)模型)時(shí)會再次談到這個(gè)話題。(element-valuepair)構(gòu)成了關(guān)于某一相關(guān)資源所做的唯一陳述的全部。如果元數(shù)據(jù)是關(guān)元數(shù)據(jù)模式支配著可以做出的各類陳述。元數(shù)據(jù)編碼體系(encodingschemes)則支配著能指類型1表例如,許多元數(shù)據(jù)模式都建議,具體說明日期時(shí)應(yīng)根據(jù)國際標(biāo)準(zhǔn)ISO8601(《數(shù)據(jù)存儲和交換形式·信息交換·日期和時(shí)間的表示方法》)的規(guī)定對數(shù)值進(jìn)行編碼。ISO8601標(biāo)準(zhǔn)是時(shí)間根據(jù)ISO8601標(biāo)準(zhǔn)進(jìn)行編碼后可寫為:ISO8601標(biāo)準(zhǔn)是一種語法編碼體系,換句話說,這種體系就如何表達(dá)具體類型的數(shù)據(jù)提出能指類型2公平來講,的確非常龐大。在本書出版時(shí),它的最新版本為第35版,分6卷出版,共有6845頁內(nèi)容,包括30萬條主題標(biāo)目。(順便補(bǔ)充一句,第35的形式出版,美國國會圖書館正在過渡到僅提供在線出版物的平臺。)實(shí)際上,如果說只有300000條主題標(biāo)目的話會讓人產(chǎn)生誤解。中的規(guī)則能將主題標(biāo)目串聯(lián)起此確定以下作品是關(guān)于西雅圖大火期間當(dāng)?shù)剌喍傻?。名稱規(guī)范數(shù)據(jù)文檔),馬克·吐溫,1835—1910年(Twain,Mark,采用受控詞匯表時(shí),這個(gè)字符串是引用“馬克吐溫”時(shí)唯一可接受的術(shù)語。馬克吐溫的原名是薩繆爾·蘭霍恩克萊門茨(ulnghonens),他曾用過多個(gè)筆名,但是如果你把作為元數(shù)據(jù)元素的數(shù)值來源,引用它時(shí)只有唯一一種有效的方法。實(shí)際上的條目薩繆爾·蘭霍恩克萊門茨,1835—1910年”中包含了這樣一條備注:本標(biāo)目不可用作主題。有關(guān)本人的作品可參見條目“馬克吐溫,1835—1910年”。規(guī)范文件就像一位無情的情人:對你可以使用的術(shù)語十分挑剔,甚至你只是想一想要用錯(cuò)誤的術(shù)PaulGettyResearchInstitute)建立了兩個(gè)名稱規(guī)范文檔:文化對象名稱規(guī)范(CulturalObjectsNameAuthority?),(UnionListofArtistNames?),提供了關(guān)于藝術(shù)家和藝術(shù)家組織的信息。藝術(shù)家人名規(guī)范中關(guān)于馬克·吐溫的條目與LCNAF的條目略有不同:Twain,Mark(pseudonym)[馬克·發(fā)表的資料以及與本國相關(guān)的內(nèi)容都是國家圖書館的責(zé)任范圍。(作用。)書館已經(jīng)搜集的資料呢?我們從上文馬克·吐溫的例子可以看到,美國國會圖書館和蓋蒂研究所創(chuàng)建的規(guī)范文檔存在部分重疊。會圖書館、德國國家圖書館、法國國家圖書館以及聯(lián)機(jī)計(jì)算機(jī)圖書館中心(onneopurbyn)已經(jīng)發(fā)起了一個(gè)名為(虛擬國際規(guī)范文檔)的項(xiàng)目。在本書出版時(shí),已經(jīng)在世界各地的22個(gè)機(jī)構(gòu)之間建立起了合作伙伴關(guān)系(其中包括蓋蒂研究所,這也是唯一一個(gè)非國家圖書館合作方)。是一種優(yōu)步式的規(guī)范文檔,換句話說,它將所有參與者的記錄搜集到同一種服務(wù)中,以供全球分享。(ThesaurusofGeographicNames?)頓”命名的市或鎮(zhèn),此外還有其他以華盛頓命名的地區(qū)。但是在敘詞表中表達(dá)華盛頓一來納州的華盛頓不會與緬因州的華盛頓混淆,因?yàn)槊總€(gè)華盛頓的父條目都不同(見圖2–2)。圖同?!读_格同義詞詞典》(Roget’sThesaurus)在同義詞詞典中,無論如何定義某個(gè)詞,其中只有僅僅兩種關(guān)系(同義詞與反義詞)同、有時(shí)更為復(fù)雜的關(guān)系。再次回到輪渡的例子,LSCH通過廣義術(shù)語(broaderterm)和狹義術(shù)語 (ferry)相比是更加廣義的術(shù)語,而水上出租車(watertaxi)則是更加狹義的術(shù)語。因此,輪渡是客輪的子類,而水上出租車是輪渡的子類。術(shù)語之間是“ISA”關(guān)系(繼承關(guān)圖敘詞表中另外一種常見的關(guān)系是E”關(guān)系(代用關(guān)系)。E的用處在于說上文馬克·吐溫的例子中,條目“薩繆爾蘭霍恩·克萊門茨,1835—1910年指向了首選術(shù)語“馬克吐溫,1835—1910年”。我們再來舉一個(gè)例子,列出了卡薩布蘭卡 TGN,“Casablanca”應(yīng)當(dāng)是首選術(shù)語,而不是“DarelBeida”或任何其他名稱。麗莎時(shí)裝公司(MonalisaFashions)所在地,而這兩個(gè)實(shí)體之間往往沒有什么關(guān)聯(lián)。隨著圖敘詞表是一種層級,其中實(shí)體之間的關(guān)系一般來說十分簡單,往往是“ISA”關(guān)系:水上出實(shí)的父子關(guān)系。在家譜中,實(shí)際上有兩層父關(guān)系——父親與母親,以及兩種子關(guān)系——兒與兒子。認(rèn)清這一點(diǎn)后,我們可以創(chuàng)建以下規(guī)則:如果是女性,那么就可以是的母親;或者反過來說,如果是的母親,那么就是女性?!芭岳?。推理位于敘詞表層級結(jié)構(gòu)的最上層,通過這種形式將有關(guān)世界的知識整合到其中。存在以下規(guī)則:如果是女性,那么與任何子實(shí)體之間的默認(rèn)關(guān)系就是母親,并且應(yīng)該在的名字旁標(biāo)記符號。年”自己的資料。如果你想在oodd中為某本書分配“待讀”標(biāo)簽也沒有問題,即使世界上任何其他人的“待讀列表上都沒有這本書也沒有關(guān)系。如果你希望使用ungdo”這個(gè)標(biāo)簽來描述圖片分享網(wǎng)站k上的一張照片也沒有問題,即使你是世界上唯一一個(gè)使用這個(gè)標(biāo)簽的人也可以。標(biāo)簽是個(gè)性化的術(shù)語,只要對于創(chuàng)作者有所含義就可以。河系漫游指南》(hehhsudeoheaay)oodd上最為常見的一些書籍標(biāo)簽是“科幻與幽默”。(oodd將標(biāo)簽稱為“定制書架”。)oodd將成千上萬獨(dú)立用戶的個(gè)性標(biāo)簽聚集到一起,就能準(zhǔn)確地從中提取出這本書的種類。這樣一來,oodd用戶今后在查找科幻、幽默或科幻幽默皆有的書籍時(shí),就會找到《銀河系漫游指南》這本書。福特·派法特(科幻人物)——小說[Prefect,F(xiàn)ord(Fictitiouscharacter)—亞瑟·丹特(科幻人物)——小說[Dent,Arthur(Fictitiouscharacter)—除了oodd中的“科幻”標(biāo)簽,其他很受歡迎的《銀河系漫游指南》的標(biāo)簽包括-和”(均為“科幻一詞的縮寫或簡寫形式)。這種形式變化重新提出了特異性簽的存在是否會影響這種有用性呢?錄。實(shí)際上,這是非常重要的一點(diǎn),人們稱之為“一對一原則”(One-to-OnePrinciple),莎”許多元數(shù)據(jù)模式包含應(yīng)對這類情形的元素。舉例來說,都柏林核心元數(shù)據(jù)元素集和A核心類目[一種描述視覺文化作品的模式,由視覺資源協(xié)會(ul ousoon)創(chuàng)建而成]有相關(guān)”的元素,而(蓋蒂信托基金藝術(shù)作品描述類目)也有一個(gè)名為“相關(guān)作品(dok)的元素。盧浮宮的蒙娜麗莎”高分辨率數(shù)字照片是一種與《蒙娜麗莎》畫像相關(guān)的資源,就像《帶胡須的蒙娜麗莎》一樣。這兩個(gè)資源能會共享同一對元素值,說明其與《蒙娜麗莎》畫像相關(guān)、從中派生而來,并在這兩個(gè)源與后者之間建立起關(guān)系。因此,這符合一對一原則,即每個(gè)資源都擁有自己的元數(shù)據(jù)錄,但是資源之間的某種重要關(guān)系也得到了記錄。列出的“美國國會圖書館圖書在版編目”(LibraryofCongressCataloginginPublication)數(shù)位置,而且實(shí)際上一條記錄的保存位置也會發(fā)生變化。no公司維護(hù)著(壓縮磁盤數(shù)據(jù)庫)。正如其名,是關(guān)于(光盤)以及在中保存的音樂文件的描述性元數(shù)據(jù)記錄數(shù)據(jù)庫。任何獲得授權(quán)的音樂播放器應(yīng)用都可以訪問在線數(shù)據(jù)庫中的這些記錄來向應(yīng)用的使用者展示這類元數(shù)據(jù)。換句話說,是外部元數(shù)據(jù)記錄的集合。開發(fā)的初衷在于早期沒有包括任何關(guān)于其內(nèi)容的元數(shù)據(jù),后來–文字規(guī)范出現(xiàn)后,人們才得以在中保存這種元數(shù)據(jù)。然而,這種–文字?jǐn)?shù)據(jù)與其描述的音樂文件分別保存在中的不同位置。這樣看來,中的–文字”記錄依舊是外部元數(shù)據(jù)記錄,同樣,位于本書版權(quán)頁的元數(shù)據(jù)相對于本書的實(shí)際內(nèi)容來說也是外部元數(shù)據(jù)記錄。然而,在翻錄時(shí)(即拷貝上的文件并將其轉(zhuǎn)換為其他格式),許多應(yīng)用也會翻錄中關(guān)于音頻文件的–文字?jǐn)?shù)據(jù)。換句話說,在這種情況下,數(shù)字音頻文件華盛頓哥倫比亞特區(qū)西北區(qū)賓夕法尼亞大街1600號,郵編:20500(1600PennsylvaniaAveNWWashington,DC20500)規(guī)范日期與時(shí)間格式的ISO8601標(biāo)準(zhǔn)、美國公民的社保號碼等等。甚至還有體系來為學(xué)術(shù)圖默撒·巴卡(MurthaBaca),被我們遺忘的服務(wù)和其他一些如今聽起來名字古怪的服務(wù)是十分流行的數(shù)據(jù)傳輸方式。要更加有效地描述網(wǎng)絡(luò)中的文件。( 的《創(chuàng)新的擴(kuò)散》(DiffusionofInnovations)是社會科學(xué)領(lǐng)域中被引用最多的作品,并且復(fù)雜性會增加采納創(chuàng)新的成本。當(dāng)然,成本可以是財(cái)務(wù)成本,而新技術(shù)成本往往十分高本。以學(xué)開車為例,如果考慮到你為了學(xué)習(xí)嫻熟駕駛可能花費(fèi)的時(shí)間(駛教練帶來的壓力),經(jīng)過改進(jìn)的新版本發(fā)布時(shí),新技術(shù)的早期采用者已經(jīng)耗費(fèi)了為早期版本付出的時(shí)間和金錢。再拿數(shù)字視頻的媒介來說,早期采用者使用的是視頻光碟,這隨后完全被D數(shù)字光碟取代,后者又被藍(lán)光光碟取代……15表圖關(guān)于這件藝術(shù)作品的第一個(gè)描述性陳述如下:這個(gè)資源的標(biāo)題是“蒙娜麗莎。但是蒙娜麗莎”(ona)在意大利語的拼寫為aoond。那么我們該使用哪個(gè)作為標(biāo)題呢?答案:兩者皆可。都柏林核心元數(shù)據(jù)元素“標(biāo)題的描述明確說明這是一個(gè)為資源賦予的名稱”,但是卻沒有具體說明一點(diǎn),即標(biāo)題就是唯一的名稱。我們將在下面進(jìn)一步探但是講述的卻是不同的事物。delGiocondo)之妻麗莎·格拉迪尼(LisaGherardini)命名。因此關(guān)于這幅畫像做出的另標(biāo)題:LaGioconda日期:1503—1506說,從建議最佳實(shí)踐的角度來說,“日期元素應(yīng)采用O860標(biāo)準(zhǔn)等編碼體系,“主題元素應(yīng)從受控詞匯表中選擇一個(gè)值,“格式元素應(yīng)選自(互聯(lián)網(wǎng)多用途互聯(lián)網(wǎng)郵件擴(kuò)展)類別的受控詞匯表,“標(biāo)識符元素應(yīng)使用符合某一正式且唯一識別符系統(tǒng)的值,關(guān)聯(lián)”和資源元素應(yīng)采用唯一的標(biāo)識符來識別相關(guān)的資源。對于“創(chuàng)作者”元素沒有建議最佳實(shí)踐,但是在實(shí)際操作中往往要使用名稱規(guī)范文檔。 如,雖然列奧納多·達(dá)芬奇說意大利語,但是這對于描述《蒙娜麗莎》畫像本身并沒有關(guān)素。一般來說,美術(shù)品或數(shù)字文件等人工制品都具有單一的“創(chuàng)作者標(biāo)題格式和日期”等元素。于”(,被描述資源是相關(guān)資源的一部分)、“受眾(udne,實(shí)體、人或其他類別等資源服務(wù)的對象)有15種核心元素的基礎(chǔ)上增加了由40個(gè)術(shù)語組成的集合。擴(kuò)展元素集的第二種機(jī)制是運(yùn)用修飾詞(qu)。修飾詞特定于個(gè)體的單獨(dú)元素,可更加精準(zhǔn)地解讀或細(xì)化元素的含義。以各辦公室之間的備忘錄為例,第一版草擬于201412月1日,隨后在12月3日和5日分別進(jìn)行過修訂。此外,該備忘錄僅適用于2015年第一季布以及最后期限實(shí)質(zhì)上都是日期,因此可以用元素集中的“日期核心元素來進(jìn)行描述。但是核心元素“日期并不具有特定性,即,與資源生命周期中某一事件相關(guān)的時(shí)間點(diǎn)或一段時(shí)間”。我們需要更多的詳細(xì)信息涵蓋更為具體的日期類型。通過為日期元素添加修飾詞就能達(dá)到提供這種詳細(xì)信息的目的,例如:實(shí)際上,所有這些修飾詞都以都柏林核心元數(shù)據(jù)術(shù)語的形式存在,即“建”()、“已修改(odd)和有效”()。這些對“日期元素的具體細(xì)用的修飾詞廣受歡迎、實(shí)用性強(qiáng),并且被納入了術(shù)語集之中。這些用例中包括版本控制 和修飾詞的構(gòu)建都必須基于都柏林抽象模型(DublinCoreAbstractModel)。抽象模型是(達(dá)爾文核心)是尚未納入術(shù)語集的用例之一,其命名的巧妙之處在于它是一種提供生物多樣性信息的元數(shù)據(jù)模式。包括基于術(shù)語“位置(oon)的元素,例如“大陸”(onnn)、國家”(oun)、“島(nd)和“水體(ody),還包括特定領(lǐng)域元素,例如“界(kngdo)和“門(phyu)。元素根據(jù)都柏林抽象模型構(gòu)表了廣泛的適用性從而使其有資格被納入到術(shù)語集之中。舉例來說,如果我們要根據(jù)ISO8601實(shí)際上,從1995年首次發(fā)布L 2.規(guī)范時(shí)起,就包括了支持在網(wǎng)頁中嵌入元據(jù)的功能。是hd元素的子元素,換句話說,元素包含在網(wǎng)頁的頁頭部分中。頁頭部分含有關(guān)于網(wǎng)頁的多種元數(shù)據(jù),包括文檔標(biāo)題、樣式表等。元素還包含了hd其他子元素沒有明確說明的網(wǎng)頁元數(shù)據(jù)。換句話說,是一組雜項(xiàng)的集合。標(biāo)簽擁有集中屬性,但是其中只有兩種與本書中的討論有關(guān):名稱(n,相當(dāng)于元數(shù)據(jù)元素)以及內(nèi)容(onn,為該元素分配的值)。L5對名稱”元素給出了5種標(biāo)準(zhǔn)值:作者(uho,自我說明)、描述(dpon,同樣是自我說明)、生成器<metaname=“author”content=“Jeffrey<metaname=“description”content=“Chapter3ofthebookMetadata,publishedbyMIT<metaname=“keywords”content=“metadata,DublinCore,DarwinCore,uniqueidentifiers,metatag,ISO8601,EssentialKnowledgeSeries”>作者、描述、生成器、應(yīng)用名稱(application-name)以及關(guān)鍵詞都是HTML5規(guī)范文檔正<metaname=“dc.creator”content=“Jeffrey<metaname=“dc.description”content=“chapter3ofthebook<metaname=“dc.publisher”content=“MIT<metaname=“dc.language”content=“en”scheme=“ISO<metaname=“dc.identifier”content=“978-0-262-52851- (2015).Metadata.Cambridge,MA:TheMITPress.”>而事實(shí)正是如此。關(guān)鍵詞堆砌(keywordstuffing)是一種十分常見的“黑帽”(即,不道德話說,就是類似于下方的標(biāo)簽:<metaname=“keywords”content=“…”>),但是谷歌在顯來說至關(guān)重要,美國數(shù)字公共圖書館、歐洲數(shù)字圖書館和多媒體數(shù)據(jù)庫(dbpda)等項(xiàng)因?yàn)榇_立這些原則的正是最初建立都柏林核心元數(shù)據(jù)元素集的團(tuán)隊(duì)。海軍上將格拉斯·霍珀(GraceHopper)數(shù)字?jǐn)z影是常見的技術(shù)性元數(shù)據(jù)應(yīng)用場景之一——多數(shù)現(xiàn)代數(shù)字相機(jī)和智能手機(jī)都會向照片這種圖像文件中嵌入一條內(nèi)容豐富的元數(shù)據(jù)記錄。當(dāng)你將圖像從相機(jī)中下載到另一臺電腦或者上傳到k或ng等照片共享網(wǎng)站時(shí),這條元數(shù)據(jù)記錄會附在圖像文件中。圖你可以使用一些軟件應(yīng)用程序和網(wǎng)站來查看、編輯xf數(shù)據(jù)。ho和dobehoohop等圖像管理與處理應(yīng)用程序以及k和ng等照片托管服務(wù)都可以顯示xf數(shù)據(jù)。有些網(wǎng)站和網(wǎng)絡(luò)瀏覽器插件也可以在網(wǎng)頁上顯示這種元數(shù)據(jù)。第三方服務(wù)也可以從數(shù)字圖中提取這種元數(shù)據(jù)并以各種方式加以利用。“我知道你的貓住在哪兒(I now ourtv,主頁:knohyouv.o)項(xiàng)目利用嵌入在xf記錄中的數(shù)據(jù)在世界地圖上為來自網(wǎng)絡(luò)照片托管服務(wù)的照片定位。另一個(gè)項(xiàng)目hooyn(phooynh.n)則更進(jìn)一步,將在相同地點(diǎn)拍攝的多張照片拼接成為全景視圖。比如說,我在用MicrosoftWord(微軟公司的文字處理器應(yīng)用程序)寫這章內(nèi)容的時(shí)候,次數(shù)(次數(shù)太多了,我都不愿意承認(rèn)),即使這種數(shù)據(jù)沒有嵌入到o文件中,我也可以從計(jì)算機(jī)的文件系統(tǒng)中提取出一些。所有計(jì)算機(jī)操作系統(tǒng)都可以顯示關(guān)于計(jì)算機(jī)文件的一些技術(shù)性元數(shù)據(jù),例如創(chuàng)建日期與實(shí)踐、最后修改日期和時(shí)間以及文件大小。(尤尼斯)操作系統(tǒng)則更進(jìn)一步,可以顯集的資源特點(diǎn)數(shù)量和類別會越來越多。據(jù)應(yīng)用場景之一。21是(國際標(biāo)準(zhǔn)化組織)頒布的標(biāo)準(zhǔn),定義了一種開放式框架,基于這種框架可構(gòu)建應(yīng)用程序來提供并顯示多媒體文件。21標(biāo)準(zhǔn)的核心在于數(shù)字項(xiàng)(gl)——一種結(jié)構(gòu)性數(shù)字對象,可包括視頻、圖像、音軌和其他資源,還有描述這些資源之間關(guān)系的數(shù)據(jù)。(數(shù)字項(xiàng)聲明語言)描述了用于表達(dá)數(shù)字項(xiàng)的術(shù)語與概念集合。在這些術(shù)語中,“容器”可容納多個(gè)子實(shí)體,包括一個(gè)描述符、多個(gè)項(xiàng)目以及其他容器;項(xiàng)目指可通過多媒體播放器應(yīng)用程序向用戶顯示的數(shù)字項(xiàng);單個(gè)項(xiàng)目可包含多個(gè)子項(xiàng)(括多首獨(dú)立歌曲一樣)、描述符以及條件;“描述符指關(guān)于某一容器或項(xiàng)目的描述性元數(shù)據(jù);“條件定義了多媒體播放器在顯示某一文件前必須進(jìn)行的測試(例如,將顯示的文件格式)。還可以包括許多其他元素,全部元素共同決定多媒體對象的內(nèi)容以及如何在一系列軟件和權(quán)限環(huán)境中顯示。根據(jù)W3C(萬維網(wǎng)聯(lián)盟)數(shù)據(jù)溯源孵化組(ProvenanceIncubatorGroup)的定義,資源溯遺憾的是,knn如今已經(jīng)不復(fù)存在。(不過一種名為khdog的新服務(wù)同樣可以提供knn的大部分功能。)但是,knn短暫而有益的一生讓人們清楚子資源不僅易于復(fù)制,而且便于編輯(就像維基百科文章一樣)。knn十分明確可靠性,同樣有必要了解什么實(shí)體影響過資源的歷史。雖然目前存在幾種溯源元數(shù)據(jù)模式,但其他領(lǐng)域中對于其他用例的標(biāo)準(zhǔn)化(數(shù)據(jù)元素集用于一般用途,蓋蒂名詞表用于藝術(shù)對象、xf用于數(shù)字圖像等)尚未發(fā)生在資源的特點(diǎn)以及影響資源的實(shí)體,并且都對資源和實(shí)體之間的關(guān)系進(jìn)行了分類。3在為實(shí)體(ny)、代理(gn)和活動(vy),與3數(shù)據(jù)溯源孵化組的定義一致,即“實(shí)體是一種資源,代理是影響資源生命周期的實(shí)體,而活動是這種影響的本質(zhì)。實(shí)體可能起源于其他實(shí)體或歸因于某個(gè)代理,也可能產(chǎn)生于或被用于活動,以此類推(見圖4–2)。圖數(shù)據(jù)模型定義了對于保存流程非常重要的4種實(shí)體:對象(ob,數(shù)字資源,既具體資源)、代理(gn,可影響對象的人或組織)、活動(vn,由代理針對某對象進(jìn)行的、帶有時(shí)間標(biāo)記的操作)以及權(quán)限聲明(ghsn,知識產(chǎn)權(quán)等許可)。每個(gè)這種實(shí)體都包括一個(gè)“語義單元集合,這在其他元數(shù)據(jù)模式中被稱為元素(見圖4–3)圖為這4類實(shí)體具體列出了許多語義單元。對象的語義單元中有些大家已經(jīng)十分熟悉,例如大小(e)、格式(o)和創(chuàng)建應(yīng)用程序(ngppon),其他的大家可能不太熟悉,例如重要屬性(gnnop,重要得足以值得保存的資源特點(diǎn))和保存級別(pvonv,應(yīng)用于某個(gè)對象的保存功能)。其他語義單元也同樣與此相似:用于代理的名稱(ne)、類型(yp)和識別符(dn)等;用于活動的日期、描述和識別符等。對如何為某些語義單元?jiǎng)?chuàng)建或選擇值提出了建議,不過與都柏林核心元數(shù)據(jù)元素集的“推薦最佳實(shí)踐相比,這些建議往往不具有那么強(qiáng)的描述性。盡管都柏林核心元數(shù)據(jù)元素集建議對日期元素采用O860等編碼體系,S只是建議語義單元“由應(yīng)用程序創(chuàng)建的日期(ddyppon)的值應(yīng)當(dāng)采用結(jié)構(gòu)化形式”,然而在其他領(lǐng)域中,為了能提供盡可能多的細(xì)節(jié)來支持?jǐn)?shù)字保存過中格式元素的“推薦最佳實(shí)踐是從互聯(lián)網(wǎng)多用途互聯(lián)網(wǎng)郵件擴(kuò)展類別的受控詞匯表中選擇一個(gè)值。提出了同樣的建議,此外進(jìn)一步具體到實(shí)際應(yīng)具有9個(gè)與格式相關(guān)的語義單元,包括格式名稱(oe)、格式版本(oo)和格式注冊表語可以量化“權(quán)限元素:授權(quán)(n,一種法律文檔)、權(quán)限持有者(ghodr,個(gè)人或組織)和使用權(quán)(ghs,權(quán)限持有者根據(jù)授權(quán)中理應(yīng)使用資源所必須擁有的權(quán)限)限元數(shù)據(jù)大開方便之門。C (創(chuàng)作共用權(quán)限表達(dá)語言)是眾多廣泛應(yīng)用的模式之一?!皠?chuàng)作共用是通過建立標(biāo)準(zhǔn)化法律授權(quán)來推動創(chuàng)作的一個(gè)項(xiàng)目,其標(biāo)準(zhǔn)化法律授權(quán)允許創(chuàng)作者有選擇性地保留在“版權(quán)標(biāo)目下捆綁在一起的多項(xiàng)不同權(quán)限,同時(shí)允許對相關(guān)的作品進(jìn)行一定的使用。為了達(dá)到這一目的,“創(chuàng)作共用項(xiàng)目不得不極為精細(xì)地解析版權(quán)。為此,該項(xiàng)目詳細(xì)地說明了涉及版權(quán)的實(shí)體與關(guān)系。C的規(guī)范識別了兩類屬性,即作品的屬性與作品授權(quán)的包括原有的屬性名稱(buon,如果更改或再次分發(fā)某一作品,賦予屬性時(shí)引用的名稱)和屬性(buon,為該屬性提供的,最好為唯一識別符)。以下是授權(quán)屬性:允許(p)、禁止(pohbs)、要求(qu)、管轄地(poduon)、分發(fā)(dbuo)和衍生作品(dvvok),而“禁止只可能出現(xiàn)一個(gè)值,即商業(yè)使用(oe)。創(chuàng)作共用”項(xiàng)目在標(biāo)準(zhǔn)化法律授權(quán)方面運(yùn)用了C擇哪些作為最適合的資源。元–表頭(hd)包括關(guān)于文檔本身的元數(shù)據(jù),而不是關(guān)于文檔中被描述資源的元數(shù)據(jù)。換句話說,如果是關(guān)于元數(shù)據(jù)記錄的元數(shù)據(jù),那么文檔的表頭部分就是檔的日期以及與文檔相關(guān)的代理角色(創(chuàng)作者、編輯者、檔案管理人、知識產(chǎn)權(quán)所有者等)。描述性元數(shù)據(jù)自然而然包含的是描述性元數(shù)據(jù)。就像一樣,并沒有明確文檔能使用哪些描述性元數(shù)據(jù)模式,因?yàn)橛刑嗄J娇蛇x:實(shí)際上,允許使用多個(gè)描述性元數(shù)據(jù)部分,因此可以使用多種模式來描述一個(gè)單獨(dú)的資源?!懊枋鲂栽獢?shù)據(jù)部分并沒有提供任何原生的元素來描述資源。在其他模式下,元數(shù)據(jù)記錄提供的所有描述或者“封裝在文檔之中,或者關(guān)聯(lián)文檔。然而,“描述性元數(shù)據(jù)部分提供的一識別符。結(jié)構(gòu)地圖(StructuralMap)部分提供了一種機(jī)制,用于組織METS文檔在“文件”部分識別METS文檔的結(jié)構(gòu)鏈接(StructuralLink)極為簡單——僅僅是具體說明METS以回答——搜集所有你的呼出與呼入電話,以及你的手機(jī)位置。我從1996過的每個(gè)網(wǎng)站。因?yàn)槲規(guī)啄暌詠矶荚谑褂胔oe瀏覽器,所以谷歌可能也記錄了我從那時(shí)起訪問過的每個(gè)網(wǎng)站。“我們根據(jù)元數(shù)據(jù)決定要誰的命。2014年4月,邁克爾·海登(MichaelHayden)將軍在約翰·霍普金斯大學(xué)參加“重新評估美國國家安全局”(ReevaluatingtheNSA)委員會辯論時(shí)語驚四座。海登將軍是美國國家安因元數(shù)據(jù)而死,這怎么可能?盡管從刺殺(Assassinations)到僵尸藝術(shù)(Zombieart)等任何作品都可以用藝術(shù)和建筑敘詞表(Art&ArchitectureThesaurus)來描述,但沒人會因游戲《凱文·貝肯的六度分離》(SixDegreesofKevinBacon)科斯·[1](MaxSchreck)與沃夫甘·齊爾澤(WolfgangZilzer)(Boykott),而沃夫甘與伊麗莎白·麥戈文(ElizabethMcGovern)共同出演了《愛到發(fā)燒》(Lovesick)·貝肯共同出演了《天下父母心》(She’sHavingaBaby),因此令人驚訝的是,馬科斯·夏瑞克的“貝肯數(shù)”只有3。顯而易見,《凱文·貝肯面,“六度分離”理論受到了斯坦利·米爾格蘭姆(StanleyMilgram)在1967年提出的小世界實(shí)驗(yàn)(SmallWorldExperiment)的影響,這也是世界上最早針對社交網(wǎng)絡(luò)進(jìn)行的實(shí)證研(Erd?snumber),以曾經(jīng)極為廣泛地合作、聯(lián)合撰寫論文的數(shù)學(xué)家保羅·埃爾德什(Paul曾經(jīng)是一部紀(jì)錄片《N是一個(gè)數(shù)字》(NIsaNumber)·貝肯本人的在構(gòu)建一個(gè)社交網(wǎng)絡(luò)時(shí)——也就是嘗試對節(jié)點(diǎn)進(jìn)行分類、對邊緣進(jìn)行標(biāo)記時(shí)——完全地錄每一類人、事物和關(guān)系也許會無功而返,因?yàn)檫@樣的集合太大了。對于你嘗試構(gòu)建的絡(luò)來說,關(guān)鍵在于決定哪些是重要的節(jié)點(diǎn)類型和邊緣標(biāo)簽。這些在《凱文·貝肯的六度分離》中非常簡單,為此人人都能輕易上手這個(gè)游戲。相比之下,boo更為復(fù)雜,因?yàn)槠渲猩婕案囝愋偷墓?jié)點(diǎn)與邊緣。但是boo提供了軟件界面,能向用戶展示這些選項(xiàng)并且在后臺使用算法來為用戶管理社交網(wǎng)絡(luò)。這些是boo的重要特性??偟膩碚f,網(wǎng)絡(luò)的要點(diǎn)在于:網(wǎng)絡(luò)越復(fù)雜,越為關(guān)鍵的就是計(jì)算要融入網(wǎng)絡(luò)的管理,尤其是分析之中羅賓·鄧巴(obn unb)最先發(fā)現(xiàn)了靈長類動物的腦容量與這些物種平均社交群體規(guī)模之間的關(guān)系。鄧巴根據(jù)研究結(jié)果提出,人類個(gè)體的社會群體最大規(guī)模——一個(gè)人可保穩(wěn)定社會關(guān)系并且了解每個(gè)人與其他個(gè)人之間關(guān)系的最大人群數(shù)量——大約為150人。在此之后,研究者們對這一數(shù)字進(jìn)行過爭論,但是預(yù)估數(shù)量不會比250人這個(gè)值高出多少。簡而言之,人類可以記住相當(dāng)大的一個(gè)社交網(wǎng)絡(luò),只要自身處于這個(gè)網(wǎng)絡(luò)中就可以,但分析較大的網(wǎng)絡(luò),或者在自身社交圈之外的網(wǎng)絡(luò),就需要借助計(jì)算。(poy)、共同旅行(vh)和已發(fā)送的論壇消息(noug)。我們也可以想象其他可能存在的邊標(biāo)簽,例如呼叫()、發(fā)送電子郵件至(nt o)、旅行至(vso)以及拜訪過(v)等。[1]曾在1922年無聲電影《諾斯費(fèi)拉圖》(Nosferatu)中扮演歐洛克公爵(CountOrlok)?!獙τ谂c學(xué)習(xí)資源有關(guān)的使用性數(shù)據(jù)來說,并行數(shù)據(jù)是一個(gè)相對較新的術(shù)語。采用這一術(shù)的大背景是(國家自然科學(xué)數(shù)字圖書館)希望通過一種方法來引用用戶在中使用數(shù)字學(xué)習(xí)對象的情況。最初是美國國家科學(xué)基金(onl neoundon)的一個(gè)項(xiàng)目,現(xiàn)在已經(jīng)成為關(guān)于高質(zhì)量在線教育資源的元數(shù)據(jù)以及相關(guān)鏈接的集合,尤為關(guān)注的是M學(xué)科,即科學(xué)(n)、技術(shù)(hnoogy)、工程(NASA)、美國公共電視網(wǎng)(PBS)、美國自然歷史博物館(AmericanMuseumofNaturalHistory)等網(wǎng)站以及許多其他NSDL的門戶網(wǎng)站,可以在種類繁多的集合中提供搜本身并不存放任何教育資源,所有資源都存放在其他組織的網(wǎng)站上。完全由與教育資源和存放這些資源的組織有關(guān)的描述性元數(shù)據(jù)構(gòu)成。然而,除了這類元數(shù)據(jù)以外,上被提及過多少次,在課程中被使用過多少次,修改過多少次,以及其他使用指標(biāo)。在關(guān)于并行數(shù)據(jù)的文檔中,明確指出,并行數(shù)據(jù)的目的不是替代描述性元數(shù)據(jù),而是對其進(jìn)行補(bǔ)充。存放的描述性元數(shù)據(jù)能幫助用戶搜索、瀏覽教育資源。搜集的并行數(shù)據(jù)可以為本身以及其他合作組織反饋如何、為什么以及誰曾經(jīng)使用這些資源。在本書出版之時(shí),將并行數(shù)據(jù)這一術(shù)語定義為“關(guān)于教育資源的使用性元數(shù)據(jù)。然而,毫無疑問不是唯一一個(gè)搜集并行數(shù)據(jù)的組織。在過去幾年中,儀表盤(hbo)成為展示網(wǎng)站和其他在線系統(tǒng)數(shù)據(jù)的常用工具。舉例來說,谷歌分析(GoogeAnalytics)是搜集詳細(xì)網(wǎng)站使用數(shù)據(jù)的知名系統(tǒng)。許多學(xué)習(xí)管理系統(tǒng)——存放在圖Loremipsum,Dolorsitamet,consecteturadipisicingelit,seddoeiusmodtemporincididuntutlaboreetdoloremagnaaliqua.Utenimadminimveniam,quisnostrudexercitationullamcolaborisnisiutaliquipexeacommodoconsequat.Duisauteiruredolorinreprehenderitinvoluptatevelitessecillumdoloreeufugiatnullapariatur.LoremDolorsitamet,consecteturadipisicingelit,seddoeiusmodtemporincididuntutlaboreetdoloremagnaaliqua.Utenimadminimveniam,quisnostrudexercitationullamcolaborisnisiutaliquipexeacommodoconsequat.DuisLorem:ipsumDolor:sitametConsectetur:Elit:seddoeiusmodtemporincididuntUtlaboreetdoloremagnaaliqua.Utenimadminimveniam,quisnostrudexercitationullamcolaborisnisiutaliquipexeacommodoconsequat.答案:這段文字的格式表明這是一條備忘錄或一封郵件,上方為信頭(表圖,即資源描述框架,是用于描述資源的框架。公平地講,是一種同義反復(fù),但是它用作定義時(shí),要比一般情況下的同義反復(fù)更加有用。它是組織數(shù)據(jù)所依賴的一種框架和邏輯結(jié)構(gòu)??蚣艿哪康氖鞘裁矗棵枋鲑Y源。什么資源呢?盡管一般用于描述網(wǎng)絡(luò)資源,但是基本上可以用來描述任何資源。簡而言之,是一種對實(shí)體做出描述性陳述的通用數(shù)據(jù)模型。圖在線服務(wù)中加以引用。假設(shè)盧浮宮聘用了攝影師弗雷德里克·D.芬奇(FrédéricD.Vinci)圖家”、島等元素)。實(shí)際上,都柏林核心元數(shù)據(jù)元素集作為基礎(chǔ)并且運(yùn)用通用抽象模型核心元數(shù)據(jù)元素集的初衷——“推動發(fā)展聯(lián)網(wǎng)電子信息對象資源描述(或元數(shù)據(jù))記錄的技術(shù)水平”。當(dāng)所有模式都認(rèn)可相同現(xiàn)存的實(shí)體與關(guān)系時(shí),這種創(chuàng)建元數(shù)據(jù)模式的“模塊式方法才得以體,而3的溯源模式則認(rèn)為代理是可以影響資源生命周期的實(shí)體。這些實(shí)體不僅擁有一種挑戰(zhàn)。抽象模型基本上來說是一種確定元數(shù)據(jù)模式本體的機(jī)制。抽象模型采用了一種我們比較熟悉的方法來確定元數(shù)據(jù)模式的本體。被描述資源是三元組的主題(例如,《蒙娜麗莎》畫像)。被描述資源由屬性–值配對進(jìn)行描述。屬性–值配對由單獨(dú)一個(gè)屬性和單獨(dú)一個(gè)值構(gòu)成(例如,創(chuàng)作者是列奧納多·達(dá)芬奇)。圖<h2>Thistextisheading</h2>(<h2>這段文字是標(biāo)題<b>Thistextisbold</b>(<b>這段文字要加粗<ahref=“\h/”>Thistextisalink</a>(<ahref=“\h/”>這段文是“可擴(kuò)展標(biāo)記語言(xnbekupnguge)的縮寫。雖然縮寫以”開頭,但是“可擴(kuò)展(xnb)并不是以”開頭。我也回答不了為什么縮寫是。]再次強(qiáng)調(diào)一點(diǎn),不是一種語言,而是一個(gè)指令集合。是具體說明如何對網(wǎng)頁文檔進(jìn)行格式化的指令集合,而則是具體說明其他標(biāo)記語言的指令集合。但是對于來說,這是可行的。比如說,你可以用來構(gòu)建一種語言。實(shí)際上,人們已經(jīng)成功地實(shí)現(xiàn)了這一點(diǎn),那就是。L 5是本書出版時(shí)最新版本,同樣構(gòu)建在之上——盡管之前版本的構(gòu)建在另一種標(biāo)記語言(標(biāo)準(zhǔn)通用標(biāo)記語言)的基礎(chǔ)之上。答案就在于(文檔類型定義)。文檔可以聲明并定義一種標(biāo)記語言中存在的所有元素。不同版本的擁有不同的文檔。但是語言編寫的元素在各個(gè)版本中都相當(dāng)穩(wěn)定,而這些也十分類似。當(dāng)前語言版本的包含了上一版本中所有標(biāo)記元素的定義。例如,L4.0版本的中包含的標(biāo)目與字體樣式聲明如下:<!ENTITY%heading“H1|H2|H3|H4|H5|<!ENTITY%fontstyle“TT|I|B|BIG|這是一個(gè)L 的簡單示例。然而,的美妙之處在于可以用來定義任何標(biāo)記言的元素。舉例來說,也聲明了都柏林核心元數(shù)據(jù)元素集。下面這行代碼聲明了15種元素:<!ENTITY%dcmes“dc:title|dc:creator|dc:subject|dc:description|dc:publisher|dc:contributor|dc:date|dc:type|dc:format|dc:identifier|dc:source|dc:language|dc:relation|dc:coverage|dc:rights”><!ELEMENTdc:title(#PCDATA)<!ATTLISTdc:titlexml:langCDATA#IMPLIED<!ATTLISTdc:titlerdf:resourceCDATA#IMPLIED(ParsedCharacterData)以及標(biāo)題屬性(AT-TLIST),而且必須是不同的數(shù)據(jù)類型(字這里沒有必要進(jìn)一步討論如何創(chuàng)建。上文曾經(jīng)提到,延伸閱讀”更多的詳細(xì)信息。這些非常簡單的案例無一例外地展示了可以在中聲明任何元素。聲明多種元素的可以聲明完整的標(biāo)記語言,或完整的元數(shù)據(jù)模式。然而,這里也沒有必要過多討論,因?yàn)橐呀?jīng)越來越少見了。原因在于L不再構(gòu)建于之上,而沒有聲明L中的元素。相反,M(文檔對象模型)聲明了L元素,其中包括以層級樹狀結(jié)構(gòu)組織的所有L5元素。所有現(xiàn)代網(wǎng)絡(luò)瀏覽器都具有引用這種M的功能,并且可以據(jù)此解讀文檔中使用的元素。從極為宏觀的層面上來講,和十分相似,兩者都可以聲明標(biāo)記語言中的元素以及元核心元數(shù)據(jù)元素集的新版本來適應(yīng)這種“去的趨勢。XMLDTD來具體說明。與屬于3技術(shù)棧的基礎(chǔ)。位于基礎(chǔ)之上的是移動、語音以及其他網(wǎng)絡(luò)服務(wù)技各種技術(shù),尤其是語義網(wǎng)。湯姆·希斯(TomHeath)與克里斯汀·比澤爾(ChristianBizer),《關(guān)聯(lián)數(shù)據(jù):讓網(wǎng)絡(luò)進(jìn)化成為全球數(shù)據(jù)空間》(LinkedData:EvolvingtheWebintoaGlobalDataSpace)蒂姆·伯納斯李(mne)發(fā)明了萬維網(wǎng)后并不就此滿足,隨后闡明了對數(shù)據(jù)網(wǎng)據(jù)還可以通過軟件來處理,因此應(yīng)用程序可以為用戶來執(zhí)行各種任務(wù)。伯納斯·李和他的同事在2006舊沒有實(shí)現(xiàn)。悼念亡友威廉·彼得(WilliamPeter)而創(chuàng)作了《悼亡》(AFuneralElegy,目前文學(xué)學(xué)者很多人也許會享受我們的電腦用雨果·維文(ugovng,史密斯特工的扮演者)的聲音說話,但是史密斯特工并不是伯納斯·李和他的同事所指的軟件代理。軟件代理的語義算機(jī)程序。伯納斯·李和他的同事在那篇原創(chuàng)文章中以問診預(yù)約排期為例來說明在語義網(wǎng)依托的未來進(jìn)行篩選,最后與治療提供方的代理進(jìn)行溝通來根據(jù)你的日程來進(jìn)行問診預(yù)約。日程也許可以說是這個(gè)示例中最為簡單的部分。本書前幾章曾提到,ISO8601是一種表達(dá)日期和時(shí)間的標(biāo)準(zhǔn),因此假設(shè)這個(gè)示例中的所有日程都根據(jù)ISO8601標(biāo)準(zhǔn)進(jìn)行編碼。你日這種語義網(wǎng)需要的不僅僅是將結(jié)構(gòu)化數(shù)據(jù)上傳到網(wǎng)上,還需要在結(jié)構(gòu)化數(shù)據(jù)之間建立聯(lián)系。實(shí)際上,網(wǎng)頁之間存在的聯(lián)系正是讓語義網(wǎng)成為“網(wǎng)絡(luò)據(jù)之間的關(guān)聯(lián)支持軟件在數(shù)據(jù)集之間建立聯(lián)系。湯姆·希斯和克里斯汀比澤爾在他們以關(guān)聯(lián)數(shù)據(jù)為題的著作中提到,“關(guān)聯(lián)數(shù)據(jù)的基本概念是將萬維網(wǎng)的一般架構(gòu)應(yīng)用在全球范圍內(nèi)共享結(jié)構(gòu)化數(shù)據(jù)的任務(wù)”。盡管網(wǎng)絡(luò)是一個(gè)復(fù)是用于描述資源的框架,借此來利用主謂賓三元組。三元組(即主語)所描述的資源通過來進(jìn)行唯一識別,從而實(shí)現(xiàn)對資源的解引用。三元組中的賓語也是一個(gè)資源,同用戶要在語義網(wǎng)引擎中搜索“蒙娜麗莎這一關(guān)鍵詞,有可能搜索結(jié)果中會包括《蒙娜麗莎》畫像的電子圖像、關(guān)于這幅畫的描述性元數(shù)據(jù)以及相關(guān)鏈接以便了解更多關(guān)于列奧納多·達(dá)芬奇、麗莎·戴爾吉奧亢多和盧浮宮博物館的數(shù)據(jù)。簡而言之,能幫助用戶將資源置于情境之中的數(shù)據(jù)。 生》(TheBirthofVenus)從伯納斯·李和他的同事最初寫下那篇關(guān)于語義網(wǎng)的文章到現(xiàn)在已經(jīng)有15年了,然而軟件服務(wù)在多數(shù)情況下彼此直接交互,通過(應(yīng)用程序編程接口)提供并獲取結(jié)構(gòu)化數(shù)日程表就是一個(gè)非常好的示例。在許多活動發(fā)揮重要作用的組織(學(xué)校、劇院等)方網(wǎng)站上會提供nd(日歷數(shù)字交換)推送。這種數(shù)據(jù)在網(wǎng)絡(luò)中十分常見,其形式往往為后綴是的鏈接,一般還會帶有一個(gè)日歷圖標(biāo)。nd標(biāo)準(zhǔn)利用開始與結(jié)束時(shí)間、摘要和活動組織者等元素對活動元數(shù)據(jù)進(jìn)行編碼。nd推送是一條鏈接。許多日程表應(yīng)用都支持向日程表中添加鏈接,這樣就能展示推送數(shù)據(jù)編碼的所有活動。由于數(shù)據(jù)推送的形式是鏈接,提供方可以更新推送。舉例來說,如果我訂閱了波士頓紅襪隊(duì)(oondox)的nd數(shù)據(jù)推送,我的個(gè)人日程表就總是會列出紅襪隊(duì)的比賽日程。另外一個(gè)可以充分說明通過提供、獲取元數(shù)據(jù)的例子是從照片托管服務(wù)中獲取xf數(shù)據(jù)。第四章中我們曾討論過“我知道你的貓住在哪兒項(xiàng)目和hooynh項(xiàng)目。這些服務(wù)會通過k和ng等照片托管服務(wù)的I查詢滿足某些條件(例如包含貓或具體地標(biāo)建筑)的照片,這些照片的xf記錄中包含了數(shù)據(jù)。接下來,地圖應(yīng)用程序的I可以用來導(dǎo)入這種數(shù)據(jù),然后在地圖上為這些照片定位。深奧莫測的主題感興趣,不需要任何許可就能開設(shè)一個(gè)網(wǎng)站、ub(湯博樂)n(照片分享網(wǎng)站)賬號。另一方面,幾乎毫無疑問的是,別人也能根據(jù)任何主題來開設(shè)一個(gè)網(wǎng)站、ub博客或者n賬號,無論這個(gè)主題是否冒犯了你。有些組織控制著網(wǎng)絡(luò)的某些部分。例如,互聯(lián)網(wǎng)名字與編號分配機(jī)構(gòu)()負(fù)責(zé)監(jiān)管域名系統(tǒng)(),就該如此,因?yàn)殛P(guān)于資源可能做出的陳述數(shù)量幾乎沒有限制。詞表:AAT?(藝術(shù)與建筑敘詞表)、TGN?(蓋蒂地理名稱敘詞表)、CONA?(文化對象名稱規(guī)范)和ULAN?(藝術(shù)家人名規(guī)范文檔)。需要注意的是,AAT和TGN都是敘蓋蒂詞匯表在關(guān)聯(lián)數(shù)據(jù)的概念出現(xiàn)前就已經(jīng)建立起來了。是這4種敘詞表中歷史最久的一個(gè),可以追溯到20世紀(jì)70范圍,因此自然要實(shí)現(xiàn)互聯(lián)互通。在本書出版時(shí),的層級仍然處于試點(diǎn)發(fā)布階段,而“蒙娜麗莎尚未納入在線敘詞表之中。但是另一條數(shù)據(jù)列奧納多·達(dá)·芬奇已經(jīng)納入了在線敘詞表。長有濃密頭發(fā)的男子漫畫,識別碼是700002067。這一對象的A記錄包含的多個(gè)元素使用了來自其他蓋蒂敘詞表的值。例如,作品類型(okyp)值為繪畫(n),識別碼是300033973而展示材料(dpyng s)是筆和墨(nndnk),識別碼分別為300022452和300015012。當(dāng)然,這部作品的創(chuàng)者是列奧納多·達(dá)芬奇,他也是中的實(shí)體,識別碼是500010879。這部作品目前在蓋蒂中心的藏品之中,識別碼是500260314,但是很明顯它曾經(jīng)保存在英格蘭,N識別碼是7002445。上面提到的每個(gè)識別碼都是唯一的識別符。蓋蒂研究所為4種敘詞表中的每個(gè)實(shí)體都創(chuàng)建了一個(gè)唯一的識別符。蓋蒂研究所是全球藝術(shù)領(lǐng)域的重要參與者,付出了極大的努力來發(fā)這些敘詞表以及其他與藝術(shù)相關(guān)的標(biāo)準(zhǔn)。因此,許多博物館和其他文化遺產(chǎn)組織都在用蓋蒂研究所的成果。非常重要的一點(diǎn)是這些識別碼都是由蓋蒂研究所分配的。當(dāng)某一源一旦處于網(wǎng)絡(luò)中,那么自然而然就擁有。雖然蓋蒂研究所的唯一識別符得到了廣泛應(yīng)用,卻是由根據(jù)蓋蒂研究所開發(fā)的相關(guān)機(jī)制分配的。這些識別符與蓋蒂研究所服務(wù)器的一一對應(yīng),例如,識別碼7002445與I \hhpvob.gy.dugn7002445相對應(yīng)。訪問這條,就能找到一條包含謂語–賓語配對表的記錄,在上述謂語和賓語的三元組中,“英格蘭為主語。例如,謂語是地點(diǎn)類別”(pyp),而賓語是國家”(主權(quán)國家,ovgn)。聯(lián)數(shù)據(jù)服務(wù)(LibraryofCongressLinkedDataService)(ubtdngsndeuhoy)以及其他幾種詞匯表,其中每個(gè)實(shí)體理所當(dāng)然具有唯一識別符,并且擁有對應(yīng)的。(例如,“列奧納多達(dá)·芬奇的I是\huhonn79034525.h)。作為規(guī)范文檔,將多種來源的記錄整合到了單一的服務(wù)之中。記錄的諸多來源中有美國國會圖書館和蓋蒂研究所。記錄列出了所有提供可匯編數(shù)據(jù)的來源,而這些來源同時(shí)也關(guān)聯(lián)到了原有記錄。當(dāng)然,每條記錄都擁有一個(gè)唯一識別符以及與其對應(yīng)的一個(gè)(“列奧納多達(dá)·芬\h我們在第二章討論“一對一原則時(shí)曾提到,每個(gè)單獨(dú)的資源在單獨(dú)的元數(shù)據(jù)模式下只有一條元數(shù)據(jù)記錄?!霸趩为?dú)的元數(shù)據(jù)模式下這一點(diǎn)非常重要。在這一節(jié)中,我們已經(jīng)提到了至少三條關(guān)于“列奧納多達(dá)·芬奇的記錄。其中每條都用于不同的目的:美國國會圖書館名稱規(guī)范文檔記錄所起到的主要作用是提供人名的受控形式,而提供的不僅僅是人名,還包括傳記和其他信息。將來自多個(gè)來源的數(shù)據(jù)整合到了一條記錄中,借此降都發(fā)揮著雙重作用:成為可以由應(yīng)用程序或服務(wù)解引用的權(quán)威記錄,并且進(jìn)一步提供鏈接,關(guān)聯(lián)到可解引用的資源。 生(Born)元素以及三個(gè)隱含元素:原名(birthname)、出生日期(birthdate)和出生地(placeofbirth),每個(gè)都有相應(yīng)值。維基百科關(guān)于“列奧納多·達(dá)·芬奇”的頁面文字中可一篇維基百科文章對應(yīng)著一個(gè)實(shí)體(一個(gè)人、地點(diǎn)、事物或概念等)。當(dāng)然,人們會爭辯“一個(gè)實(shí)體合并。但是盡管文章會不斷變化,總會有一條pd條目指向文章中的每個(gè)實(shí)體。在本書出版時(shí),125個(gè)不同語言版本的維基百科中共有超過3800萬個(gè)條目。含“……的出生地”(birthplaceof),以及哪些人曾經(jīng)在這座城市中出生的列表,其他類型圖7–1圖在本書出版時(shí),蓋蒂研究所仍在致力于把前文討論的全部4種敘詞表作為關(guān)聯(lián)開放數(shù)據(jù)公布——藝術(shù)與建筑敘詞表和蓋蒂地理名稱詞表已經(jīng)在2014在2015年公布。和中的每條記錄(例如,沙發(fā))目前都含有一個(gè)語義觀點(diǎn)”結(jié)構(gòu)中的所有父術(shù)語(家具、坐式家具等)和子術(shù)語(等),蒂敘詞表的已經(jīng)納入了pd之中,從而將這個(gè)極為豐富的網(wǎng)絡(luò)關(guān)聯(lián)到其他網(wǎng)絡(luò)之中。前文也順便提到了《紐約時(shí)報(bào)》的關(guān)聯(lián)開放數(shù)據(jù)詞匯表。2010年,《紐約時(shí)報(bào)》開始公布自己的“時(shí)報(bào)話題”(TimesTopics)主題標(biāo)目,其中列出(vdo.ov)]等等的集合,可讓網(wǎng)絡(luò)上的任何資源成為社交圖譜中的富對象”。舉例來說,只要一段視頻或一條新聞文章嵌入到boo的頁面更新中,就能通過題和描述。開放數(shù)據(jù)云圖(LinkingOpenDataCloudDiagram)展示了其中許多組織(雖然不是全證”(Asimple,primafacieargumentinfavoroftheSemanticWeb)。[遺憾但也有些諷刺意互聯(lián)網(wǎng)檔案館(InternetArchive)的網(wǎng)站時(shí)光機(jī)(WaybackMachine)來找到這篇文章。]表達(dá)帕爾西亞的主張可以說,數(shù)據(jù)越多越好(moredataisbetter)。毫無疑問,人們會質(zhì)疑“多既是多的主張,因?yàn)樵絹碓蕉嗟目捎脭?shù)據(jù)100多年來一直主導(dǎo)著對“數(shù)據(jù)洪流(這只是用來形容這種現(xiàn)象的術(shù)語之一)的探討。但是越來越多的可用數(shù)據(jù)讓人們得以創(chuàng)建各種工具和服務(wù)來使用這些數(shù)據(jù)。和xe這樣的搜索引擎依賴全文檢索在20世紀(jì)90<h1><a\h<span>by<ahref=“\h/authors/jeffrey-pomerantz”>Jeffrey<divitemscope\h \h pomerantz”>JeffreyPomerantz</a></span><spanitemprop=”description”>往不可見的信息基礎(chǔ)架構(gòu)。屬關(guān)系[數(shù)據(jù)類型為組織(organization)]和地址[數(shù)據(jù)類型為郵政地址(postaladdress)]。h.og中的各種類型構(gòu)成了一種層級結(jié)構(gòu)。舉例來說,人是事物(hng)的一種,事物是h.og中的最高級實(shí)體。郵政地址是聯(lián)系點(diǎn)(onon)的子實(shí)體,而后者又是結(jié)構(gòu)值(uudu)的子實(shí)體,然后按層級向上為不可見(nngb)和事物。子實(shí)體會繼承父實(shí)體的屬性,因此郵政地址一定擁有描述屬性,因?yàn)檫@是事物的屬性之一。這與第二章西雅圖示例中展示的層級結(jié)構(gòu)屬于同一類型。 h.og的搜索工具都可以利用這種數(shù)據(jù)來讓用戶創(chuàng)建高度個(gè)性化以及經(jīng)過篩選的搜索。在谷歌中搜索熱量低于100卡路里、不含堅(jiān)果的碎巧克力曲奇食譜有用的結(jié)果,但是運(yùn)用搜索工具菜單有可能會更加準(zhǔn)確。都收藏了來自文化遺產(chǎn)機(jī)構(gòu)(圖書館、檔案館和博物館)數(shù)字化處理以便可以在線訪問。這兩個(gè)項(xiàng)目都不負(fù)責(zé)存放這些資料——相應(yīng)的文化遺產(chǎn)機(jī)構(gòu)本身存放歐洲數(shù)字圖書館稱之為合作伙伴(n),而美國數(shù)字公共圖書館稱之為樞紐(ub)。歐洲數(shù)字圖書館和美國數(shù)字公共圖書館發(fā)揮著門戶的作用,即提供一定功能,使用戶可以通過搜索、瀏覽,以及訪問這些材料。數(shù)據(jù)模式,前者為(歐洲數(shù)字圖書館數(shù)據(jù)模型),后者為(美國數(shù)字公共圖書館元數(shù)據(jù)應(yīng)用規(guī)范)被稱為類()。舉例來說,這兩種元數(shù)據(jù)模式區(qū)分了文化遺產(chǎn)對象本身即美國數(shù)字公共圖書館稱之為來源資源(ouou)類和本質(zhì)為來源資源的數(shù)字表達(dá)表現(xiàn)的網(wǎng)或集合。接下來,和進(jìn)一步說明了這些實(shí)體屬性的集合。例如,來源資源在和中的屬性包括創(chuàng)建者(o)、描述(dpon)、主體(ub)、標(biāo)題()、部分于()、引用(n)、代替(p)、其他15個(gè)都柏林核心元數(shù)據(jù)元素中的許多以及較大的術(shù)語集合。至今為止已經(jīng)開發(fā)了一些獨(dú)特的屬性,而隨后采納了這些屬性,例如,包含(nopo)、起源于數(shù)據(jù)模式的元素,包括開放檔案計(jì)劃對象重用與交換協(xié)議(OAI-ORE)和CCREL。潘多拉(ndo)作為一種為大眾喜愛的在線音樂服務(wù),廣泛運(yùn)用了元數(shù)據(jù)。潘多拉的核心在于音樂基因計(jì)劃(ucnoeot?),其中有大約450個(gè)特性可用于描述一首音樂。這些特性相當(dāng)于元數(shù)據(jù)模式中的元素,并且囊括了從相對簡單(度、每分鐘節(jié)拍數(shù)、歌手性別等)到極為主觀(例如,聲音特點(diǎn)、樂器失真程度等
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年環(huán)保材料貼牌生產(chǎn)與技術(shù)支持合同
- 2025年度木工企業(yè)員工績效考核與激勵(lì)合同4篇
- 二零二五年度水利樞紐工程塊石供應(yīng)合同模板下載3篇
- 二零二五年度商業(yè)用途二房東房屋租賃經(jīng)營合同2篇
- 2025年度挖掘機(jī)械買賣與環(huán)保節(jié)能合同3篇
- 二零二五年度智能農(nóng)業(yè)無人機(jī)農(nóng)藥噴灑服務(wù)合同3篇
- 二零二四年度醫(yī)療器械研發(fā)合作與專利授權(quán)合同
- 二零二五年度農(nóng)業(yè)大棚租賃與農(nóng)業(yè)保險(xiǎn)合作合同范本4篇
- 二零二五年度牛肝菌產(chǎn)品包裝設(shè)計(jì)與印刷合同3篇
- 二零二五年度醫(yī)療設(shè)備配件更換與健康管理合同4篇
- UPVC管道安裝施工方法
- 張家界喀斯特地貌
- 讓學(xué)生看見你的愛
- 12123交管學(xué)法減分練習(xí)題及答案二(帶圖文通用版)
- 銷售禮盒營銷方案
- 南潯至臨安公路(南潯至練市段)公路工程環(huán)境影響報(bào)告
- 初中數(shù)學(xué)校本教材(完整版)
- 重慶市銅梁區(qū)2024屆數(shù)學(xué)八上期末檢測試題含解析
- 中央導(dǎo)管相關(guān)血流感染防控
- 光的偏振和晶體光學(xué)基礎(chǔ)課件
- 中科大光學(xué)講義08光的偏振
評論
0/150
提交評論