信息組織期末復(fù)習(xí)要點(diǎn)-(1)_第1頁
信息組織期末復(fù)習(xí)要點(diǎn)-(1)_第2頁
信息組織期末復(fù)習(xí)要點(diǎn)-(1)_第3頁
信息組織期末復(fù)習(xí)要點(diǎn)-(1)_第4頁
信息組織期末復(fù)習(xí)要點(diǎn)-(1)_第5頁
已閱讀5頁,還剩16頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、信息組織期末復(fù)習(xí)要點(diǎn)第一章 信息組織導(dǎo)論信息組織的環(huán)境與背景一、信息檢索工具的變化1.手工檢索時(shí)代:目錄、題錄、索引等2.計(jì)算機(jī)檢索時(shí)代:各種檢索系統(tǒng),核心是數(shù)據(jù)庫3.網(wǎng)絡(luò)檢索時(shí)代:檢索型、目錄型、混合型檢索工具4.各種檢索工具的涌現(xiàn),目前互聯(lián)網(wǎng)上運(yùn)行的搜索引擎至少有幾千種之多。二、信息檢索技術(shù)的進(jìn)步1.按照信息存儲(chǔ)的載體和實(shí)現(xiàn)查找的技術(shù)手段,信息檢索可以分為手工檢索、機(jī)械檢索、光電檢索、計(jì)算機(jī)檢索。2.網(wǎng)絡(luò)信息檢索采用的檢索技術(shù)包括:布爾邏輯檢索、自然語言檢索、多語種檢索、字段檢索、區(qū)分大小寫檢索、限制檢索、二次檢索、自然語言檢索、多語種檢索、加權(quán)檢索、模糊檢索、概念檢索、相關(guān)反應(yīng)檢索等1.

2、2 信息組織的相關(guān)概念與內(nèi)容一、組織與組織系統(tǒng)1.組織:組織是一種有意識(shí)地行為;其目的是為了創(chuàng)造次序與構(gòu)造2.組織系統(tǒng):資源與交互3.組織系統(tǒng)的三層體系:用戶界面、業(yè)務(wù)邏輯、數(shù)據(jù)4.組織對象的種類:物理實(shí)體、關(guān)于物理實(shí)體的信息、數(shù)字資源、關(guān)于數(shù)字資源的信息5. 資源、文獻(xiàn)與館藏1資源:資源具有一般意義上的任何價(jià)值, 可以支持面向目標(biāo)的活動(dòng),如實(shí)體、對象等。資源在網(wǎng)絡(luò)體系構(gòu)造中具有特殊的意義。通常, 描述網(wǎng)頁、圖像、視頻等資源, 以及訪問它們的協(xié)議, 超文本傳輸協(xié)議 ( ), 使用統(tǒng)一資源標(biāo)識(shí)符 (URI)。2文獻(xiàn):文獻(xiàn)通常用于數(shù)字或物理格式的信息資源; 工件是指由人創(chuàng)造的資源, 以及具有經(jīng)濟(jì)價(jià)

3、值的資源的資產(chǎn)。3館藏:館藏是已為某一目的選擇的一組資源。相似的期限被設(shè)置 (數(shù)學(xué)), 聚合 (數(shù)據(jù)建模), 數(shù)據(jù)集 (科學(xué)和商業(yè)) 和語料庫 (語言學(xué)和文藝分析)。6.元數(shù)據(jù):描述或與其他資源相關(guān)聯(lián)的數(shù)據(jù)1挑戰(zhàn)1:決定哪一個(gè)資源是主要的2挑戰(zhàn)2:用于描述一個(gè)人或過程的元數(shù)據(jù)再用于描述其他資源7.信息組織:為了方便人們檢索、獲取信息而獎(jiǎng)龐雜、無序的信息進(jìn)展系統(tǒng)化和有序化的過程。從廣義上來說,包括信息搜集與選擇、信息分析與提醒、信息描述與加工、信息整理與存儲(chǔ)。1.3 組織活動(dòng)決策的6個(gè)方面一、組織活動(dòng)決策的6個(gè)方面1.組織對象:不同組織系統(tǒng)的組織對象存在不同,如圖書館、博物館、檔案館。越來越多的

4、組織系統(tǒng)處理和組織的資源是原生數(shù)字資源,如音樂、照片、視頻和其他非文本內(nèi)容如傳感器數(shù)據(jù)。2.組織原因:發(fā)現(xiàn),識(shí)別,選擇,建立分類體系,類分,整合,分割,推薦,交互等。3.組織數(shù)量:并非所有的資源都應(yīng)享有同等程度的組織。受控詞匯可以產(chǎn)生更一致的組織,如果正在組織一個(gè)固定的資源集合, 那么可能會(huì)比需要一個(gè)能夠容納將來可能擁有的資源的組織系統(tǒng)來組織它。4.組織時(shí)間5.如何組織:組織活動(dòng)從資源產(chǎn)生時(shí)就開場發(fā)生,嵌入到資源的整個(gè)生命周期中。如當(dāng)一個(gè)作者撰寫一篇文檔時(shí),作者通過標(biāo)題、章節(jié)標(biāo)題、體例、頁碼和其他機(jī)制對該文檔進(jìn)展了一定程度的組織,用以區(qū)分和識(shí)別與其他局部的關(guān)系。數(shù)字形式的照片、視頻和文檔在創(chuàng)立

5、時(shí)往往被自動(dòng)地賦予了相應(yīng)的描述,如時(shí)間和位置。6.組織位置:可以在物理安排中組織資源,資源安排可以鼓勵(lì)或勸阻人之間的交往, 創(chuàng)造自由、平安感或監(jiān)禁的感覺。對于數(shù)字資源, 它們組織的位置通常是無形的或無關(guān)緊要的。第二章 信息組織導(dǎo)論信息組織系統(tǒng)中的4類活動(dòng)一、 分別是什么?1.選擇信息資源1選擇是一個(gè)發(fā)現(xiàn),識(shí)別,評(píng)估資源并納入組織系統(tǒng)中某一集合的過程。選擇的方法和標(biāo)準(zhǔn)因不同領(lǐng)域而異,但它們要確保資源能夠?qū)崿F(xiàn)“面向目標(biāo)的活動(dòng)“。2選擇和保存所有資源:信息過載、弱組織原那么 選擇在組織之前:獨(dú)特或罕見資源需要被一個(gè)一個(gè)地評(píng)估 選擇和組織并發(fā):同質(zhì)或可預(yù)測的資源 選擇在組織之后:根據(jù)模式創(chuàng)立的資源3選

6、擇標(biāo)準(zhǔn):基于某些特定目的效用價(jià)值、內(nèi)在價(jià)值、稀缺性或唯一性、最新、建立品牌或聲譽(yù)、適于使用。4路徑依賴5選擇與采樣:如果您的目標(biāo)是對其進(jìn)展推論而不必研究其所有實(shí)例,那么通過從大量群體中隨機(jī)抽樣來選擇資源至關(guān)重要?;诮y(tǒng)計(jì)的良好樣本是指被選資源和未被選資源在重要方面沒有不同。2.組織信息資源1幾乎任何資源的屬性都可以用來組織它們,但是最適當(dāng)或有效的屬性因資源類型和任務(wù)而異。在資源創(chuàng)立或被選擇之前,就應(yīng)當(dāng)決定在組織中使用哪些資源屬性。2組織物理資源3自動(dòng)/預(yù)先注意:物理資源通常根據(jù)諸如它們的尺寸,顏色或形狀的內(nèi)在物理性質(zhì)來組織,因?yàn)槿祟愐曈X系統(tǒng)快速且自動(dòng)地對它們給予很多關(guān)注。相近性和相似性、即格式

7、塔原那么。4形狀和顏色的預(yù)處理,當(dāng)形狀和顏色特性不相關(guān)時(shí),預(yù)注意與處理并行是不可能的。5整體由一些相互作用的局部組成,這些局部可以在整體上分開,分析和重新排列。當(dāng)視覺信息不明確時(shí),存在將視野的一些局部視為前景而將其它局部視為背景的自然趨勢。6連續(xù)性7偽裝:類似于背景,反向陰影,陰影消除和破壞邊緣檢測的破壞性著色,顏色和圖案證明了Gestalt處理的力量。3.支持交互1直接交互與中介交互:與資源的交互可以是直接的,中介的或間接的,或限于與資源副本、描述的交互。2交互與價(jià)值創(chuàng)造:物理操作,符號(hào)控制和人際交互,三者的交互有不同的地方。3物理資源的價(jià)值創(chuàng)造4數(shù)字資源的價(jià)值創(chuàng)造:交互的本質(zhì)是對資源中包含

8、的信息進(jìn)展信息交換或符號(hào)操縱。用于信息資源的數(shù)字資源描述可以促進(jìn)查找,識(shí)別,選擇和其他“價(jià)值創(chuàng)造交互,即使資源本身沒有被數(shù)字化。5智慧資源的價(jià)值創(chuàng)造6符號(hào)交互和其它技術(shù)作用的分解7價(jià)值創(chuàng)造:功能可見性和交互設(shè)計(jì)8功能可見性:交互不同于那些通過有意識(shí)的描述、整理或技術(shù)之后產(chǎn)生的“被設(shè)計(jì)的交互.9數(shù)字化與交互:數(shù)字資源交互的種類和功能由編碼中的構(gòu)造和語義的數(shù)量“信息智能來確定。4.維護(hù)信息資源1維護(hù)包括任何活動(dòng), 其目的是確保資源在將來的某一時(shí)間使用或重用。2可維護(hù)性和擴(kuò)展性設(shè)計(jì)/組織。3選擇基于應(yīng)用于資源的一些隱式或顯式條件。4保存物質(zhì)資源需要保持在防止其惡化的條件下,它還包括用于改良訪問或恢復(fù)

9、資源的舉措。5文檔恢復(fù)6數(shù)字保護(hù):副本、篡改杜絕等7法律:啟用文檔發(fā)現(xiàn)的民事訴訟規(guī)那么、政府問責(zé)、被遺忘權(quán)、強(qiáng)制披露數(shù)據(jù)泄露。8記錄管理:保存要求、不保存要求、訪問控制,特別是分類信息制止保存?zhèn)€人身份信息、去除要求和權(quán)限等。9計(jì)算治療:眾包數(shù)字化 /公民科學(xué),許多博物館或科學(xué)存儲(chǔ)庫正在尋求幫助將他們的藏品數(shù)字化,初步分類和稀缺專家。第三章 組織系統(tǒng)中的資源3.1什么是資源一、資源的粒度1.資源是其他資源的聚合或復(fù)合材料, 或具有內(nèi)部構(gòu)造, 對其“屬性的粒度構(gòu)成疑問。2.我們可能需要組織和管理粒狀資源、復(fù)合資源以及它們之間的關(guān)系-同時(shí)也可以在不同級(jí)別的上下文/容器/集合中標(biāo)識(shí) 零件。3.對于信息

10、資源而言, 物理資源的粒度更容易確定二、資源的標(biāo)識(shí)符1. 標(biāo)識(shí)符:是一種特殊命名,它通過規(guī)那么以受控的方式分配,規(guī)那么定義可能的值和命名原那么。例如,將一個(gè)數(shù)字資源的標(biāo)識(shí)符輸入到系統(tǒng)中,從而確定它的位置,這樣它就可以被檢索出來。三、資源的名稱1. 名稱:指的是對某一資源區(qū)別于其他資源的標(biāo)簽。2. 名稱的選擇往往受到多種因素的影響,如公眾的可獲取性、習(xí)慣,語言類型,機(jī)構(gòu)政策,個(gè)人以及文化偏見等。如果一個(gè)資源有兩個(gè)及以上的名稱或者標(biāo)識(shí)符,也就意味著有同義詞或別名的出現(xiàn)。這種現(xiàn)象被稱為“詞匯問題。3. 受控詞匯可用于來解決詞匯問題。通過添加名稱和標(biāo)簽,標(biāo)準(zhǔn)資源被分配的規(guī)那么,或通過自然語言定義映射,

11、使其轉(zhuǎn)換為權(quán)威或受控的術(shù)語。需要注意的是,詞匯控制不能消除所有歧義。3.2資源的屬性一、四個(gè)可區(qū)分屬性1.資源域1每個(gè)資源具有一定的區(qū)別于其他資源的本質(zhì)或類型,稱之為資源域。對于物理資源而言,域的區(qū)別較為容易,即可以粗略根據(jù)物質(zhì)容易感知的屬性做物質(zhì)類型的區(qū)分。對于信息資源而言,容易被感知的屬性往往不可靠和不相關(guān),因此更多的是基于語義特征來進(jìn)展域的區(qū)別。2信息資源可以被分類和分層,但有時(shí)候類別邊界不清晰卻更有益于從弱構(gòu)造的敘事內(nèi)容到高度構(gòu)造化的事務(wù)性內(nèi)容發(fā)現(xiàn)信息資源的域。由此,格魯什科和麥格拉思提出了文檔類型譜。3不同構(gòu)造域或類型的文檔可以根據(jù)被語義規(guī)定的內(nèi)容區(qū)分,即通過其內(nèi)部構(gòu)造數(shù)量、呈現(xiàn)方式

12、和內(nèi)容構(gòu)造的相關(guān)性。2. 資源格式1物理環(huán)境還是數(shù)字環(huán)境,信息資源都能以各種格式存在。知道哪個(gè)是最原始或者最重要的信息資源十分的重要,特別對于獨(dú)特的或有價(jià)值的信息資源而言。2數(shù)字信息資源的兩個(gè)維度:內(nèi)容表示顯性化程度和內(nèi)容表示的別離程度。信息智商,如掃描文檔;數(shù)據(jù)庫或XML文檔;HTML文檔。具有較高“智商格式的信息很容易和有效地用計(jì)算機(jī)處理。3編碼構(gòu)造的部件,如章,節(jié)或類似的語義組成。信息是否被編碼為文本字符的序列,以使它是人類以及計(jì)算機(jī)可讀也是十分重要的。3. 資源能動(dòng)性1代理是在某種程度上促使資源可以自發(fā)引起自身的行動(dòng)。被動(dòng)型:組織系統(tǒng)中的被動(dòng)型資源無處不在,這些資源通常是無形的,只有某

13、些行動(dòng)的觸發(fā)才能使得他們變得有價(jià)值。主動(dòng)型:主動(dòng)型資源通常依靠自己創(chuàng)造效益和價(jià)值,有時(shí)候也通過觸發(fā)被動(dòng)型資源產(chǎn)生。2智能性連續(xù)體感知與意識(shí):資源媒介感知周圍環(huán)境和其他資源的互動(dòng)的根底,但是感知事物并不能為組織系統(tǒng)創(chuàng)造任何價(jià)值。刺激:當(dāng)資源通過信息的感知采取行動(dòng)時(shí),才具備創(chuàng)造價(jià)值和影響的能力。驅(qū)動(dòng)器:通常被用來描述可以控制物理機(jī)械或者系統(tǒng)的東西。關(guān)聯(lián):主動(dòng)型資源要發(fā)揮自身的作用,就必須要與控制其他資源的驅(qū)動(dòng)器相關(guān)聯(lián)。計(jì)算或計(jì)算力:主動(dòng)型資源通常可以通過閱讀傳感器的信息,然后分析信息的內(nèi)容并不斷去調(diào)整行動(dòng)??山M合性與合作:智能的主動(dòng)型資源不僅僅能夠分析所搜集的信息和為之調(diào)整行為,還可以在共同遵守一

14、定格式和標(biāo)準(zhǔn)的根底上,會(huì)聚不同來源的信息來創(chuàng)造更大的價(jià)值。4. 資源格式與焦點(diǎn)1物理形式描述物理資源:描述性資源與物理資源的關(guān)系是通過將描述性資源以物理形式進(jìn)展編碼。2數(shù)字形式描述物理資源:典型就是通過圖書館在線目錄定位實(shí)體圖書館資源的館藏所在位置。3數(shù)字形式描述數(shù)字資源:描述數(shù)字資源的數(shù)字資源也就是對網(wǎng)絡(luò)原生的信息資源進(jìn)展描述。4物理形式描述數(shù)字資源:報(bào)紙廣告、馬路廣告商品貨架上的可以被手機(jī)掃描商品或效勞信息的二維碼就是以物理形式描述數(shù)字資源。5識(shí)別資源所屬的域,確定哪些屬性是重要的或與人或者系統(tǒng)操作相關(guān)的,然后指定由其中哪些性質(zhì)來定義的資源之間的關(guān)系的原理是構(gòu)建組織系統(tǒng)最核心的任務(wù)。3.3

15、 命名資源一、為什么要給資源命名幫助我們尋找到資源、描述資源、復(fù)用資源、鏈接資源等。二、資源命名中存在的問題1詞匯問題:人們描述事物中所選擇的單詞與他們的經(jīng)歷和語境有關(guān)系。2同義詞、多義詞、假同源詞等:當(dāng)資源有同義詞或者多義詞時(shí)容易被錯(cuò)誤區(qū)分,難以用自動(dòng)化的程序確定其正確的表示方式。3不恰當(dāng)聯(lián)系的命名:假同源,如在中國,4是不桔祥的數(shù)字,意味著死亡4通過假設(shè)常量屬性的命名:通過假設(shè)常量屬性來命名是建立在資源屬性的根底上,但是隨著資源本身的變化,其屬性的含義也會(huì)跟著改變。5語義差距:指在命名和描述資源時(shí),用自動(dòng)化方式代替人為方式描述產(chǎn)生語義的差距。三、選擇好的命名和標(biāo)識(shí)符1需要讓命名有富含信息量

16、2使用受控語言3允許別名4使標(biāo)識(shí)唯一或者被限定5區(qū)分識(shí)別和解決第四章 資源描述與元數(shù)據(jù)4.1 資源描述一、為什么要描述一個(gè)資源1. 資源描述的目的是便于查閱、區(qū)分、檢索這些資源,以及管理資源獲取入口和保存這些資源。2. 不同的資源領(lǐng)域有特色的或標(biāo)準(zhǔn)的資源描述,但是不同類型的資源一定也有用于區(qū)分的屬性, 或者不帶偏見或有理由的區(qū)分他們。二、資源描述的框架或方法1.RDF1RDF是一種計(jì)算機(jī)可處理的網(wǎng)絡(luò)資源描述的標(biāo)準(zhǔn)模型,是語義網(wǎng)構(gòu)建的根底。資源是指帶有URIUniform Resource Identifier的任何資源。2關(guān)鍵思想:使用URI識(shí)別在線資源,如網(wǎng)頁,以及線下資源,如人和國家。3三

17、元組形式:資源,屬性和屬性值。RDF使用XML編寫,它的設(shè)計(jì)編寫目的不是為了顯示給人看,而是設(shè)計(jì)為可被計(jì)算機(jī)閱讀和理解。于是RDF信息會(huì)有假設(shè)干種序列化形式,即可使用三元組表示。2. MARC21:包括作者,標(biāo)題,出版年,出版商和頁碼等。4.2 資源屬性一、資源屬性類型1. 內(nèi)在屬性:資源所固有的,局部是靜態(tài)的,也有動(dòng)態(tài)的,但是是從資源內(nèi)部發(fā)生變化,而不是由于外部行動(dòng)或努力而改變,有時(shí)可用于識(shí)別符。1物理屬性:物理的或可感知的屬性即外表可見的。對于自然事物,這些物理屬性非常適合進(jìn)展描述,這些屬性具有一定的特色或一致性、可預(yù)測性和關(guān)聯(lián)性。對于人造產(chǎn)品,外觀屬性預(yù)測性較差,重要的是外觀下所具有的的

18、功能。對于物理形式的信息,外觀與內(nèi)容之間的關(guān)聯(lián)因文檔類型不同而不同。2.外在屬性:外在屬性是人為賦予的一種屬性。局部是靜態(tài)的,如名字或識(shí)別符,局部是動(dòng)態(tài)的,如當(dāng)前位置,受歡送程度,價(jià)格等。1文化屬性:來源于傳統(tǒng)語言的使用或文化,或者涉及到與此類似的方面。由于文化屬性來源于文化或語言知識(shí),因而對于缺少一樣視角或經(jīng)歷的人來說是難以理解的。2情境屬性:與事物被描述時(shí)所處的情景或情境相關(guān)。情境是指與用戶、應(yīng)用程度和周圍環(huán)境之間交互相關(guān)的情景的特征化信息。隨著情境的改變,可能基于情境的描述會(huì)變得不再使用。3構(gòu)造屬性:事物的內(nèi)在或外在構(gòu)造對于描述來說是有用。組成局部的數(shù)量或排列和與其他資源的關(guān)聯(lián)的數(shù)量和類

19、型。4.3 資源描述的過程一、資源描述的六個(gè)環(huán)節(jié)1. 選擇范圍和焦點(diǎn):1描述實(shí)例或館藏:確定資源粒度之后,就是確定是否需要分別描述這些資源。2抽象化資源描述:一個(gè)應(yīng)用于整個(gè)資源類型的描述方案如模型或元數(shù)據(jù)標(biāo)準(zhǔn)。2.確定目標(biāo)1支持選擇:發(fā)現(xiàn)、性能與兼容性、鑒別、評(píng)估2支持組織:組織是為描述和配置資源指定原那么或條例以便實(shí)現(xiàn)更好的交互能力。實(shí)體資源通常根據(jù)其有形或可感知的屬性,如大小,顏色,組成材料,形狀等。3支持交互:書目記錄功能需求FRBR應(yīng)用于組織系統(tǒng)的四個(gè)目的包括發(fā)現(xiàn)已經(jīng)存在的資源識(shí)別所需資源從資源集中選擇一個(gè)資源導(dǎo)航:當(dāng)用戶不清楚他們的信息需求時(shí),使用關(guān)系性和構(gòu)造化描述進(jìn)展導(dǎo)航效果更好。

20、具體方式如: 概括,聚合和派生關(guān)系。4支持資源維護(hù)關(guān)于資源格式和技術(shù)的技術(shù)性信息,保持資源完整性的“保存元數(shù)據(jù).版本信息,有效期或使用期限信息使用記錄3.識(shí)別屬性1任何資源都要從多角度描述,這些描述均與不同屬性相關(guān),取決于交互類型和所處情境。2不同類型資源需要包含不同的屬性3資源描述中所使用的屬性取決于描述的主體4概念層次一樣的屬性在實(shí)現(xiàn)層次可能不同?;跁r(shí)間的資源的總結(jié)性描述具有非常大的挑戰(zhàn),如電影,歌曲等。5兩個(gè)重要維度:屬性的本質(zhì)和屬性持久性4.設(shè)計(jì)描述詞表1原那么:用戶便利性、表達(dá)性、充分性和必要性、標(biāo)準(zhǔn)化、整合2兩大挑戰(zhàn):需要額外的和特定的情境原那么之間可能存在一定的沖突3資源描述利

21、用的主體:資源描述必須針對不同用戶群體進(jìn)展設(shè)計(jì),如圖書館用戶,企業(yè)員工,企業(yè)客戶,科學(xué)家等群體。4受控詞表和內(nèi)容規(guī)那么:術(shù)語表、敘詞表、上位詞、下位詞、本體 。5降維:目標(biāo)是減少描述資源的術(shù)語數(shù)量,通過一些方法減少資源描述的維度,如特征抽取,主成份分析,正交分解,潛在語義分析,多維標(biāo)度等。5.編制資源描述:每個(gè)編制主體都有不同的特點(diǎn),最好使用混合的方式取長補(bǔ)短。如,由終端用戶為一個(gè)新的資源領(lǐng)域標(biāo)記相應(yīng)詞匯,由專家進(jìn)展準(zhǔn)確之后再借助于軟件工具利用分類器生成摘要。6.評(píng)價(jià)資源描述:依據(jù)一些標(biāo)準(zhǔn)或維度評(píng)估其質(zhì)量1常用:準(zhǔn)確度、完整性、一致性.2其他:時(shí)效性、互操作性、可用性.3評(píng)價(jià)資源描述的創(chuàng)立4評(píng)

22、價(jià)資源描述的使用5反復(fù)評(píng)價(jià)的重要性:用戶顯性反應(yīng)或資源交互記錄的隱形反應(yīng)非常重要. 第五章 對關(guān)系和構(gòu)造的描述一、描述關(guān)系的五種觀點(diǎn)1語義學(xué): 聯(lián)想的意義2詞法學(xué): 如何使用特定語言中的詞語來表達(dá)關(guān)系的概念描述。3構(gòu)造: 分析資源之間的關(guān)聯(lián)、排列、鄰近或連接的模式 (通常忽略它們的原因)。4架構(gòu):強(qiáng)調(diào)關(guān)系組成局部的數(shù)量和抽象級(jí)別,它們一起表征其復(fù)雜性。5實(shí)施層面的觀點(diǎn):如何以特定符號(hào)和語法實(shí)現(xiàn)關(guān)系,以及在某些技術(shù)環(huán)境中將關(guān)系排列和存儲(chǔ)的方式。二、三種廣義的語義關(guān)系1包含關(guān)系種類包含:is-a, is-a-type-of, subset is-a-type-of, subset局部-整體關(guān)系包含

23、:部件-對象、成員-集合、局部-質(zhì)量、材料-對象、地點(diǎn)-區(qū)域、特征-活動(dòng)、階段-活動(dòng)拓?fù)洹⑽恢?、時(shí)間包含:is-in,the Vatican City is-in Italy2歸屬關(guān)系:為特定的資源斷定或分配其屬性的值注意屬性與值的區(qū)別,如color: attribute, green: value屬性有時(shí)可以包含多個(gè)判斷,有多種表達(dá)方式,可以用于表達(dá)另外的關(guān)系。3擁有關(guān)系:外表上和局部整體關(guān)系相似,但沒有后者中“作為其中一局部的意思。在機(jī)構(gòu)組織系統(tǒng)里尤其重要,所有權(quán),控制,責(zé)任及相關(guān)的轉(zhuǎn)讓,均是這些系統(tǒng)支持的交互活動(dòng)的根本局部。同時(shí)隱含持續(xù)時(shí)間和持續(xù)力,有時(shí)難于從慣常處所和做法來區(qū)分關(guān)系。三

24、、本體和分類法1分類法可以捕捉到在某個(gè)范疇的種類包含關(guān)系的系統(tǒng),但還有很多種關(guān)系。其他類型的關(guān)系,都在表述著這個(gè)范疇的知識(shí),對了解這個(gè)范疇或者多個(gè)范疇相關(guān)的資源或活動(dòng)都有幫助。2本體是眾多的關(guān)系組成的網(wǎng)絡(luò)可以創(chuàng)立出一種資源。關(guān)于視圖,顯示出它也具備一種分類法作為自身概念的展臺(tái)。本體在某些組織系統(tǒng),是不可或缺的局部,特別是信息密集的系統(tǒng),其資源的范圍和規(guī)模需要一套全面而受控的描述詞表。四、詞匯關(guān)系的種類1下位關(guān)系和上位關(guān)系,這可對應(yīng)種類包含關(guān)系。2轉(zhuǎn)喻關(guān)系,這可對應(yīng)局部全部關(guān)系。3同義關(guān)系,絕對同義或者命題同義。4多義關(guān)系,具備多種含義。5反義關(guān)系,嚴(yán)格的雙分反義詞對。五、敘詞表對敘詞關(guān)系的表達(dá)

25、1敘詞表是一項(xiàng)參考性工作,根據(jù)語義與詞匯的關(guān)系組織詞語,被專業(yè)人士用于描述資源。2不同的范疇和主題領(lǐng)域都有各自的敘詞表。3在敘詞表中,通常用寬含義(BT)和窄含義(NT)來表述上位和下位的種類包含關(guān)系。六、構(gòu)造元數(shù)據(jù)以數(shù)據(jù)庫或文檔的概要模式,描述信息資源的種類,也可能包括組成局部的包含和歸屬關(guān)系的語法細(xì)節(jié)??捎糜诿枋鰯?shù)據(jù)庫表格間的關(guān)系,圖書章節(jié)的關(guān)系或庫存管理系統(tǒng)的各局部關(guān)系。七、語義網(wǎng)和關(guān)聯(lián)數(shù)據(jù)1.語義網(wǎng)在2001年提出,所有的信息都可以被自開工具和人類分享和處理。1XML的應(yīng)用,包括RDF和OWL,使得網(wǎng)絡(luò)更加語義化和網(wǎng)絡(luò)資源關(guān)系更加顯性化。2Wikepedia,就是利用語義注釋的模版鼓勵(lì)

26、用戶以內(nèi)容編碼格式創(chuàng)立信息。2.“關(guān)聯(lián)數(shù)據(jù)運(yùn)動(dòng)是語義網(wǎng)的延伸,將網(wǎng)絡(luò)架構(gòu)的根本原那么以更好的語義條目來重建。八、資源描述和獲取1.前提:在線目錄在編制文獻(xiàn)書目關(guān)系上做得并不好,原因在于目錄顯示的設(shè)計(jì)和目錄記錄中信息組織的局限性。即使是MARC記錄,內(nèi)含的數(shù)據(jù)也不能被重復(fù)使用和重新排列。2.RDA1作為新一代的編目規(guī)那么,希望將不相連的資源描述鏈接起來,呈現(xiàn)完整而相連的關(guān)于著作,作者,出版物,出版商和主題的數(shù)據(jù)。2利用RDF來提醒和存儲(chǔ)書目資料中的關(guān)系。3將圖書館數(shù)據(jù)變得更廣泛在線和可用,同時(shí)也希望利用語義網(wǎng)的分布特性,使得本身更具影響力。第六章 描述資源的類和類型一、為什么分類以及怎樣分類1.

27、定義:類別是指被同樣對待的事物或抽象實(shí)體構(gòu)成的類、集合或組。2.原因:感知、交流、分析、預(yù)測、分類或試圖使經(jīng)歷有意義時(shí), 都涉及到類別。所有人類語言和文化將物理和經(jīng)歷的 世界 分成類別。類別是應(yīng)用先驗(yàn)知識(shí)的認(rèn)知和語言模型,創(chuàng)造和使用類別是必要的人類活動(dòng);類別使我們能夠根據(jù)相似性和不相似性將事物彼此關(guān)聯(lián)。3.怎樣分類人們認(rèn)識(shí)到世界中的構(gòu)造,然后創(chuàng)立類別。通過強(qiáng)化構(gòu)造來表達(dá)世界的意義,哪些事物應(yīng)該放在一起是結(jié)果,而不是分類的原因。二、4種根本類別及其聯(lián)系和區(qū)別1.文化類別:可以理解為一種自然人認(rèn)知能力,它是作為非正式和正式組織系統(tǒng)的根底。2.個(gè)人類別:傾向于在我們的個(gè)人活動(dòng)中自發(fā)增長。3.機(jī)構(gòu)類別

28、:符合公司、政府和其他目標(biāo)企業(yè)內(nèi)部和之間正式協(xié)調(diào)配合的需要。明確創(chuàng)立和使用,最常見的是用于許多人相互協(xié)調(diào)。在抽象和信息密集型領(lǐng)域中創(chuàng)立,其中需要明確和準(zhǔn)確類別來標(biāo)準(zhǔn)和系統(tǒng)化活動(dòng),實(shí)現(xiàn)信息共享和重用,并降低交易本錢。不是描述世界本來的樣子,而是通過賦予比文化類別更正式和專制的語義模型定義類別進(jìn)而改變或控制世界。4.計(jì)算類別:由計(jì)算機(jī)程序創(chuàng)立,用于信息檢索,機(jī)器學(xué)習(xí),預(yù)測分析和其他應(yīng)用。5.聯(lián)系文化、個(gè)人、計(jì)算機(jī)和機(jī)構(gòu)類別的概念有效地區(qū)分了創(chuàng)立類別的主要過程和目的。 這些類別描述了物體、事件、設(shè)置、內(nèi)部體驗(yàn)、物理定向,實(shí)體之間的關(guān)系以及人類經(jīng)歷的許多其他方面。6.區(qū)別融合、沖突和相互重組,不是將它

29、們視為具有準(zhǔn)確的邊界,而是分類活動(dòng)、方法上的區(qū)域。個(gè)人類別和機(jī)構(gòu)類別基于文化類別而形成。文化類別傾向于描述日常經(jīng)歷和積累的文化知識(shí)。文化類別的學(xué)習(xí)沒有明確指導(dǎo),主要是受照顧孩子的人的影響,它們與特定文化背景下的語言習(xí)得和語言使用有關(guān)。個(gè)人類別與文化類別不同:一是個(gè)別類別有時(shí)具有想象力或隱喻根底,對創(chuàng)造他們的人而言是有意義的,但可能會(huì)扭曲或誤解文化類別。其次,個(gè)人類別通常是專門的或綜合的文化類別,可以捕捉特定的經(jīng)歷或個(gè)人歷史。機(jī)構(gòu)類別與個(gè)人類別不同,因?yàn)樗枰罅颗韰f(xié)調(diào)現(xiàn)個(gè)體類別之間的不匹配,表達(dá)了在正式制度體系中喪失了的有用的工作或語境知識(shí)。機(jī)構(gòu)分類工作必須克制文化類別的模糊性和不一致性,

30、因?yàn)榍罢弑仨毥?jīng)常符合更嚴(yán)格的邏輯標(biāo)準(zhǔn),以支持推理和符合法律要求。三、七個(gè)主要原那么1.枚舉:有限或可數(shù)集合中的任何資源都可以被該事實(shí)視為類別成員。 該原那么也稱為擴(kuò)展定義,集合的成員稱為擴(kuò)展項(xiàng)。 2.單個(gè)屬性:資源的任何單個(gè)屬性都可以用于創(chuàng)立類別。最容易使用是內(nèi)在的靜態(tài)屬性,是永遠(yuǎn)不會(huì)改變的屬性。天然或制造物體的組成材料是可用于描述物理資源的內(nèi)在和靜態(tài)屬性。用于為組織系統(tǒng)創(chuàng)立類別的最有用的單一屬性是那些被正式分配,客觀可測量和有序的,或與已建立的文化類別相關(guān)聯(lián)的屬性。3.多個(gè)屬性和等級(jí)多級(jí)類別系統(tǒng)。當(dāng)使用一樣的資源屬性序列來布置組織系統(tǒng)中的所有資源時(shí),這創(chuàng)立了邏輯等級(jí)構(gòu)造。資源子集的不同屬性。

31、每個(gè)資源都針對每個(gè)屬性進(jìn)展評(píng)估。必要和充分的屬性。一組大型的資源并不總需要許多屬性和類別來組織。某些類型的類別可以只用一些根本屬性來準(zhǔn)確定義。4.家族相似性:使用統(tǒng)計(jì)而不是邏輯方式對屬性進(jìn)展分類,以得出要分類的資源和類別的其他成員之間的相似性或相似性的一些量度。使用它們在復(fù)合或集成的方式來確定相似性。5. 相似性:成為分類的有用機(jī)制的前提是必須明確相似性度量的方法。 基于特征或基于屬性、基于幾何、基于隊(duì)列(alignment-based)、變換6. 基于理論的類別:以適合使特定分類合理的理論或形式組織事物,防止家庭相似性或相對于可見屬性的相似性將導(dǎo)致不同的類別分配。7.基于目標(biāo)的類別組織并處理

32、資源以到達(dá)目標(biāo)。類別是由某個(gè)特定上下文中的特定目標(biāo)導(dǎo)出或?qū)С龅?。第七?按照類別類分資源一、Classification的涵義1.作為名詞,分類法或分類表,是一種類別系統(tǒng),即根據(jù)預(yù)先確定的一組原那么對類別進(jìn)展排序,并用于組織資源集合。2.作為動(dòng)詞,是以系統(tǒng)化方式將資源分進(jìn)設(shè)置好的類別系統(tǒng)通常是機(jī)構(gòu)類別的活動(dòng)。二、分類法與標(biāo)簽的區(qū)別1.分類法按照原那么和系統(tǒng)化的方式實(shí)現(xiàn),是準(zhǔn)確、可靠的,效地滿足機(jī)構(gòu)和商業(yè)性目的。2.標(biāo)簽利用資源的任何屬性和詞匯來描述該資源,不管該資源之間的差異,從而構(gòu)建一個(gè)類目系統(tǒng)。也可以稱為社會(huì)分類法。3.群眾分類法,用于描述特定網(wǎng)站或應(yīng)用的標(biāo)簽集合4.標(biāo)簽分類法:用戶或社區(qū)

33、建立原那么來管理標(biāo)簽,旨在以一種使標(biāo)簽更加系統(tǒng)化的新詞。三、分類表的排列形式1.枚舉式:一種明確將所有可能分配資源的類別列舉的分類方表。 2.層級(jí)式:當(dāng)所有的資源屬性以一種固定的次序考慮,每種構(gòu)成分類系統(tǒng)中的一個(gè)等級(jí)的分類方案。3.字母或有序化:認(rèn)為這些組織原那么是創(chuàng)立隱式或潛在的分類系統(tǒng),在該類別僅在需要時(shí)生成。4. 分面分類分析-綜合法:最常見的類型的方面是枚舉(互斥的);布爾(是或否);分級(jí)或分類(邏輯控制);和頻譜(一系列數(shù)值)。四、分類法的原那么1. 原那么鑲嵌在分類表中:文獻(xiàn)保障、科學(xué)保障、用戶或使用保障。2. 按照類別類分資源的原那么:唯一性,重新開發(fā)和遵循一套詳細(xì)且通常比擬主觀

34、的規(guī)那么。3. 分類法維護(hù)的原那么:在開場定義時(shí)構(gòu)建多余的邏輯空間,圖書館分類法使用命名或編碼方案創(chuàng)立新的子,信息系統(tǒng)分類方案也能預(yù)估文檔或數(shù)據(jù)庫方案的演化。五、世界三大分類法的概況1.杜威十進(jìn)分類法:分為10個(gè)大類,涵蓋整個(gè)知識(shí)領(lǐng)域。每個(gè)大類可以進(jìn)一步分為10個(gè)子類,每個(gè)子類再包括10個(gè)局部。分類號(hào)碼根本上采用層累制,有時(shí)也采用小數(shù)順序制。2. 國際際十進(jìn)分類法:歐洲第一部文獻(xiàn)分類表,最早提出概念分析和組配原那么。UDC 多語種、多版本、類目詳細(xì)、組配靈活、標(biāo)引能力強(qiáng),能適用于成冊文獻(xiàn)的分類和排架,也能滿足單篇文獻(xiàn)的分類要求。 3. 美國國會(huì)圖書館圖書分類法:有21個(gè)大類,由字母進(jìn)展編號(hào)。每

35、個(gè)大類可進(jìn)一步細(xì)分,使得LCC類目層級(jí)較多,具有較強(qiáng)的實(shí)踐性,但是缺乏一定的理論性根底。偏向于適應(yīng)于美國及國家管理層面的需求。 六、杜威十進(jìn)分類法的特點(diǎn)1.體系構(gòu)造完整、嚴(yán)謹(jǐn),類目詳盡,層次清楚,易于理解,便于按學(xué)科進(jìn)展檢索。2.采用嚴(yán)格的層累標(biāo)記制,類號(hào)等級(jí)清楚,具有較強(qiáng)的助記性,但有時(shí)號(hào)碼過于冗長。3.首創(chuàng)仿分、復(fù)分等具有組配性質(zhì)的編號(hào)法。4.最先為分類表編配詳細(xì)的相關(guān)索引,提供一條簡便的字順檢索的途徑 。5.擁有實(shí)力雄厚的管理機(jī)構(gòu),定期修訂,使分類法不斷得到更新。 七、什么是分面在分面分類系統(tǒng)中,每一種資源可以使用多個(gè)分面的屬性加以描述,但是搜尋資源的代理不需要考慮所有的屬性即分面,也不

36、需要以固定的順序來考慮。八、分面分類系統(tǒng)設(shè)計(jì)的步驟和原那么1。設(shè)計(jì)步驟1范圍:定義分類的目的,細(xì)化概念或資源的范圍2選擇每一個(gè)組面的取值:決定組面的邏輯類型和可能的取值;細(xì)化組面的取值順序,包括字母、年代、處理過程、規(guī)模、流行程度、復(fù)雜性程度、地理或拓?fù)錁?gòu)造。3組面識(shí)別:分析和描述資源樣本實(shí)例以失卻候選組面的屬性或維度。4設(shè)計(jì)組面層級(jí)和語法:檢查組面之間的關(guān)系;決定如何組合各個(gè)組面。5驗(yàn)證,迭代與精:利用新的實(shí)例對分類進(jìn)展檢驗(yàn),修正各個(gè)組面和取值。2.原那么1正交性:組面應(yīng)該是相互獨(dú)立的維度,確保一個(gè)資源涵蓋所有組面的取值,且每一個(gè)組面只有一個(gè)取值。2語義平衡:頂層組面應(yīng)該是分類領(lǐng)域中對資源具

37、有最正確區(qū)分能力的屬性,取值應(yīng)該具有相等的語義范圍,使得資源分布在各個(gè)子類別中。3覆蓋范圍:組面的取值應(yīng)該能在預(yù)期范圍內(nèi)類分所有的實(shí)例。4可擴(kuò)展性:組面的值應(yīng)能適應(yīng)需要潛在增加的一組實(shí)例,簡單是增加一個(gè)“其他值。5客觀性:盡可能明確和具體。6標(biāo)準(zhǔn)性:不使用特殊、隱喻或需要特定知識(shí)來解釋的術(shù)語。第八章 資源描述形式一、使資源描述構(gòu)造化的元模型1.元模型描述了資源描述和其他信息資源中常見的構(gòu)造。組織系統(tǒng)的任何設(shè)計(jì)師都會(huì)創(chuàng)立一個(gè)特定領(lǐng)域的模型,但不會(huì)創(chuàng)立一個(gè)全新的元模型,而是從已現(xiàn)有標(biāo)準(zhǔn)的元模型中進(jìn)展選擇。2.所產(chǎn)生的模型有時(shí)被稱“領(lǐng)域特定語言。標(biāo)準(zhǔn)元模型可以提高經(jīng)濟(jì)效益,開發(fā)人員可以用針對這些元模

38、型設(shè)計(jì)的工具和知識(shí),不必從頭開場。二、建模的約束條件1.元模型對資源描述的構(gòu)造施加了限制,但在組織系統(tǒng)方面,仍需要進(jìn)一步明確所組織的具體資源類型的描述內(nèi)容和組成。2. 一旦選擇了一個(gè)元模型,在特定的域中對資源和集合進(jìn)展建模時(shí),必須處理約束條件。3. 指定詞匯和模式:為特定領(lǐng)域的資源描述創(chuàng)立模型涉及指定這些描述的公共元素,并給出這些元素的標(biāo)準(zhǔn)名稱。還可以指定如何將這些元素排列成較大的構(gòu)造。4. 在XML中,模型在schemas單獨(dú)文檔中被定義。XML提供了文檔中的元素和屬性名稱的術(shù)語詞匯表。XML還定義如何將這些元素,屬性及其內(nèi)容排列成更高級(jí)別的構(gòu)造規(guī)那么。5. 控制值:模型也可限制描述的值或內(nèi)

39、容。有時(shí),單個(gè)模型可用于將定義某些屬性名稱的術(shù)語和可用于屬性值的術(shù)語。三、符號(hào)和寫作系統(tǒng)1.符號(hào)1ASCII美國信息交換標(biāo)準(zhǔn)代碼是用于數(shù)字環(huán)境的已經(jīng)編碼和標(biāo)準(zhǔn)化的符號(hào)例如。每個(gè)字符都必須嚴(yán)格定義。在ASCII中,每個(gè)charcter的數(shù)字從0到127,所以有128個(gè)ASCII字符。2不同的符號(hào)可能包括非常相似的標(biāo)記。在非數(shù)字環(huán)境中,將依靠上下文來了解書面標(biāo)記是否被用作音樂符號(hào)、數(shù)學(xué)符號(hào)或英文縮寫的一局部。3計(jì)算機(jī)沒有對上下文的直觀理解。Unicode將number sign日常生活中#的表現(xiàn)形式和sharp sign音樂中#的表現(xiàn)形式編碼看做兩個(gè)不同的字符。 2.寫作系統(tǒng)1寫作系統(tǒng)采用一個(gè)或多

40、個(gè)符號(hào),并添加一組使用它們的規(guī)那么。2聲門書寫系統(tǒng):大多都能認(rèn)知到一種特定的人類語言。3許多書寫系統(tǒng),如數(shù)學(xué)和音樂系統(tǒng),都不與人類語言相聯(lián)系。用于描述資源的系統(tǒng)屬于后者。4以自然人類語言為根底的聲門書寫系統(tǒng)難以準(zhǔn)確,全面地描述。非聲門書寫系統(tǒng)可以使用抽象模型進(jìn)展準(zhǔn)確和全面的描述。非聲門書寫系統(tǒng)由特定元模型描述,并且適合于給定元模型的約束條件。5寫作系統(tǒng)提供了將符號(hào)排列成有意義的構(gòu)造的規(guī)那么。符號(hào)中的字符沒有固有的含義,字符取決于寫入系統(tǒng)上下文的內(nèi)涵。第九章 與資源進(jìn)展交互一、交互的前提:整合,聯(lián)接,聚類或合并資源以提供更廣泛的資源和更同質(zhì)的描述進(jìn)展檢索。二、交互的決定要素1.用戶需求:人與組織系統(tǒng)之間的交互越抽象及之間中介的越多,從用戶獲取自描述組織系統(tǒng)到用戶與人或機(jī)器中介交互再到計(jì)算代理與其他計(jì)算代理之間交互,就應(yīng)該越準(zhǔn)確的描述交互的需求。用戶信息需求決定了所需資源的類型和內(nèi)容,表現(xiàn)為搜索請求、構(gòu)建查詢式、瀏覽組織系統(tǒng)分類

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論