【大學(xué)】 信息資源組織基礎(chǔ)_第1頁
【大學(xué)】 信息資源組織基礎(chǔ)_第2頁
【大學(xué)】 信息資源組織基礎(chǔ)_第3頁
【大學(xué)】 信息資源組織基礎(chǔ)_第4頁
【大學(xué)】 信息資源組織基礎(chǔ)_第5頁
已閱讀5頁,還剩38頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

第一講信息資源組織基礎(chǔ)元數(shù)據(jù)與信息資源組織編輯ppt第一章引言編輯ppt生活中的信息組織你怎么組織你的——書籍或資料衣物或任何其他生活雜物電腦文件大腦中的信息編輯ppt你怎么組織——藏書按用途:興趣愛好的(小說、旅游、烹調(diào)),學(xué)習(xí)類的,收藏類,工具書類…按載體:刊物、報紙、圖書、畫冊…按學(xué)科或?qū)n}:(藏書家)……編輯ppt你怎么整理——CD/DVD按類型:古典、流行、爵士、藍(lán)調(diào)...或故事片、文藝片、MTV、動畫片、紀(jì)錄片;按人物:貝多芬、柴可夫斯基…或布魯斯威利斯、李連杰、007…綜合方法……編輯ppt你怎么整理——衣物類型;季節(jié);面料;喜歡程度;……上述綜合編輯ppt你怎么整理——計算機文件?你頭腦中的信息?編輯ppt總結(jié)分類方法是人類最本能認(rèn)識世界的方法,因而也應(yīng)用于任何資源的組織;按使用方便(多數(shù)是內(nèi)容)分類而不是按物理順序(或字順等)排列;用于類分事物的性質(zhì)叫做“屬性”,試行分內(nèi)部屬性和外部屬性;不作索引或簡單的書本式索引;憑記憶查找,因而強調(diào)助記性。編輯ppt總結(jié):信息資源組織常用方法分類法主題法字順法號碼法(賦予號碼后的字順法)時空法(例如大事記,年鑒等)序列法(大小/多少/好壞/貴賤…)超文本法(鏈接法)編輯ppt相關(guān)因素信息資源組織與下列因素有關(guān):信息資源組織的對象是什么?信息資源組織的目的是什么?信息資源組織對象有什么顯著特性?如何更方便的使用(達(dá)到目的)編輯ppt第二章

信息資源組織的基本問題編輯ppt基本問題什么是信息?什么是信息資源?什么是信息資源組織?信息資源組織的對象是什么?(數(shù)據(jù)、信息、知識、智慧及其他相關(guān)概念的關(guān)系是什么?)信息資源組織的目的是什么?信息資源組織的相關(guān)應(yīng)用領(lǐng)域傳統(tǒng)圖書館(博物館/檔案館)的信息資源組織現(xiàn)代信息資源組織面臨的問題與挑戰(zhàn)編輯ppt數(shù)據(jù):離散、互不關(guān)聯(lián)的客觀事實,孤立的文字、數(shù)據(jù)和符號,缺乏關(guān)聯(lián)和目的性信息:人們對數(shù)據(jù)進行系統(tǒng)組織、整理和分析,使其產(chǎn)生相關(guān)性,但沒有與特定用戶行動相關(guān)聯(lián)知識:與行動和決策密切相關(guān),人們做決策的行動能力,知識創(chuàng)造與環(huán)境相關(guān)智慧:對事務(wù)發(fā)展的前瞻性看法,智慧得益于人的內(nèi)在價值觀和信仰什么是數(shù)據(jù)、信息、知識、智慧編輯ppt什么是數(shù)據(jù)、信息、知識、智慧Data:數(shù)據(jù)=沒有加工的事實數(shù)據(jù)對應(yīng)于人、物理對象、事件或其它實體的原始事實。單獨的數(shù)據(jù)沒有意義計算機中表示為數(shù)字或其它符號形式(不僅是數(shù)字形式。Number強調(diào)數(shù)字的內(nèi)容,Digital強調(diào)數(shù)的形式)例如10000Information:信息=數(shù)據(jù)+語境將數(shù)據(jù)放到一個語境(context)中,從而給予它一定的含義,它就成為信息經(jīng)過處理的有用的數(shù)據(jù),用來回答Who/What/Where/When的問題信息是經(jīng)人組織的數(shù)據(jù)組成例如¥10000Knowledge:知識=信息+判斷是一種由人創(chuàng)造的,并且反映他們是如何來進行判斷、選擇并且采取行動的know-how,知識一般與人們所受的教育、經(jīng)驗、思考方法、決策及其他能力相關(guān)。信息被閱讀、告知或可視與理解等等例如¥10000是上海外環(huán)線附近2005年房產(chǎn)的單價Wisdom:智慧=知識+整合對知識進行組合、創(chuàng)造以及理解知識要義的能力Wisdomisnotaproductofschoolingbutofthelifelongattempttoacquireit.(AlbertEinstein)例如”以¥10000的單價購買外環(huán)線的房子肯定虧本”文獻(xiàn)Document:記錄有知識的一切載體。信息資源的一種形式;編輯ppt其他有關(guān)信息的定義信息如同反饋——指機器利用其行為造成的結(jié)果作為自適應(yīng)信息以調(diào)整自身,作為正在進行的過程的一個部分——維納《控制論》1949年

Informationasfeedback--theabilityofamachinetousetheresultsofitsownperformanceasself-regulatinginformationandadjustitselfaspartofitsongoingprocess--NorbertWeiner,Cybernetics,1949信息是能夠被編碼而通過連接信源和信宿的通道進行傳輸?shù)臇|西——申農(nóng)1949年

Informationiswhatevercanbecodedfortransmissionthroughamechanicalchannelconnectingasourcewithareceiver--Shannon,1949“Informationiscommonlyusedtodenotesomepopulationofobjectstowhichsomesignificantprobabilityofbeingusefullyinformativeinthefuturehasbeenattributed.”--Buckland,1991.Unlike‘knowledge’or‘belief’

“theconceptofinformationhasconnotationsofneutrality--itishomogeneousandnoncontroversial.Thereality,ofcourse,ismorecomplicated”--Agre,1995信息是負(fù)熵(申農(nóng)《信息論》)編輯ppt什么是知識?知識是能夠指導(dǎo)思考、行為和交流的正確和真實的觀察、經(jīng)驗和過程的總結(jié)。知識包含真理和信念,觀點和概念,判斷和預(yù)期,方法和訣竅等內(nèi)容,也可以理解為用于解決問題的結(jié)構(gòu)化信息。編輯pptWorldsofKnowledge

(fromPopper’sObjectiveKnowledge)World1isthephysicalworldWorld2issubjectiveknowledgeorexperience--mentalstatesandprocesses.World3isobjectiveknowledge--recordedknowledge,publicknowledge--createdbypeople.編輯pptKnowledgeHierarchy[Source:KarlSveiby,TacitKnowledgeinKMYearbook1999-2000]3LevelsExpertiseKnow-HowSkillsKnowledgeInformationData編輯ppt智慧wisdom知識knowledge情報Intelligent信息information數(shù)據(jù)data隱性知識顯性知識分散孤立與行動相關(guān)前瞻性具有相關(guān)性對抗性數(shù)據(jù)、信息、知識、智慧之間的關(guān)系編輯ppt知識的類型事實知識(Know-what)原理知識(Know-why)技能知識(Know-how)人力知識(know-who)檢索知識(know-where

)編輯ppt再舉一例“8,000’和‘10,000-數(shù)據(jù)‘10,000米的高山’與‘8,000米的飛機飛行最大高度’是信息“飛機無法飛越這座高山”是知識‘必須飛得比地形高’是智慧編輯ppt什么是信息資源信息資源即“作為資源的信息”,可以理解為有價值的信息。然而信息的價值是體現(xiàn)在使用中的,對于不同的使用者,信息可以有不同的價值,而且信息的不同組合、不同的關(guān)聯(lián)也能使信息具有不同的價值。這反映了信息的特性:信息是具有語境(context,也譯成“上下文”)的數(shù)據(jù)。從計算機操作的角度來看,“信息資源是具有標(biāo)識的任何東西”。其價值由用戶去判斷。信息資源組織的目的就是以靈活的方式揭示信息之間的關(guān)聯(lián)(包括結(jié)構(gòu)關(guān)聯(lián)和語義關(guān)聯(lián)),滿足不同用戶的需要,使其成為“資源”。世間萬物,只要人能夠識別出來的東西,給它一個標(biāo)識(最常用的標(biāo)識就是名稱),它就成了“資源”作為元數(shù)據(jù)描述的對象,DCMI和W3C強調(diào),其“資源”只是在互聯(lián)網(wǎng)上,由命名域給出URI標(biāo)識的實體。編輯ppt什么是信息資源組織?即信息資源的有序化的活動:對于信息資源有序化的規(guī)律的認(rèn)識,以及應(yīng)用認(rèn)識得來的規(guī)律從事有序化工作知識組織=信息資源組織利用一定科學(xué)規(guī)則和方法,通過對信息外在特征和內(nèi)容特征的描述和序化,實現(xiàn)無需信息流向有序信息流的轉(zhuǎn)換,從而保證用戶對信息的有效獲取和利用及信息的有效流通和組合。信息的外在特征:信息的(物質(zhì))載體所直接反應(yīng)的特征;信息的內(nèi)容特征:信息所包含和承載的具體內(nèi)容,即通過信息載體所傳遞和交流的具體內(nèi)容。編輯ppt信息資源組織的目的查找Find標(biāo)識Identify選擇Select獲取Obtain編輯ppt信息資源組織體系根據(jù)對象區(qū)分信息組織的不同領(lǐng)域:哲學(xué)認(rèn)識論以知識的抽象本質(zhì)組織知識;圖書情報機構(gòu)傳統(tǒng)上結(jié)合實物載體組織信息資源;數(shù)字圖書館以數(shù)字化的信息形式組織資源;情報檢索系統(tǒng)可以看成是DL中的一個部分,通過數(shù)字化信息內(nèi)容的各種結(jié)構(gòu)組織資源,人為標(biāo)注的結(jié)構(gòu);本身的結(jié)構(gòu)被人發(fā)現(xiàn)而利用;企業(yè)知識管理圍繞企業(yè)管理中信息的利用組織資源;搜索引擎的信息組織;語義萬維網(wǎng)中的信息組織;其他各種領(lǐng)域知識根據(jù)領(lǐng)域的特點組織知識編輯ppt圖書館的信息資源組織圖書館學(xué)的目的宗旨:信息資源整序圖書館工作的組成(采分編典流)的目的主要方法:目錄學(xué)(關(guān)于傳統(tǒng)圖書館信息組織的科學(xué))分類法主題法文摘與索引圖書編目無數(shù)的經(jīng)驗編輯ppt圖書館如何組織/整理圖書?由于數(shù)量和體積龐大,引入圖書代用品:目錄卡片;(書、卡的分離圖書館管理上的一大進步。博物館、檔案館等任何涉及載體管理的機構(gòu)莫不如此)泥版、羊皮卷、紙莎草、竹簡乃至半導(dǎo)體零件、各類倉儲物資,在計算機發(fā)明之前,卡片目錄是最先進管理方式。其意義甚至不亞于結(jié)繩記事、文字發(fā)明、書籍產(chǎn)生……目錄是館藏的縮影和“代用品”;為了達(dá)到方便存取的目的,多套目錄卡片提供多種查詢途徑;圖書采取唯一方式排架,目錄卡片指引到唯一的圖書排架號;每種途徑反映了圖書的某一屬性,例如先按載體類型或語種分,再按學(xué)科分類,或其他屬性分,如著者目錄;卡片目錄/圖書典藏的排列是分類與字順等多種方式的結(jié)合;目錄卡片的種類有限,不可能窮盡用戶認(rèn)識的角度和使用需求與習(xí)慣;圖書是知識的載體,部分目錄反映館藏知識體系,圖書館通過管理知識載體,間接地整理知識。編輯ppt圖書館的信息資源組織(續(xù))連續(xù)出版物有一點不同二次文獻(xiàn)(情報)服務(wù)有很大不同電子資源使傳統(tǒng)圖書館的信息組織方寸大亂編輯ppt信息資源組織面臨的數(shù)字環(huán)境傳統(tǒng)情報檢索的挑戰(zhàn)處理單元變?yōu)椤扒閳筝d體”:期刊論文、科研報告、報紙文章、專利文獻(xiàn)…;解決方案:文獻(xiàn)數(shù)據(jù)庫+原文提供;數(shù)字化浪潮的挑戰(zhàn)處理單元復(fù)雜化,包含書本、期刊、論文、報告、以及“事實”、“數(shù)據(jù)”(傳統(tǒng)的事實數(shù)據(jù)以工具書形式存在)并且需要整合利用需要研究信息/知識整個生命周期的完整過程,甚至包括部分認(rèn)知過程需要從數(shù)據(jù)、信息層面上升到“知識”層面這個過程是正在進行時,隨著技術(shù)的發(fā)展正在變化。編輯pptCollectionsgrid信息資源類型highlowlowhighStewardship權(quán)威性Uniqueness稀缺性BooksJournalsNewspapersGov.docsCD,DVDMapsScoresSpecial

collections

ArchivesRarebooksLocalhistorymaterialsArchives&ManuscriptsTheses&dissertationsFreely-accessiblewebresourcesResearchandlearningmaterials

ePrints/techreportsLearningobjectsCoursewareE-portfoliosResearchdataUntransferredrecordsFrom:LorcanDempsey編輯pptWeb上的信息Google當(dāng)前索引80多億網(wǎng)頁,每天平均收到2000萬個查詢。中國的公開網(wǎng)頁在3-4億,百度每天大概收到500萬個查詢每篇網(wǎng)頁的平均大小在12KB左右,于是總共約40TB容量(10年)人類的1億種書,每本算10萬字,200KB,總共約20TB容量。(5000年)編輯ppt搜索引擎搜索引擎(SearchEngines)是對互聯(lián)網(wǎng)上的信息資源(主要是網(wǎng)頁)進行搜集整理,然后提供查詢服務(wù)的系統(tǒng),通常包括信息搜集、信息整理和用戶查詢?nèi)糠?,但提供給用戶的往往只是一個查詢界面。兩類搜索服務(wù)GoogleYahoo編輯ppt網(wǎng)絡(luò)信息資源的挑戰(zhàn)數(shù)量巨大沒有一個搜索引擎能夠覆蓋萬維網(wǎng)的16%網(wǎng)站;所有搜索引擎加起來覆蓋了萬維網(wǎng)的42%極端異質(zhì)信息值不同長度不同語法或輸入錯誤內(nèi)容錯誤、過時或不可靠多種格式多語種速度問題每分鐘需要接受15,000~20,000次查詢請求編輯ppt數(shù)字化信息量舉例音樂作品(莫扎特):約100MB報紙(華爾街雜志):100MB/年(文本)卡片目錄(美國國會圖書館):17GB廣播(WABC):270GB/年(未經(jīng)壓縮)網(wǎng)絡(luò)論壇(Netnews):300GB/年地區(qū)圖書館(加州大學(xué)圖書館):1.4TB(圖書掃描版)Internet出版(WWW):1997年約4TB電視(CNN新聞):1GB/1小時,6TB/年(經(jīng)壓縮)錄像帶出租(BlockbusterVideo):9TB科研圖書館(美國會圖書館):全部圖書館數(shù)字化20TB

來源:美國伯克利加州大學(xué)教授PeterLyman和AlexInternet公司總裁BrewsterKahle所著《文化制品數(shù)字化存檔行動綱要》。編輯ppt信息檢索的問題查找非結(jié)構(gòu)信息有困難多數(shù)數(shù)據(jù)庫在結(jié)構(gòu)化字段上工作多數(shù)商業(yè)信息是非結(jié)構(gòu)化的.報告、電子郵件、來往公函...美國商業(yè)每年產(chǎn)生4500億份文件波音747文件比飛機重量還重索引是主觀的索引者之間不一致,經(jīng)驗統(tǒng)計表明索引者之間僅20%相同.作者與索引者之間、檢索者與用戶之間不一致.信息超載信息太多,需要過濾檢索結(jié)果垃圾太多,有害信息太多編

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論