第1章 信息組織引論.ppt_第1頁
第1章 信息組織引論.ppt_第2頁
第1章 信息組織引論.ppt_第3頁
第1章 信息組織引論.ppt_第4頁
第1章 信息組織引論.ppt_第5頁
已閱讀5頁,還剩42頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、第1章 信息組織引論,1.1 信息資源在知識經(jīng)濟中的地位與作用,信息:是物質存在的一種方式、形態(tài)或運動狀態(tài),是標記在通訊系統(tǒng)中的信號,是構成知識的原料。 信息與物資、能源已成為現(xiàn)代社會的三大支柱。,1.1.1 信息在我國經(jīng)濟和社會發(fā)展中的作用,哈佛大學的丹尼爾提出“后工業(yè)社會”的概念(信息社會)(前工業(yè)社會依靠原始勞動力并從自然界提取初級資源;工業(yè)社會圍繞生產(chǎn)和機器這個軸心并為制造商品而組織起來;后工業(yè)社會圍繞知識組織起來)。 上世紀八十年代托夫勒預言:隨著西方社會進入信息時代,社會的主宰力量將由金錢轉向知識。,? =,1.1.2 信息組織在信息資源開發(fā)中的地位與作用,現(xiàn)代信息技術的發(fā)展,導致

2、信息量急劇增長。人類面對兩個新問題,即: 知識和信息的海量性和無限性與人的精力、時間的有限性形成了尖銳的矛盾; 知識和信息的無序性和污染性與人類使用的選擇性同樣是尖銳的對立。 失去控制和無組織的信息不再是一種資源。 信息組織是信息資源建設的中心環(huán)節(jié),是建立信息系統(tǒng)的重要條件,是信息檢索與咨詢的基礎,是開展用戶服務的有力保證。,1.1.3 信息組織的驅動力-信息環(huán)境,信息爆炸 信息超載 信息的特性:越消費越多 梅特卡夫定律:隨著上網(wǎng)人數(shù)的增長,網(wǎng)上資源將呈幾何級數(shù)的增長。 信息污染嚴重(垃圾信息、虛假信息、冗余信息、反動信息等),1.1.3 信息組織的驅動力-信息檢索需求的多樣化,文獻檢索(以文

3、獻為檢索對象,檢索到文獻線索或原文) 數(shù)據(jù)檢索(以數(shù)值或圖表形式表示的數(shù)據(jù)為檢索對象) 事實檢索(以從文獻中抽取的事項為檢索內容??赏ㄟ^人工或自動抽取事實形成資源庫,例如:公交線路搜索,名人事跡搜索, 事實抽取,組織與檢索 總的說來,信息檢索需求向著個性化、用戶情景敏感、以知識而不是信息為檢索單元、信息之間的關系檢索等方向發(fā)展,1.1.3 信息組織的驅動力-信息檢索機制的變化,手工檢索 聯(lián)機檢索 例如:redwood(3n)deck?(s)(swimming(w)pool?) 網(wǎng)絡檢索 信息檢索機制的變化源于信息組織方式的變化,也影響到信息組織的發(fā)展。,1.1.3 信息組織的驅動力-信息檢索工

4、具的變化,按加工信息的手段分為: 手工檢索工具(目錄、索引) 機械檢索工具(卡片分揀等) 計算機檢索工具(檢索系統(tǒng)、數(shù)據(jù)庫) 按載體形式分為: 書本型 卡片型 縮微型 磁性材料型 光盤型,1.1.3 信息組織的驅動力-信息檢索工具的變化,網(wǎng)絡檢索工具按檢索機制分: 檢索型 目錄型 混合型(例如:yahoo、intute等) 按數(shù)據(jù)內容分: 綜合型 專題型(例如:博客檢索、專業(yè)檢索) 特殊型(圖片、地圖、ftp等) 按是否組織數(shù)據(jù)分: 單獨型檢索工具 集合型檢索工具(例如dogpile、,1.1.3 信息組織的驅動力-信息檢索技術的進步,網(wǎng)絡檢索結合多種技術(布爾檢索、截詞檢索、鄰近檢索、短語檢

5、索、字段檢索、區(qū)分大小寫檢索、限制檢索、二次檢索、自然語言檢索、多語種檢索等) AltaVista的翻譯檢索( 例如:檢索“人民”),內容提要,什么是信息組織? 為什么要進行信息組織? 如何進行信息組織? 思想 方法 技術手段,什么是信息組織,信息組織,也叫信息整序,是利用一定的規(guī)則、方法和技術對信息的外部特征和內容特征進行揭示和描述,并按給定的參數(shù)和序列公式排列,使信息從無序集合轉換為有序集合的過程。 外部特征:信息的物理載體直接反映的信息對象,構成信息的外在的、形式的特征(題名、作者、出版社、日期等) 內部特征:信息包含的內容,由主題詞、關鍵詞或其它知識單元表達,什么是信息組織?,信息組織

6、的基本內容,信息選擇 從采集到的無序的信息流中甄別出有用的信息,剔除無 用信息 信息分析 按一定邏輯關系對選擇過的信息內、外部特征進行細化、挖掘、加工整理并歸類,信息描述和揭示 根據(jù)信息組織和檢索的需要,對信息的主題內容、形式 特征、物質形態(tài)等進行分析和記錄 信息存儲 將經(jīng)過加工整理序化后的信息按一定格式與順序存儲在 特定的載體中,信息組織的基本內容,信息組織的類型,按信息表現(xiàn)形式劃分 文字信息組織、圖像信息組織、 聲音信息組織、視頻信息組織 按信息加工程度劃分 一次信息組織、二次信息組織、三次信息組織 按信息的傳播載體劃分 文獻信息組織、非文獻信息組織,信息組織的理論基礎,語言學 組織符號系

7、統(tǒng)(語法、詞匯) 邏輯學 演繹推理、歸納推理、綜合、分析 知識分類 知識體系結構,圖書館的信息組織,物理陳列:分類號、索書號、上架、更新,圖書館的信息組織,館藏書目檢索庫 題名、作者、出版時間、分類號、 國際標準書號、索書號、主題詞,信息組織的兩大思想,1、分類方法 根據(jù)信息的學科體系特征來序列信息的一種方法 體系、類目關系 中國圖書館分類法 2、主題方法 根據(jù)文獻主題特征來組織排列信息的一種方法, 由受控的自然語言語詞直接表達主題概念,應用 分類法: Yahoo分類目錄 門戶網(wǎng)站分類頻道 分類搜索瀏覽 主題法: 百度,Google 搜索引擎,信息組織的兩大思想,比較分析 分類法系統(tǒng)性強,滿足

8、族性檢索,符合人們的思維與檢索習慣,分類目錄瀏覽 主題法直觀,滿足特性檢索,提供了一種直接面向對象、事實或概念的信息組織方法,信息組織的兩大思想,3、分類主題一體化 族性檢索與特性檢索相結合 搜索引擎在分類檢索的同時添加了關鍵詞索引手 段,而一些主題檢索的搜索引擎也輔助以分類索引 功能 CNKI中的組織法 搜索引擎的分類搜索,信息組織的兩大思想,信息的描述與揭示工具,1、過程 著錄:編制文獻目錄時,對文獻內容和形式特征 進行分析、選擇和記錄的過程 標引:指分析文獻的內容屬性及相關外表屬性, 并用特定語言表達分析出的屬性或特征,從而賦 予文獻檢索標識的過程,2、工具 語言標識系統(tǒng) 標引語言 分類

9、語言:用分類號表達主題概念,依據(jù)知識分 類將主題概念組織、排列成類目體系,主要以類 目體系的自身結構顯示概念之間關系的標引語言 主題語言:由受控的自然語言直接表達主題概 念,按語詞字順排列主題概念,主要用參照顯示 概念之間關系的標引語言,信息的描述與揭示工具,網(wǎng)絡信息組織,1、元數(shù)據(jù)(metadata) 關于數(shù)據(jù)的數(shù)據(jù)(data about data) 元數(shù)據(jù)(Medadata)是組織信息的基本工具,是為標引和著錄網(wǎng)上信息資源而產(chǎn)生的結構化數(shù)據(jù),它是用來描述網(wǎng)上信息資源,加強對網(wǎng)上信息資源的搜集、開發(fā)、組織與利用的網(wǎng)絡數(shù)據(jù)集合元數(shù)據(jù)是組織數(shù)據(jù)、各種數(shù)據(jù)域及它們之間相互關系的信息,1、元數(shù)據(jù) 數(shù)

10、據(jù)類型 元素名稱 (Element names) 元素描述( Element description) 元素標識( Element representation) 元素代碼( Element coding) 元素語義( Element semantics) 元素分類( Element classification),網(wǎng)絡信息組織,2、網(wǎng)絡信息資源描述的相關標準 (1)MARC(Machine Readable Catalogue),機器可讀 目錄,是一種計算機能夠識別和閱讀的目錄 特點:伸縮性強,適應面廣 包括001999個字段 字段內容著錄詳盡,作用強化 USMARC(美國國會圖書館機讀目錄

11、通信格式) UNIMARC(國際機讀目錄通信格式) CNMARC(中國機讀目錄格式),網(wǎng)絡信息組織,2、網(wǎng)絡信息資源描述的相關標準 (2)Dublin Core(都柏林核心集),描述網(wǎng)絡信息資 源的一種簡單元數(shù)據(jù),其目的是提供一種 Internet資源的描述規(guī)范,以便發(fā)掘西文電子資 源,包括15個數(shù)據(jù)單元(element) 特點: 通俗易懂,運用靈活,國際通用,可擴展性,網(wǎng)絡信息組織,2、網(wǎng)絡信息資源描述的相關標準 (3)通用標記語言 通用置標語言標準 SGML (Standard Generalized Markup Language) 超文本置標語言 HTML( Hyper-text Ma

12、rkup Language) 可擴展的置標語言 XML (eXtensible Markup Language),網(wǎng)絡信息組織,3、技術與方法 a.文件方式:適用于非結構化信息,不涉及信息 之間的內在邏輯聯(lián)系,無法處理海量信息 b.數(shù)據(jù)庫方式:將所有已獲得的網(wǎng)絡信息資源以 固定的記錄格式存貯,用戶通過關鍵詞及其組 配查詢,網(wǎng)絡信息組織,3、技術與方法 c.主題樹方式:按事先確定的概念體系結構分類進 行組織,用戶以瀏覽方式層層遍歷 d.超媒體方式:超文本多媒體 資源形成網(wǎng)狀結構 如網(wǎng)絡過于龐雜和復雜,用戶易迷航,網(wǎng)絡信息組織,知識組織,知識組織 狹義:文獻的分類、標引、編目、文摘、索引等 廣義:針對知識的兩要素進行組織,知識因子(結 點)的有序化和知識關聯(lián)(結點間的聯(lián)系) 布魯克斯提出的“知識地圖”: 對文獻內容進行知識分析與組織,找到人們在知識創(chuàng) 造過程中相互影響及聯(lián)系的結點,從而深入揭示知識的有 機結構,為用戶提供情報。,學科知識地圖,Don R. Swanson基于非相關文獻的知識發(fā)現(xiàn),知識組織的技術與方法,客觀知識組織的基本工具: 分類法、主題法 主觀知識組織的工具: 數(shù)據(jù)倉庫、知識挖掘(DM,Data Mining)、 數(shù)據(jù)庫中的知識發(fā)現(xiàn)(

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論