


版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、信息整流與知識增值服務 綜合教育論文【內容提要】本文提出數字圖書館的主要功能目標是信息整 流與知識增值服務;信息與知識轉換是數字圖書館的關鍵理論和 技術問題。圖書館受到In ternet的巨大沖擊、不再是文獻信息服 務的唯一提供者,數字圖書館如何才能挽回失去的老用戶,吸引新用戶?知識管理工程將使數字圖書館成為21世紀學習的大平臺、文化知識的大平臺和知識資源中心。【摘要題】信息服務數字圖書館的信息整流數字圖書館把傳統圖書館的功能由信息的查詢和圖書資料 的借閱擴展到知識服務的新階段。實現這一宏偉目標需要解決許 多技術和社會問題,其中有兩個最關鍵的技術是信息的整流和知 識的創(chuàng)新。前者涉及數字圖書館的
2、知識鏈建立問題,后者涉及數字圖書館的信息變換成知識的知識增值服務問題。1.1數字圖書館的知識鏈數字圖書館是一個龐大的數字資料庫, 包括所有資料的數字 化存儲,在線網上資料、多媒體資料、電子出版物等。數字圖書 館根據用戶對信息的不同需求, 將文本、圖片等原件制作成不同 數字形式。一般有純圖像形式,目錄文本形式,正文圖像形式, 全文本形式和全文索引形式。但關鍵還是知識鏈的建立。為實現知識鏈信息,數字圖書館將資源分成為元數據和對象 數據。對象數據指數字化的文本、圖像、聲言、影像等,元數據 則指那些描述和管理對象的數據。 對象數據分布式地存放在各地 的資源站點內,元數據則集中存放在數字圖書館中心的超大
3、規(guī)模 服務器上。用戶查詢時,中心調度系統通過元數據來調度各對象 數據庫以提供服務。知識的控制單位長期停留在文獻這一級上,而人對知識的需求一般不是以文獻為單位的。 早在20世紀70年代后期就有專家 指出,知識的控制單位將從文獻深化到文獻中的數據、公式、事 實、結論等最小的獨立的 知識元” 一旦實現知識的控制單位由文 獻深化到 知識元”大量文獻中所包含的知識元”及相關信息間的鏈接將產生極大的知識增值,從而大大推進人類對知識的利 用,促進新知識的創(chuàng)造,從而也將推動知識資源業(yè)的重大發(fā)展1.一篇文獻反映作者的科學研究成果,包含著作者的知識創(chuàng)新 的過程。于是文本結構本身就隱含著對某學科問題的知識鏈。假如我
4、們把每篇文獻的知識看成是人類知識結構中的一個 知識單元,知識單元與知識結構就組成了個性知識與共性知識的 知識系統。個性知識體現在知識的創(chuàng)新上,共性知識結構則表現在知識的完整性上。于是我們就建立了個性知識與共性知識的知 識鏈。事實上,專利文獻就明顯地表現了個性知識單元與人類知 識結構的知識創(chuàng)新鏈關系2.數字圖書館對文本的知識標引,既體現了標引者應用學科知 識結構的背景知識的能力,同時又體現了標引者識別和提煉作者 的知識創(chuàng)新點的判斷和知識組織能力。因此,是一個知識鏈建立的知識增值過程。1.2數字圖書館的知識發(fā)現知識鏈的建立過程是知識發(fā)現和知識再組織的過程。知識發(fā)現的主要目標是采用有效的算法, 從大
5、量現有或歷史數據集合中 發(fā)現并找出最初未知、但最終可理解的有用知識, 并用簡明的方 式顯示出來。知識發(fā)現一般包含如下幾個步驟:(1)理解相應的問題領域;(2)準備相關數據子集;(3)發(fā)現模式(數據挖掘); (4)所發(fā)現模式的后處理;(5)應用發(fā)現結果。(1)文本知識結構分析技術盡管與多媒體信息相比,文本信息顯得比較普通,但文本仍 然是記載和傳播信息的最主要媒體, 因此對文本信息知識發(fā)現技 術的研究具有十分重要的意義和廣泛的應用前景。文本結構分析的目的在于發(fā)現文本表達主題概念的物理組織結構,由物理結構自動重組主題概念的邏輯結構,實現對文本知識的抽象化和具體化推理檢索。文獻3把文本結構分成物理結構
6、和邏輯結構。物理結構=標題,段落,句子,詞匯,它表示了文本的組成情況。可米用 向量空間模型表示文本及文本各個部分,進行文本結構分析,其中主要是文本的層次分析, 從而得到文本的邏輯結構。 邏輯結構 =主題,層次,段落,句子,主題詞,它更著重于表示文本所包 含的思想內容和表達的邏輯方式。(2)知識鏈結構文本的物理結構是文本的外表形式,邏輯結構體現了作者表達目的的邏輯順序,而文本的知識鏈結構則是作者的目的和靈 魂,知識鏈結構=問題,已有解的優(yōu)缺點,新解的方案,性能評 價,今后方向.研究文本的目的是為了獲得文本的知識鏈,以創(chuàng) 建新的知識鏈。引文方法是一種很好的文獻鏈, 表現了引用文獻與被引用文獻之間的
7、多種關系。但它并不完全直接表現知識鏈關系。文獻鏈是一種龐大的文獻引用系統。知識鏈則是一種巨大的知識引用系 統。若能完成這一巨大的系統, 人類將可能進行更有效的知識學 習。1.3信息整流的實現知識鏈是文本知識結構的普遍特性,是人類學習、創(chuàng)新的紐帶。信息整流與信息濾波不同。信息濾波的目的主要有兩點,即 過濾掉不相關的文檔以及將相關文檔列表分為新的文檔和已經 查閱過的文檔,并按相似度大小排序,對已檢索的相關文檔,通 知信息Age nt不必返回全文文檔,以減少通信費用。信息整流的 目的在于建立數字圖書館的知識鏈庫,提供知識鏈服務。信息整流是建立知識鏈的過程。 從全文提取出知識單元, 形 成獨立的知識基
8、礎,構成知識單元庫,把各種知識單元庫進行鏈 接,構成數字圖書館廣泛的知識網絡庫。知識網絡庫形成了學科橫向交叉和學科縱向延伸的科學知識體系。描述了人類知識學習和知識創(chuàng)新的知識網絡結點。把人類知識學習和創(chuàng)新活動之間的距離大大的縮短。在知識網絡庫 中,用戶可以跨知識單元庫學習所感興趣的知識,更可以通過知識單元庫直接學習到解決問題的知識和辦法。知識單元庫的實現是知識網絡庫建立的基礎和關鍵。已有的信息置標語言 HTML ( HyperTextMarkupLanguage)的超級鏈接功能使 Web技術從計算機世界走向 社會、走向千家萬戶,實現 Web與數據庫的超級鏈接。HTML 表現出Web顯示數據的通用
9、方法,而XML提供了一個直接處理 Web數據的通用方法。HTML著重描述 Web頁面的顯示格式, 而XML著重描述 Web頁面的內容。XML是文檔的各種數字表 示方式,用XML表示的數字文檔可以由計算機處理,也可以供 人閱讀。XML文檔是一種純文本文檔,可以包含圖片、視頻或其他多媒體信息,可以是百科全書,也可以是一封電子郵件,或 一則天氣預報、一張電子商務交易單等。如對商品的描述中, 若在應用中的名稱、質量、價格還不足以描述一個商品的特征時, 還可通過其他模式增加新特征, 只要加入的元素在它們各自名域 的前后關系中是有效的。這就為知識單元的描述提供了工具, 通 過XML標記將文本標記成知識單元,繼而將知識單元鏈接成知 識結構,實現知識鏈。與引文索引不同,在用 XML實現知識單元的描述中,可以 將被引文獻中的知識單元采用指針的方式加以直接標記,于是實現了知識鏈接的作用。鏈接(Linking )是Web實現關鍵。HTML的鏈接是單向的 有兩個端點一一源端和目標端,源端通常是 Web頁的一個片段, 如一個詞語、一段文本或一幅圖像,目標端是一個 資源”由統一 資源標記(URI)地址指定。XML是描述結構化數據的底層文 法,用這種簡單文法可以支持種類繁多的應用。預計XML將成為數字圖書館信息整流的基礎性語言。數字圖書館的知識增值服務數字圖書館不僅是傳統圖書館的數字化, 而
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 煙臺大學《泌尿生殖與內分泌系統醫(yī)學教程》2023-2024學年第二學期期末試卷
- 2025至2031年中國電動手動兩用轉盤座行業(yè)投資前景及策略咨詢研究報告
- 2025-2030年中國PET改性酚醛樹市場運行新形勢與投資前景報告
- 婚禮發(fā)言稿模板
- 反流的臨床護理
- 廣告效果評估的管理模式
- 保安工作計劃建筑業(yè)市政工程部門
- 小腸損傷的臨床護理
- 班主任與家長的溝通策略計劃
- 引導幼兒參與班級建設的方案計劃
- 藍色北京師范大學4.3頂部導航欄博士復試模板
- 防汛減災小知識
- 2024年四川宜賓環(huán)球集團有限公司招聘考試真題
- 期中測試(范圍:第1-4章)(A卷·夯實基礎)-北師大版七年級數學下冊(原卷版)
- 2025時政試題及答案(100題)
- 《旅行社經營與管理》電子教案 5-2 旅行社接待業(yè)務2
- 醫(yī)療器械操作規(guī)范與安全知識培訓試題庫
- 視力檢查方法課件
- 2025固體礦產地質調查規(guī)范1:25000
- 2025-2030中國具身智能行業(yè)研發(fā)創(chuàng)新策略與未來前景展望報告
- 智慧樹知到《藝術與審美(北京大學)》期末考試附答案
評論
0/150
提交評論