![信息整流與知識增值服務(wù)_綜合教育論_第1頁](http://file3.renrendoc.com/fileroot_temp3/2021-12/22/9091dc64-2592-4f41-90d6-446a3b0ff340/9091dc64-2592-4f41-90d6-446a3b0ff3401.gif)
![信息整流與知識增值服務(wù)_綜合教育論_第2頁](http://file3.renrendoc.com/fileroot_temp3/2021-12/22/9091dc64-2592-4f41-90d6-446a3b0ff340/9091dc64-2592-4f41-90d6-446a3b0ff3402.gif)
![信息整流與知識增值服務(wù)_綜合教育論_第3頁](http://file3.renrendoc.com/fileroot_temp3/2021-12/22/9091dc64-2592-4f41-90d6-446a3b0ff340/9091dc64-2592-4f41-90d6-446a3b0ff3403.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、信息整流與知識增值服務(wù) 綜合教育論文【內(nèi)容提要】本文提出數(shù)字圖書館的主要功能目標是信息整 流與知識增值服務(wù);信息與知識轉(zhuǎn)換是數(shù)字圖書館的關(guān)鍵理論和 技術(shù)問題。圖書館受到In ternet的巨大沖擊、不再是文獻信息服 務(wù)的唯一提供者,數(shù)字圖書館如何才能挽回失去的老用戶,吸引新用戶?知識管理工程將使數(shù)字圖書館成為21世紀學習的大平臺、文化知識的大平臺和知識資源中心。【摘要題】信息服務(wù)數(shù)字圖書館的信息整流數(shù)字圖書館把傳統(tǒng)圖書館的功能由信息的查詢和圖書資料 的借閱擴展到知識服務(wù)的新階段。實現(xiàn)這一宏偉目標需要解決許 多技術(shù)和社會問題,其中有兩個最關(guān)鍵的技術(shù)是信息的整流和知 識的創(chuàng)新。前者涉及數(shù)字圖書館的
2、知識鏈建立問題,后者涉及數(shù)字圖書館的信息變換成知識的知識增值服務(wù)問題。1.1數(shù)字圖書館的知識鏈數(shù)字圖書館是一個龐大的數(shù)字資料庫, 包括所有資料的數(shù)字 化存儲,在線網(wǎng)上資料、多媒體資料、電子出版物等。數(shù)字圖書 館根據(jù)用戶對信息的不同需求, 將文本、圖片等原件制作成不同 數(shù)字形式。一般有純圖像形式,目錄文本形式,正文圖像形式, 全文本形式和全文索引形式。但關(guān)鍵還是知識鏈的建立。為實現(xiàn)知識鏈信息,數(shù)字圖書館將資源分成為元數(shù)據(jù)和對象 數(shù)據(jù)。對象數(shù)據(jù)指數(shù)字化的文本、圖像、聲言、影像等,元數(shù)據(jù) 則指那些描述和管理對象的數(shù)據(jù)。 對象數(shù)據(jù)分布式地存放在各地 的資源站點內(nèi),元數(shù)據(jù)則集中存放在數(shù)字圖書館中心的超大
3、規(guī)模 服務(wù)器上。用戶查詢時,中心調(diào)度系統(tǒng)通過元數(shù)據(jù)來調(diào)度各對象 數(shù)據(jù)庫以提供服務(wù)。知識的控制單位長期停留在文獻這一級上,而人對知識的需求一般不是以文獻為單位的。 早在20世紀70年代后期就有專家 指出,知識的控制單位將從文獻深化到文獻中的數(shù)據(jù)、公式、事 實、結(jié)論等最小的獨立的 知識元” 一旦實現(xiàn)知識的控制單位由文 獻深化到 知識元”大量文獻中所包含的知識元”及相關(guān)信息間的鏈接將產(chǎn)生極大的知識增值,從而大大推進人類對知識的利 用,促進新知識的創(chuàng)造,從而也將推動知識資源業(yè)的重大發(fā)展1.一篇文獻反映作者的科學研究成果,包含著作者的知識創(chuàng)新 的過程。于是文本結(jié)構(gòu)本身就隱含著對某學科問題的知識鏈。假如我
4、們把每篇文獻的知識看成是人類知識結(jié)構(gòu)中的一個 知識單元,知識單元與知識結(jié)構(gòu)就組成了個性知識與共性知識的 知識系統(tǒng)。個性知識體現(xiàn)在知識的創(chuàng)新上,共性知識結(jié)構(gòu)則表現(xiàn)在知識的完整性上。于是我們就建立了個性知識與共性知識的知 識鏈。事實上,專利文獻就明顯地表現(xiàn)了個性知識單元與人類知 識結(jié)構(gòu)的知識創(chuàng)新鏈關(guān)系2.數(shù)字圖書館對文本的知識標引,既體現(xiàn)了標引者應(yīng)用學科知 識結(jié)構(gòu)的背景知識的能力,同時又體現(xiàn)了標引者識別和提煉作者 的知識創(chuàng)新點的判斷和知識組織能力。因此,是一個知識鏈建立的知識增值過程。1.2數(shù)字圖書館的知識發(fā)現(xiàn)知識鏈的建立過程是知識發(fā)現(xiàn)和知識再組織的過程。知識發(fā)現(xiàn)的主要目標是采用有效的算法, 從大
5、量現(xiàn)有或歷史數(shù)據(jù)集合中 發(fā)現(xiàn)并找出最初未知、但最終可理解的有用知識, 并用簡明的方 式顯示出來。知識發(fā)現(xiàn)一般包含如下幾個步驟:(1)理解相應(yīng)的問題領(lǐng)域;(2)準備相關(guān)數(shù)據(jù)子集;(3)發(fā)現(xiàn)模式(數(shù)據(jù)挖掘); (4)所發(fā)現(xiàn)模式的后處理;(5)應(yīng)用發(fā)現(xiàn)結(jié)果。(1)文本知識結(jié)構(gòu)分析技術(shù)盡管與多媒體信息相比,文本信息顯得比較普通,但文本仍 然是記載和傳播信息的最主要媒體, 因此對文本信息知識發(fā)現(xiàn)技 術(shù)的研究具有十分重要的意義和廣泛的應(yīng)用前景。文本結(jié)構(gòu)分析的目的在于發(fā)現(xiàn)文本表達主題概念的物理組織結(jié)構(gòu),由物理結(jié)構(gòu)自動重組主題概念的邏輯結(jié)構(gòu),實現(xiàn)對文本知識的抽象化和具體化推理檢索。文獻3把文本結(jié)構(gòu)分成物理結(jié)構(gòu)
6、和邏輯結(jié)構(gòu)。物理結(jié)構(gòu)=標題,段落,句子,詞匯,它表示了文本的組成情況。可米用 向量空間模型表示文本及文本各個部分,進行文本結(jié)構(gòu)分析,其中主要是文本的層次分析, 從而得到文本的邏輯結(jié)構(gòu)。 邏輯結(jié)構(gòu) =主題,層次,段落,句子,主題詞,它更著重于表示文本所包 含的思想內(nèi)容和表達的邏輯方式。(2)知識鏈結(jié)構(gòu)文本的物理結(jié)構(gòu)是文本的外表形式,邏輯結(jié)構(gòu)體現(xiàn)了作者表達目的的邏輯順序,而文本的知識鏈結(jié)構(gòu)則是作者的目的和靈 魂,知識鏈結(jié)構(gòu)=問題,已有解的優(yōu)缺點,新解的方案,性能評 價,今后方向.研究文本的目的是為了獲得文本的知識鏈,以創(chuàng) 建新的知識鏈。引文方法是一種很好的文獻鏈, 表現(xiàn)了引用文獻與被引用文獻之間的
7、多種關(guān)系。但它并不完全直接表現(xiàn)知識鏈關(guān)系。文獻鏈是一種龐大的文獻引用系統(tǒng)。知識鏈則是一種巨大的知識引用系 統(tǒng)。若能完成這一巨大的系統(tǒng), 人類將可能進行更有效的知識學 習。1.3信息整流的實現(xiàn)知識鏈是文本知識結(jié)構(gòu)的普遍特性,是人類學習、創(chuàng)新的紐帶。信息整流與信息濾波不同。信息濾波的目的主要有兩點,即 過濾掉不相關(guān)的文檔以及將相關(guān)文檔列表分為新的文檔和已經(jīng) 查閱過的文檔,并按相似度大小排序,對已檢索的相關(guān)文檔,通 知信息Age nt不必返回全文文檔,以減少通信費用。信息整流的 目的在于建立數(shù)字圖書館的知識鏈庫,提供知識鏈服務(wù)。信息整流是建立知識鏈的過程。 從全文提取出知識單元, 形 成獨立的知識基
8、礎(chǔ),構(gòu)成知識單元庫,把各種知識單元庫進行鏈 接,構(gòu)成數(shù)字圖書館廣泛的知識網(wǎng)絡(luò)庫。知識網(wǎng)絡(luò)庫形成了學科橫向交叉和學科縱向延伸的科學知識體系。描述了人類知識學習和知識創(chuàng)新的知識網(wǎng)絡(luò)結(jié)點。把人類知識學習和創(chuàng)新活動之間的距離大大的縮短。在知識網(wǎng)絡(luò)庫 中,用戶可以跨知識單元庫學習所感興趣的知識,更可以通過知識單元庫直接學習到解決問題的知識和辦法。知識單元庫的實現(xiàn)是知識網(wǎng)絡(luò)庫建立的基礎(chǔ)和關(guān)鍵。已有的信息置標語言 HTML ( HyperTextMarkupLanguage)的超級鏈接功能使 Web技術(shù)從計算機世界走向 社會、走向千家萬戶,實現(xiàn) Web與數(shù)據(jù)庫的超級鏈接。HTML 表現(xiàn)出Web顯示數(shù)據(jù)的通用
9、方法,而XML提供了一個直接處理 Web數(shù)據(jù)的通用方法。HTML著重描述 Web頁面的顯示格式, 而XML著重描述 Web頁面的內(nèi)容。XML是文檔的各種數(shù)字表 示方式,用XML表示的數(shù)字文檔可以由計算機處理,也可以供 人閱讀。XML文檔是一種純文本文檔,可以包含圖片、視頻或其他多媒體信息,可以是百科全書,也可以是一封電子郵件,或 一則天氣預(yù)報、一張電子商務(wù)交易單等。如對商品的描述中, 若在應(yīng)用中的名稱、質(zhì)量、價格還不足以描述一個商品的特征時, 還可通過其他模式增加新特征, 只要加入的元素在它們各自名域 的前后關(guān)系中是有效的。這就為知識單元的描述提供了工具, 通 過XML標記將文本標記成知識單元,繼而將知識單元鏈接成知 識結(jié)構(gòu),實現(xiàn)知識鏈。與引文索引不同,在用 XML實現(xiàn)知識單元的描述中,可以 將被引文獻中的知識單元采用指針的方式加以直接標記,于是實現(xiàn)了知識鏈接的作用。鏈接(Linking )是Web實現(xiàn)關(guān)鍵。HTML的鏈接是單向的 有兩個端點一一源端和目標端,源端通常是 Web頁的一個片段, 如一個詞語、一段文本或一幅圖像,目標端是一個 資源”由統(tǒng)一 資源標記(URI)地址指定。XML是描述結(jié)構(gòu)化數(shù)據(jù)的底層文 法,用這種簡單文法可以支持種類繁多的應(yīng)用。預(yù)計XML將成為數(shù)字圖書館信息整流的基礎(chǔ)性語言。數(shù)字圖書館的知識增值服務(wù)數(shù)字圖書館不僅是傳統(tǒng)圖書館的數(shù)字化, 而
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025-2030全球單細胞RNA文庫制備試劑盒行業(yè)調(diào)研及趨勢分析報告
- 2025-2030全球商業(yè)碳捕捉技術(shù)行業(yè)調(diào)研及趨勢分析報告
- 2025年全球及中國LED 燈帶罩行業(yè)頭部企業(yè)市場占有率及排名調(diào)研報告
- 鋼梯欄桿行業(yè)行業(yè)發(fā)展趨勢及投資戰(zhàn)略研究分析報告
- 2025-2030年中國工程帶行業(yè)深度研究分析報告
- 再生資源綠色收儲利用中心項目資金申請報告
- 2025年鋯鋼玉磚項目可行性研究報告
- 預(yù)應(yīng)力混凝土簡支箱梁生產(chǎn)線項目申請備案可行性研究報告
- 2025年度借條轉(zhuǎn)讓與執(zhí)行合同樣本
- 2025年度消費金融公司貸款利息合同(升級版)
- 2025年度院感管理工作計劃(后附表格版)
- 勵志課件-如何做好本職工作
- 化肥銷售工作計劃
- 2024浙江華數(shù)廣電網(wǎng)絡(luò)股份限公司招聘精英18人易考易錯模擬試題(共500題)試卷后附參考答案
- 2024年山東省濟南市中考英語試題卷(含答案解析)
- 2024年社區(qū)警務(wù)規(guī)范考試題庫
- 2025中考英語作文預(yù)測:19個熱點話題及范文
- 第10講 牛頓運動定律的綜合應(yīng)用(一)(講義)(解析版)-2025年高考物理一輪復(fù)習講練測(新教材新高考)
- 靜脈治療護理技術(shù)操作標準(2023版)解讀 2
- 2024年全國各地中考試題分類匯編(一):現(xiàn)代文閱讀含答案
- GB/T 30306-2024家用和類似用途飲用水處理濾芯
評論
0/150
提交評論