



下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、1.1企業(yè)非結(jié)構(gòu)化信息管理現(xiàn)狀數(shù)據(jù)的有效利用是每個企業(yè)高效運作的基礎(chǔ)。提到信息管理,最典型的處理 受到是數(shù)據(jù)庫應(yīng)用,但實際上數(shù)據(jù)庫技術(shù)只擅長管理并操作結(jié)構(gòu)化數(shù)據(jù)。有統(tǒng)計 表明,企業(yè)數(shù)據(jù)每年以200%的速度增長,其中80%的數(shù)據(jù)以文件、郵件、圖片 等非結(jié)構(gòu)化數(shù)據(jù)存放在企業(yè)內(nèi)計算機系統(tǒng)中的各個角落,這些非常寶貴的信息資 源亟待被有效管理并循環(huán)利用。而數(shù)據(jù)庫只解決了 20%的結(jié)構(gòu)化數(shù)據(jù)管理問題, 因此,企業(yè)或機構(gòu)中80%的非結(jié)構(gòu)化信息的管理是企業(yè)信息資源管理的核心。如何方便,快捷,安全地管理企業(yè)內(nèi)部的信息內(nèi)容就將涉及到企業(yè)搜索引擎 領(lǐng)域的應(yīng)用。企業(yè)搜索就是為企業(yè)內(nèi)外部各類非結(jié)構(gòu)化數(shù)據(jù)處理提供的一個綜
2、合 應(yīng)用平臺層,將各類數(shù)據(jù)信息與用戶的需求直接連接,而無須用戶了解其間的任 何過程信息。對于用戶來說,使用企業(yè)搜索就如同看電視一樣簡單,只要告訴它 你想看什么,它即會立即返回你需要的任何內(nèi)容,以你最希望看到的方式展示出 來。企業(yè)搜索引擎除了與互聯(lián)網(wǎng)搜索工具一樣能完成采集、檢索等基本功能外, 企業(yè)搜索對相關(guān)核心技術(shù)的要求更高,如采集的效率更快,全面性更強,深度更 深,而且能夠定向定量采集;檢索則更加注重個性化檢索,以信息內(nèi)容為核心的 相關(guān)度排序方式、個性化推送,甚至還包括自動分類、聚類、語義分析等對信息 的組織和有序化技術(shù)。企業(yè)搜索并不是簡單的將互聯(lián)網(wǎng)搜索技術(shù)拿到企業(yè)內(nèi)部來 用,而是對企業(yè)內(nèi)外部
3、數(shù)據(jù)的高效獲取和有效組織的技術(shù)和過程,它不僅僅包括 互聯(lián)網(wǎng)搜索的相關(guān)技術(shù),還包括一系列對于非結(jié)構(gòu)化數(shù)據(jù)的組織、分析和安全管 理技術(shù)等。業(yè)界提出了不少方法以實現(xiàn)這些功能,例如:關(guān)鍵字搜索、標簽解決方案、 交叉過濾和語言方法等等。通過這些方法可以在一定程度上提高計算機對非結(jié)構(gòu) 化信息的處理能力,但由于這些方法都需要一定程度的人工干預(yù)。事實上,為了 保證各類業(yè)務(wù)的成功運營,真正需要做的是使計算機能夠自動、實時和智能地處 理業(yè)務(wù)運營所必需的各類信息,這就需要計算機系統(tǒng)可以理解當今存儲的非結(jié)構(gòu) 化信息究竟是什么,理解當前進行處理的信息究竟代表什么含義。也就是說采用 內(nèi)容理解、概念匹配技術(shù)實現(xiàn)計算機對文本
4、、網(wǎng)頁、電子郵件、語音、視頻、文檔和個性檔案的自動分析和處理將是企業(yè)搜索技術(shù)中的核心與重點。通過這樣的 技術(shù),企業(yè)能夠整合各種異構(gòu)的內(nèi)部或外部數(shù)據(jù)源,無論是結(jié)構(gòu)化數(shù)據(jù)還是非結(jié) 構(gòu)化數(shù)據(jù),通過對數(shù)據(jù)內(nèi)容的理解,來實現(xiàn)自動化的信息管理、知識發(fā)現(xiàn)和信息 的主動推送。對于企業(yè)搜索引擎而言,通過對結(jié)構(gòu)化信息(如數(shù)據(jù)庫和XML等)和非結(jié)構(gòu) 化信息(如PDF文檔、電子郵件和視頻音頻等)的分析與處理,通常都會完成以下分類功能:企業(yè)搜索引擎主要功能檢索用戶檔案信息推送社區(qū)專家協(xié)作結(jié)構(gòu)化信息與非結(jié)構(gòu)化信息辦公系統(tǒng)電子郵件數(shù)據(jù)庫網(wǎng)頁信息自動摘要圖錯誤!文檔中沒有指定樣式的文字。-1企業(yè)搜索引擎功能其中主要功能含義如
5、下:關(guān)鍵字檢索:用戶在文本框輸入一個或幾個關(guān)鍵詞,搜索引擎隨后返回所有包含搜索詞的 文檔結(jié)果。自然語言檢索:用戶采用自然語言描述查詢條件,可以是語句、段落或是整篇文檔,搜索引 擎查詢并返回與所查概念相關(guān)的結(jié)果。自動摘要搜索引擎根據(jù)文檔內(nèi)容信息返回文檔內(nèi)容中最重要概念的摘要,進一步可以 根據(jù)給定查詢的結(jié)果提供最適當?shù)膭討B(tài)摘要自動超鏈接搜索引擎將文檔內(nèi)容動態(tài)鏈接到與其上下文內(nèi)容相似的信息上。例如,在互 聯(lián)網(wǎng)瀏覽一篇文章時,搜索引擎自動把該文動態(tài)鏈接到與其上下文相似的內(nèi)容或 實時地推薦相關(guān)的資料。自動聚類搜索引擎根據(jù)文檔內(nèi)容直接的相似度,自動將大量相關(guān)內(nèi)容或類似文檔集中 到一起形成統(tǒng)一的聚類。自動分類搜索引擎根據(jù)概念相似性自動對信息進行分類,進一步還可以根據(jù)文檔內(nèi)容 發(fā)現(xiàn)最適合的類別,并自動打上分類標記,以便進行后續(xù)的處理或歸檔。用戶搜索檔案根據(jù)用戶搜索偏好可以生成每個用戶的搜索檔案,可以代表用戶當前的興趣 所在,而且不需要用戶填寫任何形式的表格。社區(qū)與協(xié)作基于用戶搜索檔案理解的用戶信息,并自動將有共同興趣的用戶聚集為用戶 社區(qū)。專家定位根據(jù)用戶檔案自動識別出該社區(qū)內(nèi)的專家信息推送通過多種渠道包括瀏覽器、移動設(shè)備、即時通訊軟件的不過等給用戶發(fā)送個 性化的內(nèi)容。音頻搜索通過對音頻進行語音識別,理解音頻和音頻內(nèi)容信息,將其轉(zhuǎn)化為文本后用 于信息搜索領(lǐng)域。視頻
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 福建護坡加固施工方案
- 房屋買賣合同預(yù)售合同
- 中華傳統(tǒng)美文鑒賞教學方法:古詩解析與創(chuàng)作訓練
- 屋面漏水導流施工方案
- 阜陽別墅木屋施工方案
- 接戶線施工方案
- 塔吊安裝專項施工方案
- 漢口閣樓安裝施工方案
- 鍋爐除渣干式排渣施工方案
- 年產(chǎn)12000噸聚羧酸高性能減水劑復配液及3000噸水泥助磨劑復配液項目環(huán)評報告表
- 高速公路建設(shè)承攬合同
- 20以內(nèi)破十法練習題-A4打印版
- 工程指令單完整版本
- 物業(yè)公司人員培訓及考核方案
- 數(shù)據(jù)中心容災(zāi)備份解決方案
- 七年級下冊第三單元名著導讀《駱駝祥子》公開課一等獎創(chuàng)新教學設(shè)計(公開課公開課一等獎創(chuàng)新教案及作業(yè)設(shè)計)
- 幾何圖形中求線段線段和面積等最值問題 中考數(shù)學
- 呼吸道傳染病的護理要點
- 真太陽時調(diào)整
- 景區(qū)開發(fā)合作協(xié)議書范本
- 我國醫(yī)療保障現(xiàn)狀問題
評論
0/150
提交評論