企業(yè)內(nèi)容管理軟件的核心技術(shù)及應(yīng)用方向_第1頁
企業(yè)內(nèi)容管理軟件的核心技術(shù)及應(yīng)用方向_第2頁
免費預(yù)覽已結(jié)束,剩余5頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、企業(yè)容管理軟件的核心技術(shù)及應(yīng)用方向容管理已經(jīng)從當(dāng)年的“特殊應(yīng)用管理容”到“特定領(lǐng)域的容管理系統(tǒng)”發(fā)展成今天的通用企業(yè)容管理平臺”To平臺是主流明確了企業(yè)容管理,認識到平臺的重要性,那么到底何處入手了解、掌握并開發(fā)出適合 您的企業(yè)容管理應(yīng)用呢?最好的方式是從成熟商業(yè)軟件入手。一個統(tǒng)一、完整、集成、開放、可擴展的容管理架構(gòu)應(yīng)該包含以下容:ns我們就其中的一些重點技術(shù)做詳細的探討。1、系統(tǒng)架構(gòu)對于任何平臺來說,良好的架構(gòu)對于系統(tǒng)的重要性是不言而喻的,尤其是企業(yè)容管理系 統(tǒng)。容管理平臺軟件需要考慮如何實現(xiàn)靈活髙效的數(shù)據(jù)模型,如何設(shè)計各種語言的API接口, 如何實現(xiàn)完善的訪問控制管理,以及如何架構(gòu)系統(tǒng)的

2、拓撲以完成數(shù)據(jù)遷移、緩存,如何支持PB級的存儲和上千的并發(fā)用戶。企業(yè)容管理尤其需要考慮到未來的擴展能力,如何在最大化保護 用戶現(xiàn)有投資的情況下,提供無限的可擴展空間。由于企業(yè)容管理牽涉的圍太廣,使得平臺在 選擇技術(shù)時,必須使用大量的成熟穩(wěn)定的技術(shù),而且必須符合業(yè)界標準。此外,當(dāng)這些技術(shù)發(fā) 展時,企業(yè)容管理平臺必須能夠支持這些新的技術(shù)以及新的標準。同時還要在技術(shù)、軟件、平 臺本身升級時保護用戶先有的數(shù)據(jù)。作為企業(yè)容管理的匚亶通常需要掌握數(shù)據(jù)庫、應(yīng)用服務(wù)器、存儲等必需的核心技術(shù)。然 后將這些技術(shù)整合在一起,以滿足用戶的需求。比如,下圖中的三角形架構(gòu)是一種代表性架構(gòu), 充分利用了各種軟件技術(shù)的優(yōu)勢,

3、設(shè)計出了髙效、靈活、髙擴展的企業(yè)容管理平臺。該體系結(jié) 構(gòu)是由一個索引服務(wù)器、一個或多個資源管理器和一個或多個客戶程序構(gòu)成的三角形客戶/服務(wù) 器模型。索引服務(wù)器(又稱圖書館服務(wù)器)負責(zé)存儲管理用戶安全控制信息和關(guān)于數(shù)字對象的元 數(shù)據(jù)信息等。底層基于關(guān)系數(shù)據(jù)庫管理存儲所有的元數(shù)據(jù)信息、安全權(quán)限控制信息、用戶信息, 并支持參量檢索、文本檢索、參量/文本混合檢索等多jg道檢索方式。資源管理器負責(zé)存儲管理數(shù)字對象,支持從硬盤到磁帶庫、光盤庫的多層級存儲管理,wor s充整性.一致性Windows, Linux. AIX,Solaris. AS/400. z/OSMTTPFTP血鬥孚g g舲ifa?na曲

4、M松耀元恿as信g致M他加舲支持從一個資源管理器到多個資源管理器的擴展。通過基于流媒體的媒體資源管理器支持對音 頻、視頻信息的流媒體服務(wù)。當(dāng)用戶想獲取某容對象時,客戶程序發(fā)送查詢請求至索引服務(wù)器,然后索引服務(wù)器返回 搜索結(jié)果并將容對象存儲的具體存儲位置加密形成安全對象令牌??蛻舳烁鶕?jù)索引服務(wù)器發(fā)來 的安全令牌發(fā)出獲取容對象的請求至資源管理器,最后資源管理器響應(yīng)并解析請求,并將容對 象直接返回至客戶端。這種方式可以保證“安全盡在控制,信息一站必達”。在這個三角形架構(gòu)下,可以支持多個分布式資源管理器,具有很好的擴展性。而客戶對 系統(tǒng)的所有操作,包括增加、更新、刪除、提取等等,都通過統(tǒng)一的庫訪問協(xié)議

5、完成,從而保 證信息的一致性、完整性和安全性。2、數(shù)據(jù)模型數(shù)據(jù)模型的設(shè)計應(yīng)該是企業(yè)容管理中最有挑戰(zhàn)性的技術(shù)實現(xiàn)之一。 數(shù)據(jù)模型的能力直接 表現(xiàn)出一個企業(yè)容管理平臺適應(yīng)用戶需求的能力。在實施企業(yè)容管理的初始階段,我們只能了 解很少的一部分需求,如果我們設(shè)計數(shù)據(jù)模型時僅基于這些特定的需求,那么這個應(yīng)用可能只 能適應(yīng)客戶當(dāng)時的需求,而無法適應(yīng)客戶的需求變化。在容管理中,通常元數(shù)據(jù)越復(fù)雜,容提 升價值的潛力就越大。而豐富元數(shù)據(jù)的模型不是一蹴而就的,這就要求一個面向客戶容管理的 通用數(shù)據(jù)模型,以適應(yīng)客戶不斷變化的需求,提升信息的價值。如下圖這個抽象的容管理數(shù)據(jù) 模型非常值得借鑒。在這個模型中,在對一個容

6、進行描述時,支持多層級的元數(shù)據(jù)模型,支持對各種復(fù)合文 檔的精確描述,可以對同一文檔中不同的資源對象實施不同的處理和控制;該模型也可以靈活 地描述容和容之間的關(guān)系以及容在使用中的工作狀態(tài)。而圖形化的建模工具以及支持建模的API可以幫助方便客戶和應(yīng)用開發(fā)商通過不同方式快速建模并進行調(diào)整。現(xiàn)在,某些行業(yè)已經(jīng)開始 定制行業(yè)元數(shù)據(jù)標準來描述復(fù)雜的需求,例如數(shù)字圖書館行業(yè)和廣電行業(yè)開始基于都柏林元數(shù) 據(jù)定制自己行業(yè)的多層級元數(shù)據(jù)標準,并以XML描述。XML與通常的關(guān)系型數(shù)據(jù)庫不同之處在于 其數(shù)據(jù)是有結(jié)構(gòu)的,并且可能在同一個Tag下包含多值。 如上圖所示的元數(shù)據(jù)模型可以方便地 支持從XHL文件向容管理數(shù)據(jù)模

7、型的轉(zhuǎn)換。 在描述不同容之間的關(guān)系時, 準許用戶在初始模型 建立時或者在使用過程中隨時建立(Link)、數(shù)據(jù)庫外鍵和引用屬性(引用屬性是一種可以將 一個字段變成指向另一條記錄的指針)。這是一種可以將系統(tǒng)中任意兩個記錄關(guān)聯(lián)在一起的方 法,不管這兩條記錄在數(shù)據(jù)模型上是否相似,也無論他們是否已經(jīng)和其他記錄建立了關(guān)系,從 而為客戶建立描述容的甦方式提供了便利的條件。出于性能和穩(wěn)定考慮,目前基于關(guān)系型數(shù) 據(jù)庫還是保存元數(shù)據(jù)最好的手段。未來的趨勢是越來越加強對XML的支持,包括對XML數(shù)據(jù)庫 的支持。3、檢索查詢對于企業(yè)容管理的最終用戶來說,如何高效準確地找到自己所需要的資源是首要課題。尤其是企業(yè)容管理的

8、數(shù)據(jù)模型逐漸復(fù)雜、來源更加多樣化,使得檢索查詢就變得更加重要,同 時也變得非常困難。因此企業(yè)容管理系統(tǒng)需要支持標準,支持多渠道復(fù)合檢索以及查詢優(yōu)化。用戶可以實現(xiàn)在對單一系統(tǒng)的查詢,也可以使用信息集成技術(shù),完成一次檢索對多個數(shù) 據(jù)源的查詢。從數(shù)據(jù)模型的分析上得出,企業(yè)容管理系統(tǒng)的元數(shù)據(jù)可以非常復(fù)雜。例如各種基于XML的元數(shù)據(jù)標準,其定義都極其詳細。舉例來說,廣電標準數(shù)據(jù)模型規(guī)定了廣播魁音像資料編 目著錄項目和規(guī)則,適用于廣播電視音像資料的編目著錄,將主要用于廣播電視音像資料的收 藏、管理、檢索、資料獲取,具有實用、簡單、靈活、易轉(zhuǎn)換、可擴展等特性。這個數(shù)據(jù)模型, 包括了4級信息,每個級別的信息包

9、括15大屬性,屬性里面又包括多個子屬性,很多屬性則是 用多值的方式實現(xiàn)的。這樣的模型創(chuàng)建后,需要一個簡單、強大且基于標準的檢索方式,而查 詢中可能會涉及到元數(shù)據(jù)參量查詢、元數(shù)據(jù)的全文檢索、文本對象的全文檢索等復(fù)合檢索等等, 單純使用關(guān)系型數(shù)據(jù)庫的SQL語言很難滿足這種多渠道檢索的需求。對XHL查詢的支持是業(yè)界 普遍采用技術(shù)基礎(chǔ)。例如有的產(chǎn)品從XQuery和XPath上設(shè)計出了非常好的查詢方法。IBMContentManager通過查詢解析器,將用戶的查詢重新處理,并進行優(yōu)化,然后向底層的數(shù)據(jù) 庫發(fā)出查詢語句。這種被稱為XQPE (XQueryPathExpressions)的查詢語言可以完全闡

10、釋所有可 能用到的數(shù)據(jù)模型,并且使用簡單,髙效。在容管理平臺中,除了對關(guān)系型數(shù)據(jù)庫的元數(shù)據(jù)進行參量檢索外,對元數(shù)據(jù)以及文本對 象的全文檢索也是非常重要的。所謂全文檢索(FullTextSearch),通常是指對文字型的處理 對象,根據(jù)數(shù)據(jù)資料的容,而不是根據(jù)外在特征來實現(xiàn)的信息檢索手段。例如,IBMContentManager可以在文本正文及文本字段屬性上建立全文搜索。全文索引是對字的檢索。 另外還有一個概念是智能檢索,或者稱為TokenSearch,這是基于詞的檢索,涉及到分詞、對詞 的概念和意圖分析等等。需要注意的是,全文檢索查詢,尤其是中文智能檢索只是容管理系統(tǒng)中的一種檢索方式?,F(xiàn)在有很

11、多誤導(dǎo)的信息, 試圖將“全文檢索”、 中文智能檢索”曲解成容管理。 客戶實施了 這種“容管理”系統(tǒng)后,肯定無法達到預(yù)先的期望。因為單純的全文搜索引擎無法完成客戶對 容的管理需求。而且,單純的全文搜索引擎不能有效地與關(guān)系型數(shù)據(jù)庫的結(jié)構(gòu)化息集成,在整 合檢索時的效率也是必須注意的問題。4、容管理的API為了更好支持在企業(yè)容管理平臺上快速開發(fā)出滿足用戶需求的應(yīng)用,容管理平臺必須提 供出完整的API以滿足各種客戶端的開發(fā)。完整的API支持是區(qū)別企業(yè)容管理平臺和一般的容 管理應(yīng)用重要依據(jù)。通過企業(yè)容管理平臺提供的API,廠商可以開發(fā)出面向各種不同客戶需求的 垂直應(yīng)用,也可以支持應(yīng)用開發(fā)商和客戶開發(fā)自己的

12、容管理應(yīng)用。因此,如何設(shè)計好API就成 為關(guān)鍵的問題。做過軟件的朋友可能都有體會,做一個應(yīng)用不難,但是做一個平臺非常難,其 中的一個原因就是需要為使用者提供出完整的API。這些API既要保證體現(xiàn)平臺所有的功能,又 要盡量遵循標準。只有遵循業(yè)界標準,才可以保證開發(fā)人員容易上手,應(yīng)用容易移植。但是, 與關(guān)系型數(shù)據(jù)庫這種成熟的平臺不同,容管理平臺還處在發(fā)展階段,并沒有像關(guān)系型數(shù)據(jù)庫那 樣有JDBC和ODBC等成熟的標準。JSR170(ContentRepositoryAPIforJava)、XQuery (XMLQueryLanguage)和JSR225 (XQueryAPI for Java)等都

13、是企業(yè)容管理的候選標準。只是 目前這些標準還無法完全滿足客戶需求,所以必須基于這些標準進行擴展。5、工作流在企業(yè)容管理軟件中,工作流是必須考慮的要素。通常實現(xiàn)工作流的方法有兩個不同層 面,一個層面是使用軟件置的工作流,支持在單一系統(tǒng)部的工作流。這種工作流簡單易用,使 用成本低,而且效率很高。另一層面則是基于第三方的工作流引擎,為企業(yè)搭建企業(yè)工作流程管理的總線,實現(xiàn)跨 不同系統(tǒng)的企業(yè)工作流程管理。在企業(yè)容管理軟件中,還有很多因素都是需要考慮并值得關(guān)注的。例如對于容的保護、 數(shù)字水??;安全認證和權(quán)限管理;捕獲和創(chuàng)建的方式;以及計算機輸出管理、電子記錄的管理(RecordManager)、流媒體服務(wù)等等。因

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論