勞動與社會保障數(shù)據(jù)交換平臺建議方案

上傳人：伐*** IP屬地：寧夏上傳時間：2021-04-08 格式：DOC 頁數(shù)：31 大?。?.15MB 積分：15 舉報 版權(quán)申訴

已閱讀5頁，還剩26頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、利用信息集成技術(shù)構(gòu)建勞動與社會保障數(shù)據(jù)交換平臺ibm技術(shù)建議方案一、概述以現(xiàn)有信息網(wǎng)絡(luò)為依托，以現(xiàn)有業(yè)務(wù)信息為樞紐，為勞動與社?？蛻艚⒔y(tǒng)一的數(shù)據(jù)交換平臺。在建立集中統(tǒng)一的數(shù)據(jù)交換平臺，實現(xiàn)提取生產(chǎn)區(qū)的實際業(yè)務(wù)數(shù)據(jù)，并進行數(shù)據(jù)的過濾、檢測。統(tǒng)一數(shù)據(jù)標(biāo)準(zhǔn)。形成統(tǒng)一的交換資源數(shù)據(jù)庫，為統(tǒng)計分析提供基礎(chǔ)數(shù)據(jù)。完成全國聯(lián)網(wǎng)數(shù)據(jù)上報工作。同時實現(xiàn)業(yè)務(wù)資源數(shù)據(jù)庫的遠程備份。1. 現(xiàn)狀現(xiàn)在的勞動與社保數(shù)據(jù)庫有近十個，其中數(shù)據(jù)庫容量平均是50g，而且數(shù)據(jù)源為異構(gòu)數(shù)據(jù)源，包括oracle、db2、sqlserver等數(shù)據(jù)庫；2. 系統(tǒng)主要建設(shè)目標(biāo)：l 建立數(shù)據(jù)中心業(yè)務(wù)資源庫的數(shù)據(jù)采集平臺，用以實現(xiàn)對垂直的下

2、級業(yè)務(wù)系統(tǒng)數(shù)據(jù)向上級中心業(yè)務(wù)資源庫的及時更新以及數(shù)據(jù)轉(zhuǎn)換。數(shù)據(jù)中心資源庫數(shù)據(jù)采集平臺包括數(shù)據(jù)采集和數(shù)據(jù)轉(zhuǎn)換兩個主要部分。數(shù)據(jù)采集平臺起到隔離基層業(yè)務(wù)系統(tǒng)和相關(guān)資源庫應(yīng)用的作用，使得未來任何的業(yè)務(wù)系統(tǒng)的變化（系統(tǒng)更新、升級、數(shù)據(jù)格式改變甚至數(shù)據(jù)庫系統(tǒng)變更等）都不會影響整個資源庫系統(tǒng)的運行。數(shù)據(jù)轉(zhuǎn)換平臺起到數(shù)據(jù)質(zhì)量管理的作用，對數(shù)據(jù)的屬性、邏輯正確性、完整性、一致性等進行驗證查核工作。保障信息資源庫取得的數(shù)據(jù)是真實、一致和完整的。數(shù)據(jù)采集和數(shù)據(jù)轉(zhuǎn)換相結(jié)合，將形成一個長期穩(wěn)定的數(shù)據(jù)采集平臺。l 支持?jǐn)?shù)據(jù)分析和綜合決策。在資源庫基礎(chǔ)上，進行數(shù)據(jù)信息的綜合利用，實現(xiàn)信息分析、數(shù)據(jù)挖掘和決策支持。同時資源

3、庫的建設(shè)將為數(shù)據(jù)倉庫及應(yīng)用的建設(shè)打下基礎(chǔ)。l 建立對外的統(tǒng)一數(shù)據(jù)交換區(qū)，實現(xiàn)業(yè)務(wù)資源數(shù)據(jù)與交換資源數(shù)據(jù)的數(shù)據(jù)交換、上報的功能，將數(shù)據(jù)及時地通過統(tǒng)一的數(shù)據(jù)交換平臺，實現(xiàn)向部里及橫向與其它平級單位間的數(shù)據(jù)交換。實現(xiàn)業(yè)務(wù)資源數(shù)據(jù)庫到交換資源庫的數(shù)據(jù)交換，實現(xiàn)向部上報數(shù)據(jù)的功能。建立統(tǒng)一的交換數(shù)據(jù)區(qū)。l 基于交換平臺，實現(xiàn)對業(yè)務(wù)數(shù)據(jù)的檢測、過濾、篩選、抽取等功能。實現(xiàn)業(yè)務(wù)資源數(shù)據(jù)的數(shù)據(jù)檢測、過濾、篩選、抽取。數(shù)據(jù)交換平臺是建設(shè)勞動與社保數(shù)據(jù)分析區(qū)及數(shù)據(jù)交換區(qū)的核心系統(tǒng)，其主要的作用為：為地市級社保信息向上級提供安全、高效的信息傳遞、采集通道；保證社保分析數(shù)據(jù)信息交互的數(shù)據(jù)實時性和數(shù)據(jù)一致性；在

4、社保內(nèi)部形成統(tǒng)一的數(shù)據(jù)視圖，方便管理；提供向部里進行數(shù)據(jù)交換的統(tǒng)一平臺；屏蔽當(dāng)前勞動與社保內(nèi)的i t環(huán)境的復(fù)雜性，方便應(yīng)用開發(fā)和管理；屏蔽當(dāng)前勞動與社保管理機構(gòu)內(nèi)的i t環(huán)境的分布式特性（省級、地市級管理），方便應(yīng)用開發(fā)和管理；在此，我們建議利用ibm最新的信息整合的技術(shù)和解決方案構(gòu)建一個統(tǒng)一的公共數(shù)據(jù)交換平臺方案。下面我們對這樣的一個解決方案進行詳細(xì)說明。二、勞動與社會保障行業(yè)數(shù)據(jù)交換平臺方案1. 本解決方案的設(shè)計出發(fā)點：快速實現(xiàn)對多種異構(gòu)數(shù)據(jù)源的集成保證勞動與社保分析區(qū)數(shù)據(jù)采集、交換區(qū)數(shù)據(jù)的實時性、一致性；建立一套安全可靠的信息交換通道，實現(xiàn)數(shù)據(jù)在上、下級管理系統(tǒng)之間的數(shù)據(jù)交

5、換、數(shù)據(jù)同步；建立統(tǒng)一數(shù)據(jù)視圖，支持真正意義上的勞動與社保信息分析區(qū)及交換區(qū)的建立，提供復(fù)雜、分布式環(huán)境下的可讀寫操作環(huán)境，并支持今后建立跨業(yè)務(wù)系統(tǒng)條塊的新的業(yè)務(wù)流程；簡化應(yīng)用編程的難度，縮短開發(fā)和實施的周期，降低日常維護難度；能夠很好地將當(dāng)前業(yè)務(wù)系統(tǒng)與新的綜合業(yè)務(wù)系統(tǒng)的用戶管理、認(rèn)證及授權(quán)機制結(jié)合，建立方便、清晰、易管理的用戶安全認(rèn)證管理機制；在分布式的環(huán)境下實現(xiàn)全局優(yōu)化，保證分析應(yīng)用及數(shù)據(jù)交換的整體性能表現(xiàn)；適應(yīng)未來擴展性要求，方便應(yīng)用范疇的擴展；2. 建議通過ibm信息集成（ii）技術(shù)方式實現(xiàn)公共數(shù)據(jù)交換平臺信息整合方式也稱為數(shù)據(jù)整合方式。信息整合就是將業(yè)務(wù)系統(tǒng)的數(shù)據(jù)進行有機的

6、整合集成，從而實現(xiàn)對信息數(shù)據(jù)共享、交換的過程。ibm信息集成ii的核心在于業(yè)務(wù)數(shù)據(jù)的采集，并不關(guān)心原有業(yè)務(wù)數(shù)據(jù)的流程。因此，ii的核心是數(shù)據(jù)的集成。它采用數(shù)據(jù)包裝器作為連接件，將現(xiàn)有客戶的異種數(shù)據(jù)庫（oracle、db2、sqlserver）等連接在一起。ii可以采用xml格式或者關(guān)系型格式對數(shù)據(jù)進行標(biāo)準(zhǔn)定義，平臺工具內(nèi)嵌數(shù)據(jù)采集監(jiān)測功能。應(yīng)用的開發(fā)支持sql99、xml和web service標(biāo)準(zhǔn)，保障了數(shù)據(jù)使用的通用性。并且可以保證系統(tǒng)的有效性、性能和易開發(fā)性。在有效性方面，ii的數(shù)據(jù)采集機制，對源數(shù)據(jù)增量識別的問題采用了偵聽同步或者數(shù)據(jù)復(fù)制的方式，可以有效地解決數(shù)據(jù)采集同步的問題。而ii

7、的數(shù)據(jù)包裝器運行在資源庫系統(tǒng)中心，無需異地開發(fā)。ii能跨本地和異地網(wǎng)提取數(shù)據(jù)，也能在源業(yè)務(wù)系統(tǒng)屏蔽訪問時，由源業(yè)務(wù)系統(tǒng)傳遞xml數(shù)據(jù)包，對xml數(shù)據(jù)文件進行信息分解和提取，能夠滿足不同的源業(yè)務(wù)系統(tǒng)的特點。在性能方面，實際的測試表明，ii的數(shù)據(jù)復(fù)制能夠達到1.26gb/小時的數(shù)據(jù)提取量，而ii的快速數(shù)據(jù)導(dǎo)入功能更能達到30gb/小時，而該測試結(jié)果還是在一臺資源緊張的服務(wù)器運行出來的。由于ii的平臺設(shè)計的目的就是為了解決數(shù)據(jù)整合的問題，因此能夠得到這樣比較理想的測試結(jié)果，而無需依賴于特殊的開發(fā)和編程手段?；谏鲜隼碛?，我們推薦使用信息集成平臺來完成資源庫的數(shù)據(jù)采集功能，以建立長期穩(wěn)定的綜合資源數(shù)據(jù)

8、庫平臺，滿足中心業(yè)務(wù)數(shù)據(jù)庫交換和數(shù)據(jù)復(fù)用的需求。通過ibm數(shù)據(jù)整合平臺，建立勞動與社會保障業(yè)務(wù)數(shù)據(jù)中心及數(shù)據(jù)分析區(qū)和交換區(qū)我們利用ibm數(shù)據(jù)整合平臺建立一個信息集成訪問接口，建立起社保信息數(shù)據(jù)交換平臺，同時在分級上下系統(tǒng)間業(yè)務(wù)數(shù)據(jù)的數(shù)據(jù)采集平臺，并在分析數(shù)據(jù)區(qū)、交換數(shù)據(jù)區(qū)間建立一個可讀寫的雙向訪問接口，實現(xiàn)不同數(shù)據(jù)分區(qū)間的數(shù)據(jù)交換。在所提供的統(tǒng)一訪問接口的支持下，就可以在一個整體數(shù)據(jù)庫的邏輯視圖下（這一視圖跨越地市級勞動與社保信息管理系統(tǒng)），經(jīng)過相應(yīng)的數(shù)據(jù)轉(zhuǎn)換，來實現(xiàn)中心業(yè)務(wù)數(shù)據(jù)，和面向勞動與社保信息分析及交換的數(shù)據(jù)流程和業(yè)務(wù)流程，實現(xiàn)整個勞動與社保分析系統(tǒng)和數(shù)據(jù)交換系統(tǒng)快速開發(fā)和部署。在分級

9、縱向信息整合建立起數(shù)據(jù)中心的過程中，建議分階段實現(xiàn)，第一階段旨在利用數(shù)據(jù)映射層，實現(xiàn)統(tǒng)一查詢訪問，使全省數(shù)據(jù)可共享。第二階段，結(jié)合數(shù)據(jù)整合層的各項功能，進行分極系統(tǒng)的數(shù)據(jù)標(biāo)準(zhǔn)的規(guī)范化，提高共享的質(zhì)量和數(shù)據(jù)復(fù)用，并為數(shù)據(jù)交換做準(zhǔn)備。這兩個階段是信息整合所不可或缺的必要環(huán)節(jié)。第三階段，將部分被頻繁訪問、且實時性要求有限的數(shù)據(jù)物理集中，提高數(shù)據(jù)查詢的質(zhì)量，便于決策分析等業(yè)務(wù)應(yīng)用。第四階段，在第二階段數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范化的基礎(chǔ)上，實現(xiàn)統(tǒng)一的數(shù)據(jù)交換。這兩個階段可根據(jù)實際業(yè)務(wù)需求取舍，也可更換先后次序。數(shù)據(jù)交換平臺的架構(gòu)圖如下：數(shù)據(jù)整合平臺負(fù)責(zé)從市級業(yè)務(wù)數(shù)據(jù)庫及外部數(shù)據(jù)源中獲取資源庫所需的數(shù)據(jù)，實現(xiàn)中心不同數(shù)

10、據(jù)分區(qū)間的交換。數(shù)據(jù)整合平臺位于業(yè)務(wù)數(shù)據(jù)庫和數(shù)據(jù)轉(zhuǎn)換平臺之間，屏蔽了后續(xù)數(shù)據(jù)處理與數(shù)據(jù)來源間的直接關(guān)系。整合平臺主要實現(xiàn)兩個方面的功能：業(yè)務(wù)數(shù)據(jù)中心的數(shù)據(jù)采集和轉(zhuǎn)換不同數(shù)據(jù)分區(qū)（業(yè)務(wù)數(shù)據(jù)區(qū)、分析區(qū)、交換區(qū)）間的數(shù)據(jù)交換為保證對數(shù)據(jù)整合平臺的統(tǒng)一控制和管理，我們采用集中式的數(shù)據(jù)整合平臺設(shè)計思路，即在中心部署一個大的平臺上完成對主要業(yè)務(wù)數(shù)據(jù)的采集，及不同數(shù)據(jù)分區(qū)間的數(shù)據(jù)交換。數(shù)據(jù)整合平臺設(shè)計的基本原則是在業(yè)務(wù)系統(tǒng)部署軟件，和編寫專用接口，所有的軟件部署也都在此平臺上實施。2.1實現(xiàn)數(shù)據(jù)交換在本方案中，根據(jù)與已有系統(tǒng)連接的要求，需要支持實現(xiàn)與oracle，sql server，db2等異構(gòu)、多個

11、數(shù)據(jù)庫系統(tǒng)之間的數(shù)據(jù)復(fù)制，這就面臨著一個異構(gòu)數(shù)據(jù)庫之間雙向復(fù)制的技術(shù)要求，這在數(shù)據(jù)庫領(lǐng)域一直是一個很難解決的問題。而ibm websphere information integrator 恰恰在解決一個企業(yè)級異構(gòu)數(shù)據(jù)集成同時，很好地解決了這一棘手的問題。ibm websphere information integrator 能夠支持用戶在一個廣泛的異構(gòu)數(shù)據(jù)環(huán)境內(nèi)，定義各個異構(gòu)數(shù)據(jù)源之間的復(fù)制關(guān)系和復(fù)制機制，ibm websphere information integrator可以支持表級的、雙向的、指定時間點的復(fù)制，能夠提供接近實時的，事務(wù)一致的數(shù)據(jù)復(fù)制機制的定義和實現(xiàn)。使用ibm we

12、bsphere information inetgrator 后，ibm db2，ibm informix，microsoft，oracle，和sybase都可以作為復(fù)制源或復(fù)制目標(biāo)；用戶可以配置一個多樣性的拓?fù)洵h(huán)境l 復(fù)制服務(wù)器支持分布式（從一個數(shù)據(jù)庫到多個數(shù)據(jù)庫的數(shù)據(jù)遷移）和集中式（從多個數(shù)據(jù)庫到一個數(shù)據(jù)庫的數(shù)據(jù)遷移）l 數(shù)據(jù)遷移可以同時使用標(biāo)準(zhǔn)的sql表達式或存儲過程l 數(shù)據(jù)遷移可以定時的自動執(zhí)行，或在一定的時間間隔執(zhí)行，或連續(xù)執(zhí)行，或者由事件觸發(fā)執(zhí)行數(shù)據(jù)復(fù)制定義關(guān)系如下圖所示：數(shù)據(jù)運輸表oraclesql serverany source地市級管理系統(tǒng)統(tǒng)縣級管理系統(tǒng)數(shù)據(jù)復(fù)制引擎外部應(yīng)

13、用管理系統(tǒng)數(shù)據(jù)庫系統(tǒng)oracle從上圖可以看出，使用ibm websphere information integrator后，可以非常方便地實現(xiàn)跨業(yè)務(wù)平臺、跨數(shù)據(jù)平臺、跨地域的業(yè)務(wù)數(shù)據(jù)匯總、統(tǒng)計分析等工作的開展。而從前，我們要實現(xiàn)這樣一個應(yīng)用，就需要花費大量的精力，進行數(shù)據(jù)采集匯總的工作，從各個地域、各個業(yè)務(wù)系統(tǒng)、各個數(shù)據(jù)庫平臺上進行數(shù)據(jù)遷移，工作量大，而且準(zhǔn)確率和實時性都很差。而在本方案中，這一切難題都會迎刃而解。2.2實現(xiàn)數(shù)據(jù)采集通過數(shù)據(jù)整合平臺，實現(xiàn)中心對垂直業(yè)務(wù)數(shù)據(jù)的采集，我們可以提供三種數(shù)據(jù)采集的途徑，分別說明如下：批量數(shù)據(jù)抽取對于比較規(guī)范的業(yè)務(wù)系統(tǒng)，如果通過理解其數(shù)據(jù)庫表結(jié)構(gòu)能

14、夠識別增量數(shù)據(jù)，則建議采用批量數(shù)據(jù)抽取的方式。批量數(shù)據(jù)抽取的方式一般為非實時模式，在業(yè)務(wù)系統(tǒng)空閑時進行運行。對于網(wǎng)絡(luò)條件較好的數(shù)據(jù)源，該方式可直接通過信息采集平臺向業(yè)務(wù)數(shù)據(jù)庫發(fā)送數(shù)據(jù)抽取的sql 語句，增量信息通過where 條件傳入，采集的數(shù)據(jù)直接保存在信息整合平臺。對于網(wǎng)絡(luò)狀況不理想的業(yè)務(wù)系統(tǒng)，該方式可分兩步進行。首先在業(yè)務(wù)系統(tǒng)數(shù)據(jù)源將增量信息卸載為文件，然后再將文件傳送到信息采集平臺。這種模式要求在數(shù)據(jù)源部署卸載及數(shù)據(jù)傳輸程序，管理維護成本較大，建議盡量采用第一種方式。數(shù)據(jù)復(fù)制數(shù)據(jù)采集平臺提供對各類主流數(shù)據(jù)庫的各主要版本數(shù)據(jù)復(fù)制的能力。在復(fù)制的過程中，系統(tǒng)自動抽取數(shù)據(jù)的變化，通過中間的傳

15、輸，最后加載到目的地。在大多數(shù)情況下，復(fù)制應(yīng)該不干預(yù)現(xiàn)有的應(yīng)用，對系統(tǒng)的影響應(yīng)該降到最低，復(fù)制過程有必要進行管理和監(jiān)控。復(fù)制可分為兩個步驟capture用于獲取數(shù)據(jù)源數(shù)據(jù)的增量。對oracle數(shù)據(jù)源，通過trigger機制實現(xiàn)。apply負(fù)責(zé)將變更的數(shù)據(jù)送到數(shù)據(jù)目標(biāo)。wii提供對純增量的復(fù)制能力，在目標(biāo)端自動附加操作類型、時間戳等信息，以用于后續(xù)數(shù)據(jù)轉(zhuǎn)換的處理。wii所提供的數(shù)據(jù)復(fù)制方式提供多種調(diào)度手段，支持分鐘級數(shù)據(jù)的同步。對大多數(shù)據(jù)業(yè)務(wù)系統(tǒng)而言，數(shù)據(jù)復(fù)制對系統(tǒng)有一定影響，但影響有限。建議應(yīng)用在難以提供增量信息，而業(yè)務(wù)負(fù)荷又有一定擴展性的系統(tǒng)。數(shù)據(jù)偵聽同步數(shù)據(jù)偵聽同步的模式與數(shù)據(jù)復(fù)制有一定類

16、似，但可大大降低對業(yè)務(wù)系統(tǒng)正常工作時間的影響。對于部分不能提供增量信息，而當(dāng)前業(yè)務(wù)系統(tǒng)負(fù)荷又較重的系統(tǒng)，可采用數(shù)據(jù)偵聽的模式。數(shù)據(jù)偵聽與數(shù)據(jù)復(fù)制最大的不同是在變更數(shù)據(jù)捕獲方面。數(shù)據(jù)偵聽只捕獲變更數(shù)據(jù)的主鍵信息，占整個記錄的信息量很小。因而對業(yè)務(wù)系統(tǒng)的工作時間的影響很小。數(shù)據(jù)偵聽同步分兩個步驟完成數(shù)據(jù)的采集。首先通過數(shù)據(jù)偵聽獲取變更數(shù)據(jù)的主鍵及操作類型信息，并同步到數(shù)據(jù)采集平臺。然后在業(yè)務(wù)系統(tǒng)的空閑時間，通過偵聽得到的變更信息，重新通過數(shù)據(jù)采集平臺訪問數(shù)據(jù)源，批量將其他數(shù)據(jù)內(nèi)容信息抽取到數(shù)據(jù)采集平臺。數(shù)據(jù)同步中可能的意外情況由系統(tǒng)自動管理。數(shù)據(jù)采集平臺通過提供批量數(shù)據(jù)抽取、數(shù)據(jù)復(fù)制和數(shù)據(jù)偵聽同步

17、的方式，針對省廳的多種不同情況的源業(yè)務(wù)系統(tǒng)，均提出了有效的采集方案，對建立系統(tǒng)打下了堅實的基礎(chǔ)。3. ibm數(shù)據(jù)整合平臺的功能我們建議選用ibm數(shù)據(jù)整合平臺websphere information integrator作為數(shù)據(jù)交換平臺的核心技術(shù)。將市社保的各類數(shù)據(jù)源通過聯(lián)邦的方式映射到一個數(shù)據(jù)采集平臺的邏輯數(shù)據(jù)庫中。對所有業(yè)務(wù)數(shù)據(jù)的訪問都通過websphere ii完成，數(shù)據(jù)存儲的異構(gòu)性和不同數(shù)據(jù)庫操作的異構(gòu)性由websphere ii屏蔽。信息整合平臺基礎(chǔ)架構(gòu)如下所示：基于聯(lián)邦數(shù)據(jù)映射能力，在數(shù)據(jù)整合平臺可直接獲取業(yè)務(wù)數(shù)據(jù)庫的數(shù)據(jù)。在此基礎(chǔ)上，wii還提供異構(gòu)數(shù)據(jù)復(fù)制技術(shù)及數(shù)據(jù)偵聽技術(shù)，實

18、現(xiàn)對增量信息的識別和同步。其實現(xiàn)原理如下圖所示：圖中：聯(lián)邦服務(wù)器（federated database server）通過稱為包裝器（wrapper）的軟件模塊與數(shù)據(jù)源進行通信。對于上述各類數(shù)據(jù)源，websphere ii 提供專用的wrapper，每個wrapper實現(xiàn)異構(gòu)數(shù)據(jù)源的sql處理，支持異構(gòu)數(shù)據(jù)庫間數(shù)據(jù)類型的轉(zhuǎn)換和函數(shù)的轉(zhuǎn)換。對關(guān)系型數(shù)據(jù)庫數(shù)據(jù)源而言，包裝器通過安裝在信息整合平臺的該數(shù)據(jù)庫的客戶端與其進行交互。對非關(guān)系型數(shù)據(jù)源，包裝器直接進行數(shù)據(jù)訪問。包裝器從信息整合服務(wù)器接受數(shù)據(jù)訪問指令，進行轉(zhuǎn)換為數(shù)據(jù)源所支持的sql，通過數(shù)據(jù)源的客戶端提交執(zhí)行。然后將結(jié)果返回給信息整合服務(wù)器處

19、理。除包裝器外，信息整合服務(wù)器還有三個核心的部分。信息整合服務(wù)器維護一個全局的數(shù)據(jù)字典，其中保存需在信息整合平臺被訪問的數(shù)據(jù)的相關(guān)描述，包括數(shù)據(jù)源的配置信息，數(shù)據(jù)源表的結(jié)構(gòu)，字段數(shù)據(jù)類型，相應(yīng)的索引及數(shù)據(jù)量數(shù)據(jù)分布的統(tǒng)計信息。（注：該類信息無需用戶自行輸入，在定義過程中，系統(tǒng)可從源數(shù)據(jù)庫系統(tǒng)的數(shù)據(jù)字典中自動獲?。Ａ硗馊?jǐn)?shù)據(jù)字典還記錄數(shù)據(jù)源的cpu，網(wǎng)絡(luò)，i/o等系統(tǒng)資源情況?，F(xiàn)對ibm信息集成關(guān)鍵技術(shù)進行說明1）聯(lián)邦技術(shù)采用聯(lián)邦技術(shù)，可通過簡單的配置，快速實現(xiàn)數(shù)據(jù)共享。其主要特點為：l 透明性。所有信息源看起來就像是一個信息源。l 異構(gòu)性。從不同數(shù)據(jù)源整合數(shù)據(jù)。l 雙向sql訪問?；跇?biāo)準(zhǔn)

20、的通用訪問方式，且雙向可讀寫。l 可擴展性和工具化?？梢栽L問任何數(shù)據(jù)源，配置方便。l 避免對現(xiàn)有數(shù)據(jù)源和應(yīng)用程序進行更改。l 其性能可以滿足實際應(yīng)用程序和可能應(yīng)用程序的需要，包括高級查詢優(yōu)化技術(shù)、本地數(shù)據(jù)訪問以及透明緩存支持。l 可以充分利用標(biāo)準(zhǔn)的分析、報告和開發(fā)工具等高級功能。websphere ii查詢接口提供了基于標(biāo)準(zhǔn)的完整功能包括對后端數(shù)據(jù)源中缺失能力的補償。 2）sql復(fù)制在多種數(shù)據(jù)源的環(huán)境中，主要采用sql復(fù)制技術(shù)。sql復(fù)制技術(shù)能夠支持網(wǎng)絡(luò)上同構(gòu)或異構(gòu)數(shù)據(jù)庫之間的數(shù)據(jù)的有效傳輸和冗余性復(fù)制，能夠?qū)崿F(xiàn)多種復(fù)制模式（如：準(zhǔn)實時復(fù)制、定時復(fù)制、雙向復(fù)制、復(fù)制轉(zhuǎn)發(fā)等，復(fù)制范圍可整表復(fù)制或

21、表中部分行復(fù)制或修改單元復(fù)制）。復(fù)制運行時包括三個組成部分：capture、monitor和apply。其中capture提取復(fù)制數(shù)據(jù)源的變化增量；apply獲取capture的結(jié)果，并根據(jù)復(fù)制映射關(guān)系進行轉(zhuǎn)換，按照一定的時間規(guī)劃，作用于目標(biāo)數(shù)據(jù)；monitor監(jiān)控復(fù)制過程，并給出監(jiān)控信息。sql復(fù)制實現(xiàn)機制能夠解決以下三個主要問題：增量復(fù)制支持對數(shù)據(jù)的變化增量識別、提取和復(fù)制，與全量數(shù)據(jù)復(fù)制相比，可避免全量數(shù)據(jù)傳輸?shù)木薮筘?fù)載對各個系統(tǒng)的影響。對db2家族的復(fù)制數(shù)據(jù)源而言，通過讀取數(shù)據(jù)庫日志信息獲取數(shù)據(jù)增量，可避免對數(shù)據(jù)庫運行性能的影響。對于復(fù)制數(shù)據(jù)源為非db2的數(shù)據(jù)庫，其獲取數(shù)據(jù)增量的cap

22、ture方式由數(shù)據(jù)源的trigger機制實現(xiàn)(注：這些trigger由db2的復(fù)制機制自動維護)。圖3.1 sql復(fù)制機制源數(shù)據(jù)與目標(biāo)數(shù)據(jù)間的復(fù)制轉(zhuǎn)換源數(shù)據(jù)與目標(biāo)數(shù)據(jù)之間,往往存在著數(shù)據(jù)類型、格式、邏輯等不一致。為了使目標(biāo)數(shù)據(jù)源能夠讀懂、接受復(fù)制數(shù)據(jù)源的數(shù)據(jù)，就必須進行復(fù)制轉(zhuǎn)換。在復(fù)制過程中的常用轉(zhuǎn)換方法有如下兩種：復(fù)制映射和添加計算列：復(fù)制映射主要指復(fù)制源和目標(biāo)之間的列映射，可以用如下圖所示的配置工具實現(xiàn)。鼠標(biāo)拖拽產(chǎn)生的箭頭指示源與目標(biāo)列的對應(yīng)關(guān)系?！疤砑佑嬎懔小笨梢允褂胹ql對復(fù)制源的某列進行運算，產(chǎn)生一個計算列，該列的定義記錄在復(fù)制控制表中，不影響源表。如下圖紫色方框標(biāo)注的兩列：右側(cè)的是

23、目標(biāo)列，其定義長度為30個字符；左側(cè)的是對源表某列作substr字符串截取生成的計算列，截取前30個字符。此外常用的sql還有date函數(shù)、case語句等等。圖：復(fù)制映射和添加計算列兩階段復(fù)制：一致更改數(shù)據(jù)ccd表作中間表兩階段復(fù)制的優(yōu)勢在于能夠獲取數(shù)據(jù)增量及其類別，并結(jié)合多種數(shù)據(jù)轉(zhuǎn)換方法。兩階段復(fù)制中，首先由源表復(fù)制到一致更改數(shù)據(jù)ccd表，后者能夠記錄在源表上所有的更改操作的類型（插入、更新及刪除）和結(jié)果，從而捕獲源表中所有的增量信息。第二階段，開發(fā)者可以編寫存儲過程、或應(yīng)用程序處理ccd表中的數(shù)據(jù)，再采用復(fù)制方法使數(shù)據(jù)作用到最終目標(biāo)表?？膳渲?、可管理的數(shù)據(jù)分發(fā)數(shù)據(jù)分發(fā)主要指apply的過程

24、，即將復(fù)制數(shù)據(jù)源的增量應(yīng)用到復(fù)制目標(biāo)。數(shù)據(jù)分發(fā)過程中的配置和管理，對復(fù)制的可靠性和可管理十分重要。數(shù)據(jù)分發(fā)提供的配置選擇包括：啟動/停止數(shù)據(jù)應(yīng)用到目標(biāo)表；選擇連續(xù)復(fù)制方式或設(shè)置復(fù)制時間間隔等；提供自動數(shù)據(jù)分組、出錯自動回滾等功能，處理傳輸過程中的異常處理，用戶可配置發(fā)生網(wǎng)絡(luò)或系統(tǒng)故障時的傳輸重試間隔。3）雙層認(rèn)證授權(quán)機制websphere ii的雙層認(rèn)證授權(quán)機制，充分保證異地數(shù)據(jù)訪問下的數(shù)據(jù)安全。information integrator用戶對數(shù)據(jù)的操作權(quán)限，取決于各個應(yīng)用系統(tǒng)數(shù)據(jù)庫向它開放的用戶的授權(quán)，是且僅可能是后者的子集。通過開放不同權(quán)限的用戶給information integrat

25、or，可限制通過ii的用戶訪問的數(shù)據(jù)內(nèi)容和數(shù)據(jù)庫操作（如插入、修改和刪除），這樣就保證了業(yè)務(wù)數(shù)據(jù)的安全性，不會出現(xiàn)超越業(yè)務(wù)授權(quán)的所謂超級用戶，消除數(shù)據(jù)安全隱患。三、 ibm 信息集成技術(shù)的特點3.1 全局統(tǒng)一的數(shù)據(jù)視圖按照 ibm 的預(yù)想，信息集成基礎(chǔ)構(gòu)架必須為應(yīng)用層提供對其所需訪問數(shù)據(jù)的全局統(tǒng)一的數(shù)據(jù)視圖，使應(yīng)用對數(shù)據(jù)的訪問不受數(shù)據(jù)格式、數(shù)據(jù)位置和訪問接口差異的限制。對數(shù)據(jù)管理系統(tǒng)的發(fā)展不僅是要實現(xiàn)對單一數(shù)據(jù)庫中存儲的信息進行管理，而且還要能夠提供對所有形式數(shù)據(jù)的增值性集成、對數(shù)據(jù)安排實施動態(tài)管理以滿足可用性、實時性同時滿足性能要求以及提供可繼續(xù)減輕 it 人員管理復(fù)雜數(shù)據(jù)體系結(jié)構(gòu)負(fù)擔(dān)的自主

26、特色功能。為此，ibm 制訂了一項代號為 xperanto 的計劃，旨在應(yīng)對客戶對集成結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)的需求。依靠在研究上的不斷投資及在關(guān)系數(shù)據(jù)、xml、內(nèi)容管理、聯(lián)邦、搜索和復(fù)制等領(lǐng)域所擁有的可靠的數(shù)據(jù)管理技術(shù)，ibm 正著手開發(fā)集成式基礎(chǔ)構(gòu)架（如下圖所示）。ibm 基礎(chǔ)構(gòu)架憑借一系列程序設(shè)計模型、一套豐富的集成特色功能及與 ibm 的整個業(yè)務(wù)集成框架的互操作性提供了靈活的訪問方式。3.2 靈活的訪問方式ibm 的設(shè)想是通過行業(yè)標(biāo)準(zhǔn)接口提供對信息集成基礎(chǔ)構(gòu)架的靈活訪問?？蛻魬?yīng)用訪問信息可通過 odbc、jbdc、網(wǎng)絡(luò)服務(wù)、本地客戶機或異步客戶機接口來實現(xiàn)。無論數(shù)據(jù)是分布在何種數(shù)

27、據(jù)庫,文件或消息隊列中,應(yīng)用對數(shù)據(jù)的訪問都如同是在對一個邏輯的數(shù)據(jù)庫進行. 它所支持的查詢語言將包括：l 結(jié)構(gòu)化查詢語言 (sql)：業(yè)界最成熟、功能最強大的查詢語言，市場應(yīng)用廣泛；l xquery：有關(guān) xml 數(shù)據(jù)訪問的新興標(biāo)準(zhǔn)，萬維網(wǎng)協(xié)會 (w3c) 目前正在進行其標(biāo)準(zhǔn)化工作l ibm db2 content manager：是面向?qū)ο蟮膽?yīng)用程序編程接口，它支持內(nèi)容管理生命周期，包括富文本和圖像查詢。無論采用何種客戶訪問方式和查詢語言，應(yīng)用程序都應(yīng)能夠訪問通過集成服務(wù)器連接的所有數(shù)據(jù)。這種客戶訪問和查詢語言靈活性的組合使現(xiàn)有開發(fā)和分析工具能夠通過集成服務(wù)器訪問更廣泛的數(shù)據(jù),并直接利用集

28、成服務(wù)器所提供的信息集成功能。它還使基礎(chǔ)構(gòu)架能夠通過web services適應(yīng)以服務(wù)為導(dǎo)向的體系結(jié)構(gòu)，還可提供與工作流異步集成或輕松調(diào)度長耗時的查詢?nèi)蝿?wù)，并能保護您在現(xiàn)有和新應(yīng)用程序基礎(chǔ)構(gòu)架上的投資。3.3 豐富的特色功能利用 ibm 信息集成基礎(chǔ)構(gòu)架可實現(xiàn)對各種分散于各處的實時數(shù)據(jù)的集成，就好像它們來自同一數(shù)據(jù)源。該基礎(chǔ)構(gòu)架具有聯(lián)邦、搜索、高速緩存、轉(zhuǎn)換和復(fù)制異構(gòu)數(shù)據(jù)等重要的功能：聯(lián)邦: ibm 提供業(yè)界領(lǐng)先的對相異數(shù)據(jù)源的聯(lián)邦功能。聯(lián)邦的概念是：用戶可以像對待一個數(shù)據(jù)源那樣對多個數(shù)據(jù)源實施查詢和處理，同時保持?jǐn)?shù)據(jù)源各自的獨立性和完整性。視實施的具體情況，這些數(shù)據(jù)源可能是同構(gòu)或異構(gòu)數(shù)據(jù)源，

29、也可能是集中或分散的數(shù)據(jù)源。ibm 的聯(lián)邦引擎提供了下述功能：透明度:它具有屏蔽作用，可協(xié)助使用戶在訪問數(shù)據(jù)時,無法察覺底層數(shù)據(jù)源的差異、特質(zhì)和實現(xiàn)方式，并使一組聯(lián)邦數(shù)據(jù)源看上去就像是一個系統(tǒng)。異構(gòu)性: 一如其名它具有聯(lián)邦異構(gòu)類型數(shù)據(jù)的功能，這些數(shù)據(jù)類型包括結(jié)構(gòu)化數(shù)據(jù)（例如，關(guān)系數(shù)據(jù)庫）、半結(jié)構(gòu)化數(shù)據(jù)（例如，xml 文檔）、非結(jié)構(gòu)化數(shù)據(jù)（例如，自由格式文本）。可擴展性: 一種可將聯(lián)邦能力擴展到幾乎任何數(shù)據(jù)源的功能。可擴展性專為這一目的而設(shè)計，即最大程度降低集成新數(shù)據(jù)源的工作量，同時靈活地為優(yōu)化查詢訪問提供必要的信息。豐富的函數(shù)功能: 包括通過支持的查詢語言提供的函數(shù)、對后端數(shù)據(jù)源中所缺函數(shù)的

30、補償以及將數(shù)據(jù)源專用功能無縫嵌入到查詢語言中的功能。數(shù)據(jù)源自主性: 即可將數(shù)據(jù)源聯(lián)邦在一起，而對現(xiàn)有應(yīng)用程序或系統(tǒng)沒有或幾乎沒有影響。性能優(yōu)化: 使聯(lián)邦查詢成為一種現(xiàn)實備選方案的性能特性。憑借超過 25 年的研究和開發(fā)經(jīng)驗及專利的優(yōu)化技術(shù)，ibm 可以事實證明，聯(lián)邦是一個能夠滿足性能要求的可行方案。搜索: ibm 的基礎(chǔ)構(gòu)架將提供高級搜索和查詢功能，包括網(wǎng)絡(luò)爬行、文檔索引建立、多搜索引擎搜索結(jié)果聯(lián)邦、以實現(xiàn)智能訪問為目標(biāo)的文本文檔分類和摘要信息建立以及語義理解。2002 年，ibm 組建了“ibm 搜索和文本分析研究院”，以通過集成式體系結(jié)構(gòu)統(tǒng)一并加速 ibm 在高級搜索和挖掘功能上的研究和部

31、署。研究成果將可為 ibm 信息集成平臺以及其它 ibm 方案提供動力。高速緩沖存儲器: ibm 的信息集成基礎(chǔ)構(gòu)架將支持在數(shù)據(jù)層級中的多個點放置和管理數(shù)據(jù)，以改善性能。這絕非是簡單的高速緩存功能，而是基于策略的數(shù)據(jù)安排和管理。需要由一系列高速緩存策略才能向發(fā)出請求的應(yīng)用程序提供足夠的性能、實時性和可用性特性。轉(zhuǎn)換: 基礎(chǔ)構(gòu)架必須提供豐富的轉(zhuǎn)換特色功能，以便進行分析、交換和呈現(xiàn)。轉(zhuǎn)換功能完成不同類型數(shù)據(jù)庫sql語句的動態(tài)轉(zhuǎn)換(如數(shù)據(jù)類型及函數(shù)的匹配).另外還包括對數(shù)據(jù)源缺失函數(shù)的補償和原有數(shù)據(jù)源專用功能(如存儲過程和用戶自定義函數(shù))的嵌入。復(fù)制: 作為信息集成基礎(chǔ)構(gòu)架的一個基本特征，復(fù)制功能不

32、可或缺。它是分布式訪問特色功能的有益補充，實現(xiàn)了對集中式數(shù)據(jù)存儲器的管理，并為高效管理數(shù)據(jù)高速緩沖存儲器提供了必需的基礎(chǔ)構(gòu)架。信息集成可實現(xiàn)異構(gòu)關(guān)系型數(shù)據(jù)源之間的相互復(fù)制. 支持多點對一點的數(shù)據(jù)集中模式和一點對多點的數(shù)據(jù)分發(fā)模式. 包括初始的數(shù)據(jù)同步和增量的鑒別和同步. 并提供對復(fù)制過程的監(jiān)控.簡化全面業(yè)務(wù)集成: 如前所提及，信息集成只是整個業(yè)務(wù)集成基礎(chǔ)構(gòu)架的一部分。為支持業(yè)務(wù)的改良需求，此基礎(chǔ)構(gòu)架補充了強健的數(shù)據(jù)和內(nèi)容存儲器及附加集成技術(shù)，并采用了行業(yè)標(biāo)準(zhǔn)。數(shù)據(jù)存儲：ibm 現(xiàn)今提供業(yè)內(nèi)領(lǐng)先的關(guān)系數(shù)據(jù)庫管理系統(tǒng)和內(nèi)容管理系統(tǒng)，并在提供集成 xml 支持方面引領(lǐng)著行業(yè)的發(fā)展。除現(xiàn)有功能（基于關(guān)

33、系數(shù)據(jù)庫模型）外，xml 儲存還必須完整地包含和充分利用 xml 數(shù)據(jù)模型。xml 儲存設(shè)計有一個內(nèi)置 xml 注冊表，可以輕松管理大量 xml 工件。這些工件包括隨 xml 數(shù)據(jù)數(shù)量和種類的增加而可能產(chǎn)生的 xml schema 文檔、文檔類型定義 (dtd) 和web services說明文檔等。利用互補的集成技術(shù)：開發(fā)企業(yè)集成基礎(chǔ)構(gòu)架的關(guān)鍵在于能否自如地組合利用或單獨利用適用的集成技術(shù)。ibm 繼續(xù)專注于信息集成對“ibm 軟件集團”全線產(chǎn)品，特別是 websphere 業(yè)務(wù)集成系列產(chǎn)品的集成，以提供一套全面的業(yè)務(wù)集成基礎(chǔ)構(gòu)架。websphere 軟件平臺為數(shù)據(jù)庫及聯(lián)邦數(shù)據(jù)庫應(yīng)用程序提供

34、了一個開放、集成式的 java 技術(shù)開發(fā)環(huán)境。同時，ibm 也在投入力量使其能夠與 microsoft visualstudio 順暢協(xié)作并實現(xiàn)集成。簡言之，ibm 的集成式解決方案是業(yè)內(nèi)覆蓋領(lǐng)域最廣、最完整的集成式解決方案。支持行業(yè)標(biāo)準(zhǔn)：ibm 繼續(xù)處于開發(fā)和采用行業(yè)標(biāo)準(zhǔn)的最前沿，為在不同開發(fā)商工具間實現(xiàn)廣泛的互操作性提供便利。四、 ibm信息整合解決方案的優(yōu)勢我們建議的社保信息數(shù)據(jù)交換平臺解決方案具備以下幾個關(guān)鍵的技術(shù)優(yōu)勢：41建立、地市級管理系統(tǒng)之間的信息交互、地市級管理系統(tǒng)的信息交互，實際包含兩方面的含義：u 數(shù)據(jù)交換：實現(xiàn)、地市級級系統(tǒng)之間的數(shù)據(jù)交換，實現(xiàn)數(shù)據(jù)的物理遷移，數(shù)據(jù)由某個

35、數(shù)據(jù)源傳遞到某個目標(biāo)數(shù)據(jù)庫中；數(shù)據(jù)共享：為跨越社保管理現(xiàn)有的業(yè)務(wù)系統(tǒng)、各個合作機構(gòu)的業(yè)務(wù)系統(tǒng)中所有相關(guān)數(shù)據(jù)，進行綜合查詢和分析提供數(shù)據(jù)集成訪問支持； 42利用異構(gòu)數(shù)據(jù)透明訪問技術(shù)實現(xiàn)數(shù)據(jù)共享ibm解決方案的核心產(chǎn)品是ibm information integrator，其中核心技術(shù)之一為聯(lián)邦數(shù)據(jù)訪問技術(shù)。如下圖所示，通過采用 ibm information integrator，將數(shù)據(jù)交換平臺各級業(yè)務(wù)管理系統(tǒng)中的各類數(shù)據(jù)源，通過聯(lián)邦的方式映射到一個邏輯的數(shù)據(jù)庫中。對所有數(shù)據(jù)的訪問都通過ibm information integrator完成，數(shù)據(jù)存儲的異構(gòu)性和不同數(shù)據(jù)庫操作的異構(gòu)性由ibm

36、information integrator屏蔽?；趇bm information integrator可實現(xiàn)異構(gòu)平臺的表級數(shù)據(jù)庫的通用sql操作。43統(tǒng)一編程接口，簡化應(yīng)用編程由于對所有數(shù)據(jù)的訪問都通過ibm information integrator完成，數(shù)據(jù)存儲的異構(gòu)性和不同數(shù)據(jù)庫操作的異構(gòu)性由ibm information integrator屏蔽。因此對于新的省級社保信息綜合業(yè)務(wù)系統(tǒng)（如數(shù)據(jù)實時交換、綜合查詢、數(shù)據(jù)遷移等）的開發(fā)者來說，不必了解現(xiàn)有各種業(yè)務(wù)系統(tǒng)的數(shù)據(jù)庫訪問接口及編程方法，而只需熟練掌握ibm information integrator所提供的一套編程訪問接口就可

37、以實現(xiàn)所有的應(yīng)用開發(fā)工作。整個編程開發(fā)將非常簡便。44提供全局優(yōu)化技術(shù)，保證系統(tǒng)整體性能領(lǐng)先的基于成本的優(yōu)化器:ibm 在業(yè)界最早實現(xiàn)了基于成本的優(yōu)化技術(shù)，優(yōu)化器能夠模擬采用不同方式從磁盤中查詢數(shù)據(jù)所付出的代價，從而選用最佳查詢方案。它在優(yōu)化時考慮了cpu速度、磁盤i/o率、表格尺寸、有效訪問路徑，并且如果可能的話可以重寫查詢，以得到更高的性能。ibm的優(yōu)化器充分考慮了并行、大量并發(fā)用戶、復(fù)雜查詢等各種可能遇到的情況，使其能夠運行于各種計算環(huán)境。通過調(diào)節(jié)相應(yīng)參數(shù)，數(shù)據(jù)庫管理員還可以根據(jù)數(shù)據(jù)庫應(yīng)用的具體類型方便地選擇是否讓優(yōu)化器為此種應(yīng)用做專門的優(yōu)化。獨特的查詢重寫技術(shù):ibm對用戶的每一個sq

38、l語句的處理過程于其它數(shù)據(jù)庫有所不同：在經(jīng)過語法分析和語義檢查之后，先對用戶的sql語句進行查詢重寫，再將重寫后的查詢sql語句送交優(yōu)化器優(yōu)化。由于經(jīng)過查詢重寫的sql語句可以最有效的被優(yōu)化器優(yōu)化，程序員可以專心于業(yè)務(wù)邏輯的實現(xiàn)，而不必過多地將精力放在了解數(shù)據(jù)庫優(yōu)化器工作原理以及關(guān)注sql語句的寫法上，減少了應(yīng)用程序不能正確實現(xiàn)業(yè)務(wù)邏輯的可能性。另一方面，查詢重寫技術(shù)還有助于消除經(jīng)常見到的由于項目組中不同開發(fā)人員的水平差異導(dǎo)致的程序執(zhí)行效率不同，或圖形界面動態(tài)生成sql語句繁瑣、低效的現(xiàn)象。在異構(gòu)環(huán)境下優(yōu)化技術(shù)同樣適用：使用ibm information integrator構(gòu)建一個異構(gòu)分布式

39、數(shù)據(jù)庫環(huán)境后，ibm先進的基于成本優(yōu)化器仍然可以通過ibm information integrator發(fā)揮作用，也就是說，ibm可以將一個跨越多個業(yè)務(wù)系統(tǒng)的sql語句根據(jù)各個業(yè)務(wù)系統(tǒng)的實際狀況進行成本估算、查詢重寫、最優(yōu)查詢路徑模擬及確定。實現(xiàn)一個跨業(yè)務(wù)系統(tǒng)的全局優(yōu)化。從而保證了整個系統(tǒng)的整體性能。ibm information integrator 提供一個本地的數(shù)據(jù)存儲支持，聯(lián)邦服務(wù)引擎實現(xiàn)sql的分解和訪問路徑的優(yōu)化，其主要原則為將對數(shù)據(jù)的操作盡量分發(fā)到分布式的數(shù)據(jù)源，在ibm information integrator 聯(lián)邦服務(wù)引擎中統(tǒng)一考慮處理的成本，選擇成本最低的路徑。成本優(yōu)化

40、依據(jù)保存在ibm information integrator catalog 中的各類數(shù)據(jù)源的統(tǒng)計信息。45先進的cache技術(shù)，保證系統(tǒng)性能ibm information integrator內(nèi)置了先進的cache技術(shù)，可以支持用戶建立物化查詢表（materialized query table），這個物化查詢表可以跨越各個業(yè)務(wù)系統(tǒng)建立一個針對經(jīng)常查詢內(nèi)容的預(yù)計算、預(yù)處理的結(jié)果集，使用cache技術(shù)存放起來，來提高使用到這些結(jié)果集的運算或查詢操作的速度。46對xml技術(shù)的完美支持我們知道xml作為數(shù)據(jù)交換的一個載體，將在未來的應(yīng)用中占據(jù)越來越重要的位置，因此，在ibm informatio

41、n integrator中對xml有強大的支持，以適應(yīng)當(dāng)前和未來的應(yīng)用需要。ibm information integrator提供了專用的xml wrapper。通過xml wrapper, ibm information integrator支持對xml內(nèi)容基于sql的訪問支持。即用戶可以使用sql直接操作xml文本，將存放在各個業(yè)務(wù)系統(tǒng)中的數(shù)據(jù)組成一個xml文本輸出，或者將一個xml文本依照dtd或schema分解存儲。47簡化web services技術(shù)實現(xiàn)ibm作為web service架構(gòu)的倡導(dǎo)者和領(lǐng)導(dǎo)者，在自身的全部產(chǎn)品線中，都提供了全面的web services支持，ibm

42、information integrator也不例外，如下圖所示，基于統(tǒng)一數(shù)據(jù)服務(wù)平臺，可大大簡化復(fù)雜異構(gòu)環(huán)境的web services的實現(xiàn)。48對mq的直接支持mq是在消息傳輸中間件市場的冠軍產(chǎn)品，在很多涉及數(shù)據(jù)傳輸和數(shù)據(jù)交換平臺建設(shè)中，ibm mq產(chǎn)品系列得到了廣泛的應(yīng)用，因此作為綜合業(yè)務(wù)系統(tǒng)整合的數(shù)據(jù)管理產(chǎn)品，一定要具備與mq的直接訪問和支持的能力。而在本建議方案中，ibm information integrator提供了對mq message的直接訪問能力。可將sql的輸出直接送入mq的隊列，也可用sql直接訪問mq隊列，對應(yīng)用的整合提供了更好的靈活性。49 結(jié)合各業(yè)務(wù)系統(tǒng)用戶管理

43、機制，支持建立跨業(yè)務(wù)應(yīng)用的用戶管理機制使用ibm information integrator可以實現(xiàn)一個原有系統(tǒng)的用戶及其權(quán)限對information integrator用戶權(quán)限的一個映射定義。即information integrator中的一個用戶，也就是省級數(shù)據(jù)交換平臺系統(tǒng)中的一個用戶可以映射到下屬各個業(yè)務(wù)系統(tǒng)中的某個或某幾個用戶上，由各個業(yè)務(wù)系統(tǒng)管理訪問自身業(yè)務(wù)數(shù)據(jù)的所有用戶及其授權(quán)，而省級數(shù)據(jù)交換平臺的用戶僅是這些數(shù)據(jù)的一個使用者，其對數(shù)據(jù)的操作權(quán)限不能超越自身系統(tǒng)的授權(quán)機制，這樣就保證了業(yè)務(wù)數(shù)據(jù)的安全性。不會出現(xiàn)超越業(yè)務(wù)授權(quán)的所謂超級用戶，消除數(shù)據(jù)安全隱患。410 開放性，支持

44、多種主流平臺ibm information integrator是一個開放的系統(tǒng)，能夠支持主流的unix、windows、linux： microsoft windows nt microsoft windows 2000 aix hp-ux sun solaris linux五、 ibm配置方案方案中，我們通過先進的數(shù)據(jù)整合技術(shù)，實現(xiàn)一個邏輯集中、物理分布與物理集中相配合的中心業(yè)務(wù)信息庫，從而構(gòu)建起一個數(shù)據(jù)交換平臺，解決了數(shù)據(jù)的讀寫雙向訪問技術(shù)難點，在此之上可以定義跨越社保管理條塊的業(yè)務(wù)流程和數(shù)據(jù)流程。是一個先進、合理、可實施的方案。在方案中，數(shù)據(jù)中心部署ibm數(shù)據(jù)整合平臺，建立數(shù)據(jù)中心的業(yè)

45、務(wù)數(shù)據(jù)中心，形成一個全局范圍內(nèi)的業(yè)務(wù)數(shù)據(jù)全集，首先可以滿足對勞動與社保業(yè)務(wù)的分析要求，而且，在一定程度上滿足了數(shù)據(jù)層面中心對市級單位數(shù)據(jù)的冗余，備份。系統(tǒng)配置如下圖所示：市級社保業(yè)務(wù)應(yīng)用l ibm db2 information integrator advanced edition connectorl ibm db2 ii connector內(nèi)蒙古勞動廳數(shù)據(jù)中心根據(jù)各地的實際情況，ibm websphere information integrator advanced 可以考慮配置在unix、windows或者linux服務(wù)器上，支撐整個信息集成的應(yīng)用。如果在該級數(shù)據(jù)中心需要建立一個本地

46、數(shù)據(jù)庫系統(tǒng)來支撐類似統(tǒng)一單位庫、統(tǒng)一人員庫等標(biāo)準(zhǔn)化的數(shù)據(jù)存儲，同時還考慮開展決策分析系統(tǒng)，那么可以使用ibm information integrator內(nèi)置的企業(yè)級數(shù)據(jù)庫存儲引擎支持建立一個本地的數(shù)據(jù)庫系統(tǒng)。根據(jù)數(shù)據(jù)量的大小，配置合適的磁盤陣列。同時我們建議購置磁帶庫及相應(yīng)的企業(yè)級備份管理軟件，配合ibm information integrator實現(xiàn)數(shù)據(jù)的備份/恢復(fù)工作。以保證整個系統(tǒng)運行的安全、可靠。建議軟件配置： ibm websphere information integrator advance edition ibm websphere information integra

47、tor connector ibm websphere data stage server edition附件ibm db2 information integrator產(chǎn)品簡介由于當(dāng)前信息技術(shù)的飛速發(fā)展，各企業(yè)的業(yè)務(wù)環(huán)境日益復(fù)雜，各種業(yè)務(wù)數(shù)據(jù)不斷的增加，使得企業(yè)中各種數(shù)據(jù)類型繁多，數(shù)據(jù)源也十分分散。用戶越來越希望能夠?qū)φ麄€企業(yè)不同數(shù)據(jù)源及數(shù)據(jù)類型的數(shù)據(jù)進行統(tǒng)一的相關(guān)聯(lián)的管理。但是目前很多企業(yè)受各方面因素的約束，分散的且不同廠商的數(shù)據(jù)源很難復(fù)制或集中到單一的數(shù)據(jù)庫上。因此，這就使用戶越來越渴望能夠獲得一個可以整合企業(yè)中各個分布式的數(shù)據(jù)源以方便訪問多樣化數(shù)據(jù)的解決方案。在這種需求之下，ibm公司

48、提供了ibm information integrator系列產(chǎn)品，能夠在整個企業(yè)范圍內(nèi)訪問關(guān)系型、結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)。它能提供戰(zhàn)略上的數(shù)據(jù)集成架構(gòu)，以幫助用戶去訪問、處理以及整合異構(gòu)的、分布式的實時數(shù)據(jù)。ibm information integrator包括聯(lián)邦數(shù)據(jù)服務(wù)器（federated data server）和復(fù)制服務(wù)器（replication server），用于整合異構(gòu)的實時數(shù)據(jù)。聯(lián)邦數(shù)據(jù)服務(wù)器（federated data server）利用sql或產(chǎn)生sql的工具（整合的開發(fā)環(huán)境、報表、分析工具）訪問、整合及處理分布式的和異構(gòu)的數(shù)據(jù)。該產(chǎn)品主要適用于數(shù)據(jù)源為各類關(guān)系型數(shù)據(jù)庫及其他如xml、web或內(nèi)容數(shù)據(jù)源。ibm information int

人人文庫> 全部分類> 畢業(yè)設(shè)計 > 任務(wù)書類

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

勞動與社會保障數(shù)據(jù)交換平臺建議方案

文檔簡介

溫馨提示

最新文檔

評論

勞動與社會保障數(shù)據(jù)交換平臺建議方案

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔