利用主題圖實(shí)現(xiàn)城市圈電子政務(wù)系統(tǒng)數(shù)據(jù)整合模型的構(gòu)建_第1頁(yè)
利用主題圖實(shí)現(xiàn)城市圈電子政務(wù)系統(tǒng)數(shù)據(jù)整合模型的構(gòu)建_第2頁(yè)
利用主題圖實(shí)現(xiàn)城市圈電子政務(wù)系統(tǒng)數(shù)據(jù)整合模型的構(gòu)建_第3頁(yè)
利用主題圖實(shí)現(xiàn)城市圈電子政務(wù)系統(tǒng)數(shù)據(jù)整合模型的構(gòu)建_第4頁(yè)
利用主題圖實(shí)現(xiàn)城市圈電子政務(wù)系統(tǒng)數(shù)據(jù)整合模型的構(gòu)建_第5頁(yè)
已閱讀5頁(yè),還剩7頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

利用主題圖實(shí)現(xiàn)城市圈電子政務(wù)系統(tǒng)數(shù)據(jù)整合模型的構(gòu)建

[分類(lèi)號(hào)]TP3931引言城市圈(CityCircle)是指在城市群中出現(xiàn)的以一個(gè)大城市為核心,周邊城市共同參與分工、合作,構(gòu)成一個(gè)人口和產(chǎn)業(yè)密集、分工明確、各具特色、優(yōu)勢(shì)互補(bǔ)的圈域經(jīng)濟(jì)一體化的區(qū)域[1-2]。區(qū)域信息一體化建設(shè)是城市圈融合和發(fā)展的重要前提,城市間電子政務(wù)系統(tǒng)數(shù)據(jù)整合是其中的重點(diǎn)、難點(diǎn)。由于城市間的差異、建設(shè)的經(jīng)濟(jì)成本,城市圈很難重新建立統(tǒng)一的電子政務(wù)系統(tǒng)。因此,如何將各城市已有的電子政務(wù)系統(tǒng)數(shù)據(jù)進(jìn)行有效整合,從而使縱向結(jié)構(gòu)的各城市電子政務(wù)系統(tǒng)實(shí)現(xiàn)橫向數(shù)據(jù)共享是一個(gè)亟待解決的課題。目前,絕大多數(shù)電子政務(wù)系統(tǒng)均采用關(guān)系型數(shù)據(jù)庫(kù)系統(tǒng)(RelationalDataBaseManagementSystem,RDBMS)進(jìn)行數(shù)據(jù)管理,城市間多電子政務(wù)系統(tǒng)間數(shù)據(jù)結(jié)構(gòu)具有如下特性。(1)數(shù)據(jù)異構(gòu)性。城市間各電子政務(wù)系統(tǒng)由于數(shù)據(jù)庫(kù)的結(jié)構(gòu)和存儲(chǔ)方式不盡相同,以及數(shù)據(jù)管理模式和應(yīng)用流程的差異,形成了系統(tǒng)間的數(shù)據(jù)異構(gòu)。(2)數(shù)據(jù)成分復(fù)雜性。政務(wù)系統(tǒng)的數(shù)據(jù)來(lái)自于各個(gè)行業(yè)和部門(mén),而且不斷有新數(shù)據(jù)產(chǎn)生,因此數(shù)據(jù)成分相對(duì)復(fù)雜。(3)數(shù)據(jù)主題性。盡管政務(wù)數(shù)據(jù)的數(shù)量龐大且成分復(fù)雜,但從使用角度分析,可以針對(duì)部門(mén)間相關(guān)數(shù)據(jù)的交叉和關(guān)聯(lián),按業(yè)務(wù)流程將數(shù)據(jù)分為多個(gè)不同的主題,使數(shù)據(jù)組織清晰化。(4)數(shù)據(jù)環(huán)境不一致性。各系統(tǒng)采用不同的計(jì)算機(jī)操作系統(tǒng)和數(shù)據(jù)庫(kù)系統(tǒng)以及硬件和體系結(jié)構(gòu)的差異,形成了數(shù)據(jù)環(huán)境的不一致性。本文在深入探討主題圖在知識(shí)組織、信息資源定位等方面優(yōu)勢(shì)的基礎(chǔ)上,針對(duì)上述數(shù)據(jù)結(jié)構(gòu)特性,構(gòu)建基于主題圖的城市圈電子政務(wù)系統(tǒng)數(shù)據(jù)整合模型。該模型通過(guò)對(duì)異構(gòu)數(shù)據(jù)庫(kù)進(jìn)行逆向工程,利用ER模型及OAI技術(shù)生成相關(guān)主題圖,并利用主題圖的可融合性進(jìn)行主題圖合并,從而實(shí)現(xiàn)異地異構(gòu)電子政務(wù)系統(tǒng)問(wèn)數(shù)據(jù)的整合,支持跨政府部門(mén)的業(yè)務(wù)協(xié)同,增強(qiáng)電子政務(wù)系統(tǒng)集成能力和協(xié)調(diào)能力。該方法具有計(jì)算量相對(duì)較小、經(jīng)濟(jì)成本低等優(yōu)點(diǎn),同時(shí)可保證數(shù)據(jù)整合的語(yǔ)義性、可擴(kuò)展性和靈活性。2主題圖應(yīng)用的可行性一個(gè)結(jié)構(gòu)完整的電子政務(wù)系統(tǒng)至少應(yīng)該包括用戶(hù)層、應(yīng)用層、數(shù)據(jù)層三個(gè)層次。用戶(hù)層對(duì)用戶(hù)身份進(jìn)行管理并提供交互界面;應(yīng)用層是相關(guān)應(yīng)用、服務(wù)程序的集合;數(shù)據(jù)層則是所有數(shù)據(jù)資源的集合,在電子政務(wù)系統(tǒng)中一般是指RDBMS。利用主題圖技術(shù)對(duì)多電子政務(wù)系統(tǒng)進(jìn)行數(shù)據(jù)整合是在各政務(wù)系統(tǒng)的數(shù)據(jù)層和應(yīng)用層之間增加了一個(gè)第三方主題圖索引層,如圖1所示。在該層中從各RDBMS提取數(shù)據(jù),利用主題圖構(gòu)成一個(gè)結(jié)構(gòu)化的語(yǔ)義索引。應(yīng)用層根據(jù)用戶(hù)層的操作發(fā)出對(duì)數(shù)據(jù)的檢索請(qǐng)求,索引層響應(yīng)并對(duì)其進(jìn)行初步的語(yǔ)義檢索處理,然后根據(jù)檢索結(jié)果指向?qū)嶋H數(shù)據(jù)或者為RDBMS提供經(jīng)過(guò)數(shù)據(jù)整理和語(yǔ)義加工后的檢索關(guān)鍵詞,將最終檢索結(jié)果返回用戶(hù)層。圖1主題圖索引層2.1關(guān)系型數(shù)據(jù)庫(kù)關(guān)系型數(shù)據(jù)庫(kù)將復(fù)雜的數(shù)據(jù)結(jié)構(gòu)歸納為一系列“二維表格”,利用這種二元關(guān)系來(lái)表達(dá)實(shí)體類(lèi)型及實(shí)體間的聯(lián)系[3]。關(guān)系型數(shù)據(jù)庫(kù)的設(shè)計(jì)主要包括關(guān)系模式(RelationalSchema)設(shè)計(jì)和完整性約束(IntegrityConstraints)申明兩部分[4]。關(guān)系型數(shù)據(jù)庫(kù)的各個(gè)屬性相互關(guān)聯(lián),相互依賴(lài),相互制約,從而構(gòu)成一個(gè)結(jié)構(gòu)嚴(yán)密的整體。為了避免出現(xiàn)數(shù)據(jù)冗余、邏輯錯(cuò)誤和操作異常,提高存取效率和準(zhǔn)確率,在進(jìn)行數(shù)據(jù)庫(kù)設(shè)計(jì)時(shí)必須遵循相應(yīng)的規(guī)則(關(guān)系模式)[5]。因此為實(shí)現(xiàn)關(guān)系型數(shù)據(jù)庫(kù)向主題圖的轉(zhuǎn)換,必須依從一定的策略,從數(shù)據(jù)的語(yǔ)義層次提取這些模式信息。2.2可行性分析主題圖實(shí)質(zhì)上是一個(gè)獨(dú)立于具體信息資源的、動(dòng)態(tài)的、結(jié)構(gòu)化的索引,通過(guò)對(duì)主題關(guān)系實(shí)例的訪問(wèn)可檢索到相關(guān)的實(shí)際資源,從而指引用戶(hù)到特定的地址獲取信息[6]。因此,利用主題圖對(duì)多電子政務(wù)系統(tǒng)進(jìn)行數(shù)據(jù)整合是對(duì)數(shù)據(jù)庫(kù)進(jìn)行一個(gè)映射與導(dǎo)航,將抽象、孤立的數(shù)據(jù)組織起來(lái),形成結(jié)構(gòu)化的語(yǔ)義網(wǎng)絡(luò)。利用這種方法可以有效避免異地異構(gòu)數(shù)據(jù)庫(kù)之間的數(shù)據(jù)標(biāo)準(zhǔn)化、數(shù)據(jù)合并、數(shù)據(jù)關(guān)聯(lián)等大量繁瑣的計(jì)算過(guò)程。傳統(tǒng)數(shù)據(jù)庫(kù)合并方法雖然可以解決異構(gòu)數(shù)據(jù)合并問(wèn)題,但是無(wú)法很好解決語(yǔ)義異構(gòu)問(wèn)題,而主題圖的應(yīng)用可以解決這一問(wèn)題。對(duì)于數(shù)據(jù)庫(kù)和主題圖之間轉(zhuǎn)換的可行性,給出一個(gè)簡(jiǎn)單實(shí)例。假設(shè)某政務(wù)系統(tǒng)數(shù)據(jù)庫(kù)中的數(shù)據(jù)表如表1、表2和表3所示。圖2主題圖轉(zhuǎn)換及合并如圖2所示,根據(jù)主題圖TAO(TopicsAssociationsOccurrences)三要素的原理,可以對(duì)三個(gè)表格信息進(jìn)行分析,識(shí)別出數(shù)據(jù)信息中的主題(Topic)、聯(lián)系(Association)與事件(Occurrence)。實(shí)例中主題包括:?jiǎn)挝?、員工、職務(wù)、學(xué)歷、國(guó)土局等,其中單位、員工等是主題類(lèi)型;聯(lián)系類(lèi)型包括:任職、領(lǐng)導(dǎo)、工作關(guān)系等;事件包括:法人、張三等。將識(shí)別出的信息分別用XTM規(guī)定的元素節(jié)點(diǎn)進(jìn)行描述,生成XTM文檔,分別形成三個(gè)子主題圖。由于主題圖具有良好的可擴(kuò)展性與可融合性,因此可以在全局模式的指導(dǎo)下對(duì)建立的三個(gè)子主題圖進(jìn)行相似度分析,對(duì)高相似度或者一致的主題按一定規(guī)則進(jìn)行合并,把子主題圖按照自底而上的模式合并,形成全局主題圖。這種方式可以方便實(shí)現(xiàn)底層數(shù)據(jù)的增加、刪除、修改甚至數(shù)據(jù)庫(kù)結(jié)構(gòu)的變化。3模型構(gòu)建多系統(tǒng)間數(shù)據(jù)整合的基礎(chǔ)在于對(duì)異構(gòu)數(shù)據(jù)庫(kù)的統(tǒng)一化,而對(duì)數(shù)據(jù)的交互操作是模型設(shè)計(jì)的關(guān)鍵。本模型利用OAI技術(shù)形成元數(shù)據(jù)集合,從而實(shí)現(xiàn)異構(gòu)數(shù)據(jù)的標(biāo)準(zhǔn)化,通過(guò)對(duì)各政務(wù)系統(tǒng)的DBMS分別進(jìn)行逆向工程,在元數(shù)據(jù)倉(cāng)儲(chǔ)的基礎(chǔ)上按照相關(guān)規(guī)則生成局部子主題圖并遵循一定原則進(jìn)行合并,利用生成的全局主題圖實(shí)現(xiàn)數(shù)據(jù)的交互操作。3.1模型概述圖3數(shù)據(jù)整合模型結(jié)構(gòu)圖如圖3所示,將模型設(shè)計(jì)為三個(gè)模塊:數(shù)據(jù)處理模塊,主題圖生成模塊,主題圖合并模塊。(1)數(shù)據(jù)處理模塊:本模塊主要是將數(shù)據(jù)庫(kù)進(jìn)行解析,通過(guò)對(duì)異構(gòu)數(shù)據(jù)庫(kù)的數(shù)據(jù)標(biāo)準(zhǔn)化[7]、數(shù)據(jù)庫(kù)ER模式的抽取、元數(shù)據(jù)創(chuàng)建、元數(shù)據(jù)收割等手段,形成元數(shù)據(jù)倉(cāng)儲(chǔ),為高層應(yīng)用服務(wù)。(2)主題圖生成模塊:本模塊利用底層形成的元數(shù)據(jù)倉(cāng)儲(chǔ),依照主題圖模板和規(guī)則文檔生成主題圖[8]。(3)主題圖合并模塊:由于主題圖具有良好的擴(kuò)展性和可重用性,全局主題圖可以分為若干個(gè)局部主題圖分別構(gòu)建,采用自底而頂?shù)姆绞竭M(jìn)行逐級(jí)合并,最終構(gòu)成一個(gè)總的全局主題圖。3.2ER模型提取關(guān)系型數(shù)據(jù)庫(kù)的結(jié)構(gòu)和語(yǔ)義信息都包含在概念數(shù)據(jù)模式(ER模式)中,向主題圖轉(zhuǎn)換的一個(gè)關(guān)鍵問(wèn)題是關(guān)系型數(shù)據(jù)庫(kù)ER模型的提取,利用ER模型所包含的語(yǔ)義信息來(lái)指導(dǎo)主題圖的構(gòu)建。ER模型的提取一般采用數(shù)據(jù)庫(kù)逆向工程(DataBaseReverseEngineering,DBRE)方法完成。數(shù)據(jù)庫(kù)逆向工程指獲取現(xiàn)有數(shù)據(jù)庫(kù)的語(yǔ)義信息,把關(guān)系模式轉(zhuǎn)化為概念模式,最后用易于人類(lèi)理解的概念模式來(lái)表示結(jié)果。一般來(lái)說(shuō),RDBMS數(shù)據(jù)字典中保存了當(dāng)前“最終”模式狀態(tài)[9],因此本文設(shè)計(jì)了一個(gè)ERGenerator來(lái)從數(shù)據(jù)字典中提取ER模式,如圖4所示。圖4ERGeneratorERGenerator通過(guò)JDBC對(duì)RDBMS進(jìn)行連接以后,得到一個(gè)Connection對(duì)象,可以從這個(gè)對(duì)象獲得RDBMS的各種信息。獲取這些信息的方法是通過(guò)ResultSetMetaData類(lèi)和DataBaseMetaData類(lèi)實(shí)現(xiàn),使用ResultSetMetaData獲得數(shù)據(jù)表的信息,使用DataBaseMetaData獲得數(shù)據(jù)庫(kù)的信息,主要步驟如下:(1)建立數(shù)據(jù)庫(kù)連接使用ResultSetMetaData類(lèi)和DataBaseMetaData類(lèi),需要使用JDBCAPI與數(shù)據(jù)庫(kù)連接。首先加載連接數(shù)據(jù)庫(kù)的JDBC驅(qū)動(dòng)程序,然后調(diào)用java.sql包中DriverManager類(lèi)的getConnection方法,獲得一個(gè)Connection對(duì)象。此Connection對(duì)象是java.sql包中接口Connection的一個(gè)實(shí)現(xiàn),表示與該數(shù)據(jù)庫(kù)的一次連接,代碼如下:(3)獲取實(shí)體關(guān)系信息ER圖中的關(guān)系通過(guò)FK來(lái)表示,根據(jù)程序?qū)K的讀取,可以獲取實(shí)體間的關(guān)系。DataBaseMetaData類(lèi)提供getImportedKeys方法得到已經(jīng)References到他表的字段。通過(guò)這個(gè)接口可以很方便地得到有關(guān)FK的信息,代碼如下:在實(shí)驗(yàn)室構(gòu)建ERGenerator時(shí)采用CA公司的CASE工具Erwin對(duì)其進(jìn)行輔助操作。3.3OAI元數(shù)據(jù)收割模塊由于各電子政務(wù)系統(tǒng)RDBMS中數(shù)據(jù)信息的異構(gòu)特征,該模型采用OAI元數(shù)據(jù)收割技術(shù)來(lái)進(jìn)行元數(shù)據(jù)提取。OAI(OpenArchivesInitiative)元數(shù)據(jù)收割協(xié)議(OAIProtocolforMetadataHarvesting,OAI-PMH)廣泛應(yīng)用于資源整合、跨庫(kù)檢索、學(xué)科信息門(mén)戶(hù)建立、個(gè)性化服務(wù)等領(lǐng)域。OAI協(xié)議最大的特色是通過(guò)相對(duì)簡(jiǎn)單的、獨(dú)立于應(yīng)用程序以外的元數(shù)據(jù)收割協(xié)議,來(lái)實(shí)現(xiàn)異構(gòu)分布元數(shù)據(jù)資源之間便捷的互操作[10]。本模型利用OAI技術(shù)進(jìn)行跨庫(kù)元數(shù)據(jù)收割的結(jié)構(gòu)如圖5所示。該模塊由三個(gè)步驟組成:(1)將各系統(tǒng)數(shù)據(jù)庫(kù)中的數(shù)據(jù)資源處理成數(shù)字對(duì)象存儲(chǔ)在數(shù)字倉(cāng)儲(chǔ)中,建立元數(shù)據(jù)庫(kù),然后對(duì)元數(shù)據(jù)進(jìn)行結(jié)構(gòu)化組織,從而形成數(shù)據(jù)提供者(DataProvider,DP),為OAI元數(shù)據(jù)收割提供元數(shù)據(jù)信息。(2)利用元數(shù)據(jù)收集器對(duì)數(shù)據(jù)提供者提供的元數(shù)據(jù)進(jìn)行收集。圖5OAI元數(shù)據(jù)收割(3)對(duì)收集的元數(shù)據(jù)進(jìn)行規(guī)范化處理:①元數(shù)據(jù)過(guò)濾,將不符合要求的元數(shù)據(jù)過(guò)濾掉;②元數(shù)據(jù)格式轉(zhuǎn)換,將過(guò)濾后的元數(shù)據(jù)轉(zhuǎn)換為統(tǒng)一格式;③元數(shù)據(jù)索引,對(duì)整理好的元數(shù)據(jù)進(jìn)行索引。經(jīng)過(guò)上述規(guī)范化處理形成元數(shù)據(jù)集合[11]。OAI元數(shù)據(jù)收割模塊可以將異構(gòu)元數(shù)據(jù)轉(zhuǎn)換成符合規(guī)范的元數(shù)據(jù)格式,形成元數(shù)據(jù)集合(倉(cāng)儲(chǔ)),為高層應(yīng)用服務(wù),以實(shí)現(xiàn)對(duì)異構(gòu)信息資源的互操作。3.4主題圖生成與合并(1)主題圖生成模塊圖6主題圖自動(dòng)生成如圖6所示,主題圖生成模塊主要完成主題圖的自動(dòng)生成環(huán)節(jié),其核心是在元數(shù)據(jù)倉(cāng)儲(chǔ)基礎(chǔ)上,根據(jù)提取的ER模式信息,按照規(guī)范生成主題圖并進(jìn)行校驗(yàn)與可視化。該模塊分為三個(gè)步驟:①主題圖初步生成。利用OAI元數(shù)據(jù)收割模塊進(jìn)行元數(shù)據(jù)收割,按照數(shù)據(jù)資源規(guī)范和數(shù)據(jù)集規(guī)范進(jìn)行數(shù)據(jù)抽取,形成元數(shù)據(jù)倉(cāng)儲(chǔ)。按照一定的主題圖規(guī)范生成初步的主題圖并輸出。②語(yǔ)義合法性校驗(yàn)。對(duì)于初步生成的主題圖參照ER模型及SCTM約束語(yǔ)言進(jìn)行語(yǔ)義合法性檢驗(yàn),并對(duì)其進(jìn)行完善[12]。③可視化及系統(tǒng)集成。主題圖生成后應(yīng)對(duì)其進(jìn)行可視化工作,提供基于主題圖的瀏覽、檢索界面及接口[13],并將主題圖以二維圖的形式表達(dá)出來(lái)。同時(shí)采用Java語(yǔ)言進(jìn)行開(kāi)發(fā),將其與電子政務(wù)系統(tǒng)進(jìn)行系統(tǒng)集成,建構(gòu)電子政務(wù)系統(tǒng)的索引層。一般可以借助Omnigator或StarTree等工具進(jìn)行主題圖可視化。為實(shí)現(xiàn)主題圖界面的靈活化,本模型采用XML語(yǔ)法及XSLT配合StarTree來(lái)實(shí)現(xiàn)。(2)主題圖合并模塊由于本模型的主題圖生成采用由底而頂、逐漸擴(kuò)大的方式構(gòu)建,所以主題圖合并模塊是整個(gè)模型中的關(guān)鍵技術(shù)。主題圖遵循的合并原則有:①當(dāng)兩個(gè)主題被合并,代表同一事物的主題和聯(lián)系將被合并,并刪除重復(fù)項(xiàng)。②當(dāng)兩個(gè)主題被合并,結(jié)果是一個(gè)主題,其特征元素是原來(lái)兩個(gè)元素的并集[14]。兩個(gè)主題如果滿足下列條件之一則視為描述同一概念:①兩者具有一個(gè)或多個(gè)相同的主題提示符。②兩者在同一范圍定義中有相同的主題提示符。③它們是對(duì)同一個(gè)可尋址事物的具體化[15]。基于以上原則,本文采用類(lèi)程序語(yǔ)言來(lái)描述主題圖合并采用的三種方法:①主題合并4結(jié)語(yǔ)本文針對(duì)城市圈建設(shè)中多電子政務(wù)系統(tǒng)數(shù)據(jù)整合課題,在深入分析主題圖技術(shù)和關(guān)系型數(shù)據(jù)庫(kù)的基礎(chǔ)上,提出在電子政務(wù)系統(tǒng)的應(yīng)用層及數(shù)據(jù)層之間建立一個(gè)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論