(大數(shù)據(jù)資料)合貴陽(yáng)市政府?dāng)?shù)據(jù)資源開放平臺(tái)v1.0_第1頁(yè)
(大數(shù)據(jù)資料)合貴陽(yáng)市政府?dāng)?shù)據(jù)資源開放平臺(tái)v1.0_第2頁(yè)
(大數(shù)據(jù)資料)合貴陽(yáng)市政府?dāng)?shù)據(jù)資源開放平臺(tái)v1.0_第3頁(yè)
(大數(shù)據(jù)資料)合貴陽(yáng)市政府?dāng)?shù)據(jù)資源開放平臺(tái)v1.0_第4頁(yè)
(大數(shù)據(jù)資料)合貴陽(yáng)市政府?dāng)?shù)據(jù)資源開放平臺(tái)v1.0_第5頁(yè)
已閱讀5頁(yè),還剩237頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

(大數(shù)據(jù)資料)[合]貴陽(yáng)市政府?dāng)?shù)據(jù)資源開放平臺(tái)v1.0(大數(shù)據(jù)資料)[合]貴陽(yáng)市政府?dāng)?shù)據(jù)資源開放平臺(tái)v1.0(大數(shù)據(jù)資料)[合]貴陽(yáng)市政府?dāng)?shù)據(jù)資源開放平臺(tái)v1.0貴陽(yáng)市政府?dāng)?shù)據(jù)資源開放平臺(tái)實(shí)施方案建設(shè)單位: 貴陽(yáng)市信息產(chǎn)業(yè)發(fā)展中心編制單位: 貴州省郵電規(guī)劃設(shè)計(jì)院有限公司二零一六年十一月貴陽(yáng)市政府?dāng)?shù)據(jù)資源開放平臺(tái)實(shí)施方案 編制負(fù)責(zé)人:顧崇慰建設(shè)單位: 貴陽(yáng)市信息產(chǎn)業(yè)發(fā)展中心編制單位: 貴州省郵電規(guī)劃設(shè)計(jì)院有限公司二零一六年十一月

需求分析和項(xiàng)目建設(shè)的必要性數(shù)據(jù)開放相關(guān)問(wèn)題和目標(biāo)分析主要問(wèn)題一、缺乏數(shù)據(jù)資源開放的標(biāo)準(zhǔn)和機(jī)制我市電子政務(wù)經(jīng)過(guò)幾十年的發(fā)展,自上而下逐級(jí)推進(jìn),自建、自用和自成體系的電子政務(wù)建設(shè)模式明顯,各部門自成體系,標(biāo)準(zhǔn)不一、缺乏有效整合,形成了一個(gè)個(gè)“數(shù)據(jù)孤島”,致使豐富的數(shù)據(jù)資源難以得到共享,數(shù)據(jù)的收集、加工、存儲(chǔ)、利用的規(guī)范性差,政府?dāng)?shù)據(jù)資源開放缺乏統(tǒng)一的標(biāo)準(zhǔn)和機(jī)制,數(shù)據(jù)資源管理有待提高。二、數(shù)據(jù)的采集、加工能力薄弱一些政府部門缺少技術(shù)力量,采集數(shù)據(jù)能力薄弱,有些部門自己都沒(méi)有數(shù)據(jù)清單,不清楚自己手上到底有什么數(shù)據(jù)資源。另外,由于數(shù)據(jù)加工手段的缺乏,數(shù)據(jù)資源往往存在不準(zhǔn)確不及時(shí)或不全面,數(shù)據(jù)質(zhì)量缺少控制。政府?dāng)?shù)據(jù)具有分布廣、格式多樣、非結(jié)構(gòu)化等大數(shù)據(jù)的典型特點(diǎn),目前缺乏專業(yè)團(tuán)隊(duì)針對(duì)性地對(duì)政府?dāng)?shù)據(jù)進(jìn)行采集、加工。三、數(shù)據(jù)資源使用效率不高數(shù)據(jù)資源開放存在著數(shù)據(jù)資源不清楚、數(shù)據(jù)資源量不足、信息更新不及時(shí)、交互性差等問(wèn)題。各級(jí)政府部門掌握大量的政府信息數(shù)據(jù)庫(kù),這些庫(kù)分別屬于不同部門。由于缺乏數(shù)據(jù)資源的梳理和協(xié)調(diào),普遍存在數(shù)據(jù)資源量不足、數(shù)據(jù)內(nèi)容更新不及時(shí)、網(wǎng)絡(luò)平臺(tái)交互性差,政府信息資源交流不暢,數(shù)據(jù)資源利用率低造成社會(huì)資源極大浪費(fèi)。目標(biāo)分析政府作為最大的公共數(shù)據(jù)擁有者,除了自身要充分利用、共享數(shù)據(jù)資源外,更有責(zé)任和義務(wù)通過(guò)數(shù)據(jù)資源的開放,增強(qiáng)政府行政的透明度,提升社會(huì)治理能力,通過(guò)推動(dòng)整個(gè)社會(huì)對(duì)政府?dāng)?shù)據(jù)的開發(fā)利用,以助推產(chǎn)業(yè)升級(jí)和經(jīng)濟(jì)轉(zhuǎn)型,主動(dòng)把握和應(yīng)對(duì)大數(shù)據(jù)時(shí)代所帶來(lái)的機(jī)遇和挑戰(zhàn)。一、通過(guò)政務(wù)數(shù)據(jù)資源目錄體系和數(shù)據(jù)質(zhì)量管控機(jī)制為政府?dāng)?shù)據(jù)開放利用準(zhǔn)備優(yōu)質(zhì)數(shù)據(jù)資源打通部門間數(shù)據(jù)壁壘,促進(jìn)部門數(shù)據(jù)流通利用,扭轉(zhuǎn)數(shù)據(jù)重復(fù)采集引起的部門數(shù)據(jù)“打架”被動(dòng)局面,避免開放數(shù)據(jù)質(zhì)量不佳影響社會(huì)創(chuàng)新和政府公信力。通過(guò)推進(jìn)市政府部門政務(wù)數(shù)據(jù)資源目錄體系梳理,整合現(xiàn)有各類跨部門數(shù)據(jù)交換體系,建立跨部門數(shù)據(jù)采集、共享校核機(jī)制和比對(duì)、清洗機(jī)制,實(shí)現(xiàn)數(shù)據(jù)資源共享管理,促進(jìn)各部門可開放的數(shù)據(jù)資源普遍共享,確保數(shù)據(jù)生命力。二、實(shí)現(xiàn)政府?dāng)?shù)據(jù)統(tǒng)一平臺(tái)集中開放基于“云上貴州貴陽(yáng)平臺(tái)”負(fù)責(zé)匯集、儲(chǔ)存、共享、開放全市公共數(shù)據(jù),政府?dāng)?shù)據(jù)開放平臺(tái)通過(guò)與政府內(nèi)部的數(shù)據(jù)資源管理系統(tǒng)對(duì)接,從中直接選擇數(shù)據(jù)對(duì)外提供數(shù)據(jù)開放服務(wù)。不斷做實(shí)政府?dāng)?shù)據(jù)資源目錄,整合部門共享清單和需求清單,設(shè)置信息共享權(quán)限。不是簡(jiǎn)單的照搬信息公開方式開放數(shù)據(jù),而是在數(shù)據(jù)資源目錄的基礎(chǔ)上建立政府?dāng)?shù)據(jù)開放門戶網(wǎng)站,真正做到開放的數(shù)據(jù)經(jīng)常更新、開放的數(shù)據(jù)切實(shí)可以進(jìn)行加工利用。將政務(wù)數(shù)據(jù)資源目錄的匯集、共享和對(duì)外開放融為一體,對(duì)內(nèi)管理數(shù)據(jù),對(duì)外開放數(shù)據(jù)。數(shù)據(jù)開放平臺(tái)基于數(shù)據(jù)資源目錄建設(shè),各部門預(yù)先設(shè)置本部門數(shù)據(jù)資源目錄中數(shù)據(jù)集的“開放”等級(jí),數(shù)據(jù)開放平臺(tái)直接讀取位于“開放”等級(jí)的數(shù)據(jù)并向社會(huì)公眾提供下載。三、以大數(shù)據(jù)應(yīng)用帶動(dòng)政務(wù)數(shù)據(jù)匯集和開放為社會(huì)提供開放共享、安全可控的政務(wù)數(shù)據(jù)資源,推動(dòng)各級(jí)行政機(jī)關(guān)和依法行使行政職能的機(jī)構(gòu),共享和開放在履行職能過(guò)程中產(chǎn)生、獲取的數(shù)據(jù)資源,促進(jìn)政務(wù)數(shù)據(jù)資源科學(xué)配置和有效利用。通過(guò)社會(huì)參與推進(jìn)大數(shù)據(jù)應(yīng)用發(fā)展,滿足社會(huì)需求,充分發(fā)揮出大數(shù)據(jù)的經(jīng)濟(jì)效益和社會(huì)效益,借此帶動(dòng)政務(wù)數(shù)據(jù)匯集和開放。實(shí)現(xiàn)對(duì)各類政務(wù)數(shù)據(jù)的共享整合和開發(fā)應(yīng)用。以前期倒逼、后期需求為導(dǎo)向,形成貴陽(yáng)市政務(wù)數(shù)據(jù)資源開放的順向機(jī)制。業(yè)務(wù)功能和業(yè)務(wù)流程分析近年來(lái),貴陽(yáng)市信息化建設(shè)特別是政務(wù)信息化建設(shè)取得了很大進(jìn)展,為經(jīng)濟(jì)、文化建設(shè)和行政體制改革提供了有力的支持,成效顯著。但是隨著轉(zhuǎn)型跨越與經(jīng)濟(jì)調(diào)整的壓力到來(lái),這就需要對(duì)貴陽(yáng)現(xiàn)有信息化建設(shè)進(jìn)行提高和完善。建設(shè)大數(shù)據(jù)開放平臺(tái),有效整合信息資源,讓城市管理者和社會(huì)各界能夠在任何時(shí)候都可以獲取貴陽(yáng)的相關(guān)信息和數(shù)據(jù),可有效提升社會(huì)生產(chǎn)力。其主要表現(xiàn)于:面向政府:促進(jìn)跨部門業(yè)務(wù)協(xié)同、輔助政府科學(xué)決策,提升政府行政效能,助力服務(wù)型效能政府轉(zhuǎn)型。面向產(chǎn)業(yè):促進(jìn)城市產(chǎn)業(yè)轉(zhuǎn)型升級(jí),將會(huì)帶動(dòng)一大批具有廣闊市場(chǎng)前景,資源消耗低,產(chǎn)業(yè)帶動(dòng)大,就業(yè)機(jī)會(huì)多,綜合效益好的產(chǎn)業(yè)發(fā)展,助力城市產(chǎn)業(yè)實(shí)現(xiàn)生產(chǎn)方式、經(jīng)營(yíng)模式及運(yùn)營(yíng)方式的轉(zhuǎn)變,實(shí)現(xiàn)可持續(xù)發(fā)展。面向民生:以人為本,通過(guò)信息化手段提供智慧型化、人性化城市服務(wù),市民在工作、生活中可獲得一站式、互動(dòng)式、高效率的信息服務(wù);引導(dǎo)公共信息資源的社會(huì)化開發(fā)利用,豐富信息消費(fèi)內(nèi)容,提升信息服務(wù)水平,最終實(shí)現(xiàn)公共服務(wù)均等化;引導(dǎo)創(chuàng)新應(yīng)用,提升市民信息化生活品質(zhì),打造高效、便捷、和諧生活。數(shù)據(jù)資源開放規(guī)劃一、開放數(shù)據(jù)規(guī)劃制定開放數(shù)據(jù)辦法,包括數(shù)據(jù)開放的原則、數(shù)據(jù)開放的工作步驟、梳理數(shù)據(jù)開放目錄的方法、梳理數(shù)據(jù)集的方法、加工處理數(shù)據(jù)的方法、發(fā)布數(shù)據(jù)集的方法、數(shù)據(jù)更新和維護(hù)的方法、數(shù)據(jù)利用以及日常運(yùn)維的方法等方面工作內(nèi)容。二、制定數(shù)據(jù)開放目錄對(duì)可開放數(shù)據(jù)的進(jìn)行梳理,形成數(shù)據(jù)開放目錄。通過(guò)對(duì)各政府部門的部門職責(zé)、機(jī)構(gòu)設(shè)置、業(yè)務(wù)范圍、信息化建設(shè)等各方面的梳理分析,改變過(guò)去要什么梳理什么的方式,按照有什么梳理什么的原則梳理出各部門可開放的管理數(shù)據(jù)、服務(wù)數(shù)據(jù)、監(jiān)管數(shù)據(jù)等全方位、全生命周期的數(shù)據(jù)目錄,最后組合各部門的開放數(shù)據(jù)梳理成果,形成全市數(shù)據(jù)開放目錄。三、開放數(shù)據(jù)集的篩選在數(shù)據(jù)開放目錄的基礎(chǔ)上,篩選出政府各部門可以開放的數(shù)據(jù)集,并收集每個(gè)開放數(shù)據(jù)集的元數(shù)據(jù)信息,形成初始的開放數(shù)據(jù)集目錄匯總表。四、依托大數(shù)據(jù)基礎(chǔ)信息平臺(tái)進(jìn)行數(shù)據(jù)的加工和清洗對(duì)選定的開放數(shù)據(jù)集中的結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行加工,對(duì)數(shù)據(jù)按照提供單位、數(shù)據(jù)主題分類和數(shù)據(jù)加工程度等不同維度進(jìn)行分類和打標(biāo)簽。五、開放數(shù)據(jù)的脫敏建立和完善相關(guān)政府與公用事業(yè)數(shù)據(jù)資源中的安全、隱私保護(hù)的風(fēng)險(xiǎn)監(jiān)控點(diǎn),形成隱私檢查表,按照隱私保護(hù)規(guī)則對(duì)數(shù)據(jù)進(jìn)行脫敏。六、數(shù)據(jù)的發(fā)布、更新及維護(hù)數(shù)據(jù)經(jīng)過(guò)采集與加工后,按照建立好的數(shù)據(jù)目錄,發(fā)布到數(shù)據(jù)開放平臺(tái)中進(jìn)行統(tǒng)一開放。數(shù)據(jù)接入和更新過(guò)程中,建立數(shù)據(jù)上線檢查測(cè)試的機(jī)制,通過(guò)檢查數(shù)據(jù)結(jié)構(gòu)、格式確認(rèn)數(shù)據(jù)的開放形式(API或下載瀏覽),從而保證開放數(shù)據(jù)的質(zhì)量。數(shù)據(jù)開放功能分析一、實(shí)現(xiàn)政務(wù)數(shù)據(jù)資源順暢開放數(shù)據(jù)資源的開放是提升政府工作效率和工作質(zhì)量的主要手段。要遵循一定的原則、規(guī)范、標(biāo)準(zhǔn),實(shí)現(xiàn)各政務(wù)部門和公共服務(wù)單位的政務(wù)數(shù)據(jù)資源的有序開放,包括各政務(wù)部門業(yè)務(wù)統(tǒng)計(jì)數(shù)據(jù),對(duì)這些開放信息資源進(jìn)行整合,使得數(shù)據(jù)資產(chǎn)化,消除信息孤島。由于政府各部門信息化水平不一,待開放共享數(shù)據(jù)有些實(shí)現(xiàn)了信息化,有些還沒(méi)有信息化;已經(jīng)實(shí)現(xiàn)信息化的數(shù)據(jù)由于采用不同類型的數(shù)據(jù)存儲(chǔ)方式,數(shù)據(jù)格式不統(tǒng)一;不同部門的網(wǎng)絡(luò)情況、數(shù)據(jù)采集范圍、數(shù)據(jù)質(zhì)量、數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)安全要求也有很大差異。因此需要建設(shè)統(tǒng)一的數(shù)據(jù)開放平臺(tái)解決上述問(wèn)題。二、推動(dòng)數(shù)據(jù)資源統(tǒng)籌管理數(shù)據(jù)資源統(tǒng)籌管理是提高政府決策科學(xué)化的前提。對(duì)于各政務(wù)部門都需要的基礎(chǔ)信息,以及一些跨部門的主題應(yīng)用信息,政府需要通過(guò)數(shù)據(jù)開放平臺(tái)整合各部門相關(guān)信息資源,形成政務(wù)信息資源基礎(chǔ)信息庫(kù)和主題數(shù)據(jù)庫(kù),為各級(jí)各部門提供標(biāo)準(zhǔn)統(tǒng)一、具有權(quán)威性和高可用性的數(shù)據(jù),以便各部門和自身業(yè)務(wù)數(shù)據(jù)結(jié)合深入開展政務(wù)信息資源開發(fā)利用,提高科學(xué)決策水平和工作效率。三、促進(jìn)數(shù)據(jù)資源深度開發(fā)利用數(shù)據(jù)的價(jià)值在于有效利用,信息資源只有開發(fā)利用起來(lái),用于支撐科學(xué)決策、跨部門業(yè)務(wù)協(xié)同、公共服務(wù),才能體現(xiàn)價(jià)值。信息資源的開發(fā)利用能夠促進(jìn)社會(huì)創(chuàng)新。通過(guò)對(duì)公共數(shù)據(jù)的深度挖掘分析,發(fā)現(xiàn)數(shù)據(jù)價(jià)值,驅(qū)動(dòng)創(chuàng)新應(yīng)用。數(shù)據(jù)資源目錄梳理總體過(guò)程總體過(guò)程分為三個(gè)階段:調(diào)研準(zhǔn)備階段、調(diào)研實(shí)施階段、質(zhì)量評(píng)估階段。調(diào)研準(zhǔn)備階段指調(diào)研項(xiàng)目啟動(dòng)后,到開始在每一個(gè)部門調(diào)研之前,包括明確調(diào)研目標(biāo)、確定調(diào)研范圍和范圍、確定調(diào)研團(tuán)隊(duì)、制定調(diào)研計(jì)劃、業(yè)務(wù)預(yù)研(熟悉調(diào)研部門業(yè)務(wù))、資料準(zhǔn)備和溝通腳本準(zhǔn)備等環(huán)節(jié)。調(diào)研實(shí)施階段調(diào)研對(duì)接、培訓(xùn)、調(diào)研表格發(fā)放、現(xiàn)場(chǎng)調(diào)研、調(diào)研整理等環(huán)節(jié)。質(zhì)量評(píng)估階段指對(duì)某單位或部門調(diào)研輸出物全部輸出后,按照制訂的評(píng)估指標(biāo)進(jìn)行評(píng)分,以評(píng)定相關(guān)部門的成果和配合度,同時(shí)還提供評(píng)估反饋與改進(jìn)過(guò)程,以優(yōu)化評(píng)估結(jié)果。信息量分析與預(yù)測(cè)本次項(xiàng)目涉及貴陽(yáng)市政府28個(gè)委辦局,111個(gè)信息化系統(tǒng),1462個(gè)數(shù)據(jù)集,12899個(gè)數(shù)據(jù)項(xiàng),1736個(gè)信息編碼(估算值)。本次項(xiàng)目的難點(diǎn)體現(xiàn)在以下幾個(gè)方面:一、基礎(chǔ)數(shù)據(jù)的匯總與整理工作。為了借鑒國(guó)內(nèi)先進(jìn)地市的數(shù)據(jù)資源目錄編制工作的經(jīng)驗(yàn),并結(jié)合貴陽(yáng)市政府各委辦局的數(shù)據(jù)資源現(xiàn)狀,需匯總并整理國(guó)內(nèi)5個(gè)先進(jìn)地市的數(shù)據(jù)資源目錄,形成我們可以提供給委辦局的數(shù)據(jù)資源目錄范本。這5個(gè)先進(jìn)地市的數(shù)據(jù)資源目錄的匯總與整理,總共需整理150個(gè)政府部門,600多個(gè)信息化系統(tǒng),8000多個(gè)數(shù)據(jù)集。預(yù)計(jì)工作量需240人天。二、業(yè)務(wù)數(shù)據(jù)資源目錄的梳理工作。本次項(xiàng)目涉及28個(gè)委辦局,即28個(gè)具有行業(yè)特性的部門。各行業(yè)業(yè)務(wù)數(shù)據(jù)資源差異大、業(yè)務(wù)邏輯復(fù)雜,存在著很強(qiáng)的業(yè)務(wù)理解壁壘。更為重要的是,各委辦局存在著很大的思想意識(shí)障礙,“不愿共享”是當(dāng)前數(shù)據(jù)資源開放平臺(tái)推進(jìn)工作中最大的困難點(diǎn)。為了梳理28個(gè)部門的業(yè)務(wù)邏輯,需反復(fù)與各部門業(yè)務(wù)主管人員持續(xù)、反復(fù)溝通,形成共識(shí)。通過(guò)國(guó)內(nèi)其他地市的經(jīng)驗(yàn)來(lái)看,單個(gè)部門業(yè)務(wù)邏輯梳理需200人天,28個(gè)部門總計(jì)需5600人天。三、數(shù)據(jù)資源開放規(guī)則的制定工作。本次項(xiàng)目涉及28個(gè)委辦局,111個(gè)信息化系統(tǒng),需統(tǒng)計(jì)的數(shù)據(jù)集約1462個(gè),數(shù)據(jù)項(xiàng)約12899個(gè),即至少需要梳理1462張信息表,具體內(nèi)容包括編碼、信息項(xiàng)名稱、共享類型、管理方式、提供方式、備注等,還需設(shè)計(jì)12899個(gè)數(shù)據(jù)元目錄表,并賦予每張表相應(yīng)的編碼。本項(xiàng)工作1個(gè)人天預(yù)計(jì)完成30張表,28個(gè)部門共計(jì)需400人天。系統(tǒng)功能和性能需求分析業(yè)務(wù)需求數(shù)據(jù)開放門戶業(yè)務(wù)需求貴陽(yáng)市政府?dāng)?shù)據(jù)開放平臺(tái)需求在互聯(lián)網(wǎng)上構(gòu)建數(shù)據(jù)開放門戶網(wǎng)站,該門戶網(wǎng)站將政府開放數(shù)據(jù)向社會(huì)上的企業(yè)和公眾免費(fèi)開放;公眾可以按數(shù)據(jù)主題、按政府部門、按數(shù)據(jù)類型等多維度對(duì)開放數(shù)據(jù)進(jìn)行訪問(wèn),門戶應(yīng)該提供多組合條件的數(shù)據(jù)檢索服務(wù);提供數(shù)據(jù)指數(shù)可以對(duì)各類數(shù)據(jù)的開放程度、數(shù)據(jù)總量、增長(zhǎng)趨勢(shì)、熱度、最新數(shù)據(jù)等進(jìn)行直觀展現(xiàn);門戶應(yīng)該提供應(yīng)用商店,方便公眾基于政府?dāng)?shù)據(jù)開發(fā)的應(yīng)用APP能夠有一個(gè)展示的平臺(tái);門戶應(yīng)該提供互動(dòng)交流功能方便公眾有效溝通交流,提供數(shù)據(jù)需求和意見(jiàn)建議。數(shù)據(jù)開放管理需求數(shù)據(jù)開放管理需要提供運(yùn)維管理和數(shù)據(jù)開放管理兩大功能。通過(guò)運(yùn)維管理,可以進(jìn)行平臺(tái)參數(shù)的配置、工作流定義、權(quán)限控制,也可以平臺(tái)中用戶、開發(fā)者、數(shù)據(jù)集、接口、訪問(wèn)日志等進(jìn)行統(tǒng)計(jì)分析。通過(guò)數(shù)據(jù)管理提供從建立數(shù)據(jù)開放目錄、開放數(shù)據(jù)入庫(kù)、加工處理、維護(hù)、發(fā)布、歸檔等數(shù)據(jù)的全生命周期的管理功能;提供數(shù)據(jù)開放平臺(tái)的技術(shù)支撐體系,保證平臺(tái)的健康運(yùn)營(yíng),以提高平臺(tái)的穩(wěn)定性、易用性和交互性體驗(yàn),提升平臺(tái)承載能力,包括工作流服務(wù)、搜索引擎、智能推薦引擎、大數(shù)據(jù)存儲(chǔ)以及分布式計(jì)算等支撐體系。數(shù)據(jù)開放目錄需求數(shù)據(jù)開放目錄需要基于貴陽(yáng)市共享交換目錄管理作為后臺(tái)的支撐,通過(guò)目錄管理系統(tǒng)梳理數(shù)據(jù)開放目錄機(jī)器開放數(shù)據(jù)指標(biāo)。支撐互聯(lián)網(wǎng)門戶系統(tǒng)的數(shù)據(jù)開放服務(wù)目錄分類及展示。提供資源目錄查詢、目錄檢索服務(wù)等功能。數(shù)據(jù)脫敏需求數(shù)據(jù)脫敏要求從原始數(shù)據(jù)向開放數(shù)據(jù)庫(kù)敏感數(shù)據(jù)交換的過(guò)程中,通過(guò)一定方法消除原始環(huán)境數(shù)據(jù)中的敏感信息,并保留目標(biāo)環(huán)境業(yè)務(wù)所需的數(shù)據(jù)特征或內(nèi)容。數(shù)據(jù)脫敏要求不僅要確保敏感信息被去除,還需求保障還需要盡可能的平衡脫敏所花費(fèi)的代價(jià)、使用方的業(yè)務(wù)需求等多個(gè)因素。因此,為了確保數(shù)據(jù)脫敏的過(guò)程、代價(jià)可控,得到的結(jié)果正確且滿足業(yè)務(wù)需要設(shè)計(jì)合理數(shù)據(jù)脫敏策略和規(guī)則。功能需求數(shù)據(jù)開放門戶功能需求數(shù)據(jù)開放門戶要有良好界面體驗(yàn),提供多種訪問(wèn)渠道,包括電腦瀏覽器和移動(dòng)版門戶以及微信公眾號(hào)等,提供豐富的圖文界面。以圖文并茂的方式分類展示數(shù)據(jù)開放信息。提供按主題、按機(jī)構(gòu)的方式進(jìn)行數(shù)據(jù)服務(wù)的分類展現(xiàn)。提供數(shù)據(jù)開放圖譜,展現(xiàn)開放數(shù)據(jù)的關(guān)聯(lián)關(guān)系。所以都數(shù)據(jù)集合開放服務(wù)都提供詳細(xì)用戶操作指南。提供數(shù)據(jù)預(yù)覽和接口測(cè)試功能。公眾通過(guò)門戶獲取開放數(shù)據(jù)要求系統(tǒng)提供數(shù)據(jù)能力指標(biāo)信息。展現(xiàn)數(shù)據(jù)來(lái)源數(shù)據(jù)貢獻(xiàn)單位數(shù)據(jù)總量和目錄;數(shù)據(jù)動(dòng)態(tài)--熱門數(shù)據(jù)最新數(shù)據(jù)使用量最多數(shù)據(jù)排名,提供數(shù)據(jù)分類導(dǎo)航,數(shù)據(jù)推薦,數(shù)據(jù)檢索,數(shù)據(jù)排序(瀏覽次數(shù)、下載次數(shù)、評(píng)論次數(shù),評(píng)分情況。公眾對(duì)數(shù)據(jù)獲取需要降低數(shù)據(jù)獲取障礙,提升數(shù)據(jù)開放使用率。不注冊(cè)能獲取那些數(shù)據(jù),注冊(cè)登陸用戶獲取數(shù)據(jù)要優(yōu)化登陸體驗(yàn),簡(jiǎn)化登錄環(huán)節(jié)簡(jiǎn)單,增加用戶粘性。每個(gè)開放數(shù)據(jù)有位于URI,便于傳播分享。提供數(shù)據(jù)集預(yù)覽;數(shù)據(jù)指標(biāo)信息預(yù)覽;提供數(shù)據(jù)文檔指導(dǎo)數(shù)據(jù)下載和被應(yīng)用機(jī)讀。開放數(shù)據(jù)API服務(wù)應(yīng)該提供數(shù)據(jù)測(cè)試功能。數(shù)據(jù)應(yīng)用,應(yīng)該提供數(shù)據(jù)應(yīng)用頻道,供開發(fā)者提交APP應(yīng)用,提供應(yīng)用免費(fèi)下載和評(píng)論功能;展現(xiàn)開發(fā)者信息。互動(dòng)交流,每個(gè)數(shù)據(jù)集或者服務(wù)API都應(yīng)該提供評(píng)論、評(píng)價(jià)和評(píng)分功能。數(shù)據(jù)開放支持通過(guò)分享鏈接在互聯(lián)網(wǎng)平臺(tái)上(微信、微博、朋友圈、QQ)傳播。門戶提供意見(jiàn)和建議系統(tǒng),公共評(píng)論功能不需要注冊(cè),提供數(shù)據(jù)需求在線申請(qǐng)(給讓用戶提交關(guān)心的數(shù)據(jù))反向推動(dòng)數(shù)據(jù)開放。提供問(wèn)卷調(diào)查。 設(shè)置網(wǎng)站動(dòng)態(tài)板塊,定期發(fā)布系統(tǒng)運(yùn)行進(jìn)展、組織的活動(dòng)、宣傳、領(lǐng)導(dǎo)關(guān)懷、熱點(diǎn)應(yīng)用事件等。 數(shù)據(jù)授權(quán)1) 數(shù)據(jù)授權(quán)協(xié)議條款不能模糊2) 不限制數(shù)據(jù)自由分享傳播3) 數(shù)據(jù)免費(fèi)性(是否加入收費(fèi))4) 明確保障數(shù)據(jù)的自由增值利用權(quán)利5) 明確保障數(shù)據(jù)的自由分享傳播權(quán)利2.3.2.數(shù)據(jù)開放管理功能需求建立數(shù)據(jù)開放管理子系統(tǒng),提供平臺(tái)運(yùn)營(yíng)管理和數(shù)據(jù)管理兩大功能。通過(guò)運(yùn)營(yíng)管理,可以進(jìn)行平臺(tái)參數(shù)的配置、工作流定義、權(quán)限控制,也可以平臺(tái)中用戶、開發(fā)者、數(shù)據(jù)集、接口、訪問(wèn)日志等進(jìn)行統(tǒng)計(jì)分析。數(shù)據(jù)管理模塊提供從建立數(shù)據(jù)目錄、數(shù)據(jù)入庫(kù)、加工處理、維護(hù)、發(fā)布、歸檔等數(shù)據(jù)的全生命周期的管理功能;二是建立數(shù)據(jù)開放平臺(tái)的技術(shù)支撐體系,保證平臺(tái)的健康運(yùn)營(yíng),以提高平臺(tái)的穩(wěn)定性、易用性和交互性體驗(yàn),提升平臺(tái)承載能力,包括工作流服務(wù)、搜索引擎、智能推薦引擎、大數(shù)據(jù)存儲(chǔ)以及分布式計(jì)算等支撐體系。數(shù)據(jù)開放目錄功能需求數(shù)據(jù)開放目錄包括開放數(shù)據(jù)目錄、開放服務(wù)目錄五類目錄。開放數(shù)據(jù)目錄、開放服務(wù)目錄則從數(shù)據(jù)及服務(wù)兩個(gè)方面面向社會(huì)大眾提供。數(shù)據(jù)目錄主要針對(duì)的是數(shù)據(jù),提供數(shù)據(jù)資源目錄服務(wù),以便發(fā)現(xiàn)和定位信息資源數(shù)據(jù)資源;數(shù)據(jù)服務(wù)目錄主要針對(duì)的對(duì)象是數(shù)據(jù)服務(wù)資源,提供服務(wù)地址等目錄信息,以便發(fā)現(xiàn)和定位數(shù)據(jù)服務(wù)。數(shù)據(jù)開放目錄的建設(shè)從開放數(shù)據(jù)的提供者梳理數(shù)據(jù)開始,到數(shù)據(jù)的使用者查詢、使用、需要經(jīng)為歷六個(gè)環(huán)節(jié):規(guī)則、編目、注冊(cè)、發(fā)布、查詢、維護(hù)。針對(duì)六個(gè)環(huán)節(jié)分別提供相應(yīng)的功能。數(shù)據(jù)脫敏需求為保障數(shù)據(jù)安全,避免數(shù)據(jù)安全事故的發(fā)生,數(shù)據(jù)開放過(guò)程必須采用脫敏加密技術(shù)進(jìn)行嚴(yán)格處理。數(shù)據(jù)脫敏主要分為兩種:動(dòng)態(tài)脫敏和靜態(tài)脫敏。動(dòng)態(tài)數(shù)據(jù)脫敏,即根據(jù)不同的應(yīng)用需求,對(duì)數(shù)據(jù)中的敏感信息進(jìn)行不同的界定,通過(guò)制定相應(yīng)的脫敏規(guī)則對(duì)那些被界定為敏感信息的數(shù)據(jù)進(jìn)行屏蔽。靜態(tài)數(shù)據(jù)脫敏也叫“持久性數(shù)據(jù)脫敏”,即對(duì)數(shù)據(jù)中的常規(guī)敏感信息在數(shù)據(jù)源處就進(jìn)行替換、覆蓋或隱藏等脫敏處理。實(shí)施單位必須制定嚴(yán)格的隱私保護(hù)策略和脫敏規(guī)則,根據(jù)信息資源的保密級(jí)別進(jìn)行相應(yīng)脫敏加密操作。如直接使用密文、數(shù)據(jù)模糊泛化處理等。項(xiàng)目建設(shè)的必要性開放數(shù)據(jù)是未來(lái)電子政務(wù)發(fā)展的必要條件,開放政府是未來(lái)政府勝任角色挑戰(zhàn)的必然選擇。開放數(shù)據(jù)已是世界改革創(chuàng)新的發(fā)展趨勢(shì),加快貴陽(yáng)市政府開放數(shù)據(jù)的步伐,確保政府?dāng)?shù)據(jù)開放透明,克服數(shù)據(jù)技術(shù)壁壘,促進(jìn)貴陽(yáng)市信息技術(shù)基礎(chǔ)設(shè)施建設(shè),推動(dòng)大數(shù)據(jù)價(jià)值在貴陽(yáng)實(shí)現(xiàn)。也有利于節(jié)約政府信息服務(wù)成本,提高政府工作效率,擴(kuò)大政府信息服務(wù)范圍,提高政府公眾影響力,支持信息內(nèi)容產(chǎn)業(yè)的發(fā)展,促進(jìn)信息增值。一、利于構(gòu)建服務(wù)型政府,推動(dòng)政府透明化通過(guò)數(shù)據(jù)開放使信息資源在政府與公眾之間重新優(yōu)化分配,改變過(guò)去公民與政府之間的信息不對(duì)稱、不平衡的狀況,使公民與政府能夠共享政府信息資源,享受個(gè)性化的信息服務(wù),依據(jù)公開的信息數(shù)據(jù)與政府進(jìn)行及時(shí)、有效的溝通,透明、參與和協(xié)作的機(jī)制構(gòu)成了更加民主和有效的政府基本框架。二、滿足公眾需求,提高對(duì)政府滿意度通過(guò)政府開放數(shù)據(jù),促進(jìn)公共服務(wù)領(lǐng)域提供更好的服務(wù),通過(guò)政府?dāng)?shù)據(jù)的免費(fèi)使用來(lái)帶動(dòng)創(chuàng)新,創(chuàng)造出一些有助于大眾更好地適應(yīng)現(xiàn)代生活的實(shí)用工具和產(chǎn)品。同時(shí),政府部門人力資源、職業(yè)教育、社會(huì)保障等方面的信息資源實(shí)現(xiàn)開放共享,將有效填平求職者與各行業(yè)人才需求之間的“信息不對(duì)稱”鴻溝,優(yōu)化人力資源配置,有效降低失業(yè)率。通過(guò)政府?dāng)?shù)據(jù)開放平臺(tái),為公民社提供了自由、平等、責(zé)任和參與的生態(tài)環(huán)境,使公民愿意承擔(dān)公共責(zé)任、參與公共事務(wù),通過(guò)意見(jiàn)表達(dá),凡事發(fā)出聲音,形成一個(gè)防止政府犯下錯(cuò)誤的監(jiān)督力量,提高社會(huì)對(duì)政府的滿意度。三、促進(jìn)社會(huì)治理現(xiàn)代化社會(huì)治理方式要實(shí)現(xiàn)社會(huì)管理與社會(huì)自治的有機(jī)結(jié)合。十八屆三中全會(huì)指出,改進(jìn)社會(huì)治理方式,要“實(shí)現(xiàn)政府治理和社會(huì)自我調(diào)節(jié)、居民自治良性互動(dòng)”。優(yōu)化社會(huì)治理,既要加強(qiáng)黨政主導(dǎo)、社會(huì)管理,又要堅(jiān)持多方參與、共同治理。社會(huì)管理注重自上而下、以權(quán)力為主導(dǎo),重在“有為而治”;社會(huì)自治注重自下而上、以權(quán)利為主導(dǎo),重在“無(wú)為而治”。二者交織融合、各有側(cè)重,共同立于社會(huì)基礎(chǔ)之上。因此社會(huì)治理是政府和社會(huì)共同參與的事情,政府起到管理作用,社會(huì)也具備調(diào)整完善的自我凈化功能,通過(guò)政府?dāng)?shù)據(jù)開放平臺(tái),既形成一個(gè)防止政府犯下錯(cuò)誤的監(jiān)督力量,又最大限度地調(diào)動(dòng)社會(huì)公眾的積極性,激發(fā)社會(huì)活力,使公民愿意承擔(dān)公共責(zé)任、參與公共事務(wù)以及約束自身行為。四、帶動(dòng)新興產(chǎn)業(yè)的發(fā)展,推動(dòng)產(chǎn)業(yè)升級(jí)通過(guò)數(shù)據(jù)開放平臺(tái)通過(guò)開放接口,簡(jiǎn)化使用政府?dāng)?shù)據(jù)的環(huán)節(jié)、減少使用政府?dāng)?shù)據(jù)的成本,免去了數(shù)據(jù)更新、維護(hù)的困難,降低創(chuàng)新的門檻,推動(dòng)網(wǎng)絡(luò)經(jīng)濟(jì)的發(fā)展,還可以帶動(dòng)移動(dòng)互聯(lián)網(wǎng)產(chǎn)業(yè)、大數(shù)據(jù)產(chǎn)業(yè)及數(shù)據(jù)服務(wù)產(chǎn)業(yè)的發(fā)展。數(shù)據(jù)的開放可以催生一系列新模式、新業(yè)態(tài)、新產(chǎn)品,促進(jìn)產(chǎn)業(yè)轉(zhuǎn)型升級(jí)。讓大數(shù)據(jù)時(shí)代最重要的生產(chǎn)資料數(shù)據(jù)自由地流動(dòng)起來(lái),以催生創(chuàng)新,推動(dòng)知識(shí)經(jīng)濟(jì)和網(wǎng)絡(luò)經(jīng)濟(jì)的發(fā)展,促進(jìn)貴陽(yáng)市的經(jīng)濟(jì)增長(zhǎng)由粗放型向精細(xì)型轉(zhuǎn)型升級(jí)。數(shù)據(jù)開放共享將促進(jìn)現(xiàn)代信息服務(wù)業(yè)、文化創(chuàng)意、智庫(kù)等第三產(chǎn)業(yè)的發(fā)展,拓展新的就業(yè)空間。社會(huì)化力量利用政府?dāng)?shù)據(jù),開發(fā)對(duì)社會(huì)公眾有實(shí)用價(jià)值的應(yīng)用,既為社會(huì)中小企業(yè)提供了創(chuàng)造的平臺(tái),又為社會(huì)公眾的生活帶來(lái)了實(shí)實(shí)在在的便利??傮w建設(shè)方案建設(shè)思路和原則建設(shè)思路隨著政府信息化水平的不斷提升,政府部門在履行職責(zé)過(guò)程中已生成、采集和保存了海量的數(shù)據(jù),成為社會(huì)主要的數(shù)據(jù)保有者。政府所保存的這些數(shù)據(jù)與公眾的生產(chǎn)生活息息相關(guān)。大數(shù)據(jù)往往建立在開放數(shù)據(jù)的基礎(chǔ)上,大數(shù)據(jù)應(yīng)用需要整合和利用來(lái)自政府、企業(yè)、社會(huì)組織和公眾等多種來(lái)源的數(shù)據(jù),而政府?dāng)?shù)據(jù)是大數(shù)據(jù)不可或缺的重要組成部分。因此,開放政府?dāng)?shù)據(jù)供社會(huì)利用是實(shí)現(xiàn)大數(shù)據(jù)戰(zhàn)略的重要前提。貴陽(yáng)市作為貴州省委省政府推動(dòng)國(guó)家大數(shù)據(jù)戰(zhàn)略行動(dòng)的綜合試驗(yàn)區(qū)。 堅(jiān)持政府?dāng)?shù)據(jù)共享開放是貴陽(yáng)建設(shè)塊數(shù)據(jù)城市的基礎(chǔ)性、關(guān)鍵性工程。貴陽(yáng)政府?dāng)?shù)據(jù)資源開放平臺(tái)的建設(shè)思路要以“數(shù)據(jù)是資源、應(yīng)用是核心、產(chǎn)業(yè)是目的、安全是保障,開放是創(chuàng)新”為原則,堅(jiān)持信息化、市場(chǎng)化、產(chǎn)業(yè)化三化統(tǒng)籌,以開放是慣例不開放是特例為指導(dǎo)思想。以政府?dāng)?shù)據(jù)資源的共享和開放為核心驅(qū)動(dòng)力,加速我市塊數(shù)據(jù)創(chuàng)新發(fā)展和產(chǎn)業(yè)鏈的構(gòu)建,打造國(guó)家大數(shù)據(jù)政府治理的地方典范,體現(xiàn)國(guó)家大數(shù)據(jù)戰(zhàn)略的貴陽(yáng)實(shí)踐。1)在建設(shè)過(guò)程中要借鑒與探索相結(jié)合政府?dāng)?shù)據(jù)資源開放規(guī)劃的建設(shè)內(nèi)容,有些是已有現(xiàn)成的標(biāo)準(zhǔn)和經(jīng)驗(yàn),如政府?dāng)?shù)據(jù)交換共享體系、政府資源共享目錄體系,這些建設(shè)內(nèi)容的建設(shè)要在標(biāo)準(zhǔn)和規(guī)范的基礎(chǔ)上,參考成功的經(jīng)驗(yàn),保證切實(shí)做好。有些內(nèi)容在國(guó)內(nèi)尚屬創(chuàng)新,這部分的建設(shè)要根據(jù)《大數(shù)據(jù)發(fā)展行動(dòng)綱要》的精神,循序漸進(jìn),搞好規(guī)劃和設(shè)計(jì),做好業(yè)務(wù)上、技術(shù)上的論證,從簡(jiǎn)單易行又能做出亮點(diǎn)的部分出發(fā),不斷積累經(jīng)驗(yàn)不斷前進(jìn)。2)在經(jīng)驗(yàn)參考上要國(guó)內(nèi)、國(guó)際相結(jié)合我市政府?dāng)?shù)據(jù)資源開放建設(shè)要全面借鑒國(guó)內(nèi)、國(guó)際領(lǐng)先的數(shù)據(jù)開放平臺(tái)建設(shè)理念和經(jīng)驗(yàn)。3)在項(xiàng)目建設(shè)前期要采取倒逼機(jī)制貴陽(yáng)市政府?dāng)?shù)據(jù)資源開放平臺(tái)建設(shè)前期為了快速形成成效,可以采取倒逼的機(jī)制,先期設(shè)定一個(gè)確定的目標(biāo),比如12月底完成100項(xiàng)政府?dāng)?shù)據(jù)資源集的開放。采用倒逼機(jī)制可以保障項(xiàng)目在短時(shí)間快速推出平臺(tái)。初步形成數(shù)據(jù)開放環(huán)境,吸引數(shù)據(jù)需求者參與到項(xiàng)目建設(shè)中來(lái)。4)在項(xiàng)目建設(shè)后期要以需求為導(dǎo)向因?yàn)榍捌诘牡贡茩C(jī)制,后期項(xiàng)目在建設(shè)過(guò)程中已經(jīng)有大批參與者,帶來(lái)了大量的數(shù)據(jù)開放建設(shè)需求。有了這些需求導(dǎo)向后能夠更好的把握項(xiàng)目建設(shè)方向。數(shù)據(jù)開放體系也會(huì)更加趨向完善。5)堅(jiān)持供給側(cè)推動(dòng)政府?dāng)?shù)據(jù)開放建設(shè)初期,項(xiàng)目成功的最關(guān)鍵因素還是在資源供給側(cè)。通過(guò)對(duì)供給側(cè)的資源摸底和數(shù)據(jù)梳理,以標(biāo)準(zhǔn)化,規(guī)范化、流程化的方式進(jìn)行開放資源的采集、融合、編目。加快支撐政府?dāng)?shù)據(jù)資源的統(tǒng)一對(duì)外開放的進(jìn)程。(6)制度先行。首先要進(jìn)行數(shù)據(jù)開放的制度規(guī)范工作,從根本上解決“憑什么開放、開放什么”的法律依據(jù)問(wèn)題,建立起數(shù)據(jù)開放的規(guī)范,全面保障政府?dāng)?shù)據(jù)開放的合法性、合理性,全面打消個(gè)別政府不敢開放數(shù)據(jù)的顧慮和擔(dān)憂,同時(shí)明確政府部門拒絕開放的法律責(zé)任。制訂完善的數(shù)據(jù)開放的標(biāo)準(zhǔn)規(guī)范體系。盡快制訂《龍崗區(qū)數(shù)據(jù)開放管理辦法法》、《政府?dāng)?shù)據(jù)安全管理規(guī)范》、《政府?dāng)?shù)據(jù)開發(fā)使用規(guī)范》等配套性的標(biāo)準(zhǔn)規(guī)范,依法明確數(shù)據(jù)開放的責(zé)任主體、權(quán)限職責(zé)、法律責(zé)任等事項(xiàng),確保政府?dāng)?shù)據(jù)開放的合法性、規(guī)范性和安全性,為政府?dāng)?shù)據(jù)開放保駕護(hù)航。(7)標(biāo)準(zhǔn)統(tǒng)一。數(shù)據(jù)開放的最大價(jià)值在于數(shù)據(jù)的開發(fā)利用,而為了提高利用率,明確政府開放數(shù)據(jù)的統(tǒng)一標(biāo)準(zhǔn)格式,顯得尤為重要。這就要求政府開放的數(shù)據(jù),要從用戶使用的角度出發(fā),避免設(shè)置數(shù)據(jù)格式不可機(jī)讀、不可編輯和不可下載的諸多限制,為用戶機(jī)器讀取、編輯和二次開發(fā)利用提供最大的便利。(8)民生服務(wù)為先。在解決了開放依據(jù)和數(shù)據(jù)格式的基礎(chǔ)上,要明確“開放什么數(shù)據(jù)”的問(wèn)題,對(duì)此,應(yīng)該堅(jiān)持問(wèn)題導(dǎo)向、滿足民生服務(wù)需求導(dǎo)向的原則,最先開放教育、醫(yī)療、社保、交通、就業(yè)和環(huán)保等涉及民生服務(wù)的數(shù)據(jù),在確保廣大民眾知情權(quán)的基礎(chǔ)上,引導(dǎo)廣大數(shù)據(jù)企業(yè)和創(chuàng)業(yè)團(tuán)隊(duì)積極開發(fā)民生服務(wù)應(yīng)用軟件,讓企業(yè)或開發(fā)者幫助政府協(xié)同解決諸多民生治理中面臨的難題,提高政府的公共服務(wù)能力。(9)建立健全政府大數(shù)據(jù)管理體系。數(shù)據(jù)開放是一項(xiàng)專業(yè)性很強(qiáng)的工作,對(duì)政府傳統(tǒng)的機(jī)構(gòu)設(shè)置、人才結(jié)構(gòu)、專業(yè)能力和治理流程都會(huì)提出新的要求,這就需要政府根據(jù)數(shù)據(jù)開放和大數(shù)據(jù)治理的要求,加強(qiáng)加大數(shù)據(jù)專業(yè)人才引進(jìn)、合理調(diào)整機(jī)構(gòu)設(shè)置、強(qiáng)化政府?dāng)?shù)據(jù)管理以及開展服務(wù)需求者調(diào)查等系列工作,全面提高政府的數(shù)據(jù)治理能力。建設(shè)原則一、開放性原則除政府秘密、個(gè)人隱私、商業(yè)機(jī)密類的數(shù)據(jù)可以豁免之外,政府部門應(yīng)該免費(fèi)的、無(wú)保留地向社會(huì)開放可開放數(shù)據(jù),政府拒絕提供數(shù)據(jù)須負(fù)舉證責(zé)任,司法部門具有重新審定政府?dāng)?shù)據(jù)開放事實(shí)的權(quán)力。二、數(shù)據(jù)開放平等性原則政府?dāng)?shù)據(jù)開放對(duì)所有公民都應(yīng)該是平等無(wú)差異對(duì)待的,無(wú)論年齡、身份、地位,都可以自由的獲取和使用,用于合法的任何活動(dòng)。三、技術(shù)兼容性原則技術(shù)手段和技術(shù)措施必須具有開放性、兼容性和互操作性的原則,不對(duì)數(shù)據(jù)開放與共享設(shè)定技術(shù)限制或技術(shù)障礙。四、民生數(shù)據(jù)優(yōu)先開放原則選擇所涉業(yè)務(wù)與社會(huì)公眾的緊密度高的政府部門,優(yōu)先展開數(shù)據(jù)開放工作;選擇民生指數(shù)高的數(shù)據(jù)集優(yōu)先梳理、采集、處理和發(fā)布。總體架構(gòu)設(shè)計(jì)設(shè)計(jì)思路政府?dāng)?shù)據(jù)資源開放平臺(tái)整合全市政府多年行政沉淀的數(shù)據(jù)資源,運(yùn)用大數(shù)據(jù)、云計(jì)算等先進(jìn)信息技術(shù),建設(shè)統(tǒng)一的政府?dāng)?shù)據(jù)共享開放平臺(tái),編制數(shù)據(jù)資源目錄體系和數(shù)據(jù)共享開放標(biāo)準(zhǔn)規(guī)范,支撐政府?dāng)?shù)據(jù)資源面向公眾共享和開放,促進(jìn)大眾創(chuàng)業(yè),萬(wàn)眾創(chuàng)新。通過(guò)對(duì)政府各部門的非涉密數(shù)據(jù)進(jìn)行采集、梳理,生成數(shù)據(jù)資源開放目錄及政府?dāng)?shù)據(jù)資源開放庫(kù)。通過(guò)數(shù)據(jù)集封裝,形成數(shù)據(jù)開放服務(wù),通過(guò)數(shù)據(jù)服務(wù)開放平臺(tái),為社會(huì)公眾提供直接科獲取利用和再利用的政府?dāng)?shù)據(jù)資源,同時(shí),通過(guò)引入社會(huì)資源,完善開放數(shù)據(jù)庫(kù),平臺(tái)設(shè)計(jì)思路如下:

大數(shù)據(jù)正在改變和重塑著政府的治理生態(tài),并成為推動(dòng)政府治理方式變革的主導(dǎo)力量之一,而數(shù)據(jù)開放是實(shí)現(xiàn)數(shù)據(jù)共享、智慧治理的基礎(chǔ)所在和第一道門檻。因此,理清思路,采取舉措,加快政府?dāng)?shù)據(jù)開放,是貴陽(yáng)市利用大數(shù)據(jù)推動(dòng)政府治理方式變革,提升治理能力新選擇。為此,提出如下思路:一、標(biāo)準(zhǔn)統(tǒng)一,制度先行首先要進(jìn)行數(shù)據(jù)開放的制度規(guī)范工作,從根本上解決“憑什么開放、開放什么”的法律依據(jù)問(wèn)題,建立起數(shù)據(jù)開放的規(guī)范,全面保障政府?dāng)?shù)據(jù)開放的合法性、合理性,全面打消個(gè)別政府不敢開放數(shù)據(jù)的顧慮和擔(dān)憂,同時(shí)明確政府部門拒絕開放的法律責(zé)任。制訂完善的數(shù)據(jù)開放的標(biāo)準(zhǔn)規(guī)范體系。盡快制訂《龍崗區(qū)數(shù)據(jù)開放管理辦法法》、《政府?dāng)?shù)據(jù)安全管理規(guī)范》、《政府?dāng)?shù)據(jù)開發(fā)使用規(guī)范》等配套性的標(biāo)準(zhǔn)規(guī)范,依法明確數(shù)據(jù)開放的責(zé)任主體、權(quán)限職責(zé)、法律責(zé)任等事項(xiàng),確保政府?dāng)?shù)據(jù)開放的合法性、規(guī)范性和安全性,為政府?dāng)?shù)據(jù)開放保駕護(hù)航。數(shù)據(jù)開放的最大價(jià)值在于數(shù)據(jù)的開發(fā)利用,而為了提高利用率,明確政府開放數(shù)據(jù)的統(tǒng)一標(biāo)準(zhǔn)格式,顯得尤為重要。這就要求政府開放的數(shù)據(jù),要從用戶使用的角度出發(fā),避免設(shè)置數(shù)據(jù)格式不可機(jī)讀、不可編輯和不可下載的諸多限制,為用戶機(jī)器讀取、編輯和二次開發(fā)利用提供最大的便利。二、集中式開放和分布式開放相結(jié)合結(jié)合貴陽(yáng)市政府信息化建設(shè)現(xiàn)狀,貴陽(yáng)當(dāng)前政府?dāng)?shù)據(jù)共享交換平臺(tái)的建設(shè)采用集中式和分布式相結(jié)合的模式。集中式實(shí)現(xiàn)貴陽(yáng)市大部分委辦局的數(shù)據(jù)歸集和數(shù)據(jù)共享交換傳輸路由。分布式采用SOA建設(shè)模式,數(shù)據(jù)不在中心歸集。但是數(shù)據(jù)共享通道和數(shù)據(jù)服務(wù)調(diào)用基于云服務(wù)總線集成并實(shí)現(xiàn)互聯(lián)互通。政府開放數(shù)據(jù)的建設(shè)。依托政府共享交換平臺(tái)實(shí)現(xiàn)歸集數(shù)據(jù)的集中開放。依托云服務(wù)技術(shù)實(shí)現(xiàn)數(shù)據(jù)服務(wù)化生成和數(shù)據(jù)服務(wù)分布式開放。三、政府開放數(shù)據(jù)資源集約化管理以數(shù)據(jù)為核心進(jìn)行集約化存儲(chǔ)、計(jì)算和管理,提升資源的利用率和數(shù)據(jù)價(jià)值,為政府、企業(yè)和個(gè)人提供開放的數(shù)據(jù)服務(wù)。基于云化的設(shè)計(jì)思路體現(xiàn)了集約化建設(shè)和資源最大化利用,避免重復(fù)建設(shè)和數(shù)據(jù)資源不一致問(wèn)題。四、基于大數(shù)據(jù)實(shí)現(xiàn)資源服務(wù)和數(shù)據(jù)開放本項(xiàng)目政府?dāng)?shù)據(jù)資源開放平臺(tái)建設(shè)以數(shù)據(jù)為主線,基于大數(shù)據(jù)技術(shù)是數(shù)據(jù)采集、存儲(chǔ)、標(biāo)準(zhǔn)化、編目和開放,創(chuàng)造數(shù)據(jù)應(yīng)用價(jià)值;以數(shù)據(jù)資源開放為驅(qū)動(dòng)力,提升政府?dāng)?shù)據(jù)利用和再利用價(jià)值。五、基于組件和服務(wù)技術(shù)實(shí)現(xiàn)平臺(tái)的松耦合建設(shè)基于SOA/WOA組件化和服務(wù)化實(shí)現(xiàn)了項(xiàng)目各類應(yīng)用的松耦合建設(shè),即業(yè)務(wù)組件化和組件能力服務(wù)化,解決項(xiàng)目各類應(yīng)用信息孤島和業(yè)務(wù)流程不連貫等問(wèn)題,便于根據(jù)業(yè)務(wù)的實(shí)際需求,快速進(jìn)行功能的擴(kuò)展和組合。六、基于標(biāo)準(zhǔn)API實(shí)現(xiàn)數(shù)據(jù)資源的服務(wù)開放為實(shí)現(xiàn)政府?dāng)?shù)據(jù)的安全開放,設(shè)計(jì)一個(gè)完整的體系架構(gòu),保障平臺(tái)的各項(xiàng)服務(wù)的有效開展。針對(duì)政府?dāng)?shù)據(jù)的特點(diǎn),基于REST架構(gòu)風(fēng)格進(jìn)行安全的數(shù)據(jù)資源能力開放API(OpenAPI)設(shè)計(jì);遵循分級(jí)訪問(wèn)控制原則,結(jié)合實(shí)際應(yīng)用場(chǎng)景,依據(jù)OAuth2標(biāo)準(zhǔn)協(xié)議實(shí)現(xiàn)安全授權(quán)機(jī)制,以保障隱私數(shù)據(jù)和敏感數(shù)據(jù)的安全訪問(wèn)。同時(shí),實(shí)現(xiàn)對(duì)OpenAPI應(yīng)用管理的功能,包括對(duì)第三方應(yīng)用進(jìn)行內(nèi)容審核及安全測(cè)試、提供安全接入和安全監(jiān)管。七、構(gòu)建全覆蓋的數(shù)據(jù)治理治理體系平臺(tái)需要從配置管理、監(jiān)控管理、故障恢復(fù)、服務(wù)質(zhì)量四個(gè)維度提供系統(tǒng)化IT治理服務(wù)功能,提升系統(tǒng)的可管理性、健壯性,降低運(yùn)維成本。該體系主要包括對(duì)數(shù)據(jù)交換共享與數(shù)據(jù)服務(wù)開發(fā)兩大方面:數(shù)據(jù)共享治理:提供配置管理中心和監(jiān)控管理中心,全面管理各個(gè)交換節(jié)點(diǎn)數(shù)據(jù)交換配置,實(shí)時(shí)監(jiān)控?cái)?shù)據(jù)傳輸過(guò)程、網(wǎng)絡(luò)狀況和數(shù)據(jù)交換節(jié)點(diǎn)的運(yùn)行狀態(tài);并捕獲數(shù)據(jù)傳輸異常、網(wǎng)絡(luò)異常、網(wǎng)關(guān)運(yùn)行狀態(tài)異常等,提供斷點(diǎn)續(xù)傳、數(shù)據(jù)重傳等多種故障智能恢復(fù)機(jī)制。在數(shù)據(jù)服務(wù)開放方面,提供高可用的數(shù)據(jù)開放服務(wù)。采用云服務(wù)總線,提供服務(wù)注冊(cè)管理、服務(wù)粒度監(jiān)控、服務(wù)請(qǐng)求監(jiān)控、服務(wù)調(diào)度次數(shù)控制、服務(wù)調(diào)度權(quán)限控制、服務(wù)代理訪問(wèn)權(quán)限控制、服務(wù)及服務(wù)方法的流量控制等功能,并提供服務(wù)質(zhì)量保證。八、構(gòu)建防控一體的安全保障體系建立大數(shù)據(jù)安全技術(shù)、地方法規(guī)和倫理道德體系,保障國(guó)家安全、社會(huì)安全和個(gè)人隱私不受侵犯。一是建立大數(shù)據(jù)安全技術(shù)保障體系。支持基于大數(shù)據(jù)技術(shù)的網(wǎng)絡(luò)與信息安全環(huán)境建設(shè),推進(jìn)信息安全技術(shù)與產(chǎn)品的研發(fā)與應(yīng)用,加強(qiáng)數(shù)據(jù)保護(hù),提升網(wǎng)絡(luò)安全監(jiān)測(cè)、預(yù)警和應(yīng)急處理能力。二是建立大數(shù)據(jù)安全地方法規(guī)。支持?jǐn)?shù)據(jù)產(chǎn)品知識(shí)產(chǎn)權(quán)的研究和保護(hù),加快制定信息采集和管控、敏感數(shù)據(jù)管理、數(shù)據(jù)交換、個(gè)人隱私、數(shù)據(jù)權(quán)益和合理利用等領(lǐng)域的大數(shù)據(jù)地方性法規(guī)和政府規(guī)章,探索大數(shù)據(jù)領(lǐng)域數(shù)據(jù)隱私、商業(yè)秘密等方面的數(shù)據(jù)全生命周期監(jiān)管。三是倡導(dǎo)適應(yīng)于大數(shù)據(jù)發(fā)展的倫理道德體系。建立基于數(shù)據(jù)倫理道德的新公序良俗,倡導(dǎo)“誰(shuí)使用、誰(shuí)負(fù)責(zé)”、公民數(shù)據(jù)權(quán)不容侵犯等適應(yīng)于大數(shù)據(jù)發(fā)展的倫理道德體系,維護(hù)社會(huì)公平正義總體架構(gòu)貴陽(yáng)市政府?dāng)?shù)據(jù)資源開放平臺(tái)的建設(shè)主要依托于政府?dāng)?shù)據(jù)共享交換平臺(tái)進(jìn)行大部分委辦局的數(shù)據(jù)集中采集。然后通過(guò)數(shù)據(jù)加工處理和脫敏脫密進(jìn)入統(tǒng)一政府?dāng)?shù)據(jù)資源開放庫(kù)。沒(méi)有集中的歸集數(shù)據(jù)基于云服務(wù)技術(shù)將分布在各委辦局的數(shù)據(jù)以服務(wù)接口的方式發(fā)布到數(shù)據(jù)開放服務(wù)池。通過(guò)對(duì)數(shù)據(jù)開放庫(kù)中的數(shù)據(jù)和服務(wù)池中數(shù)據(jù)服務(wù)接口進(jìn)行資源的統(tǒng)一編目和分類分級(jí)。數(shù)據(jù)開放管理平臺(tái)通過(guò)一系列的管理與業(yè)務(wù)流程將開放數(shù)據(jù)庫(kù)的數(shù)據(jù)集和數(shù)據(jù)服務(wù)定時(shí)和實(shí)時(shí)發(fā)布到數(shù)據(jù)開放網(wǎng)站上。數(shù)據(jù)開放網(wǎng)站是開放數(shù)據(jù)和服務(wù)的互聯(lián)網(wǎng)統(tǒng)一出口和展現(xiàn)界面。整個(gè)政府?dāng)?shù)據(jù)資源開放平臺(tái)的總體架構(gòu)如下: 平臺(tái)的總體架構(gòu)分為五大層和三大體系。五大層分別是開放數(shù)據(jù)來(lái)源層、數(shù)據(jù)開放庫(kù)層、開放目錄體系層、開放數(shù)據(jù)管理層、數(shù)據(jù)開放網(wǎng)站層。三大體系分別是標(biāo)準(zhǔn)與規(guī)范體系、安全保障體系、運(yùn)維保障體系。1)數(shù)據(jù)來(lái)源層 數(shù)據(jù)來(lái)源層以集中式和分布式相結(jié)合的方式向數(shù)據(jù)開放平臺(tái)提供數(shù)據(jù)和服務(wù)。主要依托貴陽(yáng)市政府?dāng)?shù)據(jù)共享交換平臺(tái)實(shí)現(xiàn)數(shù)據(jù)的采集和融合?;谠品?wù)總線數(shù)據(jù)分布式數(shù)據(jù)服務(wù)的統(tǒng)一集成和管理。2)數(shù)據(jù)開放庫(kù)層 數(shù)據(jù)開放庫(kù)對(duì)政府開放數(shù)據(jù)集的進(jìn)行集成存儲(chǔ)和管理。3)開放目錄體系層 數(shù)據(jù)開放目錄體系層主要實(shí)現(xiàn)開放數(shù)據(jù)和開放服務(wù)的統(tǒng)一編目和分類分級(jí)管理。數(shù)據(jù)開放目錄按照公開數(shù)據(jù)、內(nèi)部數(shù)據(jù)和涉密數(shù)據(jù)進(jìn)行分級(jí)。按照政務(wù)主題、行業(yè)領(lǐng)域、服務(wù)模式分析分類。數(shù)據(jù)資源開放目錄平臺(tái)實(shí)現(xiàn)資源目錄、子目錄。元數(shù)據(jù)目錄的標(biāo)準(zhǔn)化管理。4)數(shù)據(jù)開放管理層數(shù)據(jù)開放管理層控制資源開放的最終形式和流程。主要完成資源數(shù)據(jù)集封裝和服務(wù)API封裝以及發(fā)布流程管理。資源數(shù)據(jù)集封裝要解決資源在線可機(jī)讀性的問(wèn)題。API封裝實(shí)現(xiàn)資源可規(guī)范調(diào)用的問(wèn)題。數(shù)據(jù)開放管理層還保證數(shù)據(jù)開放的所有質(zhì)量和安全問(wèn)題。5)數(shù)據(jù)開放網(wǎng)站層數(shù)據(jù)開放網(wǎng)站部署在互聯(lián)網(wǎng),網(wǎng)站前端包括開放數(shù)據(jù)目錄列表、API接口列表。APP應(yīng)用?;?dòng)交流、信息反饋、搜索引擎、數(shù)據(jù)開放指數(shù)、數(shù)據(jù)關(guān)聯(lián)圖譜等功能。網(wǎng)站后臺(tái)主要實(shí)現(xiàn)網(wǎng)站內(nèi)容和風(fēng)格的管理以及信息反饋和統(tǒng)計(jì)分析。6)標(biāo)準(zhǔn)與規(guī)范體系 主要基于DB52貴陽(yáng)地方政府?dāng)?shù)據(jù)標(biāo)準(zhǔn)規(guī)范結(jié)合數(shù)據(jù)國(guó)家標(biāo)準(zhǔn)GB2007政務(wù)信息資源目錄體系和交換體系來(lái)建設(shè)。7)安全保障體系 安全保障體系包括基礎(chǔ)設(shè)施安全,數(shù)據(jù)庫(kù)安全、平臺(tái)安全和應(yīng)用安全。8)運(yùn)維保障體系 運(yùn)維保障體系主要包括數(shù)據(jù)開放平臺(tái)的日常運(yùn)行維護(hù)管理和監(jiān)控。數(shù)據(jù)架構(gòu)貴陽(yáng)市政府?dāng)?shù)據(jù)資源開放平臺(tái)數(shù)據(jù)的處理架構(gòu),如下圖所示:整個(gè)數(shù)據(jù)處理架構(gòu)分為三條主線,分別是數(shù)據(jù)集開放數(shù)據(jù)處理流程。數(shù)據(jù)接口開放數(shù)據(jù)流程,資源編目數(shù)據(jù)流程圖。數(shù)據(jù)集開放處理架構(gòu)從數(shù)據(jù)采集開始,經(jīng)過(guò)共享交換平臺(tái)歸集進(jìn)入共享交換庫(kù),通過(guò)ETL進(jìn)行數(shù)據(jù)加工,通過(guò)數(shù)據(jù)脫敏系統(tǒng)進(jìn)行數(shù)據(jù)脫敏,通過(guò)自動(dòng)光盤傳導(dǎo)或者網(wǎng)閘設(shè)備將開放數(shù)據(jù)全送到數(shù)據(jù)開放庫(kù)。經(jīng)過(guò)數(shù)據(jù)開放管理平臺(tái)進(jìn)行數(shù)據(jù)集文件封裝。最終在開放網(wǎng)站上形成可機(jī)讀的數(shù)據(jù)文件(excel/xml/cvs/json)。 數(shù)據(jù)服務(wù)處理流程比較復(fù)雜,主要分為三種情況,一種是開放庫(kù)的數(shù)據(jù)經(jīng)過(guò)服務(wù)生成集成到云服務(wù)總線,第二種是委辦局的數(shù)據(jù)通過(guò)服務(wù)生成集成到云服務(wù)總線。第三種是委辦局自己開發(fā)或者已有的數(shù)據(jù)服務(wù)集成到云服務(wù)總線。數(shù)據(jù)開放管理系統(tǒng)基于APIManager進(jìn)行服務(wù)包裝。最終在開放網(wǎng)站形成可在線調(diào)用的API服務(wù)。資源編目數(shù)據(jù)處理流程主要實(shí)現(xiàn)對(duì)數(shù)據(jù)資源和服務(wù)資源的統(tǒng)一分級(jí)分類和編目。資源編目信息包括目錄信息、子目錄信息和元數(shù)據(jù)目錄信息。統(tǒng)一存儲(chǔ)在資源目錄庫(kù)中。開放網(wǎng)站調(diào)用目錄庫(kù)在線展現(xiàn)資源的分類。技術(shù)路線本項(xiàng)目涉及的系統(tǒng)數(shù)量多,業(yè)務(wù)復(fù)雜,將采用面向服務(wù)體系架構(gòu)(SOA),實(shí)現(xiàn)應(yīng)用系統(tǒng)松散耦合,使各應(yīng)用模塊相對(duì)獨(dú)立,在必要時(shí)完全可以獨(dú)立運(yùn)行。應(yīng)用系統(tǒng)與應(yīng)用系統(tǒng)之間、應(yīng)用系統(tǒng)與支撐服務(wù)平臺(tái)之間通過(guò)SOA的方式進(jìn)行集成和整合,可以確保應(yīng)用集成和部署的順利進(jìn)行。開發(fā)技術(shù)本項(xiàng)目應(yīng)用軟件系統(tǒng)可基于JavaEE標(biāo)準(zhǔn)的分布式體系結(jié)構(gòu)設(shè)計(jì),采用B/S三層結(jié)構(gòu),一方面使應(yīng)用系統(tǒng)具有平臺(tái)獨(dú)立性,可以部署在任何符合JavaEE規(guī)范的應(yīng)用服務(wù)器和SOA套件,提高系統(tǒng)的部署靈活性,降低維護(hù)和管理成本,同時(shí)可以充分利用現(xiàn)有的成熟的JavaEE技術(shù)平臺(tái)積累的組件,實(shí)現(xiàn)系統(tǒng)設(shè)計(jì)的靈活性和擴(kuò)展性,保證軟件的質(zhì)量。B/S模式的用戶只需要瀏覽器就可以訪問(wèn)操作應(yīng)用系統(tǒng),使用非常簡(jiǎn)便。瀏覽器帶來(lái)的兼容性比C/S程序的兼容性較強(qiáng),可以減少出現(xiàn)由于用戶環(huán)境差異導(dǎo)致的無(wú)法使用問(wèn)題。并且在系統(tǒng)更新升級(jí)時(shí),只需要更新服務(wù)器端的程序即可,避免向各用戶分發(fā)升級(jí)后的程序。B/S模式服務(wù)器端的可擴(kuò)展性非常好,可以根據(jù)業(yè)務(wù)的拓展,以及業(yè)務(wù)量的增加,隨需而動(dòng)地?cái)U(kuò)展服務(wù)器,提供服務(wù)器的服務(wù)能力,滿足用戶需求。開發(fā)語(yǔ)言和工具本項(xiàng)目應(yīng)用系統(tǒng)軟件的開發(fā)語(yǔ)言以Java為主,開發(fā)工具為eclipse。iOS客戶端開發(fā)語(yǔ)言使用Objective-C和Swift,開發(fā)工具為Xcode。系統(tǒng)前臺(tái)頁(yè)面基于HTML5、JS及JQuery實(shí)現(xiàn)動(dòng)態(tài)刷新。數(shù)據(jù)庫(kù)平臺(tái)本項(xiàng)目系統(tǒng)數(shù)據(jù)庫(kù)采用基于“云上貴州-貴陽(yáng)平臺(tái)”的關(guān)系型數(shù)據(jù)庫(kù),主要采用MySql數(shù)據(jù)庫(kù)。由于應(yīng)用系統(tǒng)中統(tǒng)計(jì)分析功能需要對(duì)大量的數(shù)據(jù)進(jìn)行讀寫操作,因此可采用分布式部署、讀寫分離、負(fù)載均衡、索引、正確選擇引擎等多種措施來(lái)優(yōu)化數(shù)據(jù)庫(kù)性能。對(duì)于非結(jié)構(gòu)化數(shù)據(jù),采用MongeDB作為NoSQL數(shù)據(jù)庫(kù),以滿足對(duì)數(shù)據(jù)庫(kù)高并發(fā)讀寫,海量數(shù)據(jù)的高效率存儲(chǔ)和訪問(wèn),以及數(shù)據(jù)庫(kù)高可用性和高擴(kuò)展性需求。軟件接口本項(xiàng)目系統(tǒng)的數(shù)據(jù)調(diào)用接口采用REST接口技術(shù)。REST模式的Web服務(wù)相比復(fù)雜的SOAP和XML-RPC明顯的更加簡(jiǎn)潔,通過(guò)基于REST的API公開系統(tǒng)資源是一種靈活的方法,可以為不同種類的應(yīng)用程序提供以標(biāo)準(zhǔn)方式格式化的數(shù)據(jù)。它可以幫助滿足集成需求(這對(duì)于構(gòu)建可在其中容易地組合(Mashup)數(shù)據(jù)的系統(tǒng)非常關(guān)鍵),并幫助將基于REST的基本服務(wù)集擴(kuò)展或構(gòu)建為更大的集合。數(shù)據(jù)安全接入本項(xiàng)目系統(tǒng)需要使用包括中考錄取數(shù)據(jù)、高考數(shù)據(jù)等第三方系統(tǒng)數(shù)據(jù),數(shù)據(jù)的安全接入訪問(wèn)非常重要。綜合安全性和成本考慮,數(shù)據(jù)訪問(wèn)安全接入基于云上貴州貴陽(yáng)平臺(tái)采用移動(dòng)端VPDN接入技術(shù)。本期項(xiàng)目建設(shè)方案數(shù)據(jù)處理與標(biāo)準(zhǔn)化(處理、控制、標(biāo)準(zhǔn)化)數(shù)據(jù)質(zhì)量管理是對(duì)支持業(yè)務(wù)需求的數(shù)據(jù)進(jìn)行全面的管理。依據(jù)數(shù)據(jù)在數(shù)據(jù)生命周期的各個(gè)階段的特性,建立數(shù)據(jù)質(zhì)量控制機(jī)制,及時(shí)發(fā)現(xiàn)數(shù)據(jù)質(zhì)量問(wèn)題,不斷改善數(shù)據(jù)的使用質(zhì)量,從而提升數(shù)據(jù)的可用性,實(shí)現(xiàn)數(shù)據(jù)更大的商業(yè)價(jià)值。數(shù)據(jù)質(zhì)量管理的范疇包括:制定全局?jǐn)?shù)據(jù)質(zhì)量的衡量指標(biāo)、分析工具及報(bào)告機(jī)制;發(fā)現(xiàn)、評(píng)估和報(bào)告數(shù)據(jù)在使用中的質(zhì)量問(wèn)題;在數(shù)據(jù)梳理、數(shù)據(jù)對(duì)接、數(shù)據(jù)存儲(chǔ)、管理、使用等數(shù)據(jù)生命周期每一環(huán)節(jié)上定位數(shù)據(jù)質(zhì)量問(wèn)題產(chǎn)生的根源,促進(jìn)建立或?qū)嵤┯嘘P(guān)的工作流程來(lái)解決數(shù)據(jù)質(zhì)量問(wèn)題,保證全局?jǐn)?shù)據(jù)質(zhì)量的不斷改進(jìn)和數(shù)據(jù)可用性的不斷提升。數(shù)據(jù)質(zhì)量評(píng)價(jià)體系數(shù)據(jù)質(zhì)量評(píng)價(jià),是以對(duì)數(shù)據(jù)的準(zhǔn)確定義為基礎(chǔ),對(duì)數(shù)據(jù)質(zhì)量管理的執(zhí)行提供依據(jù),評(píng)議出數(shù)據(jù)質(zhì)量關(guān)鍵性指標(biāo),實(shí)現(xiàn)對(duì)數(shù)據(jù)質(zhì)量的量化診斷和評(píng)價(jià)??陀^評(píng)價(jià)在質(zhì)量管理系統(tǒng)中,建立以以下6個(gè)方面指標(biāo)的評(píng)估為主的數(shù)據(jù)質(zhì)量評(píng)估模型:數(shù)據(jù)規(guī)范性數(shù)據(jù)規(guī)范維度的評(píng)估是評(píng)估是否有收集數(shù)據(jù)、錄入數(shù)據(jù)等的強(qiáng)制性標(biāo)準(zhǔn)或統(tǒng)一規(guī)范。例如國(guó)家部委、行業(yè)、省、市等各級(jí)標(biāo)準(zhǔn)或者規(guī)范等。數(shù)據(jù)規(guī)范和標(biāo)準(zhǔn)化體系為比較數(shù)據(jù)質(zhì)量評(píng)估結(jié)果提供標(biāo)準(zhǔn),并為數(shù)據(jù)錄入等提供操作指導(dǎo),也是數(shù)據(jù)綜合治理工作的基礎(chǔ)。數(shù)據(jù)規(guī)范測(cè)量數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)模型、業(yè)務(wù)規(guī)劃、原數(shù)據(jù)和參考數(shù)據(jù)的存在性、完整性、質(zhì)量和文檔資料。數(shù)據(jù)完整性數(shù)據(jù)完整性指數(shù)據(jù)集合中既不缺少應(yīng)有的數(shù)據(jù),也沒(méi)有多余的數(shù)據(jù)。數(shù)據(jù)是否有缺失,數(shù)據(jù)覆蓋的寬度和廣度是否足夠。數(shù)據(jù)完整性包括數(shù)據(jù)缺失程度和數(shù)據(jù)覆蓋程度2個(gè)因子。數(shù)據(jù)缺失程度:指數(shù)據(jù)傳輸轉(zhuǎn)移過(guò)程中是否出現(xiàn)遺失,遺失的程度如何。數(shù)據(jù)覆蓋程度:指線上已有數(shù)據(jù)占應(yīng)捕獲數(shù)據(jù)總體的比例,反映數(shù)據(jù)的全面性、可用性的測(cè)量標(biāo)準(zhǔn)。數(shù)據(jù)準(zhǔn)確性數(shù)據(jù)準(zhǔn)確性是數(shù)據(jù)質(zhì)量的基本也是最重要的屬性,包含3個(gè)因子。分別是:數(shù)據(jù)錯(cuò)誤率、數(shù)據(jù)可靠度和數(shù)據(jù)標(biāo)準(zhǔn)符合度。數(shù)據(jù)錯(cuò)誤率:不滿足給定數(shù)據(jù)集合法值的域的比率。數(shù)據(jù)錯(cuò)誤是指數(shù)據(jù)記錄字段的值與實(shí)際的值不相符。數(shù)據(jù)的可靠度:基礎(chǔ)數(shù)據(jù)來(lái)源的可靠程度。數(shù)據(jù)標(biāo)準(zhǔn)的符合度:基礎(chǔ)數(shù)據(jù)對(duì)于應(yīng)用不同行業(yè)標(biāo)準(zhǔn)和業(yè)務(wù)規(guī)則的符合程度。數(shù)據(jù)唯一性數(shù)據(jù)唯一性是對(duì)存在于部門數(shù)據(jù)內(nèi)或跨部門數(shù)據(jù)的特定字段、記錄或數(shù)據(jù)集重復(fù)的測(cè)量標(biāo)準(zhǔn)。數(shù)據(jù)及時(shí)性和可用性及時(shí)性和有效性是數(shù)據(jù)在預(yù)期時(shí)段內(nèi)對(duì)特定應(yīng)用的及時(shí)程度和可用程度的測(cè)量標(biāo)準(zhǔn)。數(shù)據(jù)值隨時(shí)間而不斷變化,并且真實(shí)目標(biāo)發(fā)生變化的時(shí)間與數(shù)據(jù)庫(kù)中表示它的數(shù)據(jù)更新以及使其對(duì)應(yīng)用可用的時(shí)間總有一個(gè)落差??赡艽嬖谌斯鬟f時(shí)間延遲(從事實(shí)被人所知到首次被輸入到系統(tǒng)之間的時(shí)間延遲)和系統(tǒng)數(shù)據(jù)傳遞時(shí)間延遲(從事實(shí)被系統(tǒng)捕獲后到使用者能夠?qū)ζ溥m用所花費(fèi)的時(shí)間延遲)。數(shù)據(jù)易用性易用性是指數(shù)據(jù)能夠被訪問(wèn)和使用的程度以及易于被更新、維護(hù)和管理的程度的測(cè)量標(biāo)準(zhǔn)。在數(shù)據(jù)使用過(guò)程中,數(shù)據(jù)的易用性和可維護(hù)性決定了完成目標(biāo)的效率。數(shù)據(jù)庫(kù)中的數(shù)據(jù)可以使用,并不等于能夠毫不費(fèi)力地使用它們。建立起數(shù)據(jù)質(zhì)量評(píng)價(jià)體系后,各企業(yè)即可根據(jù)指標(biāo)體系,確立其質(zhì)量特性及相應(yīng)的權(quán)重值,分階段分模塊評(píng)價(jià)系統(tǒng)數(shù)據(jù)質(zhì)量水平,為進(jìn)一步改進(jìn)提供方向。主觀評(píng)價(jià)建立以用戶評(píng)價(jià)為數(shù)據(jù)質(zhì)量評(píng)價(jià)標(biāo)準(zhǔn)的主觀評(píng)價(jià)體系,所有共享數(shù)據(jù)的用戶均可以對(duì)所用數(shù)據(jù)在規(guī)范性、完整性、準(zhǔn)確性、及時(shí)性和可用性、易用性6各方面進(jìn)行打分和評(píng)價(jià)。客觀和主觀評(píng)價(jià)兩個(gè)體系共同配合,形成數(shù)據(jù)質(zhì)量的完整評(píng)價(jià)。規(guī)則管理數(shù)據(jù)質(zhì)量檢查工作需要依據(jù)業(yè)務(wù)規(guī)則對(duì)數(shù)據(jù)源中的數(shù)據(jù)進(jìn)行檢查,所以規(guī)則管理模塊包括兩部分關(guān)鍵功能:采集點(diǎn)管理及規(guī)則庫(kù)管理。釆集點(diǎn)管理主要是負(fù)責(zé)采樣邏輯的定義。規(guī)則用于描述數(shù)據(jù)在業(yè)務(wù)上的約束條件。規(guī)則可以按照不同數(shù)據(jù)源建立,在數(shù)據(jù)處理時(shí),規(guī)則引擎會(huì)讀取相應(yīng)的規(guī)則信息進(jìn)行執(zhí)行。對(duì)于數(shù)據(jù)質(zhì)量管理來(lái)說(shuō),規(guī)則可以參照質(zhì)量質(zhì)量評(píng)價(jià)體系中的客觀評(píng)價(jià)標(biāo)準(zhǔn)進(jìn)行建立。規(guī)則分為三類:約束規(guī)則、計(jì)算規(guī)則和條件規(guī)則。約束規(guī)則約束規(guī)則描述了一種無(wú)條件必須為真或者假的強(qiáng)制規(guī)則。這種約束可以是結(jié)構(gòu)化的約束,也可以是行為的約束。結(jié)構(gòu)化的約束當(dāng)創(chuàng)建術(shù)語(yǔ)或者改變術(shù)語(yǔ)之間的關(guān)系的時(shí)候,結(jié)構(gòu)化的約束能夠保證術(shù)語(yǔ)的完整性;行為的約束典型地被定義為“前置條件”和“后置條件”。只有符合“前置條件”的情況下操作才能夠正確地執(zhí)行;“后置條件”保證了操作結(jié)果的正確性,“后置條件”表示該行為是否滿足了其預(yù)期的結(jié)果。計(jì)算規(guī)則計(jì)算規(guī)則用以反映一種計(jì)算的關(guān)系;條件規(guī)則條件規(guī)則反映當(dāng)一定條件成立時(shí),觸發(fā)相關(guān)的事件或事務(wù)。規(guī)則管理功能主要包括規(guī)則分類、新增規(guī)則、編輯、刪除和查看等功能。其中,規(guī)則分類是對(duì)規(guī)則從常見(jiàn)的數(shù)據(jù)質(zhì)量問(wèn)題的角度進(jìn)行分類,提供規(guī)則分類的增刪改列表功能。新增規(guī)則是應(yīng)指定規(guī)則包含的采集點(diǎn)信息,為校核程序提供需要的采集數(shù)據(jù)。系統(tǒng)還提供基本規(guī)則管理和規(guī)則包管理功能,方便規(guī)則管理和問(wèn)題處理。度量信息管理度量信息是數(shù)據(jù)質(zhì)量檢查的基本依據(jù),它反映了數(shù)據(jù)質(zhì)量的衡量標(biāo)準(zhǔn),也是數(shù)據(jù)質(zhì)量管理系統(tǒng)的一個(gè)重要組成部分。度量信息是經(jīng)驗(yàn)的積累,需要在數(shù)據(jù)質(zhì)量不斷的建設(shè)過(guò)程中逐步精確化,隨著衡量標(biāo)準(zhǔn)的不斷細(xì)化和精確,數(shù)據(jù)質(zhì)量也會(huì)不斷提高。數(shù)據(jù)稽核管理數(shù)據(jù)稽核主要是通過(guò)計(jì)劃或手動(dòng)的方式對(duì)采集的數(shù)據(jù)做規(guī)則校驗(yàn),對(duì)符合規(guī)則的問(wèn)題數(shù)據(jù)進(jìn)行記錄。每次數(shù)據(jù)稽核應(yīng)記錄檢查的執(zhí)行情況,形成校核記錄。數(shù)據(jù)稽核需要記錄錯(cuò)誤率變化趨勢(shì),以便用戶了解數(shù)據(jù)質(zhì)量的提升情況。數(shù)據(jù)稽核管理包括執(zhí)行計(jì)劃管理、手動(dòng)執(zhí)行檢查和規(guī)則執(zhí)行狀態(tài)、問(wèn)題數(shù)據(jù)統(tǒng)計(jì)、數(shù)據(jù)質(zhì)量分析、數(shù)據(jù)質(zhì)量報(bào)告等功能。執(zhí)行計(jì)劃管理通過(guò)對(duì)規(guī)則相關(guān)的校核程序制訂周期性自動(dòng)運(yùn)行的執(zhí)行計(jì)劃,可以簡(jiǎn)化數(shù)據(jù)稽核過(guò)程,形成定期的數(shù)據(jù)質(zhì)量檢查,以實(shí)現(xiàn)有計(jì)劃的逐步改善源數(shù)據(jù)質(zhì)量的目標(biāo)。如果規(guī)則檢查的數(shù)據(jù)集是按時(shí)間段進(jìn)行檢查的,在制訂執(zhí)行計(jì)劃時(shí)應(yīng)避免數(shù)據(jù)集之間的數(shù)據(jù)重疊,即對(duì)同一個(gè)數(shù)據(jù)稽核對(duì)象制訂多個(gè)在同一時(shí)期運(yùn)行的計(jì)劃。手動(dòng)執(zhí)行檢查為滿足非周期性的數(shù)據(jù)稽核需求,系統(tǒng)應(yīng)能依據(jù)指定的規(guī)則對(duì)采集數(shù)據(jù)進(jìn)行即時(shí)的數(shù)據(jù)稽核。規(guī)則執(zhí)行狀態(tài)無(wú)論是手動(dòng)執(zhí)行數(shù)據(jù)稽核還是按計(jì)劃周期性的執(zhí)行數(shù)據(jù)稽核,每次數(shù)據(jù)稽核都會(huì)有一個(gè)校核記錄用于記錄數(shù)據(jù)稽核程序的執(zhí)行情況。問(wèn)題數(shù)據(jù)統(tǒng)計(jì)數(shù)據(jù)檢査可能產(chǎn)生問(wèn)題數(shù)據(jù),作為數(shù)據(jù)質(zhì)量管理人員關(guān)注每次數(shù)據(jù)稽核的數(shù)據(jù)錯(cuò)誤情況。數(shù)據(jù)質(zhì)量問(wèn)題可以通過(guò)一些指標(biāo)(如錯(cuò)誤率)來(lái)衡量。錯(cuò)誤率=一次檢查發(fā)現(xiàn)的問(wèn)題數(shù)據(jù)條數(shù)/一次檢查的總數(shù)據(jù)條數(shù)x100%數(shù)據(jù)質(zhì)量分析數(shù)據(jù)質(zhì)量分析是對(duì)不同業(yè)務(wù)域下的錯(cuò)誤數(shù)據(jù),完成率的一個(gè)綜合統(tǒng)計(jì),可用來(lái)部門排序、跨業(yè)務(wù)域排名、跨部門排名,從而形成有統(tǒng)籌觀念上的數(shù)據(jù)質(zhì)量分析報(bào)告。數(shù)據(jù)質(zhì)量報(bào)告數(shù)據(jù)質(zhì)量報(bào)告是對(duì)考核規(guī)則和非考核規(guī)則按地市局統(tǒng)計(jì)分析各規(guī)則對(duì)應(yīng)的數(shù)據(jù)總數(shù)、錯(cuò)誤總數(shù)、正確數(shù)的統(tǒng)計(jì)報(bào)告,從而形成有可靠的數(shù)據(jù)依據(jù)的數(shù)據(jù)質(zhì)量報(bào)告。問(wèn)題管理問(wèn)題管理是對(duì)數(shù)據(jù)質(zhì)量相關(guān)問(wèn)題進(jìn)行有效處理的功能,在發(fā)現(xiàn)問(wèn)題、處理問(wèn)題的過(guò)程中,可以通過(guò)問(wèn)題報(bào)告的形式登記問(wèn)題、指派處理人員,并提交問(wèn)題處理情況,體現(xiàn)流程化的管理。問(wèn)題處理環(huán)節(jié)主要涉及到兩個(gè)用戶角色:數(shù)據(jù)質(zhì)量管理人員、問(wèn)題數(shù)據(jù)處理人員。數(shù)據(jù)稽核產(chǎn)生的問(wèn)題數(shù)據(jù)將由系統(tǒng)發(fā)送給規(guī)則定義時(shí)指定的數(shù)據(jù)質(zhì)量管理人員。接收到問(wèn)題數(shù)據(jù)的管理人員可以將問(wèn)題數(shù)據(jù)即層層往下派送至問(wèn)題數(shù)據(jù)的具體處理人員處理。具體問(wèn)題處理流程如下圖所示:圖STYLEREF1\s5SEQ圖\*ARABIC\s12問(wèn)題處理流程問(wèn)題發(fā)現(xiàn)數(shù)據(jù)質(zhì)量的問(wèn)題可以來(lái)自兩種情況,第一種是人工報(bào)告發(fā)現(xiàn)的問(wèn)題,第二種是通過(guò)數(shù)據(jù)稽核等其他輔助手段發(fā)現(xiàn)的各類數(shù)據(jù)質(zhì)量問(wèn)題。人工報(bào)告發(fā)現(xiàn)的問(wèn)題,由問(wèn)題的發(fā)現(xiàn)人負(fù)責(zé)將問(wèn)題的名稱、描述、類型等關(guān)鍵因素錄入到問(wèn)題管理模塊中進(jìn)行問(wèn)題觸發(fā)與發(fā)現(xiàn)。通過(guò)在告警等環(huán)節(jié)設(shè)置問(wèn)題發(fā)現(xiàn)程序,預(yù)先設(shè)定一定的事件觸發(fā)條件和規(guī)則,發(fā)現(xiàn)程序一旦偵測(cè)到數(shù)據(jù)存在的異常并符合問(wèn)題的觸發(fā)條件,則產(chǎn)生一個(gè)數(shù)據(jù)質(zhì)量問(wèn)題。無(wú)論是人工報(bào)告的問(wèn)題,還是監(jiān)視程序自動(dòng)捕獲的問(wèn)題,都通過(guò)系統(tǒng)將該問(wèn)題事件發(fā)送到問(wèn)題列表,等待管理人員進(jìn)行下一步處理。問(wèn)題發(fā)布由數(shù)據(jù)質(zhì)量管理人員進(jìn)行對(duì)問(wèn)題的確認(rèn)和核實(shí),并將其發(fā)布至與該問(wèn)題相關(guān)人員。問(wèn)題處理與跟蹤在某一問(wèn)題由該問(wèn)題的負(fù)責(zé)人員進(jìn)行初步的處理后,將處理意見(jiàn)、時(shí)間、期望的改正結(jié)論等相關(guān)內(nèi)容,錄入系統(tǒng),在不同的問(wèn)題處理階段需對(duì)該問(wèn)題的處理狀態(tài)進(jìn)行更新。對(duì)該問(wèn)題已授權(quán)的用戶可以查詢到問(wèn)題的處理意見(jiàn)和處理步驟,及當(dāng)前最新的處理狀態(tài)。問(wèn)題解決問(wèn)題的負(fù)責(zé)人可以隨時(shí)關(guān)閉問(wèn)題,關(guān)閉問(wèn)題時(shí)需填寫問(wèn)題總結(jié)報(bào)告。問(wèn)題關(guān)閉后,就進(jìn)入只讀狀態(tài),不能再進(jìn)行任何反饋或者回復(fù)操作。通過(guò)建立起數(shù)據(jù)質(zhì)量管理子系統(tǒng),實(shí)現(xiàn)了平臺(tái)數(shù)據(jù)質(zhì)量的處理閉環(huán),有效促進(jìn)了開發(fā)信息資源的數(shù)據(jù)質(zhì)量不斷提升。數(shù)據(jù)安全管理建立數(shù)據(jù)安全分級(jí)和授權(quán)機(jī)制,對(duì)數(shù)據(jù)按其敏感性、重要性建立一套完整的數(shù)據(jù)安全分級(jí)標(biāo)準(zhǔn)。并基于數(shù)據(jù)安全分級(jí)標(biāo)準(zhǔn)和數(shù)據(jù)使用者的工作職責(zé)及權(quán)限制定相關(guān)的數(shù)據(jù)使用授權(quán)流程。以保證業(yè)務(wù)數(shù)據(jù)使用的安全性和合規(guī)性。數(shù)據(jù)安全管理包括數(shù)據(jù)安全分級(jí)和授權(quán)機(jī)制。(1)數(shù)據(jù)安全分級(jí)數(shù)據(jù)安全分級(jí)標(biāo)準(zhǔn)采用四個(gè)安全等級(jí):絕密、機(jī)密、內(nèi)部、公開四個(gè)級(jí)別。表4-1數(shù)據(jù)安全級(jí)別表密級(jí)定義示例授權(quán)訪問(wèn)范圍絕密關(guān)系國(guó)家安全或者包含商業(yè)機(jī)密等需要嚴(yán)格控制和保護(hù)的信息。要求保證高度機(jī)密性、準(zhǔn)確性、完整性、可靠性和可用性。涉及國(guó)家安全的機(jī)密信息;的戰(zhàn)略規(guī)劃、未公開的購(gòu)并信息、財(cái)務(wù)預(yù)測(cè)信息。高級(jí)管理層機(jī)密涉及運(yùn)作的關(guān)鍵信息,在內(nèi)部特定范圍內(nèi)限制訪問(wèn)的信息。要求保證機(jī)密性、準(zhǔn)確性、完整性、可靠性和可用性。產(chǎn)品和系統(tǒng)源代碼和開發(fā)文檔、市場(chǎng)戰(zhàn)略、審計(jì)報(bào)告、競(jìng)爭(zhēng)優(yōu)勢(shì)分析等;未上報(bào)或者未公開的監(jiān)管數(shù)據(jù)和審計(jì)報(bào)告。內(nèi)部特定部門的特定崗位內(nèi)部可以在內(nèi)部共享的信息,但是不能對(duì)公眾開放的數(shù)據(jù)和信息,與第三方需要使用保密協(xié)議進(jìn)行保護(hù)的信息。要求保證完整性、準(zhǔn)確性、可靠性、可用性。業(yè)務(wù)操作流程、內(nèi)部策略、會(huì)議備忘錄、內(nèi)部通訊錄等。全部或者部分員工公開經(jīng)過(guò)審核可以通過(guò)信息發(fā)布渠道向外公開的數(shù)據(jù)和信息。某些情況下需要保證完整性和準(zhǔn)確性。網(wǎng)站發(fā)布的信息、公開報(bào)告。公眾(2)數(shù)據(jù)訪問(wèn)授權(quán)定義用戶所屬的角色或者功能,明確各類用戶能夠訪問(wèn)的數(shù)據(jù)范圍,并按照角色或功能指定可以訪問(wèn)的數(shù)據(jù)對(duì)象。數(shù)據(jù)訪問(wèn)授權(quán)一般應(yīng)該遵循以下原則:僅限于經(jīng)過(guò)有關(guān)管理層審批的數(shù)據(jù)用戶可以訪問(wèn)和使用數(shù)據(jù);按照業(yè)務(wù)需求,允許數(shù)據(jù)用戶以特定的方式訪問(wèn),并賦予能夠滿足業(yè)務(wù)需求的最小操作權(quán)限;在數(shù)據(jù)的訪問(wèn)或使用過(guò)程中,數(shù)據(jù)用戶必須嚴(yán)格遵守各項(xiàng)安全控制措施。數(shù)據(jù)評(píng)估管理1、數(shù)據(jù)價(jià)值評(píng)估對(duì)數(shù)據(jù)價(jià)值成本進(jìn)行評(píng)估,對(duì)數(shù)據(jù)存儲(chǔ)、處理、應(yīng)用進(jìn)行優(yōu)化。2、數(shù)據(jù)重要性評(píng)估從表的在數(shù)據(jù)使用過(guò)程中和數(shù)據(jù)應(yīng)用中對(duì)表的重要性進(jìn)行評(píng)估,輸出表重要性級(jí)別。3、存儲(chǔ)周期評(píng)估包括存儲(chǔ)規(guī)則的配置和數(shù)據(jù)實(shí)際的存儲(chǔ)情況進(jìn)行評(píng)估對(duì)比。存儲(chǔ)周期的計(jì)算,計(jì)算表到期時(shí)間。如果到期了,則這個(gè)表可以進(jìn)行刪除或轉(zhuǎn)儲(chǔ)。4、時(shí)效性評(píng)估通過(guò)對(duì)數(shù)據(jù)關(guān)系的分析,發(fā)現(xiàn)孤立表或無(wú)效表。根據(jù)表名判斷此表大約含義,建表日期、狀態(tài)日期,表內(nèi)數(shù)據(jù)時(shí)間等判斷此表最后更新時(shí)間。通過(guò)數(shù)據(jù)的使用日志,對(duì)孤立表和無(wú)效表進(jìn)行判斷是否有使用如果滿足以上3點(diǎn),就可以判斷此表無(wú)使用和處理.就可以進(jìn)行下線處理。5、冗余數(shù)據(jù)評(píng)估系統(tǒng)中存在著大量的冗余的數(shù)據(jù)。比如從清單上的進(jìn)行匯總的表就非常多,這些匯總表中有些存在相識(shí)性,這就造成了大量的冗余數(shù)據(jù),這些大量的冗余數(shù)據(jù),一方面給數(shù)據(jù)的精確性和可靠性將帶來(lái)影響,同時(shí)也影響著數(shù)據(jù)庫(kù)的性能。6、數(shù)據(jù)關(guān)系評(píng)估數(shù)據(jù)關(guān)系的類別可以分為以下幾種:主外鍵關(guān)系:由上線時(shí)進(jìn)行登記。參考關(guān)系:主要描述實(shí)體表與維度表的關(guān)系。輸入與輸出:通過(guò)元數(shù)據(jù)解析建立。歷史拍照:通過(guò)處理程序解析發(fā)現(xiàn)建立。冗余備份:從目的可以劃分為:分工提速、轉(zhuǎn)儲(chǔ)優(yōu)化、應(yīng)用分流、數(shù)據(jù)統(tǒng)計(jì)臨時(shí)備份。系統(tǒng)根據(jù)以上的關(guān)系類別,通過(guò)相識(shí)表的發(fā)現(xiàn)分析,自動(dòng)建立數(shù)據(jù)之間的關(guān)系。開放數(shù)據(jù)庫(kù)建設(shè)(集中式、分布式)概述開放數(shù)據(jù)庫(kù)采用分布式和集中式兩種方式并存的設(shè)計(jì)方案。分布式開放主要是實(shí)現(xiàn)職能部門一部分?jǐn)?shù)據(jù)庫(kù)數(shù)據(jù)通過(guò)服務(wù)生成器直接生成服務(wù),通過(guò)服務(wù)總線進(jìn)行集中管理,加上直接提供數(shù)據(jù)開放接口的數(shù)據(jù),由服務(wù)目錄進(jìn)行統(tǒng)一編目,實(shí)現(xiàn)數(shù)據(jù)服務(wù)開放;集中式開放是職能部門的數(shù)據(jù)通過(guò)市共享交換平臺(tái)進(jìn)入共享數(shù)據(jù)庫(kù),再經(jīng)過(guò)分析處理、脫敏脫密等技術(shù)手段進(jìn)行數(shù)據(jù)開放庫(kù),由服務(wù)生成器生成服務(wù)或者數(shù)據(jù)文件的形式,通過(guò)開放目錄系統(tǒng)統(tǒng)一管理,實(shí)現(xiàn)數(shù)據(jù)開放。開放數(shù)據(jù)庫(kù)建設(shè)流程如下圖:開放數(shù)據(jù)庫(kù)建設(shè)流程圖數(shù)據(jù)開放庫(kù)建設(shè)數(shù)據(jù)開放庫(kù)采用統(tǒng)一數(shù)據(jù)庫(kù)的模式進(jìn)行集中建設(shè),即在貴陽(yáng)市共享交換平臺(tái)數(shù)據(jù)共享庫(kù)的基礎(chǔ)上通過(guò)分析處理和脫敏脫密等數(shù)據(jù)處理技術(shù)手段建設(shè)數(shù)據(jù)開放庫(kù)。數(shù)據(jù)開放庫(kù)采用分層設(shè)計(jì),包括數(shù)據(jù)緩沖區(qū)、數(shù)據(jù)貼源區(qū)和數(shù)據(jù)整合區(qū)。數(shù)據(jù)緩沖區(qū)臨時(shí)存儲(chǔ)各數(shù)據(jù)來(lái)源的數(shù)據(jù),主要起數(shù)據(jù)出錯(cuò)時(shí)追根溯源作用;數(shù)據(jù)貼源區(qū)對(duì)緩沖區(qū)的數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,如統(tǒng)一編碼格式;數(shù)據(jù)整合區(qū)存儲(chǔ)清洗后的開放數(shù)據(jù)。數(shù)據(jù)建模維度建模維度建模是一種邏輯設(shè)計(jì)技術(shù),該技術(shù)試圖采用某種直觀的標(biāo)準(zhǔn)框架結(jié)構(gòu)來(lái)表現(xiàn)數(shù)據(jù),并且允許進(jìn)行高性能存取,它會(huì)遵循維度方面的規(guī)范,并且堅(jiān)持帶有某些重要限制條件的關(guān)系模型規(guī)范。每個(gè)維度模型都由具有復(fù)合鍵的事實(shí)表和維度表構(gòu)成。事實(shí)表維度模型的基本表,存放有大量的業(yè)務(wù)性能度量值。所有事實(shí)表有兩個(gè)或者兩個(gè)以上的外關(guān)鍵字,外關(guān)鍵用于連接到維度表的主關(guān)鍵字。事實(shí)表要通過(guò)與之相連的維度表進(jìn)行存取。事實(shí)表本身通常也有由外關(guān)鍵字子集組成的自己的主關(guān)鍵字。維度表維度表是事實(shí)表不可分割的過(guò)濾條件和描述角度。在一個(gè)設(shè)計(jì)合理的維度模型中,維度表有許多列或者屬性,這些屬性給出對(duì)維度表的行所進(jìn)行的描述。每個(gè)維度用單一的主關(guān)鍵字進(jìn)行定義,主關(guān)鍵字是確保同與之相連的任何事實(shí)表之間存在引用完整性的基礎(chǔ)。維度屬性是查詢約束條件,成組與報(bào)表標(biāo)簽生成的基本來(lái)源。模式結(jié)構(gòu)本項(xiàng)目選擇的維度建模工具包括星型結(jié)構(gòu)和雪花結(jié)構(gòu)。星型結(jié)構(gòu)開放數(shù)據(jù)庫(kù)主要提供的是查詢操作,星型結(jié)構(gòu)是最便于執(zhí)行查詢操作的邏輯模型。如下圖所示,星型結(jié)構(gòu)由一個(gè)事實(shí)表和多個(gè)維表組成,事實(shí)表包含了基礎(chǔ)的和匯總的業(yè)務(wù)事實(shí),描述了主題的數(shù)據(jù),與之相連的維表,用于限制用度的查詢結(jié)果,將數(shù)據(jù)過(guò)濾,縮小訪問(wèn)范圍。針對(duì)貴陽(yáng)市復(fù)雜的基礎(chǔ)資源數(shù)據(jù),應(yīng)用星型模式可以體現(xiàn)以下優(yōu)勢(shì):1、結(jié)構(gòu)更簡(jiǎn)單、查詢效率更高,更適合數(shù)據(jù)的抽取、轉(zhuǎn)換和加載,使性能達(dá)到最大化。2、更適合數(shù)據(jù)源的不斷擴(kuò)展情況。針對(duì)緩慢變化維問(wèn)題,我們采用添加維度行的方式來(lái)處理。這樣處理,需要代理鍵的支持。實(shí)現(xiàn)方式是當(dāng)有維度屬性發(fā)生變化時(shí),生成一條新的維度記錄,主鍵是新分配的代理鍵,通過(guò)自然鍵可以和原維度記錄保持關(guān)聯(lián)。這種方式擴(kuò)展性更高,并且可以通過(guò)時(shí)間版本來(lái)查歷史維度信息。雪花型結(jié)構(gòu)雪花型結(jié)構(gòu)是對(duì)星型結(jié)構(gòu)的擴(kuò)展,是對(duì)星型的維表進(jìn)一步標(biāo)準(zhǔn)化,它的優(yōu)點(diǎn)是通過(guò)最大限度地減少數(shù)據(jù)存儲(chǔ)量以及把較小的標(biāo)準(zhǔn)化表聯(lián)合在一起,來(lái)改善性能,如下圖所示。開放庫(kù)設(shè)計(jì)以上各數(shù)據(jù)源進(jìn)入到大數(shù)據(jù)庫(kù),其中結(jié)構(gòu)化數(shù)據(jù)將進(jìn)入數(shù)據(jù)緩沖區(qū),非結(jié)構(gòu)化數(shù)據(jù)進(jìn)入非結(jié)構(gòu)化數(shù)據(jù)庫(kù)。下面對(duì)大數(shù)據(jù)庫(kù)層次結(jié)構(gòu)進(jìn)行介紹:數(shù)據(jù)緩沖區(qū):存儲(chǔ)源數(shù)據(jù),只保留一個(gè)月數(shù)據(jù),防止上層數(shù)據(jù)計(jì)算錯(cuò)誤時(shí)進(jìn)行恢復(fù)的數(shù)據(jù)來(lái)源;貼源區(qū):基于緩沖區(qū)數(shù)據(jù)進(jìn)行基礎(chǔ)處理,包括拉鏈數(shù)據(jù)生成、數(shù)據(jù)編碼格式統(tǒng)一等,用于生成歷史數(shù)據(jù)和對(duì)外共享。開放庫(kù):基于共享數(shù)據(jù)庫(kù)數(shù)據(jù)進(jìn)行清洗比對(duì)、匯總、關(guān)聯(lián)、融合加工,形成開放數(shù)據(jù)庫(kù)。為了有效支撐業(yè)務(wù)系統(tǒng),實(shí)現(xiàn)系統(tǒng)間的數(shù)據(jù)共享、數(shù)據(jù)交換、數(shù)據(jù)分析,為業(yè)務(wù)系統(tǒng)提供數(shù)據(jù)共享交換、大數(shù)據(jù)訪問(wèn)、主題分析、大數(shù)據(jù)應(yīng)用等能力。數(shù)據(jù)緩沖區(qū)緩沖區(qū)是開放數(shù)據(jù)庫(kù)的數(shù)據(jù)入口,存儲(chǔ)的是從共享數(shù)據(jù)庫(kù)抽取過(guò)來(lái)的數(shù)據(jù)。其作用主要有兩個(gè):一、作為數(shù)據(jù)中轉(zhuǎn)樞紐;二、防止后端數(shù)據(jù)處理出錯(cuò)時(shí),再次執(zhí)行出錯(cuò),并可追根溯源。緩沖區(qū)主要保存外圍系統(tǒng)的原始數(shù)據(jù),不做任何處理。數(shù)據(jù)主要提供給業(yè)務(wù)數(shù)據(jù)庫(kù)使用,時(shí)間保留一個(gè)月的時(shí)間,并將原始數(shù)據(jù)刪除,以節(jié)省存儲(chǔ)空間。數(shù)據(jù)緩沖區(qū)存儲(chǔ)在Oracle數(shù)據(jù)庫(kù)。數(shù)據(jù)來(lái)源緩沖區(qū)作為開放數(shù)據(jù)庫(kù)的數(shù)據(jù)入口,也是開放數(shù)據(jù)庫(kù)的底層,主要承擔(dān)著數(shù)據(jù)底層數(shù)據(jù)樞紐的作用。緩沖區(qū)的數(shù)據(jù)來(lái)源于數(shù)據(jù)共享與交換平臺(tái)。數(shù)據(jù)按照實(shí)際需求的時(shí)間力度從數(shù)據(jù)共享與交換平臺(tái)獲取,數(shù)據(jù)以時(shí)間戳的方式進(jìn)行更新,每天按照增量的方式抽?。ㄒ髮?duì)方的數(shù)據(jù)必須以時(shí)間戳的方式進(jìn)行提供),每個(gè)月進(jìn)行全量更新一次,每月全量更新就是為了防止增量過(guò)程中數(shù)據(jù)遺漏等出現(xiàn)的問(wèn)題,每月全量更新可以保證將問(wèn)題的時(shí)間窗縮減到一個(gè)月之內(nèi)。數(shù)據(jù)存儲(chǔ)緩沖區(qū)存儲(chǔ)在Oracle數(shù)據(jù)庫(kù)上,作為數(shù)據(jù)中轉(zhuǎn)樞紐,對(duì)存儲(chǔ)的數(shù)據(jù)不做任何修改,保持原汁原味,跟源系統(tǒng)的數(shù)據(jù)模型一致。一方面保障對(duì)后端提供數(shù)據(jù)的及時(shí)性,另一方面可以對(duì)后端出現(xiàn)問(wèn)題追根溯源。緩沖區(qū)是開放數(shù)據(jù)庫(kù)的最原始的數(shù)據(jù),數(shù)據(jù)需要定時(shí)備份。按照設(shè)計(jì),緩沖區(qū)數(shù)據(jù)只存儲(chǔ)一個(gè)月,一個(gè)月后通過(guò)ETL定時(shí)轉(zhuǎn)存功能,其后刪除原始的數(shù)據(jù),以減少緩沖區(qū)的存儲(chǔ)空間。數(shù)據(jù)初始化建庫(kù)完成后,利用ETL工具,將存量的結(jié)構(gòu)化數(shù)據(jù)一次性依次導(dǎo)入到數(shù)據(jù)緩沖區(qū)。數(shù)據(jù)抽取的要點(diǎn):抽取方法:通過(guò)ETL工具抽取;抽取方式:全量抽取;抽取頻率:一次;增量數(shù)據(jù)入庫(kù)抽取源數(shù)據(jù)中每天增加的數(shù)據(jù),將新增的數(shù)據(jù)導(dǎo)入到數(shù)據(jù)緩沖區(qū),增量數(shù)據(jù)數(shù)據(jù)量較少,需要配置調(diào)度策略來(lái)定時(shí)執(zhí)行。數(shù)據(jù)抽取的要點(diǎn):抽取方法:通過(guò)ETL工具抽??;抽取方式:增量抽??;抽取頻率:每天一次(視實(shí)際數(shù)據(jù)更新情況);數(shù)據(jù)貼源區(qū)由于開放數(shù)據(jù)庫(kù)的數(shù)據(jù)源數(shù)據(jù)的更新頻率各不相同,即使將這種來(lái)源廣泛的數(shù)據(jù)從源庫(kù)抽取到開放數(shù)據(jù)庫(kù)中,也不是一件易事。增加ODS層(貼源區(qū)),可以最快速最小化轉(zhuǎn)換方式將源頭的數(shù)據(jù)抽取到開放數(shù)據(jù)庫(kù)中,將這些數(shù)據(jù)按原有的結(jié)構(gòu)和屬性,以一定的歷史周期保存起來(lái),并做一些簡(jiǎn)單的數(shù)據(jù)處理,增加裝載時(shí)間、更新時(shí)間的“拉鏈”信息、統(tǒng)一編碼格式等。它還需要使用增量更新的方式保留一份最新的業(yè)務(wù)數(shù)據(jù),以保持與源系統(tǒng)數(shù)據(jù)保持同步。數(shù)據(jù)存儲(chǔ)數(shù)據(jù)到貼源區(qū)后,基本將按原有的結(jié)構(gòu)和屬性存儲(chǔ)在Oracle數(shù)據(jù)庫(kù)中。貼源區(qū)中的所有數(shù)據(jù),不管源數(shù)據(jù)的規(guī)模大小,對(duì)數(shù)據(jù)進(jìn)行全表存儲(chǔ),并增加數(shù)據(jù)分類標(biāo)識(shí),如計(jì)生、公安等,以對(duì)數(shù)據(jù)進(jìn)行邏輯區(qū)分。數(shù)據(jù)模型設(shè)計(jì)所有源系統(tǒng)的數(shù)據(jù)被加載到數(shù)據(jù)緩沖區(qū)后,都會(huì)在貼源區(qū)中進(jìn)行標(biāo)準(zhǔn)化處理,并進(jìn)行歷史數(shù)據(jù)累積,保留全量數(shù)據(jù)。此數(shù)據(jù)區(qū)的數(shù)據(jù)基本保持源系統(tǒng)數(shù)據(jù)的原貌,盡可能不做變形,這主要出于以下幾個(gè)方面的考慮:貼源區(qū)保留與源系統(tǒng)相同的數(shù)據(jù),可以用于支持一些對(duì)于數(shù)據(jù)的原貌性要求比較高的應(yīng)用,比如一些稽核類應(yīng)用、一些法律查詢類應(yīng)用等;進(jìn)行數(shù)據(jù)轉(zhuǎn)換往往會(huì)帶來(lái)轉(zhuǎn)換錯(cuò)誤的風(fēng)險(xiǎn),貼源區(qū)保留與源系統(tǒng)相同的數(shù)據(jù),可以減少大數(shù)據(jù)中心出現(xiàn)錯(cuò)誤的可能性,同時(shí)也為基礎(chǔ)庫(kù)的查錯(cuò)和糾錯(cuò)提供了一個(gè)可靠的支持;數(shù)據(jù)標(biāo)準(zhǔn)也是經(jīng)常在變的,貼源區(qū)保留與源系統(tǒng)相同的未變形的數(shù)據(jù)可以保證數(shù)據(jù)不會(huì)因?yàn)閿?shù)據(jù)標(biāo)準(zhǔn)變化而無(wú)法回溯;整合區(qū)將會(huì)進(jìn)行各種標(biāo)準(zhǔn)化,貼源區(qū)保留了與源系統(tǒng)相同的數(shù)據(jù),提供了與基礎(chǔ)庫(kù)做過(guò)轉(zhuǎn)換以后的數(shù)據(jù)進(jìn)行檢核的數(shù)據(jù)基礎(chǔ);由于保留了源系統(tǒng)數(shù)據(jù),可以更加方便、快速實(shí)現(xiàn)業(yè)務(wù)源系統(tǒng)報(bào)表遷移到貼源區(qū)。所以我們規(guī)劃貼源區(qū)盡可能保持與源系統(tǒng)數(shù)據(jù)相同。如果在開放數(shù)據(jù)庫(kù)內(nèi)實(shí)現(xiàn)數(shù)據(jù)標(biāo)準(zhǔn)化的工作,可以在貼源區(qū)建立一張標(biāo)準(zhǔn)化轉(zhuǎn)換表,可以通過(guò)配置選擇對(duì)哪些字段需要標(biāo)準(zhǔn)化,然后通過(guò)關(guān)聯(lián)標(biāo)準(zhǔn)化轉(zhuǎn)換表獲得部分或全部字段的標(biāo)準(zhǔn)化數(shù)據(jù),同時(shí)保留源系統(tǒng)的原始數(shù)據(jù)字段,根據(jù)需要將標(biāo)準(zhǔn)數(shù)據(jù)交換到數(shù)據(jù)共享交換平臺(tái)中提供對(duì)外供數(shù)。同樣,此后的整合區(qū)也將利用貼源區(qū)的標(biāo)準(zhǔn)化視圖作為數(shù)據(jù)源進(jìn)行標(biāo)準(zhǔn)化后的數(shù)據(jù)加工。開放數(shù)據(jù)庫(kù)的數(shù)據(jù)標(biāo)準(zhǔn)化可以都通過(guò)對(duì)貼源區(qū)的標(biāo)準(zhǔn)化視圖進(jìn)行訪問(wèn)來(lái)實(shí)現(xiàn),這也有利于數(shù)據(jù)質(zhì)量的保證。貼源區(qū)的特點(diǎn)與作用貼源區(qū)的特點(diǎn)和主要作用總結(jié)如下:建設(shè)周期短,見(jiàn)效快;保留源系統(tǒng)歷史全量數(shù)據(jù),可用于實(shí)現(xiàn)一些適合基于源系統(tǒng)結(jié)構(gòu)實(shí)現(xiàn)的應(yīng)用、報(bào)表或隨機(jī)查詢,特別是數(shù)據(jù)源要求比較單一、時(shí)效性要求比較高的應(yīng)用,例如一些緊急的部門級(jí)的報(bào)表類應(yīng)用就比較適合;為后面基礎(chǔ)庫(kù)的建設(shè)做技術(shù)、知識(shí)和數(shù)據(jù)的準(zhǔn)備和積累,為基礎(chǔ)庫(kù)的初始加載以及出錯(cuò)補(bǔ)數(shù)提供數(shù)據(jù)支持;支持要求未標(biāo)準(zhǔn)化前代碼的數(shù)據(jù)需求;支持一些要求數(shù)據(jù)不能變形,數(shù)據(jù)結(jié)構(gòu)也不能變形的特殊應(yīng)用,如一些稽核類應(yīng)用及司法查詢應(yīng)用;數(shù)據(jù)初始化建庫(kù)完成后,利用ETL工具,將數(shù)據(jù)緩沖區(qū)中的數(shù)據(jù)抽取到貼源區(qū)。數(shù)據(jù)抽取的要點(diǎn):抽取方法:通過(guò)ETL工具抽取;抽取方式:全量抽?。怀槿☆l率:一次;增量數(shù)據(jù)入庫(kù)抽取數(shù)據(jù)緩沖區(qū)中每天增加的數(shù)據(jù),將新增的數(shù)據(jù)導(dǎo)入到貼源區(qū)中,增量數(shù)據(jù)數(shù)據(jù)量較少,需要配置調(diào)度策略來(lái)定時(shí)執(zhí)行。數(shù)據(jù)抽取的要點(diǎn):抽取方法:通過(guò)ETL工具抽??;抽取方式:增量抽??;抽取頻率:每天一次(視實(shí)際數(shù)據(jù)更新情況);數(shù)據(jù)整合區(qū)數(shù)據(jù)整合區(qū)以共享數(shù)據(jù)庫(kù)數(shù)據(jù)做為基礎(chǔ)數(shù)據(jù),因此主要建設(shè)人口庫(kù)、法人庫(kù)、房屋庫(kù)等。數(shù)據(jù)整合區(qū)采用可擴(kuò)展的設(shè)計(jì)模式,未來(lái)可以擴(kuò)展新的數(shù)據(jù)。數(shù)據(jù)整合區(qū)數(shù)據(jù)模型除了參照市人口庫(kù)、法人庫(kù)、房屋庫(kù)現(xiàn)有數(shù)據(jù)結(jié)構(gòu)外,也會(huì)結(jié)合實(shí)際情況予以擴(kuò)展。數(shù)據(jù)整合區(qū)存儲(chǔ)最新的數(shù)據(jù),當(dāng)有數(shù)據(jù)更新后,數(shù)據(jù)整合區(qū)數(shù)據(jù)將采取T+1的策略更新。數(shù)據(jù)整合區(qū)數(shù)據(jù)可以通過(guò)數(shù)據(jù)交換共享平臺(tái)給各業(yè)務(wù)部門使用。數(shù)據(jù)來(lái)源數(shù)據(jù)整合區(qū)的數(shù)據(jù)來(lái)源于數(shù)據(jù)貼源區(qū),數(shù)據(jù)貼源區(qū)的數(shù)據(jù)來(lái)源于數(shù)據(jù)緩沖區(qū),數(shù)據(jù)緩沖區(qū)的數(shù)據(jù)來(lái)源數(shù)據(jù)共享與交換平臺(tái),因此,數(shù)據(jù)整合區(qū)的數(shù)據(jù)也來(lái)源于數(shù)據(jù)共享與交換平臺(tái)。數(shù)據(jù)初始化建庫(kù)完成后,利用ETL工具,將數(shù)據(jù)從數(shù)據(jù)貼源區(qū)抽取到數(shù)據(jù)整合區(qū)。人口庫(kù)、法人庫(kù)、房屋庫(kù)以市和區(qū)各部門的人口、法人、房屋數(shù)據(jù)為基礎(chǔ)。數(shù)據(jù)更新當(dāng)數(shù)據(jù)共享與交換平臺(tái)相應(yīng)的數(shù)據(jù)源表的數(shù)據(jù)更新后,數(shù)據(jù)整合區(qū)的數(shù)據(jù)會(huì)及時(shí)更新,更新的時(shí)間是T+1。判斷數(shù)據(jù)更新的方式采用全表比對(duì)的方式,采用MD5校驗(yàn)碼,ETL工具事先為要抽取的表建立一個(gè)結(jié)構(gòu)類似的MD5臨時(shí)表,該臨時(shí)表記錄源表主鍵以及根據(jù)所有字段的數(shù)據(jù)計(jì)算出來(lái)的MD5校驗(yàn)碼。每次進(jìn)行數(shù)據(jù)抽取時(shí),對(duì)源表和MD5臨時(shí)表進(jìn)行MD5校驗(yàn)碼的比對(duì),從而決定源表中的數(shù)據(jù)是新增、修改還是刪除,同時(shí)更新MD5校驗(yàn)碼。數(shù)據(jù)整合區(qū)形成后還將利用市鏡像庫(kù)提供的數(shù)據(jù)比對(duì)服務(wù)進(jìn)行二次處理,市鏡像庫(kù)數(shù)據(jù)發(fā)生變化時(shí),數(shù)據(jù)整合區(qū)也將同步更新。增量數(shù)據(jù)入庫(kù)抽取相應(yīng)數(shù)據(jù)庫(kù)中每天增加的數(shù)據(jù),將新增的數(shù)據(jù)導(dǎo)入到數(shù)據(jù)整合區(qū)中。如果新增的數(shù)據(jù)是新增的記錄項(xiàng),則在數(shù)據(jù)整合區(qū)中追加一條記錄;如果新增的數(shù)據(jù)是對(duì)原有數(shù)據(jù)的修改,則在數(shù)據(jù)整合區(qū)中更新相應(yīng)的記錄項(xiàng),并將歷史數(shù)據(jù)保存。數(shù)據(jù)監(jiān)控?cái)?shù)據(jù)更新監(jiān)控對(duì)開放數(shù)據(jù)庫(kù)中的入庫(kù)數(shù)據(jù)進(jìn)行監(jiān)控,監(jiān)控?cái)?shù)據(jù)來(lái)源單位、數(shù)據(jù)來(lái)源數(shù)量等??砂磿r(shí)間段條件來(lái)查詢某個(gè)具體時(shí)間段數(shù)據(jù)更新情況。開放數(shù)據(jù)庫(kù)中的數(shù)據(jù)更新后,系統(tǒng)會(huì)及時(shí)展示更新情況,可以細(xì)化到某個(gè)表中數(shù)據(jù)的更新情況展示。數(shù)據(jù)資源監(jiān)控對(duì)開放數(shù)據(jù)庫(kù)中基礎(chǔ)數(shù)據(jù)的當(dāng)前數(shù)據(jù)總量、最近更新量、最近更新時(shí)間、距上次更新時(shí)間的天數(shù)、新增數(shù)據(jù)量、日更新數(shù)據(jù)量、今天與昨天數(shù)據(jù)更新量對(duì)比等整體信息。開放服務(wù)庫(kù)建設(shè)服務(wù)庫(kù)建設(shè)即API管理方式主要針對(duì)兩方面應(yīng)用:一是對(duì)于提供系統(tǒng)接口的委辦局實(shí)現(xiàn)接口、交換中心庫(kù)、基礎(chǔ)庫(kù)以及歷史庫(kù)統(tǒng)一格式封裝和管理,提供標(biāo)準(zhǔn)服務(wù)調(diào)用;二是對(duì)職能部門直接可以生成開放服務(wù)的數(shù)據(jù),通過(guò)服務(wù)生成器直接生成服務(wù)和服務(wù)總線,由服務(wù)目錄管理,實(shí)現(xiàn)開放服務(wù)。數(shù)據(jù)資源目錄體系建設(shè)(數(shù)據(jù)數(shù)據(jù)資源目錄、數(shù)據(jù)服務(wù)目錄)概述對(duì)開放數(shù)據(jù)資源采取目錄管理模式,有利于市政府領(lǐng)導(dǎo)和各委辦局全面了解和利用全市數(shù)據(jù)資源和數(shù)據(jù)開放服務(wù)。目錄主要用來(lái)管理兩類資源:數(shù)據(jù)資源和服務(wù)資源。數(shù)據(jù)資源是指從各個(gè)委辦局的采集的元數(shù)據(jù)。服務(wù)資源是指可以重用的能完成數(shù)據(jù)開放應(yīng)用數(shù)據(jù),包括用服務(wù)生成器生成的服務(wù)和委辦局提供的接口服務(wù)。數(shù)據(jù)資源目錄的內(nèi)容包括:產(chǎn)生該數(shù)據(jù)資源的部門、業(yè)務(wù)系統(tǒng)、相關(guān)業(yè)務(wù)(參照權(quán)責(zé)清單),該數(shù)據(jù)資源的名稱(中文說(shuō)明,英文名稱)、包含的各指標(biāo)項(xiàng)(中文說(shuō)明,英文名稱,數(shù)據(jù)類型和大小,公開方式等)、分類、編碼、更新周期等。對(duì)開放目錄分級(jí)管理,包括公開數(shù)據(jù)、內(nèi)部數(shù)據(jù)、涉密數(shù)據(jù);并對(duì)數(shù)據(jù)開放內(nèi)容進(jìn)行分類管理,包括主題分類、行業(yè)分類、服務(wù)分類、標(biāo)簽維度。普通用戶可以管理本單位的數(shù)據(jù)資源目錄,包括查詢、增加、修改、刪除等操作,但必須通過(guò)系統(tǒng)用戶審批后才能正式生效。系統(tǒng)用戶可以管理全市的數(shù)據(jù)資源目錄,包括查詢、批準(zhǔn)并發(fā)布、拒絕等操作,指定各部門要求報(bào)送的資源目錄,更新市數(shù)據(jù)資源目錄并管理其訂閱、發(fā)布狀態(tài),對(duì)市數(shù)據(jù)資源目錄的統(tǒng)計(jì)分析(發(fā)布、訂閱、審批、拒絕等情況)。整體架構(gòu)項(xiàng)目的數(shù)據(jù)資源開放目錄系統(tǒng)是一款云資源目錄及云服務(wù)治理產(chǎn)品、嚴(yán)格遵循GB/T21063-2007政務(wù)信息資源目錄體系標(biāo)準(zhǔn)的基礎(chǔ)上擴(kuò)展了云資源開放所必備的云服務(wù)治理功能。它具有資源類化編目、目錄版本管理、服務(wù)消費(fèi)認(rèn)證,同時(shí)它向用戶提供檢索服務(wù)、訂閱服務(wù)、使用評(píng)價(jià)等功能。數(shù)據(jù)資源開放目錄系統(tǒng)提供了RSS訂閱和瀏覽器查閱兩種方式調(diào)用查看服務(wù)內(nèi)容,并提供搜索功能,以方便人們更快、更準(zhǔn)的發(fā)現(xiàn)服務(wù)資源,并能充分地利用資源。同時(shí),該系統(tǒng)利用同步橋接機(jī)制發(fā)現(xiàn)云服務(wù)總線和云服務(wù)生成器上新發(fā)布的服務(wù),自動(dòng)完成服務(wù)“發(fā)布”->“發(fā)現(xiàn)”提升了平臺(tái)的運(yùn)行效率。根據(jù)GB/T21063-2007政務(wù)信息資源目錄體系標(biāo)準(zhǔn),結(jié)合SOA、WOA架構(gòu)規(guī)范,以及上述的架構(gòu)藍(lán)圖,目錄系統(tǒng)的整體建設(shè)框架設(shè)計(jì)如下:整個(gè)平系統(tǒng)構(gòu)分為五個(gè)層級(jí)包括數(shù)據(jù)源、數(shù)據(jù)資源編目、目錄分類(數(shù)據(jù)目錄、服務(wù)目錄)、數(shù)據(jù)資源分類與分級(jí)、數(shù)據(jù)目錄管理;兩大體系:目錄標(biāo)準(zhǔn)體系、安全保障體系。數(shù)據(jù)源數(shù)據(jù)源主要包括兩大類數(shù)據(jù)資源:市電子政務(wù)數(shù)據(jù)和各局辦數(shù)據(jù)服務(wù)接口/API。市電子政務(wù)數(shù)據(jù)主要是來(lái)自市數(shù)據(jù)資源共享平臺(tái)基礎(chǔ)庫(kù)數(shù)據(jù)以及市委辦局業(yè)務(wù)數(shù)據(jù),其類型包括結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù);服務(wù)接口/API主要是各委辦局提供的數(shù)據(jù)服務(wù)接口/API。在數(shù)據(jù)采集過(guò)程中對(duì)數(shù)據(jù)資源進(jìn)行資源梳理和體征提取,為數(shù)據(jù)資源編目做準(zhǔn)備,數(shù)據(jù)采集是數(shù)據(jù)匯聚的重要手段,包括數(shù)據(jù)交換平臺(tái)實(shí)現(xiàn)和手工報(bào)送方式。數(shù)據(jù)資源編目元數(shù)據(jù)編目:負(fù)責(zé)對(duì)元數(shù)據(jù)和元數(shù)據(jù)集合的管理,其中包括了23項(xiàng)國(guó)家核心元數(shù)據(jù),并遵循了國(guó)家標(biāo)準(zhǔn)中對(duì)核心元數(shù)據(jù)的定義和著錄規(guī)則。同時(shí)還可以根據(jù)需求動(dòng)態(tài)擴(kuò)展元數(shù)據(jù),元數(shù)據(jù)支持單項(xiàng)(文本、日期等)和復(fù)合項(xiàng)兩種數(shù)據(jù)類型。元數(shù)據(jù)集提供了版本和模板管理,在填充完元數(shù)據(jù)后,可將其作為元數(shù)據(jù)集模板,以供其他元數(shù)據(jù)集使用。編目管理:資源編目管理的特征項(xiàng)填報(bào)實(shí)現(xiàn)編目表單的動(dòng)態(tài)生成,按動(dòng)態(tài)加載的元數(shù)據(jù)集合對(duì)元數(shù)據(jù)元素進(jìn)行賦值、標(biāo)準(zhǔn)符合性檢查、分類和輸出等元數(shù)據(jù)操作,構(gòu)成目錄的核心內(nèi)容。編目注冊(cè)的資源需要經(jīng)過(guò)審核后才能發(fā)布提供外部訪問(wèn)。數(shù)據(jù)接口/API接入:滿足各委辦局提供接口接入和API。目錄分類目錄主要用來(lái)管理兩類資源:數(shù)據(jù)資源和服務(wù)資源。數(shù)據(jù)資源是指從各個(gè)委辦局的采集的元數(shù)據(jù)。服務(wù)資源是指可以重用的能完成數(shù)據(jù)開放應(yīng)用數(shù)據(jù),包括用服務(wù)生成器生成的服務(wù)和委辦局提供的接口服務(wù)。數(shù)據(jù)資源分類與分級(jí)數(shù)據(jù)資源分類是把具有某種共同屬性或特征的政務(wù)信息歸并在一起,通過(guò)其類別的屬性或特征來(lái)對(duì)政務(wù)信息進(jìn)行的歸類,據(jù)以建立政務(wù)數(shù)據(jù)資源目錄分類體系,具體實(shí)現(xiàn)政務(wù)數(shù)據(jù)資源采集、管理、服務(wù)、共享等,以便有序管理和開發(fā)利用政務(wù)數(shù)據(jù)資源。數(shù)據(jù)資源分級(jí):分級(jí)包括公開數(shù)據(jù)、內(nèi)部數(shù)據(jù)、涉密數(shù)據(jù)。數(shù)據(jù)目錄管理目錄管理實(shí)現(xiàn)對(duì)目錄服務(wù)中心的目錄內(nèi)容和目錄服務(wù)運(yùn)行的關(guān)聯(lián),應(yīng)根據(jù)目錄審核、目錄檢索、目錄維護(hù)、目錄發(fā)布、目錄訂閱、統(tǒng)計(jì)分析、日志管理等功能。審核功能:按照目錄標(biāo)準(zhǔn)對(duì)目錄內(nèi)容進(jìn)行形式審核,符合標(biāo)準(zhǔn)的目錄內(nèi)容進(jìn)入目錄內(nèi)容服務(wù)信息庫(kù),按照標(biāo)準(zhǔn)要求自動(dòng)發(fā)布;未通過(guò)形式審核的目錄內(nèi)容,回退到相關(guān)政務(wù)部門,經(jīng)形式修正后重新審核。維護(hù)功能:對(duì)目錄內(nèi)容信息庫(kù),目錄內(nèi)容服務(wù)信息庫(kù)中的目錄內(nèi)容提供維護(hù)功能。系統(tǒng)管理員可以增加、修改或刪除資源目錄。核實(shí)功能:系統(tǒng)對(duì)資源目錄上描述的數(shù)據(jù)進(jìn)行核實(shí)。目錄訂閱和發(fā)布:訂閱資源的指標(biāo)如何包含條件共享字段,第一步需要系統(tǒng)管理員進(jìn)行審核,系統(tǒng)管理員審核通過(guò)后,第二部需要部門管理員確認(rèn),部門管理員確認(rèn)這個(gè)條件共享的字段能共享給申請(qǐng)的部門使用。開放、共享資源申請(qǐng):訂閱資源的指標(biāo)是開放和共享的,則只需要系統(tǒng)管理員確定通過(guò)一下就可以了。不共享資源:即此字段不公開,訂閱時(shí)不能訂閱次字段。資源目錄統(tǒng)計(jì):統(tǒng)計(jì)、查詢資源目錄使用情況。資源目錄管理需要統(tǒng)計(jì)資源庫(kù)的容量和使用率,通過(guò)圖表方式以及數(shù)據(jù)的方式顯示統(tǒng)計(jì)結(jié)果。統(tǒng)計(jì)分析項(xiàng)目包括資源容量統(tǒng)計(jì)、資源使用統(tǒng)計(jì)、上傳統(tǒng)計(jì)等。目錄服務(wù)地址管理:存儲(chǔ)目錄服務(wù)中心的目錄服務(wù)地址,用于目錄服務(wù)中心之間的互連互通。監(jiān)控功能:監(jiān)控系統(tǒng)的運(yùn)行狀態(tài)。兩大體系:1、目錄標(biāo)準(zhǔn)規(guī)范體系:1、安全保障體系:信息安全是電子政務(wù)的前提,更是政府業(yè)務(wù)的重中之重,沒(méi)有數(shù)據(jù)安全保障,電子檢務(wù)就無(wú)法開展。建立統(tǒng)一安全體系,從物理、網(wǎng)絡(luò)、系統(tǒng)、信息和管理等方面保證整體安全;以應(yīng)用與實(shí)效為主導(dǎo),管理與技術(shù)并重,建立綜合防范機(jī)制,保障信息平臺(tái)安全、高效、可靠的運(yùn)行。數(shù)據(jù)資源目錄編制與管理流程數(shù)據(jù)編目主要分兩種,部門有目錄系統(tǒng)的進(jìn)行目錄同步就可以了;沒(méi)有目錄系統(tǒng)的需要對(duì)部門資源進(jìn)行編目。編目分類如下圖:目錄管理實(shí)現(xiàn)對(duì)數(shù)據(jù)資源目錄平臺(tái)的全部操作,根據(jù)對(duì)目錄平臺(tái)的操作可分為編目系統(tǒng)、目錄管理系統(tǒng)、目錄服務(wù)系統(tǒng)三個(gè)部分。目錄是用于描述政務(wù)數(shù)據(jù)資源,包括資源本身的屬性、特征及其定位信息和獲取方式。編目系統(tǒng)采用靈活的部署方式,可以人工編目、機(jī)輔編目、自動(dòng)編目多種編目方式,也支持電子文件、數(shù)據(jù)庫(kù)、網(wǎng)頁(yè)等多種部門開放數(shù)據(jù)資源。目錄管理系統(tǒng)包括對(duì)開放數(shù)據(jù)的“元數(shù)據(jù)”信息進(jìn)行管理和服務(wù)管理(包括接口/API管理),說(shuō)明各部門可以提供哪些數(shù)據(jù),數(shù)據(jù)的類型、交換周期、交換方式等信息;另一方面對(duì)開放服務(wù)進(jìn)行管理,說(shuō)明服務(wù)的類型、申請(qǐng)方式等。目錄服務(wù)系統(tǒng)發(fā)布目錄、目錄服務(wù)、服務(wù)申請(qǐng)和服務(wù)審批等。了解數(shù)據(jù)資源中心有哪些數(shù)據(jù)資源并發(fā)起申請(qǐng),提供部門可以根據(jù)共享目錄的要求提供數(shù)據(jù)。目錄服務(wù)系統(tǒng)是在數(shù)據(jù)資源梳理的基礎(chǔ)上構(gòu)建而成的,提供資源登記管理、數(shù)據(jù)資源展示、數(shù)據(jù)資源發(fā)布及數(shù)據(jù)資源服務(wù)。數(shù)據(jù)資源目錄編制與管理流程圖此外,需要統(tǒng)一的安全認(rèn)證、授權(quán)管理,統(tǒng)一的備份/恢復(fù)機(jī)制,統(tǒng)一的數(shù)據(jù)資源更新機(jī)制等。以保證數(shù)據(jù)資源的安全、完整、有效,實(shí)現(xiàn)方便高效的共享。開放資源目錄功能設(shè)計(jì)元數(shù)據(jù)管理元數(shù)據(jù)管理的重要性:元數(shù)據(jù)管理可作為一項(xiàng)重要功能,讓目錄系統(tǒng)得以管理復(fù)雜數(shù)據(jù)集成環(huán)境中的變化,同時(shí)提供可信、安全的數(shù)據(jù)。當(dāng)業(yè)務(wù)數(shù)據(jù)相關(guān)方參與這一進(jìn)程并接受對(duì)數(shù)據(jù)參考框架的責(zé)任,其優(yōu)勢(shì)將變得更有說(shuō)服力。此時(shí),政府

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論