生物醫(yī)療產(chǎn)業(yè)大腦項(xiàng)目建設(shè)方案_第1頁
生物醫(yī)療產(chǎn)業(yè)大腦項(xiàng)目建設(shè)方案_第2頁
生物醫(yī)療產(chǎn)業(yè)大腦項(xiàng)目建設(shè)方案_第3頁
生物醫(yī)療產(chǎn)業(yè)大腦項(xiàng)目建設(shè)方案_第4頁
生物醫(yī)療產(chǎn)業(yè)大腦項(xiàng)目建設(shè)方案_第5頁
已閱讀5頁,還剩39頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

生物醫(yī)療產(chǎn)業(yè)大腦項(xiàng)目建設(shè)方案

一、建設(shè)目標(biāo)、規(guī)模與內(nèi)容..........................................2

1.建設(shè)目標(biāo)....................................................2

2.建設(shè)規(guī)模....................................................2

3.建設(shè)內(nèi)容....................................................2

二、總體架構(gòu)設(shè)計(jì)..................................................3

三、業(yè)務(wù)應(yīng)用及應(yīng)用模型建設(shè)方案....................................3

1.產(chǎn)業(yè)鏈云圖..................................................3

2.賽道分析選擇................................................6

3.產(chǎn)業(yè)運(yùn)行監(jiān)測................................................7

4.智能報告系統(tǒng)................................................9

5.智能招商助手...............................................10

6.應(yīng)用模型層.................................................14

四、數(shù)據(jù)層建設(shè)方案...............................................16

1.數(shù)據(jù)體系建設(shè)...............................................16

2.數(shù)據(jù)治理服務(wù)...............................................20

五、安全體系建設(shè)方案.............................................32

1.概述.......................................................32

2.安全體系設(shè)計(jì)...............................................32

3.安全管理體系...............................................37

六、網(wǎng)絡(luò)系統(tǒng)建設(shè)方案.............................................39

七、備份系統(tǒng)建設(shè)方案.............................................40

八、運(yùn)行維護(hù)體系建設(shè)方案.........................................41

1.運(yùn)行維護(hù)服務(wù)原則...........................................41

2.運(yùn)行維護(hù)服務(wù)規(guī)范...........................................42

3.運(yùn)行維護(hù)服務(wù)內(nèi)容...........................................42

九、軟硬件選型方案...............................................44

1

一、建設(shè)目標(biāo)、規(guī)模與內(nèi)容

1.建設(shè)目標(biāo)

建設(shè)生物醫(yī)療產(chǎn)業(yè)大腦項(xiàng)目,利用云計(jì)算、大數(shù)據(jù)、人工智能等新一代信息

技術(shù)手段,在前期產(chǎn)業(yè)鏈課題研究成果基礎(chǔ)上,將長沙市生物醫(yī)療產(chǎn)業(yè)信息進(jìn)

行數(shù)字化,構(gòu)建產(chǎn)業(yè)鏈云圖、賽道分析選擇、產(chǎn)業(yè)運(yùn)行監(jiān)測、智能報告系統(tǒng)、智

能招商助手等應(yīng)用,在線展示長沙市產(chǎn)業(yè)發(fā)展現(xiàn)狀、相關(guān)產(chǎn)業(yè)政策、項(xiàng)目用地

等信息,實(shí)現(xiàn)產(chǎn)業(yè)鏈精準(zhǔn)招商引商,加快產(chǎn)業(yè)深度革新發(fā)展。

2.建設(shè)規(guī)模

本項(xiàng)目覆蓋長沙市生物醫(yī)療產(chǎn)業(yè)相關(guān)的,以湘江數(shù)字健康產(chǎn)業(yè)園為核心,

瀏陽經(jīng)濟(jì)技術(shù)開發(fā)區(qū)、長沙高新技術(shù)產(chǎn)業(yè)開發(fā)區(qū)、金霞經(jīng)濟(jì)開發(fā)區(qū)、望城經(jīng)濟(jì)

技術(shù)開發(fā)區(qū)和隆平高科技園為主要集聚區(qū),寧鄉(xiāng)經(jīng)濟(jì)技術(shù)開發(fā)區(qū)、寧鄉(xiāng)高新技

術(shù)產(chǎn)業(yè)園區(qū)、長沙經(jīng)濟(jì)技術(shù)開發(fā)區(qū)多點(diǎn)分布的“一核兩區(qū)三園多點(diǎn)”的生物醫(yī)

療產(chǎn)業(yè),以及生物醫(yī)療相關(guān)的企業(yè)。

本項(xiàng)目將圍繞生物醫(yī)療產(chǎn)業(yè)建設(shè)應(yīng)用場景,覆蓋長沙市的生物醫(yī)療產(chǎn)業(yè)園

區(qū)和企業(yè),面向長沙市工信、湘江新區(qū)和長沙市各生物醫(yī)療產(chǎn)業(yè)園區(qū)等用戶。

3.建設(shè)內(nèi)容

針對本項(xiàng)目主要建設(shè)內(nèi)容分為二大塊:

1)針對長沙市生物醫(yī)療產(chǎn)業(yè)大數(shù)據(jù)進(jìn)行數(shù)據(jù)治理建設(shè)。

2)建設(shè)生物醫(yī)療產(chǎn)業(yè)大腦五大應(yīng)用系統(tǒng)。分別為產(chǎn)業(yè)鏈云圖、賽道分析

選擇、產(chǎn)業(yè)運(yùn)行監(jiān)測、智能報告系統(tǒng)、智能招商助手等。

通過匯聚私域產(chǎn)業(yè)數(shù)據(jù)、公域產(chǎn)業(yè)數(shù)據(jù)等,對結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù)

進(jìn)行存儲與融合,形成各類標(biāo)準(zhǔn)化主題庫,為應(yīng)用系統(tǒng)提供支撐;建設(shè)產(chǎn)業(yè)

鏈云圖、賽道分析選擇、產(chǎn)業(yè)運(yùn)行監(jiān)測、智能報告系統(tǒng)、智能招商助手等應(yīng)

用。

2

二、總體架構(gòu)設(shè)計(jì)

本次項(xiàng)目建設(shè),將構(gòu)建長沙市生物醫(yī)療產(chǎn)業(yè)數(shù)據(jù)基礎(chǔ)和各類分析模型,在

此基礎(chǔ)上構(gòu)建產(chǎn)業(yè)鏈云圖、賽道分析選擇、產(chǎn)業(yè)運(yùn)行監(jiān)測、智能報告系統(tǒng)、智能

招商助手等應(yīng)用。

業(yè)□

m大JTWeb?-*g

fni系

s筑

運(yùn)

,

ffmi

M曲南

星-Mrtm?

|g?W||<WMW|[?->][■WB]-

--------------「B?人jmKMdETittauRy-

MXJI

;友演.ttxt.人,i

BMVJi?*>jMM?±ir^riiM;???■(

三、業(yè)務(wù)應(yīng)用及應(yīng)用模型建設(shè)方案

1.產(chǎn)業(yè)鏈云圖

構(gòu)建長沙市生物醫(yī)療產(chǎn)業(yè)全景,涵蓋產(chǎn)業(yè)鏈、技術(shù)鏈、創(chuàng)新鏈、資本鏈

、人才鏈、空間連,形成產(chǎn)業(yè)鏈云圖,展示產(chǎn)業(yè)鏈構(gòu)成、資源要素、創(chuàng)新成

果和空間布局。展示信息包括:產(chǎn)業(yè)載體在各區(qū)的落圖情況及載體介紹;重

點(diǎn)園區(qū)在各區(qū)的落圖情況;重點(diǎn)企業(yè)(全部、規(guī)上、高新、上市企業(yè))在各區(qū)的

熱力分布情況;創(chuàng)新資源(如功能服務(wù)平臺、科研院所等)在各區(qū)的落圖情況;產(chǎn)

業(yè)評價指數(shù);企業(yè)主營分布;企業(yè)趨勢;企業(yè)排名;國家/省市級人才分布;核心

產(chǎn)業(yè)投資分布;核心產(chǎn)業(yè)融資分布;技術(shù)分布;園區(qū)產(chǎn)業(yè)配套情況;產(chǎn)品分布

;核心產(chǎn)業(yè)的產(chǎn)量統(tǒng)計(jì);核心產(chǎn)業(yè)的產(chǎn)值統(tǒng)計(jì)等信息。

1.1.產(chǎn)業(yè)鏈

通過數(shù)字化落圖的方式,以可視化的方式分別展示產(chǎn)業(yè)鏈上下游,包含原

材料供應(yīng)、外包服務(wù)、產(chǎn)業(yè)服務(wù)、生產(chǎn)研發(fā)、產(chǎn)品應(yīng)用,并展示每個產(chǎn)業(yè)鏈環(huán)節(jié)

3

中企業(yè)名單、高端人才(諾獎、院士、國外院士、千人計(jì)劃)、融資(各輪融資)、

專利(獲得國內(nèi)、國際專利數(shù)量),可以直觀的展現(xiàn)整個產(chǎn)業(yè)鏈的全貌。

圖:細(xì)胞/基因治療產(chǎn)業(yè)鏈

1.2.技術(shù)鏈

洞察產(chǎn)業(yè)發(fā)展取得的技術(shù)成果,并進(jìn)行數(shù)字化落圖,通過對重點(diǎn)成果研發(fā)管

線、細(xì)分類型、增長趨勢、聚集態(tài)勢進(jìn)行分析,通過可視化的方式直觀的了解

產(chǎn)業(yè)技術(shù)成果的發(fā)展水平。

圖:生物醫(yī)療技術(shù)鏈

1.3.創(chuàng)新鏈

將創(chuàng)新要素進(jìn)行數(shù)字化落圖,以可視化的方式對產(chǎn)業(yè)研發(fā)環(huán)節(jié)梳理,對研

發(fā)過程中各環(huán)節(jié)的創(chuàng)新成果、研發(fā)資源進(jìn)行統(tǒng)計(jì),從創(chuàng)新企業(yè)、服務(wù)企業(yè)、科研

機(jī)構(gòu)、創(chuàng)新人才、創(chuàng)新資本、成果價值等創(chuàng)新要素的維度,全面分析在創(chuàng)新過

程中投入產(chǎn)出情況,直觀呈現(xiàn)每個產(chǎn)業(yè)研發(fā)創(chuàng)新階段服務(wù)資源的分布,通過數(shù)

4

量統(tǒng)計(jì)結(jié)果反映出產(chǎn)業(yè)研發(fā)整體處于的階段,從而對產(chǎn)業(yè)未來發(fā)展的趨勢、潛力

和新產(chǎn)品上市的周期進(jìn)行判斷。

圖:創(chuàng)新資源分布

1.4.資本鏈

通過數(shù)字化和可視化的方式,展示產(chǎn)業(yè)歷年企業(yè)融資、并購、上市等各類資

本動態(tài)及空間分布,各領(lǐng)域、各輪次融資數(shù)量和變化趨勢等產(chǎn)業(yè)資本信息,體

現(xiàn)產(chǎn)業(yè)資本活躍度,展示金融資本對產(chǎn)業(yè)發(fā)展的創(chuàng)新支撐。同時通過對資本事

件的統(tǒng)計(jì)與分析,使工信局及產(chǎn)業(yè)管理部門實(shí)時掌握產(chǎn)業(yè)資本動態(tài),做好重點(diǎn)

企業(yè)發(fā)展跟蹤。

圖:生物醫(yī)療產(chǎn)業(yè)投融資情況

1.5.人才鏈

通過數(shù)字化和可視化的方式,展示產(chǎn)業(yè)高端人才聚集和分布態(tài)勢,以高端

人才數(shù)量、稱號、級別、領(lǐng)域、崗位等維度對高端人才進(jìn)行統(tǒng)計(jì)分析,在地理

5

空間上展示人才遷徙進(jìn)程和人才聚集現(xiàn)狀,并通過實(shí)時更新的人才畫像加深對

高端人才的了解。

圖:人才分布情況

1.6.空間鏈

通過數(shù)字化和可視化的方式,來展示長沙市生物醫(yī)療產(chǎn)業(yè)發(fā)展環(huán)境,通過

地圖承載和分析產(chǎn)業(yè)要素的分布情況,展示產(chǎn)業(yè)發(fā)展環(huán)境及交通區(qū)位,展示產(chǎn)業(yè)

載體、人才資源、企業(yè)資源、服務(wù)資源、專業(yè)配套等資源在空間上的分布情況

,體現(xiàn)區(qū)域產(chǎn)業(yè)發(fā)展資源優(yōu)勢,提升招商工作成效。

圖:產(chǎn)業(yè)分布情況

2.賽道分析選擇

對長沙市生物醫(yī)療產(chǎn)業(yè)的整體情況做數(shù)字化和可視化呈現(xiàn)。包括生物醫(yī)療

產(chǎn)業(yè)市場增速、國際國內(nèi)龍頭的數(shù)量、本地重點(diǎn)企業(yè)、人才、成果、融資的情況

6

,可發(fā)現(xiàn)具體賽道對的發(fā)展前景、競爭程度和自身潛力。可具體了解生物醫(yī)療

產(chǎn)業(yè)細(xì)分領(lǐng)域的市場前景預(yù)測,同時可對比長沙市生物醫(yī)療產(chǎn)業(yè)的自身實(shí)力和

競爭程度。對于重點(diǎn)細(xì)分領(lǐng)域,實(shí)時監(jiān)測進(jìn)入市場時間、市場占有率、研發(fā)資

源及創(chuàng)新資源(創(chuàng)新人才、創(chuàng)新專利、論文文獻(xiàn))等資源要素,基于產(chǎn)業(yè)評估模

型從供應(yīng)鏈的上、中、下游分析區(qū)域產(chǎn)業(yè)發(fā)展瓶頸(卡脖子環(huán)節(jié))及產(chǎn)業(yè)發(fā)展優(yōu)勢

圖:賽道分析

3.產(chǎn)業(yè)運(yùn)行監(jiān)測

3.1.產(chǎn)業(yè)動態(tài)監(jiān)測

從宏觀、中觀、微觀三個層面,客觀、全面地監(jiān)測、分析、評估產(chǎn)業(yè)發(fā)展情

況。通過數(shù)據(jù)指標(biāo)實(shí)現(xiàn)對產(chǎn)業(yè)數(shù)據(jù)的統(tǒng)計(jì)匯總,同時指標(biāo)的可視化圖表展示指

標(biāo)表現(xiàn)出產(chǎn)業(yè)各地域發(fā)展?fàn)顩r,第一時間掌握產(chǎn)業(yè)重點(diǎn)發(fā)展領(lǐng)域本地區(qū)、全國

、全球的動態(tài)信息。

圖:產(chǎn)業(yè)動態(tài)

7

3.2.企業(yè)動態(tài)監(jiān)測

基于企業(yè)所處細(xì)分領(lǐng)域和產(chǎn)業(yè)鏈環(huán)節(jié),建立企業(yè)發(fā)展拐點(diǎn)預(yù)測模型,根據(jù)

企業(yè)創(chuàng)新成果、業(yè)務(wù)收入、盈利水平、投融資情況以及相應(yīng)市場分析,形成拐點(diǎn)

監(jiān)測預(yù)警信息判斷企業(yè)是否進(jìn)入發(fā)展瓶頸期或即將進(jìn)入快速發(fā)展期,展示監(jiān)測

事件類型、重點(diǎn)領(lǐng)域分布圖、監(jiān)測動態(tài)、重點(diǎn)監(jiān)測企業(yè)。使產(chǎn)業(yè)管理部門針對

性的為企業(yè)制定幫扶政策,以及匹配服務(wù)資源和金融資源。

對與輿情(工商變更、人事變動、高管調(diào)研、高層言論、投融資事件、子公

司設(shè)立、產(chǎn)品研發(fā)進(jìn)展、產(chǎn)品上市、產(chǎn)品召回、違規(guī)違法)相關(guān)的各類企業(yè)風(fēng)險

進(jìn)行重點(diǎn)監(jiān)測。當(dāng)出現(xiàn)重大投資并購、通報處罰、違規(guī)違法等重大經(jīng)營、法律

風(fēng)險事件時,系統(tǒng)將自動預(yù)警并實(shí)時推送給相關(guān)產(chǎn)業(yè)管理人員,以便及時采

取相應(yīng)措施。

3.3.一企一檔

通過對長沙市生物醫(yī)療產(chǎn)業(yè)數(shù)據(jù)標(biāo)簽體系和模型算法的構(gòu)建,繪制豐富立

體、實(shí)施動態(tài)的企業(yè)數(shù)字畫像檔案,并根據(jù)企業(yè)發(fā)展評價模型,生成企業(yè)質(zhì)量評

價檔案,通過企業(yè)榜單實(shí)現(xiàn)對企業(yè)的分類識別和發(fā)展拐點(diǎn)監(jiān)控,同時對企業(yè)需

求進(jìn)行實(shí)行采集預(yù)測,為企業(yè)培育發(fā)展提供有力服務(wù)支撐依據(jù)。

將企業(yè)信息、企業(yè)投入、企業(yè)產(chǎn)出、企業(yè)發(fā)展和新聞動態(tài)進(jìn)行分類展示,具

體包括:

企業(yè)信息。包括企業(yè)工商信息、人才團(tuán)隊(duì)、資質(zhì)榮譽(yù)等信息。

8

企業(yè)投入。包括企業(yè)資金投入(企業(yè)法人代表、凈資產(chǎn)、研發(fā)投入)和人員

投入(員工數(shù)量、科研人員數(shù)量)等信息。

企業(yè)產(chǎn)出。包括企業(yè)經(jīng)濟(jì)產(chǎn)出(營業(yè)收入)、產(chǎn)品成果、專利成果(企業(yè)發(fā)明

專利、發(fā)明授權(quán))等信息。

企業(yè)發(fā)展。包括企業(yè)對外投資和企業(yè)融資情況等信息。

新聞動態(tài)。實(shí)時展示與企業(yè)相關(guān)的新聞動態(tài),如工商變更、產(chǎn)業(yè)外溢、新

聞輿情、法律風(fēng)險等信息。

EZ3

頭歷企/0?企業(yè)&?&SB?力企/黑--1

皿..?二

?18!

,<?<

?..W?<??s?<>v

?>??■<???—―

?"A*?"0*tmm<tw>?■>■

eE.

?*>???■

****?<1*J?**??VMm*

?**???wait*<?vw?r?

?m*u*v??'?,>*??*MM*

?<)?

??**??《?

?.MW<?<M?MM<???????3”<?W,

圖:企業(yè)榜單

4.智能報告系統(tǒng)

基于對產(chǎn)業(yè)發(fā)展中產(chǎn)業(yè)載體、產(chǎn)業(yè)要素歷史成果分析,通過沉淀打磨后的

報告模板定時定期自動生成,消除人工收集整理信息的復(fù)雜流程,減輕手工編

制報告的工作量,提升出具產(chǎn)業(yè)報告的效率。

根據(jù)「產(chǎn)業(yè)總覽」「產(chǎn)業(yè)載體」「重點(diǎn)企業(yè)」「創(chuàng)新資源」四個固定模版

,按產(chǎn)業(yè)分類、每月定時生成相關(guān)報告,可以根據(jù)地區(qū)和生成時間進(jìn)行篩選。

同時提供即時生成數(shù)據(jù)報告的功能,隨時幫助用戶了解目標(biāo)區(qū)域產(chǎn)業(yè)的總

覽概況、產(chǎn)業(yè)載體、重點(diǎn)企業(yè)、創(chuàng)新資源明細(xì)信息。系統(tǒng)的進(jìn)行數(shù)據(jù)獲取及校

驗(yàn),釋放人力資源,保證數(shù)據(jù)質(zhì)量。

根據(jù)「產(chǎn)業(yè)運(yùn)行」「企業(yè)動態(tài)」兩個固定模版,按產(chǎn)業(yè)分類、每月定時生

成相關(guān)報告,可以根據(jù)地區(qū)和生成時間進(jìn)行篩選。簡化報告編制操作難度,提

升工作效率。

9

新一代信息技術(shù)

聯(lián)汽車、

M34ftA)4

生命裔端裝*助透新徒界相節(jié)味*保

ZF-卜t*j

岸色食品

圖:產(chǎn)業(yè)報告

5.智能招商助手

5.1.招商管理工作臺

1、招商列表

實(shí)現(xiàn)按條件對招商線索數(shù)據(jù)進(jìn)行檢索查詢,列表字段包括線索名稱、線索

簡介、發(fā)布時間、意向區(qū)域、載體類型、所需面積、所屬產(chǎn)業(yè)、建議對接部門等

,同時可對錄入項(xiàng)目進(jìn)行編輯或刪除。

2、線索跟進(jìn)

對招商線索的跟進(jìn)情況進(jìn)行信息填報及線索流轉(zhuǎn)處理。設(shè)置線索跟進(jìn)記錄

填報功能,內(nèi)容包括招商經(jīng)理姓名、對接時間、對接方式、跟進(jìn)階段、企業(yè)對接

人、對接地點(diǎn)、溝通記錄。每次記錄按時排序形成對接記錄,可查看過往的所

有跟進(jìn)記錄信息。同時,系統(tǒng)支持對錄入記錄進(jìn)行編輯與刪除。

招商管理部門可以將線索分發(fā)給下轄區(qū)縣/園區(qū),追蹤下轄區(qū)縣/園區(qū)對線

索的跟進(jìn)情況,統(tǒng)籌管控整體招商進(jìn)展。

招商線索對接反饋,包括招商人員與標(biāo)的企業(yè)聯(lián)系情況、線索準(zhǔn)確性、企業(yè)

投資遷址意愿等,一方面體現(xiàn)招商人員工作績效,另一方面有助于調(diào)整優(yōu)化智

能推薦算法模型,進(jìn)一步提高推薦的精準(zhǔn)性。

3、上傳招商線索

按照線索信息模板填報線索信息后,實(shí)現(xiàn)線索數(shù)據(jù)的批量上傳導(dǎo)入。實(shí)現(xiàn)

填報錄入新增線索功能,線索信息包括企業(yè)名稱、項(xiàng)目名稱、對接時間、對接方

10

式、企業(yè)對接人、對接地點(diǎn)、企業(yè)亮點(diǎn)、溝通記錄等;同時可對錄入項(xiàng)目進(jìn)行

編輯或刪除。

4、導(dǎo)出招商線索

將當(dāng)前招商列表數(shù)據(jù)按表格模板進(jìn)行數(shù)據(jù)的批量導(dǎo)出。實(shí)現(xiàn)根據(jù)時間節(jié)點(diǎn)

、產(chǎn)業(yè)類型、載體類型、跟進(jìn)階段不同字段批量統(tǒng)計(jì)與導(dǎo)出。

5.2.招商線索管理

1、智能預(yù)測

利用人工智能及大數(shù)據(jù)的技術(shù),構(gòu)建招商預(yù)測模型,前置性發(fā)現(xiàn)有潛在對

外投資選址意向的企業(yè),提升招商工作的效率及成功率。利用不同的招商線索

和動因向用戶推薦潛在標(biāo)的。除多維度組合篩選招商標(biāo)的外,智能預(yù)測推薦的

招商線索分為三類:

1)綜合推薦名單,通過GBDT算法模型,預(yù)測具有潛在對外投資或遷址

的企業(yè);

2)政策疏解驅(qū)動名單,通過匹配模型預(yù)測因地方政策的原因,可能會對

外搬遷的企業(yè);

3)潛在的創(chuàng)業(yè)企業(yè)預(yù)測名單,主要監(jiān)測學(xué)術(shù)人才的研究成果動態(tài)、知名

企業(yè)高管離職動態(tài)等,此類人才在滿足一定條件下將可能會自主創(chuàng)業(yè)成立企

業(yè)。

11

圖:招商線索智能預(yù)測功能示意圖

2、我的線索

基于對長沙地區(qū)的產(chǎn)業(yè)基礎(chǔ)現(xiàn)狀,如產(chǎn)業(yè)定位、區(qū)位優(yōu)勢、產(chǎn)業(yè)政策等,

利用人工智能及大數(shù)據(jù)的技術(shù),建立針對本區(qū)域的企業(yè)投資選址預(yù)測及推薦模

型,模型包含四個類型:領(lǐng)域模型、區(qū)域模型、客群模型、事件模型。區(qū)域線

索定制化模型如下所示:

模型類型模型描述模型示例

基于地區(qū)的產(chǎn)業(yè)定位,針對特定的細(xì)分領(lǐng)域抗體企業(yè)產(chǎn)業(yè)化、

領(lǐng)域模型

進(jìn)行企業(yè)的投資選址預(yù)測及推薦。高端醫(yī)療器械企業(yè)

針對地區(qū)重點(diǎn)關(guān)注的區(qū)域,對該區(qū)域內(nèi)的企業(yè)北京醫(yī)藥產(chǎn)業(yè)外溢

區(qū)域模型

進(jìn)行投資選址預(yù)測及推薦。上海醫(yī)藥產(chǎn)業(yè)外溢

針對地區(qū)重點(diǎn)關(guān)注的客群,進(jìn)行企業(yè)投資選

客群模型跨國藥企來華布局

址預(yù)測及推薦。

針對當(dāng)前行業(yè)內(nèi)熱點(diǎn)事件,發(fā)掘地區(qū)的招商

事件模型4+7招商機(jī)會點(diǎn)

機(jī)會點(diǎn),并進(jìn)行企業(yè)投資選址預(yù)測及推薦。

通過企業(yè)選址意向、地區(qū)匹配度、創(chuàng)新能力、資金實(shí)力、團(tuán)隊(duì)實(shí)力五個

方面綜合評估企業(yè)情況,為招商經(jīng)理評估企業(yè)質(zhì)量以及落地可能性提供參考

依據(jù)。

12

線索標(biāo)的質(zhì)量評價指標(biāo)如下所示:

一級維度二級維度指標(biāo)描述

推薦理由選址意向反應(yīng)企業(yè)對外投資選址的意向需求及原因

地區(qū)匹配度反應(yīng)該企業(yè)與地區(qū)的匹配程度及落地可能性

創(chuàng)新能力反應(yīng)企業(yè)的技術(shù)實(shí)力及產(chǎn)品研發(fā)進(jìn)展

資金實(shí)力通過融資、營收等情況反應(yīng)企業(yè)的資金實(shí)力

團(tuán)隊(duì)實(shí)力通過團(tuán)隊(duì)核心人員背景反應(yīng)企業(yè)的團(tuán)隊(duì)實(shí)力

圖:推薦理由示意圖

圖:我的線索功能示意圖

13

6.應(yīng)用模型層

6.1.應(yīng)用管理系統(tǒng)

1、組織用戶管理

對系統(tǒng)涉及到的政府單位、企業(yè)和產(chǎn)業(yè)園區(qū)等組織單位和用戶賬號進(jìn)行管

理,可以設(shè)置不同機(jī)構(gòu)或部門的子系統(tǒng)管理員,針對機(jī)構(gòu)、部門、職務(wù)、崗位、

個人等進(jìn)行管理。職務(wù)和崗位可進(jìn)行明顯有序的分離??梢栽O(shè)置用戶組,即相同

或類似權(quán)限的人員,可以歸入同一個用戶組,進(jìn)行統(tǒng)一的賦權(quán)。

2、權(quán)限與賬號管理

為政府產(chǎn)業(yè)管理部門以及企業(yè)注冊用戶設(shè)置不同的角色與權(quán)限。

角色管理:根據(jù)業(yè)務(wù)系統(tǒng)功能分發(fā)需求制定相應(yīng)的角色,用戶通過隸屬于某

個角色而獲得相應(yīng)的操作權(quán)限。一個用戶可以隸屬于多個角色,一個角色也可

以下轄多個用戶,角色可以隸屬于應(yīng)用系統(tǒng),也可以獨(dú)立于系統(tǒng)。為角色定義

好相應(yīng)的功能權(quán)限和菜單權(quán)限配置。

角色權(quán)限管理:通過權(quán)限控制建立功能權(quán)限與角色的關(guān)聯(lián)關(guān)系,根據(jù)需求特

點(diǎn)來給用戶角色授權(quán)。

3、用戶注冊管理

為用戶提供注冊管理,用戶注冊包括普通用戶賬號、認(rèn)證用戶賬號兩種注冊

方式。

4、日志管理

提供對系統(tǒng)用戶及管理員登錄、操作記錄日志功能,強(qiáng)化系統(tǒng)的安全性。生

成的安全日志可以供安全管理員進(jìn)行安全審計(jì)。安全管理員與系統(tǒng)管理員完全

獨(dú)立,系統(tǒng)管理員不可訪問系統(tǒng)日志,只有安全管理員可以訪問日志。系統(tǒng)在

初始化的時候具有審計(jì)安全帳號,該帳號能對日志進(jìn)行查看和審計(jì)、導(dǎo)出,系

統(tǒng)管理員不能刪除和操作日志。系統(tǒng)提供完備安全的日志實(shí)現(xiàn)安全審計(jì),日志

覆蓋每個用戶、每個模塊、每條信息,日志內(nèi)容包括了人、時間、空間、操作

類型、操作描述、操作結(jié)果等關(guān)鍵內(nèi)容,并能進(jìn)行查詢統(tǒng)計(jì)。

5、消息管理

通過消息組件為平臺提供系統(tǒng)內(nèi)部消息、短信和郵件的發(fā)送和接收接口服

務(wù),以WebService的方式向各個應(yīng)用系統(tǒng)提供接收和發(fā)送接口。在接收過程中

14

進(jìn)行關(guān)鍵字的過濾,后臺采用任務(wù)的方式進(jìn)行發(fā)送和接收,該服務(wù)從數(shù)據(jù)庫收集

消息,通過短信接口或郵件服務(wù)器進(jìn)行發(fā)送,并將發(fā)送結(jié)果回寫到數(shù)據(jù)。

6、參數(shù)設(shè)置

提供系統(tǒng)運(yùn)行所需各類參數(shù)設(shè)置功能,具體設(shè)置內(nèi)容由項(xiàng)目實(shí)施機(jī)構(gòu)根據(jù)

實(shí)施方案進(jìn)行設(shè)計(jì)。

6.2.產(chǎn)業(yè)鏈圖譜模型

產(chǎn)業(yè)鏈圖譜模型是為重點(diǎn)產(chǎn)業(yè)的產(chǎn)業(yè)評價體系建設(shè)的基礎(chǔ)。根據(jù)行業(yè)特點(diǎn)、

結(jié)合重點(diǎn)發(fā)展環(huán)節(jié)及細(xì)分方向,明確產(chǎn)業(yè)定義、產(chǎn)業(yè)外延及內(nèi)涵、產(chǎn)業(yè)分類及集

群,和產(chǎn)業(yè)鏈重點(diǎn)賽道分析,是建設(shè)長沙市生物醫(yī)療產(chǎn)業(yè)評價體系的基礎(chǔ)。通

過產(chǎn)業(yè)鏈模型的建立,可以通過調(diào)用底層數(shù)據(jù),通過模型進(jìn)行計(jì)算和分析,

形成產(chǎn)業(yè)鏈云圖等各類應(yīng)用所需要的各項(xiàng)指標(biāo)。

產(chǎn)業(yè)定義

產(chǎn)業(yè)鏈圖譜繪制

■專家■論證I

產(chǎn)業(yè)鏈圖譜應(yīng)用

圖:產(chǎn)業(yè)鏈?zhǔn)崂磉^程

15

四、數(shù)據(jù)層建設(shè)方案

1.數(shù)據(jù)體系建設(shè)

項(xiàng)目數(shù)據(jù)來源包括兩個方面:政府相關(guān)部門及園區(qū)提供的政府私域產(chǎn)業(yè)數(shù)

據(jù)和第三方提供的公域產(chǎn)業(yè)數(shù)據(jù)。依托數(shù)據(jù)治理平臺,實(shí)現(xiàn)多來源數(shù)據(jù)的接入、

治理與融合,形成基礎(chǔ)庫、專題庫和應(yīng)用庫的數(shù)據(jù)資產(chǎn),為各項(xiàng)應(yīng)用提供數(shù)據(jù)支

撐。

數(shù)據(jù)體系的建設(shè)主要包括:數(shù)據(jù)集成管理、全程調(diào)度、數(shù)據(jù)開發(fā)管理、數(shù)

據(jù)質(zhì)量管理、數(shù)據(jù)資產(chǎn)管理和數(shù)據(jù)服務(wù)等。

數(shù)

據(jù)直詞檢索I效幅封裝I數(shù)混旋權(quán)I斂雌送I數(shù)底下就

若數(shù)據(jù)總統(tǒng)-

資產(chǎn)日W蕾理I資產(chǎn)森詢I錄入盒控及警

敖數(shù)據(jù)資產(chǎn)敢照示港

數(shù)

數(shù)

?血畛系版本城I聯(lián)市核費(fèi)產(chǎn)體?^$

據(jù)

據(jù)

據(jù)

*;/urn;

閣然曬團(tuán)訐估標(biāo)港&制I3睡運(yùn)

管元效摳效運(yùn)石

稽碑筠管理?匪店告元敕嘉變更I溯源分析堆

管W

.理

tt

據(jù)

榷入適配I數(shù)娜庚數(shù)靠清洗I蚊光觸臺全程M數(shù)摳洞洗1故球呼

處融餌集成

9數(shù)J8接入I救蠢核直政嘉打僑I崛計(jì)亶實(shí)體美聯(lián)I關(guān)系圖譜

數(shù)*

據(jù)

源私陵I端發(fā)及?控信I投促I產(chǎn)促I其他公域數(shù)據(jù)互聯(lián)網(wǎng)數(shù)據(jù)I算他

L1.數(shù)據(jù)集成管理

數(shù)據(jù)集成服務(wù)為平臺提供基礎(chǔ)數(shù)據(jù)服務(wù),并為業(yè)務(wù)應(yīng)用層提供數(shù)據(jù)支撐。

方案提供了標(biāo)準(zhǔn)數(shù)據(jù)采集接口、數(shù)據(jù)抽取、數(shù)據(jù)文件導(dǎo)入功能,并提供數(shù)據(jù)源

管理功能。

1.2.全程調(diào)度

在大數(shù)據(jù)環(huán)境下,每天需要處理海量的任務(wù),多的可以達(dá)到幾十上百萬。任

務(wù)的類型也很繁雜,有MapReduce、HiveSQL、Spark、Java、Shell、Python

、Perl、虛擬節(jié)點(diǎn)等,任務(wù)之間互相依賴且要不同的運(yùn)行環(huán)境。為了解決以上

問題,需要建設(shè)全程調(diào)度系統(tǒng)。

16

1.3.數(shù)據(jù)開發(fā)

根據(jù)主題域的不同,在生產(chǎn)環(huán)境/開發(fā)環(huán)境中,分別建立相對應(yīng)的文件層

級目錄,文件夾名稱即為數(shù)據(jù)層級/主題域/數(shù)據(jù)庫對象的描述信息,葉子節(jié)點(diǎn)

為數(shù)據(jù)庫對象的名稱作為文件的名稱,原則上數(shù)據(jù)開發(fā)與手動任務(wù)目錄下的

文件組織形式應(yīng)該一致。

其中,生產(chǎn)環(huán)境的文件組織關(guān)系與開發(fā)環(huán)境的相同,區(qū)別于生命周期,且生

產(chǎn)環(huán)境基于開發(fā)環(huán)境,開發(fā)環(huán)境將測試成功的數(shù)據(jù)倉庫作業(yè)發(fā)布與生產(chǎn)環(huán)境,

用戶基于生產(chǎn)環(huán)境進(jìn)行進(jìn)一步的應(yīng)用。

1.4.數(shù)據(jù)資產(chǎn)管理

1、資產(chǎn)目錄管理

數(shù)據(jù)目錄管理能夠?qū)崿F(xiàn)數(shù)據(jù)元管理、資源分類與編目、目錄注冊與注銷、目

錄匯聚同步、資源目錄管理、標(biāo)準(zhǔn)落地檢查等功能。

2、數(shù)據(jù)標(biāo)準(zhǔn)管理

數(shù)據(jù)標(biāo)準(zhǔn)管理系統(tǒng)基于標(biāo)準(zhǔn)規(guī)劃、標(biāo)準(zhǔn)管理、標(biāo)準(zhǔn)應(yīng)用進(jìn)行設(shè)計(jì),從標(biāo)準(zhǔn)的

角度規(guī)范數(shù)據(jù)治理元數(shù)據(jù),多角度形成數(shù)據(jù)模型、數(shù)據(jù)操作規(guī)范、數(shù)據(jù)質(zhì)量要

求。主要功能包括標(biāo)準(zhǔn)庫管理、數(shù)據(jù)架構(gòu)管理、元數(shù)據(jù)管理、主數(shù)據(jù)管理等。

3、血緣關(guān)系管理

數(shù)據(jù)血緣是指在數(shù)據(jù)接入、加工融合、流轉(zhuǎn)流通到最終消亡過程中形成的

繼承關(guān)系集合。通過各類數(shù)據(jù)資源間和數(shù)據(jù)項(xiàng)間的繼承關(guān)系進(jìn)行描述和管理,

反應(yīng)數(shù)據(jù)資源在各個環(huán)節(jié)間的繼承關(guān)系。主要包括血緣關(guān)系管理,血緣關(guān)系分

析和血緣關(guān)系查詢等功能。

4、數(shù)據(jù)資產(chǎn)開放

數(shù)據(jù)資產(chǎn)開放模塊通過收集用戶所有數(shù)據(jù)資產(chǎn)信息,完成以下工作:

1)開放數(shù)據(jù)資源目錄體系設(shè)計(jì)和實(shí)施,包括賬號、部門、主題、編目發(fā)布流

程進(jìn)行設(shè)計(jì)并實(shí)施;

2)數(shù)據(jù)編目,對數(shù)據(jù)中心的表進(jìn)行編碼,掛載到數(shù)據(jù)目錄平臺上;

3)通過數(shù)據(jù)血緣探查,幫助用戶完成數(shù)據(jù)資產(chǎn)的上下游梳理和表關(guān)聯(lián)關(guān)系

識別,解決用戶"有哪些數(shù)據(jù)可用"、"到哪里可以找到數(shù)據(jù)"的難題,并且提升數(shù)

據(jù)資源的利用率。

17

1.5.數(shù)據(jù)質(zhì)量管理

1、稽核規(guī)則管理

可以對空值、數(shù)據(jù)合法性、記錄數(shù)、非法值、碼值、數(shù)據(jù)波動、數(shù)值、值域

、數(shù)值重復(fù)、主鍵重復(fù)、主外鍵、業(yè)務(wù)約束等維度進(jìn)行稽核。

2、稽核任務(wù)管理

實(shí)現(xiàn)數(shù)據(jù)稽核任務(wù)的配置管理,以及對稽核日志和采集日志的管理功能。

3、稽核結(jié)果管理

可以按照日期、稽核類別統(tǒng)計(jì)出數(shù)據(jù)質(zhì)量報告,包括稽核類別、度量規(guī)則、

稽核方法等內(nèi)容,可以按照稽核類別對應(yīng)的稽核方法數(shù)的統(tǒng)計(jì)圖、度量規(guī)則和稽

核方法數(shù)目的統(tǒng)計(jì)表等方式對稽核方法進(jìn)行分析。

4、質(zhì)量問題管理

根據(jù)不同稽核方法稽核出的問題數(shù)據(jù)顯示在稽核結(jié)果明細(xì)列表中展現(xiàn),根

據(jù)稽核結(jié)果生成相應(yīng)的問題工單,派發(fā)給相關(guān)負(fù)責(zé)人進(jìn)行整改。

5、評分規(guī)則管理

配置不同稽核規(guī)則所占比重,形成最終分值。

1.6.數(shù)據(jù)服務(wù)

1)API管理

數(shù)據(jù)服務(wù)以API為技術(shù)支撐,為應(yīng)用和信息服務(wù)提供服務(wù)集成與管理支

撐功能。API系統(tǒng)把數(shù)據(jù)資產(chǎn)封裝成應(yīng)用系統(tǒng)可以直接調(diào)用的WebService或

可視化的Web查詢服務(wù),通過服務(wù)的統(tǒng)一管理與調(diào)度,實(shí)現(xiàn)基于授權(quán)的服務(wù)

調(diào)用和信息共享,以屏蔽背后復(fù)雜的數(shù)據(jù)信息資源機(jī)構(gòu),簡化信息共享服務(wù)難

度和復(fù)雜度,支撐各部門、各系統(tǒng)、各角色靈活、多樣的信息應(yīng)用服務(wù)需要。

服務(wù)主要采用標(biāo)準(zhǔn)接口定義的WebService,從而架設(shè)業(yè)務(wù)系統(tǒng)基礎(chǔ)服務(wù)架

構(gòu),充分利用已有的信息化資源,為共享應(yīng)用提供最大化的服務(wù)支撐,以持續(xù)

性發(fā)展方式支撐各個業(yè)務(wù)系統(tǒng)建設(shè)與運(yùn)維。

API系統(tǒng)由基礎(chǔ)數(shù)據(jù)服務(wù)、服務(wù)注冊、服務(wù)發(fā)布、服務(wù)目錄、服務(wù)管理等幾

部分組成。

1、基礎(chǔ)數(shù)據(jù)服務(wù)

18

通過對據(jù)資源進(jìn)行提取和封裝,對外發(fā)布成服務(wù),供其他系統(tǒng)訪問和調(diào)用。

實(shí)現(xiàn)各類數(shù)據(jù)資源對外提供的訪問和管理能力。

2、應(yīng)用組件封裝

1)應(yīng)用接入組件封裝

應(yīng)用接入封裝實(shí)現(xiàn)第三方應(yīng)用接入的統(tǒng)一標(biāo)準(zhǔn)化。定義了各類型應(yīng)用接入

的接口類型,如WebService、Http/Rest>FTP、socket等協(xié)議。

2)查詢分析能力組件封裝

查詢分析能力封裝實(shí)現(xiàn)單次信息查詢、批量信息查詢的內(nèi)部處理邏輯,將系

統(tǒng)內(nèi)部的數(shù)據(jù)根據(jù)查詢請求組裝、規(guī)整;

3、服務(wù)注冊

系統(tǒng)提供基于數(shù)據(jù)庫的服務(wù)注冊功能,將數(shù)據(jù)庫數(shù)據(jù)信息按照統(tǒng)一標(biāo)準(zhǔn)、統(tǒng)

一架構(gòu)對外提供共享服務(wù)。

4、服務(wù)發(fā)布

發(fā)布服務(wù)支持可視化發(fā)布,提供快速的生成相應(yīng)協(xié)議的服務(wù),無需編寫代碼

O

5、服務(wù)目錄

服務(wù)目錄對于系統(tǒng)中的服務(wù)進(jìn)行分類管理,實(shí)現(xiàn)對不同的服務(wù)按照不同的

業(yè)務(wù)快速分類,并可實(shí)現(xiàn)對服務(wù)的查詢和檢索,可以進(jìn)行靈活的服務(wù)分類。

服務(wù)目錄由服務(wù)規(guī)約、服務(wù)資源、服務(wù)資源綁定的數(shù)據(jù)資源信息及數(shù)據(jù)資源

組成,其中一個服務(wù)規(guī)約支持創(chuàng)建多個服務(wù)資源,一個服務(wù)資源使用多個數(shù)據(jù)

資源信息。

6、服務(wù)管理

服務(wù)管理是對服務(wù)組件進(jìn)行維護(hù),提供服務(wù)運(yùn)行環(huán)境并能對外提供訪問接

口,處理服務(wù)請求。

7、數(shù)據(jù)服務(wù)接口類型

1)查詢檢索接口

包括精確查詢、模糊查詢、分類查詢、組合查詢、全文檢索等多種查詢接口

o支持對結(jié)構(gòu)化和非結(jié)構(gòu)化的各類數(shù)據(jù)的查詢接口封裝;支持對已有數(shù)據(jù)查詢

19

接口進(jìn)行二次封裝形成新的數(shù)據(jù)查詢接口;支持對查詢結(jié)果的二次檢索;支持

異步的批量數(shù)據(jù)查詢。

2)數(shù)據(jù)鑒權(quán)接口

數(shù)據(jù)鑒權(quán),基于數(shù)據(jù)的訪問控制規(guī)則,實(shí)現(xiàn)數(shù)據(jù)的訪問權(quán)限鑒別的過程。訪

問控制規(guī)則從內(nèi)容敏感度、數(shù)據(jù)來源、數(shù)據(jù)種類、字段及字段關(guān)系分類四個維

度進(jìn)行資源權(quán)限的控制,資源鑒權(quán)通過用戶的數(shù)據(jù)資源權(quán)限,使用數(shù)據(jù)鑒權(quán)服

務(wù)實(shí)現(xiàn)對數(shù)據(jù)資源的訪問控制。

2)共享交換

共享交換包含數(shù)據(jù)推送服務(wù)和數(shù)據(jù)下載服務(wù)。

1、數(shù)據(jù)推送服務(wù),支持?jǐn)?shù)據(jù)推送規(guī)則、推送標(biāo)準(zhǔn)、數(shù)據(jù)種類、推送周期等參

數(shù)配置,能夠根據(jù)配置進(jìn)行數(shù)據(jù)封裝,將數(shù)據(jù)資源推送給平臺或系統(tǒng)。

2、支持結(jié)構(gòu)化數(shù)據(jù)的批量下載,應(yīng)通過大數(shù)據(jù)量定期打包、小數(shù)據(jù)量實(shí)時打

包方式,實(shí)現(xiàn)基礎(chǔ)數(shù)據(jù)資源庫的全量數(shù)據(jù)下載和增量數(shù)據(jù)下載。

2.數(shù)據(jù)治理服務(wù)

基于產(chǎn)業(yè)大腦的統(tǒng)一規(guī)劃架構(gòu),依托數(shù)據(jù)體系建設(shè),實(shí)現(xiàn)政務(wù)跨部門數(shù)據(jù)、

外部跨機(jī)構(gòu)數(shù)據(jù)、應(yīng)用系統(tǒng)回流數(shù)據(jù)等多來源數(shù)據(jù)的接入、治理與融合,形成基

礎(chǔ)庫、專題庫和應(yīng)用庫的數(shù)據(jù)資產(chǎn),為各項(xiàng)應(yīng)用提供數(shù)據(jù)支撐。

數(shù)據(jù)治理流程包含五個部分,分別為:數(shù)據(jù)架構(gòu)設(shè)計(jì)、數(shù)據(jù)集成開發(fā)、基

礎(chǔ)數(shù)據(jù)治理、專題數(shù)據(jù)治理、應(yīng)用數(shù)據(jù)治理。

數(shù)據(jù)架構(gòu)設(shè)計(jì)數(shù)據(jù)集成開發(fā)專?據(jù)治理頤鶴筑

?睜娜?需求調(diào)研?標(biāo)準(zhǔn)化?數(shù)據(jù)打標(biāo)?他他

?數(shù)倉分層-表創(chuàng)建?斯詆據(jù)開發(fā)

?命名規(guī)更?數(shù)據(jù)接入?數(shù)據(jù)融合'?數(shù)據(jù)核音?分析模型

?開發(fā)棚5?數(shù)據(jù)核直?數(shù)據(jù)核直

圖:數(shù)據(jù)治理流程圖

2.1.數(shù)據(jù)架構(gòu)設(shè)計(jì)

1)整體架構(gòu)設(shè)計(jì)

私域數(shù)據(jù)從長沙市數(shù)據(jù)局獲取、公域數(shù)據(jù)從第三方訂閱,并按照原始格式存

儲入貼源層,支持結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)的存儲。

20

對數(shù)據(jù)進(jìn)行清洗、轉(zhuǎn)換、融合后,形成法人單位、人才信息、宏觀經(jīng)濟(jì)、資

源要素、輿情資訊、標(biāo)準(zhǔn)規(guī)范等基礎(chǔ)數(shù)據(jù)庫。

2)數(shù)據(jù)倉庫模型設(shè)計(jì)

數(shù)據(jù)倉庫模型設(shè)計(jì)主要包括概念設(shè)計(jì)、邏輯結(jié)構(gòu)、物理結(jié)構(gòu)三大模塊。設(shè)計(jì)

步驟如下:

1、確定主題

由于主題與業(yè)務(wù)密切相關(guān),數(shù)據(jù)倉庫模型設(shè)計(jì)之前需要充分熟悉項(xiàng)目業(yè)務(wù)

需求,從而確定數(shù)據(jù)分析或者前端展示的主題。

2、確定量度

在確定了主題以后,還需要考慮分析的技術(shù)指標(biāo)。量度是要統(tǒng)計(jì)的指標(biāo),必

須事先選擇恰當(dāng),基于不同的量度將直接產(chǎn)生不同的決策結(jié)果。

3、確定數(shù)據(jù)粒度

確定量度之后,還需考慮該量度的匯總情況和不同維度下的量度的聚合情

況。

4、確定維度

維度分析的各個角度。需設(shè)計(jì)各個維度的主鍵、層次、級別,盡量減少冗余

O

5、創(chuàng)建事實(shí)表

確定事實(shí)數(shù)據(jù)和維度后,可以考慮加載事實(shí)表。事實(shí)表中將存在維度代理

鍵和各量度,而不應(yīng)該存在描述性信息,即符合“瘦高原則”,即要求事實(shí)表

數(shù)

據(jù)條數(shù)盡量多(粒度最小),而描述性信息盡量少。

3)命名規(guī)范

1、表命名規(guī)范

命名形式:(層次名>_<數(shù)據(jù)內(nèi)容描述,

命名規(guī)則:

使用英文小寫字母,單詞之間用下劃線分開;

數(shù)據(jù)內(nèi)容采用英文簡稱,當(dāng)英文出現(xiàn)多個單詞時,可以用下劃線分割。

2、任務(wù)節(jié)點(diǎn)命名規(guī)范

節(jié)點(diǎn)資源類型命名規(guī)范備注

21

虛擬節(jié)點(diǎn)vt_{虛擬節(jié)點(diǎn)含義}根節(jié)點(diǎn)啟動任務(wù)

同步節(jié)點(diǎn)導(dǎo)入任務(wù)cdp_{源業(yè)務(wù)系統(tǒng)表名}

同步節(jié)點(diǎn)導(dǎo)出任務(wù)cdp_out_{輸出表名}如果存在多個

目標(biāo)庫,可以添加目

標(biāo)庫標(biāo)識后綴

shell節(jié)點(diǎn)sh_{腳本名稱}

mi-節(jié)點(diǎn)mr一{腳本名稱}

ddl資源ddl_{輸出表名}

python資源{腳本名稱}.py

jar{腳本名稱}.jar

跨調(diào)度依賴或檢查chk_{源表名}

3、任務(wù)命名規(guī)范

所有的自動化和手動運(yùn)行任務(wù)均需遵循一定的命名規(guī)范,便于管理。

手動建表任務(wù):CT_[表名],[表名]為所需創(chuàng)建表的表名,

CT為createtable的縮寫;

手動初始化任務(wù):INIT」表名],[表名]為所需初始化的表的表名,INIT為

initialization的縮寫;

數(shù)據(jù)開發(fā)任務(wù):INIT」表名],任務(wù)名為最終生成的正式生產(chǎn)表的表名;

數(shù)據(jù)同步任務(wù):TR_[目標(biāo)數(shù)據(jù)庫的表名],所有的數(shù)據(jù)導(dǎo)出任務(wù)的命名,以

TR打頭,后接目標(biāo)數(shù)據(jù)庫的表名。

4)開發(fā)規(guī)范

1、統(tǒng)一維度

為更好的進(jìn)行數(shù)據(jù)整合,將來自不同數(shù)據(jù)源的數(shù)據(jù)合并到一起,每個維度

需要標(biāo)準(zhǔn)化、統(tǒng)一化,在數(shù)據(jù)倉庫中需要為每個維度建立一致型的標(biāo)準(zhǔn),方便

后續(xù)的數(shù)據(jù)交叉探查。

為每個維度建立標(biāo)準(zhǔn)化的編碼方式,以及數(shù)據(jù)格式,為后續(xù)的數(shù)據(jù)標(biāo)準(zhǔn)化

打下基礎(chǔ);

完成標(biāo)準(zhǔn)化后,需要將各源系統(tǒng)中數(shù)據(jù)中的維度數(shù)據(jù)進(jìn)行關(guān)聯(lián)轉(zhuǎn)換,將不

同數(shù)據(jù)源標(biāo)識同一事物的不同屬性值進(jìn)行統(tǒng)一;

對于不同系統(tǒng)的不同維度,可以通過創(chuàng)建維度的映射關(guān)系表,將其映射到

標(biāo)準(zhǔn)化后的維度上。

2、統(tǒng)一數(shù)據(jù)格式

22

在數(shù)據(jù)清洗過程中,需要將各源系統(tǒng)的數(shù)據(jù)格式進(jìn)行統(tǒng)一,下表為主要的

需統(tǒng)一的數(shù)據(jù)格式。

格式類型統(tǒng)一格式示例

日期YYYY-MM-DD,默認(rèn)為1900-01-012021-07-01

時間HH:MI:SS,默認(rèn)為00:00:0012:13:14

字符串去除頭尾空格,去除回車,默認(rèn)為NULLTrim(,AABB')

整型默認(rèn)為0(可根據(jù)具體業(yè)務(wù)類型調(diào)整)1

雙精度默認(rèn)保留4位小數(shù)(根據(jù)具體業(yè)務(wù)調(diào)整)3.1314

2.2.數(shù)據(jù)集成開發(fā)

1)數(shù)據(jù)集成范圍

1、數(shù)據(jù)歸集方式

本系統(tǒng)采用的對接方式為庫表交換、文件交換和接口服務(wù)等方式。

(1)庫表交換

在數(shù)據(jù)提供方網(wǎng)絡(luò)環(huán)境內(nèi)的節(jié)點(diǎn)機(jī)上配置一個前置數(shù)據(jù)庫,由數(shù)據(jù)庫提供

方根據(jù)技術(shù)規(guī)范組織數(shù)據(jù),并往前置機(jī)數(shù)據(jù)庫中寫入數(shù)據(jù);本系統(tǒng)作為數(shù)據(jù)接

收方,經(jīng)安全交換通道和交換傳輸控制,自動將前置機(jī)的數(shù)據(jù)讀取到數(shù)據(jù)中心

,隨后進(jìn)行后續(xù)的加工處理和使用。

(2)文件交換

在數(shù)據(jù)提供方網(wǎng)絡(luò)環(huán)境內(nèi)的節(jié)點(diǎn)機(jī)上設(shè)置文件交換區(qū),由數(shù)據(jù)提供方定期

生成txt、excel.mdb(數(shù)據(jù)庫文件)或其他約定格式的文件,按要求提交到

文件交換區(qū);經(jīng)安全交換通道和交換傳輸控制,本系統(tǒng)定期讀取文件,解析

并形成結(jié)構(gòu)化數(shù)據(jù),導(dǎo)入到數(shù)據(jù)中心相應(yīng)數(shù)據(jù)表進(jìn)行后續(xù)加工處理。

(3)接口服務(wù)

本系統(tǒng)根據(jù)編制的技術(shù)規(guī)范,開發(fā)并提供公共的接收數(shù)據(jù)的WebService

服務(wù)接口;數(shù)據(jù)提供方按技術(shù)規(guī)范開發(fā)數(shù)據(jù)同步程序,定時調(diào)用服務(wù)接口傳遞

數(shù)據(jù)到本系統(tǒng)。

2、公域數(shù)據(jù)歸集

系統(tǒng)通過向第三方訂閱推送的方式,歸集第三方的公域產(chǎn)業(yè)數(shù)據(jù),可歸集

的數(shù)據(jù)資源如下:

數(shù)據(jù)庫數(shù)據(jù)維度核心字段

23

機(jī)構(gòu)庫公司基本資料表企業(yè)名稱、成立日期、所屬行業(yè)、主營業(yè)務(wù)、經(jīng)營范圍

、公司簡介、官網(wǎng)、聯(lián)系電話、注冊地址、法定代表

人、變更記錄、管理團(tuán)隊(duì)、對外投資、分支機(jī)構(gòu)

科研機(jī)構(gòu)表機(jī)構(gòu)名稱、地址、領(lǐng)域、簡介、成立日期、類別

交易代碼、公司名稱、報告期、總資產(chǎn)、總負(fù)債、利潤

企業(yè)財(cái)務(wù)表

專利表專利名稱、申請人、申請時間、法律狀態(tài)

人才庫人才基本資料表姓名、單位、性別、簡歷、任職經(jīng)歷、人才分類

文獻(xiàn)表文獻(xiàn)名稱、作者、發(fā)表時間、摘要

項(xiàng)目名稱、項(xiàng)目編號、負(fù)責(zé)人、牽頭單位、公示日期

重點(diǎn)研發(fā)項(xiàng)目表

、計(jì)劃專項(xiàng)類型

交易庫中標(biāo)信息表中標(biāo)日期、中標(biāo)人、標(biāo)的、中標(biāo)金額、正文

證券代碼表交易代碼、公司名稱、上市日期、交易市場

融資事件表事件ID、融資機(jī)構(gòu)名稱、融資時間、融資金額

產(chǎn)品庫藥物臨床試驗(yàn)表登記號、適應(yīng)癥、題目、編號、申請受理號、藥物名稱

、類型、申辦者名稱、聯(lián)系方式、試驗(yàn)分期、研究者

姓名、單位、電話

注冊號、批準(zhǔn)日期、注冊人名稱、預(yù)期用途、審批部門

國產(chǎn)藥品表

、產(chǎn)品名稱、結(jié)構(gòu)組成、規(guī)格型號

受理號、公示時間、申請人、產(chǎn)品名稱、審核單位、同

器械優(yōu)先審評表

意理由

載體庫園區(qū)基本資料表載體名、地址、面積、經(jīng)緯度、運(yùn)營主體

實(shí)驗(yàn)室基本資料

實(shí)驗(yàn)室名稱、級別、成立日期、簡介、類型

宏觀統(tǒng)計(jì)數(shù)值表截止日期、指標(biāo)名稱、數(shù)值

宏觀庫

政策表標(biāo)題、發(fā)布時間、正文、發(fā)布部門、文號、政策類型

企業(yè)榜單表排名類型、排名、企業(yè)名稱、數(shù)值

產(chǎn)業(yè)庫

行業(yè)統(tǒng)計(jì)數(shù)值表截止日期、指標(biāo)名稱、數(shù)值

資訊庫新聞表標(biāo)題、發(fā)布時間、正文、新聞類型

會議活動表標(biāo)題、會議時間、地址、簡介、鏈接

研究報告表標(biāo)題、發(fā)布日期、作者、正文

3、私域數(shù)據(jù)歸集

私域數(shù)據(jù)主要是無法從公開途徑獲得數(shù)據(jù),包括用于統(tǒng)計(jì)產(chǎn)業(yè)規(guī)模的產(chǎn)值

稅收、發(fā)展目標(biāo)等統(tǒng)計(jì)數(shù)據(jù),以及企業(yè)的經(jīng)營收入、稅收、員工數(shù)量等微

觀數(shù)據(jù)。通過這些數(shù)據(jù)可以更完整體現(xiàn)區(qū)域產(chǎn)業(yè)發(fā)展規(guī)模、提高企業(yè)畫像的信

24

息維度,更精準(zhǔn)監(jiān)測企業(yè)發(fā)展拐點(diǎn)等動態(tài),這些數(shù)據(jù)主要分布在稅務(wù)、統(tǒng)計(jì)等

政府部門。相關(guān)數(shù)據(jù)的使用申請,已經(jīng)與長沙市數(shù)據(jù)資源局溝通,將由建設(shè)方

協(xié)同湘江新區(qū)和長沙市產(chǎn)業(yè)部門,按照長沙市政府信息化項(xiàng)目相關(guān)流程,向

長沙市數(shù)據(jù)資源局提出申請。

4、其他來源接入

按照業(yè)務(wù)系統(tǒng)和需求,接入其他來源的數(shù)據(jù),如企業(yè)自主填報等。

2)數(shù)據(jù)接入實(shí)施流程

1、調(diào)研準(zhǔn)備階段

在這個階段需要準(zhǔn)備以下工作:用戶的總體了解;技術(shù)方案準(zhǔn)備;相關(guān)培訓(xùn)

資料的準(zhǔn)備(行業(yè)成功案例和經(jīng)驗(yàn)總結(jié))。

2、業(yè)務(wù)調(diào)研

在本階段調(diào)研中,主要是了解用戶當(dāng)前的業(yè)務(wù)流程和系統(tǒng)概況,并搜集相

關(guān)的資料和數(shù)據(jù),以準(zhǔn)備下一階段的分析。

3、系統(tǒng)調(diào)研

本階段要細(xì)致的分析整理用戶報表及業(yè)務(wù)系統(tǒng)數(shù)據(jù),仔細(xì)揣摩決策系統(tǒng)各

級用戶關(guān)心的問題;構(gòu)建分析模型原型,與用戶之間互動討論,確定分析指標(biāo)

、維度和組合規(guī)則及計(jì)算公式。

4、整理分析模型

通過原型收集了用戶需求后,討論修改后,確認(rèn)相應(yīng)的數(shù)據(jù)來源,完成分析

模型描述。

5、審核確認(rèn)

經(jīng)過對不同的訪問對象進(jìn)行訪問后,基于訪問記錄對數(shù)據(jù)倉庫項(xiàng)目所涉及

到的分析主題范圍、系統(tǒng)要求等問題進(jìn)行討論、整理,形成需求分析文檔。最后

提交給客戶進(jìn)行審核確認(rèn)。

6、需求調(diào)研文檔輸出

項(xiàng)目數(shù)據(jù)需求調(diào)研完成后,輸出項(xiàng)目數(shù)據(jù)需求調(diào)研文檔,調(diào)研文檔應(yīng)包含

現(xiàn)有系統(tǒng)業(yè)務(wù)簡介、應(yīng)用場景、數(shù)據(jù)表結(jié)構(gòu)、大數(shù)據(jù)應(yīng)用需求表。

7、源數(shù)據(jù)接入

25

在ODS(源數(shù)據(jù)接入層)層創(chuàng)建與源系統(tǒng)中表結(jié)構(gòu)完全一致的數(shù)據(jù)表,并

指定分區(qū)字段。由于創(chuàng)建表是一次性操作,所以使用手動任務(wù)完成,為每個表

創(chuàng)建一個手動任務(wù),將手動任務(wù)發(fā)布到生產(chǎn)環(huán)境,并手動觸發(fā)執(zhí)行,完成數(shù)據(jù)表

的創(chuàng)建。

在ODS(源數(shù)據(jù)接入層)層配置數(shù)據(jù)源,創(chuàng)建數(shù)據(jù)接入任務(wù),配置數(shù)據(jù)接

入的任務(wù)(源表、目的表、分區(qū)字段、where條件、調(diào)度周期等),將任務(wù)發(fā)布到

生產(chǎn)環(huán)境,參與調(diào)度。

8、數(shù)據(jù)核查

在ODS

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論