版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
生物醫(yī)療產(chǎn)業(yè)大腦項(xiàng)目建設(shè)方案
一、建設(shè)目標(biāo)、規(guī)模與內(nèi)容..........................................2
1.建設(shè)目標(biāo)....................................................2
2.建設(shè)規(guī)模....................................................2
3.建設(shè)內(nèi)容....................................................2
二、總體架構(gòu)設(shè)計(jì)..................................................3
三、業(yè)務(wù)應(yīng)用及應(yīng)用模型建設(shè)方案....................................3
1.產(chǎn)業(yè)鏈云圖..................................................3
2.賽道分析選擇................................................6
3.產(chǎn)業(yè)運(yùn)行監(jiān)測................................................7
4.智能報告系統(tǒng)................................................9
5.智能招商助手...............................................10
6.應(yīng)用模型層.................................................14
四、數(shù)據(jù)層建設(shè)方案...............................................16
1.數(shù)據(jù)體系建設(shè)...............................................16
2.數(shù)據(jù)治理服務(wù)...............................................20
五、安全體系建設(shè)方案.............................................32
1.概述.......................................................32
2.安全體系設(shè)計(jì)...............................................32
3.安全管理體系...............................................37
六、網(wǎng)絡(luò)系統(tǒng)建設(shè)方案.............................................39
七、備份系統(tǒng)建設(shè)方案.............................................40
八、運(yùn)行維護(hù)體系建設(shè)方案.........................................41
1.運(yùn)行維護(hù)服務(wù)原則...........................................41
2.運(yùn)行維護(hù)服務(wù)規(guī)范...........................................42
3.運(yùn)行維護(hù)服務(wù)內(nèi)容...........................................42
九、軟硬件選型方案...............................................44
1
一、建設(shè)目標(biāo)、規(guī)模與內(nèi)容
1.建設(shè)目標(biāo)
建設(shè)生物醫(yī)療產(chǎn)業(yè)大腦項(xiàng)目,利用云計(jì)算、大數(shù)據(jù)、人工智能等新一代信息
技術(shù)手段,在前期產(chǎn)業(yè)鏈課題研究成果基礎(chǔ)上,將長沙市生物醫(yī)療產(chǎn)業(yè)信息進(jìn)
行數(shù)字化,構(gòu)建產(chǎn)業(yè)鏈云圖、賽道分析選擇、產(chǎn)業(yè)運(yùn)行監(jiān)測、智能報告系統(tǒng)、智
能招商助手等應(yīng)用,在線展示長沙市產(chǎn)業(yè)發(fā)展現(xiàn)狀、相關(guān)產(chǎn)業(yè)政策、項(xiàng)目用地
等信息,實(shí)現(xiàn)產(chǎn)業(yè)鏈精準(zhǔn)招商引商,加快產(chǎn)業(yè)深度革新發(fā)展。
2.建設(shè)規(guī)模
本項(xiàng)目覆蓋長沙市生物醫(yī)療產(chǎn)業(yè)相關(guān)的,以湘江數(shù)字健康產(chǎn)業(yè)園為核心,
瀏陽經(jīng)濟(jì)技術(shù)開發(fā)區(qū)、長沙高新技術(shù)產(chǎn)業(yè)開發(fā)區(qū)、金霞經(jīng)濟(jì)開發(fā)區(qū)、望城經(jīng)濟(jì)
技術(shù)開發(fā)區(qū)和隆平高科技園為主要集聚區(qū),寧鄉(xiāng)經(jīng)濟(jì)技術(shù)開發(fā)區(qū)、寧鄉(xiāng)高新技
術(shù)產(chǎn)業(yè)園區(qū)、長沙經(jīng)濟(jì)技術(shù)開發(fā)區(qū)多點(diǎn)分布的“一核兩區(qū)三園多點(diǎn)”的生物醫(yī)
療產(chǎn)業(yè),以及生物醫(yī)療相關(guān)的企業(yè)。
本項(xiàng)目將圍繞生物醫(yī)療產(chǎn)業(yè)建設(shè)應(yīng)用場景,覆蓋長沙市的生物醫(yī)療產(chǎn)業(yè)園
區(qū)和企業(yè),面向長沙市工信、湘江新區(qū)和長沙市各生物醫(yī)療產(chǎn)業(yè)園區(qū)等用戶。
3.建設(shè)內(nèi)容
針對本項(xiàng)目主要建設(shè)內(nèi)容分為二大塊:
1)針對長沙市生物醫(yī)療產(chǎn)業(yè)大數(shù)據(jù)進(jìn)行數(shù)據(jù)治理建設(shè)。
2)建設(shè)生物醫(yī)療產(chǎn)業(yè)大腦五大應(yīng)用系統(tǒng)。分別為產(chǎn)業(yè)鏈云圖、賽道分析
選擇、產(chǎn)業(yè)運(yùn)行監(jiān)測、智能報告系統(tǒng)、智能招商助手等。
通過匯聚私域產(chǎn)業(yè)數(shù)據(jù)、公域產(chǎn)業(yè)數(shù)據(jù)等,對結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù)
進(jìn)行存儲與融合,形成各類標(biāo)準(zhǔn)化主題庫,為應(yīng)用系統(tǒng)提供支撐;建設(shè)產(chǎn)業(yè)
鏈云圖、賽道分析選擇、產(chǎn)業(yè)運(yùn)行監(jiān)測、智能報告系統(tǒng)、智能招商助手等應(yīng)
用。
2
二、總體架構(gòu)設(shè)計(jì)
本次項(xiàng)目建設(shè),將構(gòu)建長沙市生物醫(yī)療產(chǎn)業(yè)數(shù)據(jù)基礎(chǔ)和各類分析模型,在
此基礎(chǔ)上構(gòu)建產(chǎn)業(yè)鏈云圖、賽道分析選擇、產(chǎn)業(yè)運(yùn)行監(jiān)測、智能報告系統(tǒng)、智能
招商助手等應(yīng)用。
業(yè)□
m大JTWeb?-*g
fni系
s筑
運(yùn)
,
ffmi
M曲南
量
星-Mrtm?
|g?W||<WMW|[?->][■WB]-
--------------「B?人jmKMdETittauRy-
MXJI
;友演.ttxt.人,i
BMVJi?*>jMM?±ir^riiM;???■(
三、業(yè)務(wù)應(yīng)用及應(yīng)用模型建設(shè)方案
1.產(chǎn)業(yè)鏈云圖
構(gòu)建長沙市生物醫(yī)療產(chǎn)業(yè)全景,涵蓋產(chǎn)業(yè)鏈、技術(shù)鏈、創(chuàng)新鏈、資本鏈
、人才鏈、空間連,形成產(chǎn)業(yè)鏈云圖,展示產(chǎn)業(yè)鏈構(gòu)成、資源要素、創(chuàng)新成
果和空間布局。展示信息包括:產(chǎn)業(yè)載體在各區(qū)的落圖情況及載體介紹;重
點(diǎn)園區(qū)在各區(qū)的落圖情況;重點(diǎn)企業(yè)(全部、規(guī)上、高新、上市企業(yè))在各區(qū)的
熱力分布情況;創(chuàng)新資源(如功能服務(wù)平臺、科研院所等)在各區(qū)的落圖情況;產(chǎn)
業(yè)評價指數(shù);企業(yè)主營分布;企業(yè)趨勢;企業(yè)排名;國家/省市級人才分布;核心
產(chǎn)業(yè)投資分布;核心產(chǎn)業(yè)融資分布;技術(shù)分布;園區(qū)產(chǎn)業(yè)配套情況;產(chǎn)品分布
;核心產(chǎn)業(yè)的產(chǎn)量統(tǒng)計(jì);核心產(chǎn)業(yè)的產(chǎn)值統(tǒng)計(jì)等信息。
1.1.產(chǎn)業(yè)鏈
通過數(shù)字化落圖的方式,以可視化的方式分別展示產(chǎn)業(yè)鏈上下游,包含原
材料供應(yīng)、外包服務(wù)、產(chǎn)業(yè)服務(wù)、生產(chǎn)研發(fā)、產(chǎn)品應(yīng)用,并展示每個產(chǎn)業(yè)鏈環(huán)節(jié)
3
中企業(yè)名單、高端人才(諾獎、院士、國外院士、千人計(jì)劃)、融資(各輪融資)、
專利(獲得國內(nèi)、國際專利數(shù)量),可以直觀的展現(xiàn)整個產(chǎn)業(yè)鏈的全貌。
圖:細(xì)胞/基因治療產(chǎn)業(yè)鏈
1.2.技術(shù)鏈
洞察產(chǎn)業(yè)發(fā)展取得的技術(shù)成果,并進(jìn)行數(shù)字化落圖,通過對重點(diǎn)成果研發(fā)管
線、細(xì)分類型、增長趨勢、聚集態(tài)勢進(jìn)行分析,通過可視化的方式直觀的了解
產(chǎn)業(yè)技術(shù)成果的發(fā)展水平。
圖:生物醫(yī)療技術(shù)鏈
1.3.創(chuàng)新鏈
將創(chuàng)新要素進(jìn)行數(shù)字化落圖,以可視化的方式對產(chǎn)業(yè)研發(fā)環(huán)節(jié)梳理,對研
發(fā)過程中各環(huán)節(jié)的創(chuàng)新成果、研發(fā)資源進(jìn)行統(tǒng)計(jì),從創(chuàng)新企業(yè)、服務(wù)企業(yè)、科研
機(jī)構(gòu)、創(chuàng)新人才、創(chuàng)新資本、成果價值等創(chuàng)新要素的維度,全面分析在創(chuàng)新過
程中投入產(chǎn)出情況,直觀呈現(xiàn)每個產(chǎn)業(yè)研發(fā)創(chuàng)新階段服務(wù)資源的分布,通過數(shù)
4
量統(tǒng)計(jì)結(jié)果反映出產(chǎn)業(yè)研發(fā)整體處于的階段,從而對產(chǎn)業(yè)未來發(fā)展的趨勢、潛力
和新產(chǎn)品上市的周期進(jìn)行判斷。
圖:創(chuàng)新資源分布
1.4.資本鏈
通過數(shù)字化和可視化的方式,展示產(chǎn)業(yè)歷年企業(yè)融資、并購、上市等各類資
本動態(tài)及空間分布,各領(lǐng)域、各輪次融資數(shù)量和變化趨勢等產(chǎn)業(yè)資本信息,體
現(xiàn)產(chǎn)業(yè)資本活躍度,展示金融資本對產(chǎn)業(yè)發(fā)展的創(chuàng)新支撐。同時通過對資本事
件的統(tǒng)計(jì)與分析,使工信局及產(chǎn)業(yè)管理部門實(shí)時掌握產(chǎn)業(yè)資本動態(tài),做好重點(diǎn)
企業(yè)發(fā)展跟蹤。
圖:生物醫(yī)療產(chǎn)業(yè)投融資情況
1.5.人才鏈
通過數(shù)字化和可視化的方式,展示產(chǎn)業(yè)高端人才聚集和分布態(tài)勢,以高端
人才數(shù)量、稱號、級別、領(lǐng)域、崗位等維度對高端人才進(jìn)行統(tǒng)計(jì)分析,在地理
5
空間上展示人才遷徙進(jìn)程和人才聚集現(xiàn)狀,并通過實(shí)時更新的人才畫像加深對
高端人才的了解。
圖:人才分布情況
1.6.空間鏈
通過數(shù)字化和可視化的方式,來展示長沙市生物醫(yī)療產(chǎn)業(yè)發(fā)展環(huán)境,通過
地圖承載和分析產(chǎn)業(yè)要素的分布情況,展示產(chǎn)業(yè)發(fā)展環(huán)境及交通區(qū)位,展示產(chǎn)業(yè)
載體、人才資源、企業(yè)資源、服務(wù)資源、專業(yè)配套等資源在空間上的分布情況
,體現(xiàn)區(qū)域產(chǎn)業(yè)發(fā)展資源優(yōu)勢,提升招商工作成效。
圖:產(chǎn)業(yè)分布情況
2.賽道分析選擇
對長沙市生物醫(yī)療產(chǎn)業(yè)的整體情況做數(shù)字化和可視化呈現(xiàn)。包括生物醫(yī)療
產(chǎn)業(yè)市場增速、國際國內(nèi)龍頭的數(shù)量、本地重點(diǎn)企業(yè)、人才、成果、融資的情況
6
,可發(fā)現(xiàn)具體賽道對的發(fā)展前景、競爭程度和自身潛力。可具體了解生物醫(yī)療
產(chǎn)業(yè)細(xì)分領(lǐng)域的市場前景預(yù)測,同時可對比長沙市生物醫(yī)療產(chǎn)業(yè)的自身實(shí)力和
競爭程度。對于重點(diǎn)細(xì)分領(lǐng)域,實(shí)時監(jiān)測進(jìn)入市場時間、市場占有率、研發(fā)資
源及創(chuàng)新資源(創(chuàng)新人才、創(chuàng)新專利、論文文獻(xiàn))等資源要素,基于產(chǎn)業(yè)評估模
型從供應(yīng)鏈的上、中、下游分析區(qū)域產(chǎn)業(yè)發(fā)展瓶頸(卡脖子環(huán)節(jié))及產(chǎn)業(yè)發(fā)展優(yōu)勢
圖:賽道分析
3.產(chǎn)業(yè)運(yùn)行監(jiān)測
3.1.產(chǎn)業(yè)動態(tài)監(jiān)測
從宏觀、中觀、微觀三個層面,客觀、全面地監(jiān)測、分析、評估產(chǎn)業(yè)發(fā)展情
況。通過數(shù)據(jù)指標(biāo)實(shí)現(xiàn)對產(chǎn)業(yè)數(shù)據(jù)的統(tǒng)計(jì)匯總,同時指標(biāo)的可視化圖表展示指
標(biāo)表現(xiàn)出產(chǎn)業(yè)各地域發(fā)展?fàn)顩r,第一時間掌握產(chǎn)業(yè)重點(diǎn)發(fā)展領(lǐng)域本地區(qū)、全國
、全球的動態(tài)信息。
圖:產(chǎn)業(yè)動態(tài)
7
3.2.企業(yè)動態(tài)監(jiān)測
基于企業(yè)所處細(xì)分領(lǐng)域和產(chǎn)業(yè)鏈環(huán)節(jié),建立企業(yè)發(fā)展拐點(diǎn)預(yù)測模型,根據(jù)
企業(yè)創(chuàng)新成果、業(yè)務(wù)收入、盈利水平、投融資情況以及相應(yīng)市場分析,形成拐點(diǎn)
監(jiān)測預(yù)警信息判斷企業(yè)是否進(jìn)入發(fā)展瓶頸期或即將進(jìn)入快速發(fā)展期,展示監(jiān)測
事件類型、重點(diǎn)領(lǐng)域分布圖、監(jiān)測動態(tài)、重點(diǎn)監(jiān)測企業(yè)。使產(chǎn)業(yè)管理部門針對
性的為企業(yè)制定幫扶政策,以及匹配服務(wù)資源和金融資源。
對與輿情(工商變更、人事變動、高管調(diào)研、高層言論、投融資事件、子公
司設(shè)立、產(chǎn)品研發(fā)進(jìn)展、產(chǎn)品上市、產(chǎn)品召回、違規(guī)違法)相關(guān)的各類企業(yè)風(fēng)險
進(jìn)行重點(diǎn)監(jiān)測。當(dāng)出現(xiàn)重大投資并購、通報處罰、違規(guī)違法等重大經(jīng)營、法律
風(fēng)險事件時,系統(tǒng)將自動預(yù)警并實(shí)時推送給相關(guān)產(chǎn)業(yè)管理人員,以便及時采
取相應(yīng)措施。
3.3.一企一檔
通過對長沙市生物醫(yī)療產(chǎn)業(yè)數(shù)據(jù)標(biāo)簽體系和模型算法的構(gòu)建,繪制豐富立
體、實(shí)施動態(tài)的企業(yè)數(shù)字畫像檔案,并根據(jù)企業(yè)發(fā)展評價模型,生成企業(yè)質(zhì)量評
價檔案,通過企業(yè)榜單實(shí)現(xiàn)對企業(yè)的分類識別和發(fā)展拐點(diǎn)監(jiān)控,同時對企業(yè)需
求進(jìn)行實(shí)行采集預(yù)測,為企業(yè)培育發(fā)展提供有力服務(wù)支撐依據(jù)。
將企業(yè)信息、企業(yè)投入、企業(yè)產(chǎn)出、企業(yè)發(fā)展和新聞動態(tài)進(jìn)行分類展示,具
體包括:
企業(yè)信息。包括企業(yè)工商信息、人才團(tuán)隊(duì)、資質(zhì)榮譽(yù)等信息。
8
企業(yè)投入。包括企業(yè)資金投入(企業(yè)法人代表、凈資產(chǎn)、研發(fā)投入)和人員
投入(員工數(shù)量、科研人員數(shù)量)等信息。
企業(yè)產(chǎn)出。包括企業(yè)經(jīng)濟(jì)產(chǎn)出(營業(yè)收入)、產(chǎn)品成果、專利成果(企業(yè)發(fā)明
專利、發(fā)明授權(quán))等信息。
企業(yè)發(fā)展。包括企業(yè)對外投資和企業(yè)融資情況等信息。
新聞動態(tài)。實(shí)時展示與企業(yè)相關(guān)的新聞動態(tài),如工商變更、產(chǎn)業(yè)外溢、新
聞輿情、法律風(fēng)險等信息。
EZ3
頭歷企/0?企業(yè)&?&SB?力企/黑--1
皿..?二
?18!
,<?<
?..W?<??s?<>v
?>??■<???—―
?"A*?"0*tmm<tw>?■>■
eE.
?*>???■
****?<1*J?**??VMm*
?**???wait*<?vw?r?
?m*u*v??'?,>*??*MM*
?<)?
??**??《?
?.MW<?<M?MM<???????3”<?W,
圖:企業(yè)榜單
4.智能報告系統(tǒng)
基于對產(chǎn)業(yè)發(fā)展中產(chǎn)業(yè)載體、產(chǎn)業(yè)要素歷史成果分析,通過沉淀打磨后的
報告模板定時定期自動生成,消除人工收集整理信息的復(fù)雜流程,減輕手工編
制報告的工作量,提升出具產(chǎn)業(yè)報告的效率。
根據(jù)「產(chǎn)業(yè)總覽」「產(chǎn)業(yè)載體」「重點(diǎn)企業(yè)」「創(chuàng)新資源」四個固定模版
,按產(chǎn)業(yè)分類、每月定時生成相關(guān)報告,可以根據(jù)地區(qū)和生成時間進(jìn)行篩選。
同時提供即時生成數(shù)據(jù)報告的功能,隨時幫助用戶了解目標(biāo)區(qū)域產(chǎn)業(yè)的總
覽概況、產(chǎn)業(yè)載體、重點(diǎn)企業(yè)、創(chuàng)新資源明細(xì)信息。系統(tǒng)的進(jìn)行數(shù)據(jù)獲取及校
驗(yàn),釋放人力資源,保證數(shù)據(jù)質(zhì)量。
根據(jù)「產(chǎn)業(yè)運(yùn)行」「企業(yè)動態(tài)」兩個固定模版,按產(chǎn)業(yè)分類、每月定時生
成相關(guān)報告,可以根據(jù)地區(qū)和生成時間進(jìn)行篩選。簡化報告編制操作難度,提
升工作效率。
9
新一代信息技術(shù)
聯(lián)汽車、
M34ftA)4
生命裔端裝*助透新徒界相節(jié)味*保
ZF-卜t*j
岸色食品
圖:產(chǎn)業(yè)報告
5.智能招商助手
5.1.招商管理工作臺
1、招商列表
實(shí)現(xiàn)按條件對招商線索數(shù)據(jù)進(jìn)行檢索查詢,列表字段包括線索名稱、線索
簡介、發(fā)布時間、意向區(qū)域、載體類型、所需面積、所屬產(chǎn)業(yè)、建議對接部門等
,同時可對錄入項(xiàng)目進(jìn)行編輯或刪除。
2、線索跟進(jìn)
對招商線索的跟進(jìn)情況進(jìn)行信息填報及線索流轉(zhuǎn)處理。設(shè)置線索跟進(jìn)記錄
填報功能,內(nèi)容包括招商經(jīng)理姓名、對接時間、對接方式、跟進(jìn)階段、企業(yè)對接
人、對接地點(diǎn)、溝通記錄。每次記錄按時排序形成對接記錄,可查看過往的所
有跟進(jìn)記錄信息。同時,系統(tǒng)支持對錄入記錄進(jìn)行編輯與刪除。
招商管理部門可以將線索分發(fā)給下轄區(qū)縣/園區(qū),追蹤下轄區(qū)縣/園區(qū)對線
索的跟進(jìn)情況,統(tǒng)籌管控整體招商進(jìn)展。
招商線索對接反饋,包括招商人員與標(biāo)的企業(yè)聯(lián)系情況、線索準(zhǔn)確性、企業(yè)
投資遷址意愿等,一方面體現(xiàn)招商人員工作績效,另一方面有助于調(diào)整優(yōu)化智
能推薦算法模型,進(jìn)一步提高推薦的精準(zhǔn)性。
3、上傳招商線索
按照線索信息模板填報線索信息后,實(shí)現(xiàn)線索數(shù)據(jù)的批量上傳導(dǎo)入。實(shí)現(xiàn)
填報錄入新增線索功能,線索信息包括企業(yè)名稱、項(xiàng)目名稱、對接時間、對接方
10
式、企業(yè)對接人、對接地點(diǎn)、企業(yè)亮點(diǎn)、溝通記錄等;同時可對錄入項(xiàng)目進(jìn)行
編輯或刪除。
4、導(dǎo)出招商線索
將當(dāng)前招商列表數(shù)據(jù)按表格模板進(jìn)行數(shù)據(jù)的批量導(dǎo)出。實(shí)現(xiàn)根據(jù)時間節(jié)點(diǎn)
、產(chǎn)業(yè)類型、載體類型、跟進(jìn)階段不同字段批量統(tǒng)計(jì)與導(dǎo)出。
5.2.招商線索管理
1、智能預(yù)測
利用人工智能及大數(shù)據(jù)的技術(shù),構(gòu)建招商預(yù)測模型,前置性發(fā)現(xiàn)有潛在對
外投資選址意向的企業(yè),提升招商工作的效率及成功率。利用不同的招商線索
和動因向用戶推薦潛在標(biāo)的。除多維度組合篩選招商標(biāo)的外,智能預(yù)測推薦的
招商線索分為三類:
1)綜合推薦名單,通過GBDT算法模型,預(yù)測具有潛在對外投資或遷址
的企業(yè);
2)政策疏解驅(qū)動名單,通過匹配模型預(yù)測因地方政策的原因,可能會對
外搬遷的企業(yè);
3)潛在的創(chuàng)業(yè)企業(yè)預(yù)測名單,主要監(jiān)測學(xué)術(shù)人才的研究成果動態(tài)、知名
企業(yè)高管離職動態(tài)等,此類人才在滿足一定條件下將可能會自主創(chuàng)業(yè)成立企
業(yè)。
11
圖:招商線索智能預(yù)測功能示意圖
2、我的線索
基于對長沙地區(qū)的產(chǎn)業(yè)基礎(chǔ)現(xiàn)狀,如產(chǎn)業(yè)定位、區(qū)位優(yōu)勢、產(chǎn)業(yè)政策等,
利用人工智能及大數(shù)據(jù)的技術(shù),建立針對本區(qū)域的企業(yè)投資選址預(yù)測及推薦模
型,模型包含四個類型:領(lǐng)域模型、區(qū)域模型、客群模型、事件模型。區(qū)域線
索定制化模型如下所示:
模型類型模型描述模型示例
基于地區(qū)的產(chǎn)業(yè)定位,針對特定的細(xì)分領(lǐng)域抗體企業(yè)產(chǎn)業(yè)化、
領(lǐng)域模型
進(jìn)行企業(yè)的投資選址預(yù)測及推薦。高端醫(yī)療器械企業(yè)
針對地區(qū)重點(diǎn)關(guān)注的區(qū)域,對該區(qū)域內(nèi)的企業(yè)北京醫(yī)藥產(chǎn)業(yè)外溢
區(qū)域模型
進(jìn)行投資選址預(yù)測及推薦。上海醫(yī)藥產(chǎn)業(yè)外溢
針對地區(qū)重點(diǎn)關(guān)注的客群,進(jìn)行企業(yè)投資選
客群模型跨國藥企來華布局
址預(yù)測及推薦。
針對當(dāng)前行業(yè)內(nèi)熱點(diǎn)事件,發(fā)掘地區(qū)的招商
事件模型4+7招商機(jī)會點(diǎn)
機(jī)會點(diǎn),并進(jìn)行企業(yè)投資選址預(yù)測及推薦。
通過企業(yè)選址意向、地區(qū)匹配度、創(chuàng)新能力、資金實(shí)力、團(tuán)隊(duì)實(shí)力五個
方面綜合評估企業(yè)情況,為招商經(jīng)理評估企業(yè)質(zhì)量以及落地可能性提供參考
依據(jù)。
12
線索標(biāo)的質(zhì)量評價指標(biāo)如下所示:
一級維度二級維度指標(biāo)描述
推薦理由選址意向反應(yīng)企業(yè)對外投資選址的意向需求及原因
地區(qū)匹配度反應(yīng)該企業(yè)與地區(qū)的匹配程度及落地可能性
創(chuàng)新能力反應(yīng)企業(yè)的技術(shù)實(shí)力及產(chǎn)品研發(fā)進(jìn)展
資金實(shí)力通過融資、營收等情況反應(yīng)企業(yè)的資金實(shí)力
團(tuán)隊(duì)實(shí)力通過團(tuán)隊(duì)核心人員背景反應(yīng)企業(yè)的團(tuán)隊(duì)實(shí)力
圖:推薦理由示意圖
圖:我的線索功能示意圖
13
6.應(yīng)用模型層
6.1.應(yīng)用管理系統(tǒng)
1、組織用戶管理
對系統(tǒng)涉及到的政府單位、企業(yè)和產(chǎn)業(yè)園區(qū)等組織單位和用戶賬號進(jìn)行管
理,可以設(shè)置不同機(jī)構(gòu)或部門的子系統(tǒng)管理員,針對機(jī)構(gòu)、部門、職務(wù)、崗位、
個人等進(jìn)行管理。職務(wù)和崗位可進(jìn)行明顯有序的分離??梢栽O(shè)置用戶組,即相同
或類似權(quán)限的人員,可以歸入同一個用戶組,進(jìn)行統(tǒng)一的賦權(quán)。
2、權(quán)限與賬號管理
為政府產(chǎn)業(yè)管理部門以及企業(yè)注冊用戶設(shè)置不同的角色與權(quán)限。
角色管理:根據(jù)業(yè)務(wù)系統(tǒng)功能分發(fā)需求制定相應(yīng)的角色,用戶通過隸屬于某
個角色而獲得相應(yīng)的操作權(quán)限。一個用戶可以隸屬于多個角色,一個角色也可
以下轄多個用戶,角色可以隸屬于應(yīng)用系統(tǒng),也可以獨(dú)立于系統(tǒng)。為角色定義
好相應(yīng)的功能權(quán)限和菜單權(quán)限配置。
角色權(quán)限管理:通過權(quán)限控制建立功能權(quán)限與角色的關(guān)聯(lián)關(guān)系,根據(jù)需求特
點(diǎn)來給用戶角色授權(quán)。
3、用戶注冊管理
為用戶提供注冊管理,用戶注冊包括普通用戶賬號、認(rèn)證用戶賬號兩種注冊
方式。
4、日志管理
提供對系統(tǒng)用戶及管理員登錄、操作記錄日志功能,強(qiáng)化系統(tǒng)的安全性。生
成的安全日志可以供安全管理員進(jìn)行安全審計(jì)。安全管理員與系統(tǒng)管理員完全
獨(dú)立,系統(tǒng)管理員不可訪問系統(tǒng)日志,只有安全管理員可以訪問日志。系統(tǒng)在
初始化的時候具有審計(jì)安全帳號,該帳號能對日志進(jìn)行查看和審計(jì)、導(dǎo)出,系
統(tǒng)管理員不能刪除和操作日志。系統(tǒng)提供完備安全的日志實(shí)現(xiàn)安全審計(jì),日志
覆蓋每個用戶、每個模塊、每條信息,日志內(nèi)容包括了人、時間、空間、操作
類型、操作描述、操作結(jié)果等關(guān)鍵內(nèi)容,并能進(jìn)行查詢統(tǒng)計(jì)。
5、消息管理
通過消息組件為平臺提供系統(tǒng)內(nèi)部消息、短信和郵件的發(fā)送和接收接口服
務(wù),以WebService的方式向各個應(yīng)用系統(tǒng)提供接收和發(fā)送接口。在接收過程中
14
進(jìn)行關(guān)鍵字的過濾,后臺采用任務(wù)的方式進(jìn)行發(fā)送和接收,該服務(wù)從數(shù)據(jù)庫收集
消息,通過短信接口或郵件服務(wù)器進(jìn)行發(fā)送,并將發(fā)送結(jié)果回寫到數(shù)據(jù)。
6、參數(shù)設(shè)置
提供系統(tǒng)運(yùn)行所需各類參數(shù)設(shè)置功能,具體設(shè)置內(nèi)容由項(xiàng)目實(shí)施機(jī)構(gòu)根據(jù)
實(shí)施方案進(jìn)行設(shè)計(jì)。
6.2.產(chǎn)業(yè)鏈圖譜模型
產(chǎn)業(yè)鏈圖譜模型是為重點(diǎn)產(chǎn)業(yè)的產(chǎn)業(yè)評價體系建設(shè)的基礎(chǔ)。根據(jù)行業(yè)特點(diǎn)、
結(jié)合重點(diǎn)發(fā)展環(huán)節(jié)及細(xì)分方向,明確產(chǎn)業(yè)定義、產(chǎn)業(yè)外延及內(nèi)涵、產(chǎn)業(yè)分類及集
群,和產(chǎn)業(yè)鏈重點(diǎn)賽道分析,是建設(shè)長沙市生物醫(yī)療產(chǎn)業(yè)評價體系的基礎(chǔ)。通
過產(chǎn)業(yè)鏈模型的建立,可以通過調(diào)用底層數(shù)據(jù),通過模型進(jìn)行計(jì)算和分析,
形成產(chǎn)業(yè)鏈云圖等各類應(yīng)用所需要的各項(xiàng)指標(biāo)。
產(chǎn)業(yè)定義
產(chǎn)業(yè)鏈圖譜繪制
■專家■論證I
產(chǎn)業(yè)鏈圖譜應(yīng)用
圖:產(chǎn)業(yè)鏈?zhǔn)崂磉^程
15
四、數(shù)據(jù)層建設(shè)方案
1.數(shù)據(jù)體系建設(shè)
項(xiàng)目數(shù)據(jù)來源包括兩個方面:政府相關(guān)部門及園區(qū)提供的政府私域產(chǎn)業(yè)數(shù)
據(jù)和第三方提供的公域產(chǎn)業(yè)數(shù)據(jù)。依托數(shù)據(jù)治理平臺,實(shí)現(xiàn)多來源數(shù)據(jù)的接入、
治理與融合,形成基礎(chǔ)庫、專題庫和應(yīng)用庫的數(shù)據(jù)資產(chǎn),為各項(xiàng)應(yīng)用提供數(shù)據(jù)支
撐。
數(shù)據(jù)體系的建設(shè)主要包括:數(shù)據(jù)集成管理、全程調(diào)度、數(shù)據(jù)開發(fā)管理、數(shù)
據(jù)質(zhì)量管理、數(shù)據(jù)資產(chǎn)管理和數(shù)據(jù)服務(wù)等。
數(shù)
據(jù)直詞檢索I效幅封裝I數(shù)混旋權(quán)I斂雌送I數(shù)底下就
服
若數(shù)據(jù)總統(tǒng)-
資產(chǎn)日W蕾理I資產(chǎn)森詢I錄入盒控及警
敖數(shù)據(jù)資產(chǎn)敢照示港
數(shù)
數(shù)
?血畛系版本城I聯(lián)市核費(fèi)產(chǎn)體?^$
據(jù)
據(jù)
據(jù)
*;/urn;
安
閣然曬團(tuán)訐估標(biāo)港&制I3睡運(yùn)
管元效摳效運(yùn)石
全
稽碑筠管理?匪店告元敕嘉變更I溯源分析堆
理
管W
理
.理
tt
據(jù)
榷入適配I數(shù)娜庚數(shù)靠清洗I蚊光觸臺全程M數(shù)摳洞洗1故球呼
處融餌集成
9數(shù)J8接入I救蠢核直政嘉打僑I崛計(jì)亶實(shí)體美聯(lián)I關(guān)系圖譜
數(shù)*
據(jù)
源私陵I端發(fā)及?控信I投促I產(chǎn)促I其他公域數(shù)據(jù)互聯(lián)網(wǎng)數(shù)據(jù)I算他
L1.數(shù)據(jù)集成管理
數(shù)據(jù)集成服務(wù)為平臺提供基礎(chǔ)數(shù)據(jù)服務(wù),并為業(yè)務(wù)應(yīng)用層提供數(shù)據(jù)支撐。
方案提供了標(biāo)準(zhǔn)數(shù)據(jù)采集接口、數(shù)據(jù)抽取、數(shù)據(jù)文件導(dǎo)入功能,并提供數(shù)據(jù)源
管理功能。
1.2.全程調(diào)度
在大數(shù)據(jù)環(huán)境下,每天需要處理海量的任務(wù),多的可以達(dá)到幾十上百萬。任
務(wù)的類型也很繁雜,有MapReduce、HiveSQL、Spark、Java、Shell、Python
、Perl、虛擬節(jié)點(diǎn)等,任務(wù)之間互相依賴且要不同的運(yùn)行環(huán)境。為了解決以上
問題,需要建設(shè)全程調(diào)度系統(tǒng)。
16
1.3.數(shù)據(jù)開發(fā)
根據(jù)主題域的不同,在生產(chǎn)環(huán)境/開發(fā)環(huán)境中,分別建立相對應(yīng)的文件層
級目錄,文件夾名稱即為數(shù)據(jù)層級/主題域/數(shù)據(jù)庫對象的描述信息,葉子節(jié)點(diǎn)
為數(shù)據(jù)庫對象的名稱作為文件的名稱,原則上數(shù)據(jù)開發(fā)與手動任務(wù)目錄下的
文件組織形式應(yīng)該一致。
其中,生產(chǎn)環(huán)境的文件組織關(guān)系與開發(fā)環(huán)境的相同,區(qū)別于生命周期,且生
產(chǎn)環(huán)境基于開發(fā)環(huán)境,開發(fā)環(huán)境將測試成功的數(shù)據(jù)倉庫作業(yè)發(fā)布與生產(chǎn)環(huán)境,
用戶基于生產(chǎn)環(huán)境進(jìn)行進(jìn)一步的應(yīng)用。
1.4.數(shù)據(jù)資產(chǎn)管理
1、資產(chǎn)目錄管理
數(shù)據(jù)目錄管理能夠?qū)崿F(xiàn)數(shù)據(jù)元管理、資源分類與編目、目錄注冊與注銷、目
錄匯聚同步、資源目錄管理、標(biāo)準(zhǔn)落地檢查等功能。
2、數(shù)據(jù)標(biāo)準(zhǔn)管理
數(shù)據(jù)標(biāo)準(zhǔn)管理系統(tǒng)基于標(biāo)準(zhǔn)規(guī)劃、標(biāo)準(zhǔn)管理、標(biāo)準(zhǔn)應(yīng)用進(jìn)行設(shè)計(jì),從標(biāo)準(zhǔn)的
角度規(guī)范數(shù)據(jù)治理元數(shù)據(jù),多角度形成數(shù)據(jù)模型、數(shù)據(jù)操作規(guī)范、數(shù)據(jù)質(zhì)量要
求。主要功能包括標(biāo)準(zhǔn)庫管理、數(shù)據(jù)架構(gòu)管理、元數(shù)據(jù)管理、主數(shù)據(jù)管理等。
3、血緣關(guān)系管理
數(shù)據(jù)血緣是指在數(shù)據(jù)接入、加工融合、流轉(zhuǎn)流通到最終消亡過程中形成的
繼承關(guān)系集合。通過各類數(shù)據(jù)資源間和數(shù)據(jù)項(xiàng)間的繼承關(guān)系進(jìn)行描述和管理,
反應(yīng)數(shù)據(jù)資源在各個環(huán)節(jié)間的繼承關(guān)系。主要包括血緣關(guān)系管理,血緣關(guān)系分
析和血緣關(guān)系查詢等功能。
4、數(shù)據(jù)資產(chǎn)開放
數(shù)據(jù)資產(chǎn)開放模塊通過收集用戶所有數(shù)據(jù)資產(chǎn)信息,完成以下工作:
1)開放數(shù)據(jù)資源目錄體系設(shè)計(jì)和實(shí)施,包括賬號、部門、主題、編目發(fā)布流
程進(jìn)行設(shè)計(jì)并實(shí)施;
2)數(shù)據(jù)編目,對數(shù)據(jù)中心的表進(jìn)行編碼,掛載到數(shù)據(jù)目錄平臺上;
3)通過數(shù)據(jù)血緣探查,幫助用戶完成數(shù)據(jù)資產(chǎn)的上下游梳理和表關(guān)聯(lián)關(guān)系
識別,解決用戶"有哪些數(shù)據(jù)可用"、"到哪里可以找到數(shù)據(jù)"的難題,并且提升數(shù)
據(jù)資源的利用率。
17
1.5.數(shù)據(jù)質(zhì)量管理
1、稽核規(guī)則管理
可以對空值、數(shù)據(jù)合法性、記錄數(shù)、非法值、碼值、數(shù)據(jù)波動、數(shù)值、值域
、數(shù)值重復(fù)、主鍵重復(fù)、主外鍵、業(yè)務(wù)約束等維度進(jìn)行稽核。
2、稽核任務(wù)管理
實(shí)現(xiàn)數(shù)據(jù)稽核任務(wù)的配置管理,以及對稽核日志和采集日志的管理功能。
3、稽核結(jié)果管理
可以按照日期、稽核類別統(tǒng)計(jì)出數(shù)據(jù)質(zhì)量報告,包括稽核類別、度量規(guī)則、
稽核方法等內(nèi)容,可以按照稽核類別對應(yīng)的稽核方法數(shù)的統(tǒng)計(jì)圖、度量規(guī)則和稽
核方法數(shù)目的統(tǒng)計(jì)表等方式對稽核方法進(jìn)行分析。
4、質(zhì)量問題管理
根據(jù)不同稽核方法稽核出的問題數(shù)據(jù)顯示在稽核結(jié)果明細(xì)列表中展現(xiàn),根
據(jù)稽核結(jié)果生成相應(yīng)的問題工單,派發(fā)給相關(guān)負(fù)責(zé)人進(jìn)行整改。
5、評分規(guī)則管理
配置不同稽核規(guī)則所占比重,形成最終分值。
1.6.數(shù)據(jù)服務(wù)
1)API管理
數(shù)據(jù)服務(wù)以API為技術(shù)支撐,為應(yīng)用和信息服務(wù)提供服務(wù)集成與管理支
撐功能。API系統(tǒng)把數(shù)據(jù)資產(chǎn)封裝成應(yīng)用系統(tǒng)可以直接調(diào)用的WebService或
可視化的Web查詢服務(wù),通過服務(wù)的統(tǒng)一管理與調(diào)度,實(shí)現(xiàn)基于授權(quán)的服務(wù)
調(diào)用和信息共享,以屏蔽背后復(fù)雜的數(shù)據(jù)信息資源機(jī)構(gòu),簡化信息共享服務(wù)難
度和復(fù)雜度,支撐各部門、各系統(tǒng)、各角色靈活、多樣的信息應(yīng)用服務(wù)需要。
服務(wù)主要采用標(biāo)準(zhǔn)接口定義的WebService,從而架設(shè)業(yè)務(wù)系統(tǒng)基礎(chǔ)服務(wù)架
構(gòu),充分利用已有的信息化資源,為共享應(yīng)用提供最大化的服務(wù)支撐,以持續(xù)
性發(fā)展方式支撐各個業(yè)務(wù)系統(tǒng)建設(shè)與運(yùn)維。
API系統(tǒng)由基礎(chǔ)數(shù)據(jù)服務(wù)、服務(wù)注冊、服務(wù)發(fā)布、服務(wù)目錄、服務(wù)管理等幾
部分組成。
1、基礎(chǔ)數(shù)據(jù)服務(wù)
18
通過對據(jù)資源進(jìn)行提取和封裝,對外發(fā)布成服務(wù),供其他系統(tǒng)訪問和調(diào)用。
實(shí)現(xiàn)各類數(shù)據(jù)資源對外提供的訪問和管理能力。
2、應(yīng)用組件封裝
1)應(yīng)用接入組件封裝
應(yīng)用接入封裝實(shí)現(xiàn)第三方應(yīng)用接入的統(tǒng)一標(biāo)準(zhǔn)化。定義了各類型應(yīng)用接入
的接口類型,如WebService、Http/Rest>FTP、socket等協(xié)議。
2)查詢分析能力組件封裝
查詢分析能力封裝實(shí)現(xiàn)單次信息查詢、批量信息查詢的內(nèi)部處理邏輯,將系
統(tǒng)內(nèi)部的數(shù)據(jù)根據(jù)查詢請求組裝、規(guī)整;
3、服務(wù)注冊
系統(tǒng)提供基于數(shù)據(jù)庫的服務(wù)注冊功能,將數(shù)據(jù)庫數(shù)據(jù)信息按照統(tǒng)一標(biāo)準(zhǔn)、統(tǒng)
一架構(gòu)對外提供共享服務(wù)。
4、服務(wù)發(fā)布
發(fā)布服務(wù)支持可視化發(fā)布,提供快速的生成相應(yīng)協(xié)議的服務(wù),無需編寫代碼
O
5、服務(wù)目錄
服務(wù)目錄對于系統(tǒng)中的服務(wù)進(jìn)行分類管理,實(shí)現(xiàn)對不同的服務(wù)按照不同的
業(yè)務(wù)快速分類,并可實(shí)現(xiàn)對服務(wù)的查詢和檢索,可以進(jìn)行靈活的服務(wù)分類。
服務(wù)目錄由服務(wù)規(guī)約、服務(wù)資源、服務(wù)資源綁定的數(shù)據(jù)資源信息及數(shù)據(jù)資源
組成,其中一個服務(wù)規(guī)約支持創(chuàng)建多個服務(wù)資源,一個服務(wù)資源使用多個數(shù)據(jù)
資源信息。
6、服務(wù)管理
服務(wù)管理是對服務(wù)組件進(jìn)行維護(hù),提供服務(wù)運(yùn)行環(huán)境并能對外提供訪問接
口,處理服務(wù)請求。
7、數(shù)據(jù)服務(wù)接口類型
1)查詢檢索接口
包括精確查詢、模糊查詢、分類查詢、組合查詢、全文檢索等多種查詢接口
o支持對結(jié)構(gòu)化和非結(jié)構(gòu)化的各類數(shù)據(jù)的查詢接口封裝;支持對已有數(shù)據(jù)查詢
19
接口進(jìn)行二次封裝形成新的數(shù)據(jù)查詢接口;支持對查詢結(jié)果的二次檢索;支持
異步的批量數(shù)據(jù)查詢。
2)數(shù)據(jù)鑒權(quán)接口
數(shù)據(jù)鑒權(quán),基于數(shù)據(jù)的訪問控制規(guī)則,實(shí)現(xiàn)數(shù)據(jù)的訪問權(quán)限鑒別的過程。訪
問控制規(guī)則從內(nèi)容敏感度、數(shù)據(jù)來源、數(shù)據(jù)種類、字段及字段關(guān)系分類四個維
度進(jìn)行資源權(quán)限的控制,資源鑒權(quán)通過用戶的數(shù)據(jù)資源權(quán)限,使用數(shù)據(jù)鑒權(quán)服
務(wù)實(shí)現(xiàn)對數(shù)據(jù)資源的訪問控制。
2)共享交換
共享交換包含數(shù)據(jù)推送服務(wù)和數(shù)據(jù)下載服務(wù)。
1、數(shù)據(jù)推送服務(wù),支持?jǐn)?shù)據(jù)推送規(guī)則、推送標(biāo)準(zhǔn)、數(shù)據(jù)種類、推送周期等參
數(shù)配置,能夠根據(jù)配置進(jìn)行數(shù)據(jù)封裝,將數(shù)據(jù)資源推送給平臺或系統(tǒng)。
2、支持結(jié)構(gòu)化數(shù)據(jù)的批量下載,應(yīng)通過大數(shù)據(jù)量定期打包、小數(shù)據(jù)量實(shí)時打
包方式,實(shí)現(xiàn)基礎(chǔ)數(shù)據(jù)資源庫的全量數(shù)據(jù)下載和增量數(shù)據(jù)下載。
2.數(shù)據(jù)治理服務(wù)
基于產(chǎn)業(yè)大腦的統(tǒng)一規(guī)劃架構(gòu),依托數(shù)據(jù)體系建設(shè),實(shí)現(xiàn)政務(wù)跨部門數(shù)據(jù)、
外部跨機(jī)構(gòu)數(shù)據(jù)、應(yīng)用系統(tǒng)回流數(shù)據(jù)等多來源數(shù)據(jù)的接入、治理與融合,形成基
礎(chǔ)庫、專題庫和應(yīng)用庫的數(shù)據(jù)資產(chǎn),為各項(xiàng)應(yīng)用提供數(shù)據(jù)支撐。
數(shù)據(jù)治理流程包含五個部分,分別為:數(shù)據(jù)架構(gòu)設(shè)計(jì)、數(shù)據(jù)集成開發(fā)、基
礎(chǔ)數(shù)據(jù)治理、專題數(shù)據(jù)治理、應(yīng)用數(shù)據(jù)治理。
數(shù)據(jù)架構(gòu)設(shè)計(jì)數(shù)據(jù)集成開發(fā)專?據(jù)治理頤鶴筑
?睜娜?需求調(diào)研?標(biāo)準(zhǔn)化?數(shù)據(jù)打標(biāo)?他他
?數(shù)倉分層-表創(chuàng)建?斯詆據(jù)開發(fā)
?命名規(guī)更?數(shù)據(jù)接入?數(shù)據(jù)融合'?數(shù)據(jù)核音?分析模型
?開發(fā)棚5?數(shù)據(jù)核直?數(shù)據(jù)核直
圖:數(shù)據(jù)治理流程圖
2.1.數(shù)據(jù)架構(gòu)設(shè)計(jì)
1)整體架構(gòu)設(shè)計(jì)
私域數(shù)據(jù)從長沙市數(shù)據(jù)局獲取、公域數(shù)據(jù)從第三方訂閱,并按照原始格式存
儲入貼源層,支持結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)的存儲。
20
對數(shù)據(jù)進(jìn)行清洗、轉(zhuǎn)換、融合后,形成法人單位、人才信息、宏觀經(jīng)濟(jì)、資
源要素、輿情資訊、標(biāo)準(zhǔn)規(guī)范等基礎(chǔ)數(shù)據(jù)庫。
2)數(shù)據(jù)倉庫模型設(shè)計(jì)
數(shù)據(jù)倉庫模型設(shè)計(jì)主要包括概念設(shè)計(jì)、邏輯結(jié)構(gòu)、物理結(jié)構(gòu)三大模塊。設(shè)計(jì)
步驟如下:
1、確定主題
由于主題與業(yè)務(wù)密切相關(guān),數(shù)據(jù)倉庫模型設(shè)計(jì)之前需要充分熟悉項(xiàng)目業(yè)務(wù)
需求,從而確定數(shù)據(jù)分析或者前端展示的主題。
2、確定量度
在確定了主題以后,還需要考慮分析的技術(shù)指標(biāo)。量度是要統(tǒng)計(jì)的指標(biāo),必
須事先選擇恰當(dāng),基于不同的量度將直接產(chǎn)生不同的決策結(jié)果。
3、確定數(shù)據(jù)粒度
確定量度之后,還需考慮該量度的匯總情況和不同維度下的量度的聚合情
況。
4、確定維度
維度分析的各個角度。需設(shè)計(jì)各個維度的主鍵、層次、級別,盡量減少冗余
O
5、創(chuàng)建事實(shí)表
確定事實(shí)數(shù)據(jù)和維度后,可以考慮加載事實(shí)表。事實(shí)表中將存在維度代理
鍵和各量度,而不應(yīng)該存在描述性信息,即符合“瘦高原則”,即要求事實(shí)表
數(shù)
據(jù)條數(shù)盡量多(粒度最小),而描述性信息盡量少。
3)命名規(guī)范
1、表命名規(guī)范
命名形式:(層次名>_<數(shù)據(jù)內(nèi)容描述,
命名規(guī)則:
使用英文小寫字母,單詞之間用下劃線分開;
數(shù)據(jù)內(nèi)容采用英文簡稱,當(dāng)英文出現(xiàn)多個單詞時,可以用下劃線分割。
2、任務(wù)節(jié)點(diǎn)命名規(guī)范
節(jié)點(diǎn)資源類型命名規(guī)范備注
21
虛擬節(jié)點(diǎn)vt_{虛擬節(jié)點(diǎn)含義}根節(jié)點(diǎn)啟動任務(wù)
同步節(jié)點(diǎn)導(dǎo)入任務(wù)cdp_{源業(yè)務(wù)系統(tǒng)表名}
同步節(jié)點(diǎn)導(dǎo)出任務(wù)cdp_out_{輸出表名}如果存在多個
目標(biāo)庫,可以添加目
標(biāo)庫標(biāo)識后綴
shell節(jié)點(diǎn)sh_{腳本名稱}
mi-節(jié)點(diǎn)mr一{腳本名稱}
ddl資源ddl_{輸出表名}
python資源{腳本名稱}.py
jar{腳本名稱}.jar
跨調(diào)度依賴或檢查chk_{源表名}
3、任務(wù)命名規(guī)范
所有的自動化和手動運(yùn)行任務(wù)均需遵循一定的命名規(guī)范,便于管理。
手動建表任務(wù):CT_[表名],[表名]為所需創(chuàng)建表的表名,
CT為createtable的縮寫;
手動初始化任務(wù):INIT」表名],[表名]為所需初始化的表的表名,INIT為
initialization的縮寫;
數(shù)據(jù)開發(fā)任務(wù):INIT」表名],任務(wù)名為最終生成的正式生產(chǎn)表的表名;
數(shù)據(jù)同步任務(wù):TR_[目標(biāo)數(shù)據(jù)庫的表名],所有的數(shù)據(jù)導(dǎo)出任務(wù)的命名,以
TR打頭,后接目標(biāo)數(shù)據(jù)庫的表名。
4)開發(fā)規(guī)范
1、統(tǒng)一維度
為更好的進(jìn)行數(shù)據(jù)整合,將來自不同數(shù)據(jù)源的數(shù)據(jù)合并到一起,每個維度
需要標(biāo)準(zhǔn)化、統(tǒng)一化,在數(shù)據(jù)倉庫中需要為每個維度建立一致型的標(biāo)準(zhǔn),方便
后續(xù)的數(shù)據(jù)交叉探查。
為每個維度建立標(biāo)準(zhǔn)化的編碼方式,以及數(shù)據(jù)格式,為后續(xù)的數(shù)據(jù)標(biāo)準(zhǔn)化
打下基礎(chǔ);
完成標(biāo)準(zhǔn)化后,需要將各源系統(tǒng)中數(shù)據(jù)中的維度數(shù)據(jù)進(jìn)行關(guān)聯(lián)轉(zhuǎn)換,將不
同數(shù)據(jù)源標(biāo)識同一事物的不同屬性值進(jìn)行統(tǒng)一;
對于不同系統(tǒng)的不同維度,可以通過創(chuàng)建維度的映射關(guān)系表,將其映射到
標(biāo)準(zhǔn)化后的維度上。
2、統(tǒng)一數(shù)據(jù)格式
22
在數(shù)據(jù)清洗過程中,需要將各源系統(tǒng)的數(shù)據(jù)格式進(jìn)行統(tǒng)一,下表為主要的
需統(tǒng)一的數(shù)據(jù)格式。
格式類型統(tǒng)一格式示例
日期YYYY-MM-DD,默認(rèn)為1900-01-012021-07-01
時間HH:MI:SS,默認(rèn)為00:00:0012:13:14
字符串去除頭尾空格,去除回車,默認(rèn)為NULLTrim(,AABB')
整型默認(rèn)為0(可根據(jù)具體業(yè)務(wù)類型調(diào)整)1
雙精度默認(rèn)保留4位小數(shù)(根據(jù)具體業(yè)務(wù)調(diào)整)3.1314
2.2.數(shù)據(jù)集成開發(fā)
1)數(shù)據(jù)集成范圍
1、數(shù)據(jù)歸集方式
本系統(tǒng)采用的對接方式為庫表交換、文件交換和接口服務(wù)等方式。
(1)庫表交換
在數(shù)據(jù)提供方網(wǎng)絡(luò)環(huán)境內(nèi)的節(jié)點(diǎn)機(jī)上配置一個前置數(shù)據(jù)庫,由數(shù)據(jù)庫提供
方根據(jù)技術(shù)規(guī)范組織數(shù)據(jù),并往前置機(jī)數(shù)據(jù)庫中寫入數(shù)據(jù);本系統(tǒng)作為數(shù)據(jù)接
收方,經(jīng)安全交換通道和交換傳輸控制,自動將前置機(jī)的數(shù)據(jù)讀取到數(shù)據(jù)中心
,隨后進(jìn)行后續(xù)的加工處理和使用。
(2)文件交換
在數(shù)據(jù)提供方網(wǎng)絡(luò)環(huán)境內(nèi)的節(jié)點(diǎn)機(jī)上設(shè)置文件交換區(qū),由數(shù)據(jù)提供方定期
生成txt、excel.mdb(數(shù)據(jù)庫文件)或其他約定格式的文件,按要求提交到
文件交換區(qū);經(jīng)安全交換通道和交換傳輸控制,本系統(tǒng)定期讀取文件,解析
并形成結(jié)構(gòu)化數(shù)據(jù),導(dǎo)入到數(shù)據(jù)中心相應(yīng)數(shù)據(jù)表進(jìn)行后續(xù)加工處理。
(3)接口服務(wù)
本系統(tǒng)根據(jù)編制的技術(shù)規(guī)范,開發(fā)并提供公共的接收數(shù)據(jù)的WebService
服務(wù)接口;數(shù)據(jù)提供方按技術(shù)規(guī)范開發(fā)數(shù)據(jù)同步程序,定時調(diào)用服務(wù)接口傳遞
數(shù)據(jù)到本系統(tǒng)。
2、公域數(shù)據(jù)歸集
系統(tǒng)通過向第三方訂閱推送的方式,歸集第三方的公域產(chǎn)業(yè)數(shù)據(jù),可歸集
的數(shù)據(jù)資源如下:
數(shù)據(jù)庫數(shù)據(jù)維度核心字段
23
機(jī)構(gòu)庫公司基本資料表企業(yè)名稱、成立日期、所屬行業(yè)、主營業(yè)務(wù)、經(jīng)營范圍
、公司簡介、官網(wǎng)、聯(lián)系電話、注冊地址、法定代表
人、變更記錄、管理團(tuán)隊(duì)、對外投資、分支機(jī)構(gòu)
科研機(jī)構(gòu)表機(jī)構(gòu)名稱、地址、領(lǐng)域、簡介、成立日期、類別
交易代碼、公司名稱、報告期、總資產(chǎn)、總負(fù)債、利潤
企業(yè)財(cái)務(wù)表
等
專利表專利名稱、申請人、申請時間、法律狀態(tài)
人才庫人才基本資料表姓名、單位、性別、簡歷、任職經(jīng)歷、人才分類
文獻(xiàn)表文獻(xiàn)名稱、作者、發(fā)表時間、摘要
項(xiàng)目名稱、項(xiàng)目編號、負(fù)責(zé)人、牽頭單位、公示日期
重點(diǎn)研發(fā)項(xiàng)目表
、計(jì)劃專項(xiàng)類型
交易庫中標(biāo)信息表中標(biāo)日期、中標(biāo)人、標(biāo)的、中標(biāo)金額、正文
證券代碼表交易代碼、公司名稱、上市日期、交易市場
融資事件表事件ID、融資機(jī)構(gòu)名稱、融資時間、融資金額
產(chǎn)品庫藥物臨床試驗(yàn)表登記號、適應(yīng)癥、題目、編號、申請受理號、藥物名稱
、類型、申辦者名稱、聯(lián)系方式、試驗(yàn)分期、研究者
姓名、單位、電話
注冊號、批準(zhǔn)日期、注冊人名稱、預(yù)期用途、審批部門
國產(chǎn)藥品表
、產(chǎn)品名稱、結(jié)構(gòu)組成、規(guī)格型號
受理號、公示時間、申請人、產(chǎn)品名稱、審核單位、同
器械優(yōu)先審評表
意理由
載體庫園區(qū)基本資料表載體名、地址、面積、經(jīng)緯度、運(yùn)營主體
實(shí)驗(yàn)室基本資料
實(shí)驗(yàn)室名稱、級別、成立日期、簡介、類型
表
宏觀統(tǒng)計(jì)數(shù)值表截止日期、指標(biāo)名稱、數(shù)值
宏觀庫
政策表標(biāo)題、發(fā)布時間、正文、發(fā)布部門、文號、政策類型
企業(yè)榜單表排名類型、排名、企業(yè)名稱、數(shù)值
產(chǎn)業(yè)庫
行業(yè)統(tǒng)計(jì)數(shù)值表截止日期、指標(biāo)名稱、數(shù)值
資訊庫新聞表標(biāo)題、發(fā)布時間、正文、新聞類型
會議活動表標(biāo)題、會議時間、地址、簡介、鏈接
研究報告表標(biāo)題、發(fā)布日期、作者、正文
3、私域數(shù)據(jù)歸集
私域數(shù)據(jù)主要是無法從公開途徑獲得數(shù)據(jù),包括用于統(tǒng)計(jì)產(chǎn)業(yè)規(guī)模的產(chǎn)值
稅收、發(fā)展目標(biāo)等統(tǒng)計(jì)數(shù)據(jù),以及企業(yè)的經(jīng)營收入、稅收、員工數(shù)量等微
觀數(shù)據(jù)。通過這些數(shù)據(jù)可以更完整體現(xiàn)區(qū)域產(chǎn)業(yè)發(fā)展規(guī)模、提高企業(yè)畫像的信
24
息維度,更精準(zhǔn)監(jiān)測企業(yè)發(fā)展拐點(diǎn)等動態(tài),這些數(shù)據(jù)主要分布在稅務(wù)、統(tǒng)計(jì)等
政府部門。相關(guān)數(shù)據(jù)的使用申請,已經(jīng)與長沙市數(shù)據(jù)資源局溝通,將由建設(shè)方
協(xié)同湘江新區(qū)和長沙市產(chǎn)業(yè)部門,按照長沙市政府信息化項(xiàng)目相關(guān)流程,向
長沙市數(shù)據(jù)資源局提出申請。
4、其他來源接入
按照業(yè)務(wù)系統(tǒng)和需求,接入其他來源的數(shù)據(jù),如企業(yè)自主填報等。
2)數(shù)據(jù)接入實(shí)施流程
1、調(diào)研準(zhǔn)備階段
在這個階段需要準(zhǔn)備以下工作:用戶的總體了解;技術(shù)方案準(zhǔn)備;相關(guān)培訓(xùn)
資料的準(zhǔn)備(行業(yè)成功案例和經(jīng)驗(yàn)總結(jié))。
2、業(yè)務(wù)調(diào)研
在本階段調(diào)研中,主要是了解用戶當(dāng)前的業(yè)務(wù)流程和系統(tǒng)概況,并搜集相
關(guān)的資料和數(shù)據(jù),以準(zhǔn)備下一階段的分析。
3、系統(tǒng)調(diào)研
本階段要細(xì)致的分析整理用戶報表及業(yè)務(wù)系統(tǒng)數(shù)據(jù),仔細(xì)揣摩決策系統(tǒng)各
級用戶關(guān)心的問題;構(gòu)建分析模型原型,與用戶之間互動討論,確定分析指標(biāo)
、維度和組合規(guī)則及計(jì)算公式。
4、整理分析模型
通過原型收集了用戶需求后,討論修改后,確認(rèn)相應(yīng)的數(shù)據(jù)來源,完成分析
模型描述。
5、審核確認(rèn)
經(jīng)過對不同的訪問對象進(jìn)行訪問后,基于訪問記錄對數(shù)據(jù)倉庫項(xiàng)目所涉及
到的分析主題范圍、系統(tǒng)要求等問題進(jìn)行討論、整理,形成需求分析文檔。最后
提交給客戶進(jìn)行審核確認(rèn)。
6、需求調(diào)研文檔輸出
項(xiàng)目數(shù)據(jù)需求調(diào)研完成后,輸出項(xiàng)目數(shù)據(jù)需求調(diào)研文檔,調(diào)研文檔應(yīng)包含
現(xiàn)有系統(tǒng)業(yè)務(wù)簡介、應(yīng)用場景、數(shù)據(jù)表結(jié)構(gòu)、大數(shù)據(jù)應(yīng)用需求表。
7、源數(shù)據(jù)接入
25
在ODS(源數(shù)據(jù)接入層)層創(chuàng)建與源系統(tǒng)中表結(jié)構(gòu)完全一致的數(shù)據(jù)表,并
指定分區(qū)字段。由于創(chuàng)建表是一次性操作,所以使用手動任務(wù)完成,為每個表
創(chuàng)建一個手動任務(wù),將手動任務(wù)發(fā)布到生產(chǎn)環(huán)境,并手動觸發(fā)執(zhí)行,完成數(shù)據(jù)表
的創(chuàng)建。
在ODS(源數(shù)據(jù)接入層)層配置數(shù)據(jù)源,創(chuàng)建數(shù)據(jù)接入任務(wù),配置數(shù)據(jù)接
入的任務(wù)(源表、目的表、分區(qū)字段、where條件、調(diào)度周期等),將任務(wù)發(fā)布到
生產(chǎn)環(huán)境,參與調(diào)度。
8、數(shù)據(jù)核查
在ODS
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 裝飾吊燈施工方案
- 防靜電木地板施工方案
- 家具搬遷施工方案
- 大數(shù)據(jù)在網(wǎng)站營銷中的應(yīng)用-深度研究
- 互動式教學(xué)與課程成效-深度研究
- 互聯(lián)網(wǎng)法律風(fēng)險防控策略-深度研究
- 機(jī)器人手術(shù)效率分析-深度研究
- 保險數(shù)據(jù)隱私保護(hù)-深度研究
- 智能摩托車智能語音交互-深度研究
- 人工智能在知識產(chǎn)權(quán)法中的角色-深度研究
- 《天潤乳業(yè)營運(yùn)能力及風(fēng)險管理問題及完善對策(7900字論文)》
- 醫(yī)院醫(yī)學(xué)倫理委員會章程
- xx單位政務(wù)云商用密碼應(yīng)用方案V2.0
- 農(nóng)民專業(yè)合作社財(cái)務(wù)報表(三張報表)
- 動土作業(yè)專項(xiàng)安全培訓(xùn)考試試題(帶答案)
- 大學(xué)生就業(yè)指導(dǎo)(高職就業(yè)指導(dǎo)課程 )全套教學(xué)課件
- 死亡病例討論總結(jié)分析
- 第二章 會展的產(chǎn)生與發(fā)展
- 空域規(guī)劃與管理V2.0
- JGT266-2011 泡沫混凝土標(biāo)準(zhǔn)規(guī)范
- 商戶用電申請表
評論
0/150
提交評論