版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
ICS35.020CCSL70團(tuán) 體 標(biāo) 準(zhǔn)T/FBD002-2023Publicdataaggregationandsharingplatform—technicalrequirementsofdataaggregation2023-11-28發(fā)布 2023-11-28實(shí)施福建省大數(shù)據(jù)產(chǎn)業(yè)商會??發(fā)布T/FBD002T/FBD002—2023前 言本文件按照GB/T1.1—2020《標(biāo)準(zhǔn)化工作導(dǎo)則 第1部分:標(biāo)準(zhǔn)化文件的結(jié)構(gòu)和起草規(guī)則》的定起草。請注意本文件的某些內(nèi)容可能涉及專利。本文件的發(fā)布機(jī)構(gòu)不承擔(dān)識別這些專利的責(zé)任。本文件由福建大數(shù)據(jù)一級開發(fā)有限公司提出。本文件由福建省大數(shù)據(jù)產(chǎn)業(yè)商會歸口。I一體化公共數(shù)據(jù)平臺數(shù)據(jù)匯聚技術(shù)要求范圍本文件適用于一體化公共數(shù)據(jù)平臺數(shù)據(jù)匯聚建設(shè)工作管理。規(guī)范性引用文件(包括所有的修改單適用于本文件。GB/T26863—2022 火電站監(jiān)控系統(tǒng)術(shù)語GB/T35295—2017 信息技術(shù)大數(shù)據(jù)術(shù)GB/T39477 信息安全技術(shù)政務(wù)信息共享數(shù)據(jù)安全技術(shù)要求術(shù)語和定義下列術(shù)語和定義適用于本文件。數(shù)據(jù)集dataset數(shù)據(jù)記錄匯聚的數(shù)據(jù)形式。注:的特征,當(dāng)其在網(wǎng)絡(luò)上傳輸時或暫時駐留于計(jì)算機(jī)存儲器中以備讀出或更新時,表征的是動態(tài)數(shù)據(jù)。[來源:GB/T35295—2017,2.1.46]公共數(shù)據(jù) publicdata(以下統(tǒng)稱公共管理和服務(wù)機(jī)構(gòu)),在依法履行職責(zé)或者提供公共服務(wù)過程中收集、產(chǎn)生的各類數(shù)據(jù)及其衍生數(shù)據(jù)。數(shù)據(jù)湖datalake以原生格式存儲原始數(shù)據(jù)的袁術(shù)數(shù)據(jù)存儲庫或系統(tǒng)。注1:數(shù)據(jù)湖直接按原樣存儲數(shù)據(jù),而無需事先對被存儲數(shù)據(jù)進(jìn)行結(jié)構(gòu)化處理。2:數(shù)據(jù)湖能存儲結(jié)構(gòu)化數(shù)據(jù)如關(guān)系型數(shù)據(jù)庫的表),半結(jié)構(gòu)化數(shù)據(jù)CSV、日志、XML、JSON),非結(jié)構(gòu)化數(shù)據(jù)(如電子郵件、文檔、PDF)和二進(jìn)制數(shù)據(jù)(如圖形、音頻、視頻)等。[來源:GB/T26863—2022,10.42]數(shù)據(jù)匯聚dataaggregation指從多個數(shù)據(jù)源中收集數(shù)據(jù),并將其整合到一個共同的數(shù)據(jù)存儲中??s略語CDC:變更數(shù)據(jù)捕獲(ChangeDataCapture)HTTP:超文本傳輸協(xié)議(HyperTextTransferProtocol)IP:網(wǎng)際互連協(xié)議(InternetProtocol)JSON:JavaScript(JavaScriptObjectNotation)XML:可擴(kuò)展標(biāo)記語言(ExtensibleMarkupLanguage)1基本要求公共數(shù)據(jù)匯聚共享平臺(以下簡稱“平臺”)滿足多源異構(gòu)數(shù)據(jù)的接入需求,包括文件系統(tǒng)、關(guān)系型數(shù)據(jù)庫、非關(guān)系型數(shù)據(jù)庫、實(shí)時流數(shù)據(jù)等。GB/T39477。對于未來新型的數(shù)據(jù)庫出現(xiàn),平臺宜滿足多種類型、多種版本數(shù)據(jù)庫數(shù)據(jù)的匯聚,能實(shí)現(xiàn)快速適配對接。訪問要求服務(wù)內(nèi)容外部網(wǎng)絡(luò)可通過代理來訪問平臺服務(wù)器上的資源。統(tǒng)一網(wǎng)關(guān)統(tǒng)一網(wǎng)關(guān)的管理內(nèi)容包括以下三部分:——統(tǒng)一對外出口管理:管理網(wǎng)關(guān)服務(wù)的地址代理服務(wù)、協(xié)議代理服務(wù)、端口代理服務(wù);將外部允許訪問的數(shù)據(jù)服務(wù)地址統(tǒng)一提供給編排任務(wù)節(jié)點(diǎn)進(jìn)行訪問?!?wù)配置管理:進(jìn)行項(xiàng)目管理和工作組管理;項(xiàng)目管理為用戶創(chuàng)建獨(dú)立的任務(wù)配置空間;數(shù)據(jù)匯聚要求數(shù)據(jù)類型平臺支持的數(shù)據(jù)類型包括:結(jié)構(gòu)化數(shù)據(jù)。規(guī)則、完整,能夠通過二維邏輯來表現(xiàn)的數(shù)據(jù),嚴(yán)格遵循數(shù)據(jù)格式與長度規(guī)范,如:數(shù)據(jù)庫表、ExcelJSON、XML數(shù)據(jù)接入功能要求支持網(wǎng)絡(luò)隔離環(huán)境下的內(nèi)外網(wǎng)數(shù)據(jù)接入。接入形式直接接入,直接訪問數(shù)據(jù)源進(jìn)行直接采集,實(shí)現(xiàn)數(shù)據(jù)的接入。NginxIP注:Nginx,即HTTP和反向代理web服務(wù)器,同時也提供了IMAP/POP3/SMTP服務(wù)。前置機(jī)接入,通過前置機(jī)的配置,實(shí)現(xiàn)數(shù)據(jù)的接入。網(wǎng)閘接入,通過網(wǎng)閘提供的數(shù)據(jù)擺渡服務(wù)作為中間交換,連接跨網(wǎng)數(shù)據(jù),實(shí)現(xiàn)數(shù)據(jù)的接入。A。數(shù)據(jù)采集技術(shù)要求2采集技術(shù)要求如下:——支持對象存儲方式的數(shù)據(jù)寫入;——支持多種類型的數(shù)據(jù)寫入,如結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化等;——支持多種格式的數(shù)據(jù)讀取,如CSV、JSON、XML等;——支持多種來源的數(shù)據(jù)采集,如數(shù)據(jù)庫、文件系統(tǒng)、消息隊(duì)列等;——支持批量定時任務(wù)或?qū)崟r流數(shù)據(jù)采集,實(shí)現(xiàn)數(shù)據(jù)的采集;——支持變更數(shù)據(jù)采集;——支持元數(shù)據(jù)、索引數(shù)據(jù)、存儲數(shù)據(jù)等形式的數(shù)據(jù)采集。普通采集方式1。圖1 普通采集流程圖數(shù)據(jù)庫采集方式2。圖2 數(shù)據(jù)庫采集流程圖數(shù)據(jù)抽取通用要求CDC平臺支持不同周期要求,調(diào)整數(shù)據(jù)抽取頻次。平臺支持用戶手工干預(yù)作業(yè)。數(shù)據(jù)表抽取數(shù)據(jù)表抽取要求如下:a) 支持配置任務(wù)調(diào)度周期和時間;d) 支持定義抽取字段和抽取條件;數(shù)據(jù)流抽取3數(shù)據(jù)流抽取要求如下:支持選取數(shù)據(jù)主題,以及讀取權(quán)限授權(quán);接口抽取接口抽取要求如下:HTTPkey、key、輸出的字段等信息;keykey結(jié)構(gòu)化文件抽取結(jié)構(gòu)化文件抽取要求如下:支持配置讀取結(jié)構(gòu)化文件的抽取任務(wù);半結(jié)構(gòu)化文件抽取半結(jié)構(gòu)化文件抽取要求如下:非結(jié)構(gòu)化文件抽取非結(jié)構(gòu)化文件抽取要求如下:通過文件傳輸協(xié)議或?qū)ο蟠鎯f(xié)議,從本地或遠(yuǎn)程服務(wù)器上抽取非結(jié)構(gòu)化文件;支持配置服務(wù)器參數(shù),包括地址、端口、用戶名、密碼或密鑰、目錄或桶名,對象名等信息。4B.1。
附錄 A(資料性)數(shù)據(jù)接入案例圖A.1 直接采集邏輯架構(gòu)圖B.2。圖A.2 網(wǎng)絡(luò)代理邏輯架構(gòu)圖5B.3。圖A.3 前置機(jī)接入邏輯架構(gòu)圖B.4。圖A.4 網(wǎng)閘接口邏輯架構(gòu)圖6參考文獻(xiàn)國務(wù)院辦公廳關(guān)于
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年物流與供應(yīng)鏈管理優(yōu)化合同
- 2024年滬教版七年級物理下冊月考試卷
- 2024年浙教版高二數(shù)學(xué)上冊階段測試試卷
- 2024年離異后子女撫養(yǎng)費(fèi)用協(xié)議
- 醫(yī)療安全知識在英語繪本教學(xué)中的滲透
- 2025中國鐵路北京局集團(tuán)招聘全日制普通高校畢業(yè)生140人(二)高頻重點(diǎn)提升(共500題)附帶答案詳解
- 2025中國郵政集團(tuán)江蘇分公司春季招聘高頻重點(diǎn)提升(共500題)附帶答案詳解
- 2025中國系統(tǒng)校園招聘360人(寒假專場)高頻重點(diǎn)提升(共500題)附帶答案詳解
- 2025中國原子能科學(xué)研究院回旋加速器研究設(shè)計(jì)中心校園招聘高頻重點(diǎn)提升(共500題)附帶答案詳解
- 2025中共江蘇省委黨校(江蘇行政學(xué)院)公開招聘專業(yè)技術(shù)人員10人高頻重點(diǎn)提升(共500題)附帶答案詳解
- 2024秋期國家開放大學(xué)??啤陡叩葦?shù)學(xué)基礎(chǔ)》一平臺在線形考(形考任務(wù)一至四)試題及答案
- 國開(內(nèi)蒙古)2024年《創(chuàng)新創(chuàng)業(yè)教育基礎(chǔ)》形考任務(wù)1-3終考任務(wù)答案
- 食品安全日管控、周排查及月調(diào)度記錄表
- 2024-2024年江蘇省普通高中學(xué)業(yè)水平測試物理試卷(含答案)
- ATS(發(fā)動機(jī)智能冷卻系統(tǒng))
- 畢業(yè)論文飲料罐裝生產(chǎn)流水線系統(tǒng)設(shè)計(jì)與調(diào)試
- CAD的樂趣(漂亮的自定義線型)
- 某某油庫投產(chǎn)試運(yùn)行方案
- 業(yè)障病因果病對照表
- 街坊管道設(shè)計(jì)報告書
- 員工反賄賂反腐敗行為準(zhǔn)則
評論
0/150
提交評論