DB11T 2317-2024政務數據質量評估規(guī)范_第1頁
DB11T 2317-2024政務數據質量評估規(guī)范_第2頁
DB11T 2317-2024政務數據質量評估規(guī)范_第3頁
DB11T 2317-2024政務數據質量評估規(guī)范_第4頁
DB11T 2317-2024政務數據質量評估規(guī)范_第5頁
已閱讀5頁,還剩15頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

DB11北京市市場監(jiān)督管理局發(fā)布 本文件按照GB/T1.1—2020《標準化工作導則第本文件起草單位:北京市大數據中心、北京市政上海交通大學、北京交通大學、中國人民大學、北京郵電大學、北京工業(yè)大學、公安部第三研究所、中國工業(yè)互聯網研究院、太極計算機股份有限公本文件主要起草人:王睿宇、王宇航、駱亦飛、張琳、徐海琛、賈曉豐、張晰、高嵩、高文飛、張健楓、江茜、章敏、苗婕、馬征、李凝云、崔鵬、徐葳、張久珍、吳帆、鄭臻哲、李浥東、范舉、高志鵬、林紹福、劉旭、趙琰昉、聶志鋒、趙章界、趙瑩、肖益、李寶東、穆顯顯、趙敏、楊燕、政務數據質量評估規(guī)范通過數據質量稽核后存儲的數據庫表,表中有數據質量稽核數據質量六性評估模型主要從數據規(guī)范性、完整性、準確性、一致性、及時性和可用性6個維度進數據質量評估管理,包括數據規(guī)范性、完整性、準確性、一致性、及時性和可a)數據規(guī)范性:描述數據內容、值域、格式等符合標準數據元的情況,衡量數據標準、規(guī)范程b)數據完整性:描述數據的描述性要素、要素屬性及要素關系的完整情況,衡量數據在存儲、c)數據準確性:描述數據與其對應的客觀實體的特征相一致的情況,衡量數據符合實際情況的d)數據一致性:描述數據類型、數據含義和數據內容的一致情況,衡量數據的一致程度。e)數據及時性:描述數據獲取和更新的情況,衡量數據的更新及時程度。f)數據可用性:描述數據能夠被訪問、檢索、使用和操作的水平,衡量數據的可用程度。指標編碼是政務數據質量評估的唯一性編碼,由一級指標、二級指標共4位數字組成,編碼規(guī)則見一級指標由2位數字組成,01代表數據規(guī)范性指標、02代表數據完整標、04代表數據一致性指標、05代表數據及時性指標、06代表數據可用性指標數據屬性值應滿足數據標準或數據字典中定義的展現格稽核表指定稽核列在限定范圍內的不符合格式的數據數量為B,稽核表限定范圍內總條數為A,參照性?;藬祿c參照數據進行比較校驗,判斷指定稽核列中不符合參照列示例:在人口登記信息表中,稽核數據是人口登記性別數據,參照數據是性別碼表,性別為:未知的性別0、男性1、女性2、未說明的性別9,參照性校驗,即人口登記數據的性別必須為0、1、2、9,不應出現其他稽核表指定稽核列在限定范圍內的不符合參照數據的數量為B,稽核表限定范圍內總條數為A,參照性校稽核數據與參照數據進行比較校驗,判斷指定稽核列中不符合參照列示例:在人口登記信息表中,稽核數據是人口登記性別數據,參照數據是性別碼表,性別為:未知的性別0、男性1、女性2、未說明的性別9,要求人口登記數據的性別既有男性又有女性,若性別中只有1或只有22、結果錯誤,則該數據資源得業(yè)務規(guī)則稽核數據符合業(yè)務規(guī)則的程度示例:身份證號字段要符合稽核表指定稽核列在限定范圍內的不符合業(yè)務規(guī)則的數據質量為B,稽核表限定范圍內總條數為A,則該資源得分X=(1-B/A)×描述實際匯聚數據資源的字段是否與資源目錄注冊的字段數業(yè)務主鍵或重要字段等必填項的數據值不示例:涉人數據資源的姓名、身份證號等重要字段數據稽核表指定稽核列在限定范圍內的空值數量為B,該稽核表限定范圍內總條數為A,則該資源數據記錄完按照業(yè)務規(guī)則要求,驗證當前稽核表中滿足過濾條件的數據記錄數范圍是否滿足預先設定規(guī)則,包括時示例:某數據資源實際業(yè)務產生時間為1966年,而實際匯聚數據只有2000年后的數據,那此數據資源不滿足數核心字段完數據的核心關鍵字段示例:涉人數據中證件號碼、涉企數據中統(tǒng)一社會信用代碼等唯一標識字段數據內容應完稽核表中指定稽核列在限定范圍內核心字段內容缺失的數據數量為B,稽核表限定范圍內總檢查單列或者多列數據組合是否示例:一個身份證號碼只能對應唯一稽核表指定稽核列在限定范圍內的重復數量為B,稽核表限定范圍內總條數為描述數據是否與其對應的客觀實示例:年齡的取值范圍應該在0-200稽核表指定稽核列在限定范圍內的不符合值域范圍數量為B,稽核表限定范圍內總條數為A,則該資源得分X=(1-數據內容可靠性校驗描述數據內容是否真實可靠,是示例:企業(yè)注冊資金為-100萬,因注值,此項數據內容稽核表指定稽核列在限定范圍內的數據內容為無效的數量為B,稽核表限定范檢驗稽核表中數據的邏輯性示例:入學時間應當早于畢稽核表指定稽核列中不符合邏輯關系的數量為B,稽核表限定范圍內總條數為A,則該資源得分一致性校驗據,或表間數示例1:單表單行,身份證號碼的7—14位要與出生日示例2:雙表單行,同一個身份證號碼在多個表中對應稽核表指定稽核列中不符合一致性約束記錄數量為B,稽核表限定范圍內總條數為A,則該資源更新周期描述數據資源的更新周期是否符合數據實際產生周期情況。規(guī)范政務部門把數據更新周期設示例:門診就診記錄數據更新周期為1天。年報類數據的更新周期應根據數據的業(yè)務屬性來判定數據更新周期是1、若數據更新周期合理,該數據資源得分2、若數據更新周期不合理,該數據資源得更新及時率描述數據資源是否按照業(yè)務上數據實際產生的更新周期進行更新。規(guī)范政務部門能夠按時進示例:政務部門設置資源數據更新為1月,則需要每月更根據數據是否及時按照更新周期合理,來判1、若數據是按時更新或未到更新時間,該2、若數據未按時更新或無法判斷是否更可直接利描述數據資源的度。如果源端是數據庫類型,可直接通過數據庫表的方式共享,增強數據的可用示例:源端是數據庫表直接通過數據1、若原始數據為庫表格式的結構化數數據可理解性(數據描述文指數據庫表中的字段應有對應的描述文檔(如數等),描述需準確,便于更好的示例:通過數據碼表,將數據庫表字段CSRQ與“出生日數據庫表中字段對應的描述不準確或缺失的數量為B,數據庫表中字段總數為6.1.1政務數據質量評分,主要采用權重法計算質量評分。對數據):X——數據一級指標得分;xi——數據二級指標得分;"i——數據二級指標權重。注1:不同數據資源適用評估指標不同,各部門根據業(yè)務數據實6.2.2對數據質量進行整體評分定級時,需根據數據實際應用情況同的權重。數據是否準確、完整,能否被有效使完整性評分需配置較高的權重。如若在某些特定場景需求下對數據時效性要求高,則應當將數據質量評估程序詳見圖3,包括:構建質量評估組織、確定質量評估對象、確定評估指標、配置a)構建質量評估組織:構建質量評估組織,明確每個部門及個人在組織中的質量評估職責。b)確定質量評估對象:根據政務部門的具體業(yè)務需求,確定開展數據質量評估的數據資源(數c)確定評估指標:根據明確的質量評估對象,d

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論