版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
E-Government(I\Monthly)ISSN1672-7223CN11-5181/TPInitialIssueIfil)04No.10,2022(TotdNo.238)PublicationDateI2022-1&10gk@@.?*82—564
AuthoritiesinCh6/ge/ChineseAcademyofScienoesSponsorIDocumentationandInformationCenterofCASEditedby/E-GovernmentEditorialDepartmentPublishedby/E-GovernmentEdilonalOepamentDistributedby/BeijingBureauforDistributionofNe\vspape/8andPeriodicalsPostDistributionCade/82-564Edil0r-in-Chief/ZhouHongrenManagingEditorIZhüngJianhuiViceEdit0r-in-Chief/SongWenbao.HuangHaang,TianHongEditor/WuXuwen,RenFangfangA#Editor/WangChuanweiHeadofEdfonalDepartment/ZhangJianhuiCu?entEditor-in-Ch6ge/SongWenhaoAdvertisementCensor/MiaoZhigang/@@,86-10-82622546f§J&786-1O-625391d4
Address133BeiSihuanXiiu,Zhonggvancun,Beijing,ChinaP.C.I\00190Officemailbox/egov6mail.ias.ac.enWebs*e/w/WeChatofficialacc0u?i/eg0v_dyTelI8&0szmzMgFax/06-10-H534144Price/RM885.00Printing/BeijingKexinPrintingCo.,Ltd4IlRightsReserved專題研究:公共數(shù)據(jù)授權(quán)運營價值共創(chuàng)與數(shù)據(jù)安全的兼顧:基于聯(lián)邦學習的政府數(shù)據(jù)授權(quán)運營模式研究*胡業(yè)飛① 陳美欣② 張怡夢**③①復(fù)旦大學國際關(guān)系與公共事務(wù)學院上海200433②天津大學管理與經(jīng)濟學部天津300072③上海理工大學管理學院上海200093摘要:如何在公共數(shù)據(jù)資源的開發(fā)利用中兼顧價值共創(chuàng)與數(shù)據(jù)安全,是我國政府數(shù)據(jù)開放事業(yè)始終面臨的一大挑戰(zhàn)。在國家“十四五”規(guī)劃提出“開展政府數(shù)據(jù)授權(quán)運營試點”這一政策背景下,構(gòu)建基于聯(lián)邦學習技術(shù)的政府數(shù)據(jù)授權(quán)運營模式,有望解決上述問題。首先分析了基于傳統(tǒng)API技術(shù)構(gòu)建政府數(shù)據(jù)授權(quán)運營模式的局限性,進而提出利用聯(lián)邦學習技術(shù)來建構(gòu)政府數(shù)據(jù)授權(quán)運營新模式,并對該模式中主要參與主體、模式運作的過程邏輯以及政社主體間的新關(guān)系做了詳細解析,論證了聯(lián)邦學習技術(shù)與政府數(shù)據(jù)授權(quán)運營的適配性。隨后,從橫向聯(lián)邦學習、縱向聯(lián)邦學習、聯(lián)邦遷移學習三種技術(shù)路徑出發(fā),分別結(jié)合電力供給與配置、個人與企業(yè)信貸評估以及醫(yī)療服務(wù)三個實際情景,呈現(xiàn)出基于聯(lián)邦學習的政府數(shù)據(jù)授權(quán)運營模式在不同情景下達成公共數(shù)據(jù)資源開發(fā)利用目標的過程?;诼?lián)邦學習的政府數(shù)據(jù)授權(quán)運營新模式有著兼顧價值共創(chuàng)與數(shù)據(jù)安全的顯著優(yōu)勢,同時也為政府數(shù)據(jù)運營機構(gòu)乃至政府本身的技術(shù)與管理能力提出了新的要求。關(guān)鍵詞:政府數(shù)據(jù)授權(quán)運營;政府數(shù)據(jù)開放;聯(lián)邦學習;價值共創(chuàng);數(shù)據(jù)安全DOI:10.16582/ki.dzzw.2022.10.001一、引言:如何開展政府數(shù)據(jù)授權(quán)運營激活數(shù)據(jù)要素潛能,更大程度地釋放公共數(shù)據(jù)資源所蘊含的經(jīng)濟社會價值,是發(fā)展數(shù)字經(jīng)濟、數(shù)字政府和數(shù)字社會的重要目標之一[1,2]。為實現(xiàn)上述目標,政府數(shù)據(jù)開放工作從2015年起被納入國家戰(zhàn)略規(guī)劃中,并在2020年被《中共中央國務(wù)院關(guān)于構(gòu)建更加完善的要素市場化配置體制機制的意見》進一步確立為“加快培育數(shù)據(jù)要素市場”的首要措施。本質(zhì)上講,政府數(shù)據(jù)開放是政府與社會圍繞公共數(shù)據(jù)資源進行價值共創(chuàng)的過程。已有學者指出,政府數(shù)據(jù)開放的內(nèi)核是合作治理,即以跨
部門協(xié)同的方式實現(xiàn)經(jīng)濟社會價值的合作生產(chǎn)[3,4]。通過政府開放公共數(shù)據(jù)資源、社會主體對公共數(shù)據(jù)資源進行開發(fā)利用這一協(xié)作形式,新的知識乃至產(chǎn)品、服務(wù)被創(chuàng)造出來,最終形成一種價值共創(chuàng)的生態(tài)[5]。不過,當前政府數(shù)據(jù)開放的主要運作模式——即無門檻、非定向地向全社會開放原始公共數(shù)據(jù)資源——帶來了泄露國家機密與隱私信息、威脅國家安全等潛在風險,這些風險在近年也開始得到學術(shù)界的關(guān)注。學者們發(fā)現(xiàn):一方面,政府工作人員可能在數(shù)據(jù)開放過程中,因主觀故意或過失行為而對外泄露了國家機密[6];另一*基金項目:教育部人文社會科學研究青年基金項目“公共服務(wù)視角下政府數(shù)據(jù)開放(OGD)的發(fā)展困境及其對策研究”(項目號:20YJC630044);國家自然科學基金青年項目“政府角色對合作治理績效的影響研究:以技術(shù)標準領(lǐng)域為例”(項目號:72004158);上海市科技創(chuàng)新行動計劃軟科學研究項目“城市數(shù)字治理中的創(chuàng)新技術(shù)應(yīng)用效果評價研究”(項目號:**通訊作者收稿日期:2022-06-22修回日期:2022-09-02胡業(yè)飛陳美欣張怡夢·價值共創(chuàng)與數(shù)據(jù)安全的兼顧:基于聯(lián)邦學習的政府數(shù)據(jù)授權(quán)運營模式研究方面,即使政府開放的公共數(shù)據(jù)資源并不屬于國家機密,但由于公共數(shù)據(jù)本身的獨特性以及其與自然人、法人的高度關(guān)聯(lián)性,不法分子有可能將這些公共數(shù)據(jù)與其他數(shù)據(jù)進行關(guān)聯(lián)分析,從而導(dǎo)致國家機密或個人隱私的泄露[7]。因此,有研究就提出,應(yīng)當重新思考政府數(shù)據(jù)開放的運作方式,在無門檻、非定向開放公共數(shù)據(jù)資源的方式之外探索新的政府數(shù)據(jù)開放形式,保證社會主體以合法、恰當?shù)姆绞介_發(fā)公共數(shù)據(jù),限制不合適的數(shù)據(jù)獲取與利用行為,降低政府數(shù)據(jù)開放風險的發(fā)生概率[8]。于是,政府數(shù)據(jù)授權(quán)運營作為數(shù)據(jù)開放的一種新形式應(yīng)運而生。2021年,國家“十四五”規(guī)劃為鼓勵第三方深化對公共數(shù)據(jù)的挖掘利用,在“加強公共數(shù)據(jù)開放共享”條目下提出“開展政府數(shù)據(jù)授權(quán)運營試點”。這為政府數(shù)據(jù)開放領(lǐng)域確立了一個新的研究與實踐議題。盡管目前學術(shù)界和實踐界還在探索政府數(shù)據(jù)授權(quán)運營的概念內(nèi)涵與運作方式,但已經(jīng)形成了幾點共識性的認知:第一,“授權(quán)”會貫穿政府數(shù)據(jù)授權(quán)運營全過程,即由政府授權(quán)一個特定組織(下文稱政府數(shù)據(jù)運營機構(gòu))來運營公共數(shù)據(jù)資源,其他社會主體須向政府授權(quán)的這個數(shù)據(jù)運營機構(gòu)來獲取公共數(shù)據(jù)資源使用權(quán)[9]168;第二,為兼顧價值共創(chuàng)與數(shù)據(jù)安全,政府數(shù)據(jù)授權(quán)運營模式下的公共數(shù)據(jù)開發(fā)利用活動會受到更強的監(jiān)管,甚至接受政府的全程監(jiān)管[10,11];第三,企業(yè)、個人等各類社會主體將主要以“可用不可得”的方式利用政府開放的公共數(shù)據(jù)資源[9]170。不過,對政府數(shù)據(jù)授權(quán)運營模式的理論探討目前主要還停留在宏觀層面,有待向更微觀、更實操的層面推進。將抽象的宏觀政策規(guī)劃轉(zhuǎn)化為有效的微觀政策執(zhí)行,始終是公共管理學界的重要任務(wù)[12]。那么,在國家宏觀政策的指導(dǎo)下,如何構(gòu)建一種微觀可操作的政府數(shù)據(jù)授權(quán)運營模式?現(xiàn)有的“可用不可得”技術(shù)能否支撐政府數(shù)據(jù)授權(quán)運營工作的開展?這些研究問題還缺乏相
關(guān)理論研究的探討。本文即嘗試為上述問題提供一個解答。首先,本文將分析基于傳統(tǒng)應(yīng)用程序編程接口(API)技術(shù)構(gòu)建的政府數(shù)據(jù)授權(quán)運營模式存在何種局限性;其次,本文將從“聯(lián)邦學習”這一新興的隱私計算技術(shù)出發(fā),建構(gòu)基于聯(lián)邦學習的政府數(shù)據(jù)授權(quán)運營模式,并結(jié)合政府數(shù)據(jù)授權(quán)運營的潛在發(fā)生場景,解釋其價值共創(chuàng)過程,從而增進對政府數(shù)據(jù)授權(quán)運營的理論知識積累。二、基于傳統(tǒng)API技術(shù)的政府數(shù)據(jù)授權(quán)運營及其局限性公共數(shù)據(jù)資源運營機構(gòu)一般會要求社會主體以“可用不可得”的方式開發(fā)利用公共數(shù)據(jù)資源。API(ApplicationProgrammingInterface,應(yīng)用程序編程接口)技術(shù)是這一運作模式下的傳統(tǒng)技術(shù)選擇。API技術(shù)是提供軟件組件和服務(wù)的編程接口,能夠幫助用戶獲取已有的數(shù)據(jù)、服務(wù)或程序組件,使其更為快速和高效地構(gòu)建程序產(chǎn)品[13]。這種功能可以幫助政府數(shù)據(jù)運營機構(gòu)對外提供數(shù)據(jù)服務(wù)。該機構(gòu)可以通過開放API接口來向企業(yè)、社會組織、社會公眾提供公共數(shù)據(jù)資源,從而滿足這些社會主體的數(shù)據(jù)需求[14]。特別對于政府數(shù)據(jù)授權(quán)運營而言,API接口可要求社會主體在調(diào)用服務(wù)或獲取數(shù)據(jù)時,必須持有政府認可的個人唯一標識碼(Key),從而實現(xiàn)了“授權(quán)”貫穿數(shù)據(jù)開放與流通全過程,支撐更有力的政府監(jiān)管(參見圖1)。在政府數(shù)據(jù)授權(quán)運營中運用API技術(shù),能夠衍生出“可用不可見”和“可見不可得”兩種運作模式。“可用不可見”是指社會主體不直接獲取原始的公共數(shù)據(jù)資源,而是調(diào)用政府數(shù)據(jù)開放平臺提供的程序功能,直接獲得分析結(jié)果或服務(wù)。在這種模式下,API接口是平臺為政府外部的開發(fā)者提供的服務(wù)訪問接口,通過API接口,程序開發(fā)者可直接調(diào)用平臺已有的程序功能為己所用,不需要了解數(shù)據(jù)的具體內(nèi)容[15]?!翱梢姴豢傻谩笔呛鷺I(yè)飛陳美欣張怡夢·價值共創(chuàng)與數(shù)據(jù)安全的兼顧:基于聯(lián)邦學習的政府數(shù)據(jù)授權(quán)運營模式研究搜索政府數(shù)據(jù)接口獲取API文檔獲取URLHttp方式請求URL獲取API文檔獲取URLHttp方式請求URL輸入個人唯一標識碼(Key)輸入個人唯一標識碼(Key)成功 服務(wù)器解析并響應(yīng) 失敗獲取數(shù)據(jù)返回錯誤碼政府數(shù)據(jù)處理與利用Key錯誤數(shù)據(jù)庫無法訪問獲取數(shù)據(jù)返回錯誤碼政府數(shù)據(jù)處理與利用Key錯誤數(shù)據(jù)庫無法訪問結(jié)束 結(jié)束圖1政府授權(quán)下社會主體通過API端口的數(shù)據(jù)調(diào)用流程指社會主體能夠了解公共數(shù)據(jù)資源的基本內(nèi)容和結(jié)構(gòu),并且得到處理后的信息或者少部分原始數(shù)據(jù),但無法得到全部的原始數(shù)據(jù)集,避免更多機密信息的泄露。在這種模式下,社會主體調(diào)用API接口獲取的是格式轉(zhuǎn)化與處理后的小部分數(shù)據(jù)[16]。不過,API接口作為一種傳統(tǒng)技術(shù)應(yīng)用于政府數(shù)據(jù)授權(quán)運營,存在一定的局限性。一方面,對“可用不可見”模式而言,社會主體對公共數(shù)據(jù)資源的開發(fā)利用嚴重受限于平臺所能提供的程序功能。政府數(shù)據(jù)授權(quán)運營平臺提供的程序功能總是有限的,不可能滿足社會主體的所有需求。當需求與功能不匹配時,社會主體在這種情況下缺乏拓展相關(guān)功能的機會,變得無計可施。另一方面,對“可見不可得”模式而言,如果社會主體從API接口獲得的是處理后的信息,這些主體依然有機會按照“逆向工程”邏輯反推原始數(shù)據(jù)全集。政府為避免這種“逆向工程”而對原始數(shù)據(jù)進行深度處理,又會極大削弱數(shù)據(jù)的二次開發(fā)利用價值。如果社會主體從API接口獲得的是一小部分原始數(shù)據(jù)集,那么該主體
可通過“少量多次”的方式獲取原始數(shù)據(jù)資源的全集,使API技術(shù)喪失“可見不可得”功能,無法起到維護數(shù)據(jù)安全、減少風險發(fā)生的應(yīng)有作用。這種情形下,政府只能限制社會主體的數(shù)據(jù)獲取次數(shù)與總規(guī)模,這種限制同樣不利于公共數(shù)據(jù)資源價值的充分釋放。營活動,更好地釋放公共數(shù)據(jù)資源所蘊含的價值,就需要選擇新技術(shù)工具,建構(gòu)一套新的政府數(shù)據(jù)授權(quán)運營模式。三、基于聯(lián)邦學習的政府數(shù)據(jù)授權(quán)運營模式:結(jié)構(gòu)與邏輯政府數(shù)據(jù)授權(quán)運營的核心原則,是在保障數(shù)據(jù)安全以及原始數(shù)據(jù)(特別是涉密、涉及隱私的數(shù)據(jù))不外流的前提下,融合政府主體掌握的數(shù)據(jù)資源與社會主體掌握的數(shù)據(jù)開發(fā)能力,實現(xiàn)多元主體共同參與下的價值共創(chuàng)。相比具有顯著局限性的API技術(shù),作為隱私計算(privacycomputing)形式之一的聯(lián)邦學習(federated胡業(yè)飛陳美欣張怡夢·價值共創(chuàng)與數(shù)據(jù)安全的兼顧:基于聯(lián)邦學習的政府數(shù)據(jù)授權(quán)運營模式研究learning)(一)聯(lián)邦學習技術(shù)簡述聯(lián)邦學習是分布式機器學習技術(shù)的一種特殊形式。這一技術(shù)可讓包括政府在內(nèi)的多個數(shù)據(jù)所有者在不暴露自身數(shù)據(jù)的前提下,共同協(xié)作完成模型訓(xùn)練任務(wù)。聯(lián)邦學習用模型參數(shù)的傳輸和更新替代了數(shù)據(jù)的對外共享,在此基礎(chǔ)上實現(xiàn)多主體合作開發(fā)全局模型并加以利用[17]。聯(lián)邦學習技術(shù)具備兩個核心優(yōu)勢,表現(xiàn)在:第一,聯(lián)邦學習技術(shù)允許多主體攜各自的數(shù)據(jù)資源共同參與數(shù)據(jù)開發(fā)利用活動。聯(lián)邦學習技術(shù)繼承了分布式機器學習的特征,允許擁有不同數(shù)據(jù)資源的多個節(jié)點共同執(zhí)行同一個機器學習任務(wù),各個節(jié)點獨立訓(xùn)練數(shù)據(jù)并獲得模型參數(shù)后,上傳至中心節(jié)點,由中心節(jié)點完成參數(shù)整合和模型分發(fā)[18]。這一技術(shù)突破了數(shù)據(jù)資源開發(fā)利用需要在一臺服務(wù)器匯聚全部數(shù)據(jù)的傳統(tǒng)方法限制,為政府數(shù)據(jù)授權(quán)運營提供了更為便捷的技術(shù)條件[19]。第二,聯(lián)邦學習技術(shù)可實現(xiàn)數(shù)據(jù)在“可用不可得”基礎(chǔ)上的開發(fā)利用,有利于規(guī)避原始數(shù)據(jù)在流動過程中面臨的風險,保護隱私信息和數(shù)據(jù)安全。借助聯(lián)邦學習技術(shù),每個參與者掌握的原始數(shù)據(jù)在數(shù)據(jù)開發(fā)過程中都不對外傳輸,而是保留在本地[20]。這就實現(xiàn)了真正的數(shù)據(jù)“可用不可得”,降低隱私與涉密信息的泄露風險,更加匹配政府數(shù)據(jù)授權(quán)運營的工作要求[21]。(二)基于聯(lián)邦學習技術(shù)的政府數(shù)據(jù)授權(quán)運營模式架構(gòu)結(jié)合政府數(shù)據(jù)授權(quán)運營的內(nèi)在邏輯及聯(lián)邦學習技術(shù)
的功能屬性,提出建構(gòu)一種基于聯(lián)邦學習技術(shù)的政府數(shù)據(jù)授權(quán)運營模式。圖2說明了政府數(shù)據(jù)授權(quán)運營工作參與主體的角色及功能定位,圖3則說明了基于聯(lián)邦學習的政府數(shù)據(jù)授權(quán)運營模式運作過程。⒈政府數(shù)據(jù)授權(quán)運營模式中的主要參與主體如圖2所示,政府數(shù)據(jù)授權(quán)運營工作主要有政府職能部門、大數(shù)據(jù)中心(大數(shù)據(jù)局)、政府數(shù)據(jù)運營機構(gòu)、政府數(shù)據(jù)使用方等四類主體共同參與。第一類主體是政府職能部門,即政府數(shù)據(jù)的法定持有者與供給主體。這一主體在依法履行職責過程中制作、獲取、生成、保存政府數(shù)據(jù),并為政府數(shù)據(jù)授權(quán)運營提供高質(zhì)量的數(shù)據(jù)集資源,同時承擔一定的政府數(shù)據(jù)管理責任,保護數(shù)據(jù)安全。在政府數(shù)據(jù)授權(quán)運營過程中,政府職能部門有著一系列工作職責。第一,在源頭上保障政府數(shù)據(jù)安全。政府職能部門需要在制作、獲取、生成和保存政府數(shù)據(jù)過程中采用數(shù)據(jù)加密、數(shù)據(jù)脫敏等方法減少原始數(shù)據(jù)內(nèi)的敏感信息內(nèi)容。第二,定期維護及更新政府數(shù)據(jù),特別對具有較高利用率和利用價值的政府數(shù)據(jù)提升更新速度。第三,提升政府數(shù)據(jù)的質(zhì)量和價值。政府職能部門應(yīng)努力提升數(shù)據(jù)完整性和種類豐富性,為政府數(shù)據(jù)授權(quán)運營工作提供更多、更好的數(shù)據(jù)集資源。第二類主體是政府內(nèi)部的大數(shù)據(jù)中心(大數(shù)據(jù)局)。大數(shù)據(jù)中心(大數(shù)據(jù)局)是政府數(shù)據(jù)授權(quán)運營工作的統(tǒng)籌管理機構(gòu),依法承擔政府數(shù)據(jù)的集中統(tǒng)一管理責任。大數(shù)據(jù)中心(大數(shù)據(jù)局)與政府職能部門協(xié)同管理政府數(shù)據(jù),雙方共同將政府數(shù)據(jù)的市場化運營權(quán)授權(quán)協(xié)同管理政府數(shù)據(jù)
監(jiān)督 提供數(shù)據(jù)服務(wù)…政府數(shù)據(jù)使用方…政府數(shù)據(jù)使用方政府職能部門
大數(shù)據(jù)中心(大數(shù)據(jù)局)
政府數(shù)據(jù)運營機構(gòu)協(xié)同授權(quán)圖2基于聯(lián)邦學習的政府數(shù)據(jù)授權(quán)運營模式下相關(guān)參與主體及主體間關(guān)系胡業(yè)飛陳美欣張怡夢·價值共創(chuàng)與數(shù)據(jù)安全的兼顧:基于聯(lián)邦學習的政府數(shù)據(jù)授權(quán)運營模式研究給一個具體的政府數(shù)據(jù)運營機構(gòu)。在宏觀層面,大數(shù)據(jù)中心(大數(shù)據(jù)局)是政府數(shù)據(jù)授權(quán)運營中極為重要的統(tǒng)籌管理者。表1展示了大數(shù)據(jù)中心(大數(shù)據(jù)局)在政府授權(quán)運營工作中角色與功能定位,包括了運營制度設(shè)計者、數(shù)據(jù)協(xié)同管理者、授權(quán)運營管理者、運營過程監(jiān)管者、運營問題協(xié)調(diào)者、數(shù)據(jù)安全保障者,其具體功能涵蓋了制度設(shè)計、主體協(xié)調(diào)、數(shù)據(jù)授權(quán)、全面監(jiān)督、維護安全等多個方面。這些功能也彰顯了大數(shù)據(jù)中心(大數(shù)據(jù)局)在政府數(shù)據(jù)授權(quán)運營中所發(fā)揮的全面管理功能。第三類主體是政府數(shù)據(jù)運營機構(gòu)。政府數(shù)據(jù)運營機構(gòu)是獲得政府數(shù)據(jù)運營權(quán)的特定組織,通常是一個市場主體(特別是國有企業(yè))。在授權(quán)運營過程中,政府數(shù)據(jù)運營機構(gòu)是政府數(shù)據(jù)授權(quán)運營工作的實際執(zhí)行者和數(shù)據(jù)服務(wù)提供者,為有意向使用政府數(shù)據(jù)的社會主體提供數(shù)據(jù)資源服務(wù),同時接受大數(shù)據(jù)中心(大數(shù)據(jù)局)的監(jiān)督管理。如果說,作為統(tǒng)籌管理機構(gòu)的大數(shù)據(jù)中心(大數(shù)據(jù)局)主要在宏觀層面發(fā)揮制度設(shè)計和全方位的監(jiān)管功能,那么政府數(shù)據(jù)運營機構(gòu)則在更為微觀的政府數(shù)據(jù)授權(quán)運營過程中體現(xiàn)其職能,具體包括以下幾個方面:第一,保證政府數(shù)據(jù)安全,核查政府數(shù)據(jù)使用方的合法身份;第二,記錄和管理聯(lián)邦學習系統(tǒng)中的中央服務(wù)器
運作情況,實施政府數(shù)據(jù)授權(quán)運營的過程管理,規(guī)范政府數(shù)據(jù)使用方行為;第三,向大數(shù)據(jù)中心(大數(shù)據(jù)局)定期匯報政府數(shù)據(jù)授權(quán)運營工作情況;第四,提升自身技術(shù)能力與軟硬件設(shè)施,強化數(shù)據(jù)服務(wù)能力。第四類主體是政府數(shù)據(jù)使用方。政府數(shù)據(jù)使用方是對政府數(shù)據(jù)有開發(fā)利用需求的各類社會主體,這些主體通過支付數(shù)據(jù)服務(wù)費用而獲得政府數(shù)據(jù)運營機構(gòu)提供的數(shù)據(jù)服務(wù)。在開發(fā)利用政府數(shù)據(jù)并釋放經(jīng)濟社會價值的基礎(chǔ)上,政府數(shù)據(jù)使用方的責任表現(xiàn)在:第一,遵守數(shù)據(jù)開發(fā)利用協(xié)議中的政府數(shù)據(jù)使用規(guī)范,在履行數(shù)據(jù)保護義務(wù)的基礎(chǔ)上挖掘政府數(shù)據(jù)價值;第二,不對外泄露和非法使用政府數(shù)據(jù),不危害國家、社會和個人安全與利益;第三,自覺接受和配合大數(shù)據(jù)中心(大數(shù)據(jù)局)以及政府數(shù)據(jù)運營機構(gòu)的監(jiān)督和管理工作。⒉基于聯(lián)邦學習的政府數(shù)據(jù)授權(quán)運營模式運作過程基于上述各主體所承擔的職責,在政府職能部門與大數(shù)據(jù)中心(大數(shù)據(jù)局)的監(jiān)督與管理之下,政府數(shù)據(jù)運營機構(gòu)與政府數(shù)據(jù)使用方以聯(lián)邦學習技術(shù)為支撐,基于各自掌握的數(shù)據(jù),聯(lián)合開展數(shù)據(jù)開發(fā)利用活動[22]。圖3呈現(xiàn)了政府數(shù)據(jù)授權(quán)運營模式的完整運作過程。該過程主要包括準備階段與開發(fā)階段兩個主要表1政府數(shù)據(jù)授權(quán)運營中大數(shù)據(jù)中心(大數(shù)據(jù)局)的統(tǒng)籌管理角色角色職責要求運營制度設(shè)計者數(shù)據(jù)協(xié)同管理者與政府職能部門協(xié)同管理政府數(shù)據(jù),職責包括:·完善平臺建設(shè),保障平臺安全性、兼容性、穩(wěn)定性·協(xié)同并督促政府職能部門管理數(shù)據(jù)資源授權(quán)運營管理者·對市場主體的經(jīng)營性質(zhì)、經(jīng)營狀況、行業(yè)信用、業(yè)務(wù)領(lǐng)域、技術(shù)能力等內(nèi)容進行全方位考察和核驗,以審查主體資格,選取政府數(shù)據(jù)運營機構(gòu)并予以授權(quán)運營過程監(jiān)管者監(jiān)督管理政府數(shù)據(jù)運營機構(gòu)工作,職責包括:·監(jiān)管運營情況,定期考核政府數(shù)據(jù)維護、更新、風險處理工作·要求政府數(shù)據(jù)運營機構(gòu)提供政府數(shù)據(jù)授權(quán)運營工作總結(jié),包括政府數(shù)據(jù)使用情況、利用成果、政府數(shù)據(jù)使用方基本信息、政府數(shù)據(jù)授權(quán)運營安全風險情況等內(nèi)容運營問題協(xié)調(diào)者·協(xié)調(diào)政府數(shù)據(jù)授權(quán)運營參與主體關(guān)系,處理政府職能部門、政府數(shù)據(jù)運營機構(gòu)、政府數(shù)據(jù)使用方出現(xiàn)的利益沖突、法律糾紛和政府數(shù)據(jù)授權(quán)運營中的各類問題數(shù)據(jù)安全保障者·防范政府數(shù)據(jù)授權(quán)運營中的各類數(shù)據(jù)風險問題,監(jiān)督政府數(shù)據(jù)運營機構(gòu)與政府數(shù)據(jù)使用方之間的數(shù)據(jù)利用行為,提供社會救濟胡業(yè)飛陳美欣張怡夢·價值共創(chuàng)與數(shù)據(jù)安全的兼顧:基于聯(lián)邦學習的政府數(shù)據(jù)授權(quán)運營模式研究管理政府數(shù)據(jù)運營機構(gòu)
政府數(shù)據(jù) 政府數(shù)據(jù)模型第二步:訓(xùn)練本地模型并加密上傳簽訂服務(wù)協(xié)議支付服務(wù)費用參與數(shù)據(jù)利用簽訂服務(wù)協(xié)議支付服務(wù)費用參與數(shù)據(jù)利用提供數(shù)據(jù)服務(wù)無原始數(shù)據(jù)共享 中央服務(wù)器 全局模型第二步:訓(xùn)練本地模型…政府數(shù)據(jù)使用方
并加密上傳私有數(shù)據(jù) 私有數(shù)據(jù)模
第三步:中央服務(wù)器接收、聚合各本地模型,生成全局模型聯(lián)邦學習系統(tǒng)圖3基于聯(lián)邦學習的政府數(shù)據(jù)授權(quán)運營模式運作流程部分。在基于聯(lián)邦學習的政府數(shù)據(jù)授權(quán)運營的準備階段,參與的各方主體首先需要建立合作關(guān)系(可見圖3左側(cè))。如果若干社會主體擬利用某些公共數(shù)據(jù)資源訓(xùn)練一種算法模型,就需要向政府數(shù)據(jù)運營機構(gòu)提出申請,在簽訂數(shù)據(jù)服務(wù)協(xié)議、提交數(shù)據(jù)服務(wù)費用后,從政府數(shù)據(jù)運營機構(gòu)處獲得公共數(shù)據(jù)資源的使用授權(quán)。這些社會主體將作為政府數(shù)據(jù)使用方,在保證履行協(xié)議內(nèi)容、保障數(shù)據(jù)安全的基礎(chǔ)上,聯(lián)合政府數(shù)據(jù)運營機構(gòu)對數(shù)據(jù)進行開發(fā)利用。大數(shù)據(jù)中心(大數(shù)據(jù)局)在各政府職能部門的協(xié)同配合之下,指導(dǎo)政府數(shù)據(jù)運營機構(gòu),對政府數(shù)據(jù)授權(quán)運營的整個過程實施監(jiān)督管理。準備階段完成之后,政府數(shù)據(jù)運營機構(gòu)及各政府數(shù)據(jù)使用方就要進入一個具體的應(yīng)用場景里,在不共享原始數(shù)據(jù)的基礎(chǔ)上,運用各自掌握的本地數(shù)據(jù)聯(lián)合開展算法模型訓(xùn)練。如圖3所示,訓(xùn)練過程分為四個步驟:第一步,政府數(shù)據(jù)運營機構(gòu)與政府數(shù)據(jù)使用方從中央服務(wù)器獲取初始模型;第二步,利用各自掌握的政府數(shù)據(jù)和
私有數(shù)據(jù)開展模型訓(xùn)練,各方主體將其各自獲得的模型參數(shù)加密上傳至中央服務(wù)器;第三步,中央服務(wù)器接收全部模型參數(shù)信息后,聚合生成全局模型;第四步,中央服務(wù)器將全局模型下發(fā)至各參與方進行新一輪模型訓(xùn)練?;诼?lián)邦學習的政府數(shù)據(jù)授權(quán)運營就是通過這種反復(fù)迭代的模型訓(xùn)練,最終獲得一個優(yōu)質(zhì)的模型成品,完成數(shù)據(jù)的開發(fā)利用工作[23]。總的來看,基于聯(lián)邦學習的政府數(shù)據(jù)授權(quán)運營模式本質(zhì)上是以授權(quán)關(guān)系為連接線,在政府職能部門與大數(shù)據(jù)中心(大數(shù)據(jù)局)支持的基礎(chǔ)上,將政府數(shù)據(jù)運營機構(gòu)和政府數(shù)據(jù)使用方(包括企業(yè)、事業(yè)單位、社會組織及社會公眾等)連接成一個合作網(wǎng)絡(luò),然后這個合作網(wǎng)絡(luò)圍繞一個中央服務(wù)器,在全程監(jiān)督下合作完成數(shù)據(jù)開發(fā)利用工作。⒊政府數(shù)據(jù)授權(quán)運營模式中的政社主體間關(guān)系創(chuàng)新與主體均承擔著特定的角色和功能作用,為實現(xiàn)價值共創(chuàng)與保障數(shù)據(jù)安全而建構(gòu)起相應(yīng)的主體間關(guān)系??傮w而胡業(yè)飛陳美欣張怡夢·價值共創(chuàng)與數(shù)據(jù)安全的兼顧:基于聯(lián)邦學習的政府數(shù)據(jù)授權(quán)運營模式研究言,基于聯(lián)邦學習構(gòu)建的政府數(shù)據(jù)授權(quán)運營模式重建了政府數(shù)據(jù)開放活動的政社主體間關(guān)系,使這一關(guān)系呈現(xiàn)出嶄新的面貌,體現(xiàn)出了創(chuàng)新性。首先,在傳統(tǒng)的政府數(shù)據(jù)開放活動中,負責開放數(shù)據(jù)的平臺只負責供給公共數(shù)據(jù)資源,而不參與社會主體的數(shù)據(jù)開發(fā)利用活動,不與社會主體發(fā)生更多合作性的關(guān)聯(lián)。但在基于聯(lián)邦學習的政府數(shù)據(jù)授權(quán)運營活動中,政府數(shù)據(jù)運營機構(gòu)與政府數(shù)據(jù)使用方(包括企業(yè)、事業(yè)單位、社會組織、社會公眾)都要貢獻出自身所擁有的數(shù)據(jù)資源和能力稟賦,直接參與模型訓(xùn)練工作,為最終的開發(fā)成果貢獻力量。這種制度安排更大程度地挖掘出了各方主體的數(shù)據(jù)資源存量與數(shù)據(jù)開發(fā)能力,更有利于協(xié)同開發(fā)出更優(yōu)質(zhì)的產(chǎn)品,從而提升價值共創(chuàng)水平。其次,聯(lián)邦學習技術(shù)也重塑了各主體間在數(shù)據(jù)層面上的關(guān)系,幫助實現(xiàn)原始數(shù)據(jù)在“可用不可得”基礎(chǔ)上獲得開發(fā)利用。政府數(shù)據(jù)運營機構(gòu)與政府數(shù)據(jù)使用方作為聯(lián)邦學習的最主要用戶,僅通過中央服務(wù)器下發(fā)的聚合模型來享用數(shù)據(jù)開發(fā)利用成果,原始數(shù)據(jù)仍保留在本地設(shè)備,彼此不發(fā)生共享[24]。這在一定程度上降低了隱私泄露風險及數(shù)據(jù)安全威脅,有利于激勵政府職能部門對外開放更多高價值數(shù)據(jù)。第三,相比傳統(tǒng)的政府數(shù)據(jù)開放模式,基于聯(lián)邦學習的政府數(shù)據(jù)授權(quán)運營模式還建構(gòu)了更有利于保障數(shù)據(jù)安全的“兩級監(jiān)管”關(guān)系,分別由政府數(shù)據(jù)運營機構(gòu)及大數(shù)據(jù)中心(大數(shù)據(jù)局)實施。第一級監(jiān)管是由政府數(shù)據(jù)運營機構(gòu)面向聯(lián)邦學習過程所實施的監(jiān)管活動。政府數(shù)據(jù)運營機構(gòu)負責審查政府數(shù)據(jù)使用方身份,簽訂數(shù)據(jù)服務(wù)協(xié)議,記錄、追溯聯(lián)邦學習參與方的數(shù)據(jù)利用情況,監(jiān)督和規(guī)范各方參與者的數(shù)據(jù)利用行為,監(jiān)督整個模型聚合過程,保證傳輸模型參數(shù)的安全。第二級監(jiān)管是由大數(shù)據(jù)中心(大數(shù)據(jù)局)面向整個政府數(shù)據(jù)授權(quán)運營體系所實施的監(jiān)管活動。政府的大數(shù)據(jù)中心(大數(shù)據(jù)局)作為統(tǒng)籌管理機構(gòu)發(fā)揮領(lǐng)導(dǎo)職能、實施統(tǒng)一監(jiān)督管
理,對政府數(shù)據(jù)運營機構(gòu)的工作情況及政府數(shù)據(jù)利用情況進行核驗和審查,指出政府數(shù)據(jù)運營機構(gòu)工作不足及存在的風險隱患,實施政府數(shù)據(jù)授權(quán)運營的事前、事中、事后的全過程管理。綜上,在基于聯(lián)邦學習技術(shù)建構(gòu)的政府數(shù)據(jù)授權(quán)運營模式架構(gòu)中,政府數(shù)據(jù)運營機構(gòu)、大數(shù)據(jù)中心(大數(shù)據(jù)局)、政府數(shù)據(jù)利用方等各方參與者建構(gòu)了一個更為緊密的合作關(guān)系網(wǎng)絡(luò),更有利于實現(xiàn)價值共創(chuàng)與數(shù)據(jù)安全的兼顧。(三)聯(lián)邦學習技術(shù)與政府數(shù)據(jù)授權(quán)運營的適配性分析更好地兼顧價值共創(chuàng)與數(shù)據(jù)安全,是選擇聯(lián)邦學習技術(shù)來建構(gòu)政府數(shù)據(jù)授權(quán)運營新模式的核心要求。通過上文對基于聯(lián)邦學習的政府數(shù)據(jù)授權(quán)運營模式的呈現(xiàn)與解析,可以發(fā)現(xiàn),在價值共創(chuàng)與數(shù)據(jù)安全兩個方面,聯(lián)邦學習技術(shù)顯示出了對政府數(shù)據(jù)授權(quán)運營的強適配性。在價值共創(chuàng)層面,聯(lián)邦學習技術(shù)能夠較好地支撐多元主體共同開發(fā)利用公共數(shù)據(jù)資源的過程。實現(xiàn)公共數(shù)據(jù)資源的開發(fā)利用,既需要政府作為數(shù)據(jù)要素供給方對外供應(yīng)公共數(shù)據(jù)資源,也需要市場主體與社會主體對公共數(shù)據(jù)資源進行開發(fā)利用,從而形成政府、市場、社會多元主體合作參與的新格局[25]。為此,支撐政府數(shù)據(jù)授權(quán)運營工作的底層技術(shù)需要滿足多主體協(xié)同這一現(xiàn)實要求。聯(lián)邦學習技術(shù)能夠?qū)崿F(xiàn)多個參與者基于各自目的建設(shè)共有的虛擬模型,以相同的地位和身份參與公共數(shù)據(jù)資源的價值釋放過程[26]。為此,聯(lián)邦學習技術(shù)能夠在政府數(shù)據(jù)授權(quán)運營工作中協(xié)調(diào)多個主體更便捷地參與公共數(shù)據(jù)資源的開發(fā)利用活動,實現(xiàn)多主體共同創(chuàng)造公共數(shù)據(jù)價值。同時,相比于傳統(tǒng)的、非定向的政府數(shù)據(jù)開放模式,基于聯(lián)邦學習的政府數(shù)據(jù)授權(quán)運營模式能夠更好地計算和評估政府數(shù)據(jù)運營機構(gòu)及政府數(shù)據(jù)使用方參與模型訓(xùn)練所付出的成本以及其所做出的貢獻,為最終收益胡業(yè)飛陳美欣張怡夢·價值共創(chuàng)與數(shù)據(jù)安全的兼顧:基于聯(lián)邦學習的政府數(shù)據(jù)授權(quán)運營模式研究分配提供依據(jù),設(shè)計更優(yōu)的收益分配機制[27]104-105。政府和社會主體提供數(shù)據(jù)的數(shù)量和質(zhì)量越高,就越能獲得更高比例的收益分成,以平衡其支出的成本。這種激勵機制可讓更多的、包括政府職能部門在內(nèi)的參與主體加入聯(lián)邦學習生態(tài),貢獻更多的數(shù)據(jù)要素和創(chuàng)新能力,使價值共創(chuàng)網(wǎng)絡(luò)更緊密、更持久地運作下去[28]。聯(lián)邦學習技術(shù)的更大優(yōu)勢則體現(xiàn)在數(shù)據(jù)安全層面。該技術(shù)能夠幫助政府數(shù)據(jù)授權(quán)運營有效防范各類風險問題,營造安全有序的數(shù)據(jù)生態(tài),具體包括以下兩個方面:第一,聯(lián)邦學習技術(shù)能夠幫助政府部門實現(xiàn)數(shù)據(jù)開發(fā)利用活動的有效監(jiān)管。在聯(lián)邦學習技術(shù)架構(gòu)下,政府以及政府授權(quán)的數(shù)據(jù)運營機構(gòu)可通過管理中央服務(wù)器,直接獲得其他主體的數(shù)據(jù)使用行為記錄與開發(fā)行為情況,并結(jié)合模型開發(fā)的具體情況,預(yù)判風險發(fā)生可能性,分析不良效應(yīng)的發(fā)生原因。例如,大數(shù)據(jù)中心(大數(shù)據(jù)局)可通過政府數(shù)據(jù)運營機構(gòu)提供的模型訓(xùn)練結(jié)果,審查各方是否以合規(guī)合法的方式開展政府數(shù)據(jù)授權(quán)運營以及政府數(shù)據(jù)開發(fā)利用工作,從而有效地防范風險發(fā)生。第二,聯(lián)邦學習技術(shù)能夠?qū)崿F(xiàn)公共數(shù)據(jù)資源的“可用不可得”,從而保護原始數(shù)據(jù)安全。原始的政府數(shù)據(jù)往往包含眾多隱私和國家機密信息,一旦政府數(shù)據(jù)在對外開放過程中造成了這些敏感信息的泄露,將會給國家、社會及個人帶來難以估算的損失。即使采用一些數(shù)據(jù)脫敏、數(shù)據(jù)加密等數(shù)據(jù)安全保護措施,違法分子也會利用數(shù)據(jù)本身所具備的關(guān)聯(lián)性、開放性,通過不同數(shù)據(jù)集的關(guān)聯(lián)和組合來還原包含敏感信息的原始數(shù)據(jù)[29]。借助聯(lián)邦學習技術(shù),行政部門可以在不對外開放原始政府數(shù)據(jù)的基礎(chǔ)上,實現(xiàn)多個數(shù)據(jù)所有者聯(lián)合建模與數(shù)據(jù)協(xié)同開發(fā),進而比較徹底地防止政府數(shù)據(jù)出現(xiàn)隱私信息泄露和數(shù)據(jù)安全問題[30]。綜上,聯(lián)邦學習技術(shù)是建構(gòu)政府數(shù)據(jù)授權(quán)運營新模
式的良好技術(shù)工具選擇,能夠幫助實現(xiàn)價值共創(chuàng)與數(shù)據(jù)安全的兼顧。四、基于聯(lián)邦學習的政府數(shù)據(jù)授權(quán)運營:路徑選擇與實景應(yīng)用依據(jù)數(shù)據(jù)集的樣本分布及數(shù)據(jù)特征,聯(lián)邦學習技術(shù)可分為橫向聯(lián)邦學習、縱向聯(lián)邦學習及聯(lián)邦遷移學習三種技術(shù)路徑。政府數(shù)據(jù)運營機構(gòu)與政府數(shù)據(jù)使用方須根據(jù)數(shù)據(jù)集特征及應(yīng)用場景需求,選擇不同的聯(lián)邦學習技術(shù)路徑進行公共數(shù)據(jù)資源的開發(fā)和利用。下文將結(jié)合三種實際場景,詳細說明了政府數(shù)據(jù)授權(quán)運營在不同情境下如何作出聯(lián)邦學習技術(shù)路徑選擇,并比較了三種技術(shù)路徑的差異。(一)橫向聯(lián)邦學習技術(shù)路徑及其實景應(yīng)用:電力供給與配置橫向聯(lián)邦學習(horizontalfederatedlearning,HFL)取樣本特征相同但數(shù)據(jù)樣本來源不完全相同的數(shù)據(jù)集進行聯(lián)合訓(xùn)練,適用于數(shù)據(jù)集特征空間重疊較多但樣本空間重疊較少的場景使用(其基本邏輯與過程如圖4所示)[27]6,51。例如,不同地區(qū)圍繞相同的一項公共事務(wù)進行管理和服務(wù),其所收集的數(shù)據(jù)樣本信息基本相似,但由于地區(qū)不同,作為公共數(shù)據(jù)來源的公共服務(wù)對象群體也存在較大差異,這使得不同主體所有的數(shù)據(jù)資源在數(shù)據(jù)特征上基本相似,但地區(qū)不同造成了樣本重疊較少。因此,這種情況下的政府數(shù)據(jù)授權(quán)運營工作可采用橫向聯(lián)邦學習開展數(shù)據(jù)開發(fā)利用活動。能源領(lǐng)域?qū)M向聯(lián)邦學習技術(shù)的應(yīng)用存在需求。例如,電力能源的供給與配置活動需要建設(shè)一個快速、安全、有效的電力供給與配置預(yù)測體系,用以預(yù)測和評估地區(qū)的用電量及用電趨勢,從而為開展供電管理工作提供參考依據(jù)。本文以電力供給與配置需求為應(yīng)用實景,構(gòu)建了基于橫向聯(lián)邦學習的政府數(shù)據(jù)授權(quán)運營工作框架。胡業(yè)飛陳美欣張怡夢·價值共創(chuàng)與數(shù)據(jù)安全的兼顧:基于聯(lián)邦學習的政府數(shù)據(jù)授權(quán)運營模式研究第一步:中央服務(wù)器發(fā)送初始模型丨第四步:全局模型下發(fā)并更新訓(xùn)練第三步:中央服務(wù)器接收、聚合各本地模型,生成全局模型參與方A 數(shù)據(jù)A 模型A參與方B參與方N
數(shù)據(jù)B 模型數(shù)據(jù)N 模型
中央服務(wù)器 全局模型第二步:各客戶端訓(xùn)練本地模型并加密上傳圖4橫向聯(lián)邦學習技術(shù)路徑下的政府數(shù)據(jù)授權(quán)運營的基本邏輯與過程在供電領(lǐng)域,基于橫向聯(lián)邦學習技術(shù)路徑所建構(gòu)的政府數(shù)據(jù)授權(quán)運營架構(gòu),由聯(lián)邦學習主體關(guān)系構(gòu)建、聯(lián)
邦學習技術(shù)運作過程、用電預(yù)測模型的應(yīng)用三部分組成,其具體結(jié)構(gòu)如圖5所示。供電管理與決策模型成果應(yīng)用跨區(qū)域、跨部門協(xié)調(diào)溝通模型成果應(yīng)用電力供給
能源管理部門指導(dǎo)生產(chǎn) 社會維
反饋需求實施電力生產(chǎn)、電力調(diào)度等供電措施供電部門
用電預(yù)測模型
調(diào)整公共服務(wù)、生產(chǎn)經(jīng)營活動與日常工作生活政府部門、生產(chǎn)經(jīng)營組織、居民第三步:中央服務(wù)器接收、聚合各本地模型,生成全局模型第二步:各客戶端訓(xùn)練本地模型并加密上傳
中央服務(wù)器
第二步:各客戶端訓(xùn)練本地模型并加密上傳技術(shù)運作過程地區(qū)A用電數(shù)據(jù)模型 地區(qū)B用電數(shù)據(jù)模型技術(shù)運作過程監(jiān)管 監(jiān)管地區(qū)A用電數(shù)據(jù)地區(qū)A電力管理部門
第一步:中央服務(wù)器發(fā)送初始模型第四步:全局模型下發(fā)并更新訓(xùn)練
地區(qū)B用電數(shù)據(jù)主體關(guān)系構(gòu)建協(xié)同管理主體關(guān)系構(gòu)建授權(quán)運營地區(qū)A政府數(shù)據(jù)運營機構(gòu)
無原始數(shù)據(jù)共享
地區(qū)B電力管理部門
地區(qū)B(大數(shù)據(jù)局)圖5橫向聯(lián)邦學習技術(shù)路徑下的政府數(shù)據(jù)授權(quán)運營架構(gòu):以電力供給與調(diào)度為例胡業(yè)飛陳美欣張怡夢·價值共創(chuàng)與數(shù)據(jù)安全的兼顧:基于聯(lián)邦學習的政府數(shù)據(jù)授權(quán)運營模式研究框架的第一部分是聯(lián)邦學習主體關(guān)系的構(gòu)建。這一部分確定了參與電力供給與調(diào)度預(yù)測模型訓(xùn)練的主體及其相互關(guān)系(參見圖5)。該情境有A、B兩地,其電力主管部門各自掌握著本地區(qū)的用電數(shù)據(jù)(包括本地區(qū)內(nèi)部各產(chǎn)業(yè)用電量、城鄉(xiāng)居民用電、同期用電變化、用電高峰時段等)。為更好地開展電力供給與調(diào)度預(yù)測,B地決定在數(shù)據(jù)“可用不可得”的條件下,結(jié)合A地數(shù)據(jù)開展模型訓(xùn)練。由于A地已開展政府數(shù)據(jù)授權(quán)運營工作,因此,B地的供電管理部門借助基于橫向聯(lián)邦學習的政府數(shù)據(jù)授權(quán)運營機制,聯(lián)合A地開展電力數(shù)據(jù)的開發(fā)利用活動。架構(gòu)的第二部分是聯(lián)邦學習技術(shù)的運作過程。B地的供電管理部門與A地政府數(shù)據(jù)運營機構(gòu)簽訂數(shù)據(jù)服務(wù)協(xié)議,雙方在遵守協(xié)議內(nèi)容及數(shù)據(jù)安全保護責任的基礎(chǔ)上開展數(shù)據(jù)開發(fā)利用,進行電力供給與調(diào)度預(yù)測模型的訓(xùn)練。最終,經(jīng)過四個步驟,兩地完成了對模型的訓(xùn)練(見圖5)。訓(xùn)練過程中,B地大數(shù)據(jù)中心(大數(shù)據(jù)局)與A地政府數(shù)據(jù)運營機構(gòu)共同實施對中央服務(wù)器的監(jiān)督管理,以獲取、追蹤、記錄、上報兩地區(qū)的本地模型以及聚合生成的全局模型,保障數(shù)據(jù)安全。第三部分是模型成果的應(yīng)用。盡管訓(xùn)練活動是由B地發(fā)起,但模型完成訓(xùn)練后,A、B兩地的供電管理部門都可以使用這一模型來更精準地研判本地的用電情況。借助這一模型,兩地的供電部門可了解本地區(qū)電力總需求及需求波動情況,指導(dǎo)實施更精準的電力生產(chǎn)與電力調(diào)度措施。此外,兩地的供電部門還可以更科學地開展限電供應(yīng)、錯峰用電等供電管理決策,協(xié)調(diào)溝通整個區(qū)域內(nèi)的電力供給和配置工作,維護社會穩(wěn)定。同時,區(qū)域內(nèi)的其他政府部門、生產(chǎn)經(jīng)營組織、居民也可根據(jù)用電預(yù)測模型提供的信息調(diào)整公共服務(wù)供給、生產(chǎn)經(jīng)營活動及日常工作生活,并及時向能源管理部門反饋需求,以更好地應(yīng)對持電力能源供
給波動給社會和個人造成的影響和損失。(二)縱向聯(lián)邦學習技術(shù)路徑及其實景應(yīng)用:個人與企業(yè)信貸評估相較于橫向聯(lián)邦學習,縱向聯(lián)邦學習(verticalfederatedlearning,VFL)更適用于數(shù)據(jù)集樣本重疊較多但樣本特征重疊較少的場景。例如,同一地區(qū)內(nèi)部涉及多領(lǐng)域公共事務(wù)的管理和服務(wù),其所收集的數(shù)據(jù)樣本信息基本相似,但業(yè)務(wù)領(lǐng)域不同造成樣本特征重疊較少。因此,這種情況下的政府數(shù)據(jù)授權(quán)運營工作可采用縱向聯(lián)邦學習開展數(shù)據(jù)開發(fā)利用??v向聯(lián)邦學習路徑下政府數(shù)據(jù)授權(quán)運營的基本邏輯與過程如圖6所示[27]72,這一過程由若干數(shù)據(jù)所有者節(jié)點及協(xié)調(diào)者參與。其中,若干數(shù)據(jù)所有者節(jié)點各自掌握一部分重要的數(shù)據(jù),彼此間地位平等,共同參與模型訓(xùn)練及模型上傳工作。同時,為防止地位平等的數(shù)據(jù)所有者之間違反數(shù)據(jù)開發(fā)協(xié)議、做出違法違規(guī)行為,也為幫助數(shù)據(jù)所有者提升模型訓(xùn)練精度和效果,縱向聯(lián)邦學習架構(gòu)會加入獨立的第三方——協(xié)調(diào)者,用以協(xié)助各方開展數(shù)據(jù)利用工作,保護數(shù)據(jù)安全。縱向聯(lián)邦學習技術(shù)路徑的一個基本應(yīng)用場景,是對個人和企業(yè)的信貸資質(zhì)進行評估。在個人和企業(yè)信貸業(yè)務(wù)領(lǐng)域,銀行作為信息劣勢方,難以充分了解借貸者的已有資產(chǎn)及還款能力。這種借貸方與還貸方之間的信息不對稱為銀行的信貸服務(wù)帶來潛在風險。為有效評估自然人與法人的償貸能力,銀行往往希望從政府這里獲得更多的自然人與法人信息。但這些數(shù)據(jù)涉及個人隱私,如果通過傳統(tǒng)的政府數(shù)據(jù)開放形式,由政府不設(shè)門檻地直接開放給銀行,可能涉嫌違反法律法規(guī)。借助縱向聯(lián)邦學習技術(shù),結(jié)合銀行與政府所掌握的數(shù)據(jù)資源,銀行可訓(xùn)練開發(fā)有關(guān)自然人與法人貸款償還能力及信用情況評估模型,從而優(yōu)化面向個人和企業(yè)的信貸服務(wù),降低借貸風險。在個人與企業(yè)信貸評估這個情景下,本文構(gòu)建了胡業(yè)飛陳美欣張怡夢·價值共創(chuàng)與數(shù)據(jù)安全的兼顧:基于聯(lián)邦學習的政府數(shù)據(jù)授權(quán)運營模式研究第二部分:加密訓(xùn)練模型聯(lián)邦模型4 4模型A
第二部分:加密訓(xùn)練模型
模型B
3 協(xié)調(diào)者 31 1 2 2第一部分:數(shù)據(jù)樣本加密對齊
參與方A 參與方B2:加密交互中間結(jié)果1:分發(fā)公鑰數(shù)據(jù)A 數(shù)據(jù)B2:加密交互中間結(jié)果1:分發(fā)公鑰3:加密匯總梯度和損失3:加密匯總梯度和損失參與方A
無原始數(shù)據(jù)共享
參與方B4:更新雙方模型圖6縱向聯(lián)邦學習技術(shù)路徑下的政府數(shù)據(jù)授權(quán)運營的基本邏輯與過程4:更新雙方模型基于縱向聯(lián)邦學習的政府數(shù)據(jù)授權(quán)運營框架(參見圖7)。該框架是由縱向聯(lián)邦學習主體關(guān)系構(gòu)建、縱向聯(lián)邦學習技術(shù)運作過程、個人及企業(yè)信貸評估模型應(yīng)用三個部分組成。架構(gòu)的第一部分依然是聯(lián)邦學習主體關(guān)系構(gòu)建。假設(shè)某地區(qū)銀行掌握著本地區(qū)的客戶數(shù)據(jù),政府設(shè)置的企業(yè)信用信息服務(wù)平臺掌握本地區(qū)企業(yè)信用相關(guān)數(shù)據(jù),市場監(jiān)管部門掌握本地區(qū)市場監(jiān)管相關(guān)數(shù)據(jù),都構(gòu)成相關(guān)模型訓(xùn)練的數(shù)據(jù)需求。但由于政府方所擁有的數(shù)據(jù)包含眾多個人與企業(yè)的隱私信息,這些原始數(shù)據(jù)難以直接匯總到一處進行開發(fā)利用。此時,三方可基于縱向聯(lián)邦學習技術(shù)路徑的政府數(shù)據(jù)授權(quán)運營,在保證原始數(shù)據(jù)不外流的基礎(chǔ)上,對政府數(shù)據(jù)進行開發(fā)利用。架構(gòu)的第二部分是縱向聯(lián)邦學習技術(shù)的運用過程。在這一過程中,銀行、企業(yè)信用信息平臺、政府數(shù)據(jù)運營機構(gòu)所掌握的各類數(shù)據(jù)資源都可保留在本地,不需要集合全部原始數(shù)據(jù)到一處,而是通過聚合各本地模型參數(shù)的方式,反復(fù)訓(xùn)練并最終聚合為一個模型。為保證模型訓(xùn)練中的數(shù)據(jù)安全,政府數(shù)據(jù)運營機構(gòu)不僅作為參與方直接參與數(shù)據(jù)開發(fā)利用活動,同時也負責監(jiān)管相關(guān)活
動,并負責將政府數(shù)據(jù)授權(quán)運營情況定期上報給地方大數(shù)據(jù)中心(大數(shù)據(jù)局),完成政府數(shù)據(jù)授權(quán)運營過程的兩級監(jiān)管。架構(gòu)的第三部分是個人及企業(yè)信貸評估模型成果的應(yīng)用。基于縱向聯(lián)邦學習技術(shù)路徑,多方數(shù)據(jù)得以獲得聯(lián)合開發(fā)利用,在不泄露隱私的情況下,更為細致、全面地描繪某一用戶或企業(yè)的特征圖像。銀行可借助這一評估模型的結(jié)果,更為準確地評價個人及企業(yè)的還款能力、信用水平及生產(chǎn)經(jīng)營情況,判斷是否對其提供借貸服務(wù),最終在整體上減少借貸風險。此外,市場監(jiān)管部門還可利用上述模型來開展市場監(jiān)管工作,敦促企業(yè)與個人維護和提升自身信用水平,提升資產(chǎn)儲量及還款能力,形塑自身合規(guī)合法行為,最終形成健康有序的信用貸款環(huán)境及市場經(jīng)營秩序。(三)聯(lián)邦遷移學習技術(shù)路徑及其實景應(yīng)用:醫(yī)療服務(wù)聯(lián)邦遷移學習(federatedtansferlarning,F(xiàn)TL)適用于數(shù)據(jù)樣本及數(shù)據(jù)特征均存在較大差異或數(shù)據(jù)缺少標注的情況,其本質(zhì)是尋找源域(sourcedomain)和目標域(targetdomain)之間的不變屬性,并利用不變屬性胡業(yè)飛陳美欣張怡夢·價值共創(chuàng)與數(shù)據(jù)安全的兼顧:基于聯(lián)邦學習的政府數(shù)據(jù)授權(quán)運營模式研究圖7縱向聯(lián)邦學習技術(shù)路徑下的政府數(shù)據(jù)授權(quán)運營框架:以個人與企業(yè)信貸評估為例在源域和目標域之間的傳送知識,從而實現(xiàn)跨領(lǐng)域知識遷移[31]。例如,不同地區(qū)不同公共事務(wù)的行政主管部門,其管理的地域范圍、面向的公共服務(wù)對象及業(yè)務(wù)類型相似度較低,數(shù)據(jù)樣本特征與數(shù)據(jù)樣本均存在較大差異。為應(yīng)對各參與方的數(shù)據(jù)差異,聯(lián)邦遷移學習技術(shù)可應(yīng)用于特征重疊及用戶重疊較少數(shù)據(jù)集的開發(fā),運用數(shù)據(jù)重疊部分來推測出更多信息?;诼?lián)邦遷移學習技術(shù)路徑的政府數(shù)據(jù)授權(quán)運營基本邏輯與過程如圖8所示。[32]在這一過程中,每個數(shù)據(jù)擁有主體都作為節(jié)點,將首先訓(xùn)練各自的本地模型,然后將本地模型加密并開展聯(lián)合訓(xùn)練,生成聯(lián)邦模型,聯(lián)邦模型通過不斷訓(xùn)練和更新獲得最優(yōu)模型。相比于橫向聯(lián)邦學習與縱向聯(lián)邦學習,聯(lián)邦遷移學習在綜合模型參
數(shù)的基礎(chǔ)上更進一步,基于子模型來建構(gòu)最終的模型產(chǎn)品。醫(yī)療服務(wù)領(lǐng)域是適用聯(lián)邦遷移學習技術(shù)的一個場景。不同地區(qū)的衛(wèi)生健康行政主管部門、公立與私立醫(yī)院、國營與私營體檢中心、高校、醫(yī)學科研機構(gòu)以及藥品研發(fā)企業(yè)等多方主體都掌握著大量醫(yī)療服務(wù)相關(guān)的數(shù)據(jù)資源,如果能對這些數(shù)據(jù)進行聯(lián)合的開發(fā)利用,將為開展診療、教學及科研工作提供重要的支撐。然而,這些醫(yī)療衛(wèi)生數(shù)據(jù)以低結(jié)構(gòu)化的形式零散分布在各方主體處,其蘊藏的價值沒有得到釋放。又加之,這些醫(yī)療服務(wù)相關(guān)數(shù)據(jù)往往包含了大量病人隱私、商業(yè)機密、實驗數(shù)據(jù)等敏感信息,使得數(shù)據(jù)利用過程面臨著較高的隱私泄露和數(shù)據(jù)安全風險,阻礙了數(shù)據(jù)價值的釋放。胡業(yè)飛陳美欣張怡夢·價值共創(chuàng)與數(shù)據(jù)安全的兼顧:基于聯(lián)邦學習的政府數(shù)據(jù)授權(quán)運營模式研究第二步:模型加密傳輸?shù)谒牟剑耗P透?/p>
聯(lián)邦模型
第三步:模型聯(lián)合訓(xùn)練模型A 模型B 模型第一步:生成本地模型數(shù)據(jù)A
數(shù)據(jù)加密
數(shù)據(jù)B
數(shù)據(jù)加密
數(shù)據(jù)N參與方A
無原始數(shù)據(jù)共享
參與方B
無原始數(shù)據(jù)共享
參與方N圖8基于聯(lián)邦遷移學習技術(shù)路徑的政府數(shù)據(jù)授權(quán)運營基本邏輯與過程基于聯(lián)邦遷移學習技術(shù)路徑的政府數(shù)據(jù)授權(quán)運營提供了上述問題的一個解決方案。借助聯(lián)邦遷移學習技術(shù),衛(wèi)生健康行政主管部門、醫(yī)院、科研機構(gòu)可在保障數(shù)據(jù)資源不流出本地的基礎(chǔ)上,共同進行數(shù)據(jù)的開發(fā)利用,并將最終獲得的醫(yī)療服務(wù)供給模型用于研發(fā)、藥效評價等相關(guān)領(lǐng)域,從而助力于提升地區(qū)的整體醫(yī)療服務(wù)水平。聯(lián)邦遷移學習的醫(yī)療服務(wù)供給框架可見圖9。該框架也由主體關(guān)系構(gòu)建、技術(shù)運作過程、模型成果應(yīng)用三個部分組成,各部分彼此銜接。在第一部分聯(lián)邦學習主體關(guān)系構(gòu)建中,某地開展了政府數(shù)據(jù)授權(quán)運營工作,該地衛(wèi)生健康相關(guān)數(shù)據(jù)由衛(wèi)生健康行政主管部門授權(quán)給政府數(shù)據(jù)運營機構(gòu)對外提供數(shù)據(jù)服務(wù)。這時,政府數(shù)據(jù)運營機構(gòu)、醫(yī)院與科研機構(gòu)可通過政府數(shù)據(jù)授權(quán)運營,構(gòu)建基于聯(lián)邦遷移學習的數(shù)據(jù)開發(fā)利用活動。在第二部分聯(lián)邦學習技術(shù)運作過程中,政府數(shù)據(jù)運營機構(gòu)、醫(yī)院以及科研機構(gòu)簽訂數(shù)據(jù)服務(wù)協(xié)議,明確各
方責任義務(wù)。之后,各參與方聯(lián)合構(gòu)建醫(yī)療服務(wù)供給模型開發(fā)場景,在本地完成本地模型的各自開發(fā)工作,隨后通過各本地模型的聯(lián)合,獲得最終的醫(yī)療服務(wù)模型結(jié)果。政府數(shù)據(jù)運營機構(gòu)還扮演著監(jiān)管者角色,監(jiān)管各主體的數(shù)據(jù)開發(fā)利用行為是否具備合規(guī)性及合法性。第三部分是醫(yī)療服務(wù)供給模型的應(yīng)用。獲得了基于聯(lián)邦遷移學習訓(xùn)練而成的醫(yī)療服務(wù)模型后,政府數(shù)據(jù)運營機構(gòu)、醫(yī)院與科研機構(gòu)都可以利用這一模型提升相關(guān)服務(wù)水平或加速研發(fā)進程。衛(wèi)生健康行政主管部門可利用該模型獲得更多醫(yī)療衛(wèi)生數(shù)據(jù)信息,為其開展管理和決策提供信息支持;科研機構(gòu)可利用模型獲得更多一手疾病診斷、藥品使用等信息,從而為科學研究和創(chuàng)新活動提供數(shù)據(jù)支持;醫(yī)院可利用模型更好地開展疾病診療與教研活動,并協(xié)助社會大眾調(diào)整生產(chǎn)經(jīng)營與生活行為,改善個人健康衛(wèi)生習慣。(四)三種聯(lián)邦學習技術(shù)路徑的比較不同的聯(lián)邦學習技術(shù)路徑適配于不同的政府數(shù)據(jù)授權(quán)運營場景需求。表2呈現(xiàn)了三種聯(lián)邦學習技術(shù)路徑的胡業(yè)飛陳美欣張怡夢·價值共創(chuàng)與數(shù)據(jù)安全的兼顧:基于聯(lián)邦學習的政府數(shù)據(jù)授權(quán)運營模式研究圖9聯(lián)邦遷移學習技術(shù)路徑下的政府數(shù)據(jù)授權(quán)運營框架:以醫(yī)療服務(wù)為例特征,從樣本空間、特征空間、數(shù)據(jù)對齊方式、技術(shù)目的、適用場景、政府數(shù)據(jù)授權(quán)運營典型場景等多個維度,比較和呈現(xiàn)了三種技術(shù)路徑在技術(shù)邏輯與適用場景上的差異。時,主要還是要看目標樣本的特征匹配哪一條技術(shù)路徑(參見表2)。如果用戶不同但業(yè)務(wù)類型相似,所收集的用戶特征數(shù)據(jù)相似,此時橫向聯(lián)邦學習技術(shù)路徑比較適配;如果用戶特征不同但來自同一地區(qū),所收集的用戶樣本比較一致,那么縱向聯(lián)邦學習技術(shù)路徑比較適
配;如果用戶特征與用戶樣本均存在較大差異,數(shù)據(jù)相似度及重疊小,這時候就要動用聯(lián)邦遷移學習來支撐政府數(shù)據(jù)的授權(quán)運營。不過,無論是選擇哪一種技術(shù)路徑(其主要差異在于數(shù)據(jù)結(jié)構(gòu)與數(shù)據(jù)特征),基于聯(lián)邦學習的政府數(shù)據(jù)運營模式都包含了構(gòu)建聯(lián)邦學習主體關(guān)系、運作聯(lián)邦學習技術(shù)流程及開展模型應(yīng)用這三個核心組成部分,三個部分層層遞進、相輔相成,共同支撐了政府數(shù)據(jù)授權(quán)運營工作模式。無論是哪種技術(shù)路徑,只要匹配實際情景的需求,政府數(shù)據(jù)授權(quán)運營活動就能夠兼顧價值共創(chuàng)與數(shù)胡業(yè)飛陳美欣張怡夢·價值共創(chuàng)與數(shù)據(jù)安全的兼顧:基于聯(lián)邦學習的政府數(shù)據(jù)授權(quán)運營模式研究表2聯(lián)邦學習的三種技術(shù)路徑選擇及其差異比較橫向聯(lián)邦學習縱向聯(lián)邦學習聯(lián)邦遷移學習樣本空間樣本重疊少樣本重疊多樣本重疊少特征空間數(shù)據(jù)特征重疊多數(shù)據(jù)特征重疊少數(shù)據(jù)特征重疊少數(shù)據(jù)對齊方式樣本特征對齊樣本對齊樣本特征對齊樣本對齊技術(shù)目的增加數(shù)據(jù)樣本量擴大數(shù)據(jù)覆蓋面增加數(shù)據(jù)特征深描用戶圖像跨領(lǐng)域、跨地區(qū)知識遷移適用場景不同地區(qū)同一業(yè)務(wù)部門的模型訓(xùn)練活動同一地區(qū)不同業(yè)務(wù)部門的模型訓(xùn)練活動跨地區(qū)、跨領(lǐng)域的模型訓(xùn)練活動政府數(shù)據(jù)授權(quán)運營典型場景適用于跨地區(qū)同類型部門數(shù)據(jù)開發(fā)利用活動,如打擊違法犯罪行為、教育水平評估、生物多樣性名錄統(tǒng)計、土地資源利用與管理等取、區(qū)域內(nèi)應(yīng)急管理資源調(diào)監(jiān)管等適用于跨地區(qū)、跨部門數(shù)據(jù)開發(fā)利用活動,如大型基建設(shè)施建設(shè)評估、環(huán)境與生物多樣性治理等據(jù)安全。因此,政府應(yīng)根據(jù)具體的工作場景、開發(fā)需求及數(shù)據(jù)集特征,選擇最適合的聯(lián)邦學習技術(shù)路徑。在公共數(shù)據(jù)資源的開發(fā)利用中,兼顧價值共創(chuàng)與數(shù)據(jù)安全是政府與社會的共同訴求。傳統(tǒng)的政府數(shù)據(jù)開放制度是通過無門檻、非定向的方式向全社會開放原始公共數(shù)據(jù)資源,在防范侵犯數(shù)據(jù)安全、威脅國家機密與個人隱私的風險方面有所不足。因此,本文結(jié)合聯(lián)邦學習這一隱私計算技術(shù),構(gòu)建了基于聯(lián)邦學習的政府數(shù)據(jù)授權(quán)運營模式,對其架構(gòu)以及應(yīng)用場景做了比較完整的呈現(xiàn)。基于聯(lián)邦學習的政府數(shù)據(jù)授權(quán)運營模式有其顯著的優(yōu)勢,也面臨著一系列應(yīng)用層面的挑戰(zhàn)。(一)基于聯(lián)邦學習的政府數(shù)據(jù)授權(quán)運營模式的核心優(yōu)勢兼顧價值共創(chuàng)與數(shù)據(jù)安全,滿足傳統(tǒng)政府數(shù)據(jù)開放模式所無法實現(xiàn)的國家安全與隱私保護要求,更有效地支撐政府與社會多方主體對公共數(shù)據(jù)資源的協(xié)同開發(fā)利用,是基于聯(lián)邦學習的政府數(shù)據(jù)授權(quán)運營模式的核心優(yōu)勢。在實現(xiàn)價值共創(chuàng)層面,基于聯(lián)邦學習的政府數(shù)據(jù)授
權(quán)運營模式能夠更好地支撐多元主體的協(xié)同。實際上,在價值共創(chuàng)過程中,不僅公共數(shù)據(jù)資源與私人數(shù)據(jù)資源是必備要素,各參與主體的數(shù)據(jù)開發(fā)利用能力也不可或缺。聯(lián)邦學習技術(shù)要求各參與主體不僅要貢獻數(shù)據(jù)資源,還要充分貢獻開發(fā)能力,保障數(shù)據(jù)開發(fā)利用效果。從這個意義上來講,基于聯(lián)邦學習的政府數(shù)據(jù)授權(quán)運營模式有著更強的技術(shù)動員能力。此外,聯(lián)邦學習技術(shù)能夠幫助管理者有效評估各參與方對模型訓(xùn)練的貢獻程度,為數(shù)據(jù)開發(fā)利用收益的分配提供科學的計算依據(jù)。數(shù)據(jù)開發(fā)產(chǎn)品的最終需求方可根據(jù)模型訓(xùn)練效果及主體貢獻程度,為包括政府在內(nèi)的其他參與者支付服務(wù)費用,使得收益分配更為公平,也符合公共資源利用的“受益者負擔”原則。因而,相比傳統(tǒng)的政府數(shù)據(jù)開放模式,基于聯(lián)邦學習的政府數(shù)據(jù)授權(quán)運營模式更好地解決了激勵問題,能夠促使各方主體貢獻更多的數(shù)據(jù)資源與技術(shù)能力。在保障數(shù)據(jù)安全層面,聯(lián)邦學習技術(shù)能夠保證原始公共數(shù)據(jù)資源的不流出,結(jié)合政府對公共數(shù)據(jù)資源開發(fā)利用過程的監(jiān)管,充分保障原始數(shù)據(jù)安全。在基于聯(lián)邦學習技術(shù)進行數(shù)據(jù)開發(fā)與模型訓(xùn)練時,各參與主體主要交換本地模型的參數(shù)而非數(shù)據(jù),各方對其所掌握的公共胡業(yè)飛陳美欣張怡夢·價值共創(chuàng)與數(shù)據(jù)安全的兼顧:基于聯(lián)邦學習的政府數(shù)據(jù)授權(quán)運營模式研究數(shù)據(jù)資源或私有數(shù)據(jù)資源都充分享有控制權(quán),原始數(shù)據(jù)不會被其他主體所獲取。因而,基于聯(lián)邦學習的政府數(shù)據(jù)授權(quán)運營模式可實現(xiàn)公共數(shù)據(jù)資源的“可用不可得”,防止原始公共數(shù)據(jù)資源被篡改或被濫用,也保障了相關(guān)國家機密與個人隱私的安全。此外,在防范數(shù)據(jù)風險問題中,聯(lián)邦學習技術(shù)的信息傳輸方式、加密機制都能進一步防范隱私與機密信息泄露、數(shù)據(jù)惡意篡改、數(shù)據(jù)不當利用等風險。在數(shù)據(jù)的開發(fā)過程中,本地訓(xùn)練產(chǎn)生的模型參數(shù)是以加密形式傳輸給協(xié)調(diào)者和中央服務(wù)器,防止模型參數(shù)在傳輸過程中泄露給外部主體,強化模型參數(shù)傳輸?shù)陌踩?。同時,聯(lián)邦學習過程會運用差分隱私等技術(shù)實現(xiàn)對惡意攻擊行為的防御,進一步保護參與各方的敏感信息[33]。(二)基于聯(lián)邦學習的政府數(shù)據(jù)授權(quán)運營模式所面臨的主要挑戰(zhàn)基于聯(lián)邦學習的政府數(shù)據(jù)授權(quán)運營模式兼顧了價值共創(chuàng)與數(shù)據(jù)安全,在保證公共數(shù)據(jù)“可用不可得”的基礎(chǔ)上,實現(xiàn)了政府與社會多元主體共同對公共數(shù)據(jù)資源的開發(fā)利用。同時,該模式也對政府數(shù)據(jù)運營機構(gòu)乃至政府提出了一大挑戰(zhàn),即對政府數(shù)據(jù)運營機構(gòu)的數(shù)據(jù)開發(fā)與數(shù)據(jù)管理能力提出了相當高的要求,構(gòu)成了顯著的能力挑戰(zhàn)。第一重能力挑戰(zhàn)面向的是政府數(shù)據(jù)運營機構(gòu)的數(shù)據(jù)開發(fā)利用技術(shù)能力。聯(lián)邦學習技術(shù)給各參與者都提出了一定的技術(shù)和能力要求要求。例如,為保證模型訓(xùn)練效率,一旦有足夠數(shù)量的主體向協(xié)調(diào)者或中央服務(wù)器報告了模型結(jié)果,訓(xùn)練速度較慢的主體會嚴重拖累整體進度[34]。政府數(shù)據(jù)運營機構(gòu)是聯(lián)邦學習活動中的重要參與者,需要與其他社會主體共同參與模型訓(xùn)練。這就要求,政府數(shù)據(jù)運營機構(gòu)必須具備足夠的技術(shù)水平和開發(fā)能力,保持其在聯(lián)邦學習中的參與地位。不過,對政府數(shù)據(jù)運營機構(gòu)而言,信息技術(shù)水平和公共數(shù)據(jù)開發(fā)利用能力原本就是其相對弱項,如果上述
能力未能得到充分加強,政府數(shù)據(jù)運營機構(gòu)依據(jù)本地公共數(shù)據(jù)資源所得到的模型參數(shù)就難以為全局模型做出貢獻,不僅限制了公共數(shù)據(jù)資源的價值釋放,還會最終在整體上削弱政府在價值共創(chuàng)中的權(quán)威性。此外,聯(lián)邦學習系統(tǒng)還可能受到外部力量的攻擊[35],這要求政府數(shù)據(jù)運營機構(gòu)加快技術(shù)積累來應(yīng)對聯(lián)邦學習中的安全與隱私威脅[36、37]。第二重能力挑戰(zhàn)面向的是政府數(shù)據(jù)運營機構(gòu)的管理與協(xié)調(diào)能力。政府數(shù)據(jù)運營機構(gòu)作為政府數(shù)據(jù)授權(quán)運營全過程的主要管理者和協(xié)調(diào)者,負責維護和完善整個數(shù)據(jù)開發(fā)利用系統(tǒng),激勵和協(xié)調(diào)各方主體參與聯(lián)邦學習的模型訓(xùn)練活動,并且要保護該系統(tǒng)免受安全威脅。為調(diào)動各方主體積極性,政府數(shù)據(jù)運營機構(gòu)還必須基于實際過程,充分量化各參與方在數(shù)據(jù)開發(fā)利用中的貢獻程度,公平地分配數(shù)據(jù)利用收益[38]。這也為政府數(shù)據(jù)運營機構(gòu)的管理能力提出了更高要求。綜上,基于聯(lián)邦學習的政府數(shù)據(jù)授權(quán)運營模式向政府數(shù)據(jù)運營機構(gòu)提出了技術(shù)能力與組織能力的新挑戰(zhàn)、新要求,要求政府數(shù)據(jù)運營機構(gòu)在能力層面匹配模式的運作需求,并且使政府數(shù)據(jù)運營機構(gòu)進一步推動基于聯(lián)邦學習的政府數(shù)據(jù)授權(quán)運營模式的建設(shè)、發(fā)展與運作。六、結(jié)語經(jīng)過十數(shù)年的發(fā)展,經(jīng)典的政府數(shù)據(jù)開放模式正在面臨包括國家秘密泄露、個人隱私侵犯等一系列風險事件的挑戰(zhàn)。為解決這一問題,國家“十四五”規(guī)劃針對政府數(shù)據(jù)開放工作,提出了“開展政府數(shù)據(jù)授權(quán)運營試點”的新要求。本文嘗試基于聯(lián)邦學習這一新興技術(shù)工具,建構(gòu)一套完整的政府數(shù)據(jù)授權(quán)運營模式,從而在實踐層面響應(yīng)國家“十四五”規(guī)劃所提要求,在理論層面則增進政府數(shù)據(jù)開放的相關(guān)知識積累。相較于傳統(tǒng)的API技術(shù),聯(lián)邦學習技術(shù)能夠真正實現(xiàn)數(shù)據(jù)的“可用不可得”,這為構(gòu)建一種具備可操胡業(yè)飛陳美欣張怡夢·價值共創(chuàng)與數(shù)據(jù)安全的兼顧:基于聯(lián)邦學習的政府數(shù)據(jù)授權(quán)運營模式研究作性的政府數(shù)據(jù)授權(quán)運營模式提供了可能。在基于聯(lián)邦學習的政府數(shù)據(jù)授權(quán)運營模式中,政府數(shù)據(jù)運營機構(gòu)、大數(shù)據(jù)中心(大數(shù)據(jù)局)、政府職能部門、政府數(shù)據(jù)利用方等各方參與者建構(gòu)了一個緊密的合作關(guān)系網(wǎng)絡(luò),更大程度地實現(xiàn)了價值共創(chuàng)與數(shù)據(jù)安全的兼顧。當然,這種新模式也對政府數(shù)據(jù)運營機構(gòu)乃至政府的技術(shù)能力與管理能力提出了新要求。特別是對于政府數(shù)據(jù)運營機構(gòu)而言,該機構(gòu)既是政府授權(quán)的公共數(shù)據(jù)資源開發(fā)利用活動管理者與監(jiān)督者,又是聯(lián)邦學習過程中的重要參與者,具備多重重要角色,需要具備較強的治理能力與技術(shù)能力。在未來,當基于聯(lián)邦學習的政府數(shù)據(jù)授權(quán)運營模式完成構(gòu)建后,政府能夠更好地兼顧政府數(shù)據(jù)開放的價值共創(chuàng)與數(shù)據(jù)安全目標,但同時也必然會面臨一些新議題和新挑戰(zhàn),包括政府如何選擇一個兼具技術(shù)能力、管理能力與倫理素養(yǎng)的政府數(shù)據(jù)運營機構(gòu),如何有效配置政府數(shù)據(jù)授權(quán)運營所獲取的數(shù)據(jù)使用費,如何恰當?shù)匕才耪當?shù)據(jù)授權(quán)運營與免費開放的比例,等等。這些新議題將為政府數(shù)據(jù)開放與政府數(shù)據(jù)授權(quán)運營這一研究領(lǐng)域拓展出新的研究空間。參考文獻:陳玲,孫君,李鑫.評估數(shù)字經(jīng)濟:理論視角與框架構(gòu)建[J].,2022(03):40-53.白永秀,李嘉雯,王澤潤質(zhì)量發(fā)展[J].,2022(06):23-36.姜東旭.數(shù)字化時代公共數(shù)據(jù)開放的合作治理路徑[J].南京工程學院學報:社會科學版,2021,21(03):60-64.胡業(yè)飛,劉夢露議的政府數(shù)據(jù)開放平臺治理研究[J].電子政務(wù),2021(10):15-28.究[J].,2021,40(11):22-30.黃道麗,原浩.開放數(shù)據(jù)與網(wǎng)絡(luò)安全立法和政策的沖突與
暗合——以美國政府行政令為視角[J].信息安全與通信保密,2015(06):78-81.情報理論與實踐,2018,41(07):53-59.[8]盛小平,郭道勝.科學數(shù)據(jù)開放共享中的數(shù)據(jù)安全治理研究[J].圖書情報工作,2020,64(22):25-36.張會平,馬太平,孫立爽.政府數(shù)據(jù)賦能數(shù)字經(jīng)濟升級:授權(quán)運營、隱私計算與場景重構(gòu)[J].情報雜志,2022,41(04):166-172.內(nèi)在機理研究——以成都市為例[J].電子政務(wù),2021(05):34-44.,2022(02):126-135.核心議題與理論邏輯進路[J].上海行政學院學報,2020,21(03):96-105.DanielJ,GregB,DanW.APIs:Astrategyguide[M].California,America:O'ReillyMedia,2011:4-5.[14]迪莉婭.政府開放數(shù)據(jù)API應(yīng)用研究[J].圖書館理論與實踐,2020(01):8-11,19.李正,吳敬征,李明樹.API使用的關(guān)鍵問題研究[J].軟件學報,2018,29(06):1716-1738.廉捷,周欣,曹偉,等.新浪微博數(shù)據(jù)挖掘方案[J].清華大學學報:自然科學版,2011,51(10)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年智慧農(nóng)業(yè)信托借款合同272篇
- 2025年度鋁材產(chǎn)品安全標準制定與實施合同4篇
- 2025版路燈照明設(shè)施節(jié)能改造與維護一體化合同4篇
- 二零二五年度房地產(chǎn)土地一級開發(fā)與居間代理合同3篇
- 二零二五年度餐飲連鎖品牌加盟返傭服務(wù)合同3篇
- 2025年水土保持監(jiān)測技術(shù)咨詢與新能源開發(fā)合同3篇
- 2025年度智能化碼頭裝卸作業(yè)服務(wù)合同4篇
- 2025年版餐飲連鎖企業(yè)收銀員用工合同3篇
- 2025年度森林撫育與生態(tài)修復(fù)工程合同范本4篇
- 離婚股權(quán)處置2025版合作協(xié)議樣本及法律風險防范3篇
- 2024年08月云南省農(nóng)村信用社秋季校園招考750名工作人員筆試歷年參考題庫附帶答案詳解
- 防詐騙安全知識培訓(xùn)課件
- 心肺復(fù)蘇課件2024
- 2024年股東股權(quán)繼承轉(zhuǎn)讓協(xié)議3篇
- 2024-2025學年江蘇省南京市高二上冊期末數(shù)學檢測試卷(含解析)
- 四川省名校2025屆高三第二次模擬考試英語試卷含解析
- 湖南財政經(jīng)濟學院專升本管理學真題
- 考研有機化學重點
- 全國身份證前六位、區(qū)號、郵編-編碼大全
- 《GPU體系結(jié)構(gòu)》課件2
- 2024年認證行業(yè)法律法規(guī)及認證基礎(chǔ)知識
評論
0/150
提交評論