《大數(shù)據(jù)導(dǎo)論》課件 第7章 大數(shù)據(jù)安全與隱私保護(hù)_第1頁(yè)
《大數(shù)據(jù)導(dǎo)論》課件 第7章 大數(shù)據(jù)安全與隱私保護(hù)_第2頁(yè)
《大數(shù)據(jù)導(dǎo)論》課件 第7章 大數(shù)據(jù)安全與隱私保護(hù)_第3頁(yè)
《大數(shù)據(jù)導(dǎo)論》課件 第7章 大數(shù)據(jù)安全與隱私保護(hù)_第4頁(yè)
《大數(shù)據(jù)導(dǎo)論》課件 第7章 大數(shù)據(jù)安全與隱私保護(hù)_第5頁(yè)
已閱讀5頁(yè),還剩124頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第7章大數(shù)據(jù)安全、開放與共享演講人2024/12/24目錄7.1大數(shù)據(jù)安全與隱私保護(hù)7.2大數(shù)據(jù)生命周期中的安全與隱私7.3大數(shù)據(jù)開放與共享017.1大數(shù)據(jù)安全與隱私保護(hù)7.1.1大數(shù)據(jù)安全與隱私保護(hù)的概念數(shù)據(jù)安全的本質(zhì)是保證信息媒介、網(wǎng)絡(luò)和存儲(chǔ)介質(zhì)中的數(shù)據(jù)資源免受威脅、破壞,保障數(shù)據(jù)的安全性。傳統(tǒng)數(shù)據(jù)安全包含兩個(gè)層次:一是數(shù)據(jù)行為的安全,二是數(shù)據(jù)內(nèi)容的安全。表7-1給出了常見的數(shù)據(jù)安全威脅類型。一方面,在數(shù)據(jù)正常的行為中,通常會(huì)受到計(jì)算機(jī)病毒、黑客攻擊和物理存儲(chǔ)介質(zhì)損壞的威脅;另一方面,在數(shù)據(jù)的采集、存儲(chǔ)和使用時(shí),數(shù)據(jù)的內(nèi)容也可能受到篡改、誤差和操作失誤等內(nèi)容破壞的風(fēng)險(xiǎn)。與傳統(tǒng)數(shù)據(jù)安全類似,大數(shù)據(jù)也會(huì)受到兩個(gè)層次的安全威脅,同時(shí)大數(shù)據(jù)在質(zhì)量和價(jià)值上實(shí)現(xiàn)了提升,且數(shù)據(jù)形式變得多樣化,使其安全原則和需求也在大數(shù)據(jù)場(chǎng)景下得到了展開和引申。7.1.1大數(shù)據(jù)安全與隱私保護(hù)的概念表7-1常見的數(shù)據(jù)安全威脅類型7.1.1大數(shù)據(jù)安全與隱私保護(hù)的概念首先,大數(shù)據(jù)成了網(wǎng)絡(luò)攻擊的首要選擇目標(biāo)。在互聯(lián)網(wǎng)運(yùn)行過(guò)程中,不同網(wǎng)絡(luò)空間中將會(huì)產(chǎn)生該領(lǐng)域的海量大數(shù)據(jù)。以微博APP為例,每天產(chǎn)生5億+條數(shù)據(jù),涵蓋文字、圖像、音頻和視頻等類型,是一個(gè)容易被發(fā)現(xiàn)的巨大目標(biāo)。在微博社交網(wǎng)絡(luò)中,不但包括用戶日常生活的交互數(shù)據(jù),還包括用戶的個(gè)人隱私信息,黑客攻擊該目標(biāo)能獲得較大的收益。其次,大數(shù)據(jù)隱私泄露風(fēng)險(xiǎn)大幅度提升。不同于傳統(tǒng)數(shù)據(jù)存儲(chǔ)在較為完備的關(guān)系型(“SQL數(shù)據(jù)庫(kù)”)中,大數(shù)據(jù)通常選擇使用非關(guān)系型(“NoSQL數(shù)據(jù)庫(kù)”)存儲(chǔ),例如:HBase,MongoDB和Redis等。這類數(shù)據(jù)庫(kù)由于發(fā)展歷史較短,沒(méi)有完備的安全機(jī)制,且通常構(gòu)建在分布式環(huán)境中,存在頻繁的網(wǎng)絡(luò)交互,增加了隱私泄露的風(fēng)險(xiǎn)。7.1.1大數(shù)據(jù)安全與隱私保護(hù)的概念再者,大數(shù)據(jù)技術(shù)被黑客作為攻擊手段。與正常的大數(shù)據(jù)分析和挖掘相同,黑客攻擊過(guò)程也可以借助大數(shù)據(jù)分析和挖掘方法。例如,黑客可以收集與攻擊目標(biāo)相關(guān)的行為數(shù)據(jù),建立數(shù)據(jù)畫像和習(xí)慣偏好,猜測(cè)其偏好使用的密碼組合,進(jìn)而通過(guò)暴庫(kù)等方式盜取用戶口令。海量的大數(shù)據(jù)在惠及我們學(xué)習(xí)、生活的同時(shí),也豐富了黑客的攻擊手段。最后,大數(shù)據(jù)技術(shù)衍生出更多的攻擊方式。大數(shù)據(jù)分析與挖掘方法為我們提供了非常便利的功能,但是這些新興功能也會(huì)成為黑客的攻擊對(duì)象。以人臉識(shí)別為例,為了攻擊人臉識(shí)別模型,研究者通過(guò)人工智能技術(shù)生成若干張人臉,并篩選出能夠成功通過(guò)絕大多數(shù)人臉識(shí)別模型的人臉圖像?!景咐?-1】逃脫絕大多數(shù)人臉識(shí)別系統(tǒng)的“萬(wàn)能人臉”。7.1.1大數(shù)據(jù)安全與隱私保護(hù)的概念圖7-1展示了人工智能技術(shù)生成的9張“萬(wàn)能人臉”,這些人臉圖像能夠欺騙絕大多數(shù)的人臉識(shí)別模型,達(dá)到繞過(guò)人臉識(shí)別安全屏障的目的。實(shí)際上,針對(duì)大數(shù)據(jù)應(yīng)用場(chǎng)景衍生出來(lái)的攻擊方法,其防范難度遠(yuǎn)高于傳統(tǒng)攻擊方法,僅僅依靠傳統(tǒng)單個(gè)時(shí)間節(jié)點(diǎn)的安全防護(hù)機(jī)制無(wú)法匹配到攻擊威脅。圖7-1人工智能技術(shù)生成的9張“萬(wàn)能人臉”7.1.1大數(shù)據(jù)安全與隱私保護(hù)的概念大數(shù)據(jù)包含多種類別,如政府公開數(shù)據(jù)、科學(xué)研究數(shù)據(jù)、社交媒體數(shù)據(jù)以及企業(yè)應(yīng)用數(shù)據(jù)等。除了大數(shù)據(jù)的安全需求以外,源自個(gè)人、企業(yè)等帶有敏感信息的大數(shù)據(jù),還普遍存在隱私保護(hù)的需求。目前,在企業(yè)大數(shù)據(jù)開放與共享中,主要將個(gè)人數(shù)據(jù)進(jìn)行匿名處理,從而達(dá)到保護(hù)個(gè)人隱私目的。事實(shí)上,在大數(shù)據(jù)分析與挖掘技術(shù)加持下,簡(jiǎn)單的數(shù)據(jù)匿名無(wú)法達(dá)到真正保護(hù)用戶個(gè)人隱私目的。例如,著名影視租賃公司Netflix曾經(jīng)匿名公開部分用戶數(shù)據(jù),用于電影推薦算法競(jìng)賽。在競(jìng)賽過(guò)程中,雖然用戶數(shù)據(jù)得到了匿名保護(hù),但是隱藏在大數(shù)據(jù)中的個(gè)人信息,還是被參賽選手設(shè)計(jì)的算法挖掘出來(lái)。大量的研究已經(jīng)表明,由于大數(shù)據(jù)中隱含有密度低、價(jià)值高的信息,僅靠簡(jiǎn)單的個(gè)人信息標(biāo)識(shí)去除,7.1.1大數(shù)據(jù)安全與隱私保護(hù)的概念無(wú)法有效保證用戶的隱私安全。此外,隨著人工智能技術(shù)的飛速發(fā)展,基于大規(guī)模的身份重識(shí)別攻擊,攻擊者從多源異構(gòu)數(shù)據(jù)中進(jìn)行交叉對(duì)比、系統(tǒng)分析,從而逆向分析出匿名身份信息,導(dǎo)致個(gè)人或企業(yè)敏感信息泄露。另一方面,在個(gè)人或企業(yè)行為大數(shù)據(jù)場(chǎng)景下,個(gè)人或企業(yè)的狀態(tài)、行為與偏好都能夠從行為大數(shù)據(jù)中挖掘得出。例如:黑客可收集用戶的網(wǎng)上購(gòu)物信息、旅游打卡信息、影評(píng)信息以及出行交通工具信息,通過(guò)多個(gè)數(shù)據(jù)源的交叉完成跨賬號(hào)關(guān)聯(lián),運(yùn)用人工智能方法對(duì)用戶信息建模,可準(zhǔn)確輸出用戶畫像和真實(shí)身份,進(jìn)而預(yù)測(cè)用戶接下來(lái)的行為。以社交網(wǎng)絡(luò)為例,一些研究者通過(guò)分析新浪微博APP的社交網(wǎng)絡(luò)和社群信息,從而曝光出明星不良行為,導(dǎo)致明星形象危機(jī);另外,針對(duì)Twitter的用戶行為分析,7.1.1大數(shù)據(jù)安全與隱私保護(hù)的概念也挖掘出了用戶的政治傾向、消費(fèi)習(xí)慣以及日常行為偏好,暴露出用戶的敏感屬性等信息。因此,面向終端的行為大數(shù)據(jù)分析,目前還缺乏有效的監(jiān)管措施,主要依靠企業(yè)的自律。在商業(yè)化的大數(shù)據(jù)應(yīng)用環(huán)境中,一方面企業(yè)需要通過(guò)大數(shù)據(jù)分析與挖掘,建立有效的推薦、預(yù)測(cè)模型;另一方面企業(yè)又需要保護(hù)好挖掘出的用戶隱私不受侵犯,二者之間的界定還缺乏規(guī)范準(zhǔn)則。在當(dāng)前的社交媒介中,用戶無(wú)法確定自己的隱私信息用途,而真正意義上的隱私保護(hù),無(wú)論是企業(yè)或是個(gè)人,都應(yīng)有權(quán)決定自己的信息如何被使用,實(shí)現(xiàn)可控的隱私保護(hù)。7.1.2大數(shù)據(jù)安全與隱私保護(hù)的挑戰(zhàn)大數(shù)據(jù)安全需求聚焦于數(shù)據(jù)本身,即包含大數(shù)據(jù)傳輸、存儲(chǔ)、分析和挖掘過(guò)程中,數(shù)據(jù)的完整性、真實(shí)性、機(jī)密性以及歸屬權(quán);隱私保護(hù)需求強(qiáng)調(diào)針對(duì)“用戶”視角,即包含用戶的敏感信息,且這些信息既可能是直接存儲(chǔ)的用戶行為數(shù)據(jù),例如:用戶名、密碼、郵箱等;也可能是通過(guò)數(shù)據(jù)分析與挖掘后的用戶行為信息,例如:政治傾向、出行習(xí)慣、購(gòu)物偏好等。關(guān)于大數(shù)據(jù)的安全性和用戶的隱私性,目前的界定方式還不明確,例如:一些研究視角認(rèn)為用戶偏好信息服務(wù)于數(shù)據(jù)分析與挖掘,對(duì)個(gè)人隱私的關(guān)注度不高;另一些研究視角則認(rèn)為用戶偏好信息包含了隱私,這些內(nèi)容涉及到大數(shù)據(jù)倫理科學(xué),亟待更多的相關(guān)研究。接下來(lái),我們分析大數(shù)據(jù)安全與隱私保護(hù)的挑戰(zhàn)。在大數(shù)據(jù)場(chǎng)景下,由于大數(shù)據(jù)具備的體量大、種類多、速度快、價(jià)值高的特性,在保證大數(shù)據(jù)具有經(jīng)典數(shù)據(jù)安全需求基礎(chǔ)上,還需要應(yīng)對(duì)大數(shù)據(jù)“4V”特性帶來(lái)的各項(xiàng)新技術(shù)挑戰(zhàn)。7.1.2大數(shù)據(jù)安全與隱私保護(hù)的挑戰(zhàn)平衡大數(shù)據(jù)可用性與機(jī)密性敏感數(shù)據(jù)的機(jī)密性一直是信息安全領(lǐng)域中的重要研究方向之一。在經(jīng)典數(shù)據(jù)安全中,為了保證敏感數(shù)據(jù)的機(jī)密性,通常使用加解密算法實(shí)現(xiàn)敏感數(shù)據(jù)的保護(hù)。針對(duì)大數(shù)據(jù)場(chǎng)景中的敏感數(shù)據(jù),一方面存在物聯(lián)網(wǎng)等高速流動(dòng)的數(shù)據(jù)形式,另一方面大數(shù)據(jù)的存儲(chǔ)和計(jì)算通常采用分布式架構(gòu)。若采用同樣的加密手段保護(hù)敏感數(shù)據(jù),在存儲(chǔ)和計(jì)算時(shí)需對(duì)敏感數(shù)據(jù)進(jìn)行重復(fù)的加解密過(guò)程,導(dǎo)致分布式架構(gòu)的性能瓶頸,同時(shí)也會(huì)造成部分?jǐn)?shù)據(jù)丟失可用性。所以,針對(duì)大數(shù)據(jù)的加解密過(guò)程,需要充分考慮數(shù)據(jù)存儲(chǔ)和計(jì)算時(shí)的分布式架構(gòu),對(duì)加解密算法的并行性能提出了更高的要求。然而,為了保證分布式存儲(chǔ)和計(jì)算的高效率,目前工業(yè)、商業(yè)等場(chǎng)景中的大數(shù)據(jù)都處于無(wú)保護(hù)狀態(tài),運(yùn)行過(guò)程中存在嚴(yán)峻的安全隱患。因此,面向大數(shù)據(jù)的分布式存儲(chǔ)和計(jì)算架構(gòu),設(shè)計(jì)合適的敏感數(shù)據(jù)加解密方案,平衡大數(shù)據(jù)可用性與機(jī)密性是大數(shù)據(jù)的安全與隱私保護(hù)的首要挑戰(zhàn)。7.1.2大數(shù)據(jù)安全與隱私保護(hù)的挑戰(zhàn)保證大數(shù)據(jù)開放共享的安全大數(shù)據(jù)的真正價(jià)值在于充分挖掘與利用,數(shù)據(jù)的開放與共享成為了大數(shù)據(jù)在利用過(guò)程中的關(guān)鍵步驟。在經(jīng)典的數(shù)據(jù)開放與共享中,數(shù)據(jù)的安全共享采用訪問(wèn)控制手段,即為不同等級(jí)的數(shù)據(jù)訪問(wèn)者設(shè)置不同權(quán)限。然而,在大數(shù)據(jù)的開放與共享場(chǎng)景中,由于數(shù)據(jù)的結(jié)構(gòu)多樣、種類繁多,使得實(shí)施正確的訪問(wèn)權(quán)限控制變得更為困難。以互聯(lián)網(wǎng)大數(shù)據(jù)為例,針對(duì)用戶使用手機(jī)APP產(chǎn)品的行為數(shù)據(jù),一方面數(shù)據(jù)挖掘服務(wù)商想要頻繁的訪問(wèn)行為數(shù)據(jù),構(gòu)建用戶畫像并為用戶推送更為精準(zhǔn)的內(nèi)容;另一方面數(shù)據(jù)挖掘服務(wù)商又不可過(guò)度訪問(wèn)用戶信息,侵犯用戶的個(gè)人隱私。因此,在大數(shù)據(jù)場(chǎng)景下,不能僅僅使用機(jī)械式的訪問(wèn)權(quán)限控制,而應(yīng)該針對(duì)不同角色設(shè)置智能化的訪問(wèn)控制權(quán)限。根據(jù)不同的大數(shù)據(jù)開放與共享場(chǎng)景,構(gòu)建動(dòng)態(tài)的安全管理策略,是大數(shù)據(jù)的安全與隱私保護(hù)的第二個(gè)挑戰(zhàn)。7.1.2大數(shù)據(jù)安全與隱私保護(hù)的挑戰(zhàn)實(shí)現(xiàn)大數(shù)據(jù)的可信溯源大數(shù)據(jù)時(shí)代背景下,人們每天都需要接收海量的大數(shù)據(jù),面臨著大數(shù)據(jù)真實(shí)性帶來(lái)的風(fēng)險(xiǎn)。當(dāng)大數(shù)據(jù)中存在虛假信息時(shí),往往會(huì)對(duì)大數(shù)據(jù)的分析造成偏差,進(jìn)而影響人們的決策誤判。例如,在網(wǎng)絡(luò)購(gòu)物中,虛假的商品信息、圖像展示造成消費(fèi)者的認(rèn)知偏差,從而購(gòu)買到不太實(shí)用甚至毫無(wú)意義的商品。在傳統(tǒng)數(shù)據(jù)的記錄和清洗過(guò)程中,有大量的人為干預(yù)操作,可保證數(shù)據(jù)的真實(shí)性,即任何數(shù)據(jù)都是可信溯源的。然而,面向海量大數(shù)據(jù),人為干預(yù)將會(huì)付出大量成本,通常采用自動(dòng)化的數(shù)據(jù)采集、清洗和存儲(chǔ)過(guò)程。在此過(guò)程中,無(wú)法自動(dòng)甄別數(shù)據(jù)源是否刻意偽造,并且在海量大數(shù)據(jù)采集中不可避免的引入人工操作誤差,這些錯(cuò)誤將在分布式架構(gòu)中被逐步放大,影響最終的大數(shù)據(jù)分析準(zhǔn)確性。因此,大數(shù)據(jù)安全與隱私保護(hù)的第三個(gè)挑戰(zhàn)是實(shí)現(xiàn)大數(shù)據(jù)的可信溯源,在大數(shù)據(jù)來(lái)源真實(shí)性、傳播誤差累積和存儲(chǔ)處理中,均建立數(shù)據(jù)可信度指標(biāo),杜絕帶有偏差的大數(shù)據(jù)。7.1.2大數(shù)據(jù)安全與隱私保護(hù)的挑戰(zhàn)破除大數(shù)據(jù)分析的個(gè)體差異大數(shù)據(jù)分析和挖掘算法能夠從已有的大數(shù)據(jù)中挖掘出有意義的知識(shí),從而應(yīng)用到不同的領(lǐng)域,為人們的學(xué)習(xí)、生活帶來(lái)極大的便利。然而,其為人們的生活帶來(lái)便利的同時(shí),也會(huì)被用于差異化對(duì)待不同個(gè)體的違法違規(guī)行為,包括“信息繭房”和“算法歧視”等。信息繭房是指人們關(guān)注的信息領(lǐng)域會(huì)習(xí)慣性地被自己的興趣所引導(dǎo),從而將自己的生活桎梏在像蠶繭一般的“繭房”中。在信息繭房中,人們僅能關(guān)注到對(duì)自己有利、感興趣的信息,這是由于大數(shù)據(jù)分析和挖掘提供的巨量知識(shí),涵蓋了個(gè)體的思想空間。長(zhǎng)期信息繭房的生活,將會(huì)造成個(gè)體的盲目自信,思維方式出現(xiàn)偏見等危害。“算法歧視”則是通過(guò)大數(shù)據(jù)分析和挖掘結(jié)果區(qū)別對(duì)待不同個(gè)體。例如,在互聯(lián)網(wǎng)中旅游類的APP,會(huì)根據(jù)不同消費(fèi)者的歷史消費(fèi)記錄、行為記錄等大數(shù)據(jù)挖掘結(jié)果,為不同消費(fèi)水平的消費(fèi)者指定相應(yīng)的門票、酒店價(jià)格,這也被稱為“大數(shù)據(jù)殺熟”,是典型的算法歧視應(yīng)用之一。7.1.3大數(shù)據(jù)安全與隱私保護(hù)策略大數(shù)據(jù)時(shí)代背景為數(shù)據(jù)安全和隱私保護(hù)提出了更高的要求,其策略主要包含從國(guó)家機(jī)構(gòu)層面、企業(yè)層面和個(gè)人層面,分別包含:7.1.3大數(shù)據(jù)安全與隱私保護(hù)策略國(guó)家法制層面立法監(jiān)管當(dāng)前,我國(guó)涉及到數(shù)據(jù)安全與隱私保護(hù)的法律主要包含:《電信和互聯(lián)網(wǎng)個(gè)人信息保護(hù)規(guī)定》、《互聯(lián)網(wǎng)個(gè)人信息安全保護(hù)指南》、《全國(guó)人大常委關(guān)于加強(qiáng)網(wǎng)絡(luò)信息保護(hù)的決定》、《中華人民共和國(guó)網(wǎng)絡(luò)安全法》等。目前,現(xiàn)有國(guó)家法律法規(guī)制定的對(duì)象為網(wǎng)絡(luò)信息、個(gè)人信息等方面的保護(hù)。在大數(shù)據(jù)時(shí)代背景下,還需要完善對(duì)政務(wù)、企業(yè)和個(gè)人大數(shù)據(jù)安全的立法,尤其是針對(duì)如何合理地進(jìn)行大數(shù)據(jù)分析與挖掘,也需要出臺(tái)相應(yīng)的標(biāo)準(zhǔn)和細(xì)則。表7-2和表7-3給出了我國(guó)數(shù)據(jù)安全相關(guān)政策法規(guī)和技術(shù)標(biāo)準(zhǔn)歷程。7.1.3大數(shù)據(jù)安全與隱私保護(hù)策略國(guó)家法制層面立法監(jiān)管表7-2我國(guó)數(shù)據(jù)安全相關(guān)政策法規(guī)歷程7.1.3大數(shù)據(jù)安全與隱私保護(hù)策略國(guó)家法制層面立法監(jiān)管表7-3我國(guó)數(shù)據(jù)安全相關(guān)技術(shù)標(biāo)準(zhǔn)歷程7.1.3大數(shù)據(jù)安全與隱私保護(hù)策略企業(yè)數(shù)據(jù)安全源頭遏制在互聯(lián)網(wǎng)應(yīng)用中,企業(yè)作為個(gè)人用戶數(shù)據(jù)的采集、傳輸、存儲(chǔ)和挖掘的使用者,需要遵循國(guó)家制定的個(gè)人信息保護(hù)法律法規(guī)制度。除此之外,個(gè)人用戶大數(shù)據(jù)挖掘結(jié)果通常包含隱私信息,在建立大數(shù)據(jù)挖掘應(yīng)用時(shí),應(yīng)該制定挖掘結(jié)果的使用范圍,只能收集所需范圍內(nèi)的用戶大數(shù)據(jù),且不能在用戶不知情的情景下直接使用大數(shù)據(jù)挖掘結(jié)果。同時(shí),企業(yè)人員對(duì)于個(gè)人隱私信息的采集和存儲(chǔ)過(guò)程,也需要制定相應(yīng)的規(guī)章制度,避免因?yàn)檎`操作導(dǎo)致個(gè)人隱私信息泄露。7.1.3大數(shù)據(jù)安全與隱私保護(hù)策略提高公民大數(shù)據(jù)安全意識(shí)在互聯(lián)網(wǎng)時(shí)代中,公民逐漸習(xí)慣網(wǎng)絡(luò)互聯(lián)的方式,并逐漸意識(shí)到網(wǎng)絡(luò)通信過(guò)程中的個(gè)人隱私問(wèn)題,例如:設(shè)置復(fù)雜的個(gè)人用戶密碼組合。在大數(shù)據(jù)背景下,互聯(lián)網(wǎng)中傳播的數(shù)據(jù)更為多樣化,每個(gè)公民都應(yīng)該主動(dòng)了解其中的個(gè)人隱私泄露問(wèn)題,提高大數(shù)據(jù)安全意識(shí)。例如:認(rèn)真閱讀手機(jī)APP的用戶數(shù)據(jù)收集政策、不隨意向陌生人展示自己的定位信息、不長(zhǎng)時(shí)間瀏覽相同的網(wǎng)頁(yè)信息等。7.1.4大數(shù)據(jù)信息安全應(yīng)用大數(shù)據(jù)時(shí)代背景下,對(duì)大數(shù)據(jù)安全和隱私保護(hù)帶來(lái)挑戰(zhàn)的同時(shí),大數(shù)據(jù)分析技術(shù)又為信息安全技術(shù)帶來(lái)了全新的發(fā)展。目前,大數(shù)據(jù)分析技術(shù)主要用于威脅檢測(cè)、身份認(rèn)證、真實(shí)性鑒別,以及構(gòu)建“安全即服務(wù)”,不但擴(kuò)展了現(xiàn)有信息安全技術(shù)的應(yīng)用,還基于大數(shù)據(jù)構(gòu)建了全新的信息安全應(yīng)用。7.1.4大數(shù)據(jù)信息安全應(yīng)用大數(shù)據(jù)威脅檢測(cè)在信息化時(shí)代,針對(duì)互聯(lián)網(wǎng)通信、數(shù)據(jù)的攻擊手段不斷涌現(xiàn),威脅檢測(cè)是政府、企業(yè)解決網(wǎng)絡(luò)安全問(wèn)題的重要手段之一。傳統(tǒng)的威脅檢測(cè)方法主要采用“保護(hù)(Protect)-檢測(cè)(Detect)-響應(yīng)(Response)-恢復(fù)(Recovery)”的PDRR模型,通過(guò)分析現(xiàn)有威脅的類型和種類,構(gòu)建網(wǎng)絡(luò)安全保護(hù)屏障。隨后,通過(guò)不間斷的檢測(cè)過(guò)程,檢測(cè)到威脅后開啟響應(yīng)過(guò)程,響應(yīng)完成后恢復(fù)遭受威脅的網(wǎng)絡(luò)環(huán)境。實(shí)際上,PDRR模型存在諸多不足之處:一是只能檢測(cè)到現(xiàn)有已知的網(wǎng)絡(luò)安全威脅類型,無(wú)法檢測(cè)未知的網(wǎng)絡(luò)安全威脅類型;二是檢測(cè)的威脅類型通常是小范圍、短時(shí)間的攻擊威脅,所檢測(cè)的攻擊范圍小,時(shí)間跨度短;三是無(wú)法對(duì)即將到來(lái)的網(wǎng)絡(luò)安全威脅進(jìn)行預(yù)測(cè),只能被動(dòng)的采取檢測(cè)->響應(yīng)->恢復(fù)的過(guò)程。7.1.4大數(shù)據(jù)信息安全應(yīng)用大數(shù)據(jù)威脅檢測(cè)基于大數(shù)據(jù)分析的威脅檢測(cè)則是通過(guò)收集網(wǎng)絡(luò)態(tài)勢(shì)大數(shù)據(jù),通過(guò)人工智能、機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘方法建立網(wǎng)絡(luò)安全威脅檢測(cè)模型,從而達(dá)到檢測(cè)網(wǎng)絡(luò)安全威脅目的?;诖髷?shù)據(jù)分析的安全威脅檢測(cè)方法具有更好的優(yōu)勢(shì):一是能夠進(jìn)行更全面的安全威脅分析。不同于傳統(tǒng)的安全定式分析,大數(shù)據(jù)分析方法可收集全面的流量、日志、通信以及文件傳輸數(shù)據(jù),能夠更好地針對(duì)特定的“信息資產(chǎn)”進(jìn)行威脅檢測(cè),威脅檢測(cè)分析的層面更廣;二是能夠分析跨度更長(zhǎng)的網(wǎng)絡(luò)安全威脅。如今的黑客攻擊可能更為隱秘,通過(guò)長(zhǎng)時(shí)間的蟄伏進(jìn)行攻擊,大數(shù)據(jù)分析方法則能夠長(zhǎng)時(shí)間監(jiān)測(cè)流式數(shù)據(jù),從而檢測(cè)出此類攻擊;三是能夠?qū)暨M(jìn)行預(yù)測(cè)。不同于傳統(tǒng)方式的被動(dòng)檢測(cè),大數(shù)據(jù)分析技術(shù)天然帶有預(yù)測(cè)性質(zhì),通過(guò)分析當(dāng)前網(wǎng)絡(luò)安全態(tài)勢(shì)數(shù)據(jù),可以檢測(cè)出將來(lái)可能遭受的安全威脅,使主動(dòng)防御更早介入;四是能夠檢測(cè)已知攻擊以外的新型攻擊。大數(shù)據(jù)分析模型旨在構(gòu)建因果關(guān)聯(lián)分析,能夠有效從大數(shù)據(jù)中分析出未知的安全隱患。7.1.4大數(shù)據(jù)信息安全應(yīng)用大數(shù)據(jù)威脅檢測(cè)如今,各大企業(yè)都配備了基于大數(shù)據(jù)的威脅檢測(cè)系統(tǒng),通過(guò)大數(shù)據(jù)的分析構(gòu)建威脅檢測(cè)系統(tǒng)。以騰訊云平臺(tái)的高級(jí)威脅檢測(cè)系統(tǒng)為例,如圖7-2所示,該系統(tǒng)采用集群化部署,設(shè)置探針記錄不同IT資產(chǎn)組的流量日志和文件形成網(wǎng)絡(luò)安全態(tài)勢(shì)大數(shù)據(jù),在集群中設(shè)置沙箱捕捉惡意攻擊意圖,生成威脅情報(bào)并上傳至服務(wù)器進(jìn)行威脅檢測(cè)分析。圖7-2騰訊云平臺(tái)基于大數(shù)據(jù)的高級(jí)威脅檢測(cè)系統(tǒng)(T-Sec)架構(gòu)圖7.1.4大數(shù)據(jù)信息安全應(yīng)用大數(shù)據(jù)威脅檢測(cè)基于網(wǎng)絡(luò)安全態(tài)勢(shì)大數(shù)據(jù),高級(jí)威脅檢測(cè)系統(tǒng)(T-Sec)提供全面的威脅檢測(cè):(1)深度威脅檢測(cè):采用人工智能、機(jī)器學(xué)習(xí)和統(tǒng)計(jì)學(xué)模型分析網(wǎng)絡(luò)安全態(tài)勢(shì)大數(shù)據(jù),深度檢測(cè)網(wǎng)絡(luò)中可能存在的、潛伏的威脅;(2)持續(xù)大數(shù)據(jù)分析:通常,定向的網(wǎng)絡(luò)攻擊并不在短時(shí)間內(nèi)完成,為了防范持續(xù)的攻擊,依靠大數(shù)據(jù)模型對(duì)多維數(shù)據(jù)進(jìn)行長(zhǎng)時(shí)間的跟蹤分析,給予用戶安全威脅事件報(bào)告;(3)全面的檢測(cè)工具:提供安全、先進(jìn)的交互式方法,包括域名解析、勒索病毒檢測(cè)、賬號(hào)密碼及郵件的安全設(shè)置,以及提供威脅云檢索,聯(lián)動(dòng)分析,以及威脅追溯等全面的檢測(cè)工具。7.1.4大數(shù)據(jù)信息安全應(yīng)用大數(shù)據(jù)身份認(rèn)證身份認(rèn)證是互聯(lián)網(wǎng)服務(wù)中最為常用的技術(shù)之一,且由于身份認(rèn)證與利益相關(guān)通常面臨較大的信息安全困擾。傳統(tǒng)的身份認(rèn)證采用復(fù)雜的口令、密碼或數(shù)字簽名在客戶端和服務(wù)端之間進(jìn)行認(rèn)證。傳統(tǒng)身份認(rèn)證技術(shù)主要面臨兩個(gè)方面的挑戰(zhàn):一是口令和密鑰的攻擊者,不但可以通過(guò)強(qiáng)制手段(如:黑客通過(guò)全盤掃描數(shù)據(jù)庫(kù)獲取用戶的口令和密鑰)獲取,也可以通過(guò)社會(huì)工程手段從用戶手中騙取,其過(guò)程較為隱蔽且難以防范;二是越安全的認(rèn)證方式其口令和密鑰越復(fù)雜,降低了用戶在使用時(shí)的便捷性(如:加密程度較高的銀行賬戶配備U盤加密狗),使用不便限制了此類技術(shù)的發(fā)展?;诖髷?shù)據(jù)分析技術(shù)能夠建立全新的用戶身份認(rèn)證手段。不同于經(jīng)典的密碼或簽名,大數(shù)據(jù)分析技術(shù)主要依托于對(duì)用戶行為數(shù)據(jù)的挖掘,構(gòu)建特定用戶使用特定系統(tǒng)、設(shè)備時(shí)的行為識(shí)別模型。7.1.4大數(shù)據(jù)信息安全應(yīng)用大數(shù)據(jù)身份認(rèn)證該模型根據(jù)當(dāng)前操作者的一系列行為,識(shí)別是否為正常用戶,與傳統(tǒng)口令或簽名的認(rèn)證方式不同。一方面,用戶行為數(shù)據(jù)通常由長(zhǎng)期積累的大數(shù)據(jù)組成,不可再通過(guò)強(qiáng)制手段或社會(huì)工程學(xué)手段輕易獲取,攻擊者很難在短時(shí)間內(nèi)模擬正常用戶長(zhǎng)期積累的行為大數(shù)據(jù);另一方面,采用大數(shù)據(jù)分析的身份認(rèn)證技術(shù),不再需要用戶記住復(fù)雜的口令,或使用繁瑣的加密硬件,只需要用戶采用自己最習(xí)慣的方式即可安全登錄。此外,由于單個(gè)用戶在任意的信息系統(tǒng)、設(shè)備中的使用習(xí)慣基本一致,基于大數(shù)據(jù)分析能夠跨系統(tǒng)、設(shè)備構(gòu)建統(tǒng)一的身份認(rèn)證模型。用戶可以自由地在互聯(lián)網(wǎng)空間中切換系統(tǒng),不再為不同系統(tǒng)、設(shè)備設(shè)置不同密碼,每次登錄不同系統(tǒng)、設(shè)備,無(wú)須復(fù)雜的身份認(rèn)證過(guò)程。7.1.4大數(shù)據(jù)信息安全應(yīng)用大數(shù)據(jù)身份認(rèn)證雖然基于大數(shù)據(jù)分析的身份認(rèn)證避免了傳統(tǒng)身份認(rèn)知缺陷,但其本身也存在一些問(wèn)題,主要包括:一是通過(guò)大數(shù)據(jù)分析用戶的行為數(shù)據(jù),構(gòu)建用戶行為畫像,其本身容易造成對(duì)用戶個(gè)人隱私的侵犯,需要設(shè)置安全規(guī)則保護(hù)個(gè)人隱私;二是“冷啟動(dòng)”問(wèn)題,顧名思義,在采用用戶行為大數(shù)據(jù)構(gòu)建身份認(rèn)證模型初始期,沒(méi)有足夠數(shù)量的行為數(shù)據(jù)用于構(gòu)建用戶畫像,這時(shí)需要尋找“冷啟動(dòng)”時(shí)期身份認(rèn)證的替代方案。因此,如今基于大數(shù)據(jù)身份認(rèn)證系統(tǒng),其冷啟動(dòng)初期還需要借助于傳統(tǒng)口令、簽名等方式過(guò)渡,當(dāng)收集到足夠量的用戶行為大數(shù)據(jù)時(shí),方可使用大數(shù)據(jù)分析技術(shù)構(gòu)建身份認(rèn)證過(guò)程。這將是此類方法今后發(fā)展亟待解決的重要問(wèn)題之一。7.1.4大數(shù)據(jù)信息安全應(yīng)用大數(shù)據(jù)真實(shí)性鑒別信息和數(shù)據(jù)的真實(shí)性鑒別在信息安全服務(wù)中占據(jù)重要地位。在大數(shù)據(jù)時(shí)代背景下,大數(shù)據(jù)分析方法被廣泛應(yīng)用于數(shù)據(jù)的真實(shí)性識(shí)別。表7-4給出了基于大數(shù)據(jù)真實(shí)性檢測(cè)的主要信息安全應(yīng)用服務(wù)。實(shí)際上,基于大數(shù)據(jù)的分析和挖掘能力,信息安全服務(wù)提供商能夠提供更好的真實(shí)性識(shí)別服務(wù)。以虛假評(píng)論的鑒別為例,在大數(shù)據(jù)場(chǎng)景中,收集手機(jī)的評(píng)論者的評(píng)價(jià)信息、位置信息、歷史瀏覽信息、新聞?dòng)^看習(xí)慣和評(píng)論時(shí)間等數(shù)據(jù),通過(guò)大數(shù)據(jù)分析技術(shù)能夠提升真實(shí)性鑒別的精準(zhǔn)度。7.1.4大數(shù)據(jù)信息安全應(yīng)用大數(shù)據(jù)真實(shí)性鑒別表7-4基于大數(shù)據(jù)真實(shí)性識(shí)別的信息安全應(yīng)用服務(wù)7.1.4大數(shù)據(jù)信息安全應(yīng)用大數(shù)據(jù)真實(shí)性鑒別在大數(shù)據(jù)中,若對(duì)評(píng)論者的用戶畫像進(jìn)行分析,在評(píng)論歷史中發(fā)現(xiàn)對(duì)于某些內(nèi)容具有嚴(yán)重的惡意評(píng)論傾向,可判斷該評(píng)論者對(duì)于特定內(nèi)容的惡意評(píng)論傾向。此外,當(dāng)前的鑒別都采用已有的信息和知識(shí)作為特征,在大數(shù)據(jù)場(chǎng)景中利用數(shù)據(jù)挖掘算法,可以挖掘出更多潛在的隱藏特征,更有助于進(jìn)行真實(shí)性識(shí)別任務(wù)。7.1.4大數(shù)據(jù)信息安全應(yīng)用面向大數(shù)據(jù)的“安全即服務(wù)”大數(shù)據(jù)發(fā)展帶來(lái)了全新的云計(jì)算模式,云計(jì)算提供“基礎(chǔ)設(shè)施即服務(wù)”、“平臺(tái)即服務(wù)”和“軟件即服務(wù)”,為不同的大數(shù)據(jù)應(yīng)用層級(jí)提供資源共享標(biāo)準(zhǔn)化服務(wù)。與此同時(shí),在大數(shù)據(jù)技術(shù)的影響下,信息安全也會(huì)迎來(lái)更全面、豐富的應(yīng)用與服務(wù),將逐漸發(fā)展出“安全即服務(wù)”的標(biāo)準(zhǔn)化服務(wù)場(chǎng)景。“安全即服務(wù)”將以大數(shù)據(jù)分析技術(shù)為基礎(chǔ),在大數(shù)據(jù)的采集、傳輸、存儲(chǔ)和分析中建立數(shù)據(jù)的安全管理技術(shù),并結(jié)合領(lǐng)域技術(shù)特色,提供特定場(chǎng)景的安全服務(wù)。在未來(lái),“安全即服務(wù)”將以大數(shù)據(jù)為基礎(chǔ)提供應(yīng)用基礎(chǔ)服務(wù),構(gòu)建跨政府部門、跨企業(yè)的安全信息服務(wù)支撐體系,形成信息安全產(chǎn)業(yè)邊界,構(gòu)建可持續(xù)發(fā)展的大數(shù)據(jù)信息安全管理和防御的閉環(huán)。027.2大數(shù)據(jù)生命周期中的安全與隱私7.2.1大數(shù)據(jù)采集與傳輸中的安全與隱私大數(shù)據(jù)采集與傳輸中的安全與隱私與采集對(duì)象有關(guān),一般包含政務(wù)大數(shù)據(jù)、企業(yè)大數(shù)據(jù)和個(gè)人大數(shù)據(jù)。政務(wù)大數(shù)據(jù)指的是政府及事業(yè)單位各部門管理過(guò)程中產(chǎn)生的大數(shù)據(jù),包含公安、交通、氣象、文化、金融、醫(yī)療、社保、農(nóng)業(yè)和民生等數(shù)據(jù)。7.2.1大數(shù)據(jù)采集與傳輸中的安全與隱私政務(wù)大數(shù)據(jù)采集與傳輸中的安全問(wèn)題政務(wù)大數(shù)據(jù)的特點(diǎn)是分工明確,分管不同行業(yè)的部門或事業(yè)單位負(fù)責(zé)相應(yīng)行業(yè)的數(shù)據(jù)采集。例如,利用政府資源可以采集并匯總的大數(shù)據(jù)類別,包含財(cái)政大數(shù)據(jù)、農(nóng)業(yè)大數(shù)據(jù)和環(huán)境大數(shù)據(jù)等;以及事業(yè)單位在生產(chǎn)、管理過(guò)程中采集到的大數(shù)據(jù),包含從醫(yī)院信息管理系統(tǒng)、學(xué)校信息管理系統(tǒng)和交通信息管理系統(tǒng)采集到的大數(shù)據(jù);此外,還有政府部門行使監(jiān)管職責(zé)時(shí)采集的大數(shù)據(jù),例如人口普查數(shù)據(jù)、醫(yī)保社保數(shù)據(jù)和食品藥品數(shù)據(jù)等。政務(wù)大數(shù)據(jù)在采集過(guò)程中分工明確,由政府下屬機(jī)構(gòu)或事業(yè)單位采集后,通過(guò)網(wǎng)絡(luò)傳送至政府信息中心存儲(chǔ),或者由分支機(jī)構(gòu)存儲(chǔ)匯總后上報(bào)給信息中心。實(shí)際上,由于不同機(jī)構(gòu)或事業(yè)單位的工作性質(zhì)差異,所采集到的政務(wù)大數(shù)據(jù)通常較為分散,數(shù)據(jù)結(jié)構(gòu)多樣化,且交互過(guò)程中可能存在管理漏洞。通常,政務(wù)大數(shù)據(jù)中包含有大量敏感信息,一旦被濫用將會(huì)對(duì)社會(huì)公眾的生活產(chǎn)生影響。7.2.1大數(shù)據(jù)采集與傳輸中的安全與隱私企業(yè)大數(shù)據(jù)采集與傳輸中的安全問(wèn)題企業(yè)大數(shù)據(jù)指的是企業(yè)運(yùn)營(yíng)過(guò)程中產(chǎn)生的大數(shù)據(jù),不同類型的企業(yè)在大數(shù)據(jù)采集過(guò)程時(shí),所遭受的大數(shù)據(jù)安全隱患通常包含網(wǎng)絡(luò)傳輸攔截攻擊、黑客入侵以及管理漏洞等。除此之外,不同類型的企業(yè)還包含特定的安全問(wèn)題,表7-5給出了不同企業(yè)大數(shù)據(jù)在特定場(chǎng)景下數(shù)據(jù)采集時(shí)的安全隱患。由表中可知,企業(yè)大數(shù)據(jù)采集過(guò)程中需要根據(jù)自身業(yè)務(wù)邏輯,設(shè)計(jì)相應(yīng)的策略防范數(shù)據(jù)采集過(guò)程中的安全隱患。與政務(wù)大數(shù)據(jù)不同,企業(yè)大數(shù)據(jù)的敏感信息通常包含企業(yè)的商業(yè)機(jī)密或企業(yè)產(chǎn)品的用戶個(gè)人信息,這些信息通常具有較高的商業(yè)價(jià)值,是黑客等攻擊者的首要目標(biāo)。針對(duì)企業(yè)大數(shù)據(jù),黑客的攻擊手段主要使用漏洞入侵或分布式拒絕服務(wù)(DistributedDenialofService,DDoS)以及DNS劫持等。7.2.1大數(shù)據(jù)采集與傳輸中的安全與隱私企業(yè)大數(shù)據(jù)采集與傳輸中的安全問(wèn)題為了應(yīng)對(duì)這些攻擊手段,通常在數(shù)據(jù)采集過(guò)程中使用安全套接層(SecureSocketsLayers,SSL),保證企業(yè)大數(shù)據(jù)傳輸和采集過(guò)程的安全性。然而,現(xiàn)有黑客攻擊和安全防護(hù)手段都僅針對(duì)常規(guī)的企業(yè)數(shù)據(jù)采集,對(duì)于企業(yè)大數(shù)據(jù)采集的新特點(diǎn),目前也可能出現(xiàn)基于人工智能等方法的全新攻擊手段,以及相應(yīng)的防護(hù)手段,對(duì)于企業(yè)大數(shù)據(jù)的攻防過(guò)程都將伴隨著數(shù)據(jù)量級(jí)的變化斷改變。7.2.1大數(shù)據(jù)采集與傳輸中的安全與隱私個(gè)人大數(shù)據(jù)采集與傳輸中的安全問(wèn)題表7-5常見企業(yè)在特定場(chǎng)景數(shù)據(jù)采集時(shí)的安全隱患7.2.1大數(shù)據(jù)采集與傳輸中的安全與隱私個(gè)人大數(shù)據(jù)采集與傳輸中的安全問(wèn)題個(gè)人大數(shù)據(jù)的采集則擁有更為豐富的手段,目前主要集中在計(jì)算機(jī)終端或移動(dòng)設(shè)備上。以個(gè)人行為大數(shù)據(jù)為例,在客戶端(如個(gè)人計(jì)算機(jī)或手機(jī))收集用戶的個(gè)人信息,定期發(fā)送給服務(wù)端,進(jìn)行存儲(chǔ)和分析。在收集和傳輸過(guò)程中,存在如下幾點(diǎn)數(shù)據(jù)安全隱患:7.2.1大數(shù)據(jù)采集與傳輸中的安全與隱私敏感隱私信息泄露個(gè)人數(shù)據(jù)中最重要的信息包括:賬號(hào)、密碼等身份信息、位置信息、語(yǔ)音信息以及軟件交互的操作信息等。一方面,由于用戶的安全意識(shí)薄弱,默認(rèn)客戶端(如APP等)收集自己的敏感信息;另一方面,由于計(jì)算機(jī)病毒和木馬等篡改個(gè)體信息,使個(gè)人數(shù)據(jù)遭到泄露和破壞。例如:某APP基于位置服務(wù)自動(dòng)收集用戶的位置信息,上傳至服務(wù)器匯總,當(dāng)服務(wù)端濫用這些信息時(shí)將會(huì)泄露用戶的行蹤。此外,基于用戶語(yǔ)音數(shù)據(jù)和操作習(xí)慣數(shù)據(jù),也可能挖掘出用戶近期的興趣愛好,這些挖掘結(jié)果也屬于用戶的敏感隱私信息,如果不加以管控,也將會(huì)出現(xiàn)濫用隱私泄露的問(wèn)題。7.2.1大數(shù)據(jù)采集與傳輸中的安全與隱私數(shù)據(jù)完整性存疑目前,基于客戶端(如APP等)的數(shù)據(jù)采集手段,通常設(shè)置數(shù)據(jù)緩沖區(qū),不斷記錄用戶的相關(guān)數(shù)據(jù),當(dāng)緩沖區(qū)滿后一次性上傳至服務(wù)端。在上傳過(guò)程中,數(shù)據(jù)的完整性將受到網(wǎng)絡(luò)波動(dòng)的影響。如果缺少數(shù)據(jù)完整性的檢驗(yàn),在大數(shù)據(jù)場(chǎng)景下,很容易造成部分?jǐn)?shù)據(jù)丟失,影響用戶數(shù)據(jù)的準(zhǔn)確度。不完整的用戶個(gè)人數(shù)據(jù)一方面將會(huì)影響關(guān)于用戶的業(yè)務(wù)邏輯,另一方面則會(huì)影響大數(shù)據(jù)分析的結(jié)果,造成用戶畫像的偏差。7.2.1大數(shù)據(jù)采集與傳輸中的安全與隱私數(shù)據(jù)遭受劫持攻擊個(gè)人數(shù)據(jù)的采集包含從客戶端到服務(wù)端的數(shù)據(jù)傳輸,將不可避免地出現(xiàn)黑客對(duì)數(shù)據(jù)的劫持和攻擊。在客戶端向服務(wù)端傳遞數(shù)據(jù)過(guò)程中,用戶對(duì)客戶端(如APP等)的數(shù)據(jù)使用權(quán)限可能被劫持,進(jìn)而遭受黑客的篡改。同時(shí),所傳輸?shù)臄?shù)據(jù)也容易被黑客解密,進(jìn)而偽造其中的關(guān)鍵信息,最終將偽造后的數(shù)據(jù)發(fā)送給服務(wù)端。當(dāng)服務(wù)端缺乏對(duì)數(shù)據(jù)傳輸過(guò)程的監(jiān)管時(shí),很可能采集到偽造后的用戶數(shù)據(jù),后果不堪設(shè)想。7.2.1大數(shù)據(jù)采集與傳輸中的安全與隱私數(shù)據(jù)遭病毒或木馬篡改個(gè)人數(shù)據(jù)除了在客戶端與服務(wù)端傳輸過(guò)程中容易遭受黑客劫持攻擊,在客戶端甚至服務(wù)端也有可能被植入的病毒或木馬篡改。病毒或木馬可通過(guò)故意誘導(dǎo)用戶操作而植入到客戶端,例如:誘導(dǎo)用戶打開含有木馬的郵件,使其植入客戶端操作系統(tǒng)中,進(jìn)而在客戶端中篡改用戶數(shù)據(jù)。如果將經(jīng)過(guò)篡改后的用戶數(shù)據(jù)發(fā)送至服務(wù)端,也會(huì)造成不良后果。【案例7-2】中心醫(yī)院內(nèi)部人員不良操作導(dǎo)致個(gè)人信息泄露。

2020年4月,在青島膠州市中心醫(yī)院疫情防控過(guò)程中,由于工作人員的操作失誤,導(dǎo)致6000多名中心醫(yī)院出入人員數(shù)據(jù)泄露,造成不良的社會(huì)影響。經(jīng)警方調(diào)查,該案件系中心醫(yī)院內(nèi)部工作人員失誤操作導(dǎo)致個(gè)人信息泄露,借助于互聯(lián)網(wǎng)的快速傳播能力,導(dǎo)致大量醫(yī)院出入人員的個(gè)人信息泄露。在政務(wù)大數(shù)據(jù)的采集和存儲(chǔ)中,內(nèi)部人員或機(jī)器能夠直接接觸到最原始的數(shù)據(jù)。這些數(shù)據(jù)中往往包含了較多的個(gè)人或國(guó)家敏感信息,不良的誤操作或有意的濫用,都將造成過(guò)安全隱患,非法使用將會(huì)影響國(guó)家信息安全。7.2.2大數(shù)據(jù)存儲(chǔ)中的安全與隱私大數(shù)據(jù)一般在云端采用分布式架構(gòu)存儲(chǔ),云端通常包含多臺(tái)存儲(chǔ)設(shè)備,根據(jù)用戶需要提供數(shù)據(jù)托管服務(wù),用戶將數(shù)據(jù)托管存儲(chǔ)在云端。實(shí)際上,云服務(wù)提供商為不同級(jí)別的用戶設(shè)置不同的云端訪問(wèn)口令,用戶根據(jù)自己的權(quán)限在云端存取數(shù)據(jù),但是云存儲(chǔ)也面臨著數(shù)據(jù)安全問(wèn)題。雖然云端提供了安全接入技術(shù),而且將云服務(wù)劃分為公有云、混合云和私有云,但是用戶在云端存儲(chǔ)的數(shù)據(jù)也可能出現(xiàn)被竊取、丟失的可能。在云服務(wù)器上,大數(shù)據(jù)分布式存儲(chǔ)存在的安全隱患包括:7.2.2大數(shù)據(jù)存儲(chǔ)中的安全與隱私云服務(wù)器遭受攻擊與普通服務(wù)器一樣,云服務(wù)器既需要與多個(gè)用戶客戶端交互詢問(wèn)數(shù)據(jù)存儲(chǔ)情況,還需要與多個(gè)存儲(chǔ)客戶端交互數(shù)據(jù)的實(shí)際存儲(chǔ)過(guò)程。交互過(guò)程一般采用網(wǎng)絡(luò)通信,如果通信過(guò)程被黑客入侵、劫持,將使用戶在云服務(wù)器上的數(shù)據(jù)被偽造、篡改,造成經(jīng)濟(jì)損失。7.2.2大數(shù)據(jù)存儲(chǔ)中的安全與隱私云服務(wù)器管理漏洞云服務(wù)器可能存在的管理漏洞也會(huì)造成安全隱患。富有經(jīng)驗(yàn)的云服務(wù)器提供商一般采用加密文檔傳輸,為不同級(jí)別的用戶建立賬號(hào)、密碼,防止用戶數(shù)據(jù)被非法閱讀、竊取。當(dāng)然,若云服務(wù)器存在技術(shù)或管理上的漏洞,也會(huì)造成用戶數(shù)據(jù)的存儲(chǔ)安全隱患。7.2.2大數(shù)據(jù)存儲(chǔ)中的安全與隱私云服務(wù)器遭受災(zāi)害通常,云服務(wù)器提供商將集群建立在可靠的自然環(huán)境中,盡量避免自然環(huán)境災(zāi)害對(duì)云服務(wù)器造成影響,例如:火災(zāi)、地震或洪水等。此外,成熟的云服務(wù)器提供商也會(huì)建立數(shù)據(jù)保護(hù)和災(zāi)難恢復(fù)等措施。然而,自然災(zāi)害可能無(wú)處不在,且具有突發(fā)的屬性,事先制定的策略往往在真實(shí)場(chǎng)景中難以顧全。例如:自然災(zāi)害突然中斷服務(wù)器的供電,在恢復(fù)供電時(shí)可能造成電力浪涌,最終造成數(shù)據(jù)丟失且難以挽回。另外,大型企業(yè)通常構(gòu)建自己的大數(shù)據(jù)分布式存儲(chǔ)架構(gòu),在自建的大數(shù)據(jù)分布式存儲(chǔ)架構(gòu)中,其面臨的大數(shù)據(jù)存儲(chǔ)安全隱患與云服務(wù)器類似,包含通信過(guò)程中的黑客入侵、存儲(chǔ)服務(wù)的安全漏洞以及突發(fā)的自然災(zāi)害等。這些都會(huì)導(dǎo)致企業(yè)級(jí)用戶數(shù)據(jù)被篡改、偽造以及丟失,帶來(lái)難以估量的經(jīng)濟(jì)損失。7.2.3大數(shù)據(jù)分析挖掘中的安全與隱私政務(wù)、企業(yè)和個(gè)人大數(shù)據(jù)經(jīng)過(guò)采集、傳輸和存儲(chǔ)后,最重要的應(yīng)用場(chǎng)景是大數(shù)據(jù)的分析和挖掘。隨著人工智能技術(shù)的飛速發(fā)展,基于數(shù)據(jù)科學(xué)與智能技術(shù)的大數(shù)據(jù)挖掘方法,能夠?qū)⒑A看髷?shù)據(jù)有機(jī)的聯(lián)合起來(lái),從看似不相干的數(shù)據(jù)中挖掘出有意義的信息。例如:沃爾瑪超市的研究者通過(guò)關(guān)聯(lián)分析,得出如下結(jié)論:超市中購(gòu)買尿布的男顧客同時(shí)也會(huì)購(gòu)買啤酒,從而將尿布和啤酒放在一起,能夠提升二者的銷量。大數(shù)據(jù)不但能夠應(yīng)用到商業(yè)促銷關(guān)系分析,同樣也能夠從個(gè)人大數(shù)據(jù)中挖掘出有效信息。例如:將個(gè)人用戶的消費(fèi)記錄、商品搜索記錄、位置信息、語(yǔ)音信息和聊天信息關(guān)聯(lián)起來(lái),通過(guò)大數(shù)據(jù)挖掘算法即可勾勒出該用戶的畫像。用戶畫像包含了部分用戶的個(gè)人隱私,將其暴露在互聯(lián)網(wǎng)中也會(huì)造成安全威脅。7.2.3大數(shù)據(jù)分析挖掘中的安全與隱私同時(shí),大數(shù)據(jù)挖掘算方法也會(huì)成為黑客的攻擊手段。通過(guò)常規(guī)渠道收集用戶數(shù)據(jù),或劫持用戶數(shù)據(jù),黑客能夠從收集到的企業(yè)、個(gè)人大數(shù)據(jù)中挖掘出隱私信息,分析企業(yè)之間或用戶之間的關(guān)聯(lián)信息,用于設(shè)計(jì)計(jì)算機(jī)病毒、木馬和入侵方法,給用戶帶來(lái)不小的安全隱患。如圖7-3所示,黑客采用數(shù)據(jù)科學(xué)分析方法與智能技術(shù)應(yīng)用方法,從海量行為大數(shù)據(jù)中挖掘出行為之間的關(guān)聯(lián)關(guān)系,進(jìn)而預(yù)測(cè)企業(yè)或個(gè)人的下一步行為,并設(shè)計(jì)入侵策略,將會(huì)對(duì)下一步行為構(gòu)成極大的安全威脅。7.2.3大數(shù)據(jù)分析挖掘中的安全與隱私圖7-3黑客使用大數(shù)據(jù)分析與挖掘建立行為預(yù)測(cè)攻擊037.3大數(shù)據(jù)開放與共享7.3.1大數(shù)據(jù)開放與共享概念隨著數(shù)據(jù)科學(xué)理論與智能數(shù)據(jù)分析技術(shù)的發(fā)展,作為“資源”主體的大數(shù)據(jù)受到廣泛關(guān)注。實(shí)際上,大數(shù)據(jù)真正的價(jià)值在于如何合理利用,通過(guò)分析與挖掘,獲取其中有意義的“知識(shí)”。我們知道,大數(shù)據(jù)的產(chǎn)生來(lái)自各方努力,不同行業(yè)在業(yè)務(wù)執(zhí)行過(guò)程中都采集、存儲(chǔ)了海量大數(shù)據(jù)。然而,想要真正利用好行業(yè)大數(shù)據(jù),大數(shù)據(jù)的開放和共享成為了關(guān)鍵。目前,研究者基于不同視角給出了開放數(shù)據(jù)(OpenData)的定義:(1)維基百科定義:開放數(shù)據(jù)指經(jīng)過(guò)挑選和許可的數(shù)據(jù),這些數(shù)據(jù)不受管理限制,例如著作權(quán)、專利權(quán)等。開放的數(shù)據(jù)可以被任何人在任何地點(diǎn)免費(fèi)獲取、使用和分享。(2)開放數(shù)據(jù)憲章定義:開放的電子數(shù)據(jù)能夠被任何人、在任何時(shí)間、地點(diǎn)自由使用和分發(fā),并保證了被開放數(shù)據(jù)必要的技術(shù)和法律特性。(3)喬爾?古林的著作《開放數(shù)據(jù)》定義:開放數(shù)據(jù)指公眾、企業(yè)和機(jī)構(gòu)能夠直接接觸到,可用于決策、投資、發(fā)現(xiàn)趨勢(shì)、尋找合作伙伴,以及解決復(fù)雜問(wèn)題的電子數(shù)據(jù)。7.3.1大數(shù)據(jù)開放與共享概念數(shù)據(jù)共享(DataSharing)指數(shù)據(jù)擁有者向其他機(jī)構(gòu)、個(gè)人開放數(shù)據(jù)的行為。數(shù)據(jù)共享與數(shù)據(jù)開放不能等價(jià),前者是將特定領(lǐng)域的數(shù)據(jù)開放給小范圍對(duì)象,而后者則是面向全體公眾開放。一般來(lái)說(shuō),可用于開放與共享的數(shù)據(jù)需滿足三個(gè)條件:一是數(shù)據(jù)應(yīng)該未經(jīng)過(guò)預(yù)處理,屬于采集的原始數(shù)據(jù);二是數(shù)據(jù)應(yīng)該有統(tǒng)一的讀寫標(biāo)準(zhǔn)格式;三是數(shù)據(jù)應(yīng)該在法律上具有不受限制的再利用權(quán)力。在《開放數(shù)據(jù)憲章》中,也明確了數(shù)據(jù)開放與共享的五大原則:一是遵循“以開放為常態(tài)、不開放為例外”的開放原則;二是保證所開放數(shù)據(jù)的質(zhì)量與數(shù)量;三是保障數(shù)據(jù)使用權(quán)的平等性;四是改善和治理發(fā)布數(shù)據(jù)的方法;五是鼓勵(lì)創(chuàng)新的發(fā)布數(shù)據(jù)。7.3.1大數(shù)據(jù)開放與共享概念在全球范圍內(nèi),信息技術(shù)和數(shù)據(jù)的開放與共享經(jīng)歷了四個(gè)階段:軟件開源階段、政府?dāng)?shù)據(jù)開放階段、科學(xué)研究數(shù)據(jù)開放階段、大數(shù)據(jù)開放與共享階段。數(shù)據(jù)開放與共享經(jīng)歷了由早期的計(jì)算機(jī)軟件、操作系統(tǒng)的開源,到制定國(guó)家政務(wù)數(shù)據(jù)和科學(xué)研究數(shù)據(jù)的開放、共享政策,再到大數(shù)據(jù)時(shí)代更為全面、精準(zhǔn)的開放與共享政策、法律和規(guī)范。我國(guó)大數(shù)據(jù)開放與共享四個(gè)階段的標(biāo)志性事件如表7-6所示。7.3.1大數(shù)據(jù)開放與共享概念表7-6我國(guó)數(shù)據(jù)開放與共享四個(gè)階段的標(biāo)志性事件7.3.1大數(shù)據(jù)開放與共享概念信息技術(shù)發(fā)展的早期主要是對(duì)計(jì)算機(jī)軟件源碼的開源,隨著計(jì)算機(jī)軟件在政府、科學(xué)研究和商業(yè)中被廣泛使用后,以政務(wù)數(shù)據(jù)、科研數(shù)據(jù)和商業(yè)數(shù)據(jù)為主體的數(shù)據(jù)重要性凸顯,相繼出臺(tái)相應(yīng)的政策、法規(guī)和指南。隨著大數(shù)據(jù)時(shí)代的來(lái)臨,大數(shù)據(jù)的開放與共享成為了政策重點(diǎn)支持對(duì)象,尤其是新政策,將大數(shù)據(jù)列為新型生產(chǎn)要素、建設(shè)大數(shù)據(jù)標(biāo)準(zhǔn)體系,以及完善大數(shù)據(jù)開放與共享進(jìn)程中的安全管理規(guī)范。近年來(lái),我國(guó)地方政府對(duì)于大數(shù)據(jù)的開放與共享也給予了鼎力支持,逐漸呈現(xiàn)出蔚然成林的態(tài)勢(shì)。根據(jù)大數(shù)據(jù)發(fā)展促進(jìn)委員會(huì)的《前瞻產(chǎn)業(yè)研究院整理》報(bào)告中指出,目前,政府各級(jí)部門的大數(shù)據(jù)開放與共享已經(jīng)成為了最受關(guān)注的政府治理領(lǐng)域。2021年中國(guó)政府大數(shù)據(jù)實(shí)施進(jìn)度與發(fā)展分析指出,在大數(shù)據(jù)發(fā)展規(guī)劃的政策、法規(guī)和指南中,分別有70%和78%的文件提及到政務(wù)大數(shù)據(jù)的開放與共享。7.3.1大數(shù)據(jù)開放與共享概念根據(jù)中國(guó)信息通信研究院的統(tǒng)計(jì)結(jié)果表明,截止到2020年底,全國(guó)有30個(gè)省份或直轄市針對(duì)大數(shù)據(jù)開放與共享一共出臺(tái)了56份政策性文件。目前,大數(shù)據(jù)的開放與共享已經(jīng)得到了高度重視,各省份或直轄市以需求向?qū)橹鳎浞挚紤]各大行業(yè)協(xié)會(huì)、企業(yè)、主管部門以及社會(huì)公眾的意見,建設(shè)數(shù)據(jù)開放與共享目錄清單,動(dòng)態(tài)調(diào)整大數(shù)據(jù)開放與共享的內(nèi)容。對(duì)于大數(shù)據(jù)開放與共享范圍,由早期的政務(wù)大數(shù)據(jù)逐步擴(kuò)展至企事業(yè)單位涉及的公共大數(shù)據(jù)資源。大數(shù)據(jù)開放與共享的成果形式也呈現(xiàn)多樣化,包括服務(wù)應(yīng)用、數(shù)據(jù)可視化、創(chuàng)新方案以及研究成果等。7.3.2大數(shù)據(jù)開放與共享的類別根據(jù)麥肯錫研究院在2013年《開放數(shù)據(jù):以流動(dòng)信息釋放創(chuàng)新力和效率》的報(bào)告中指出,全體數(shù)據(jù)包含經(jīng)典事務(wù)關(guān)系數(shù)據(jù)和大數(shù)據(jù);在大數(shù)據(jù)中,又包含各類隱私數(shù)據(jù)和開放與共享的大數(shù)據(jù);在所開放與共享的大數(shù)據(jù)中,主要包含政務(wù)大數(shù)據(jù)、科學(xué)大數(shù)據(jù)、企業(yè)大數(shù)據(jù)和個(gè)人大數(shù)據(jù)。圖7-4給出了大數(shù)據(jù)開放與共享的類別關(guān)系。大數(shù)據(jù)開放與共享具有各種劃分方式,這里僅從所開放與共享的大數(shù)據(jù)所有權(quán)出發(fā),分別給出不同類別大數(shù)據(jù)的開放與共享描述:7.3.2大數(shù)據(jù)開放與共享的類別圖7-4大數(shù)據(jù)開放與共享的類別關(guān)系7.3.2大數(shù)據(jù)開放與共享的類別政務(wù)大數(shù)據(jù)的開放與共享政務(wù)大數(shù)據(jù)是政府各級(jí)部門在履行職責(zé)過(guò)程中采集、傳輸和存儲(chǔ)的海量大數(shù)據(jù)。與政治、經(jīng)濟(jì)、民生相關(guān)的基礎(chǔ)性、關(guān)鍵性數(shù)據(jù)都以政務(wù)大數(shù)據(jù)形式存在。在保證國(guó)家、商業(yè)機(jī)密以及個(gè)人隱私前提下,對(duì)政務(wù)大數(shù)據(jù)進(jìn)行開放與共享,對(duì)促進(jìn)社會(huì)發(fā)展和提升公民生活水平質(zhì)量具有十分重要的積極作用。政務(wù)大數(shù)據(jù)的開放與共享與政務(wù)信息公開息息相關(guān),通過(guò)開放大數(shù)據(jù)保障政務(wù)信息的公開、透明。事實(shí)上,信息是利用大數(shù)據(jù)挖掘或人工智能技術(shù)從原始大數(shù)據(jù)中分析出的重要內(nèi)容。政務(wù)大數(shù)據(jù)的開放指的是由政府部門挖掘出大數(shù)據(jù)中有用的信息,將信息開放給公眾后,保障公眾對(duì)政務(wù)運(yùn)轉(zhuǎn)的“知情權(quán)”,增加政務(wù)的透明度;政務(wù)大數(shù)據(jù)共享指政府將在履行職責(zé)過(guò)程中采集、傳輸和存儲(chǔ)的海量大數(shù)據(jù)共享出來(lái),提供給社會(huì)公眾二次開發(fā)、利用,激發(fā)創(chuàng)新活力,提升政府治理水平。7.3.2大數(shù)據(jù)開放與共享的類別政務(wù)大數(shù)據(jù)的開放與共享國(guó)務(wù)院于2015年9月發(fā)布的《促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要》指出:“大力推動(dòng)政府部門數(shù)據(jù)共享,穩(wěn)步推動(dòng)公共數(shù)據(jù)資源開放”。明確政務(wù)信息應(yīng)該“以共享為原則,不共享為例外”,將“形成公共數(shù)據(jù)資源合理適度開放共享的法規(guī)制度和政策體系”作為中長(zhǎng)期目標(biāo)。2022年9月13日,國(guó)務(wù)院辦公廳印發(fā)《全國(guó)一體化政務(wù)大數(shù)據(jù)體系建設(shè)指南》(國(guó)辦函〔2022〕102號(hào)),向各級(jí)政府部門提出要求:“加強(qiáng)數(shù)據(jù)匯聚融合、共享開放和開發(fā)利用,促進(jìn)數(shù)據(jù)依法有序流動(dòng)”。政務(wù)大數(shù)據(jù)的開放與共享,不但能夠提升社會(huì)公眾對(duì)政府的認(rèn)同感,避免政府各級(jí)部門內(nèi)部出現(xiàn)問(wèn)題;且還能夠讓更多的組織、機(jī)構(gòu)和個(gè)人公平接觸、利用到大數(shù)據(jù),促進(jìn)社會(huì)的不斷發(fā)展。2016年6月,國(guó)務(wù)院印發(fā)《關(guān)于促進(jìn)和規(guī)范健康醫(yī)療大數(shù)據(jù)應(yīng)用發(fā)展的指導(dǎo)意見》,提出要建立互聯(lián)互通的健康信息平臺(tái),為打造“健康中國(guó)”提供有力支撐。該意見提出,要建設(shè)統(tǒng)一權(quán)威、互聯(lián)互通的國(guó)家、省、市、縣四級(jí)人口健康信息平臺(tái),實(shí)現(xiàn)部門、區(qū)域、行業(yè)間數(shù)據(jù)開放融合與共建共享。7.3.2大數(shù)據(jù)開放與共享的類別政務(wù)大數(shù)據(jù)的開放與共享2018年7月12日,國(guó)家衛(wèi)生健康委員會(huì)發(fā)布《國(guó)家健康醫(yī)療大數(shù)據(jù)標(biāo)準(zhǔn)、安全和服務(wù)管理辦法(試行)》(國(guó)衛(wèi)規(guī)劃發(fā)〔2018〕23號(hào)),提出要加強(qiáng)健康醫(yī)療大數(shù)據(jù)服務(wù)管理,促進(jìn)“互聯(lián)網(wǎng)+醫(yī)療健康”的發(fā)展,充分發(fā)揮健康醫(yī)療大數(shù)據(jù)作為國(guó)家重要基礎(chǔ)性戰(zhàn)略資源的作用,明確由國(guó)家衛(wèi)健委負(fù)責(zé)建立健康醫(yī)療大數(shù)據(jù)的開放與共享機(jī)制。國(guó)家衛(wèi)健委負(fù)責(zé)按照國(guó)家信息資源的開放與共享有關(guān)規(guī)定,建立健康醫(yī)療大數(shù)據(jù)開放與共享的工作機(jī)制,加強(qiáng)健康醫(yī)療大數(shù)據(jù)的共享與交換,統(tǒng)籌建設(shè)健康醫(yī)療大數(shù)據(jù)上報(bào)平臺(tái)、信息資源目錄體系和共享交換體系。此外,該辦法對(duì)標(biāo)準(zhǔn)管理、安全管理、服務(wù)管理和管理監(jiān)督四個(gè)方面提出了相關(guān)的規(guī)定和實(shí)施辦法。7.3.2大數(shù)據(jù)開放與共享的類別科學(xué)研究大數(shù)據(jù)的開放與共享科學(xué)研究數(shù)據(jù)的開放與共享是實(shí)施大數(shù)據(jù)戰(zhàn)略的重要組成部分??茖W(xué)研究大數(shù)據(jù)的開放與共享指由個(gè)人或機(jī)構(gòu)向社會(huì)公眾開放經(jīng)過(guò)研究后獲得的科學(xué)數(shù)據(jù),并授權(quán)任何人可免費(fèi)下載、傳輸、分析和再加工的權(quán)利,免除財(cái)務(wù)、法律或技術(shù)上的壁壘??茖W(xué)研究產(chǎn)生大數(shù)據(jù)的途徑主要包含四個(gè)方面:觀察數(shù)據(jù)、計(jì)算數(shù)據(jù)、實(shí)驗(yàn)數(shù)據(jù)和記錄數(shù)據(jù)。當(dāng)然,隨著科學(xué)研究的進(jìn)步,任何一個(gè)學(xué)科不僅僅采用單一的方式獲取科學(xué)研究大數(shù)據(jù)。近年來(lái),隨著網(wǎng)絡(luò)的發(fā)展和數(shù)據(jù)的開放,普通公眾也逐漸能夠接觸到科學(xué)研究的相關(guān)信息??茖W(xué)研究大數(shù)據(jù)的開放與共享從傳統(tǒng)的出版領(lǐng)域,拓展到學(xué)術(shù)交流體系,以及如今的全民科學(xué)普及,得到了極大的發(fā)展。針對(duì)某個(gè)領(lǐng)域的科學(xué)研究大數(shù)據(jù),無(wú)論是專業(yè)人士或是業(yè)余愛好者,都能夠下載、使用和存儲(chǔ)。科學(xué)研究大數(shù)據(jù)具有的學(xué)術(shù)價(jià)值,也能夠獲得二次開發(fā)和利用,造福更多的行業(yè)和產(chǎn)業(yè)。7.3.2大數(shù)據(jù)開放與共享的類別企業(yè)大數(shù)據(jù)的開放與共享企業(yè)大數(shù)據(jù)也是重要的大數(shù)據(jù)來(lái)源之一,國(guó)有企業(yè)和私營(yíng)企業(yè)在海量用戶基礎(chǔ)上,都成為了大數(shù)據(jù)的擁有者。通信領(lǐng)域中的國(guó)有企業(yè)例如中國(guó)移動(dòng)、中國(guó)聯(lián)通和中國(guó)電信,在日常運(yùn)營(yíng)過(guò)程中擁有海量的通信服務(wù)大數(shù)據(jù),通過(guò)開放與共享這些數(shù)據(jù),能夠造福社會(huì)公眾。例如:在疫情防控過(guò)程中,通過(guò)移動(dòng)通信大數(shù)據(jù)的分析,能夠定位個(gè)體是否與疫情相關(guān)人員存在近距離接觸的可能,從而能夠快速、精準(zhǔn)的布控防疫體系,快速穩(wěn)定疫情的發(fā)展。此外,在私營(yíng)企業(yè)領(lǐng)域中,以互聯(lián)網(wǎng)企業(yè)為例,例如淘寶、京東和拼多多等大型電子商務(wù)交易平臺(tái),多年的運(yùn)營(yíng)積累了海量的商品大數(shù)據(jù)、用戶大數(shù)據(jù)以及購(gòu)買信息大數(shù)據(jù)。實(shí)際上,私營(yíng)企業(yè)的大數(shù)據(jù)對(duì)社會(huì)公眾基本上處于完全開放與共享的狀態(tài),只需通過(guò)數(shù)據(jù)采集工具即可獲取共享的大數(shù)據(jù)(例如:基于Python的爬蟲程序)。一些以檢索引擎為主體的企業(yè)(例如:百度和谷歌),其數(shù)據(jù)庫(kù)中的大數(shù)據(jù)絕大部分來(lái)自互聯(lián)網(wǎng)公開數(shù)據(jù),7.3.2大數(shù)據(jù)開放與共享的類別企業(yè)大數(shù)據(jù)的開放與共享通過(guò)建立搜索引擎方便社會(huì)公眾方便的共享大數(shù)據(jù)。雖然企業(yè)大數(shù)據(jù)的開放與共享有利于經(jīng)濟(jì)發(fā)展和社會(huì)創(chuàng)新,但是部分企業(yè)為了追求利益最大化,基于隱私保護(hù)和商業(yè)機(jī)密等原因拒絕提供關(guān)鍵大數(shù)據(jù)的開放與共享,形成各自的“數(shù)據(jù)孤島”;另一方面,部分開放的企業(yè)大數(shù)據(jù),其數(shù)據(jù)完整性和安全性可能被商業(yè)巨頭操縱,造成“大數(shù)據(jù)殺熟”等問(wèn)題。7.3.2大數(shù)據(jù)開放與共享的類別個(gè)人大數(shù)據(jù)的開放與共享個(gè)人大數(shù)據(jù)一般建立在科學(xué)研究或企業(yè)應(yīng)用之上,指的是個(gè)人在科學(xué)研究或企業(yè)產(chǎn)品(APP)使用時(shí)采集或記錄到的大數(shù)據(jù)。個(gè)人大數(shù)據(jù)通常包含兩個(gè)類別,一是敏感性的個(gè)人信息,包含個(gè)人在與互聯(lián)網(wǎng)打交道時(shí)產(chǎn)生的個(gè)人隱私數(shù)據(jù),例如:個(gè)人賬戶、密碼、身份證信、銀行卡號(hào)以及醫(yī)療健康信息等;二是非敏感性的個(gè)人信息,包含不直接涉及到個(gè)人隱私的大數(shù)據(jù),例如用戶行為數(shù)據(jù)、用戶自愿公開展示的個(gè)人數(shù)據(jù)等。目前,敏感的個(gè)人大數(shù)據(jù)已經(jīng)被納入法律、法規(guī)保護(hù)范圍。非敏感的個(gè)人大數(shù)據(jù)雖然不會(huì)直接涉及到個(gè)人隱私,但是通過(guò)海量大數(shù)據(jù)的分析與挖掘,可能造成個(gè)人隱私泄露和被非法侵犯的問(wèn)題。在數(shù)據(jù)科學(xué)與智能技術(shù)飛速發(fā)展的今天,層出不窮的大數(shù)據(jù)分析與挖掘算法,對(duì)非敏感個(gè)人大數(shù)據(jù)的開放與共享過(guò)程中的隱私保護(hù)帶來(lái)了全新的挑戰(zhàn)。7.3.3大數(shù)據(jù)開放與共享的挑戰(zhàn)我們正處于一個(gè)科學(xué)、技術(shù)和商業(yè)高速發(fā)展的新時(shí)代,大數(shù)據(jù)是新時(shí)代發(fā)展的催化劑。維克托麥爾-舍恩伯格說(shuō)過(guò):“世界的本質(zhì)是數(shù)據(jù)?!贝髷?shù)據(jù)時(shí)代來(lái)臨之際,大數(shù)據(jù)的開放與共享使得在全球范圍內(nèi)利用、分析和挖掘大數(shù)據(jù)稱為了可能。開放與共享能夠極大的凸顯大數(shù)據(jù)帶來(lái)的價(jià)值。隨著國(guó)家頂層設(shè)計(jì)與實(shí)際策略制定,政府部門與部門之間、政府部門與企業(yè)之間的大數(shù)據(jù)開放與共享都取得了成效。關(guān)于大數(shù)據(jù)的開放與共享,目前已經(jīng)在全球范圍內(nèi)達(dá)成共識(shí),即運(yùn)用大數(shù)據(jù)的分析與挖掘,可有效推動(dòng)經(jīng)濟(jì)、社會(huì)發(fā)展,推行政務(wù)、企業(yè)大數(shù)據(jù)的開放與共享已經(jīng)成為了新趨勢(shì)。在全球范圍內(nèi),大數(shù)據(jù)的開放與共享帶來(lái)了全新的挑戰(zhàn):7.3.3大數(shù)據(jù)開放與共享的挑戰(zhàn)大數(shù)據(jù)開放與共享技術(shù)不成熟雖然已經(jīng)制定大數(shù)據(jù)開放與共享的相關(guān)政策,但由于相關(guān)設(shè)施不太完善,基礎(chǔ)設(shè)施和隱私保護(hù)法規(guī)成為了大數(shù)據(jù)開放與共享的首個(gè)挑戰(zhàn)。一方面,不同政府部門或企業(yè)關(guān)于大數(shù)據(jù)的采集、傳輸和存儲(chǔ)的基礎(chǔ)設(shè)施還不夠完善,各大系統(tǒng)存儲(chǔ)的數(shù)據(jù)相互獨(dú)立;還有一些業(yè)務(wù)尚未數(shù)字化,相應(yīng)領(lǐng)域的大數(shù)據(jù)沉淀還不夠,尚存的數(shù)據(jù)質(zhì)量也不佳,達(dá)不到大數(shù)據(jù)分析和挖掘的標(biāo)準(zhǔn)。另一方面,政務(wù)大數(shù)據(jù)或企業(yè)大數(shù)據(jù)通常分布于不同部門,各個(gè)部門的業(yè)務(wù)邏輯不同,在大數(shù)據(jù)采集和存儲(chǔ)上采用不同的基礎(chǔ)架構(gòu),大數(shù)據(jù)呈現(xiàn)多樣化的異構(gòu)結(jié)構(gòu)。例如:對(duì)于信息化基礎(chǔ)設(shè)施不完善的系統(tǒng),數(shù)據(jù)可能存儲(chǔ)在員工個(gè)人終端上,且數(shù)據(jù)資產(chǎn)分布不明晰,甚至出現(xiàn)手工數(shù)據(jù)記錄和計(jì)算機(jī)數(shù)據(jù)記錄并存的情況。在這樣的背景下,采用相同的大數(shù)據(jù)開放與共享策略無(wú)疑是不可行的。7.3.3大數(shù)據(jù)開放與共享的挑戰(zhàn)大數(shù)據(jù)開放與共享技術(shù)不成熟另外,關(guān)于大數(shù)據(jù)開放與共享的法律、法規(guī)也十分匱乏。目前,除了互聯(lián)網(wǎng)、金融和電信等行業(yè)的大數(shù)據(jù)開放與共享時(shí)的隱私保護(hù)法律、法規(guī)較為健全,絕大多數(shù)領(lǐng)域的大數(shù)據(jù)開放與共享的安全法律、法規(guī)尚在建設(shè)中。因此,相應(yīng)領(lǐng)域的大數(shù)據(jù)開放與共享得不到有效保障,真正意義上的大數(shù)據(jù)共享也無(wú)法準(zhǔn)確地落到實(shí)處,大數(shù)據(jù)公開的基礎(chǔ)工作很難做到精細(xì)化。不過(guò),關(guān)于不同領(lǐng)域的大數(shù)據(jù)隱私保護(hù),國(guó)家相應(yīng)的政策、法規(guī)也在不斷健全中。7.3.3大數(shù)據(jù)開放與共享的挑戰(zhàn)大數(shù)據(jù)開放與共享的意愿不強(qiáng)烈政務(wù)大數(shù)據(jù)的數(shù)據(jù)量最為龐大、價(jià)值密度最高,合理的政務(wù)大數(shù)據(jù)的開放與共享,不但能夠推動(dòng)經(jīng)濟(jì)發(fā)展、社會(huì)治理完善,還在提升政府服務(wù)能力和監(jiān)管能力中扮演重要角色。此外,大型企業(yè)在運(yùn)行過(guò)程中采集的大數(shù)據(jù),通常也具有非常大的價(jià)值,這些數(shù)據(jù)的開放與共享能夠促進(jìn)民生、提高居民生活質(zhì)量。表7-7給出了部分政務(wù)大數(shù)據(jù)和企業(yè)大數(shù)據(jù)的開放與共享實(shí)例。因此,良好的大數(shù)據(jù)開放與共享策略,能夠極大程度的豐富大數(shù)據(jù)分析和挖掘時(shí)的效果,進(jìn)而提升大數(shù)據(jù)本身的價(jià)值。7.3.3大數(shù)據(jù)開放與共享的挑戰(zhàn)大數(shù)據(jù)開放與共享的意愿不強(qiáng)烈表7-7政務(wù)大數(shù)據(jù)和企業(yè)大數(shù)據(jù)的開放與共享實(shí)例7.3.3大數(shù)據(jù)開放與共享的挑戰(zhàn)大數(shù)據(jù)開放與共享的意愿不強(qiáng)烈我們必須清楚的事實(shí)是大數(shù)據(jù)本身并不產(chǎn)生價(jià)值,只有對(duì)大數(shù)據(jù)進(jìn)行分析和挖掘才能夠利用其中的價(jià)值。因此,大數(shù)據(jù)的開放與共享在大數(shù)據(jù)產(chǎn)生價(jià)值過(guò)程中占據(jù)重要地位。然而,并非所有的政府機(jī)構(gòu)或企業(yè)都能夠意識(shí)到,大數(shù)據(jù)的價(jià)值在于利用、流動(dòng)、整合、分析和挖掘。這些政府機(jī)構(gòu)和企業(yè),往往將大數(shù)據(jù)束之高閣,針對(duì)大數(shù)據(jù)的開放與共享意愿不強(qiáng)烈。但是,大數(shù)據(jù)的“4V”特性告訴我們,任何大數(shù)據(jù)都有較強(qiáng)的時(shí)效性,經(jīng)過(guò)一段時(shí)間后大數(shù)據(jù)的價(jià)值顯著下降,意愿不強(qiáng)烈也成為了大數(shù)據(jù)開放與共享的另一大挑戰(zhàn)。7.3.3大數(shù)據(jù)開放與共享的挑戰(zhàn)大數(shù)據(jù)開放與共享的顧慮重重近年來(lái),雖然大數(shù)據(jù)的開放與共享已經(jīng)逐步提上日程,相關(guān)的法律、法規(guī)也逐步跟上,包括《網(wǎng)絡(luò)安全法》、《數(shù)據(jù)安全法》和《個(gè)人信息保護(hù)法》等,原來(lái)野蠻生長(zhǎng)的大數(shù)據(jù)環(huán)境得到了改善。但是,由于在大數(shù)據(jù)開放與共享過(guò)程中遭受的數(shù)據(jù)安全問(wèn)題頻發(fā),大到給國(guó)家的安全和經(jīng)濟(jì)發(fā)展造成危害,小到對(duì)公民造成極大的身心健康問(wèn)題,導(dǎo)致政府部門、企業(yè)等組織在開放數(shù)據(jù)時(shí)心存憂慮?!景咐?-3】大數(shù)據(jù)開放與共享導(dǎo)致暗網(wǎng)非法數(shù)據(jù)交易。

2019年1月,360企業(yè)安全發(fā)布的《2018年暗網(wǎng)非法數(shù)據(jù)交易總結(jié)》報(bào)告中指出,通過(guò)抽樣的方式發(fā)現(xiàn)暗網(wǎng)中兜售的非法數(shù)據(jù)涉及到軍事、政府、互聯(lián)網(wǎng)等多個(gè)領(lǐng)域,具體各個(gè)行業(yè)由于數(shù)據(jù)開放與共享遭到暗網(wǎng)非法交易的比例如圖7-5所示。7.3.3大數(shù)據(jù)開放與共享的挑戰(zhàn)大數(shù)據(jù)開放與共享的顧慮重重出于對(duì)大數(shù)據(jù)安全的考慮,很多政府部門或大型互聯(lián)網(wǎng)企業(yè)對(duì)數(shù)據(jù)開放與共享持謹(jǐn)慎態(tài)度,對(duì)開放后的大數(shù)據(jù)存儲(chǔ)、傳輸和使用心存憂慮,擔(dān)憂共享后的大數(shù)據(jù)遭受泄露或黑客攻擊造成嚴(yán)重后果,進(jìn)而不敢推進(jìn)大數(shù)據(jù)的開放與共享進(jìn)程。如圖7-5所示,由于大數(shù)據(jù)的開放與共享,在暗網(wǎng)上非法交易的“實(shí)名信息”占比高達(dá)45.2%,對(duì)公民的個(gè)人隱私造成了極大的危害。(a)行業(yè)分布圖7-5360威脅情報(bào)中心對(duì)于暗網(wǎng)非法數(shù)據(jù)交易的行業(yè)報(bào)告數(shù)據(jù)來(lái)源:360威脅情報(bào)中心,2019年7.3.3大數(shù)據(jù)開放與共享的挑戰(zhàn)大數(shù)據(jù)開放與共享的顧慮重重(b)主要類型圖7-5360威脅情報(bào)中心對(duì)于暗網(wǎng)非法數(shù)據(jù)交易的行業(yè)報(bào)告數(shù)據(jù)來(lái)源:360威脅情報(bào)中心,2019年7.3.3大數(shù)據(jù)開放與共享的挑戰(zhàn)大數(shù)據(jù)開放與共享的顧慮重重除了大數(shù)據(jù)安全問(wèn)題以外,大數(shù)據(jù)的倫理問(wèn)題也制約著大數(shù)據(jù)的開放與共享。大數(shù)據(jù)本身是中立的,對(duì)其開放與共享是促進(jìn)大數(shù)據(jù)利用的重要手段,但是分析和使用大數(shù)據(jù)過(guò)程并不一定中立,甚至帶有人類認(rèn)知的局限性。在大數(shù)據(jù)利用過(guò)程中,可能會(huì)出現(xiàn)觀點(diǎn)不中立甚至違背倫理的現(xiàn)象。例如:2018年10月,科技部對(duì)復(fù)旦大學(xué)附屬華山醫(yī)院、華大基因、藥明康德等6家單位作出行政處罰,原因是違反了《人類遺傳資源管理暫行辦法》,在開展業(yè)務(wù)過(guò)程中違規(guī)采集、收集、買賣、出口、出境人類遺傳資源。基因大數(shù)據(jù)帶有人類隱私和數(shù)據(jù)倫理,是公民不能觸碰的底線資源。此外,在基于大數(shù)據(jù)的無(wú)人駕駛場(chǎng)景中,面對(duì)復(fù)雜路況時(shí)由機(jī)器指令執(zhí)行緊急剎車,造成安全事故的責(zé)任認(rèn)定等,都具有不同程度的大數(shù)據(jù)倫理問(wèn)題。在這些復(fù)雜場(chǎng)景中,大數(shù)據(jù)的開放與共享牽扯到許多既有挑戰(zhàn)性、又難以界定的倫理問(wèn)題,將會(huì)加重政府部門或大型企業(yè)主體在開放與共享大數(shù)據(jù)時(shí)的顧慮。7.3.3大數(shù)據(jù)開放與共享的挑戰(zhàn)大數(shù)據(jù)開放與共享的顧慮重重最后,就算是已經(jīng)公開與共享的大數(shù)據(jù),也會(huì)由于數(shù)據(jù)質(zhì)量問(wèn)題遭到質(zhì)疑。政務(wù)大數(shù)據(jù)能夠客觀反映國(guó)家經(jīng)濟(jì)、社會(huì)的發(fā)展情況,但是需要多個(gè)部門完成協(xié)調(diào)的統(tǒng)計(jì)工作,若其中某個(gè)統(tǒng)計(jì)部門出現(xiàn)失誤,將會(huì)導(dǎo)致總體統(tǒng)計(jì)數(shù)據(jù)的偏差程度。眾多部門對(duì)政務(wù)大數(shù)據(jù)進(jìn)行收集、匯總和分析,很可能形成不統(tǒng)一的解釋口徑,造成政務(wù)大數(shù)據(jù)的公信力減弱。此外,由于技術(shù)問(wèn)題導(dǎo)致部分大數(shù)據(jù)無(wú)法進(jìn)行統(tǒng)一的比對(duì)分析和轉(zhuǎn)化,影響政府各部門統(tǒng)計(jì)數(shù)據(jù)的全面性、真實(shí)性和準(zhǔn)確性,損害公信力與權(quán)威形象。政務(wù)大數(shù)據(jù)的公開與共享所造成的數(shù)據(jù)質(zhì)量問(wèn)題,將會(huì)為政府各部門帶來(lái)不小的麻煩,也會(huì)造成不開放共享的顧慮。除了數(shù)據(jù)質(zhì)量造成的顧慮,政務(wù)大數(shù)據(jù)或企業(yè)大數(shù)據(jù)的造假行為,也是開放與共享造成顧慮的另一個(gè)重要因素。政務(wù)大數(shù)據(jù)的造假屢見不鮮,例如:2017年1月,某市因大氣環(huán)境持續(xù)惡化、二氧化硫濃度較高被環(huán)保部門約談;經(jīng)2018年3月檢測(cè)發(fā)現(xiàn),7.3.3大數(shù)據(jù)開放與共享的挑戰(zhàn)大數(shù)據(jù)開放與共享的顧慮重重該市的6個(gè)國(guó)控氣象大數(shù)據(jù)自動(dòng)監(jiān)測(cè)站數(shù)據(jù)異常,采樣系統(tǒng)遭到人為干擾,導(dǎo)致監(jiān)測(cè)到的環(huán)境大數(shù)據(jù)嚴(yán)重失真,最終對(duì)涉案人員追究了刑事責(zé)任。企業(yè)大數(shù)據(jù)造假更是隨處可見,例如:2018年10月,旅游平臺(tái)馬蜂窩點(diǎn)評(píng)內(nèi)容遭到抄襲質(zhì)疑。業(yè)內(nèi)人士指出,在互聯(lián)網(wǎng)行業(yè)中,從早期電子商務(wù)的“刷單”、“刷評(píng)論”到后期直播平臺(tái)的“買粉絲”、“刷閱讀量”等情況,充斥著多種多樣的數(shù)據(jù)造假行為。如果公開與共享這些造假的大數(shù)據(jù),將會(huì)對(duì)大數(shù)據(jù)的分析與利用造成負(fù)面影響。7.3.4數(shù)據(jù)孤島問(wèn)題在大數(shù)據(jù)開放與共享進(jìn)程中,除了數(shù)據(jù)安全與隱私保護(hù)的挑戰(zhàn)之外,還有另一個(gè)重要挑戰(zhàn)是“數(shù)據(jù)孤島”問(wèn)題?!皵?shù)據(jù)孤島”問(wèn)題普遍存在于政務(wù)大數(shù)據(jù)和企業(yè)大數(shù)據(jù)的開放與共享中。具體看來(lái),“數(shù)據(jù)孤島”問(wèn)題的出現(xiàn)主要由如下的7個(gè)方面原因造成:(1)歷史發(fā)展原因:政務(wù)大數(shù)據(jù)一直以來(lái)以部門為中心開展,導(dǎo)致跨部門的政務(wù)大數(shù)據(jù)共享存在門檻。企業(yè)早期發(fā)展追求利益至上,不愿過(guò)多開放與共享與利益無(wú)關(guān)的大數(shù)據(jù)資源。(2)共享意識(shí)原因:想要打破“數(shù)據(jù)孤島”問(wèn)題,首先需要國(guó)家層面或企業(yè)高層對(duì)大數(shù)據(jù)開放與共享的必要性、重要性有深刻的認(rèn)識(shí)。(3)缺少約束的法律、法規(guī):目前僅有一些條例、章程規(guī)定政府部門或企業(yè)需要進(jìn)行大數(shù)據(jù)的開放與共享,卻沒(méi)有強(qiáng)制性的法律、法規(guī)推動(dòng)開放與共享流程。7.3.4數(shù)據(jù)孤島問(wèn)題(4)缺乏開放與共享標(biāo)準(zhǔn):掌握大數(shù)據(jù)資源的政府部門或企業(yè)部門,不知道如何開放大數(shù)據(jù),共享大數(shù)據(jù)的范圍不明晰,缺乏可參考的標(biāo)準(zhǔn)。(5)存在制約的機(jī)制:政府部門的績(jī)效考評(píng)制約著政務(wù)大數(shù)據(jù)的開放與共享,擔(dān)憂開放后的大數(shù)據(jù)對(duì)考評(píng)產(chǎn)生影響;企業(yè)則是受到利益的制約,擔(dān)憂開放后的大數(shù)據(jù)對(duì)利益產(chǎn)生影響。(6)激勵(lì)機(jī)制短缺:大數(shù)據(jù)的開放與共享缺少合適的激勵(lì)方案,政府部門沒(méi)有動(dòng)力開放已存在的政務(wù)大數(shù)據(jù),甚至忽略一些不太重要的大數(shù)據(jù)采集。企業(yè)層面的激勵(lì)機(jī)制主要是利益,當(dāng)大數(shù)據(jù)的開放與共享能為企業(yè)提升利潤(rùn)時(shí),也能夠進(jìn)一步打破“數(shù)據(jù)孤島”問(wèn)題。(7)大數(shù)據(jù)人才匱乏:想要良好的開放與共享大數(shù)據(jù),就必須要有合理的人才梯隊(duì)推動(dòng)完成,包括管理團(tuán)隊(duì)、技術(shù)團(tuán)隊(duì)和實(shí)施團(tuán)隊(duì)的建設(shè)。但是,目前無(wú)論是政府部門還是企業(yè),大數(shù)據(jù)人才還相對(duì)匱乏。7.3.4數(shù)據(jù)孤島問(wèn)題“數(shù)據(jù)孤島”制約了政府部門的政策執(zhí)行和管理,以及企業(yè)的經(jīng)營(yíng)、管理與發(fā)展,也是政府部門或企業(yè)數(shù)字化轉(zhuǎn)型必須解決的難題?!皵?shù)據(jù)孤島”主要會(huì)帶來(lái)如下的問(wèn)題:(1)數(shù)據(jù)重復(fù):由于數(shù)據(jù)采集標(biāo)準(zhǔn)不同,各級(jí)部門在數(shù)據(jù)采集過(guò)程中必然會(huì)出現(xiàn)重復(fù)采集的情況,造成了大量重復(fù)、冗余且無(wú)效的數(shù)據(jù),降低了大數(shù)據(jù)的質(zhì)量和精準(zhǔn)度。(2)影響決策:由于不同信息系統(tǒng)中的“孤島”數(shù)據(jù)無(wú)法形成全域整體,且數(shù)據(jù)的共享往往缺乏時(shí)效性,導(dǎo)致政府部門或企業(yè)的決策沒(méi)有可參考的全域大數(shù)據(jù)。(3)協(xié)作不良:由于跨信息系統(tǒng)的大數(shù)據(jù)來(lái)自不同的數(shù)據(jù)標(biāo)準(zhǔn),無(wú)法直接進(jìn)行簡(jiǎn)單的共享,并且復(fù)雜的底層數(shù)據(jù)安全權(quán)限也影響著數(shù)據(jù)的共享,最終導(dǎo)致政府或企業(yè)各級(jí)部門之間無(wú)法形成高效的合作。7.3.4數(shù)據(jù)孤島問(wèn)題(4)效率低下:政府各部門從自己的角度出發(fā),往往發(fā)出重復(fù)率較高的政策,導(dǎo)致政策的效率低下。此外,企業(yè)各部門由于事務(wù)需求不同,也會(huì)出現(xiàn)重復(fù)“造輪子”的狀態(tài),導(dǎo)致企業(yè)的運(yùn)營(yíng)和發(fā)展效率低下。(5)體驗(yàn)較差:由于跨信息系統(tǒng)的數(shù)據(jù)標(biāo)準(zhǔn)不同,導(dǎo)致用戶的體驗(yàn)混雜,面向政府的事務(wù)或企業(yè)的服務(wù)需要下載多個(gè)“APP”,且多個(gè)“APP”之間的數(shù)據(jù)共享不及時(shí),操作方式各不相同,導(dǎo)致用戶的體驗(yàn)較差。下面,分別從政務(wù)大數(shù)據(jù)和企業(yè)大數(shù)據(jù)兩個(gè)方面,分析產(chǎn)生“數(shù)據(jù)孤島”問(wèn)題的原因、消除“數(shù)據(jù)孤島”的舉措。7.3.4數(shù)據(jù)孤島問(wèn)題政務(wù)大數(shù)據(jù)的“數(shù)據(jù)孤島”政務(wù)大數(shù)據(jù)產(chǎn)生“數(shù)據(jù)孤島”的原因主要是早期政務(wù)數(shù)據(jù)庫(kù)的建設(shè)技術(shù)標(biāo)準(zhǔn)不同,各部門自行選擇適用于自己業(yè)務(wù)的數(shù)據(jù)庫(kù)平臺(tái),且所接入的網(wǎng)絡(luò)通信標(biāo)準(zhǔn)也不同。隨著大數(shù)據(jù)時(shí)代來(lái)臨,各個(gè)部門的政務(wù)大數(shù)據(jù)都存儲(chǔ)在異構(gòu)的數(shù)據(jù)庫(kù)中,導(dǎo)致跨部門的政務(wù)大數(shù)據(jù)開放與共享難以實(shí)現(xiàn),出現(xiàn)了大面積政務(wù)大數(shù)據(jù)的“數(shù)據(jù)孤島”問(wèn)題。統(tǒng)計(jì)數(shù)據(jù)顯示,各級(jí)政府部門有大量毫無(wú)關(guān)聯(lián)的大數(shù)據(jù)資源沉積在信息管理系統(tǒng)中。一般情況下,大數(shù)據(jù)分析和挖掘的結(jié)果基本通過(guò)“數(shù)據(jù)煙囪”方式垂直向上級(jí)匯報(bào),缺少同級(jí)或跨級(jí)的橫向交流,形成相互獨(dú)立的“數(shù)據(jù)孤島”。這些數(shù)據(jù)孤島彼此獨(dú)立,管理分散,具有不同的標(biāo)準(zhǔn),治理成本較高。圖7-6給出了由于不同政務(wù)部門業(yè)務(wù)差異產(chǎn)生“數(shù)據(jù)孤島”的原因。7.3.4數(shù)據(jù)孤島問(wèn)題政務(wù)大數(shù)據(jù)的“數(shù)據(jù)孤島”圖7-6由于不同政務(wù)部門業(yè)務(wù)差異產(chǎn)生“數(shù)據(jù)孤島”的原因7.3.4數(shù)據(jù)孤島問(wèn)題政務(wù)大數(shù)據(jù)的“數(shù)據(jù)孤島”政務(wù)大數(shù)據(jù)作為政府重要的資產(chǎn)之一,由于歷史原因和開放意愿等問(wèn)題,積累的數(shù)據(jù)量較大、數(shù)據(jù)呈現(xiàn)多源異構(gòu)、分散的特性,難以有效進(jìn)行開放與共享,造成的“數(shù)據(jù)孤島”問(wèn)題嚴(yán)重影響到政務(wù)大數(shù)據(jù)的價(jià)值,浪費(fèi)了各級(jí)政府部門在政務(wù)信息化建設(shè)中的投入。政務(wù)大數(shù)據(jù)的“數(shù)據(jù)孤島”問(wèn)題在我國(guó)各省政府、各級(jí)部門的信息管理系統(tǒng)中較為常見?!景咐?-4】省級(jí)政務(wù)大數(shù)據(jù)的“數(shù)據(jù)孤島”問(wèn)題。

2018年,廣東省民盟《關(guān)于促進(jìn)我省政府大數(shù)據(jù)平臺(tái)建設(shè)的建議》的提案表明,截止到2018年1月,廣東省有超過(guò)4000類政務(wù)大數(shù)據(jù)孤島,3000多類政務(wù)大數(shù)據(jù)具有共享需求,當(dāng)前省級(jí)編目的大數(shù)據(jù)開放與共享卻只有400多例。7.3.4數(shù)據(jù)孤島問(wèn)題政務(wù)大數(shù)據(jù)的“數(shù)據(jù)孤島”根據(jù)數(shù)據(jù)統(tǒng)計(jì)顯示,廣東省目前具有37個(gè)網(wǎng)絡(luò)孤島,44個(gè)機(jī)房孤島,全省1068個(gè)政府各部門信息管理系統(tǒng)由200多家公司各自建設(shè)、運(yùn)維。數(shù)據(jù)標(biāo)準(zhǔn)多樣化且存在沖突,對(duì)開放與共享提出了不小挑戰(zhàn)。目前,我國(guó)各省份政府部門的數(shù)據(jù)孤島問(wèn)題得到了一定的治理與改善。2018年山東省“實(shí)施新舊動(dòng)能轉(zhuǎn)換重大工程”的數(shù)據(jù)顯示,截止到2017年底,山東省含有60余個(gè)省直部門專用網(wǎng)絡(luò)孤島,100余個(gè)機(jī)房孤島,150余個(gè)電子郵件及會(huì)議信息系統(tǒng)孤島,以及800多個(gè)業(yè)務(wù)系統(tǒng)孤島。經(jīng)過(guò)整合共享工作后,上述“數(shù)據(jù)孤島”通過(guò)遷移至“政務(wù)云”上得以解決。此外,山東省17個(gè)省、市直部門關(guān)停260余個(gè)無(wú)法開放與共享的“僵尸系統(tǒng)”和“影子系統(tǒng)”。7.3.4數(shù)據(jù)孤島問(wèn)題政務(wù)大數(shù)據(jù)的“數(shù)據(jù)孤島”近年來(lái),我國(guó)各省份政府部門已經(jīng)出臺(tái)多項(xiàng)政策、法規(guī),并構(gòu)建云開放和云共享平臺(tái),以期解決政務(wù)大數(shù)據(jù)的“數(shù)據(jù)孤島”問(wèn)題。表7-8給出了部分省份解決政務(wù)大數(shù)據(jù)的“數(shù)據(jù)孤島”問(wèn)題的措施。7.3.4數(shù)據(jù)孤島問(wèn)題政務(wù)大數(shù)據(jù)的“數(shù)據(jù)孤島”表7-8部分省份解決政務(wù)大數(shù)據(jù)的“數(shù)據(jù)孤島”問(wèn)題的措施7.3.4數(shù)據(jù)孤島問(wèn)題企業(yè)大數(shù)據(jù)的“數(shù)據(jù)孤島”企業(yè)大數(shù)據(jù)的“數(shù)據(jù)孤島”問(wèn)題主要由多年的信息化建設(shè)形成。在信息化、數(shù)字化和智能化不斷升級(jí)過(guò)程中,催生了企業(yè)大數(shù)據(jù)的“數(shù)據(jù)孤島”問(wèn)題。面向企業(yè)大數(shù)據(jù),數(shù)據(jù)孤島主要包含兩個(gè)層面:(1)企業(yè)內(nèi)部的“數(shù)據(jù)孤島”:大型企業(yè)一般包含有多個(gè)事業(yè)部門,各個(gè)事業(yè)部門的經(jīng)營(yíng)活動(dòng)都會(huì)產(chǎn)生大數(shù)據(jù),但是各個(gè)部門的業(yè)務(wù)不相同,選擇大數(shù)據(jù)采集、存儲(chǔ)的平臺(tái)、系統(tǒng)也不同。由于平臺(tái)、系統(tǒng)的兼容性問(wèn)題,不能在各個(gè)事業(yè)部門之間建立有效的數(shù)據(jù)開放與共享策略,進(jìn)而形成“數(shù)據(jù)孤島”。圖7-7所示,某大型企業(yè)的人事部采用辦公自動(dòng)化系統(tǒng)(OA)管理人事,生產(chǎn)部則采用企業(yè)資源規(guī)劃系統(tǒng)管理生產(chǎn)過(guò)程,而銷售部門采用客戶關(guān)系管理系統(tǒng)進(jìn)行銷售與客戶的管理。7.3.4數(shù)據(jù)孤島問(wèn)題企業(yè)大數(shù)據(jù)的“數(shù)據(jù)孤島”圖7-7企業(yè)多個(gè)事業(yè)部門之間信息管理系統(tǒng)不同造成“數(shù)據(jù)孤島”7.3.4數(shù)據(jù)孤島問(wèn)題企業(yè)大數(shù)據(jù)的“數(shù)據(jù)孤島”由于三類信息管理系統(tǒng)的底層架構(gòu)不同,當(dāng)銷售部門想要調(diào)用生產(chǎn)部門的數(shù)據(jù),并根據(jù)企業(yè)生產(chǎn)狀況制定未來(lái)的銷售戰(zhàn)略時(shí),卻因?yàn)樯a(chǎn)部門使用ERP系統(tǒng),無(wú)法直接在銷售部門使用的CRM系統(tǒng)中讀取ERP系統(tǒng)數(shù)據(jù)。長(zhǎng)此以往,造成了各個(gè)部門之間的數(shù)據(jù)相互獨(dú)立形成“孤島”。隨著時(shí)間的累計(jì),不同業(yè)務(wù)部門的海量大數(shù)據(jù)均積累在特定的信息管理系統(tǒng)中,導(dǎo)致同一家企業(yè)各個(gè)部門之間的數(shù)據(jù)互通變得困難。7.3.4數(shù)據(jù)孤島問(wèn)題企業(yè)大數(shù)據(jù)的“數(shù)據(jù)孤島”(2)企業(yè)之間的“數(shù)據(jù)孤島”:大型企業(yè)的消費(fèi)級(jí)大數(shù)據(jù)中通常都隱藏著巨大的商業(yè)利益,國(guó)內(nèi)的消費(fèi)者數(shù)據(jù)都存儲(chǔ)在互聯(lián)網(wǎng)“巨頭”企業(yè)中。目前,消費(fèi)者數(shù)據(jù)缺少法律、法規(guī)的限制,且共享這些數(shù)據(jù)并沒(méi)有合適的激勵(lì)政策。因此,各個(gè)互聯(lián)網(wǎng)“巨頭”企業(yè)開放大數(shù)據(jù)的意愿較弱,出現(xiàn)以個(gè)體互聯(lián)網(wǎng)“巨頭”為代表的“數(shù)據(jù)孤島”。例如:網(wǎng)絡(luò)購(gòu)物大數(shù)據(jù)、出行大數(shù)據(jù)和娛樂(lè)消遣大數(shù)據(jù)等?;ヂ?lián)網(wǎng)個(gè)體用戶可能同時(shí)是網(wǎng)絡(luò)購(gòu)物、出行和娛樂(lè)消遣大數(shù)據(jù)的提供者,但是三者之間卻形成了“數(shù)據(jù)孤島”,無(wú)法有效挖掘出對(duì)個(gè)體用戶有意義的信息。針對(duì)企業(yè)大數(shù)據(jù)的“數(shù)據(jù)孤島”,其根本原因在于數(shù)據(jù)治理和數(shù)據(jù)標(biāo)準(zhǔn)的不統(tǒng)一,導(dǎo)致企業(yè)的數(shù)據(jù)無(wú)法方便的開放與共享。目前,一些大型企業(yè)已經(jīng)對(duì)開始重視治理“數(shù)據(jù)孤島”,另外也有一些企業(yè)專門從事協(xié)助大型企業(yè)消除“數(shù)據(jù)孤島”的業(yè)務(wù),例如鈦鉑數(shù)據(jù)、麥聰軟件等。7.3.4數(shù)據(jù)孤島問(wèn)題企業(yè)大數(shù)據(jù)的“數(shù)據(jù)孤島”【案例7-5】某軟件:消除企業(yè)大數(shù)據(jù)的“數(shù)據(jù)孤島”方案。消除企業(yè)大數(shù)據(jù)的“數(shù)據(jù)孤島”,可以采用三個(gè)方面的策略:(1)連接數(shù)據(jù)孤島集成全域數(shù)據(jù):構(gòu)建統(tǒng)一數(shù)據(jù)服務(wù)平臺(tái),該平臺(tái)應(yīng)該支持主流的分布式大數(shù)據(jù)平臺(tái)(如Hadoop、Spark、Storm等)、數(shù)據(jù)庫(kù)和數(shù)據(jù)倉(cāng)庫(kù)(如HBase、Hive),構(gòu)建集成全域數(shù)據(jù)的接口,接收來(lái)自不同信息系統(tǒng)的多源結(jié)構(gòu)化/非結(jié)構(gòu)化數(shù)據(jù),提供從多種云、碎片化的數(shù)據(jù)庫(kù)中提取數(shù)據(jù)的健全功能。(2)創(chuàng)建可迭代“API”的“數(shù)據(jù)超市”:為了解決業(yè)務(wù)人員與開發(fā)人員之間的“技術(shù)鴻溝”,讓企業(yè)中各個(gè)部門的數(shù)據(jù)能夠“用起來(lái)”,構(gòu)建可升級(jí)、迭代的低代碼量數(shù)據(jù)調(diào)用“API”,形成“數(shù)據(jù)超市”。如圖7-8所示,7.3.4數(shù)據(jù)孤島問(wèn)題企業(yè)大數(shù)據(jù)的“數(shù)據(jù)孤島”一方面,開發(fā)人員能夠不斷迭代“API”,提升數(shù)據(jù)挖掘技術(shù)的開發(fā)效率;另一方面,業(yè)務(wù)人員能夠申請(qǐng)使用現(xiàn)有版本的“API”,查看并使用企業(yè)現(xiàn)有的全域數(shù)據(jù),構(gòu)建更高效的業(yè)務(wù)。同時(shí),業(yè)務(wù)人員將使用過(guò)程中的困難反饋給開發(fā)人員,通過(guò)不斷升級(jí)、改造“API”,建設(shè)優(yōu)化的“數(shù)據(jù)超市”。(3)全局?jǐn)?shù)據(jù)權(quán)限管理:傳統(tǒng)的企業(yè)數(shù)據(jù)權(quán)限管理方式,針對(duì)每種信息管理系統(tǒng)賦予單獨(dú)的賬號(hào)權(quán)限,操作復(fù)雜且密碼容易遺忘。此外,業(yè)務(wù)人員跨系統(tǒng)設(shè)置相同的密碼,也可能導(dǎo)致安全隱患。解決“數(shù)據(jù)孤島”的同時(shí)需要構(gòu)建全局?jǐn)?shù)據(jù)管理權(quán)限,屏蔽底層分布式數(shù)據(jù)存儲(chǔ)環(huán)境變更的影響,提升賬號(hào)權(quán)限管理的效率,同時(shí)避免出現(xiàn)數(shù)據(jù)安全問(wèn)題。7.3.4數(shù)據(jù)孤島問(wèn)題企業(yè)大數(shù)據(jù)的“數(shù)據(jù)孤島”圖7-8“API”可不斷升級(jí)、改造的“數(shù)據(jù)超市”7.3.5大數(shù)據(jù)開放與共享措施針對(duì)大數(shù)據(jù)開放與共享的現(xiàn)狀和挑戰(zhàn),分別從政務(wù)大數(shù)據(jù)、科學(xué)研究大數(shù)據(jù)、企業(yè)大數(shù)據(jù)和個(gè)人大數(shù)據(jù)四個(gè)方面,闡述大數(shù)據(jù)開放與共享的一些措施:7.3.5大數(shù)據(jù)開放與共享措施政務(wù)大數(shù)據(jù)開放與共享的措施(1)完善相關(guān)法律、法規(guī):目前,為了解決政務(wù)大數(shù)據(jù)中的“數(shù)據(jù)孤島”問(wèn)題,各省份已經(jīng)展開了不同層面的法律、法規(guī)制度完善。隨著大數(shù)據(jù)的開放與共享帶來(lái)的安全和隱私問(wèn)題加劇,各省份還需要完善相關(guān)法律、法規(guī),推出適應(yīng)于政務(wù)大數(shù)據(jù)開放與共享的法律、法規(guī)。為了提升大數(shù)據(jù)開放與共享的意愿,立法部門工作人員應(yīng)該深入基層調(diào)研,聽取基層工作人員的建議,完善相關(guān)的法律、法規(guī),構(gòu)建大數(shù)據(jù)開放與共享的激勵(lì)政策。此外,由于政務(wù)大數(shù)據(jù)的開放與共享需要面向社會(huì)公眾,立法內(nèi)容要明確開放和共享的大數(shù)據(jù)格式,協(xié)調(diào)政府各部門在統(tǒng)一的法律、法規(guī)下開放和共享政務(wù)大數(shù)據(jù),提升開放與共享意愿,降低開放與共享帶來(lái)的顧慮,為利用好政務(wù)大數(shù)據(jù)打好基礎(chǔ)。7.3.5大數(shù)據(jù)開放與共享措施政務(wù)大數(shù)據(jù)開放與共享的措施(2)建設(shè)統(tǒng)一平臺(tái):如前所述,“數(shù)據(jù)孤島”來(lái)源于政府各部門的平臺(tái)不統(tǒng)一問(wèn)題,國(guó)家和各省份目前已經(jīng)開展建設(shè)統(tǒng)一的跨部門大數(shù)據(jù)開放與共享平臺(tái)。針對(duì)開放和共享后的政務(wù)大數(shù)據(jù),統(tǒng)一平臺(tái)應(yīng)該保證大數(shù)據(jù)的統(tǒng)一性和安全性,保障公開和共享的政務(wù)大數(shù)據(jù)不被攻擊。對(duì)于不涉密的政務(wù)大數(shù)據(jù),平臺(tái)提供中間層將各部門格式不同的政務(wù)大數(shù)據(jù)統(tǒng)一轉(zhuǎn)碼為相同格式,提供開放的下載接口。定期分析政務(wù)大數(shù)據(jù)的公開、共享和被使用的情況,分析政務(wù)大數(shù)據(jù)在實(shí)際政策支持、經(jīng)濟(jì)發(fā)展過(guò)程中帶來(lái)的效益。(3)接受公眾監(jiān)督:政務(wù)大數(shù)據(jù)的開放與共享需要滿足統(tǒng)一格式,為公眾提供了解政府各部門執(zhí)行政策的過(guò)程。同樣地,大數(shù)據(jù)的開放與共享過(guò)程也需要面向公眾開放,接受公眾的監(jiān)督,讓公眾了解非涉密的政務(wù)大數(shù)據(jù)從采集、傳輸、存儲(chǔ)、預(yù)處理到開放與共享的全部過(guò)程。在公眾監(jiān)督下,政府各部門能夠最大程度避免問(wèn)題發(fā)生,保障開放和共享的政務(wù)大數(shù)據(jù)質(zhì)量。同時(shí),統(tǒng)一的大數(shù)據(jù)開放與共享平臺(tái)還應(yīng)該開放反饋窗口,讓公眾能夠及時(shí)發(fā)現(xiàn)并反饋政務(wù)大數(shù)據(jù)中的問(wèn)題,提升政務(wù)大數(shù)據(jù)的質(zhì)量。7.3.5大數(shù)據(jù)開放與共享措施政務(wù)大數(shù)據(jù)開放與共享的措施(4)加強(qiáng)制度建設(shè):政務(wù)大數(shù)據(jù)的開放與共享離不開可靠的制度,政府相關(guān)部門應(yīng)該在保證現(xiàn)有制度基礎(chǔ)上,逐步完善開放與共享的制度。具體包含兩個(gè)方面:一是確定統(tǒng)一的政務(wù)大數(shù)據(jù)開放與共享的時(shí)間,各級(jí)政府部門的大數(shù)據(jù)都遵照相應(yīng)的時(shí)間制度進(jìn)行開放和共享;二是建立政務(wù)大數(shù)據(jù)開放與共享的考核制度,對(duì)于及時(shí)公開政務(wù)大數(shù)據(jù)的部門給予相應(yīng)的激勵(lì)制度,對(duì)于未及時(shí)或不愿公開政務(wù)大數(shù)據(jù)的追究具體責(zé)任;三是設(shè)立大數(shù)據(jù)開放與共享平臺(tái)維護(hù)的規(guī)章制度,將社會(huì)公眾對(duì)于當(dāng)前政務(wù)大數(shù)據(jù)的開放與共享反饋意見納入維護(hù)進(jìn)程中,不斷優(yōu)化政務(wù)大數(shù)據(jù)的開放與共享制度。7.3.5大數(shù)據(jù)開放與共享措施科學(xué)研究大數(shù)據(jù)開放與共享的措施(1)加強(qiáng)科學(xué)研究大數(shù)據(jù)的規(guī)范化:由于學(xué)科的多樣性,科學(xué)研究中的數(shù)據(jù)形式各不相同,研究項(xiàng)目應(yīng)該規(guī)定好各學(xué)科的科學(xué)研究大數(shù)據(jù)的標(biāo)準(zhǔn)格式,科學(xué)研究者按照標(biāo)準(zhǔn)進(jìn)行科學(xué)研究,通過(guò)規(guī)范化的數(shù)據(jù)加工處理保障數(shù)據(jù)的及時(shí)性、可靠性和真實(shí)性??茖W(xué)研究大數(shù)據(jù)開放與共享的內(nèi)容,不但包含科學(xué)研究實(shí)體和科學(xué)研究數(shù)據(jù)的描述信息,還應(yīng)包括科學(xué)研究數(shù)據(jù)的輔助工具等,保證開放后的大數(shù)據(jù)能夠被公眾使用,進(jìn)行二次分析、開發(fā)和處理。此外,為了保障科學(xué)研究大數(shù)據(jù)的規(guī)范,還需要為科學(xué)研究工作者制定健全的績(jī)效管理和評(píng)價(jià)機(jī)制,通過(guò)獎(jiǎng)懲辦法調(diào)動(dòng)開放與共享科學(xué)研究大數(shù)據(jù)的積極性。(2)強(qiáng)化科學(xué)研究大數(shù)據(jù)的質(zhì)量評(píng)價(jià):在開放與共享過(guò)程中,科學(xué)研究大數(shù)據(jù)僅滿足規(guī)范化還遠(yuǎn)遠(yuǎn)不夠,還應(yīng)該強(qiáng)化大數(shù)據(jù)的質(zhì)量。質(zhì)量評(píng)價(jià)主要包括:科學(xué)研究進(jìn)程中的生產(chǎn)、管理、傳播到再利用全部過(guò)程的評(píng)價(jià)。7.3.5大數(shù)據(jù)開放與共享措施科學(xué)研究大數(shù)據(jù)開放與共享的措施由于學(xué)科差異性,同類學(xué)科應(yīng)該制定通用的科學(xué)研究大數(shù)據(jù)的質(zhì)量評(píng)價(jià)體系,提升科學(xué)研究進(jìn)程中標(biāo)準(zhǔn)化和規(guī)范化的程度。此外,還需要探索更便捷、全面的科學(xué)研究同行評(píng)審機(jī)制,以及評(píng)審和出版的全新方式。鼓勵(lì)各級(jí)出版機(jī)構(gòu)和大數(shù)據(jù)中心,積極探索并推動(dòng)科學(xué)研究大數(shù)據(jù)的質(zhì)量評(píng)價(jià)新方法,以期滿足在大數(shù)據(jù)背景下的科學(xué)研究大數(shù)據(jù)的開放與共享需求。(3)積極革新科學(xué)研究大數(shù)據(jù)出版:科學(xué)研究的出版是大數(shù)據(jù)開放與共享的經(jīng)典方式之一。傳統(tǒng)科學(xué)研究?jī)H出版論文,沒(méi)有相應(yīng)的科學(xué)研究進(jìn)程中的數(shù)據(jù)支撐,往往無(wú)法進(jìn)行有效的二次利用,不利于開放與共享。近年來(lái),隨著出版技術(shù)的日趨完善,越來(lái)越多的出版集團(tuán)在論文出版的同時(shí),還提供研究進(jìn)程中的大數(shù)據(jù)和相關(guān)輔助軟件的開放,例如:愛思唯爾(Elsevier)出版集團(tuán)提供“CodeOcean”用于開放與共享科學(xué)研究中的源碼、數(shù)據(jù)等,極大的革新了出版的方式。在未來(lái),為了提升科學(xué)研究大數(shù)據(jù)開放與共享的效率與價(jià)值,還應(yīng)該探索全新的科學(xué)大數(shù)據(jù)出版模式,提升科學(xué)研究大數(shù)據(jù)出版的質(zhì)量。7.3.5大數(shù)據(jù)開放與共享措施科學(xué)研究大數(shù)據(jù)開放與共享的措施(4)應(yīng)用新技術(shù)和新手段支撐開放與共享:科學(xué)研究大數(shù)據(jù)的開放與共享也將會(huì)帶來(lái)諸多問(wèn)題,例如數(shù)據(jù)侵權(quán)、數(shù)據(jù)安全以及隱私保護(hù)等。新興技術(shù)和手段的出現(xiàn),如區(qū)塊鏈和安全多方計(jì)算等技術(shù),能夠保證開放與共享進(jìn)程中的權(quán)利和安全問(wèn)題,實(shí)現(xiàn)可追溯、可監(jiān)控、可保護(hù)的體系,避免知識(shí)產(chǎn)權(quán)或數(shù)據(jù)中的隱私受到攻擊風(fēng)險(xiǎn)。7.3.5大數(shù)據(jù)開放與共享措施企業(yè)大數(shù)據(jù)開放與共享的措施(1)破除跨部門的“數(shù)據(jù)孤島”:要想打破企業(yè)內(nèi)部部門之間的“數(shù)據(jù)孤島”,就必須針對(duì)來(lái)自不同業(yè)務(wù)的異構(gòu)信息管理系統(tǒng)進(jìn)行全面的升級(jí)和改造,選擇系統(tǒng)化且嚴(yán)密的集成系統(tǒng),將各種業(yè)務(wù)、各個(gè)渠道的大數(shù)據(jù)綜合到統(tǒng)一的信息管理平臺(tái)中。企業(yè)自身應(yīng)該重點(diǎn)挖掘“人無(wú)我有”的大數(shù)據(jù),開放與共享具有競(jìng)爭(zhēng)價(jià)值的大數(shù)據(jù)。此外,企業(yè)還需要構(gòu)建統(tǒng)一對(duì)外的數(shù)據(jù)開放接口,并注重共享大數(shù)據(jù)的實(shí)際應(yīng)用案例建設(shè)。(2)強(qiáng)化數(shù)據(jù)安全規(guī)范和保障:企業(yè)大數(shù)據(jù)的開放與共享也將涉及企業(yè)的隱私安全。因此,在大數(shù)據(jù)開放與共享進(jìn)程中,還需要強(qiáng)化數(shù)據(jù)安全規(guī)范和保障機(jī)制。首先,企業(yè)內(nèi)部需要樹立安全理念,將大數(shù)據(jù)的安全作為影響企業(yè)聲譽(yù)的關(guān)鍵環(huán)節(jié);其次,建立合理的獎(jiǎng)懲機(jī)制,獎(jiǎng)勵(lì)積極開放與共享大數(shù)據(jù)的部門,嚴(yán)懲造成大數(shù)據(jù)安全隱患的部門;最后,引入外部機(jī)制,監(jiān)督阻礙企業(yè)大數(shù)據(jù)開放與共享的行為,提升企業(yè)大數(shù)據(jù)在經(jīng)濟(jì)發(fā)展中的有益作用。7.3.5大數(shù)據(jù)開放與共享措施企業(yè)大數(shù)據(jù)開放與共享的措施(3)完善人才培養(yǎng)與管理機(jī)制:企業(yè)對(duì)大數(shù)據(jù)人才梯隊(duì)的建設(shè)也是重要手段之一。隨著企業(yè)的逐步發(fā)展壯大,將會(huì)產(chǎn)生海量的大數(shù)據(jù),這些大數(shù)據(jù)需要交由專業(yè)人士管理、分析。企業(yè)大數(shù)據(jù)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論