版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
大數(shù)據(jù)時代的檔案館:基于SWOT的分析周楓(上海大學(xué)圖書情報檔案系上海200444)摘要文章在對大數(shù)據(jù)的特征及內(nèi)涵進(jìn)行介紹的基礎(chǔ)上,運用SWOT分析法對大數(shù)據(jù)時代我國檔案館事業(yè)發(fā)展的內(nèi)部要素和外部環(huán)境進(jìn)行全面探究,總結(jié)優(yōu)勢和機遇,剖析劣勢與威脅,并在此基礎(chǔ)上運用SWOT策略模型提出目前適合檔案館發(fā)展并提高其競爭力的策略與建議。關(guān)鍵詞檔案館大數(shù)據(jù)SWOT分析Thearchivesinbigdataera:basedontheSWOTanalysisZhouFeng(DepartmentofLibrary,InformationandArchives,ShanghaiUniversity,Shanghai,200444)Abstract:Basedontheintroductionofcharacteristicsandconnotationofbigdata,thepaperexplorestheinternalfactorsandexternalenvironmentofarchivescauseinChinawiththeSWOTanalysismethodinbigdataera,summarizingtheadvantagesandopportunities,analyzingtheweaknessesandthreats.Andthen,itputforwardseveralappropriatestrategiesforthedevelopmentofarchivesbyusingSWOTstrategymodel.Keywords:Archives;BigData;SWOTanalysis大數(shù)據(jù)是繼web2.0、云計算、物聯(lián)網(wǎng)之后近兩年最為炙熱的一個詞匯,也引發(fā)了信息科技領(lǐng)域越來越多的關(guān)注與投身熱潮。2011年,麥肯錫在研究報告《大數(shù)據(jù):下一個創(chuàng)新、競爭和生產(chǎn)率前沿》[1]中首次提出“大數(shù)據(jù)”的概念,之后《紐約時報》[2]、《華爾街日報》[3]等都對大數(shù)據(jù)進(jìn)行了專欄介紹。隨著2012年奧巴馬政府宣布投資兩億美元啟動“大數(shù)據(jù)研究與發(fā)展計劃”[4],大數(shù)據(jù)正式上升為與歷史上的互聯(lián)網(wǎng)、超級計算同等重要的國家戰(zhàn)略?!斑@是一次革命”,哈佛量化社會科學(xué)研究所主任GaryKing說:“我們的確正在起航,在龐大的新數(shù)據(jù)來源的支持下,量化的前進(jìn)步伐將會踏遍學(xué)術(shù)、商業(yè)和政府領(lǐng)域,沒有一個領(lǐng)域可以不被觸及?!盵5]檔案館也不例外,從上古的結(jié)繩記事到如今源源不斷的信息流,大數(shù)據(jù)時代的到來,也給檔案館帶來了極大的沖擊。檔案館必須利用一切有效手段來分析現(xiàn)狀與未來,做出正確的選擇。1何為大數(shù)據(jù)截至目前,大數(shù)據(jù)并沒有形成一個統(tǒng)一的定義,然而,通過分析不同概念發(fā)現(xiàn),盡管描述不一,但卻存在著一個共識:大數(shù)據(jù)不是對數(shù)據(jù)量大小的定量描述,而是一種在種類繁多、數(shù)量龐大的多樣數(shù)據(jù)中進(jìn)行的快速信息獲取。[6]1.1大數(shù)據(jù)的特征數(shù)據(jù)其實一直都在,那么又何以成為大數(shù)據(jù)呢?這主要是由大數(shù)據(jù)的4V特征決定的:1.1.1大量(Volume)大數(shù)據(jù)中的數(shù)據(jù)不再以幾個GB或幾個TB來衡量,而是以PB(1千個T)、EB(1百萬個T)或ZB(10億個T)為計量單位。IDC2011年6月報告顯示,全球數(shù)據(jù)量在2011年已達(dá)到1.8ZB,“如果把所有這些數(shù)據(jù)都刻錄存入普通DVD光盤里,光盤的高度將等同于從地球到月球一個半來回,也就是720000英里。相當(dāng)于每位美國人每分鐘寫3條Twitter,而且還要不停地寫2.6976萬年”,此外,IDC還預(yù)測“全球數(shù)據(jù)量大約每兩年翻一番,2015年全球數(shù)據(jù)量將達(dá)到近8ZB,到2020年,全球?qū)⑦_(dá)到35ZB”。[7]1.1.2速度(Velocity)首先,大數(shù)據(jù)往往以高速實時數(shù)據(jù)流的形式動態(tài)產(chǎn)生,具有很強的時效性。2010年,據(jù)英國研究咨詢公司Coda預(yù)測,移動網(wǎng)絡(luò)數(shù)據(jù)流量在未來五年有望增長40倍,用戶上傳的內(nèi)容將爆發(fā)式增長。其次,對大數(shù)據(jù)的處理速度要非???。傳統(tǒng)數(shù)據(jù)倉庫系統(tǒng)、BI應(yīng)用都是批處理方式,但對于大數(shù)據(jù)應(yīng)用,必須進(jìn)行實時數(shù)據(jù)流處理。比如對于災(zāi)難的預(yù)測,需要很快地對發(fā)生的程度、影響的區(qū)域范圍等進(jìn)行量化。1.1.3多樣(Variety)一是數(shù)據(jù)來源多,隨著科技的發(fā)展,大數(shù)據(jù)數(shù)據(jù)來源和承載方式多種多樣,如微博、社交網(wǎng)站、傳感器等,數(shù)據(jù)處于分散狀態(tài)。二是數(shù)據(jù)類型多,包括結(jié)構(gòu)化數(shù)據(jù)(如企業(yè)、行業(yè)內(nèi)數(shù)據(jù))、半結(jié)構(gòu)化數(shù)據(jù)(物聯(lián)網(wǎng)數(shù)據(jù))、非結(jié)構(gòu)化數(shù)據(jù)(互聯(lián)網(wǎng)數(shù)據(jù)),并且據(jù)Gartner預(yù)計,2012年“半結(jié)構(gòu)和非結(jié)構(gòu)化的數(shù)據(jù),諸如文檔、表格、網(wǎng)頁、音頻、圖像和視頻等將占全球網(wǎng)絡(luò)數(shù)據(jù)量的85%左右”[8]。1.1.4價值(Value)由于大量有用與可能沒用的數(shù)據(jù)并存,因此大數(shù)據(jù)可謂是“遍地都是金子,又遍地都是沙子”。一方面,大數(shù)據(jù)的價值密度較低,以視頻監(jiān)控為例,在連續(xù)不斷的監(jiān)控流中,可能僅有一兩秒的影像是有用的數(shù)據(jù)。另一方面,雖然單條數(shù)據(jù)并無多大價值,但龐大的數(shù)據(jù)量則是一座“富礦”,將已有的結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行融合、分析后,將會從中挖掘出極高的價值。1.2大數(shù)據(jù)的認(rèn)識拓展作為一個新興理念與技術(shù),大數(shù)據(jù)吸引了業(yè)界的大量眼球,讓我們驚呼大數(shù)據(jù)時代的到來。然而,大數(shù)據(jù)遠(yuǎn)非如其名稱般簡單,目前仍有很多人對其認(rèn)識與理解存在偏差。基于此種現(xiàn)狀,筆者覺得有必要對相關(guān)模糊問題進(jìn)行闡釋。1.2.1大數(shù)據(jù)一定很大?在大數(shù)據(jù)的認(rèn)識上,很多人存在這么一個誤區(qū):只有幾百TB乃至PB的數(shù)據(jù)才能稱之為大數(shù)據(jù)。事實上,“大數(shù)據(jù)并非總是說有數(shù)百個TB才算得上,根據(jù)實際使用情況,有時候數(shù)百個GB的數(shù)據(jù)也可稱為大數(shù)據(jù),這主要看它的第三個維度,也就是速度或時間維度”[9]。因而可以說,大數(shù)據(jù)不是對數(shù)據(jù)量大小的定量描述,而是在信息爆炸時代如何快速地對數(shù)據(jù)價值進(jìn)行深層挖掘。1.2.2大數(shù)據(jù)越多越好?既然是對數(shù)據(jù)進(jìn)行深入挖掘,那么是不是數(shù)據(jù)量越多越好?事實上,解決一個問題的數(shù)據(jù)規(guī)模有一個閾值。“數(shù)據(jù)少于這個閾值,問題解決不了;達(dá)到這個閾值,就可以解決以前解決不了的大問題;而數(shù)據(jù)規(guī)模超過這個閾值,對解決問題也沒有更多的幫助”。[10]因此,當(dāng)我們在做數(shù)據(jù)分析時,我們的任務(wù)不是去獲取越來越多的數(shù)據(jù),而是對數(shù)據(jù)去冗分類、去粗取精,把大數(shù)據(jù)做成小數(shù)據(jù),只有這樣,我們才能在數(shù)據(jù)之間游刃有余。1.2.3大數(shù)據(jù)主要是一種技術(shù)變革?本質(zhì)而言,大數(shù)據(jù)是信息爆炸時代對數(shù)據(jù)核心價值的再挖掘,其中綜合運用到去冗降噪技術(shù)、語義引擎、可視化分析等,因此被很多專業(yè)人士認(rèn)為是繼云計算、物聯(lián)網(wǎng)之后IT行業(yè)的又一次顛覆性變革。事實上,大數(shù)據(jù)“不僅僅是技術(shù)變革,更實質(zhì)上的是計算機服務(wù)時代的來臨,對數(shù)據(jù)的抽絲剝繭、總結(jié)結(jié)論更體現(xiàn)了計算機行業(yè)正從技術(shù)供應(yīng)型轉(zhuǎn)為服務(wù)供應(yīng)”[11]。2檔案館應(yīng)用大數(shù)據(jù)的SWOT分析SWOT分析法即態(tài)勢分析法,其思路是在分析與研究對象密切相關(guān)的內(nèi)部優(yōu)勢(Strengths)、劣勢(Weaknesses)及外部機會(Opportunities)、威脅(Threats)的基礎(chǔ)上,構(gòu)建SWOT分析矩陣,得出相應(yīng)的結(jié)論,并制定發(fā)展戰(zhàn)略及對策。運用SWOT分析法對檔案館在大數(shù)據(jù)時代的發(fā)展進(jìn)行分析,有利于檔案館認(rèn)清內(nèi)外部形勢,明確發(fā)展方向,從而制定科學(xué)的發(fā)展規(guī)劃。2.1優(yōu)勢(Strength)分析2.1.1資源優(yōu)勢對檔案館而言,其最大的優(yōu)勢在于檔案館所擁有的資源。首先,檔案館的信息資源總量龐大且增長迅速。2008年,全國各級國家檔案館共保存檔案1.93億卷,較上年增加1769萬卷,增幅達(dá)10%[12],而到2011年,各級國家檔案館館藏已達(dá)3.3億卷,到2020年,各級國家檔案館館藏將達(dá)到6億多卷[13]。其次,檔案館的數(shù)據(jù)資源種類繁多。在檔案館的數(shù)據(jù)資源中,既有數(shù)字化的紙質(zhì)檔案、接收進(jìn)館的電子文件、音視頻數(shù)據(jù)庫等,也有用戶利用信息、服務(wù)數(shù)據(jù)等數(shù)據(jù)資源,這些數(shù)據(jù)的格式、特征等形式多樣,而各館之間更是差異明顯,從而形成了大量的異構(gòu)數(shù)據(jù)。再次,檔案館的數(shù)據(jù)資源價值很高。作為國家和社會精心保存的歷史記錄,毫無疑問,檔案這種數(shù)據(jù)資源具有很高的價值。與圖書、網(wǎng)絡(luò)資源等數(shù)據(jù)資源相比,“檔案是一種最真實、最可靠、最具權(quán)威性與憑證性的原生信息資源”[14],這就使得數(shù)據(jù)洪流時代檔案的價值與作用更加凸顯,也必將使之在大數(shù)據(jù)時代占據(jù)重要地位。因此,隨著檔案館資源體系建設(shè)步伐的加快及用戶服務(wù)要求的提高,檔案館在大數(shù)據(jù)時代已經(jīng)具有了一定的大數(shù)據(jù)特征。2.1.2行業(yè)領(lǐng)先首先,各級國家檔案館是集中統(tǒng)一保管黨和國家檔案的科學(xué)文化事業(yè)機構(gòu),是永久保管檔案的基地,是社會各界利用檔案史料的中心。因此,作為一種機構(gòu)性存在與制度性安排,國家檔案館的公益性、服務(wù)性、公平性、永久性等特征,使得檔案館成為人們心目中最系統(tǒng)、最可信賴的數(shù)據(jù)資源庫。大數(shù)據(jù)時代,檔案館維護(hù)和傳承記憶的功能將更加重要,構(gòu)建一個“基于互聯(lián)網(wǎng)的,以檔案數(shù)字資源為主體,以文本、圖片、音頻、視頻等為形式,為中華民族集體記憶的建構(gòu)和傳承提供文獻(xiàn)支撐的‘中國記憶’數(shù)字資源庫”[15]將成為我們新的目標(biāo)與使命。其次,檔案館在數(shù)據(jù)處理上具有豐富的經(jīng)驗。大數(shù)據(jù)浪潮洶涌來襲,絕大部分行業(yè)與部門仍處于起步階段,而檔案館有可能在大數(shù)據(jù)時代引領(lǐng)潮流??疾鞌?shù)據(jù)生命周期,涉及到數(shù)據(jù)生成、數(shù)據(jù)采集、數(shù)據(jù)傳輸、數(shù)據(jù)處理、數(shù)據(jù)分析、數(shù)據(jù)應(yīng)用等階段,而這也恰恰是檔案館熟悉的業(yè)務(wù)范疇,因此檔案館可以通過模擬或借鑒傳統(tǒng)檔案處理的整套業(yè)務(wù)規(guī)范或流程來指導(dǎo)大數(shù)據(jù)的處理,檔案館“對知識規(guī)范性控制的思想和技術(shù)方法恰巧在大數(shù)據(jù)領(lǐng)域有了用武之地”[16]。2.2劣勢(Weaknesses)分析2.2.1認(rèn)識問題作為一個檔案大國,幾千年檔案工作的歷史積淀在我國形成了豐富多彩的檔案文化,也形成了一套獨特的檔案思維模式。大數(shù)據(jù)時代的到來,則強烈地沖擊著人們對檔案及檔案館工作根深蒂固的認(rèn)識。以檔案收集為例,長期以來,我國檔案館的收集工作都是以接收為主,征集為輔。近年來,隨著國家提出建立覆蓋人民群眾的檔案資源體系,檔案館開始收集一部分體制外檔案資源來豐富館藏,然而總的而言,我國的檔案收集工作仍處于一種被動狀態(tài)。大數(shù)據(jù)時代的到來,則要求人們突破以往收集工作認(rèn)識的桎梏,主動收集各種反映國家、社會及公民個人記憶的信息,而無論其內(nèi)容、來源、形式如何。對于檔案館工作人員而言,則有可能出現(xiàn)兩種認(rèn)識問題:一是沒有大數(shù)據(jù)意識,即無視大數(shù)據(jù)時代的來臨,依然循守以前檔案收集工作的老路;二是泛大數(shù)據(jù)化,即不加鑒別,從而使檔案館陷入數(shù)據(jù)沼澤,顯然這也是檔案館無法承受的。因此,大數(shù)據(jù)背景下,科學(xué)認(rèn)識大數(shù)據(jù)的內(nèi)涵,合理地選擇切入點,將是檔案館在大數(shù)據(jù)時代立足的首要問題。2.2.2數(shù)據(jù)異構(gòu)大數(shù)據(jù)時代,數(shù)據(jù)的價值從何而來?涂子沛認(rèn)為,海量是基礎(chǔ),整合是關(guān)鍵。傳統(tǒng)環(huán)境下,我國檔案館也面臨著數(shù)據(jù)異構(gòu)的問題,然而,大數(shù)據(jù)背景下,檔案館的數(shù)據(jù)異構(gòu)呈現(xiàn)出新的特點,即在數(shù)據(jù)類型上由結(jié)構(gòu)化數(shù)據(jù)為主轉(zhuǎn)向結(jié)構(gòu)化、半結(jié)構(gòu)化及非結(jié)構(gòu)化數(shù)據(jù)的三者融合,數(shù)據(jù)產(chǎn)生與利用方式上由服務(wù)器個人電腦等固定終端轉(zhuǎn)向手機、平板電腦、傳感器等移動終端,數(shù)據(jù)存儲方式上由存儲在關(guān)系型數(shù)據(jù)庫轉(zhuǎn)為分布式存儲(如HDFS)。這些變化有可能導(dǎo)致數(shù)據(jù)膨脹、結(jié)構(gòu)紊亂,從而使檔案館在未來的數(shù)據(jù)管理中“失控”。因此如何將這些數(shù)據(jù)庫打通,實現(xiàn)資源與技術(shù)共享,將是大數(shù)據(jù)價值能否最大化的前提,也是檔案館能否適應(yīng)“數(shù)據(jù)化生存”的關(guān)鍵。2.2.3人才瓶頸在我國檔案事業(yè)發(fā)展日新月異的今天,檔案人才隊伍的建設(shè)卻不盡如人意。一是專業(yè)人才的不足。以2006年為例,全國省、自治區(qū)、直轄市各級檔案館中具備博士學(xué)位且畢業(yè)于檔案學(xué)專業(yè)的工作人員為零,具備碩士學(xué)位且畢業(yè)于檔案學(xué)專業(yè)的工作人員只有26人,具備學(xué)士學(xué)位且畢業(yè)于檔案學(xué)專業(yè)的工作人員只有1598人[17]。二是信息技術(shù)人才的匱乏?!按髷?shù)據(jù)泡沫如果現(xiàn)在存在的話,恐怕并非數(shù)據(jù)的作用被過分夸大,而主要是由于真正具備資質(zhì)的數(shù)據(jù)科學(xué)家數(shù)量不足導(dǎo)致的。”[18]據(jù)統(tǒng)計,到2018年,美國將面臨1500000個掌握大數(shù)據(jù)應(yīng)用分析方法的技術(shù)經(jīng)理和分析師的缺口,另外欠缺14萬至19萬具有“深度分析”經(jīng)驗的工作者[19]。從目前來看,大數(shù)據(jù)成功的案例無不是特定的項目,例如“啤酒與尿布”,因此當(dāng)前階段檔案館人員最需要的是懂得用戶的需求,因為數(shù)據(jù)越大,用戶的個性需求就多樣,服務(wù)切口就越小,毫無疑問,這需要檔案人員擁有極強的洞察能力。2.3機會(Opportunity)分析2.3.1需求旺盛隨著信息環(huán)境的變化和公眾檔案意識的覺醒,人們對于檔案信息需求層面不斷加深,需求領(lǐng)域也不斷拓展。首先,精品化的信息需求與專業(yè)化的知識服務(wù)要求。隨著社會檔案意識的增強,“用戶關(guān)注的已不再是簡單的獲取文獻(xiàn),而是如何從繁雜的信息環(huán)境中捕獲和析取解決所面臨問題的信息內(nèi)容,并將這些信息融化或重組為相應(yīng)的知識或解決方案”[20],因此,用戶希望檔案館能夠提供系統(tǒng)化、精品化的信息,提供能夠直接解決用戶實際問題的知識服務(wù)。其次,個性化的信息需求與互動式的信息服務(wù)要求。隨著用戶信息素養(yǎng)的不斷提高,檔案用戶已從信息服務(wù)的“被動接受者”轉(zhuǎn)換為“主動選擇者”,他們更希望獲得一種為自己量身定做的個性化信息服務(wù)。同時,用戶在獲取信息的過程中,希望能與館員進(jìn)行人際交流與相互溝通,從而獲取文化的熏陶、思想的碰撞及心靈的浸潤。[21]事實上,大數(shù)據(jù)之所以能夠引發(fā)共識,成為當(dāng)前熱點,就在于包括檔案在內(nèi)的各行業(yè)及用戶具有了對大數(shù)據(jù)分析和利用的巨大現(xiàn)實需求和具體應(yīng)用需求。2.3.2政策導(dǎo)向隨著經(jīng)濟(jì)的發(fā)展,政府逐漸向服務(wù)型轉(zhuǎn)變,2011年3月,《中華人民共和國國民經(jīng)濟(jì)和社會發(fā)展第十二個五年規(guī)劃綱要》提出“推動經(jīng)濟(jì)社會各領(lǐng)域信息化,強化信息資源的整合、規(guī)范采集和發(fā)布,加強社會化綜合開發(fā)利用”、“增強公共文化產(chǎn)品和服務(wù)供給,建立健全公共文化服務(wù)體系”[22]。2010年6月,國家檔案局《數(shù)字檔案館建設(shè)指南》頒布,提出運用多種技術(shù)手段“采集具有重要保存價值的各類數(shù)字信息,進(jìn)行資源整合”、“對數(shù)字檔案信息進(jìn)行深度挖掘,開展增值服務(wù)”、“開展檔案利用訪問量統(tǒng)計、分布分析、輿情分析等工作”[23]。2012年國家檔案局局長楊冬權(quán)在全國檔案局館長會議上提出,努力建立以服務(wù)為主導(dǎo)的檔案信息化體系,在新的起點上進(jìn)一步推進(jìn)檔案信息化,即從過去以技術(shù)為主導(dǎo)向以服務(wù)為主導(dǎo)轉(zhuǎn)變,從注重應(yīng)用信息技術(shù)向注重檔案內(nèi)容信息化轉(zhuǎn)變,樹立“內(nèi)容為王”的觀念,建設(shè)以服務(wù)為主導(dǎo)的檔案信息化體系。[24]這些政策性文件及講話,將為大數(shù)據(jù)在檔案館中的應(yīng)用帶來更多的政策支持,也為大數(shù)據(jù)時代檔案館的發(fā)展帶來更多機遇。2.4威脅(Threat)分析2.4.1信息安全大數(shù)據(jù)時代,數(shù)據(jù)量之大、數(shù)據(jù)種類之多、對數(shù)據(jù)處理速度與時間之快,都對傳統(tǒng)的檔案館安全體系造成極大沖擊。從基礎(chǔ)技術(shù)角度而言,當(dāng)前檔案館廣泛應(yīng)用的關(guān)系型數(shù)據(jù)庫(SQL)技術(shù),經(jīng)過長期實踐與完善,在維護(hù)數(shù)據(jù)安全方面已經(jīng)設(shè)置了嚴(yán)格的訪問控制和隱私管理工具,而大數(shù)據(jù)依托的基礎(chǔ)技術(shù)是非關(guān)系型數(shù)據(jù)庫(NoSQL),在成熟度和可訪問性方面都不如傳統(tǒng)數(shù)據(jù)庫技術(shù)。從核心價值角度而言,大數(shù)據(jù)的關(guān)鍵在于信息爆炸時代對數(shù)據(jù)價值的再挖掘,然而數(shù)據(jù)分析技術(shù)的發(fā)展,對國家安全及用戶隱私產(chǎn)生了極大威脅。事實上,美國對大數(shù)據(jù)投入巨資,其目的也是為了應(yīng)對軍事和國家安全中的大數(shù)據(jù)挑戰(zhàn),提升維護(hù)國家安全和信息網(wǎng)絡(luò)安全的能力。對于用戶而言,數(shù)據(jù)持有人可以從歷史數(shù)據(jù)中推測判斷出行為人的下一步動作——個人行動軌跡、行為軌跡,甚至思維軌跡。對此,紐約時報曾載文指出,他們(大數(shù)據(jù)持有方)想知道每一毫秒我們在做什么,找出我們的行為模式,比我們自己更了解我們,從我們已經(jīng)忘記的隨意點擊中榨取我們每一分錢。[25]或許這些提法有些危言聳聽,但絕非不可能。2.4.2用戶流失大數(shù)據(jù)時代,檔案館面臨著網(wǎng)絡(luò)、圖書館及信息服務(wù)公司等的競爭,用戶流失是不爭的事實。以網(wǎng)絡(luò)為例,網(wǎng)絡(luò)信息資源的豐富使用戶足不出戶就可以獲取所需的信息,用戶對檔案館的穩(wěn)定性與忠誠度下降,據(jù)統(tǒng)計,超過90%的用戶在查找信息時,會首選搜索引擎,搜索已經(jīng)成為公眾獲取信息的代名詞,[26]以至于有人把大數(shù)據(jù)產(chǎn)業(yè)定義為“建立在對互聯(lián)網(wǎng)物聯(lián)網(wǎng)等渠道廣泛大量數(shù)據(jù)資源收集基礎(chǔ)上的數(shù)據(jù)存儲、價值提煉、智能處理和分發(fā)的信息服務(wù)業(yè)”[27],合理與否姑且不論,但大數(shù)據(jù)時代,網(wǎng)絡(luò)對檔案館的沖擊卻是毋庸置疑。因此,數(shù)字化時代,檔案館如何實現(xiàn)“數(shù)據(jù)化生存”,將是不得不慎重考慮的難題。3大數(shù)據(jù)時代檔案館發(fā)展的戰(zhàn)略選擇根據(jù)上述SWOT矩陣中對大數(shù)據(jù)時代檔案館內(nèi)外部環(huán)境的分析,將各個要素按照重要程度進(jìn)行排列組合,結(jié)合SWOT分析法提供的四種戰(zhàn)略規(guī)劃方式,形成大數(shù)據(jù)時代檔案館的四種發(fā)展戰(zhàn)略。3.1SO戰(zhàn)略——抓住機遇,發(fā)揮優(yōu)勢3.1.1強化資源優(yōu)勢大數(shù)據(jù)時代,檔案館的核心競爭力仍在于其擁有的檔案資源,因此要實現(xiàn)從傳統(tǒng)檔案資源觀向“大檔案觀”轉(zhuǎn)變,盡可能地收集全面數(shù)據(jù)、完整數(shù)據(jù)和綜合數(shù)據(jù),更多地關(guān)注一些底層化、碎片化、復(fù)雜化的信息,從而構(gòu)建一幅反映國家和社會變遷的實時全景圖。例如,美國國會圖書館就認(rèn)為Twitter推文是一種重要的新型館藏資料,對信件、日記、期刊以及其他館藏資源形成了補充,有時甚至可以替代后者,因此對2006年Twitter上線以來發(fā)布的所有內(nèi)容進(jìn)行歸檔,目前已完成對現(xiàn)有1700億條推文的收錄。[28]因此,在進(jìn)一步推進(jìn)館藏紙質(zhì)檔案數(shù)字化、加快電子文件接收進(jìn)館的基礎(chǔ)上,檔案館要有意識地收集一些諸如電子郵件、網(wǎng)頁、社交媒體等價值重大、形式多樣的數(shù)據(jù)資源,從而實現(xiàn)檔案資源的全媒體保存,真正建立覆蓋人民群眾的、滿足長遠(yuǎn)需要的檔案資源體系。2.1.2加快檔案開放大數(shù)據(jù)時代,公民對于“數(shù)據(jù)權(quán)”的要求與檔案館面臨的激烈的數(shù)據(jù)競爭將加快檔案資源開放的進(jìn)程,檔案資源的開放和流動成為必然。數(shù)據(jù)開放的意義,不僅在于保障公民的知情權(quán)、推動政府透明與工作效率的提高,更在于讓大數(shù)據(jù)時代最重要的檔案數(shù)據(jù)可以自由流動起來,由封閉的內(nèi)部資源向公開的社會信息轉(zhuǎn)變,以催生創(chuàng)新,從而建立一個前所未有的開放社會與智慧城市。例如,為了積極地公開政府信息讓市民參與政府各種決策過程,NARA出臺了《開放政府計劃》,通過公民檔案員項目、數(shù)字化戰(zhàn)略、社交媒體戰(zhàn)略、在線公共利用檢索系統(tǒng)(OPA)等舉措,擴(kuò)大檔案開放力度和公眾參與水平[29]。2.1.3創(chuàng)新服務(wù)內(nèi)容“數(shù)據(jù)本身沒有價值,通過數(shù)據(jù)提供服務(wù)才具有真正的價值,換言之,數(shù)據(jù)即服務(wù)”[30],檔案館數(shù)據(jù)資源亦是如此。如何將死檔案變成活資源,從傳統(tǒng)的資源保障獲取到數(shù)據(jù)支持創(chuàng)造,這就需要檔案館不斷創(chuàng)新服務(wù)內(nèi)容??梢灶A(yù)見的是,大數(shù)據(jù)時代,閱覽、咨詢、展覽等傳統(tǒng)服務(wù)將得到調(diào)整,而為社會機構(gòu)如政府、企業(yè)等做一定的數(shù)據(jù)分析服務(wù)、數(shù)據(jù)挖掘服務(wù)將成為大數(shù)據(jù)時代檔案館的常態(tài)服務(wù)內(nèi)容。3.2ST戰(zhàn)略——發(fā)揮優(yōu)勢,化解威脅3.2.1加大宣傳力度大數(shù)據(jù)時代,如何避免檔案信息被海量繁雜信息所湮沒,如何讓更多的人享受檔案館的服務(wù)成果,這都需要檔案部門采取各種措施來加大檔案宣傳力度。具體而言,在宣傳內(nèi)容上,要積極宣傳檔案館的資源體系,重點宣傳檔案館的特色館藏;在宣傳手段上,要注重發(fā)揮新興媒體特別是網(wǎng)絡(luò)媒體的宣傳作用,實現(xiàn)全媒體宣傳;在宣傳對象上,要實現(xiàn)大眾傳播向分眾傳播的轉(zhuǎn)變,提升檔案宣傳效果。3.2.2個性化服務(wù)“大數(shù)據(jù)的產(chǎn)生,使得一切領(lǐng)域都將進(jìn)入一個可量化的時代,重中之重,就是人的行為”[31],隨之而來的,則是檔案館的個性化服務(wù)。與以往點對點的個性化服務(wù)不同,大數(shù)據(jù)背景下的個性化服務(wù)不僅提供用戶所需要的信息,還通過對用戶需求進(jìn)行分析,提供基于海量分布式資源的精細(xì)化知識組織輸出,即實現(xiàn)信息+解決方案的一站式服務(wù)。3.3WO戰(zhàn)略——利用機會,改變劣勢3.3.1促進(jìn)資源整合檔案館啟動大數(shù)據(jù)的一個重要挑戰(zhàn),就是檔案資源的碎片化。目前,許多檔案館的資源都散落在互不連通的數(shù)據(jù)庫中,如何將這些數(shù)據(jù)庫打通,實現(xiàn)資源共享,將是大數(shù)據(jù)價值最大化的關(guān)鍵。從目前來看,利用云計算技術(shù),將全國檔案資源整合,形成一朵“中國檔案云”,或許將有效解決這一問題。3.3.2加強多方合作大數(shù)據(jù)時代,數(shù)據(jù)的多樣性是一種客觀真實的存在,沒有機構(gòu)能夠在大數(shù)據(jù)時代置身之外,也沒有機構(gòu)能夠?qū)崿F(xiàn)對所有數(shù)據(jù)的兼容并包,因此,不同數(shù)據(jù)擁有者之間的合作將非常必要。從范圍上講,這種合作不僅包括檔案系統(tǒng)內(nèi)部的合作,還包括檔案部門與圖書館、博物館及互聯(lián)網(wǎng)運營商之間的合作;從內(nèi)容上講,既包括資源上的共建共享,也包括技術(shù)、人才等方面的合作。3.4WT戰(zhàn)略——克服劣勢,避免威脅3.4.1提升館員素質(zhì)從上古的結(jié)繩記事到今天的數(shù)字化管理,技術(shù)的發(fā)展對檔案館人員提出了越來越高的要求。大數(shù)據(jù)時代,檔案館人員要實現(xiàn)從“一把鎖”到“數(shù)據(jù)科學(xué)家”的轉(zhuǎn)變。對此,繆其浩認(rèn)為,未來的數(shù)據(jù)科學(xué)家應(yīng)具備三大核心技能,“一是具備數(shù)學(xué)知識為數(shù)據(jù)集構(gòu)模,二是具備工程技能建成數(shù)據(jù)模型分析系統(tǒng),三是發(fā)現(xiàn)見解,從數(shù)據(jù)中講出故事來”[32]。3.4.2保障信息安全大數(shù)據(jù)是一把雙刃劍,社會因大數(shù)據(jù)而獲益匪淺,但個人隱私也將無處遁形,因此,大數(shù)據(jù)環(huán)境下,檔案館除了要從技術(shù)上實現(xiàn)反黑客、反病毒、防盜竊等方式來抵御外來入侵者的威脅外,更需要重點加強在信息安全保障體系、信息資源共享制度、機密信息保護(hù)、信息審計等方面的制度建設(shè),從管理上杜絕信息安全風(fēng)險、切實加強個人隱私保護(hù)。[33]通過以上分析,我們可以獲得大數(shù)據(jù)時代我們檔案館發(fā)展的SWOT矩陣,如表1。表1:大數(shù)據(jù)時代檔案館發(fā)展的SWOT矩陣內(nèi)部要素戰(zhàn)略組合外部環(huán)境內(nèi)部優(yōu)勢(Strengths)資源優(yōu)勢行業(yè)領(lǐng)先內(nèi)部劣勢(Weaknesses)認(rèn)識問題數(shù)據(jù)異構(gòu)人才瓶頸外部機會(Opportunities)有利的政策支持旺盛的用戶需求SO戰(zhàn)略強化資源優(yōu)勢加快檔案開放創(chuàng)新服務(wù)內(nèi)容WO戰(zhàn)略促進(jìn)資源整合加強多方合作外部威脅(Threats)信息安全用戶流失ST戰(zhàn)略加大宣傳力度個性化服務(wù)WT戰(zhàn)略提升館員素質(zhì)保障信息安全如果說十年前,我們對“除了上帝,任何人都必須用數(shù)據(jù)來說話”這句美國諺語尚且半信半疑,那么十年后的今天,當(dāng)全球數(shù)據(jù)量出現(xiàn)爆炸式增長時,我們將下意識地驚呼:大數(shù)據(jù)時代已經(jīng)來臨?!按髷?shù)據(jù)正構(gòu)成我們明天的新大陸,從2012年開始,我們將從大陸時代,移民進(jìn)入大數(shù)據(jù)時代”[34]。國際檔案理事會主席馬丁.博倫斯在其就職演說中指出,“一個檔案工作者應(yīng)是首先想到未來的人”。[35]大數(shù)據(jù)時代的到來,強烈地沖擊著檔案館的生存模式與發(fā)展空間,如何避免在數(shù)字化時代被邊緣化,將是檔案館不得不正視的一個問題。歷史不會重演,卻自有其韻律,如果洞悉其中的規(guī)律,那么檔案館的未來,或許就掌握在大數(shù)據(jù)的手中。參考文獻(xiàn)[1][19]Bigdata:Thenextfrontierforinnovation,competition,andproductivity[R/OL].[2013-01-11]./insights/mgi/research/technology_and_innovation/big_data_the_next_frontier_for_innovation.[2]TheNewYorkTimes.TheAgeofBigData[EB/OL].[2013-01-18]./2012/02/12/sunday-review/big-datas-impact-in-the-world.html?pagewanted=all.[3]TheWallStreetJournal.Big-DataSuccessStories:Splunk[EB/OL].[2013-01-18]./venturecapital/2011/10/21/big-data-success-stories-splunk/.[4]TheWhiteHouse.BigDataAcrosstheFederalGovernment[R/OL].[2013-01-11]./sites/default/files/microsites/ostp/big_data_fact_sheet.pdf.[5]單之卉.叩響未來之門——涂子沛解析大數(shù)據(jù)時代的挑戰(zhàn)與應(yīng)對[J].數(shù)據(jù),2012(12):8.[6]韓翠峰.大數(shù)據(jù)帶給圖書館的影響與挑戰(zhàn)[J].圖書與情報,2012(5):38.[7]亓冬,吳洋,彭默馨.直面大數(shù)據(jù)對信息安全的挑戰(zhàn)[J].保密工作,2012(8):48.[8]陳如明.大數(shù)據(jù)時代的挑戰(zhàn)、價值與應(yīng)對策略[J].移動通信,2012(17):14.[9]涂蘭敬.專家觀點:“大數(shù)據(jù)”與“海量數(shù)據(jù)”的區(qū)別[J].網(wǎng)絡(luò)與信息,2011(12):37.[10]李國杰,程學(xué)旗.大數(shù)據(jù)研究:未來科技及經(jīng)濟(jì)社會發(fā)展的重大戰(zhàn)略領(lǐng)域——大數(shù)據(jù)的研究現(xiàn)狀與科學(xué)思考[J].中國科學(xué)院院刊,2012(6):653.[11]孟薇薇.信息爆炸時代的新概念——大數(shù)據(jù)[J].商品與質(zhì)量,2012(9):9.[12]十一五期間全國檔案資源建設(shè)與整理鑒定概況[EB/OL].2013-3-5./Achievement_info.asp?id=270.[13]楊冬權(quán).關(guān)于隨館藏數(shù)量增加而相
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五版家居裝修項目審計保密合同2篇
- 2025年桶裝水品牌形象設(shè)計與廣告宣傳合同3篇
- 2025年度鋁合金門窗智能制造生產(chǎn)線合作合同4篇
- 2025年健身體驗課程合同
- 2025年海釣團(tuán)體船只租賃協(xié)議
- 2025年健康食品配送合同
- 2025年度馬鈴薯種植與農(nóng)業(yè)科技園區(qū)合作開發(fā)合同3篇
- 2025年地下車庫通風(fēng)與照明系統(tǒng)協(xié)議
- 2025年押證不押車汽車抵押貸款擔(dān)保服務(wù)協(xié)議3篇
- 2025年度琉璃工藝品品牌授權(quán)與加盟連鎖經(jīng)營合同3篇
- 人教版高中物理必修一同步課時作業(yè)(全冊)
- 食堂油鍋起火演練方案及流程
- 《呼吸衰竭的治療》
- 有余數(shù)的除法算式300題
- 2024年度醫(yī)患溝通課件
- 2024年中考政治總復(fù)習(xí)初中道德與法治知識點總結(jié)(重點標(biāo)記版)
- 2024年手術(shù)室的應(yīng)急預(yù)案
- 五年級上冊小數(shù)除法豎式計算練習(xí)300題及答案
- 【外資便利店在我國的經(jīng)營策略分析案例:以日本羅森便利店為例11000字(論文)】
- 6061鋁合金退火工藝
- 教師職業(yè)素養(yǎng)與職業(yè)發(fā)展規(guī)劃
評論
0/150
提交評論