




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、 大數(shù)據(jù)在圖書(shū)館的應(yīng)用 顏琪媛摘要:應(yīng)用大數(shù)據(jù)技術(shù),可以讓圖書(shū)館在新時(shí)期得到進(jìn)一步地發(fā)展,可以讓信息服務(wù)水平得到提升。本文首先對(duì)大數(shù)據(jù)對(duì)圖書(shū)館帶來(lái)的影響進(jìn)行分析,然后從信息服務(wù)的角度,對(duì)大數(shù)據(jù)在圖書(shū)館中的應(yīng)用特點(diǎn)進(jìn)行闡述,最后結(jié)合實(shí)例,提出幾點(diǎn)大數(shù)據(jù)在圖書(shū)館的應(yīng)用策略。關(guān)鍵詞:大數(shù)據(jù)技術(shù);數(shù)字圖書(shū)館;信息服務(wù)前言:大數(shù)據(jù)是一種較為抽象的概念,主要指的是因?yàn)樽陨砭哂休^大的容量、較快的增長(zhǎng)速度、較為復(fù)雜的關(guān)系而需要新的處理模式才可以讓其決策力得到提升的海量信息資產(chǎn)。其本身具有規(guī)模大、結(jié)構(gòu)多樣、價(jià)值密度低的特點(diǎn),其流程可以概括為數(shù)據(jù)采集、數(shù)據(jù)分析與
2、數(shù)據(jù)解釋三個(gè)環(huán)節(jié)。一、大數(shù)據(jù)對(duì)圖書(shū)館帶來(lái)的影響(一)借助大數(shù)據(jù)建立知識(shí)服務(wù)導(dǎo)航機(jī)制在傳統(tǒng)圖書(shū)館中,讀者在帶有明確目的的情況下,按照類(lèi)別去尋找自己所需的書(shū)籍往往存在很多困難,需要工作人員提供幫助。非但讀者不夠方便,工作人員的工作量也被加大了。借助大數(shù)據(jù)技術(shù),可以建立起良好的知識(shí)服務(wù)導(dǎo)航機(jī)制,可以讓此問(wèn)題得到徹底解決。可以利用移動(dòng)應(yīng)用程序?qū)^內(nèi)地圖和opac進(jìn)行有機(jī)整合,讓讀者在找尋資料時(shí)可以明確位置。(二)借助大數(shù)據(jù)完善新的知識(shí)服務(wù)方式借助大數(shù)據(jù)技術(shù),圖書(shū)館可以完成用戶數(shù)據(jù)信息的分析工作,不但可以明確用戶的信息行為,還能夠?qū)τ脩魸撛谛枨髷?shù)據(jù)予以深度挖掘。讀者的閱讀習(xí)慣、讀者的構(gòu)成部分、讀者的潛在
3、需求以及相關(guān)的借閱數(shù)據(jù)都是極具價(jià)值的信息,通過(guò)對(duì)這些信息的分析,可以對(duì)讀者展開(kāi)針對(duì)性的服務(wù)。如某位讀者經(jīng)常在圖書(shū)館內(nèi)借閱文學(xué)類(lèi)的圖書(shū),那么在其登錄數(shù)字化借閱端口時(shí),就會(huì)出現(xiàn)多種此類(lèi)圖書(shū),起到良好的推薦作用1。(三)大數(shù)據(jù)讓圖書(shū)館數(shù)據(jù)存儲(chǔ)和計(jì)算面臨挑戰(zhàn)在大數(shù)據(jù)時(shí)代,數(shù)據(jù)的數(shù)量與類(lèi)型都在不斷增多,非結(jié)構(gòu)化與結(jié)構(gòu)化的數(shù)據(jù)信息會(huì)隨著用戶的網(wǎng)絡(luò)活動(dòng)而不斷產(chǎn)生,這無(wú)疑會(huì)提高圖書(shū)館數(shù)據(jù)存儲(chǔ)、計(jì)算、分析的要求,存儲(chǔ)能力和運(yùn)算能力的限制會(huì)讓圖書(shū)館數(shù)據(jù)在應(yīng)用過(guò)程中出現(xiàn)困難,讓圖書(shū)館面臨挑戰(zhàn)。二、大數(shù)據(jù)在圖書(shū)館的應(yīng)用特點(diǎn)從信息服務(wù)角度來(lái)看,大數(shù)據(jù)在圖書(shū)館進(jìn)行應(yīng)用的過(guò)程中,服務(wù)對(duì)象、服務(wù)技術(shù)和服務(wù)模式均有所改變?,F(xiàn)階
4、段,智能手機(jī)已然成為了閱讀信息的主要載體,習(xí)慣使用智能手機(jī)的年輕人也隨之成為圖書(shū)館的主要服務(wù)對(duì)象;在服務(wù)技術(shù)方面,利用網(wǎng)絡(luò)化技術(shù)可以對(duì)傳統(tǒng)信息資源予以轉(zhuǎn)化,將其存儲(chǔ)于虛擬空間,對(duì)其進(jìn)行處理的客觀技術(shù)在不斷更新,不斷轉(zhuǎn)變,而技術(shù)的轉(zhuǎn)變帶動(dòng)了圖書(shū)館工作人員的轉(zhuǎn)變,要求工作人員需要掌握更多的服務(wù)技能;在服務(wù)模式方面,大數(shù)據(jù)在圖書(shū)館應(yīng)用之后,可以不用親身到圖書(shū)館就可以完成信息的查找工作,信息服務(wù)模式發(fā)生了極大轉(zhuǎn)變,通過(guò)檢索功能,可以很快查找到所需信息,服務(wù)效率得到極大增強(qiáng)。同時(shí),因?yàn)榫W(wǎng)絡(luò)通信技術(shù)的迅速崛起,如果圖書(shū)館建立起相應(yīng)的app,那么還可以通過(guò)軟件來(lái)為讀者提供個(gè)性化的信息推送服務(wù)2。三、大數(shù)據(jù)在
5、圖書(shū)館的應(yīng)用策略(一)選擇合理的大數(shù)據(jù)處理技術(shù)隨著信息技術(shù)的發(fā)展,數(shù)據(jù)格式漸漸變得豐富多樣,如視頻、音頻都已成為常見(jiàn)格式。在對(duì)圖書(shū)館大量數(shù)據(jù)進(jìn)行存儲(chǔ)時(shí),可以利用聯(lián)網(wǎng)方便、速度很快的硬盤(pán)存儲(chǔ)方式。圖書(shū)館在數(shù)據(jù)處理時(shí),涉及到的信息大部分為結(jié)構(gòu)化數(shù)據(jù)信息,對(duì)有價(jià)值信息進(jìn)行挖掘時(shí)具有很大的難度,圖書(shū)館應(yīng)該對(duì)數(shù)據(jù)處理方式進(jìn)行及時(shí)改變,對(duì)用戶的信息行為、借閱記錄等信息都需要予以深入分析,讓基礎(chǔ)設(shè)施得到改善,讓服務(wù)方案得到提升。就目前來(lái)看,圖書(shū)館可以選擇的數(shù)據(jù)處理方法主要可分為四種,第一種為map reduce技術(shù),這種技術(shù)可以把復(fù)雜的運(yùn)行在大規(guī)模集群上的并行計(jì)算過(guò)程轉(zhuǎn)化為兩個(gè)函數(shù)的映射與簡(jiǎn)化,對(duì)于編程人員
6、來(lái)說(shuō)十分方便,其處理流程可以概括為,編號(hào)代碼、配置作業(yè)、提交作業(yè)、分配和執(zhí)行map任務(wù)、處理中間結(jié)果、分配和執(zhí)行reduce任務(wù);第二種為no only sql數(shù)據(jù)庫(kù),這種數(shù)據(jù)庫(kù)的模型較為簡(jiǎn)單,元數(shù)據(jù)、應(yīng)用數(shù)據(jù)為分開(kāi)狀態(tài),系統(tǒng)管理十分靈活;第三種為hadoop技術(shù),這種技術(shù)具有易用性與開(kāi)源性,其主要模塊分為兩部分,即mapreduce與分布式系統(tǒng),它們是處理核心,使用者能夠通過(guò)hadoop完成計(jì)算機(jī)資源的組織工作,讓分布式計(jì)算平臺(tái)得以搭建;第四種為云計(jì)算技術(shù),無(wú)論是硬件還是軟件都是信息資源,都可以利用互聯(lián)網(wǎng)提供給用戶,同時(shí),它可以讓信息資源結(jié)構(gòu)得到擴(kuò)展,讓動(dòng)態(tài)信息得到更新。(二)解決圖書(shū)館信息
7、資源組織問(wèn)題在應(yīng)用大數(shù)據(jù)技術(shù)的過(guò)程中,信息資源組織面對(duì)的問(wèn)題包含兩個(gè)方面,即信息特征的揭示困難和具體組織對(duì)象的選擇困難。為解決這兩大難點(diǎn),需要著眼于流程設(shè)計(jì)和方法實(shí)施這兩個(gè)方面。1.信息資源組織流程信息人員利用多種信息技術(shù)可以完成分散、雜亂、大量的元數(shù)據(jù)選擇工作,對(duì)信息予以優(yōu)化和處理可以形成一個(gè)整體流程,非結(jié)構(gòu)化數(shù)據(jù)、結(jié)構(gòu)化數(shù)據(jù)與半結(jié)構(gòu)化數(shù)據(jù)是大數(shù)據(jù)的主要來(lái)源,對(duì)半結(jié)構(gòu)化數(shù)據(jù)與結(jié)構(gòu)化數(shù)據(jù)予以存儲(chǔ),對(duì)非結(jié)構(gòu)化數(shù)據(jù)與半結(jié)構(gòu)化數(shù)據(jù)予以流處理,讓并行數(shù)據(jù)庫(kù)和關(guān)系數(shù)據(jù)庫(kù)經(jīng)過(guò)批處理后可以完成數(shù)據(jù)的應(yīng)用工作。2.信息資源組織方法在圖書(shū)館信息資源中,無(wú)論是網(wǎng)絡(luò)信息還是館藏信息都會(huì)在發(fā)展到一定程度后迅速增長(zhǎng),組
8、成大數(shù)據(jù),現(xiàn)階段,數(shù)據(jù)庫(kù)方式、主題樹(shù)方式、超媒體方式與文件方式不能讓信息的收集和分析足夠高效,不能給用戶提供良好的服務(wù)體驗(yàn)。信息資源組織方式中的批處理和流處理可以對(duì)非結(jié)構(gòu)化數(shù)據(jù)產(chǎn)生良好的信息資源組織效果。(三)建立個(gè)性化、智能化的信息檢索系統(tǒng)1.個(gè)性化搜索如前文所說(shuō),在用戶信息收集基礎(chǔ)之上,建立起信息檢索系統(tǒng),用戶信息包含了學(xué)習(xí)信息、個(gè)人信息與行為信息,利用這些信息可以讓圖書(shū)館清楚用戶需求,形成推薦目錄。為實(shí)現(xiàn)個(gè)性化搜索,必須要確保搜索引擎的智能化,根據(jù)用戶輸入的關(guān)鍵詞,按照相關(guān)度、瀏覽數(shù)量等順序來(lái)呈現(xiàn)給用戶,查全率和查準(zhǔn)率都要有所保障。搜索引擎應(yīng)該具有人機(jī)對(duì)話功能和相應(yīng)的分析能力,需要針對(duì)用
9、戶搜索做出快速反應(yīng)。同時(shí),圖書(shū)館需要對(duì)搜索引擎予以定期評(píng)估,建立起以用戶為中心的搜索機(jī)制。endprint2.智能化搜索為實(shí)現(xiàn)智能化搜索,需要做好三方面的工作。首先,圖書(shū)館應(yīng)該在系統(tǒng)搜索引擎中建立起機(jī)器學(xué)習(xí)的功能;其次,圖書(shū)館應(yīng)該利用此功能,讓搜索引擎得到擴(kuò)展,除了文字檢索之外,還可以擴(kuò)展到視頻檢索、圖片檢索等;最后,搜索引擎應(yīng)該具有自動(dòng)更新功能,數(shù)據(jù)數(shù)量與類(lèi)型在不斷增長(zhǎng),搜索引擎對(duì)平臺(tái)中的海量數(shù)據(jù)需要做到實(shí)時(shí)更新,確保結(jié)果的全面與準(zhǔn)確。除此之外,在更新搜索引擎時(shí)應(yīng)該結(jié)合用戶對(duì)信息的進(jìn)行搜索的習(xí)慣。(四)設(shè)計(jì)圖書(shū)館公共數(shù)據(jù)庫(kù)1.設(shè)計(jì)圖書(shū)館公共數(shù)據(jù)庫(kù)的重要性圖書(shū)館資料建設(shè)分為三個(gè)階段,第一階段為
10、藏書(shū)建設(shè),第二階段為文獻(xiàn)資源建設(shè),第三階段為圖書(shū)館信息資源建設(shè)。完善圖書(shū)館公共數(shù)據(jù)庫(kù)是第三階段的主要內(nèi)容,公共資源建設(shè)包含三個(gè)方面,搜集制作資源、管理組織資源和資源服務(wù)體系,利用大數(shù)據(jù)技術(shù)可以完成資源的搜索、存儲(chǔ)與篩選工作,可以讓讀者需要得到滿足,并擴(kuò)大圖書(shū)館自身的發(fā)展范圍。2.設(shè)計(jì)圖書(shū)館公共數(shù)據(jù)庫(kù)的方法以我國(guó)沈陽(yáng)市圖書(shū)館為例,在公共數(shù)據(jù)庫(kù)結(jié)構(gòu)功能設(shè)計(jì)中其主線為使用者,e-r模型圖如圖1所示。如圖1所示,通過(guò)網(wǎng)絡(luò)信息采集器,圖書(shū)管理員可以完成社交網(wǎng)、公共信息網(wǎng)等方面的信息采集工作,讓其在公共數(shù)據(jù)庫(kù)中得到儲(chǔ)存。而在用戶登錄模塊,圖書(shū)管理員在輸入密碼與用戶名之后,可以進(jìn)入后臺(tái)管理界面,在此界面,可
11、操作項(xiàng)包含了期刊管理、典藏管理等內(nèi)容。而在讀者檢索界面,可以進(jìn)行圖書(shū)檢索、期刊檢索、模糊檢索和類(lèi)別檢索。在公共數(shù)據(jù)庫(kù)管理框架的設(shè)計(jì)上,可分成三個(gè)步驟進(jìn)行,首先需要使用網(wǎng)絡(luò)數(shù)據(jù)采集工具完成資源信息的采集工作,然后需要對(duì)采集的信息進(jìn)行儲(chǔ)存和組織,最后需要對(duì)信息資源進(jìn)行分析,結(jié)合當(dāng)前情況,資源信息分析出現(xiàn)在移動(dòng)終端設(shè)備與互聯(lián)網(wǎng)設(shè)備的情況較多。在網(wǎng)絡(luò)平臺(tái)公共信息數(shù)據(jù)存儲(chǔ)時(shí),把組織之后的信息數(shù)據(jù)以列式存儲(chǔ)的方法存放在hbase數(shù)據(jù)庫(kù)里,一個(gè)存儲(chǔ)列對(duì)應(yīng)一個(gè)頁(yè)鏈接。(五)提高圖書(shū)館信息服務(wù)水平1.學(xué)科知識(shí)服務(wù)為提高圖書(shū)館信息服務(wù)水平,需要加強(qiáng)學(xué)科知識(shí)服務(wù)水平,需要為用戶提供具有個(gè)性化、科學(xué)化的圖書(shū)信息。無(wú)論
12、是高校圖書(shū)館還是公共圖書(shū)館,這種學(xué)科知識(shí)服務(wù)都是必要的。在大數(shù)據(jù)的應(yīng)用過(guò)程中,圖書(shū)館的信息服務(wù)內(nèi)容會(huì)產(chǎn)生變化,信息服務(wù)模式也會(huì)隨之變化,學(xué)科知識(shí)在迅速增長(zhǎng),在不斷更新,已然組成了學(xué)科生態(tài)系統(tǒng),在此基礎(chǔ)上,對(duì)這些數(shù)據(jù)信息進(jìn)行采集與分析,利用處理工具與相關(guān)技術(shù)可以讓數(shù)據(jù)的潛在價(jià)值被挖掘出來(lái),以學(xué)科為基礎(chǔ),分析專(zhuān)業(yè)信息資源的檢索系統(tǒng)中的瀏覽下載頻率,可以找出不同時(shí)間段內(nèi)用戶的興趣點(diǎn),對(duì)數(shù)據(jù)信息進(jìn)行統(tǒng)計(jì)和挖掘可以找到圖書(shū)、用戶與信息資源之間的網(wǎng)絡(luò)結(jié)構(gòu),進(jìn)而完成網(wǎng)絡(luò)的構(gòu)建工作。2.一站式資源服務(wù)在圖書(shū)館中應(yīng)用大數(shù)據(jù)技術(shù),需要提供給用戶一站式資源服務(wù)。在當(dāng)前環(huán)境下,數(shù)字化的信息資源十分龐大,數(shù)據(jù)的類(lèi)型繁多
13、且結(jié)構(gòu)相對(duì)復(fù)雜。在圖書(shū)館中,信息資源包含了兩個(gè)方面,即虛擬館藏資源與現(xiàn)實(shí)館藏資源。虛擬館藏資源包括了在線出版物、網(wǎng)絡(luò)數(shù)據(jù)庫(kù)和網(wǎng)絡(luò)動(dòng)態(tài)信息,利用hadoop、map reduce、云計(jì)算等技術(shù)可以讓用戶在復(fù)雜的數(shù)據(jù)中快速找到所需信息,將多種信息資源予以開(kāi)放式存儲(chǔ),可以讓用戶成為信息的主動(dòng)發(fā)布者。同時(shí),圖書(shū)館在數(shù)據(jù)信息整合的時(shí)候應(yīng)該對(duì)重復(fù)數(shù)據(jù)予以去除,讓數(shù)據(jù)的可依賴(lài)性更高,利用大數(shù)據(jù)智能化檢索技術(shù)可以完成一站式資源服務(wù)的提供工作。3.信息可視化服務(wù)信息可視化程度和用戶面對(duì)信息的直觀性是緊密相關(guān)的。在大數(shù)據(jù)中,包含了大量信息,且這些信息的價(jià)值密度點(diǎn)不是很高,結(jié)合大數(shù)據(jù)分析技術(shù)可以將有價(jià)值信息予以找出
14、,然后利用可視化技術(shù)(如歷史流、標(biāo)簽云、空間信息)可以將此信息變得更為直觀。讓用戶的檢索、評(píng)價(jià)速度提升,進(jìn)而使得圖書(shū)館對(duì)自身系統(tǒng)進(jìn)行優(yōu)化。同時(shí),信息可視化技術(shù)可以與學(xué)科計(jì)量學(xué)方法相結(jié)合,生成學(xué)科知識(shí)地圖,讓作者、學(xué)科以及著作之間的關(guān)系得到直觀表現(xiàn),讓學(xué)科知識(shí)的結(jié)構(gòu)得到闡述,讓各個(gè)領(lǐng)域的發(fā)展動(dòng)態(tài)得到反映。以上海市圖書(shū)館為例,該圖書(shū)館在應(yīng)用大數(shù)據(jù)過(guò)程這能夠推出了手機(jī)app,且使用了ibeacon技術(shù),這種技術(shù)能夠?qū)⒍S碼、位置定位等移動(dòng)手段和圖書(shū)館的服務(wù)結(jié)合,在借紙質(zhì)圖書(shū)時(shí),利用手機(jī)app還可以幫助讀者快速找到圖書(shū)所在位置,而在查詢圖書(shū)時(shí),無(wú)論讀者身在何處,都可以對(duì)其進(jìn)行查看。4.智慧服務(wù)在知識(shí)服務(wù)的基礎(chǔ)上,對(duì)其進(jìn)行升華和創(chuàng)新可以形成智慧服務(wù)。瀏覽信息時(shí)產(chǎn)生的日志,借還書(shū)產(chǎn)生的數(shù)據(jù),書(shū)目查詢時(shí)產(chǎn)生的檢索目錄共同形成了用戶的信息來(lái)源,在數(shù)字圖書(shū)館中應(yīng)用大數(shù)據(jù)的挖掘技術(shù),可以讓用戶對(duì)信息服務(wù)的滿意度得到提升,針對(duì)用戶的實(shí)際需求,可以為用戶提供具有主動(dòng)性的定制化服務(wù)。以汕頭市圖書(shū)館為例,汕頭市圖書(shū)館在2017年6月份正式啟動(dòng)了大數(shù)據(jù)服務(wù)平臺(tái),并將圖書(shū)館入門(mén)處的智慧墻與之連接,智慧墻中顯示了每個(gè)小時(shí)的圖書(shū)館人次,圖書(shū)館的借還量、圖書(shū)借閱榜單以及新書(shū)的推薦等,就目前來(lái)看,在排行榜上,“東野圭吾”、“我的前半生”為熱門(mén)檢索詞,實(shí)現(xiàn)了智慧服務(wù)的目標(biāo)。結(jié)論:綜上所述,通過(guò)選擇合理的大
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 抹灰班勞務(wù)承包合同
- 房屋多人股權(quán)轉(zhuǎn)讓協(xié)議
- 自建房樓板加固施工方案
- 《高品質(zhì)住宅建設(shè)標(biāo)準(zhǔn)》編制說(shuō)明
- 五系專(zhuān)車(chē)專(zhuān)用后杠施工方案
- 鋁合金桁架腳手架施工方案
- 對(duì)開(kāi)原地區(qū)玉米螟發(fā)生原因及綠色防控對(duì)策的研究分析
- 湖北省宜昌市興山縣一中2024-2025學(xué)年高三下學(xué)期入學(xué)檢測(cè)語(yǔ)文試題(原卷版+解析版)
- 碳排放交易與碳市場(chǎng)機(jī)制的策略及實(shí)施路徑
- 醫(yī)院財(cái)務(wù)知識(shí)培訓(xùn)
- 綠植花卉租賃合同
- 2025年內(nèi)蒙古建筑職業(yè)技術(shù)學(xué)院?jiǎn)握新殬I(yè)適應(yīng)性測(cè)試題庫(kù)及答案1套
- 電子教案-《3D打印技術(shù)概論》
- JBT 11699-2013 高處作業(yè)吊籃安裝、拆卸、使用技術(shù)規(guī)程
- 2024年全國(guó)版圖知識(shí)競(jìng)賽(小學(xué)組)考試題庫(kù)大全(含答案)
- 2024年北京控股集團(tuán)有限公司招聘筆試參考題庫(kù)含答案解析
- DB32T 4353-2022 房屋建筑和市政基礎(chǔ)設(shè)施工程檔案資料管理規(guī)程
- MT_T 1175-2019 輸送瓦斯用鋼管_(高清版)
- 電子商務(wù)基礎(chǔ)與實(shí)務(wù)PPT課件
評(píng)論
0/150
提交評(píng)論