數(shù)字挖掘技術(shù)在圖書(shū)館中的應(yīng)用_第1頁(yè)
數(shù)字挖掘技術(shù)在圖書(shū)館中的應(yīng)用_第2頁(yè)
數(shù)字挖掘技術(shù)在圖書(shū)館中的應(yīng)用_第3頁(yè)
數(shù)字挖掘技術(shù)在圖書(shū)館中的應(yīng)用_第4頁(yè)
免費(fèi)預(yù)覽已結(jié)束,剩余1頁(yè)可下載查看

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、    數(shù)字挖掘技術(shù)在圖書(shū)館中的應(yīng)用    鄭曉川摘 要在數(shù)字信息時(shí)代,一個(gè)人要想完全不泄露個(gè)人信息是不可能的,而我們利用數(shù)據(jù)挖掘技術(shù)獲取這些信息并進(jìn)行分類(lèi)整理和分析,就能為各領(lǐng)域的工作謀取相關(guān)的利益。本文僅從現(xiàn)代圖書(shū)館的建設(shè)出發(fā),詳細(xì)闡述數(shù)據(jù)挖掘技術(shù)在圖書(shū)館用戶資源管理、書(shū)籍采購(gòu)及擺放、個(gè)性化推薦服務(wù)三方面的應(yīng)用,希望圖書(shū)館能在數(shù)據(jù)挖掘技術(shù)的輔助下吸引更多的讀者,為讀者提供更貼心、更優(yōu)質(zhì)的服務(wù)。【關(guān)鍵詞】圖書(shū)館 暑假挖掘技術(shù) 應(yīng)用 管理1 發(fā)現(xiàn)并管理用戶資源用戶數(shù)據(jù)按數(shù)據(jù)類(lèi)型可大致分為用戶描述類(lèi)數(shù)據(jù)、用戶行為類(lèi)數(shù)據(jù)、用戶需求類(lèi)數(shù)據(jù)和用戶反饋類(lèi)數(shù)據(jù)四個(gè)大

2、類(lèi),隨著數(shù)字圖書(shū)館的不斷發(fā)展,圖書(shū)館在獲取用戶數(shù)據(jù)的渠道、速度、數(shù)量等方面也在不斷優(yōu)化,既可以通過(guò)傳統(tǒng)方式獲取,也可以通過(guò)現(xiàn)代化的方式即數(shù)據(jù)挖掘技術(shù)獲得。在數(shù)字圖書(shū)館服務(wù)過(guò)程中獲取用戶進(jìn)入圖書(shū)館借書(shū)都會(huì)辦理借閱卡,卡上除了有用戶的基本信息如姓名、聯(lián)系方式、借閱等級(jí)以外,還記錄了他們?cè)诔挚ㄆ陂g所借閱書(shū)籍的名稱、編號(hào)、分類(lèi)、借閱時(shí)長(zhǎng)等。另外,現(xiàn)在的圖書(shū)館都配有電子檢索儀器,借閱者在檢索過(guò)程中所輸入的關(guān)鍵字也透露著他們的閱讀偏好,是一個(gè)有用的信息。但是搜索很多時(shí)候是匿名的,所以我們可以靈活地利用ip地址來(lái)代替讀者標(biāo)識(shí),統(tǒng)計(jì)每臺(tái)機(jī)器在相應(yīng)檢索時(shí)間內(nèi)各檢索字段的條數(shù)。所以在利用數(shù)據(jù)挖掘技術(shù)進(jìn)行用戶信息挖

3、掘和管理的時(shí)候,我們主要要做的工作就是將每一個(gè)用戶的基本信息與其所借閱的書(shū)目信息及檢索歷史一一匹配, 編輯入庫(kù)、定時(shí)更新。之后再將這一個(gè)個(gè)的信息聚合,做好詳細(xì)的分類(lèi),構(gòu)建起一個(gè)專門(mén)的用戶數(shù)據(jù)管理庫(kù)。針對(duì)數(shù)據(jù)庫(kù)中的用戶數(shù)據(jù),采用簡(jiǎn)單關(guān)聯(lián)、時(shí)序關(guān)聯(lián)、因果關(guān)聯(lián)等關(guān)聯(lián)分析與序列規(guī)則等數(shù)據(jù)分析與挖掘方法,對(duì)圖書(shū)館用戶特征進(jìn)行多維特征分析,挖掘用戶的隱性信息需求,從而為下文中將要談到的圖書(shū)采購(gòu)、藏館布局、個(gè)性化推薦服務(wù)打好基礎(chǔ)。2 優(yōu)化圖書(shū)館藏書(shū)和布局圖書(shū)館的藏書(shū)可分為過(guò)往藏書(shū)和近期藏書(shū),過(guò)往藏書(shū)的數(shù)量一般是近期藏書(shū)的數(shù)倍,占用的空間的大得多。但是根據(jù)借閱情況來(lái)看,過(guò)往藏書(shū)的借閱量遠(yuǎn)不如近期藏書(shū),查找起來(lái)

4、也相對(duì)費(fèi)時(shí)費(fèi)力。但即使是在近期藏書(shū)中,也存在著熱門(mén)書(shū)刊和冷門(mén)書(shū)刊之分,圖書(shū)館每年的書(shū)刊購(gòu)置費(fèi)都是十分有限的,若盲目購(gòu)置則會(huì)造成資金的浪費(fèi)和書(shū)刊的閑置,資源得不到有效利用。傳統(tǒng)的圖書(shū)館在采購(gòu)時(shí)大多通過(guò)出版社、書(shū)店等渠道來(lái)了解新書(shū)書(shū)目和銷(xiāo)售情況,卻沒(méi)有實(shí)際針對(duì)本圖書(shū)館所面向的客戶群做一個(gè)專門(mén)的分析,采購(gòu)的意見(jiàn)也多由館長(zhǎng)或個(gè)別專家來(lái)決定,不可避免地帶有強(qiáng)烈的個(gè)人意志。而利用數(shù)據(jù)挖掘技術(shù),我們可以對(duì)網(wǎng)絡(luò)上無(wú)序的、非結(jié)構(gòu)的數(shù)據(jù)進(jìn)行采集和分類(lèi),通過(guò)搜索量及輿論對(duì)新書(shū)的受歡迎程度做一個(gè)預(yù)計(jì),同時(shí)根據(jù)本館借閱者的借閱偏好整理出他們所喜愛(ài)的圖書(shū)分類(lèi),加大該類(lèi)目書(shū)刊的采購(gòu)比例,利用有限的經(jīng)費(fèi)科學(xué)采購(gòu)。除此之外,時(shí)

5、間也會(huì)對(duì)讀者的借閱行為產(chǎn)生一定的導(dǎo)向性,比如在奧運(yùn)會(huì)期間,運(yùn)動(dòng)、世界史、旅游等方面的書(shū)的借閱量就明顯上升,各類(lèi)考試的前期,其相關(guān)的輔導(dǎo)書(shū)刊的借閱量也會(huì)隨著開(kāi)考時(shí)間的臨近而逐漸上升,所以圖書(shū)館在采購(gòu)時(shí)要綜合各方信息、充分考量,使經(jīng)費(fèi)最大程度發(fā)揮效益另一方面,為方便讀者查找書(shū)目、快速完成借閱,圖書(shū)館還可而利用數(shù)據(jù)挖掘技術(shù)對(duì)圖書(shū)館的借閱流通記錄、檢索請(qǐng)求、分類(lèi)統(tǒng)計(jì)、文獻(xiàn)拒借集、頻繁借閱集、借閱時(shí)長(zhǎng)、歸還時(shí)間等數(shù)據(jù)進(jìn)行分析,得到同一類(lèi)目下書(shū)籍被借閱頻率的高低并進(jìn)行排序。那么我們就可以據(jù)此重新安排圖書(shū)館的書(shū)架布局,將借閱量大、借閱頻率高的書(shū)籍放在顯眼位置、靠近出入口的地方,這樣不僅能節(jié)省借閱者的查找時(shí)間

6、,也能減輕圖書(shū)管理員的上下架強(qiáng)度, 一舉兩得。3 為讀者提供個(gè)性化的推薦服務(wù)在圖書(shū)館巨大館藏中,讀者感興趣的書(shū)目只有很小的一部分,雖然現(xiàn)代圖書(shū)館提供的檢索服務(wù)能夠幫助讀者在輸入關(guān)鍵詞后在查詢結(jié)果瀏覽到相關(guān)書(shū)目的信息,引發(fā)他們對(duì)其他書(shū)刊的興趣,臨時(shí)增加借閱量。但這行為的發(fā)生取決于借閱者的主動(dòng)檢索,圖書(shū)館對(duì)其行為的導(dǎo)向幾乎不存在,處境十分被動(dòng)。而圖書(shū)推薦服務(wù)就是為彌補(bǔ)這一局限性而采取的主動(dòng)向讀者提供信息的方式,它降低了對(duì)讀者的要求,同時(shí)提供了更豐富的信息。圖書(shū)推薦服務(wù)是現(xiàn)代圖書(shū)館個(gè)性化信息服務(wù)中的一種,它旨在為讀者推薦他可能會(huì)感興趣的書(shū)目,以增加額外的借閱量,同時(shí)也可以起到引導(dǎo)讀者關(guān)注某一領(lǐng)域發(fā)展

7、的作用,如在人民代表大會(huì)期間,圖書(shū)館就可為讀者推薦與革命歷史、政治制度、名人自傳等相關(guān)的圖書(shū),與這一特殊的時(shí)間點(diǎn)相結(jié)合就有可能激發(fā)讀者本沒(méi)有的閱讀欲望,從而提高某類(lèi)圖書(shū)的借閱量,增加活躍度。為了提供個(gè)性化推薦服務(wù),我們可以通過(guò)對(duì)借閱記錄中讀者信息和書(shū)籍信息的關(guān)聯(lián)分析,找出讀者的閱讀偏好和借閱習(xí)慣,獲取“不同類(lèi)型的讀者喜歡哪類(lèi)書(shū)籍”,進(jìn)而建立模型并提供推薦服務(wù),向讀者推薦相關(guān)的專題信息。但需要注意的是,越新的借閱記錄指導(dǎo)意義越大,因此我們可以在借閱記錄中加入權(quán)重,將權(quán)重定于為事務(wù)發(fā)生時(shí)間的函數(shù),設(shè)定當(dāng)前時(shí)間的借閱記錄的權(quán)重為1,越早的記錄權(quán)重越低,使得最近的記錄在挖掘中提供最多的知識(shí)。同時(shí),我們還可以通過(guò)分類(lèi)分析的方法,獲取各類(lèi)讀者的特征,挖掘圖書(shū)館的潛在讀者,先免費(fèi)為他們提供感興趣的信息或解決問(wèn)題的知識(shí),將其逐漸發(fā)展為穩(wěn)定讀者。4 結(jié)語(yǔ)圖書(shū)館承擔(dān)著為讀者提供閱讀材料的重要角色,是書(shū)刊儲(chǔ)藏的重要場(chǎng)所,但是在信息經(jīng)濟(jì)時(shí)代如何為讀者提供他們所真正需要的閱讀材料,吸引更多的借閱者來(lái)到圖書(shū)館,是圖書(shū)館管理者需要思考的問(wèn)題。在數(shù)據(jù)挖掘技術(shù)的幫助下,圖書(shū)館對(duì)用戶信息的采集和整理變得簡(jiǎn)單,這對(duì)圖書(shū)館采集經(jīng)費(fèi)的合理化使用和館藏布局的優(yōu)化有都很大幫助,將推動(dòng)圖書(shū)館業(yè)務(wù)與管理的全面進(jìn)步。參考文獻(xiàn)1

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論