下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
摘
要:文章針對當(dāng)前公共圖書館少兒閱讀推薦服務(wù)中存在的問題,研究了基于大數(shù)據(jù)挖掘的公共圖書館少兒閱讀推薦方法,通過對比實(shí)驗(yàn)的方式證明了該方法的優(yōu)越性,即對于少兒和少兒家長偏好度的提升效果更好,且能在滿足少兒閱讀需求的基礎(chǔ)上引導(dǎo)少兒養(yǎng)成良好的閱讀習(xí)慣。關(guān)鍵詞:大數(shù)據(jù)挖掘;公共圖書館;少兒閱讀;推薦方法中圖分類號:G258.2
文獻(xiàn)標(biāo)識碼:A
文章編號:1003-1588(2024)01-0013-03公共圖書館是開展閱讀推廣的重要機(jī)構(gòu),承擔(dān)著培養(yǎng)少兒閱讀習(xí)慣,提升其閱讀能力的重要責(zé)任。在多元化時代背景下,少兒的閱讀環(huán)境發(fā)生了翻天覆地的變化,閱讀資源豐富,少兒的閱讀需求越來越多元化、個性化[1]。與成年人相比,少兒的閱讀能力和理解能力較弱[2],難以閱讀理論性較強(qiáng)或?qū)哟屋^深的圖書。因此,公共圖書館在為少兒讀者推薦閱讀資源的過程中,應(yīng)積極利用大數(shù)據(jù)、云計(jì)算等現(xiàn)代化技術(shù)手段尋找適合其閱讀的資源[3]。大數(shù)據(jù)技術(shù)中的大數(shù)據(jù)挖掘是指利用特定算法深度挖掘隱藏信息,常被應(yīng)用于計(jì)算機(jī)、醫(yī)學(xué)、經(jīng)濟(jì)等領(lǐng)域,成效顯著,但在公共圖書館領(lǐng)域的研究和應(yīng)用案例較少。1
基于大數(shù)據(jù)挖掘的公共圖書館少兒閱讀推薦方法1.1
公共圖書館少兒閱讀資源的獲取與處理為了保障少兒閱讀推薦服務(wù)的質(zhì)量,公共圖書館需確保相關(guān)閱讀資源的數(shù)量和質(zhì)量。在開展少兒閱讀資源建設(shè)的過程中,公共圖書館需要對各類信息資源進(jìn)行清查、轉(zhuǎn)化、集成等處理,為后續(xù)開展數(shù)據(jù)信息的挖掘工作提供優(yōu)質(zhì)信息源,這些信息包括館藏圖書數(shù)據(jù)、讀者信息、圖書借閱數(shù)據(jù)等[4]。其中,館藏圖書數(shù)據(jù)是公共圖書館在日常運(yùn)行過程中必不可少的數(shù)據(jù)信息,圖書數(shù)據(jù)包括書名、作者等一系列圖書屬性信息;讀者信息是少兒閱讀推薦方法必須用到的關(guān)鍵數(shù)據(jù),包括讀者個人信息、讀者借閱情況聚類分析數(shù)據(jù)等[5];圖書借閱數(shù)據(jù)是取自公共圖書館借閱業(yè)務(wù)數(shù)據(jù)庫的數(shù)據(jù)信息,是研究少兒讀者閱讀行為的關(guān)鍵信息。公共圖書館在獲取少兒閱讀資源后,應(yīng)對這些資源進(jìn)行相應(yīng)的預(yù)處理,處理流程如圖1所示。需要注意的是,公共圖書館應(yīng)對相關(guān)數(shù)據(jù)進(jìn)行空值數(shù)據(jù)處置和噪音數(shù)據(jù)過濾等處理,為每一本圖書設(shè)定獨(dú)立的索引,并對讀者信息中的空白項(xiàng)(空值)進(jìn)行補(bǔ)全處理[6]。在該過程中,如果存在無法補(bǔ)全的問題,公共圖書館就需要清除相關(guān)數(shù)據(jù)信息,并及時清除數(shù)據(jù)源中的重復(fù)數(shù)據(jù),以提高大數(shù)據(jù)挖掘效率。在完成數(shù)據(jù)清洗后,公共圖書館應(yīng)將各類數(shù)據(jù)轉(zhuǎn)換為統(tǒng)一的格式[7],并進(jìn)行數(shù)據(jù)集成,生成少兒基礎(chǔ)數(shù)據(jù)表、少兒節(jié)約數(shù)據(jù)表及少兒圖書數(shù)據(jù)表,為大數(shù)據(jù)挖掘奠定數(shù)據(jù)資源基礎(chǔ)。1.2
基于大數(shù)據(jù)挖掘的少兒讀者信息挖掘公共圖書館應(yīng)對少兒讀者的信息進(jìn)行聚類處理與分析,合理劃分少兒閱讀群體,科學(xué)選取符合不同少兒閱讀群體閱讀要求的閱讀資源開展少兒閱讀推薦服務(wù)。公共圖書館可按以下步驟挖掘少兒讀者信息。第一步,設(shè)置聚類個數(shù),對已完成處理的數(shù)據(jù)源進(jìn)行聚類解析,以隨機(jī)的方式獲取少兒讀者閱讀信息,利用K-means算法對數(shù)據(jù)表中的數(shù)據(jù)進(jìn)行聚類和挖掘處理。王鳳燕結(jié)合公共圖書館的讀者借閱數(shù)據(jù)將少兒讀者分為活躍型、普通型及其他類型3類[8],因此筆者將聚類K值設(shè)定為3。在分類過程中,筆者引入歐氏距離計(jì)算公式,計(jì)算不同少兒讀者信息與所屬分類之間的歐式距離,計(jì)算公式為:d(x1,x2)=∑di=1(x1k-x2k)2其中,d(x1,x2)為兩個陳述屬性x1和x2之間的歐氏距離,x1k和x2k為兩個陳述屬性的詳細(xì)選值。公共圖書館根據(jù)該公式計(jì)算得出歐氏距離后,可基于聚類相關(guān)結(jié)構(gòu),重新設(shè)定k個簇,利用誤差平方等對聚類特性進(jìn)行評定。假設(shè)在某一數(shù)據(jù)集中,k個簇的子集分別為各個簇的樣本數(shù)據(jù),則其誤差平方和的計(jì)算公式為:E=∑ki=1‖p-m‖2其中,E為誤差平方和,p為簇的個數(shù),m為各簇樣本數(shù)目。將數(shù)據(jù)集中的所有元素按照新的中心重新完成聚類,若匯總計(jì)算得出的誤差平方和不再發(fā)生明顯變化,則說明已完成聚類和收斂。第二步,在完成對準(zhǔn)則函數(shù)是否收斂的判斷后,將各類少兒讀者信息進(jìn)行分類存儲,并通過可視化的方式進(jìn)行展示。第三步,將少兒讀者聚類挖掘的行為有效值設(shè)定為k,在此過程中,應(yīng)知悉k的有效取值范圍會直接影響對少兒讀者信息聚類的效果。如果k的最終選值較小,則會在聚類后出現(xiàn)簇族覆蓋范圍過大的問題,甚至?xí)霈F(xiàn)聚類結(jié)果價值性信息較少的問題;如果k的最終選值較大,則會在聚類后出現(xiàn)簇族覆蓋范圍過小的問題,導(dǎo)致聚類數(shù)據(jù)分散,無法得到關(guān)聯(lián)性較強(qiáng)的數(shù)值。通常情況下,在初步完成對k的賦值后,必須通過持續(xù)調(diào)節(jié)的方式對k的值進(jìn)行優(yōu)化,得到一個簇間距較小的有效區(qū)間,在該區(qū)間內(nèi)輸出合適的k值。1.3
基于大數(shù)據(jù)挖掘的少兒借閱信息挖掘在完成對少兒讀者信息的挖掘后,公共圖書館應(yīng)利用大數(shù)據(jù)技術(shù)進(jìn)一步挖掘少兒借閱信息,研究少兒讀者的潛在閱讀行為規(guī)律,并通過設(shè)置支持度有效閾值、借閱行為信度等方式,對不同圖書的價值與關(guān)聯(lián)度進(jìn)行分析,具體的信息挖掘步驟如下。第一步,利用公共圖書館歷史數(shù)據(jù)庫中的信息資源建設(shè)少兒借閱信息數(shù)據(jù)庫。在數(shù)據(jù)庫建設(shè)過程中,公共圖書館可將部分圖書借閱記錄作為項(xiàng)數(shù)集合,以分析數(shù)據(jù)庫中信息的關(guān)聯(lián)性。第二步,定義少兒借閱信息行為的支持度S,行為有效置信度C及行為提升潛在空間lift,將這3個參數(shù)作為變量參數(shù),并進(jìn)行關(guān)聯(lián)處理,得到少兒借閱信息挖掘的關(guān)聯(lián)規(guī)則。公共圖書館通過調(diào)整參數(shù)有效范圍的方式,可實(shí)現(xiàn)對挖掘信息中關(guān)聯(lián)值的干擾,并通過迭代的方式,對關(guān)聯(lián)規(guī)則進(jìn)行優(yōu)化。在確認(rèn)各參數(shù)之間具有強(qiáng)關(guān)聯(lián)性后,公共圖書館應(yīng)對lift參數(shù)進(jìn)行調(diào)整,僅保留大于lift值的數(shù)據(jù),并將其作為關(guān)聯(lián)規(guī)則數(shù)值,并對相關(guān)信息進(jìn)行強(qiáng)關(guān)聯(lián)處理,以深入挖掘少兒借閱信息。第三步,在完成對信息的處理后,通過設(shè)置項(xiàng)集的方式,對關(guān)聯(lián)信息進(jìn)行集中展示,由終端技術(shù)人員負(fù)責(zé)對數(shù)據(jù)信息進(jìn)行篩查,手動清除無關(guān)信息,優(yōu)化信息挖掘成果。1.4
公共圖書館少兒閱讀個性化推薦在完成信息挖掘的基礎(chǔ)上,公共圖書館可有效開展少兒閱讀個性化推薦服務(wù),在為少兒讀者推薦優(yōu)質(zhì)閱讀資源的同時,快速檢索并聚類相似度較高的讀者信息群。公共圖書館可收集少兒讀者的個人及檢索數(shù)據(jù),利用大數(shù)據(jù)挖掘結(jié)果構(gòu)建關(guān)聯(lián)模型,精準(zhǔn)地為少兒讀者推薦閱讀資源。2
對比實(shí)驗(yàn)為了驗(yàn)證基于大數(shù)據(jù)挖掘的少兒閱讀推薦方法的效果,筆者分別將該方法與基于信息覓食的少兒閱讀推薦方法應(yīng)用于某公共圖書館的相關(guān)實(shí)踐,對兩種方法的用戶偏好度進(jìn)行對比,用戶偏好度計(jì)算公式為:U={(a1,b1),(a2,b2),…,(a3,b3)}其中,U為少兒閱讀推薦結(jié)果中的用戶偏好度,ai為某一類公共圖書館閱讀資源的評價數(shù)據(jù),bi為某一類閱讀推薦方法的用戶評價指數(shù),i的取值范圍均為1,2,3,……,n。根據(jù)實(shí)際情況,筆者將U的取值范圍設(shè)定為0到1之間,U的值越接近1,說明推薦的圖書越能夠滿足少兒讀者的閱讀需求。由于少兒的認(rèn)知發(fā)育不夠健全,因此,公共圖書館在計(jì)算用戶偏好度的過程中,除考慮少兒讀者的閱讀需求外,還應(yīng)考慮少兒家長的教育需求。表1為筆者針對兩種少兒閱讀推薦方法的用戶偏好度計(jì)算結(jié)果,基于大數(shù)據(jù)挖掘的少兒閱讀推薦方法的用戶偏好度明顯高于基于信息覓食的少兒閱讀推薦方法。3
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 江蘇海事職業(yè)技術(shù)學(xué)院《茶葉審評與檢驗(yàn)實(shí)驗(yàn)》2023-2024學(xué)年第一學(xué)期期末試卷
- 華南理工大學(xué)《金蝶云ERP供應(yīng)鏈管理》2023-2024學(xué)年第一學(xué)期期末試卷
- 湖北交通職業(yè)技術(shù)學(xué)院《地質(zhì)與地貌學(xué)》2023-2024學(xué)年第一學(xué)期期末試卷
- 遵義職業(yè)技術(shù)學(xué)院《工程軟件與程序設(shè)計(jì)》2023-2024學(xué)年第一學(xué)期期末試卷
- 珠海藝術(shù)職業(yè)學(xué)院《建筑師業(yè)務(wù)基礎(chǔ)與實(shí)踐》2023-2024學(xué)年第一學(xué)期期末試卷
- 重慶青年職業(yè)技術(shù)學(xué)院《攝影報(bào)道》2023-2024學(xué)年第一學(xué)期期末試卷
- 浙江同濟(jì)科技職業(yè)學(xué)院《舞臺表演化妝與發(fā)型》2023-2024學(xué)年第一學(xué)期期末試卷
- 重慶安全技術(shù)職業(yè)學(xué)院《模擬電子技術(shù)實(shí)驗(yàn)B》2023-2024學(xué)年第一學(xué)期期末試卷
- 中南財(cái)經(jīng)政法大學(xué)《融媒體與節(jié)目策劃》2023-2024學(xué)年第一學(xué)期期末試卷
- 鄭州亞歐交通職業(yè)學(xué)院《裝配式建筑識圖與實(shí)務(wù)》2023-2024學(xué)年第一學(xué)期期末試卷
- 中考英語688高頻詞大綱詞頻表
- GB/T 2315-2017電力金具標(biāo)稱破壞載荷系列及連接型式尺寸
- 標(biāo)準(zhǔn)工時基礎(chǔ)知識及應(yīng)用 課件
- 咽旁間隙腫瘤課件
- (完整版)中職數(shù)學(xué)習(xí)題及答案
- 高中語文 蘇軾導(dǎo)讀 課件
- 府谷縣恒陽陽建材有限公司-15萬立方米-年混凝土攪拌站項(xiàng)目報(bào)告書
- 水中鋼管樁施工方案
- 上交所期權(quán)投資者綜合試卷考試及答案
- 超市日常工作檢查表
- 電纜熱穩(wěn)定校驗(yàn)計(jì)算書
評論
0/150
提交評論