下載本文檔
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
收稿日期:2023-12-01作者簡介:王雯霞(1990—
),中國醫(yī)科大學圖書館館員;許丹(1985—
),中國醫(yī)科大學圖書館副研究館員;鞠昕蓉(1996—
),中國醫(yī)科大學圖書館助理館員。*本文系2021年度遼寧省社會科學規(guī)劃基金項目“基于FacultyOpinions最新評分的生物醫(yī)學科技論文多元評價指標體系建立研究”的階段性研究成果之一,項目編號:L21BTQ009。摘
要:文章以中國醫(yī)科大學2020年入學的本科生為樣本對象,運用RFM模型提取特征變量,結合K-means算法將其劃分為三類,構建了借閱觀望型、理性閱讀型、重要發(fā)展型三種類型的用戶畫像,并依據不同類型的用戶畫像提出了相應的服務對策,以期滿足不同類型用戶的需求,提升圖書館服務水平。關鍵詞:用戶畫像;閱讀推薦;個性化服務中圖分類號:G250.7
文獻標識碼:A
文章編號:1003-1588(2024)01-0081-031
相關研究用戶畫像技術最早由交互設計之父AlanCooper提出,首先應用在軟件工程領域,能夠將抽象信息描述成具象實體。在圖書館的各項服務中,用戶畫像技術為參考咨詢服務、視覺搜索服務等業(yè)務提供理論支撐[1,2]。例如,AlShboul等針對雅爾穆克大學的人文學者進行深入分析,利用用戶畫像清晰描繪學者們的信息尋求行為,以便圖書館為其提供更適合和滿意的服務[3];MaoJ等發(fā)現將標簽共現網絡應用于用戶畫像分析既能提供更準確的個性化推薦,又能預測用戶的檢索行為[4]。在閱讀推薦方面,趙巖構建了基于用戶畫像的智慧閱讀推薦系統(tǒng),從理論層面詳細闡述了系統(tǒng)推薦流程[5];李曉敏等從用戶自然屬性、興趣屬性、社交屬性出發(fā),實現基于相似讀者和相似圖書的虛擬圖書推薦[6];解娜結合讀者的位置信息和圖書訪問行為數據為其提供周邊好書推薦服務[7];盛琳涵從讀者、資源、情境等維度構建了閱讀推廣模式[8]。梳理現有研究結果發(fā)現數據支撐下的閱讀推薦服務實證研究較少,筆者以中國醫(yī)科大學圖書館讀者借閱數據為實例,嘗試以用戶畫像理論方法構建不同類別用戶畫像,在此基礎上開展閱讀推薦,以期提高圖書館服務水平。2
理論基礎與數據收集2.1
RFM模型RFM模型最早由ArthurHughes提出,其基本思路是通過近度R、頻度F、值度M三個行為指標劃分不同類型的用戶[9]。為評估圖書受歡迎程度,張海、李杭等將RFM模型指標定義為圖書最近被借閱時間(R)、被借閱次數(F)、被借閱總時間(M)[10,11]。在此基礎上,陳宇奇等引入圖書首次借閱間隔時長(Beginning)指標,構建了BRFM模型[12];樂承毅等將續(xù)借行為也考慮在內,構建了改進版的RFM模型[13]。筆者借鑒上述研究中的RFM模型指標含義,以進一步細分讀者類型為目標,根據讀者借閱行為數據的差異性重新調整了RFM模型的指標含義,即調整后的近度R表示在觀測時期內每位讀者最近一次借閱圖書時間與觀測截止時間的間隔,以天為時間單位;頻度F表示在觀測時期內每位讀者累計借閱圖書的總次數;值度M表示每位讀者借閱圖書間隔天數的平均值。2.2
數據收集與處理本研究的樣本對象是中國醫(yī)科大學2020年入學的本科生,對有近三年圖書借閱記錄的大學生進行深入分析具有一定的可行性和必要性。筆者以1,968位本科生讀者的姓名和學號為檢索點,通過中國醫(yī)科大學圖書館的圖書管理系統(tǒng)獲取其圖書借閱情況,共獲得14,921條相關記錄,數據收集時間為2023年3月2日。利用圖書管理系統(tǒng)采集借閱信息比較繁雜,需要分兩步完成數據處理:第一步是刪除正在借閱的圖書,這部分圖書尚未歸還,無法進一步分析其借閱行為特點。經過數據篩選,共有526本圖書是外借狀態(tài),留存的已歸還圖書借閱記錄為14,395條。第二步是提取特征變量,根據RFM模型的指標含義,累計借書次數(頻度F)能夠通過借書日期和應還日期計算出圖書的借閱間隔天數,而通過不同讀者的借書記錄能夠分析出每位讀者最近一次借閱時間間隔(近度R)和借閱時間間隔平均值(值度M)。3
用戶畫像的構建與展示3.1
特征變量描述聚類分析是基于距離測度將樣本對象按照特征變量進行分類的統(tǒng)計方法,由于距離測度對特征變量有一定的要求,因此在特征變量聚類前需要檢驗其分布狀態(tài)與獨立性。筆者利用SPSS軟件對樣本對象的指標數據進行統(tǒng)計性描述和K-S檢驗,得出近度R和頻度F的標準差分別為18和26.3,值度M具有較大的標準差,數值為35.8,結合指標含義可發(fā)現部分讀者的圖書借閱時間間隔均值為0。同時,顯著性sig均小于0.05,說明近度R、頻度F、值度M三個特征變量都不呈正態(tài)分布。合理的特征變量指標還需具備較低的相關性,以避免同類變量導致的重復計算,從而影響聚類分析的最終結果。本研究采用Spearman相關分析方法,得出頻度F和值度M呈現微弱正相關,相關系數為0.198,近度R與頻度F、值度M的相關系數分別為0.331、0.262,具有一定的獨立性。3.2
樣本對象劃分兩步聚類法根據BIC或AIC等指標自動確定最佳聚類個數,能夠靈活展示不同分組數量的聚類質量[14]。本次分類依次選擇聚類數為3~5,利用SPSS軟件實現兩步聚類并觀測聚類效果:當分組數量高于3時,兩步聚類的聚類質量比“尚好”的標準高一些,約為0.55;當分組數量為3時,聚類質量約為0.65,說明聚類結果可信。筆者據此將1,968名樣本對象劃分為三類,再結合K-means算法對其進一步聚類,聚類結果見表1。表1顯示,群體一頻度F、近度R、值度M的最終聚類中心都為0,人數為587人;群體二頻度F、近度R、值度M的最終聚類中心分別為14、14、29.55,人數最多,共有1,292人;群體三頻度F、近度R、值度M的最終聚類中心分別為6、131、219.35,共有89人,人數最少。3.3
用戶畫像構建1,968位讀者的圖書借閱記錄共有14,395條,根據三類群體的聚類結果進行劃分:群體一借閱圖書0本,群體二借閱圖書13,515本,群體三借閱圖書880本。為進一步區(qū)分群體二和群體三的借閱行為差異性,筆者從索書號中提取圖書分類號,將群體二和群體三按照圖書借閱次數進行排序,排序結果顯示兩類群體前9名的圖書分類號完全相同,能夠體現群體差異的是第10名和第11名,群體二的第10名和第11名是D類、Q類,而群體三的第10名和第11名是Q類和F類。根據所借圖書題名,筆者利用Python分詞工具包制作了兩類群體的圖書詞云圖:群體二的詞云圖中的顯著關鍵詞是系統(tǒng)解剖學、生理學、筆記、圖譜、大學英語、組織學、胚胎學等;群體三的詞云圖中的顯著關鍵詞是學習指導、彩色圖譜、婦產科、病理學、等級考試等。4
用戶畫像描述及閱讀推薦4.1
借閱觀望型群體一的頻度F、近度R、值度M都為0,說明該群體自入校以來就沒有借閱過任何圖書,可將其歸屬為借閱觀望型。借閱觀望型讀者在某種程度上是圖書借閱的潛力軍,圖書館針對他們開展借閱服務大有可為,一方面要針對這一類型讀者的專業(yè)特性進行點對點資源推薦;另一方面要優(yōu)化圖書借閱流程,拓寬讀者薦書渠道,加大館藏資源宣傳推介力度,吸引借閱觀望型讀者的目光,激發(fā)他們的閱讀熱情。4.2
理性閱讀型群體二的近度R為14、值度M為29.55,說明該群體自入校以來平均每個月借閱一次圖書,最近一次借閱時間是在半個月前。群體二的詞云圖顯示了英語四級和習題集等關鍵詞,說明該群體閱讀目的明確,可將其歸屬為理性閱讀型。理性閱讀群體的圖書借閱積極性和活躍度較高,圖書館可為其聚集志同道合的同伴,為他們提供相應的交流討論空間,既可以相同專業(yè)進行聚合,也可依據讀者相似度算法進行聚合[15]。在閱讀推薦方面,圖書館應側重專業(yè)圖書的新書推薦,尤其是各種題集、筆記,為讀者提供獲取最新輔助資料的渠道,同時加強讀者信息素養(yǎng)培養(yǎng),提升其資源查找和獲取能力。4.3
重要發(fā)展型群體三的近度R為131、值度M為219.35,說明該群體自入校以來平均每學期借閱一次圖書,最近一次借閱時間約在4個月前。群體三有過借閱歷史,但活躍度明顯低于群體二,具有發(fā)展?jié)摿?,可以將其歸屬為重要發(fā)展型。重要發(fā)展型群體人數只有89人,該群體詞云圖中的關鍵詞“學習指導”異常明顯
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度行政合同行政主體特權在緊急情況下的適用合同4篇
- 2025版小學操場運動設施更新與維修合同3篇
- 體育會展客戶關系管理考核試卷
- 光纖通信在智能電網故障診斷中的應用考核試卷
- 2025年土地轉讓合同
- 2025版停車場消防設施建設與維護服務合同3篇
- 2025版木工材料研發(fā)與勞務合作合同范本3篇
- 2025年寫作創(chuàng)作分期付款合同
- 2025年加盟代理合約協(xié)議
- 2025年家庭矛盾仲裁協(xié)議
- 油氣行業(yè)人才需求預測-洞察分析
- 《數據采集技術》課件-Scrapy 框架的基本操作
- 2025年河北省單招語文模擬測試二(原卷版)
- 高一化學《活潑的金屬單質-鈉》分層練習含答案解析
- DB34∕T 4010-2021 水利工程外觀質量評定規(guī)程
- 理論力學智慧樹知到期末考試答案章節(jié)答案2024年中國石油大學(華東)
- 2024老年人靜脈血栓栓塞癥防治中國專家共識(完整版)
- 四年級上冊脫式計算100題及答案
- 上海市12校2023-2024學年高考生物一模試卷含解析
- 儲能電站火災應急預案演練
- 人教版(新插圖)二年級下冊數學 第4課時用“進一法”和“去尾法”解決簡單的實際問題 教學課件
評論
0/150
提交評論