基于個性化的協(xié)同過濾圖書推薦算法研究_第1頁
基于個性化的協(xié)同過濾圖書推薦算法研究_第2頁
基于個性化的協(xié)同過濾圖書推薦算法研究_第3頁
基于個性化的協(xié)同過濾圖書推薦算法研究_第4頁
基于個性化的協(xié)同過濾圖書推薦算法研究_第5頁
已閱讀5頁,還剩3頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、 基于個性化的協(xié)同過濾圖書推薦算法研究 黃瑛+楊維偉Summary:近年來,隨著國家對教育的重視,圖書館圖書呈線性增長,借閱者很難從海量的圖書資源中選取有用的信息?;趥€性化的協(xié)同過濾推薦算法有效地解決了這個問題,為了提高推薦的準(zhǔn)確度,引入相似度影響因子,充分考慮不同因素對推薦結(jié)果影響力的大小。Key:推薦系統(tǒng);系統(tǒng)過濾;用戶相似性;影響因子:TP311 :A :1009-3044(2016)28-0088-021 背景協(xié)同過濾算法給我們的生活帶來了極大的便利,特別是當(dāng)我們在網(wǎng)上購物時,網(wǎng)站總是能推送我們需要的商品,簡化了購物過程,方便了我們的生活。協(xié)同過濾算法可以根據(jù)用戶偏好和其他特征為用戶

2、推薦相似物品,面對海量的圖書館圖書資源,如果可以將協(xié)同推薦算法用于圖書館圖書推薦,將能極大地方便學(xué)生的學(xué)習(xí)生活。2 相關(guān)工作以前圖書館推薦算法直接依據(jù)圖書評分數(shù)據(jù),按評分高低向用戶進行推薦,沒有考慮到用戶的偏好和需求。隨著技術(shù)的發(fā)展,圖書推薦算法也得到了改進,目前常用的圖書館推薦算法大致分為三種:1)基于內(nèi)容的推薦算法:該算法的基本思想是根據(jù)用戶的借閱歷史記錄,分析借閱書籍,提取用戶標(biāo)簽數(shù)據(jù),然后將用戶標(biāo)簽和圖書標(biāo)簽進行匹配,觀察匹配程度,選取前N本圖書,生成圖書推薦列表。2)協(xié)同過濾推薦算法:該算法在基于內(nèi)容的推薦算法上進一步改進,加入相似度概念,考慮有著相似興趣愛好的讀者對用戶的影響。我們

3、需要計算用戶相似度,找到與該用戶最相似的top-N用戶,然后分析用戶對這些相似用戶已借閱讀書的感興趣程度,得到圖書推薦列表。目前有三種常用方法用于計算用戶之間的關(guān)聯(lián)度。歐幾里得距離法:將用戶對讀書的評分轉(zhuǎn)換成向量的形式,由此我們得到一個n維的評分向量,利用歐幾里得公式計算兩個向量之間的距離,距離值越小相似度越高,歐氏公式為:余弦相似性:將用戶評分看成一個n維的向量,利用余弦公式計算兩個用戶向量夾角余弦值,值越大兩個用戶就越相似,余弦公式為:相關(guān)相似性:利用Pearson相關(guān)系數(shù)計算兩個讀者之間的相似程度。3)基于用戶個性化協(xié)同過濾推薦算法:根據(jù)高校的實際情況和需求,應(yīng)運而生了一種基于用戶背景的

4、個性化推薦方法。一般情況下,用戶多會借閱本專業(yè)的相關(guān)書籍,所以在進行推薦的過程中可以重點考慮相關(guān)專業(yè)同學(xué)的借閱記錄,將他們借閱過的書籍進行重點推薦。3 基于個性化的協(xié)同過濾推薦算法3.1 圖書初始評分每天圖書館會有大量的新書上線,這些新書由于之前沒有人借閱,需要為這些圖書人為的劃分類別和設(shè)置評分初值,根據(jù)中圖法可以將圖書劃分成不同的22個大類。3.2 計算用戶對每一類別圖書的偏好根據(jù)用戶的借閱歷史和歷史評分,結(jié)合之前的圖書分類數(shù)據(jù),計算用戶對一類書籍的總評分。用戶借閱不同類別書籍的數(shù)量不同,可以反映用戶對某類書籍的喜愛程度,為此我們?yōu)橛脩粢言u價類別賦予不同的權(quán)重值:。為某類別圖書借閱統(tǒng)計次數(shù),

5、為所有借閱圖書的總次數(shù)。由此我們可以計算出用戶對該類圖書的評分,評分公式為:表示讀者a對類別書籍的評分,i屬于類別的圖書,是用戶對類別圖書的總評分。3.3 根據(jù)用戶偏好,計算用戶相似度上一步我們得到了用戶對圖書類別的評分,根據(jù)這個評分,使用皮爾遜相關(guān)系數(shù)算法計算用戶之間的相似度,找出用戶的近鄰集合U。皮爾遜相關(guān)性公式為:M為用戶a和b的共同評分項,和分別為用戶a和用戶b的平均評分,利用圖書類別計算用戶間的相似度可以大大減少計算量。根據(jù)上式我們得到用戶之間的相似度,依據(jù)相似度大小進行排序,選取前N個用戶作為用戶a的鄰居集合U。3.4 預(yù)測用戶對其他書籍的評分產(chǎn)生推薦我們根據(jù)用戶的近鄰集U可以產(chǎn)生

6、圖書推薦列表,為了使推薦列表更準(zhǔn)確,我們引入讀者相似度的影響因子??紤]到實際情況,影響因子的主要有用戶專業(yè)、職位和以往評分準(zhǔn)確度這三個方面。1)專業(yè):眾所周知,相同專業(yè)的學(xué)生對書的需求是相似的,所有相同專業(yè)學(xué)生的借閱書籍對推薦影響較大(),影響因子表達式如下:2)職位學(xué)校內(nèi)老師、研究生和大學(xué)生是借書的主力軍。不同職位的人對圖書好壞的判讀力是不同的,因此老師對圖書推薦的推薦影響力應(yīng)該最大。下表中的,呈現(xiàn)逐漸遞減關(guān)系:3)歷史評分準(zhǔn)確度不同用戶有不同的評分習(xí)慣,對圖書評分的標(biāo)準(zhǔn)不同,為了確保推薦的準(zhǔn)確度,我們引入第三個影響因子。如果用戶評分越接近平均分則用戶評分越準(zhǔn)確,影響因子也就越大,影響因子計

7、算公式為:其中S為用戶評分圖書集,為用戶對圖書i的評分,為圖書的平均評分,max和min分別為圖書i獲得評分的最大值和最小值。綜上所述,用戶的綜合評分影響因子表達式為:用戶對某本圖書的預(yù)測評分公式為:n為屬于U集合的用戶數(shù)量,和分別為用戶a和用戶b的平均評分,為用戶b對j圖書的評分。由用戶對某本圖書的預(yù)測評分公式,我們得到用戶對推薦列表內(nèi)每本圖書的預(yù)測評分,根據(jù)實際情況,我們選擇前N本圖書進行推薦。4 結(jié)束語隨著科技的發(fā)展,推薦系統(tǒng)在我國得到廣泛使用,圖書推薦系統(tǒng)也逐漸進入學(xué)生的學(xué)習(xí)生活。根據(jù)高校的實際情況,我們提出了一種改進的圖書推薦系統(tǒng),引入影響因子概念,提高推薦準(zhǔn)確度。使學(xué)生在面對海量的

8、數(shù)據(jù)時可用更方便地找到符合自己的學(xué)習(xí)資源。Reference:1 劉建國, 周濤, 汪秉宏. 個性化推薦系統(tǒng)的研究進展J. 自然科學(xué)研究進展, 2009, 19(1): 1-15.2 張怡文, 岳麗華, 張義飛. 基于共同用戶和相似標(biāo)簽的好友推薦方法J. 計算機應(yīng)用, 2013, 33(8); 2273-2275.3 呂果, 李法運. 基于改進協(xié)同過濾的移動個性化推薦服務(wù)研究J. 情報探索, 2014(20): 101-105.4 楊濤, 曹樹金. 圖書館用戶的個性化服務(wù)需求實證研究J. 大學(xué)圖書館學(xué)報, 2011(2): 76-85.5 許文青, 林雙平. 融合熱門度因子基于標(biāo)簽的個性化圖書推薦算法J. 圖書情報研究,2015(3): 82-86.6 Koren Y. Factor in the ne

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論