資源推薦系統(tǒng)_第1頁
資源推薦系統(tǒng)_第2頁
資源推薦系統(tǒng)_第3頁
資源推薦系統(tǒng)_第4頁
資源推薦系統(tǒng)_第5頁
已閱讀5頁,還剩27頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

資源推薦系統(tǒng)第一頁,共三十二頁,編輯于2023年,星期三Outline選題的初衷什么是資源推薦系統(tǒng)我們的任務(wù)資源推薦系統(tǒng)的設(shè)計(jì)MainIdeasMainDataStructuresMainFrameAndAlgorithms關(guān)于RRSDemo第二頁,共三十二頁,編輯于2023年,星期三什么是資源推薦系統(tǒng)資源泛指網(wǎng)絡(luò)上存在的可共享的數(shù)字化信息資源推薦系統(tǒng)根據(jù)大量用戶對眾多資源訪問(查詢和使用)的歷史記錄,分析用戶可能的興趣所在,提供資源推薦服務(wù),把用戶尚未訪問、但可能喜歡的資源推薦給用戶。第三頁,共三十二頁,編輯于2023年,星期三資源推薦與資源共享用戶需求Q:我需要關(guān)于某方面的資源A:有我感興趣的東西嗎R:你看看這些東東,不錯的可以先其想所想,達(dá)到較好的使用滿意度更有潛力的資源共享方式第四頁,共三十二頁,編輯于2023年,星期三推薦的方式用戶自定義的個(gè)性化資源把與用戶訪問過的資源類似的資源推薦給用戶把某些用戶訪問的資源推薦給與他們興趣類似的用戶第五頁,共三十二頁,編輯于2023年,星期三我們的任務(wù)構(gòu)造出資源推薦系統(tǒng)的框架,分析各個(gè)模塊的功能,給出實(shí)現(xiàn)的主要流程和細(xì)節(jié)。分析資源推薦中涉及的主要問題,給出參考的算法。構(gòu)建一個(gè)模擬的應(yīng)用環(huán)境,在該環(huán)境中演示資源推薦系統(tǒng)的主要功能和算法。第六頁,共三十二頁,編輯于2023年,星期三MainIdeas.1資源推薦的前提Assumption:用戶的興趣是比較穩(wěn)定的用戶的興趣是比較穩(wěn)定的,隨時(shí)間變化的幅度是比較小的用戶的興趣是在不斷變化的,盡管幅度比較小用戶較近的對資源的訪問能體現(xiàn)用戶當(dāng)前的興趣時(shí)間效應(yīng)Assumption:更新的資源具有更大的吸引力第七頁,共三十二頁,編輯于2023年,星期三MainIdeas.2如何發(fā)現(xiàn)用戶興趣?兩個(gè)假設(shè):如果一個(gè)用戶經(jīng)常訪問某類資源,那么他很可能喜歡該類資源;如果一些用戶經(jīng)常訪問類似的資源,那么他們的興趣可能相同。第八頁,共三十二頁,編輯于2023年,星期三MainIdeas.3問題:如何進(jìn)行推薦主要考慮的因素用戶對資源類的偏好用戶之間的相似度時(shí)間效應(yīng):興趣的變化,資源的新穎用戶對推薦的配合程度第九頁,共三十二頁,編輯于2023年,星期三參考定義.1用戶的資源類的偏好對某類資源的訪問數(shù)量的相對大小作為偏好的程度用戶之間的相似度當(dāng)前相似度定義為不對稱性如果進(jìn)一步考慮時(shí)間的因素可以考慮形成Listof<資源id,Date>以dateFactor(Date)的和作為相似度第十頁,共三十二頁,編輯于2023年,星期三參考定義.2時(shí)間效應(yīng):興趣的變化,資源的新穎興趣保持性依時(shí)間而衰減衰減系數(shù)α,0<α<=1時(shí)間效應(yīng):資源的新穎資源吸引力以時(shí)間而衰減衰減系數(shù)β,0<β<=1用戶對推薦的配合程度用戶對推薦資源的訪問情況第十一頁,共三十二頁,編輯于2023年,星期三主要數(shù)據(jù)結(jié)構(gòu).1用戶集合Users資源集合Resource系統(tǒng)訪問日志UserAccessLogDisp:記錄從某個(gè)日期(系統(tǒng)定義)開始用戶對資源的訪問歷史推薦資源訪問日志UserRecommendLogDisp:記錄在某個(gè)日期(用戶登錄)用戶對推薦資源的訪問歷史用戶-用戶相似矩陣

User-Usercurrent-similaritymatrixDisp:記錄從當(dāng)前的日志計(jì)算出的用戶與用戶之間的相似程度用戶-用戶相似系數(shù)矩陣

User-Usersimilarity-confidencematrix(User-usersimilarity-indexmatrix)Disp:記錄基于整個(gè)訪問歷史的用戶與用戶之間的相似性程度第十二頁,共三十二頁,編輯于2023年,星期三主要數(shù)據(jù)結(jié)構(gòu).2用戶推薦列表UserRecommendListDisp:要推薦給某個(gè)用戶資源列表當(dāng)前推薦列表SelectedRecommendListDisp:當(dāng)前一次推薦給用戶的資源列表用戶訪問列表UserAccessListDisp:某個(gè)用戶對資源訪問的歷史記錄(從某個(gè)日期開始)推薦必要度向量UserrecommendneedityvectorDisp:描述對用戶進(jìn)行推薦的必要度用戶-資源類系數(shù)矩陣User-resourceclassratematrixDisp:用戶對各個(gè)資源類的偏好程度第十三頁,共三十二頁,編輯于2023年,星期三主要處理流程第十四頁,共三十二頁,編輯于2023年,星期三用戶登錄與訪問資源操作用戶訪問日志推薦資源訪問日志用戶i的訪問記錄分發(fā)整理生成用戶-用戶相似矩陣用戶-用戶相似系數(shù)矩陣更新用戶-資源類偏好系數(shù)矩陣更新相似度的定義形成用戶推薦必要度向量更新相似系數(shù)更新策略第十五頁,共三十二頁,編輯于2023年,星期三用戶登錄與訪問資源操作用戶訪問日志推薦資源訪問日志用戶i的訪問記錄分發(fā)整理生成用戶-用戶相似矩陣用戶-用戶相似系數(shù)矩陣更新用戶-資源類偏好系數(shù)矩陣更新相似度的定義形成用戶推薦必要度向量更新相似系數(shù)更新策略第十六頁,共三十二頁,編輯于2023年,星期三更新用戶推薦資源列表當(dāng)前推薦列表生成推薦策略推薦優(yōu)先級設(shè)定策略TopN用戶列表產(chǎn)生用戶登錄與訪問資源操作用戶訪問日志推薦資源訪問日志用戶i的訪問記錄分發(fā)整理生成用戶-用戶相似矩陣用戶-用戶相似系數(shù)矩陣更新用戶-資源類偏好系數(shù)矩陣更新相似度的定義形成用戶推薦必要度向量更新相似系數(shù)更新策略用戶登錄與訪問資源操作用戶訪問日志推薦資源訪問日志用戶i的訪問記錄分發(fā)整理生成用戶-用戶相似矩陣用戶-用戶相似系數(shù)矩陣更新用戶-資源類偏好系數(shù)矩陣更新相似度的定義形成用戶推薦必要度向量更新相似系數(shù)更新策略第十七頁,共三十二頁,編輯于2023年,星期三用戶登錄與訪問資源操作用戶訪問日志推薦資源訪問日志用戶i的訪問記錄分發(fā)整理生成更新用戶推薦資源列表當(dāng)前推薦列表用戶-用戶相似矩陣用戶-用戶相似系數(shù)矩陣生成更新用戶-資源類偏好系數(shù)矩陣更新相似度的定義推薦策略相似系數(shù)更新策略形成用戶推薦必要度向量更新主要流程框架推薦優(yōu)先級設(shè)定策略TopN用戶列表產(chǎn)生第十八頁,共三十二頁,編輯于2023年,星期三Refresh機(jī)制[1]整理<用戶訪問日志>[2]計(jì)算用戶兩兩的相似性[3]更新用戶-資源類偏好系數(shù)矩陣[4]把當(dāng)前的相似性矩陣信息添加到相似性系數(shù)矩陣[5]可以形成每個(gè)用戶topN的列表第十九頁,共三十二頁,編輯于2023年,星期三相似性系數(shù)的更新更新信息來源一部分來自計(jì)算出來的當(dāng)前相似性矩陣一部分來自用戶對推薦列表的訪問信息(可以考慮隱性的反饋)更新策略的制定,下面分別提供兩類信息更新的參考方案第二十頁,共三十二頁,編輯于2023年,星期三SimIndex的更新-當(dāng)前相似性矩陣相似性系數(shù)體現(xiàn)的是用戶的長期的相似性,是推薦的主要根據(jù),我們作以下的假設(shè):用戶的興趣是比較穩(wěn)定的,隨時(shí)間變化的幅度是比較小的用戶的興趣是在不斷變化的,盡管幅度比較小用戶較近的對資源的訪問更能體現(xiàn)用戶的興趣這三條假設(shè)給策略的制定提供了一定的依據(jù)SimIndex=(1-a)*SimIndex+a*SimCurr0<a<=1a的大小表現(xiàn)的興趣變化的快慢程度,eg.a=0.2第二十一頁,共三十二頁,編輯于2023年,星期三SimIndex的更新-用戶對推薦列表的訪問信息這部分主要在于對用戶行為的理解與把握上。可以定義promote()和depress()兩個(gè)方法。參考算法如下:

if用戶未對推薦列表進(jìn)行訪問

if用戶的推薦必要度比較高 對所有推薦進(jìn)行depress()

考慮降低用戶的推薦必要度

else

降低用戶的推薦必要度

else

對用戶訪問的推薦進(jìn)行promote()

也可以考慮對用戶未訪問的資源進(jìn)行depress()

提高用戶的推薦必要度第二十二頁,共三十二頁,編輯于2023年,星期三用戶-資源類系數(shù)矩陣的更新表示某個(gè)用戶對各類資源的不同偏好我們簡單的以對某類資源的訪問數(shù)量的相對大小作為偏好的程度(當(dāng)然可以制定其他的策略)該矩陣的元素為A(useri,resourceclassj)=<訪問j次數(shù),比例>只要在refresh時(shí),把用戶對各類資源的訪問次數(shù)添加到矩陣對應(yīng)的元素中,并重新計(jì)算比例即可。第二十三頁,共三十二頁,編輯于2023年,星期三推薦列表的生成策略有以下幾點(diǎn)考慮可以把優(yōu)先級topN的資源作為推薦的對象以優(yōu)先級作為被推薦的概率的大小,進(jìn)行隨機(jī)的推薦考慮時(shí)間因素,歷史推薦表的資源的優(yōu)先級應(yīng)該隨時(shí)間降低第二十四頁,共三十二頁,編輯于2023年,星期三推薦列表的生成策略把歷史推薦列表的資源優(yōu)先級進(jìn)行重置比如乘上一個(gè)衰減系數(shù),去掉一些優(yōu)先級很低的資源添加新的推薦資源根據(jù)最近一次推薦時(shí)間,從最相似的N個(gè)用戶那里獲得資源,并置以相應(yīng)的優(yōu)先級優(yōu)先級的設(shè)置策略可以參考如下:priority(i)=與用戶j的相似度*所屬資源類的Rate可以進(jìn)行一定的歸一化如果多個(gè)用戶訪問了同一個(gè)資源,對值進(jìn)行累加第二十五頁,共三十二頁,編輯于2023年,星期三當(dāng)前推薦列表的生成參考推薦策略以資源優(yōu)先級的大小作為被加入當(dāng)前推薦序列的概率,并把該資源從推薦列表中刪除。形成M(eg.M=10)的當(dāng)前推薦序列第二十六頁,共三十二頁,編輯于2023年,星期三演示程序說明RRSDemo第二十七頁,共三十二頁,編輯于2023年,星期三AboutRRSDemo模擬用戶在資源共享系統(tǒng)上的交互操作以隨機(jī)生成和人工干預(yù)結(jié)合的方式生成用戶相似系數(shù)矩陣(賦初值),并可以通過人工編寫的用戶訪問log進(jìn)行更新模擬推薦過程,根據(jù)用戶的訪問記錄和相似系數(shù)進(jìn)行資源推薦,根據(jù)用戶對推薦資源的訪問更新相似系數(shù)矩陣第二十八頁,共三十二頁,編輯于2023年,星期三RRSDemoDetails設(shè)置100users8resourceclasses1000resourcesperclass默認(rèn)User0,1,2iscommonininterestSoareUser3,4所有算法及策略都取文檔中參考的方案第二十九頁,共三十二頁,編輯于2023年,星期三模擬用戶交互操作行為用戶操作與程序行為[1]用戶登錄,記錄<用戶id>[6]根據(jù)<用戶id>產(chǎn)生對應(yīng)的<推薦列表>[2]用戶輸入<查詢詞>[7]根據(jù)<查詢詞>

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論