![協(xié)同過(guò)濾算法到應(yīng)用_第1頁(yè)](http://file4.renrendoc.com/view/c459338f0d5e21beab018ad3371deca3/c459338f0d5e21beab018ad3371deca31.gif)
![協(xié)同過(guò)濾算法到應(yīng)用_第2頁(yè)](http://file4.renrendoc.com/view/c459338f0d5e21beab018ad3371deca3/c459338f0d5e21beab018ad3371deca32.gif)
![協(xié)同過(guò)濾算法到應(yīng)用_第3頁(yè)](http://file4.renrendoc.com/view/c459338f0d5e21beab018ad3371deca3/c459338f0d5e21beab018ad3371deca33.gif)
![協(xié)同過(guò)濾算法到應(yīng)用_第4頁(yè)](http://file4.renrendoc.com/view/c459338f0d5e21beab018ad3371deca3/c459338f0d5e21beab018ad3371deca34.gif)
![協(xié)同過(guò)濾算法到應(yīng)用_第5頁(yè)](http://file4.renrendoc.com/view/c459338f0d5e21beab018ad3371deca3/c459338f0d5e21beab018ad3371deca35.gif)
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1.協(xié)同過(guò)濾推薦模型總體思路協(xié)同過(guò)濾推薦模型主要涉及協(xié)同過(guò)濾算法(協(xié)作型算法),CollaborativeFiltering,也稱(chēng)CF算法。1.1CF算法用戶行為與其他用戶行為比較,找出其相似的鄰居,根據(jù)鄰居的興趣或偏好,預(yù)測(cè)該用戶的興趣、偏好。1.2主要步驟(1) 構(gòu)建用戶檔案通過(guò)用戶對(duì)產(chǎn)品的各種行為(表現(xiàn)出的各類(lèi)指標(biāo)),最終形成用戶與商品的評(píng)分矩陣;(2) 生成最近的鄰居通過(guò)計(jì)算相似度,目標(biāo)用戶與數(shù)據(jù)庫(kù)內(nèi)用戶(群)的相似度,選取相似度最高的用戶(群)作為目標(biāo)用戶的鄰居;(3) 推薦產(chǎn)生根據(jù)目標(biāo)用戶的鄰居,運(yùn)用一定的推薦算法,為用戶推薦符合的鄰居的產(chǎn)品。2協(xié)同過(guò)濾推薦算法主要有兩種算法傳統(tǒng)(記憶)的協(xié)同過(guò)濾2.1.1計(jì)算相似度的方法Person相關(guān)系數(shù)工(R-R)(R-R)sim(sim(i,j)=wi,jkwI(R-R尸'工(R-R尸i,k i /,k jkel.其中,Ii7是用戶i,j共同評(píng)分的商品集合,R,R分別表示用戶i和用戶jij j,k i,k對(duì)商品k的評(píng)分,R,R分別表示用戶i和用戶j在各自己打分項(xiàng)目上的評(píng)分平ij均值。余弦相似度sim(isim(i,j)二cos(i,j)二—?—?i-jII門(mén)1*11了II工RRkikjkilleille!ileij其中:R為用戶i對(duì)商品k的評(píng)分,I為用戶i評(píng)過(guò)分的商品集合,k是用戶iik i與用戶j重合的評(píng)分?jǐn)?shù)目。模糊相似度歐幾里得相似度2.1.2商品的預(yù)測(cè)評(píng)分ppa,iK藝sim(a,u)R或pu,i a,iu=1
=R+kFsim(a,u)(Ra u,iu=1其中:sim(a,u)是目標(biāo)用戶a與鄰居用戶u的相似度,R是鄰居用戶u對(duì)項(xiàng)目u,ii的評(píng)分值,R是鄰居用戶u的平均評(píng)分,K為目標(biāo)用戶和各鄰居間相似度值之u和的倒數(shù)。sim(a,u)2.1.3推薦方法基于用戶的協(xié)同過(guò)濾基本思想:先找到目標(biāo)用戶的鄰居用戶,根據(jù)需求在鄰居用戶中選取最相似的k個(gè)鄰居,再根據(jù)這k個(gè)鄰居對(duì)各產(chǎn)品的評(píng)分,通過(guò)加權(quán)預(yù)測(cè)出目標(biāo)用戶對(duì)產(chǎn)品的評(píng)分?;谏唐返膮f(xié)同過(guò)濾基本思想:找出與商品i評(píng)分相似的鄰居商品,再取j個(gè)最相似的鄰居商品,再把這j個(gè)鄰居商品的評(píng)分加權(quán),預(yù)測(cè)目標(biāo)用戶對(duì)商品i的評(píng)分。2.1.4傳統(tǒng)協(xié)同過(guò)濾算法的步驟(1) 用戶--產(chǎn)品的評(píng)價(jià)矩陣通過(guò)用戶—產(chǎn)品的各項(xiàng)指標(biāo),得出用戶—產(chǎn)品的評(píng)價(jià)矩陣。(2) 確定用戶的鄰居計(jì)算目標(biāo)用戶/商品與數(shù)據(jù)庫(kù)中用戶/商品的相似度,取相似度最高的作為鄰居。(3) 推薦方法由用戶協(xié)同過(guò)濾和商品協(xié)同過(guò)濾兩個(gè)角度,分別預(yù)測(cè)目標(biāo)用戶對(duì)位置商品的評(píng)分。推薦規(guī)則:選擇商品評(píng)分前n個(gè)商品進(jìn)行推薦;設(shè)置閥值,選取高于閥值的商品進(jìn)行推薦基于模型的協(xié)同過(guò)濾算法2.2.1貝葉斯聚類(lèi)基本思想:基本思想是通過(guò)已知用戶的評(píng)分?jǐn)?shù)據(jù)估計(jì)出用戶對(duì)商品i的評(píng)價(jià)分布和條件概率參數(shù),再由目標(biāo)用戶的已知信息估計(jì)出目標(biāo)用戶對(duì)商品i的評(píng)分,進(jìn)行推薦。用戶u對(duì)商品i的期望得分:
E(u,i)=£P(guān)(R=kIU)xku,ik=0優(yōu)點(diǎn):所需參數(shù)少,對(duì)缺失數(shù)據(jù)不敏感,能夠?yàn)橛脩艚⒏咝У钠媚P?,可以有效的解決數(shù)據(jù)稀疏性和超高維問(wèn)題。缺點(diǎn):隨用戶量和數(shù)據(jù)量的增大,貝葉斯網(wǎng)絡(luò)模型需定期重建,耗時(shí)長(zhǎng),故不適用于更新迅速且用戶興趣變化頻繁的環(huán)境。2.2.2聚類(lèi)算法基本思想:將具有類(lèi)似特征的商品或用戶進(jìn)行分組,形成不同的偏好模式,對(duì)于目標(biāo)商品或用戶,先判斷其所屬類(lèi)別,再在該類(lèi)別中搜索最近鄰,根據(jù)最近鄰的評(píng)分預(yù)測(cè)用戶對(duì)項(xiàng)目的評(píng)分。常用的聚類(lèi)算法為K-means算法。???jī)?yōu)點(diǎn):通過(guò)聚類(lèi)將用戶的最近鄰搜索空間局限在每一個(gè)類(lèi)別中,有效的減小了搜索空間,解決了推薦的實(shí)時(shí)性問(wèn)題。缺點(diǎn):用戶只能屬于一個(gè)單獨(dú)的類(lèi)別,無(wú)法記錄用戶的多興趣特征另外,數(shù)據(jù)的超高維特征使得推薦性能下降。2.2.3奇異值分解2.2.4神經(jīng)網(wǎng)絡(luò)3.協(xié)同過(guò)濾算法的應(yīng)用3.1在數(shù)據(jù)庫(kù)中建立標(biāo)本數(shù)據(jù)3.1在數(shù)據(jù)庫(kù)中建立標(biāo)本數(shù)據(jù)基本思想:先對(duì)商品進(jìn)行統(tǒng)計(jì),依據(jù)某些指標(biāo)對(duì)用戶進(jìn)行分類(lèi),得到用戶對(duì)商品評(píng)分的矩陣,存放于數(shù)據(jù)庫(kù)中,作為初始數(shù)據(jù)。步驟:(1) 用戶進(jìn)行分類(lèi):按照指標(biāo)(2) 用戶對(duì)每個(gè)商品的評(píng)分;(3) 形成用戶商品的評(píng)分矩陣。存放于數(shù)據(jù)庫(kù)中備用商品1商品2商品3商品i標(biāo)本1評(píng)分標(biāo)本2標(biāo)本k樣本指標(biāo)Arpu值套餐使用流量性別年齡上網(wǎng)時(shí)段上網(wǎng)類(lèi)型等指標(biāo)的選?。褐笜?biāo)的選取應(yīng)該考慮是否影響對(duì)商品的需求,例如上網(wǎng)類(lèi)型等。指標(biāo)的統(tǒng)一:選取了指標(biāo)之后,如何使不同的指標(biāo)不同的單位,能夠統(tǒng)一,形成每個(gè)標(biāo)本或用戶的向量。判別目標(biāo)用戶的臨近用戶基本思想:取用戶的指標(biāo),應(yīng)用余弦相似度或者是person相關(guān)系數(shù)的方法,計(jì)算目標(biāo)用戶與標(biāo)本數(shù)據(jù)的貼近度,取貼近度最高的k個(gè)樣本作為目標(biāo)用戶的臨近用戶。步驟:(1) 計(jì)算相似度;(2)確定k個(gè)相似度最高的樣本。加權(quán)預(yù)測(cè)目標(biāo)用戶對(duì)商品的期望評(píng)分基本思想:分析目標(biāo)用戶的k個(gè)臨近用戶對(duì)商品的評(píng)分,對(duì)這些評(píng)分進(jìn)行加權(quán)預(yù)測(cè)目標(biāo)用戶對(duì)商品的評(píng)分,評(píng)分前幾
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 供應(yīng)鏈信用評(píng)價(jià)與區(qū)塊鏈-深度研究
- 新版施工合同范本
- 智能電能表及配件項(xiàng)目融資渠道探索
- 射頻同軸電纜組件項(xiàng)目籌資方案
- 車(chē)隊(duì)管理項(xiàng)目融資渠道探索
- 中學(xué)生閱讀名著的心得體會(huì)
- 旅游行業(yè)旅游活動(dòng)風(fēng)險(xiǎn)免責(zé)協(xié)議
- 電子產(chǎn)品銷(xiāo)售服務(wù)與質(zhì)保協(xié)議
- 房地產(chǎn)經(jīng)紀(jì)服務(wù)合同
- 工業(yè)廢氣處理工程合同
- 農(nóng)村高中思想政治課時(shí)政教育研究的中期報(bào)告
- 環(huán)衛(wèi)清掃保潔、垃圾清運(yùn)及綠化服務(wù)投標(biāo)方案(技術(shù)標(biāo) )
- 醫(yī)院定崗定編方案文檔
- 4-熔化焊與熱切割作業(yè)基礎(chǔ)知識(shí)(一)
- 2023年200MW儲(chǔ)能電站儲(chǔ)能系統(tǒng)設(shè)計(jì)方案
- 個(gè)人安全與社會(huì)責(zé)任的基本知識(shí)概述
- 建筑裝飾工程計(jì)量與計(jì)價(jià)試題一及答案
- 簡(jiǎn)易勞務(wù)合同電子版
- 明代文學(xué)緒論
- 體育賽事的策劃、組織與實(shí)施 體育賽事利益相關(guān)者
- 分析化學(xué)(高職)PPT完整版全套教學(xué)課件
評(píng)論
0/150
提交評(píng)論