版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、推薦算法概述馮凱旋2013/01/11綱要推薦算法介紹推薦算法舉例面臨的問題與挑戰(zhàn)推薦算法介紹給用戶(users)推薦感興趣的項目(items)為什么需要推薦算法?產(chǎn)品(products)人/用戶(people/users)職位/任務(wù)(jobs/tasks)增加銷量找到相關(guān)感興趣的事物擴(kuò)大社交網(wǎng)絡(luò)推薦算法介紹實例推薦算法介紹如何收集用戶信息?顯式(Explicit)直接由用戶提供隱式(Implicit)觀察推斷更精準(zhǔn),但增加了用戶負(fù)擔(dān)例子 用戶對項目打分 用戶資料中填寫興趣愛好 用戶清晰描述自己的目標(biāo)對用戶干預(yù)較少,但同時精準(zhǔn)度也降低例子 從用戶頻繁瀏覽的項目中推斷用戶的偏好 推薦算法介紹推薦
2、的基本原理是什么? 推薦的基本方法有哪些?基于項目(Item-based)與用戶所喜歡的項目類似的其他項目基于用戶(User-based)與用戶類似的其他用戶所喜歡的項目協(xié)同過濾推薦(Collaborative Filtering)*基于內(nèi)容推薦(Content Based)關(guān)聯(lián)規(guī)則推薦(Association Rules)混合方法推薦(Mixed or Hybrid)物以類聚聚人以群分聚推薦算法介紹相似度計算基于皮爾森相似性的相似度(Pearson correlation-based Similarity) 基于歐幾里德距離的相似度(Euclidean Distance-based Simi
3、larity)余弦相似度(Cosine Similarity)*調(diào)整余弦相似度(Adjusted Cosine Similarity)斯皮爾曼相關(guān)(Spearman Correlation)打球唱歌看電影吃東西張三1110李四1010王五0011PPT最后附有余弦相似度計算的MATLAB實現(xiàn),可以用于驗證后面涉及到的相似度計算推薦算法舉例協(xié)同過濾利用集體智慧發(fā)現(xiàn)用戶興趣所在算法分類基于用戶-項目評分矩陣最近鄰方法基于記憶的推薦(Memory Based)*基于模型的推薦(Model Based)基于用戶的推薦/基于用戶的Top-N推薦基于項目的推薦/基于項目的Top-N推薦基于貝葉斯模型的推薦
4、基于線性回歸模型的推薦推薦算法舉例協(xié)同過濾43?322442232433522415基于用戶的推薦基于項目的推薦推薦算法舉例協(xié)同過濾基于用戶的Top-N推薦43?322442232433522415推薦算法舉例協(xié)同過濾基于項目的Top-N推薦43?322442232433522415推薦算法舉例協(xié)同過濾優(yōu)點缺點算法簡單,應(yīng)用最早且最為成功的技術(shù)之一理論上能夠推薦任何項目,如圖像、音樂、視頻等用戶評價非常稀疏隨著用戶和項目增多,系統(tǒng)性能下降導(dǎo)致的可擴(kuò)展性問題基于用戶推薦的項目趨于大眾化基于項目推薦的項目缺乏多樣性新加入用戶/項目冷啟動問題推薦算法舉例基于內(nèi)容推薦又稱基于搜索的推薦基于內(nèi)容的推薦步
5、驟源于信息獲取領(lǐng)域信息檢索領(lǐng)域重要研究內(nèi)容推薦算法舉例基于內(nèi)容推薦優(yōu)點 缺點對用戶干預(yù)少,推薦結(jié)果直觀易理解加入了對用戶和項目本身特征的考慮無關(guān)于新推薦項目的冷啟動問題無數(shù)據(jù)稀疏問題有比較成熟的學(xué)習(xí)分類方法提供支持方法應(yīng)用受到項目的特征提取能力限制推薦結(jié)果更新緩慢,用戶難以發(fā)現(xiàn)新的興趣點存在關(guān)于新用戶的冷啟動問題推薦算法舉例關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘典型問題之一,又稱購物籃分析啤酒與尿布推薦算法舉例關(guān)聯(lián)規(guī)則基于關(guān)聯(lián)規(guī)則推薦步驟優(yōu)點:缺點從事務(wù)(transactions)中提取滿足閾值support和confidence的規(guī)則找出被用戶行為所“支持”的規(guī)則根據(jù)confidence對規(guī)則排序,選取Top N條規(guī)則進(jìn)行應(yīng)用通過數(shù)據(jù)挖掘產(chǎn)生有用的結(jié)果無需干預(yù)用戶行為,可離線計算關(guān)聯(lián)規(guī)則的發(fā)現(xiàn)最為耗時面臨商品名稱同義性問題非個性化推薦推薦算法舉例混合方法類別實例:內(nèi)容增強的協(xié)同過濾(Content-Boosted CF)對不同推薦算法的推薦結(jié)果進(jìn)行綜合對不同推薦算法的各自特征進(jìn)行綜合協(xié)同過濾方法不足好的推薦結(jié)果需要一定數(shù)量的用戶評分當(dāng)無法實現(xiàn)有效的顯式評分時基于項目內(nèi)容進(jìn)行“偽裝”評分43?32244223243
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 企業(yè)社會責(zé)任國際認(rèn)證申請服務(wù)行業(yè)市場調(diào)研分析報告
- 裝配用鉗項目運營指導(dǎo)方案
- 反射療法服務(wù)行業(yè)經(jīng)營分析報告
- 商標(biāo)監(jiān)控法律服務(wù)行業(yè)相關(guān)項目經(jīng)營管理報告
- 度假屋出租行業(yè)營銷策略方案
- 公共汽車包租行業(yè)經(jīng)營分析報告
- 嬰兒車專用包產(chǎn)品供應(yīng)鏈分析
- 復(fù)印機產(chǎn)業(yè)鏈招商引資的調(diào)研報告
- 手持紙帶噴射器產(chǎn)業(yè)鏈招商引資的調(diào)研報告
- 互惠基金經(jīng)紀(jì)行業(yè)相關(guān)項目經(jīng)營管理報告
- 安徽省亳州市黌學(xué)英才中學(xué)2024-2025學(xué)年七年級上學(xué)期期中生物學(xué)試題(含答案)
- 期中綜合檢測(1-4單元)(試題)- 2024-2025學(xué)年二年級上冊數(shù)學(xué)人教版
- 2024-2030年全球及中國IT服務(wù)管理(ITSM)軟件行業(yè)市場現(xiàn)狀供需分析及市場深度研究發(fā)展前景及規(guī)劃可行性分析研究報告
- 滬粵版初中物理八上八年級上學(xué)期物理期中試卷(解析版)
- 江蘇省蘇州市蘇州工業(yè)園區(qū)蘇州工業(yè)園區(qū)景城學(xué)校2023-2024學(xué)年八年級上學(xué)期期中數(shù)學(xué)試題(解析版)
- 私募基金管理公司薪酬與激勵約束制度
- 2024年消防宣傳月知識競賽考試題庫500題(含答案)
- 2024年下半年事業(yè)單位公開考試招聘工作人員報考信息表
- 北京市西城區(qū)某中學(xué)2023-2024學(xué)年八年級上學(xué)期期中考試語文試題(含答案)
- 國開2024年秋《機電控制工程基礎(chǔ)》形考任務(wù)1答案
- 二十四節(jié)氣課件:《立冬》
評論
0/150
提交評論