




已閱讀5頁,還剩76頁未讀, 繼續(xù)免費閱讀
(計算機軟件與理論專業(yè)論文)協(xié)同過濾優(yōu)化算法的研究與實現(xiàn).pdf.pdf 免費下載
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
11 j 1 分類號 udc 學(xué)位 論文 協(xié)同過濾優(yōu)化算法的研究與實現(xiàn) 作者姓名 陳玲玲 指導(dǎo)教師 王大玲教授 東北大學(xué)信息科學(xué)與工程學(xué)院 二申請學(xué)位級別 碩士 學(xué)科類別 工學(xué) 學(xué)科專業(yè)名稱 計算機軟件與理論 論文提交日期 2 0 0 8 年6 月15 日論文答辯日期 2 0 0 8 學(xué)位授予日期 功卯乎 7 答懶讎 申德 評閱人 概碗春 孝砣老 東北大學(xué) 2 0 0 8 年6 月 年7 月1 日 熒 一 l at h e s i si nc o m p u t e rs o f t w a r ea n dt h e o r y r e s e a r c ha n di m p l e m e n t a t i o nf o rc o l l a b o r a t i v ef i l t e r i n g o p t i m i z a t i o na l g o r i t h m b yc h e nl i n g l i n g s u p e r v i s o r p r o f e s s o rw a n g d a l i n g n o r t h e a s t e r nu n i v e r s i t y j u n e2 0 0 8 0 l j p 一 獨創(chuàng)性聲明 本人聲明 所呈交的學(xué)位論文是在導(dǎo)師的指導(dǎo)下完成的 論文中取得 的研究成果除加以標(biāo)注和致謝的地方外 不包含其他人己經(jīng)發(fā)表或撰寫過 的研究成果 也不包括本人為獲得其他學(xué)位而使用過的材料 與我一同工 作的同志對本研究所做的任何貢獻均己在論文中作了明確的說明并表示謝 意 學(xué)位論文作者簽名 e t 期 加彥 f 勿 學(xué)位論文版權(quán)使用授權(quán)書 本學(xué)位論文作者和指導(dǎo)教師完全了解東北大學(xué)有關(guān)保留 使用學(xué)位論 文的規(guī)定 即學(xué)校有權(quán)保留并向國家有關(guān)部門或機構(gòu)送交論文的復(fù)印件和 磁盤 允許論文被查閱和借閱 本人同意東北大學(xué)可以將學(xué)位論文的全部 或部分內(nèi)容編入有關(guān)數(shù)據(jù)庫進行檢索 交流 作者和導(dǎo)師同意網(wǎng)上交流的時間為作者獲得學(xué)位后 半年屹 一年口一年半口兩年口 學(xué)位論文作者簽名 觴仝 簽字日期 鈾 留 f 功 導(dǎo)師簽名 諺玄 簽字日期 加肋寥 多 p 一 囊 t 東北大學(xué)碩士學(xué)位論文 摘要 協(xié)同過濾優(yōu)化算法的研究與實現(xiàn) 摘要 隨著互聯(lián)網(wǎng)和電子商務(wù)的發(fā)展 電子商務(wù)推薦系統(tǒng)逐漸成為一個重要研究內(nèi)容 得 到了研究者越來越多的關(guān)注 其中 協(xié)同過濾推薦技術(shù)是目前推薦系統(tǒng)中應(yīng)用最早和最 為成功的技術(shù)之一 是個性化推薦領(lǐng)域重點研究的課題 本文通過分析了協(xié)同過濾推薦技術(shù)目前存在的問題 指出隨著電子商務(wù)系統(tǒng)用戶數(shù) 目和商品數(shù)目的日益增加 整個項目空間上用戶評分?jǐn)?shù)據(jù)極端稀疏 傳統(tǒng)的相似性度量 方法沒有強調(diào)項目所屬類別對相似性計算的影響 因而計算結(jié)果不夠準(zhǔn)確 針對該問題 提出了項目類型信息參與相似性計算的思想 將此思想分別應(yīng)用于基于項目協(xié)同過濾算 法和基于用戶協(xié)同過濾算法中 前者使用項目類型矩陣計算類型部分 后者使用由項目 類型矩陣與用戶評分矩陣得到的用戶 項目類型矩陣進行計算類型部分 并將其 與各自相應(yīng)的傳統(tǒng)相似性計算結(jié)果線性結(jié)合一并作為項目間和用戶間的相似性 實驗結(jié) 果表明 在基于項目和基于用戶協(xié)同過濾算法中 該方法不同程度地提高了預(yù)測的精確 度 本文還就傳統(tǒng)協(xié)同過濾算法無法反映用戶對不同類項目的關(guān)注度的不同問題 提出 一種改進的基于用戶的協(xié)同過濾算法 該算法利用組合推薦方法思想 結(jié)合了基于項目 和基于用戶協(xié)同過濾算法 該算法以基于用戶協(xié)同過濾算法為主體 使用基于項目協(xié)同 過濾算法得出待預(yù)測項目的鄰居項目 對基于項目協(xié)同過濾算法產(chǎn)生的目標(biāo)用戶的鄰居 集合進行再次選擇 它能考慮到用戶在不同類項目的興趣差異 找到針對每個類項目與 用戶 真正 的鄰居用戶 實驗結(jié)果表明 算法能有效避免傳統(tǒng)方法的弊端 提高預(yù)測 精度 從而提高了協(xié)同過濾系統(tǒng)的推薦質(zhì)量 關(guān)鍵詞 推薦系統(tǒng) 協(xié)同過濾 項目 用戶 優(yōu)化 組合推薦 一i i 東北大學(xué)碩士學(xué)位論文 a b s t r a c t r e s e a r c ha n di m p l e m e n t a t i o nf o rc o l l a b o r a t i v ef i l t e r i n g o p t i m i z a t i o na l g o r i t h m a b s t r a c t w i t ht h ed e v e l o p m e n to fi n t e m e ta n de c o m m e r c e t h er e c o m m e n d e rs y s t e mh a s g r a d u a l l yb e c o m ea l li m p o r t a n tr e s e a r c hf i e l do fe c o m m e r c et e c h n o l o g y a n da t t r a c t sm a n y r e s e a r c h e r s a t t e n t i o n c o l l a b o r a t i v ef i l t e r i n gt e c h n o l o g yi so n eo fe a r l i e s ta p p l i e da n dm o s t s u c c e s s f u lt e c h n o l o g i e si nr e c o m m e n d e rs y s t e m a n di ti st h em a i nr e s e a r c hi s s u e si nt h ef i e l d o fp e r s o n a l i z e dr e c o m m e n d a t i o n a n di nt h i sp a p e rw ef o c u so b rr e s e a r c ho ni t i nt h i st h e s i s i ti sp o i n t e do u tt h a t 謝t l lt h ed e v e l o p m e n to fe c o m m e r c e t h em a g n i t u d e s o fu s e r sa n dc o m m o d i t i e sg r o wr a p i d l y w h i c hr e s u l t e di nt h ee x t r e m es p a r s i t yo fu s e rr a t i n g d a t ab ya n a l y z i n gt h ep r o b l e m st h a te x i s ti nt o d a y sc o l l a b o r a t i v ef i l t e r i n gt e c h n o l o g y f o r e m p h a s i z i n gt h ei m p a c to fi t e m sg e n r e so ns i m i l a r i t yc o m p u t i n g t h et r a d i t i o n a ls i m i l a r i t y m e a s u r em e t h o d sw o r ki n a c c u r a t e l yi nt h i ss i t u a t i o n f o rt h i sp r o b l e m a l li d e ao fm a k i n g i t e m sg e n r ei n f o r m a t i o nt a k ep a r ti ns i m i l a r i t yc o m p u t i n gi sp r o p o s e d i ti sa p p l i e di n i t e m b a s e da n du s e r b a s e dc o l l a b o r a t i v ef i l t e r i n ga l g o r i t h m sr e s p e c f i v e l y t h ef o r m e ru s e st h e m a t r i xo fi t e ma n di t e m sg e n r ef o rg e n r ep a r t t h el a t t e ru s e st h em a t r i xo fu s e ra n di t e m s g e n r eg a i n e df r o mt h em a t r i xo fu s e rr a t i n ga n dt h em a t r i xo fi t e ma n di t e m g e n r ef o rt h a t p a r t t h e ni t i sc o m b i n e dw i t l le a c hc o r r e s p o n d i n go r i g i n a ls i m i l a r i t yv i al i n e a ra p p r o a c ht o b e c o m es i m i l a r i t yb e t w e e ni t e m sa n db e t w e e nu s e r s e x p e r i m e n t ss h o wi ti n c r e a s e sa c c u r a c y o fp r e d i c t i o na td i f f e r e n tl e v e l sb o t hi ni t e m b a s e da n du s e r b a s e dc o l l a b o r a t i v ef i l t e r i n g a n dt h e nam o d i f i e du s e r b a s e dc o l l a b o r a t i v ef i l t e r i n ga l g o r i t h mi sp r o p o s e df o rs o l v i n g t h ep r o b l e mt h a tt h et r a d i t i o n a lc o l l a b o r a t i v ef i l t e r i n gc a l l tr e f l e c tt h ed i f f e r e n c eo fu s e r a t t e n t i o nt od i f f e r e n tk i n d so fi t e m s t h ea l g o r i t h mc o m b i n e si t e m b a s e da n du s e r b a s e d c o l l a b o r a t i v e f i l t e r i n ga c c o r d i n g t oc o m b i n e dr e c o m m e n d a t i o n t h i sa l g o r i t h mr e g a r d s u s e r b a s e dc o l l a b o r a t i v ef i l t e r i n ga st h em a i nb o d y u s i n gn e i g h b o r so fi t e mt ob ep r e d i c t e d p r o d u c e df r o mi t e m b a s e dc o l l a b o r a t i v ef i l t e r i n gt os e l e c tn e a r e s tn e i g h b o r so fa c t i v eu s e rg o t f r o mu s e r b a s e dc o l l a b o r a t i v ef i l t e r i n ga g a i n i ti sa b l et ot a k et h ed i f f e r e n c eo fu s e r si n t e r e s t i nd i f f e r e n tk i n d so fi t e m sa n df i n d r e a l n e i g h b o r so fa c t i v eu s e r sr e g a r d i n ge v e r yk i n do f i t e m s e x p e r i m e n t ss h o w i tc a r le f f e c t i v e l ya v o i dt h es h o r t c o m i n g so ft r a d i t i o n a lm e t h o d sa n d i m p r o v et h ea c c u r a c yo fp r e d i c t i o n t h e r e b ye n h a n c i n gt h ec o l l a b o r a t i v ef i l t e r i n gs y s t e mo n t h er e c o m m e n d a t i o nq u a l i t y k e y w o r d s r e c o m m e n d e rs y s t e m c o l l a b o r a t i v ef i l t e r i n g i t e m u s e r o p t i m i z a t i o n h y b r i dr e c o m m e n d a t i o n i i i 東北大學(xué)碩士學(xué)位論文 目錄 目錄 獨創(chuàng)性聲明 i 摘要 i i a b s t r a c t i i i 第一章緒論 1 1 1 研究背景 1 1 2 本文主要研究內(nèi)容 2 1 3 本文的組織結(jié)構(gòu) 2 第二章相關(guān)理論與技術(shù) 5 2 1 電子商務(wù)推薦系統(tǒng)簡介 5 2 1 1 電子商務(wù)推薦系統(tǒng)的構(gòu)成 5 2 1 2 電子商務(wù)推薦系統(tǒng)的作用 7 2 1 3 電子商務(wù)推薦系統(tǒng)與個性化服務(wù) 8 2 2 電子商務(wù)推薦系統(tǒng)中推薦技術(shù) 8 2 2 1 協(xié)同過濾 9 2 2 2 關(guān)聯(lián)規(guī)則 9 2 2 3 聚類 1 0 2 2 4 貝葉斯 b e y e s i a n 絡(luò) 1 1 2 2 5h o r t i n g 圖 1 l 2 3 協(xié)同過濾介紹 1 l 2 3 1 協(xié)同過濾系統(tǒng)簡單描述 1 1 2 3 2 協(xié)同過濾技術(shù)的分類 1 3 2 3 3 現(xiàn)有的協(xié)同過濾推薦系統(tǒng) 1 3 2 4 協(xié)同過濾存在問題以及現(xiàn)有解決方法 1 4 2 4 1 協(xié)同過濾在應(yīng)用中存在的問題 1 4 2 4 2 現(xiàn)有的解決辦法 1 6 2 5 小結(jié) 2 0 第三章基于項目協(xié)同過濾的類型優(yōu)化算法 2 1 3 1 傳統(tǒng)基于項目協(xié)同過濾算法 2 1 3 1 1 相似度計算 2 2 3 1 2 最近鄰居 2 2 一 一 東北大學(xué)碩士學(xué)位論文目錄 3 1 3 產(chǎn)生推薦 2 2 3 2 基于項目協(xié)同過濾的類型優(yōu)化算法 2 3 3 2 1 問題的提出 2 3 3 2 2 相關(guān)工作 2 4 3 2 3 項目類型矩陣 2 4 3 2 4 類型優(yōu)化 2 5 3 3 評價標(biāo)準(zhǔn) 2 6 3 4 數(shù)據(jù)集 2 7 3 5 實驗與分析 2 7 3 5 1 實驗方案 2 7 3 5 2 實驗結(jié)果 2 8 3 5 3 實驗結(jié)果分析 3 0 3 6 爿 結(jié) 3 0 第四章基于用戶協(xié)同過濾的類型優(yōu)化算法 3 1 4 1 傳統(tǒng)基于用戶協(xié)同過濾算法 3 l 4 1 1 相似度計算 3 2 4 1 2 最近鄰居 3 2 4 1 3 產(chǎn)生推薦 3 3 4 2 基于用戶協(xié)同過濾的類型優(yōu)化算法 3 3 4 2 1 問題提出 3 3 4 2 2 用戶 類型矩陣 3 4 4 2 3 類型優(yōu)化 3 5 4 3 實驗與分析 3 6 4 3 1 實驗方案 3 6 4 3 2 實驗結(jié)果 3 6 4 3 3 實驗結(jié)果分析 3 8 4 4 進一步的構(gòu)想 4 0 4 5d 結(jié) 4 0 第五章改進的基于用戶協(xié)同過濾算法 4 3 5 1 組合推薦 4 3 5 1 1 組合推薦技術(shù) 4 3 5 1 2 基于項目和基于用戶協(xié)同過濾算法組合推薦 4 3 5 2 改進的基于用戶協(xié)同過濾算法 4 5 5 2 l 算法的提出 4 5 一v 一 查 壟蘭塑主蘭堡笙查一 旦 5 2 2 相關(guān)工作 一j 5 2 3 改進的基于用戶的協(xié)同過濾算法 4 0 5 2 4 算法分析 帥 5 3 實驗與分析 4 y 5 3 1 實驗方案 刊 5 3 2 實驗結(jié)果 例 5 3 3 實驗結(jié)果分析 5 4 小結(jié) 5 4 第六章結(jié)論與展望 5 7 6 1 本文主要內(nèi)容總結(jié) 5 7 6 2 未來工作 5 7 參考文獻 5 9 致謝 6 3 攻碩期間參加的項目和發(fā)表的論文 6 5 一v i 東北大學(xué)碩士學(xué)住論文 第一章緒論 第一章緒論弟一早三百t 匕 1 1 研究背景 近年來 隨著互聯(lián)網(wǎng)的普及和w e b 技術(shù)的日新月異促進了電子商務(wù)的快速發(fā)展 電 子商務(wù)的日益繁榮改變了傳統(tǒng)的貿(mào)易行為 它的逐步建立和完善使傳統(tǒng)的商務(wù)運作擺脫 了已有規(guī)則的束縛 對相關(guān)的商業(yè)形態(tài) 交易形式 流通方式以及營銷方式等都產(chǎn)生的 巨大的影響 在這一潮流趨勢下 企業(yè)和用戶都面臨了新的形勢 對企業(yè)而言 電子商務(wù)為企業(yè) 發(fā)展提供了新的商業(yè)入口 同時也提供了大量的產(chǎn)品信息 創(chuàng)造了更多的商業(yè)機會 全 球信息化使企業(yè)原本擁有的傳統(tǒng)的地域性優(yōu)勢和由于信息不對稱帶來的信息優(yōu)勢在很 大程度上被削弱 同時又使企業(yè)能夠獲得更廣闊的原料來源和市場選擇 網(wǎng)絡(luò)也為企業(yè) 提供了廉價 方便快捷 手段多樣的市場調(diào)研環(huán)境和營銷手段 可以更有效地與用戶接 觸交流 對用戶而言 電子商務(wù)為他們提供了前所未有的產(chǎn)品選擇空間和購物便利 在 這個能輕松得到各種資訊的信息海洋里 用戶卻從一開始的驚喜 變得有些無所適從 如何在茫茫的信息海洋中找到自己要的東西 已經(jīng)成為令企業(yè)和個人用戶頭疼的問題 雖然搜索引擎 信息檢索等能為用戶提供一定的幫助 但是它為每個用戶提供的服務(wù)都 是一樣的 而且反饋的信息量也比較大 l 不能從根本上幫助用戶解決這個問題 產(chǎn)品 種類的極大豐富使得用戶的購買目的從單純的滿足對物質(zhì)的需要更多地轉(zhuǎn)變?yōu)轶w現(xiàn)個 性特征和滿足個性化需求 因此 為滿足用戶和企業(yè)共同的迫切需要 重視用戶的個體需求 致力于滿足不同 用戶的不同偏好的電子商務(wù)個性化推薦系統(tǒng) p e r s o n a l i z e dr e c o m m e n d a t i o ns y s t e mf o r e c o m m e r c e 應(yīng)運而生 目前 幾乎所有大型的電子商務(wù)系統(tǒng) 如a m a z o n e b a y 阿 里巴巴等 都不同程度的使用了各種形式的推薦系統(tǒng) 為了保證推薦系統(tǒng)實時性條件下產(chǎn)生相對精確的推薦 研究者提出了多種不同的推 薦算法 如協(xié)同過濾技術(shù) 聚類技術(shù) 關(guān)聯(lián)規(guī)則技術(shù) h o r t i n g 圖技術(shù)等 2 j 其中協(xié)同過 濾技術(shù) 構(gòu)成了現(xiàn)有電子商務(wù)個性化推薦系統(tǒng)的基礎(chǔ) 協(xié)同過濾的出發(fā)點是 興趣相近 的用戶可能會對同樣的東西感興趣 所以只要維護關(guān)于用戶喜好的數(shù)據(jù) 從中分析得出 具有相似口味的用戶 然后就可以根據(jù)相似客戶的意見來向其進行推薦 另一種可能的 出發(fā)點是 用戶可能較偏愛與其已購買的東西相類似的商品 可以根據(jù)用戶對各種東西 的評價來判斷商品之間的相似程度 然后推薦與用戶興趣最接近的那些商品 前一種思路 以客戶與客戶之間的關(guān)系為中心 而后一種思路則以項目與項目之間的關(guān)系為著眼點 協(xié)同過濾在國內(nèi)外尤其是國外各個大型電子商務(wù)網(wǎng)站的推薦系統(tǒng)中都得到了不同 一 一 東北大學(xué)碩士學(xué)位論文第一章緒論 程度的應(yīng)用 像g r o u p l e n s 過濾網(wǎng)上新聞的系統(tǒng) r i n g o 推薦音樂的系統(tǒng) v i d e o r e c o m m e n d e r 和m o v i e l e n s 推薦電影的系統(tǒng) j c s t c 推薦笑話的系統(tǒng)等 其后 該 技術(shù)的商業(yè)應(yīng)用也不斷的擴大 如a m a z o n c o r n c d n o w c o m 等 都使用了協(xié)同過濾技 術(shù)向顧客推薦產(chǎn)品 因而協(xié)同過濾推薦技術(shù)是個性化推薦領(lǐng)域重點研究的課題 1 2 本文主要研究內(nèi)容 本文通過對電子商務(wù)推薦系統(tǒng)中的協(xié)同過濾推薦技術(shù)以及其存在的問題等的研究 分析電子商務(wù)推薦中的實際問題與需求 針對協(xié)同過濾推薦算法的一些缺陷 并結(jié)合當(dāng) 前個性化服務(wù)推薦技術(shù)的前沿 主要進行以下工作 在傳統(tǒng)協(xié)同過濾基于用戶評分矩陣的計算的基礎(chǔ)上 考慮到用戶評分?jǐn)?shù)據(jù)稀疏性和 項目分類信息對項目以及對用戶相似性的影響 引入項目類型信息參與傳統(tǒng)協(xié)同過濾中 相似度的計算 本文采用線性結(jié)合方式將通過用戶評分矩陣計算的傳統(tǒng)相似度和通過項 目類型信息計算的相似度結(jié)合一并作為事物的相似度 本文分別就此想法在基于項目協(xié) 同過濾和基于用戶協(xié)同過濾中的具體的實現(xiàn)進行了說明 并進行了相應(yīng)的實驗 通過實 驗驗證采用本文提出的方法計算相似性 它在基于項目和基于用戶的協(xié)同過濾算法中的 應(yīng)用對推薦的質(zhì)量都有不同程度的改善和提高 本文還就傳統(tǒng)的協(xié)同過濾推薦算法無法反映用戶對不同類的項目的偏好差異 使得 推薦時缺少個性 推薦質(zhì)量不高等問題 利用組合推薦思想 結(jié)合基于項目和基于用戶 二種協(xié)同過濾推薦算法而提出了改進的基于用戶協(xié)同過濾算法 該算法利用基于項目協(xié) 同過濾產(chǎn)生的待預(yù)測項目的最近鄰居集合對基于用戶協(xié)同過濾產(chǎn)生的目標(biāo)用戶的最近 鄰居用戶進行再選擇 淘汰沒有對待預(yù)測項目的最近鄰居集合中任何項目評分的用戶 找到在每一類項目上真正與目標(biāo)用戶相似的用戶 以期提高預(yù)測評分精度和改善推薦質(zhì) 量 通過進行一系列實驗驗證算法能否達到預(yù)期效果 進一步提高推薦系統(tǒng)的推薦質(zhì)量 和體現(xiàn)推薦的個性化 1 3 本文的組織結(jié)構(gòu) 本文各章的結(jié)構(gòu)安排如下 第一章為緒論 主要介紹本課題的研究背景 本文研究內(nèi)容 第二章為相關(guān)技術(shù)理論與技術(shù) 首先簡單介紹了電子商務(wù)推薦系統(tǒng)概念構(gòu)成及其作 用 并進一步介紹了目前電子商務(wù)推薦系統(tǒng)中的主要的協(xié)同過濾技術(shù) 接著著重介紹協(xié) 同過濾的基本思想 實現(xiàn)過程 現(xiàn)有的協(xié)同過濾推薦系統(tǒng)和分類 認(rèn)識和了解協(xié)同過濾 技術(shù) 接著重點介紹基于協(xié)同過濾的推薦系統(tǒng)面臨的挑戰(zhàn) 研究和分析協(xié)同過濾算法存 在的問題及目前比較典型的解決問題的方法 并對它們優(yōu)缺點進行了分析 第三章為基于項目的協(xié)同過濾的類型優(yōu)化算法 這一章通過分析項目類型信息對項 一2 一 東北大學(xué)碩士學(xué)位論文 第一章緒論 目相似性度量的重要影響 提出在傳統(tǒng)基于項目協(xié)同過濾推薦算法只利用用戶評分?jǐn)?shù)據(jù) 的基礎(chǔ)上引入項目類型信息 利用該信息參與計算項目間的相似度的想法 并通過實驗 測試其是否能改善推薦質(zhì)量 第四章為基于用戶協(xié)同過濾的類型優(yōu)化算法 通過分析傳統(tǒng)基于用戶協(xié)同過濾推薦 算法中的不足 說明項目類型對探究用戶深層興趣以及用戶相似性度量中的作用 提出 在基于用戶協(xié)同過濾推薦算法計算用戶相似步驟中性引入項目類型信息 并通過實驗驗 證算法的有效性 第五章為改進的基于用戶的協(xié)同過濾算法 該章首先介紹組合推薦思想和相應(yīng)研究 成果 接著分析了傳統(tǒng)協(xié)同過濾算法存在的不足以及相關(guān)工作 提出改進的基于用戶協(xié) 同過濾算法 該算法通過結(jié)合基于項目協(xié)同過濾算法 對傳統(tǒng)的基于用戶協(xié)同過濾算法 產(chǎn)生用戶的最近鄰居進行再選擇 以期提高預(yù)測水平 并通過實驗驗證 它能提高推薦 質(zhì)量 使推薦更具個性化 最后是結(jié)論與展望 總結(jié)全文內(nèi)容并提出進一步研究的方向 一3 一 一4 一 東北大學(xué)碩士學(xué)位論文 第二章相關(guān)理論與技術(shù) 第二章相關(guān)理論與技術(shù) 2 1 電子商務(wù)推薦系統(tǒng)簡介 隨著互聯(lián)網(wǎng)的普及和電子商務(wù)的高速發(fā)展 互聯(lián)網(wǎng)已成為一個分布廣泛的全球性信 息服務(wù)中心和人們獲取信息的一個重要途徑 然而隨著網(wǎng)絡(luò)信息的快速增長 人們卻常 常面臨 信息爆炸 的尷尬處境 不得不花費大量的時間去搜索 瀏覽自己需要的信息 在電子商務(wù)的虛擬環(huán)境下 商家所提供的商品種類和數(shù)量非常多 用戶不可能通過一個 小小的計算機屏幕一眼就知道所有的商品 用戶也不可能象在物理環(huán)境下那樣檢查挑選 商品 因此 需要商家提供一些智能化的選購指導(dǎo) 根據(jù)用戶的興趣愛好推薦用戶可能 感興趣或是滿意的商品 使用戶能夠很方便地得到自己所需要得到的商品 而且 從現(xiàn) 實經(jīng)驗來看 用戶的需求經(jīng)常是不明確的 模糊的 可能會對某類商品有著潛在的需求 但并不清楚什么商品能滿足自己的模糊需求 這時 如果商家能夠把滿足用戶模糊需求 的商品推薦給用戶 就可以把用戶的潛在需求轉(zhuǎn)化為現(xiàn)實的需求 從而提高產(chǎn)品的銷售 量 在這種背人們對信息個性化的要求越來越高 為了滿足用戶個性化的需求 電子商 務(wù)推薦系統(tǒng)應(yīng)運而生 電子商務(wù)推薦系統(tǒng)一正式的定義是r e s n i e k v a r i a n 在1 9 9 7 年給出的 它在電 子商務(wù)系統(tǒng)中向客戶提供商品信息和建議 幫助客戶決定購買何種商品 模擬銷售人員 向客戶推薦商品完成購買的過程 現(xiàn)在這個定義己被廣泛引用 推薦系統(tǒng)推薦何種商 品是在電子商務(wù)網(wǎng)站整體商品的購買情況 客戶的人數(shù)統(tǒng)計或者對客戶購買的歷史記錄 上進行分析產(chǎn)生的 廣義上講 這些因素的考慮使電子商務(wù)具有了個性化的色彩 而且 對于不同的客戶 具有推薦系統(tǒng)的電子商務(wù)網(wǎng)站表現(xiàn)出了一定的自適應(yīng)性 2 1 1 電子商務(wù)推薦系統(tǒng)的構(gòu)成 一般 電子商務(wù)推薦系統(tǒng)都可分為三個模塊輸入模塊 推薦算法模塊 輸出模塊 1 輸入模塊主要負(fù)責(zé)推薦系統(tǒng)數(shù)據(jù)源的收集和更新 數(shù)據(jù)主要來源于用戶信息 用戶可以是客戶個人和社團群體兩部分 客戶個人輸入主要指推薦系統(tǒng)的用戶為了獲得 推薦而對一些項目進行評價 以表達自己的偏好 社團群體輸入主要指集體形式的評價 數(shù)據(jù) 電子商務(wù)推薦系統(tǒng)的輸入形式多種多樣 主要包括以下幾種方式 1 用戶注冊信息輸入 用戶在電子商務(wù)站點注冊的時候 需要輸入一些個人信息 這些信息可以是用戶的年齡 性別 職業(yè)基本信息等 也可以是用戶明確表達的喜好興 趣 這類信息是電子商務(wù)推薦系統(tǒng)收集到的關(guān)于特定用戶的最初的信息 一5 一 東北大學(xué)碩士學(xué)位論文第二章相關(guān)理論與技術(shù) 2 用戶隱式瀏覽輸入 將用戶訪問電子商務(wù)站點的瀏覽行為作為推薦系統(tǒng)的輸入 這些由用戶瀏覽行為提取出的信息并不需要用戶刻意地對推薦系統(tǒng)進行配合 是在用戶 不察覺的情況下被存儲的 用戶當(dāng)前正在瀏覽的產(chǎn)品 用戶放入購物籃中的產(chǎn)品 用戶 的瀏覽路徑等都可以作為隱式瀏覽輸入信息 3 用戶顯式瀏覽輸入 這也是將用戶的瀏覽行為作為電子商務(wù)推薦系統(tǒng)的輸入 但與隱式瀏覽輸入不同的是 用戶的顯式瀏覽輸入是有目的地向電子商務(wù)推薦系統(tǒng)提供 自己的興趣愛好 例如 電子商務(wù)系統(tǒng)提供一系列熱門產(chǎn)品供用戶選擇 用戶只選擇瀏 覽自己感興趣的產(chǎn)品列表 電子商務(wù)系統(tǒng)根據(jù)用戶的瀏覽行為向其提供個性化的推薦服 務(wù) 4 關(guān)鍵字 產(chǎn)品屬性輸入 用戶在搜索引擎中輸入關(guān)鍵字作為推薦系統(tǒng)的輸入 或 將用戶當(dāng)前正在瀏覽的產(chǎn)品類別作為推薦系統(tǒng)的輸入 這種類型的輸入不同于用戶隨意 的瀏覽行為 用戶的輸入目的就是在電子商務(wù)系統(tǒng)中搜索自己需要的產(chǎn)品 5 用戶評分輸入 將用戶對產(chǎn)品的數(shù)值評分?jǐn)?shù)據(jù)作為推薦系統(tǒng)的輸入 電子商務(wù) 推薦系統(tǒng)列出一系列產(chǎn)品讓用戶評分 用戶的評分可以是一個數(shù)值 數(shù)值的大小表示用 戶對該產(chǎn)品的喜好程度 也可以是一個布爾值 0 代表不喜歡 1 代表喜歡 6 用戶文本評價輸入 用戶對已經(jīng)購買的產(chǎn)品或自己熟悉的產(chǎn)品以文本的形式進 行個人評價 推薦系統(tǒng)本身并不能判斷這些評價的好壞 但用戶在瀏覽該產(chǎn)品時 可以 通過其他用戶對產(chǎn)品的文本評價信息來評判產(chǎn)品的好壞 7 編輯推薦輸入 將領(lǐng)域?qū)<覍μ囟óa(chǎn)品的評價作為推薦系統(tǒng)的輸入 領(lǐng)域?qū)<?對產(chǎn)品的性能特點進行全面詳細(xì)的介紹 用戶通過專家的專業(yè)介紹 可以對自己并不熟 悉的產(chǎn)品加深認(rèn)識 從而決定是否購買該產(chǎn)品 8 用戶購買歷史輸入 推薦系統(tǒng)將用戶的購買歷史作為隱式評分?jǐn)?shù)據(jù) 一旦用戶 購買了特定產(chǎn)品 則認(rèn)為用戶喜歡該產(chǎn)品 推薦系統(tǒng)根據(jù)用戶的購買歷史記錄產(chǎn)生相應(yīng) 推薦 但是用戶購買了某件產(chǎn)品并不代表用戶真正喜歡該產(chǎn)品 所以在精確的推薦系統(tǒng) 中 用戶可以對購買的產(chǎn)品進行重新評分 從而使推薦系統(tǒng)產(chǎn)生更精確的推薦 2 輸出模塊主要負(fù)責(zé)把推薦系統(tǒng)產(chǎn)生的推薦集輸出給用戶 電子商務(wù)推薦系統(tǒng)的 輸出主要包括以下幾種方式 1 相關(guān)產(chǎn)品輸出 推薦系統(tǒng)根據(jù)用戶表現(xiàn)出來的行為特征或電子商務(wù)系統(tǒng)的銷售 情況向用戶產(chǎn)生產(chǎn)品推薦 這種方式是電子商務(wù)推薦系統(tǒng)中最為普遍的一種輸出 相關(guān) 產(chǎn)品輸出可以基于簡單的銷售排行向用戶推薦熱門產(chǎn)品 也可以基于對用戶行為特征的 深入分析 發(fā)現(xiàn)用戶的購買模式 從而產(chǎn)生個性化的推薦 2 個體文本評價輸出 電子商務(wù)推薦系統(tǒng)向目標(biāo)用戶提供其他用戶對產(chǎn)品的文本 評價信息 個體文本評價一般是非個性化的 對單個產(chǎn)品而言 所有用戶得到的個體文 一6 一 東北大學(xué)碩士學(xué)位論文第二章相關(guān)理論與技術(shù) 本評價都是相同的 3 個體評分輸出 電子商務(wù)推薦系統(tǒng)向目標(biāo)用戶提供其他用戶對產(chǎn)品的數(shù)值評分 信息 個體評分輸出沒有大量的文本描述信息 因而更加簡潔明了 個體評分輸出比較 適合于個體數(shù)值評分?jǐn)?shù)據(jù)比較少的場合 4 平均數(shù)值評分輸出 電子商務(wù)推薦系統(tǒng)向用戶提供其他用戶對產(chǎn)品的數(shù)值評分 的平均值 這種輸出形式具有簡潔明了的優(yōu)點 用戶可以立即獲得對該產(chǎn)品的總體評價 5 電子郵件輸出 電子商務(wù)推薦系統(tǒng)通過電子郵件的形式向用戶提供產(chǎn)品的最新 信息 這種輸出形式可以吸引用戶再次訪問電子商務(wù)站點 從而達到吸引用戶關(guān)注度 防止用戶流失的目的 3 推薦方法模塊是推薦系統(tǒng)的核心部分 負(fù)責(zé)由輸入如何得到輸出 決定著推薦 系統(tǒng)的性能優(yōu)劣 推薦方法模塊以推薦技術(shù)和算法為技術(shù)支撐 具體的推薦技術(shù)將在2 2 節(jié)詳細(xì)介紹 2 1 2 電子商務(wù)推薦系統(tǒng)的作用 電子商務(wù)推薦系統(tǒng) 3 就是利用統(tǒng)計和知識發(fā)現(xiàn)技術(shù)來解決與目標(biāo)用戶交互時提供商 品推薦問題的系統(tǒng) 它在電子商務(wù)系統(tǒng)中模擬銷售人員向客戶提供商品信息和建議 幫 助用戶決定購買何種商品 向用戶推薦商品 完成購買的過程 推薦系統(tǒng)推薦何種商品 是根據(jù)電子商務(wù)網(wǎng)站上整體商品的購買情況 所有用戶的購買歷史記錄等進行分析產(chǎn)生 的 它根據(jù)分析得到的各個用戶的興趣愛好 分別推薦用戶愛好的商品 因此也稱為個 性化推薦系統(tǒng) p e r s o n a l i z er e c o m m e n d a t i o ns y s t e m 電子商務(wù)推薦系統(tǒng)的作用主要表現(xiàn)在以下幾個方面 1 將更多的電子商務(wù)網(wǎng)站的瀏覽者轉(zhuǎn)變?yōu)樯唐返馁徺I者 電子商務(wù)網(wǎng)站的訪問者 往往沒有購買欲望 通過預(yù)測用戶的購買行為 主動為用戶提供他們可能感興趣的商品 信息 從而促成交易 2 提高了用戶對電子商務(wù)網(wǎng)站的忠誠度 與傳統(tǒng)的商務(wù)模式相比 電子商務(wù)系統(tǒng) 使得用戶擁有越來越多的選擇 用戶更換商家極其方便 只需要點擊一兩次鼠標(biāo)就可以 在不同的電子商務(wù)系統(tǒng)之間跳轉(zhuǎn) 推薦系統(tǒng)分析用戶的購買習(xí)慣 根據(jù)用戶需求向用戶 提供有價值的商品推薦 如果推薦系統(tǒng)的推薦質(zhì)量很高 那么用戶會對該推薦系統(tǒng)產(chǎn)生 依賴 因此 電子商務(wù)推薦系統(tǒng)不僅能夠為用戶提供個性化的推薦服務(wù) 而且能與用戶 建立長期穩(wěn)定的關(guān)系 從而有效保留客戶 提高客戶的忠誠度 防止客戶流失 3 提高電子商務(wù)網(wǎng)站的交叉銷售能力 電子商務(wù)推薦系統(tǒng)在用戶購買過程中向用 戶提供其他有價值的商品推薦 用戶能夠從系統(tǒng)提供的推薦列表中購買自己確實需要但 在購買過程中沒有想到的商品 從而有效提高電子商務(wù)系統(tǒng)的交叉銷售 為電子商務(wù)企 一7 一 東北大學(xué)碩士學(xué)位論文第二章相關(guān)理論與技術(shù) 業(yè)贏得了更多的發(fā)展機會 例如用戶購買了筆記本 網(wǎng)站為用戶推薦筆記本鎖 目前 推薦系統(tǒng)已廣泛運用到各行業(yè)中 推薦項目包括書籍 音像 網(wǎng)頁 文章 新聞等 在日趨激烈的競爭環(huán)境下 個性化推薦系統(tǒng)能有效的保留客戶 提高電子商務(wù) 系統(tǒng)的服務(wù)能力 成功的推薦系統(tǒng)會帶來巨大的效益 目前 幾乎所有大型的電子商務(wù) 系統(tǒng)都不同程度的使用了各種形式的推薦系統(tǒng) 如互聯(lián)網(wǎng)上最大的書店一a m a z o n t o m 互聯(lián)網(wǎng)上最大的商店一c d n o w c o m 互聯(lián)網(wǎng)上最大訪問量之一的電影網(wǎng)站一 m o v i e f i n d e r c o m 等 2 1 3 電子商務(wù)推薦系統(tǒng)與個性化服務(wù) 所謂個性化服務(wù) 就是根據(jù)每個用戶的不同喜好 為他們提供不同的服務(wù) 例如根 據(jù)用戶喜愛的頁面 確定當(dāng)前頁面的下一級連接 網(wǎng)站在為用戶提供個性化服務(wù)的同時 根據(jù)對用戶興趣的累積分析不斷調(diào)整自己來適應(yīng)用戶興趣的變化 使得每個用戶都有是 該站點唯一用戶的感覺 4 5 1 電子商務(wù)推薦系統(tǒng)使得電子商務(wù)系統(tǒng)主動適應(yīng)每一個用戶的 特定需求 為每一個用戶創(chuàng)建一個適應(yīng)該用戶的電子商店 從而為每一個用戶提供完全 不同的個性化購物體驗 因此屬于w e b 站點個性化服務(wù)的范疇 不同電子商務(wù)推薦系統(tǒng)的個性化程度各不相同 根據(jù)電子商務(wù)推薦系統(tǒng)的個性化程 度 可以將電子商務(wù)推薦系統(tǒng)分為如下三類 6 l 1 非個性化推薦系統(tǒng) 對每個用戶產(chǎn)生的推薦都是相同的 這種推薦系統(tǒng)可以基于站點工作人員的手工推 薦 或者基于統(tǒng)計分析技術(shù)等 我們經(jīng)常見到的一些站點的銷售排行 站長推薦 客戶 評論等 都屬于非個性化電子商務(wù)推薦系統(tǒng) 2 半個性化推薦系統(tǒng) 根據(jù)用戶當(dāng)前的行為產(chǎn)生相應(yīng)的推薦 這種推薦系統(tǒng)根據(jù)用戶當(dāng)前的瀏覽行為或用 戶當(dāng)前的購物籃信息產(chǎn)生推薦結(jié)果 一般使用關(guān)聯(lián)規(guī)則等技術(shù) 不同用戶得到的推薦結(jié) 果各不相同 半個性化推薦系統(tǒng)的個性化程度比非個性化推薦系統(tǒng)要高 3 完全個性化推薦系統(tǒng) 推薦系統(tǒng)保存用戶的各種歷史信息 如歷史瀏覽信息 歷史數(shù)值評分信息 用戶注 冊信息等 根據(jù)這些歷史信息 結(jié)合用戶當(dāng)前的行為 以及其他用戶的歷史信息 為用 戶產(chǎn)生完全個性化的推薦服務(wù) 這種推薦系統(tǒng)一般只能對注冊用戶提供服務(wù) 個性化程 度最高 2 2 電子商務(wù)推薦系統(tǒng)中推薦技術(shù) 為了使系統(tǒng)產(chǎn)生精確的推薦 保證推薦系統(tǒng)是實時性要求 電子商務(wù)推薦系統(tǒng)中目 前已使用的技術(shù)主要有 7 協(xié)同過濾 c o l l a b o r a t i v ef i l t e r i n g 關(guān)聯(lián)規(guī)貝l j a s s o c i a t i o n 一8 一 東北大學(xué)碩士學(xué)位論文第二章相關(guān)理論與技術(shù) r u l e s 3 1 聚類 c l u s t e r i n g e s 9 1 貝葉斯網(wǎng)絡(luò) b a y e s i a i ln e t w o r k h o r t i n g h o r t i n gg r a p h 1 0 等技術(shù) 2 2 1 協(xié)同過濾 協(xié)同過濾推薦 c o l l a b o r a t i v ef i l t e r i n gr e c o m m e n d a t i o n 是目前研究最多的個性化推薦 技術(shù) 一般采用最近鄰技術(shù) 早期的協(xié)同過濾利用用戶的歷史信息計算他們之間的距離 再利用目標(biāo)用戶的最近鄰居對商品評價的加權(quán)平均值來預(yù)測他對目標(biāo)項的喜好程度 系 統(tǒng)根據(jù)這一喜好程度來對目標(biāo)用戶進行推薦 而近些年 研究者 l i j 也有計算等項目間相 似性 通過用戶對相關(guān)項目的評分預(yù)測用戶對未評分項目的評分 協(xié)同過濾最大優(yōu)點是 對推薦對象沒有特殊的要求 能處理非結(jié)構(gòu)化的復(fù)雜對象 如音樂 電影等 目前有許多網(wǎng)站采用了該技術(shù)的推薦系統(tǒng)如表2 1 此外由微軟研究院開發(fā)的協(xié)同 過濾工具己被集成在微軟的c o m m e r c es e r v e r 產(chǎn)品中 并被許多站點使用 表2 1 采用協(xié)同過濾技術(shù)的網(wǎng)站 t a b l e2 1s i t e su s i n gc o l l a b o r a t i v ef i l t e r i n g 有關(guān)協(xié)同過濾的進一步介紹 見2 3 節(jié) 2 2 2 關(guān)聯(lián)規(guī)則 關(guān)聯(lián)規(guī)則技術(shù)在零售業(yè)得到了廣泛的應(yīng)用 關(guān)聯(lián)規(guī)則挖掘可以發(fā)現(xiàn)不同商品在銷售 過程中的相關(guān)性 關(guān)聯(lián)規(guī)則挖掘 就是發(fā)現(xiàn)數(shù)據(jù)集中項集之間有趣的關(guān)聯(lián)或者相互聯(lián)系 它是數(shù)據(jù)挖掘領(lǐng)域的 個重要分支 關(guān)聯(lián)規(guī)則挖掘可以發(fā)現(xiàn)不同商品在銷售過程中的相 關(guān)性 基于關(guān)聯(lián)規(guī)則的推薦 a s s o c i a t i o nr u l e b a s e dr e c o m m e n d a t i o n 1 2 1 是以關(guān)聯(lián)規(guī)則 一9 一 東北大學(xué)碩士學(xué)位論文 第二章相關(guān)理論與技術(shù) 為基礎(chǔ) 把已購商品作為規(guī)則頭 規(guī)則體為推薦對象 根據(jù)關(guān)聯(lián)規(guī)則尋找相關(guān)項目 并 對項目排序產(chǎn)生推薦 l 引 所謂關(guān)聯(lián)規(guī)則 即在一個交易數(shù)據(jù)庫中統(tǒng)計購買了商品集x 的交易中有多大比例的 交易同時購買了商品集y 得到的關(guān)聯(lián)規(guī)則表示為x y s c s 表示關(guān)聯(lián)規(guī)則的支 持度 c 表示關(guān)聯(lián)規(guī)則的置信度 其直觀的意義就是用戶在購買某些商品的時候有多大 傾向去購買另外一些商品 比如購買牛奶的同時很多人會同時購買面包 即把已購商品 作為規(guī)則頭 推薦對象為規(guī)則體 簡單的關(guān)聯(lián)規(guī)則推薦算法過程如下 1 使用關(guān)聯(lián)規(guī)則發(fā)現(xiàn)算法 找出電子商務(wù)系統(tǒng)中滿足最小支持度和最小置信度的 關(guān)聯(lián)規(guī)則r 關(guān)聯(lián)規(guī)則的發(fā)現(xiàn)算法很多 如a p f i o f i a p r i o r i t i d d h p f p t r e e 等 2 在r 中找出被目標(biāo)用戶支持的關(guān)聯(lián)規(guī)則r 1 即規(guī)則左邊的項目集是被目標(biāo)用戶 購買過的項目集 3 找出被關(guān)聯(lián)規(guī)則r 1 所預(yù)測且沒有被目標(biāo)用戶購買的所有商品p 4 根據(jù)p 中商品在關(guān)聯(lián)規(guī)則r 1 中的置信度排序 挑選前n 個商品作為算法輸出 如果某商品被多個規(guī)則預(yù)測 則取置信度最大者作為排序依據(jù) 算法的第一步關(guān)聯(lián)規(guī)則的發(fā)現(xiàn)最為關(guān)鍵且最耗時 是算法的瓶頸 但可以離線進行 因此可保證有效地推薦系統(tǒng)的實時性要求 其次 商品名稱的同義性問題也是關(guān)聯(lián)規(guī)則 的一個難點 2 2 3 聚類 聚類就是將數(shù)據(jù)對象歸類 分為多個簇 這些對象與同一個簇中的對象彼此相似 而與其他簇中的對象相異 1 4 聚類方法常用于協(xié)同過濾系統(tǒng)中 聚類法將有相似愛好的 用戶聚成組 完成聚類分析后 對當(dāng)前用戶的推薦可以通過和當(dāng)前用戶同類的其他用戶 的選擇或觀點進行平均化處理來得到 聚類方法推薦的結(jié)果通常比其它方法個性化要差 些 在一些情況下 聚類結(jié)果比最近鄰算法的精確度要低 但是 聚類一旦完成 最終 效果可能會很好 因為這時要分析的組數(shù)要小很多 聚類方法可以用在最近鄰法中作為 第一步 來縮小候選集 雖然將總體分為多個類可能會影響精確度或者推薦結(jié)果 但 是 聚類法是值得在精確度與效率之間進行權(quán)衡的 由于聚類過程可以離線進行 所以 在線的推薦算法產(chǎn)生推薦的速度比較快 l i 等人 采用基于項目的最近鄰方法 先用 k m s a l l s 算法將項目進行聚類 選擇活動用戶已打分并且與目標(biāo)項目在同一聚類中的項 目 即將鄰居限制在與目標(biāo)項目在同一聚類的項目中 分別計算這些項目與目標(biāo)項目之 間的相似度 然后根據(jù)最近鄰法求出活動用戶對目標(biāo)項目的評分預(yù)測值 r e c 船e 1 6 1 7 與這種方法類似 只是它是基于用戶的方法 先將用戶進行聚類 選擇與活動用戶在同 一10 東北大學(xué)碩士學(xué)位論文 第二章相關(guān)理論與技術(shù) 一聚類的那些用戶作為潛在的鄰居 然后根據(jù)這些用戶與活動用戶之間的相似度選擇鄰 居 2 2 4 貝葉斯 b e y e s i a n l 網(wǎng)絡(luò) 貝葉斯網(wǎng)絡(luò) b a y e s i a nn e t w o r k s 是一種對不確定知識進行表達和推理的拓?fù)浣Y(jié)構(gòu) 1 8 1 是人工智能 概率理論 圖論 決策理論相結(jié)合的產(chǎn)物 它借助于圖的直觀表示和 變換 清楚的表示變量之間的依存關(guān)系 在貝葉斯網(wǎng)絡(luò)中 每一個節(jié)點表示一個變量 即一個事件 各變量之間的弧表示事件發(fā)生的直接因果關(guān)系 由于貝葉斯網(wǎng)絡(luò)模仿了人 的推理機制 所以它能很好的表達知識的不確定性 并且能夠?qū)崿F(xiàn)快速推理 因而在人 工智能 目標(biāo)識別 決策評估和信息融合等領(lǐng)域中得到廣泛的應(yīng)用 l 引 推薦系統(tǒng)中應(yīng)用的貝葉斯網(wǎng)絡(luò)技術(shù)是利用用戶歷史信息創(chuàng)建相應(yīng)的模型 其中模型 用決策樹表示 節(jié)點和邊表示用戶信息 模型的建立可以離線進行 因為建模時間比較 長 一般需要數(shù)小時或數(shù)天 而由此得到的模型可以非常小 對模型的使用非常快 但 隨著用戶的不斷增多以及用戶興趣愛好的變化 即數(shù)據(jù)集的變化 貝葉斯網(wǎng)絡(luò)的學(xué)習(xí)過 程也要重新進行 因此這種方法適合用戶的興趣愛好變化比較慢的場合 2 2 5h o r t i n g 圖 電子商務(wù)推薦系統(tǒng)中的h o n i n g 圖技術(shù)是一種基于圖的方法 l o 節(jié)點代表用戶 邊 代表兩個用戶之間的相似度 在圖中尋找近鄰節(jié)點 然后綜合近鄰節(jié)點的觀點形成最后 的推薦 h o r t i n g 圖技術(shù)可以跳過中間節(jié)點尋找最近鄰居 考慮了節(jié)點之間的傳遞相似 關(guān)系 因此推薦精度優(yōu)于最近鄰協(xié)同過濾技術(shù) 2 3 協(xié)同過濾介紹 在電子商務(wù)個性化推薦系統(tǒng)的各種算法中 協(xié)同過濾算法是應(yīng)用最為成功的一類算 法 在國內(nèi)外尤其是國外各個大型電子商務(wù)網(wǎng)站的推薦系統(tǒng)中都得到了不同程度的應(yīng) 用 因而協(xié)同過濾推薦技術(shù)是個性化推薦領(lǐng)域重點研究的課題 協(xié)同過濾 其原始基本思想是基于其他類似用戶的興趣來產(chǎn)生針對目標(biāo)用戶的興趣 推薦或預(yù)測 這個基本思想和現(xiàn)在頗為流行的 口碑傳播 w o r d o f m o u t h 有點兒類似 隨著后來研究工作者的對協(xié)同過濾的不斷深入研究 s a r w a d l l 等人提出的基于項目的協(xié) 同過濾推薦算法 這一思想又得到進一步擴展 通過收集其他相似用戶或相似項目的信 息來預(yù)測當(dāng)前用戶的興趣 2 3 1 協(xié)同過濾系統(tǒng)簡單描述 協(xié)同過濾系統(tǒng)可以由輸入 協(xié)同過濾引擎以及輸出三個部分組成 2 0 1 即用戶輸入評 東北大學(xué)碩士學(xué)位論文第二章相關(guān)理論與技術(shù) 價信息 協(xié)同過濾引擎根據(jù)用戶輸入的信息產(chǎn)生預(yù)測或推薦 輸出結(jié)果這三個步驟 一 般來說 預(yù)測引擎對用戶來說是個 黑盒 用戶是不知道給他的推薦結(jié)果是怎樣得到 的 第一步為用戶輸入他對一些項目的評價 正如上一章所提到的 推薦系統(tǒng)的輸入的 用戶評價可以是顯示和隱式 但是隱式評價對數(shù)據(jù)分析難度較大 準(zhǔn)確性 有待進一步 提高 所以協(xié)同過濾領(lǐng)域研究主要以顯示評價為主 這里我們假定某一個推薦系統(tǒng)有m 個用戶和 1 個項目 使用所x 刀矩陣r 來表示用戶評分信息 矩陣中的每一個評分吒 表 示用戶f 對項目 的評分 f 實際評分 如果用戶f 對項目投票 2 t o 如果用戶f 對項目沒有投票 2 1 對于推薦要預(yù)測的用戶本文稱作目標(biāo)用戶 在圖2 1 中的目標(biāo)用戶是f 要預(yù)測的是 其對項目 評分 要預(yù)測的項目 項目1 浮h ji 項目n 用戶l 積簸三二 目三二忿 蚤鑊 用戶m覯一 目標(biāo)用戶 輸入 評分矩陣r 預(yù)測 推薦 磁戮繳繳黝 j 預(yù)測目標(biāo)用戶i j 對項目j 的評分 t l t 2 t t o p n 一向目標(biāo)用戶推薦項目 協(xié)同過濾
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 餐飲業(yè)人事管理制度
- 2025年咖啡連鎖品牌擴張戰(zhàn)略:咖啡連鎖店設(shè)計與市場布局研究報告
- 2025年交通運輸行業(yè)物流安全管理人才需求與培訓(xùn)體系創(chuàng)新報告
- 新鄉(xiāng)工程學(xué)院《物流運籌學(xué)II》2023-2024學(xué)年第二學(xué)期期末試卷
- 華北電力大學(xué)《中國重大考古發(fā)現(xiàn)》2023-2024學(xué)年第二學(xué)期期末試卷
- 昆明幼兒師范高等專科學(xué)?!缎畔⒓夹g(shù)課程標(biāo)準(zhǔn)與教材研究》2023-2024學(xué)年第二學(xué)期期末試卷
- 廣西科技大學(xué)《高級俄語口語》2023-2024學(xué)年第二學(xué)期期末試卷
- 貴陽幼兒師范高等專科學(xué)?!斗派渲委熚锢砼c技術(shù)》2023-2024學(xué)年第二學(xué)期期末試卷
- 湖南幼兒師范高等專科學(xué)?!段鞣轿幕耪摗?023-2024學(xué)年第二學(xué)期期末試卷
- 交通運輸行業(yè)發(fā)展綜合指數(shù)報告表
- 02.氣象資料業(yè)務(wù)系統(tǒng)(MDOS2.1)用戶操作手冊
- 國內(nèi)民用船舶修理價格表92本及補充本
- LY/T 2458-2015檸條錦雞兒平茬技術(shù)規(guī)程
- GB/T 34428.4-2017高速公路監(jiān)控設(shè)施通信規(guī)程第4部分:氣象檢測器
- 2020-2021學(xué)年成都青羊區(qū)五年級(上)期 語文期末試卷(word可編輯版)
- 英語六級核心詞匯圖像記憶法
- 消費者態(tài)度的形成與改變
- 廣州市人力資源和社會保障局事業(yè)單位招聘工作人員【共500題含答案解析】模擬檢測試卷
- 《理想國》第十卷中的模仿說理論(6500字)
- 大學(xué)生人際交往調(diào)查報告課件
- 湖南省長沙市望城區(qū)2020-2021學(xué)年八年級下學(xué)期期末考試歷史試卷
評論
0/150
提交評論