基于混合推薦的電影推薦系統(tǒng)設(shè)計_第1頁
基于混合推薦的電影推薦系統(tǒng)設(shè)計_第2頁
基于混合推薦的電影推薦系統(tǒng)設(shè)計_第3頁
基于混合推薦的電影推薦系統(tǒng)設(shè)計_第4頁
基于混合推薦的電影推薦系統(tǒng)設(shè)計_第5頁
已閱讀5頁,還剩7頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、百度文庫讓每個人平竽地捉升口我基于混合推薦的電影推薦系統(tǒng)設(shè)計緒論隨著經(jīng)濟的快速發(fā)展,人們的娛樂生活越來越豐富。電影,作為娛樂的重要組成部分, 越來越受到大眾的歡迎,特別是受到年輕人的喜愛。但是,如何在海量的電影中找到滿足自 己喜愛的電影卻成為一個難題。電影個性化推薦應(yīng)運而生,它就是來解決如何在海量信息中 尋找關(guān)鍵點,向用戶推薦出符合用戶要求的電影。本文,基于內(nèi)容和協(xié)同過濾混合的推薦算法,建立一個個性化的電影推薦系統(tǒng)。電影作 為推薦給用戶的一種產(chǎn)品,其對特定的時間依賴性并不強?;趦?nèi)容的推薦系統(tǒng)可以有效地 克服冷啟動和數(shù)據(jù)稀疏性問題,在系統(tǒng)初運行階段和有新用戶進入階段可以提供較髙的準(zhǔn)確 性。當(dāng)數(shù)

2、據(jù)評估到達一泄程度后,使用協(xié)同過濾推薦系統(tǒng)進行推薦。協(xié)同過濾技術(shù),不僅可 以提供同類型的優(yōu)質(zhì)產(chǎn)品給用戶,還可以根拯近鄰集的不同進行跨類型的推薦。并且隨著時 間的增加,用戶評價數(shù)的增多,更多的用戶加入到系統(tǒng)中后,會找到更匹配的近鄰用戶,使 得推薦質(zhì)量得到提升。系統(tǒng)設(shè)計一、總體構(gòu)架設(shè)計電影推薦系統(tǒng)采用B/S模式的三層框架設(shè)計,分為表示層、業(yè)務(wù)層和數(shù)據(jù)層。這樣的設(shè) 計模式達到了分散關(guān)注、松散耦合、邏輯復(fù)用和標(biāo)準(zhǔn)泄義的目的。系統(tǒng)總體框架結(jié)構(gòu)圖如圖 1所示。二、對象關(guān)系及動態(tài)模型a)對象關(guān)系電影管理中的主要對象有:管理員和電影。管理員對電影的操作有:查詢、修改、刪除、 添加等。管理員與電影是一對多的關(guān)系

3、。電影推薦中的對象是電影,系統(tǒng)在這些電影信息的基礎(chǔ)上進行推薦,系統(tǒng)和電影的關(guān)系 是多對多的關(guān)系。用戶對象可以細分為普通用戶和管理員。對象詳細關(guān)系圖如圖2所示。圖1總體構(gòu)架設(shè)訃b)動態(tài)模型電影推薦模塊是系統(tǒng)主要的動態(tài)模型。電影推薦系統(tǒng)的狀態(tài)轉(zhuǎn)化圖如3所示。記錄用戶興趣保存用戶瀏覽信息推薦結(jié)朿圖3推薦的狀態(tài)轉(zhuǎn)化圖三、數(shù)據(jù)庫設(shè)計用戶信息表有三個屬性,用戶名、郵箱、密碼。用戶爼是主鍵,為文本類型,郵箱和密 碼也是文本類型。用戶信息數(shù)據(jù)字典如下表所示。表1用戶信息數(shù)據(jù)表電影信息表有10個屬性,電影序號是主鍵,為數(shù)值型。瀏覽次數(shù)也是數(shù)值型。電影名.演員導(dǎo)演、類型、年代、地區(qū)、介紹、圖片都是文本類型。電影信

4、息表的數(shù)據(jù)字典如下表所示Q表2電影信息數(shù)據(jù)表用戶興趣信息表具有6個屬性,其中序號為主鍵,是數(shù)值型。其他用戶名、電影名、類 型、年代、類型都是文本類型。用戶興趣表的數(shù)拯字典如下表所示。表3用戶興趣信息數(shù)據(jù)表電影顯示信息表主要有4個屬性電影名為主鍵,文本類型。其他導(dǎo)演.演員、圖片也 是文本類型。電影顯示信息表的數(shù)據(jù)字典如下表所示。表4電影顯示信息數(shù)據(jù)表數(shù)據(jù)項類型3百度文郵-讓每個人平等地捉升口我圖4系統(tǒng)E-R圖四、混合推薦算法設(shè)計協(xié)同過濾通過汁算用戶之間的相似性獲得推薦,但是忽略了項目和用戶自身的特性,而 且還具有冷啟動問題?;趦?nèi)容的推薦雖然能夠解決協(xié)同過濾中的不足,但是它也有缺陷。 基于內(nèi)容的

5、推薦不可避免地受到信息獲取技術(shù)的制約,例如自動提取多媒體數(shù)據(jù)的內(nèi)容特征 具有技術(shù)上的堆題。在這種條件下,將這兩個結(jié)合混合推薦算法成為必要。這兩種算法的融合不僅相互彌補 各自的不足,而且這種混合推薦系統(tǒng)還具有較高的精度和效率。本混合電影推薦系統(tǒng)中主要有兩種推薦算法。一種是協(xié)同過濾算法,另一種是基于內(nèi)容 的推薦算法。這兩種算法融合于本推薦系統(tǒng)中,根據(jù)不同的條件進行推薦。下面詳細介紹兩 種算法的使用條件。協(xié)同過濾算法:與該用戶相似的鄰居大于等于3基于內(nèi)容的推薦算法:與該用戶相似的鄰居小于3協(xié)同過濾算法原理:當(dāng)用戶登錄時,系統(tǒng)自動計算此時的用戶相似性矩陣。如果該用戶的相似性鄰居大于等 于3,則可以使用

6、協(xié)同過濾算法推薦電影?;趦?nèi)容的推薦算法原理:用戶登錄時,系統(tǒng)自動計算此時的用戶相似性矩陣,如果該用戶的相似鄰居小于3,那 么則使用基于內(nèi)容的算法推薦電影。開始計算用戶相似矩陣協(xié)同過濾算法推薦基于內(nèi)容的推薦算法推薦圖5混合系統(tǒng)推薦算法流程圖如上圖所示,用戶登錄后,系統(tǒng)即開始個性化推薦了,但是針對每個用戶使用的方法不 同,對任何一個用戶進行推薦都要按照當(dāng)前該用戶的歷史信息進行判斷處理。首先計算用戶 相似性矩陣,如果與該用戶的相似鄰居大于等于3,那么表示打分矩陣不稀疏,則按照協(xié)同 過濾算法推薦:否則,則使用基于內(nèi)容的推薦算法進行推薦。協(xié)同過濾算法流程圖如下所示。圖6協(xié)同過濾算法流程圖如上圖所示,介

7、紹協(xié)同過濾的算法步驟:第一步:用戶A登錄后,系統(tǒng)查詢用戶一電影評分矩陣,如果某個用戶X與用戶A 樣,A打分了他也打分了,那么將用戶X加入到用戶列表list中:第二步:計算list表中各個用戶與A之間的相似性,相似性的汁算利用夾角余弦的方法, 公式如下:sim (ij) = cos (兀 y) = =叫L C Z JS稅 叫7百度文庫讓每個人平竽地捉升口我第三步:根據(jù)第二步計算相似性后.得到與用戶A最相似的3個近鄰集合S第四步:利用集合S,計算用戶A沒有評分的電影,采用S集合中三個鄰居的打分均值。公式如下:#第五步:將計算得到的電影評分排序.找岀評分最髙的5個電影,推薦給用P A,算法結(jié)束?;?/p>

8、內(nèi)容的推薦算法流程圖如下圖所示:開始圖7基于內(nèi)容的推薦算法流程圖百度文郵-讓每個人平零地捉升口我上圖介紹了用戶登錄時,使用基于內(nèi)容的推薦算法為用戶推薦感興趣的電影,該算法步驟如下:第一步:根據(jù)用戶瀏覽歷史信息表,找到當(dāng)前用戶A瀏覽過的電影,統(tǒng)汁這些電影中,用 戶A所關(guān)注的電影的類型class、年代year和地區(qū)area。第二步:得到用戶A瀏覽過的電影的類型、年代和地區(qū)后,得到電影數(shù)據(jù)庫中找到類型為 class、年代為year和地區(qū)為area的電影。找到的電影個數(shù)和大于等于5,則退出。否則, 進行下一步。第三步:在電影庫中找到類型為class和地區(qū)為area的電影。找到的電影個數(shù)和大于等于5,

9、則退出。否則,進行下一步。第四步:在電影庫中找到類型為class、年代為year的電影。找到的電影個數(shù)和大于等于5,則退出。否則,進行下一步。第五步:在電影庫中找到年代為year和地區(qū)為area的電影。退岀。性能測試推薦系統(tǒng)常用的幾種評價指標(biāo)龍義如下:1)準(zhǔn)確率P訥其中,出(厶)表示在列表L中用Hu的準(zhǔn)確率,氏(厶)表示推薦列表L中用戶u喜歡的產(chǎn)品數(shù),L是推薦列表集合長度。召回率R2)3)9其中,(厶)表示在列表L中用戶u的召回率,表示用戶在測試集中觀看的電影總FlscoreF(L嚴(yán) 7 P + R其中,P為準(zhǔn)確率,R為召回率。百度文郵-讓每個人平等地捉升口我4) 命中率hit亠NHit =S

10、英中,N為用戶觀看電影總數(shù),S為推薦列表中的電影總數(shù)。5) 多樣性 Diversity沁)=吐磅E)s(x,y)表示用戶x和y的相似性。6) 覆蓋率 CoverageCOV(L) = A/n/MMn表示推薦列表L中不同的電影個數(shù),M為系統(tǒng)電彫庫中電影總數(shù)。在本文實現(xiàn)的混合系統(tǒng)中,總共有1500部電影,1200個用戸,總共6500個評分,以 此為測試條件。設(shè)圧不同的推薦列表長度L, Hits和diversity指標(biāo)的值如下表所示。表5不同推薦列表長度系統(tǒng)性能評價從上表可以看出,混合推薦系統(tǒng)中,不同列表長度L下系統(tǒng)性能是相對穩(wěn)左的。下而 的表6給出了混合推薦系統(tǒng)與傳統(tǒng)算法在準(zhǔn)確度P、召回率R、F和多樣性四個方面的結(jié)果 比較。從該表中可以發(fā)現(xiàn),混合推薦算法比傳統(tǒng)算法的準(zhǔn)確性方而有所提升。表6系統(tǒng)性能評價指標(biāo)對比從推薦系統(tǒng)的覆蓋率指標(biāo)來看,結(jié)果如下圖所示。從下圖可知,混合推薦系統(tǒng)在覆蓋率 指標(biāo)上市明顯髙于單純的基于內(nèi)容推薦系統(tǒng)。圖8覆蓋率比較結(jié)論本文電影推薦系統(tǒng)采用B/S模式的三層框架設(shè)計,分為表示層、業(yè)務(wù)層和數(shù)據(jù)層。采用 分層結(jié)構(gòu)只要目的是使各層之間相互獨立,各層不需要關(guān)注別層的內(nèi)部或者內(nèi)部實現(xiàn)機制。個性化推薦系統(tǒng)是當(dāng)前非常熱門的領(lǐng)域,融合了網(wǎng)絡(luò)和數(shù)據(jù)庫以及算法等技術(shù),在當(dāng)前 隨著互聯(lián)網(wǎng)的普及,網(wǎng)上娛樂要求不斷增加,個性化推

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論