




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、百度文庫讓每個人平竽地捉升口我基于混合推薦的電影推薦系統(tǒng)設(shè)計緒論隨著經(jīng)濟的快速發(fā)展,人們的娛樂生活越來越豐富。電影,作為娛樂的重要組成部分, 越來越受到大眾的歡迎,特別是受到年輕人的喜愛。但是,如何在海量的電影中找到滿足自 己喜愛的電影卻成為一個難題。電影個性化推薦應(yīng)運而生,它就是來解決如何在海量信息中 尋找關(guān)鍵點,向用戶推薦出符合用戶要求的電影。本文,基于內(nèi)容和協(xié)同過濾混合的推薦算法,建立一個個性化的電影推薦系統(tǒng)。電影作 為推薦給用戶的一種產(chǎn)品,其對特定的時間依賴性并不強?;趦?nèi)容的推薦系統(tǒng)可以有效地 克服冷啟動和數(shù)據(jù)稀疏性問題,在系統(tǒng)初運行階段和有新用戶進入階段可以提供較髙的準(zhǔn)確 性。當(dāng)數(shù)
2、據(jù)評估到達一泄程度后,使用協(xié)同過濾推薦系統(tǒng)進行推薦。協(xié)同過濾技術(shù),不僅可 以提供同類型的優(yōu)質(zhì)產(chǎn)品給用戶,還可以根拯近鄰集的不同進行跨類型的推薦。并且隨著時 間的增加,用戶評價數(shù)的增多,更多的用戶加入到系統(tǒng)中后,會找到更匹配的近鄰用戶,使 得推薦質(zhì)量得到提升。系統(tǒng)設(shè)計一、總體構(gòu)架設(shè)計電影推薦系統(tǒng)采用B/S模式的三層框架設(shè)計,分為表示層、業(yè)務(wù)層和數(shù)據(jù)層。這樣的設(shè) 計模式達到了分散關(guān)注、松散耦合、邏輯復(fù)用和標(biāo)準(zhǔn)泄義的目的。系統(tǒng)總體框架結(jié)構(gòu)圖如圖 1所示。二、對象關(guān)系及動態(tài)模型a)對象關(guān)系電影管理中的主要對象有:管理員和電影。管理員對電影的操作有:查詢、修改、刪除、 添加等。管理員與電影是一對多的關(guān)系
3、。電影推薦中的對象是電影,系統(tǒng)在這些電影信息的基礎(chǔ)上進行推薦,系統(tǒng)和電影的關(guān)系 是多對多的關(guān)系。用戶對象可以細分為普通用戶和管理員。對象詳細關(guān)系圖如圖2所示。圖1總體構(gòu)架設(shè)訃b)動態(tài)模型電影推薦模塊是系統(tǒng)主要的動態(tài)模型。電影推薦系統(tǒng)的狀態(tài)轉(zhuǎn)化圖如3所示。記錄用戶興趣保存用戶瀏覽信息推薦結(jié)朿圖3推薦的狀態(tài)轉(zhuǎn)化圖三、數(shù)據(jù)庫設(shè)計用戶信息表有三個屬性,用戶名、郵箱、密碼。用戶爼是主鍵,為文本類型,郵箱和密 碼也是文本類型。用戶信息數(shù)據(jù)字典如下表所示。表1用戶信息數(shù)據(jù)表電影信息表有10個屬性,電影序號是主鍵,為數(shù)值型。瀏覽次數(shù)也是數(shù)值型。電影名.演員導(dǎo)演、類型、年代、地區(qū)、介紹、圖片都是文本類型。電影信
4、息表的數(shù)據(jù)字典如下表所示Q表2電影信息數(shù)據(jù)表用戶興趣信息表具有6個屬性,其中序號為主鍵,是數(shù)值型。其他用戶名、電影名、類 型、年代、類型都是文本類型。用戶興趣表的數(shù)拯字典如下表所示。表3用戶興趣信息數(shù)據(jù)表電影顯示信息表主要有4個屬性電影名為主鍵,文本類型。其他導(dǎo)演.演員、圖片也 是文本類型。電影顯示信息表的數(shù)據(jù)字典如下表所示。表4電影顯示信息數(shù)據(jù)表數(shù)據(jù)項類型3百度文郵-讓每個人平等地捉升口我圖4系統(tǒng)E-R圖四、混合推薦算法設(shè)計協(xié)同過濾通過汁算用戶之間的相似性獲得推薦,但是忽略了項目和用戶自身的特性,而 且還具有冷啟動問題?;趦?nèi)容的推薦雖然能夠解決協(xié)同過濾中的不足,但是它也有缺陷。 基于內(nèi)容的
5、推薦不可避免地受到信息獲取技術(shù)的制約,例如自動提取多媒體數(shù)據(jù)的內(nèi)容特征 具有技術(shù)上的堆題。在這種條件下,將這兩個結(jié)合混合推薦算法成為必要。這兩種算法的融合不僅相互彌補 各自的不足,而且這種混合推薦系統(tǒng)還具有較高的精度和效率。本混合電影推薦系統(tǒng)中主要有兩種推薦算法。一種是協(xié)同過濾算法,另一種是基于內(nèi)容 的推薦算法。這兩種算法融合于本推薦系統(tǒng)中,根據(jù)不同的條件進行推薦。下面詳細介紹兩 種算法的使用條件。協(xié)同過濾算法:與該用戶相似的鄰居大于等于3基于內(nèi)容的推薦算法:與該用戶相似的鄰居小于3協(xié)同過濾算法原理:當(dāng)用戶登錄時,系統(tǒng)自動計算此時的用戶相似性矩陣。如果該用戶的相似性鄰居大于等 于3,則可以使用
6、協(xié)同過濾算法推薦電影?;趦?nèi)容的推薦算法原理:用戶登錄時,系統(tǒng)自動計算此時的用戶相似性矩陣,如果該用戶的相似鄰居小于3,那 么則使用基于內(nèi)容的算法推薦電影。開始計算用戶相似矩陣協(xié)同過濾算法推薦基于內(nèi)容的推薦算法推薦圖5混合系統(tǒng)推薦算法流程圖如上圖所示,用戶登錄后,系統(tǒng)即開始個性化推薦了,但是針對每個用戶使用的方法不 同,對任何一個用戶進行推薦都要按照當(dāng)前該用戶的歷史信息進行判斷處理。首先計算用戶 相似性矩陣,如果與該用戶的相似鄰居大于等于3,那么表示打分矩陣不稀疏,則按照協(xié)同 過濾算法推薦:否則,則使用基于內(nèi)容的推薦算法進行推薦。協(xié)同過濾算法流程圖如下所示。圖6協(xié)同過濾算法流程圖如上圖所示,介
7、紹協(xié)同過濾的算法步驟:第一步:用戶A登錄后,系統(tǒng)查詢用戶一電影評分矩陣,如果某個用戶X與用戶A 樣,A打分了他也打分了,那么將用戶X加入到用戶列表list中:第二步:計算list表中各個用戶與A之間的相似性,相似性的汁算利用夾角余弦的方法, 公式如下:sim (ij) = cos (兀 y) = =叫L C Z JS稅 叫7百度文庫讓每個人平竽地捉升口我第三步:根據(jù)第二步計算相似性后.得到與用戶A最相似的3個近鄰集合S第四步:利用集合S,計算用戶A沒有評分的電影,采用S集合中三個鄰居的打分均值。公式如下:#第五步:將計算得到的電影評分排序.找岀評分最髙的5個電影,推薦給用P A,算法結(jié)束?;?/p>
8、內(nèi)容的推薦算法流程圖如下圖所示:開始圖7基于內(nèi)容的推薦算法流程圖百度文郵-讓每個人平零地捉升口我上圖介紹了用戶登錄時,使用基于內(nèi)容的推薦算法為用戶推薦感興趣的電影,該算法步驟如下:第一步:根據(jù)用戶瀏覽歷史信息表,找到當(dāng)前用戶A瀏覽過的電影,統(tǒng)汁這些電影中,用 戶A所關(guān)注的電影的類型class、年代year和地區(qū)area。第二步:得到用戶A瀏覽過的電影的類型、年代和地區(qū)后,得到電影數(shù)據(jù)庫中找到類型為 class、年代為year和地區(qū)為area的電影。找到的電影個數(shù)和大于等于5,則退出。否則, 進行下一步。第三步:在電影庫中找到類型為class和地區(qū)為area的電影。找到的電影個數(shù)和大于等于5,
9、則退出。否則,進行下一步。第四步:在電影庫中找到類型為class、年代為year的電影。找到的電影個數(shù)和大于等于5,則退出。否則,進行下一步。第五步:在電影庫中找到年代為year和地區(qū)為area的電影。退岀。性能測試推薦系統(tǒng)常用的幾種評價指標(biāo)龍義如下:1)準(zhǔn)確率P訥其中,出(厶)表示在列表L中用Hu的準(zhǔn)確率,氏(厶)表示推薦列表L中用戶u喜歡的產(chǎn)品數(shù),L是推薦列表集合長度。召回率R2)3)9其中,(厶)表示在列表L中用戶u的召回率,表示用戶在測試集中觀看的電影總FlscoreF(L嚴(yán) 7 P + R其中,P為準(zhǔn)確率,R為召回率。百度文郵-讓每個人平等地捉升口我4) 命中率hit亠NHit =S
10、英中,N為用戶觀看電影總數(shù),S為推薦列表中的電影總數(shù)。5) 多樣性 Diversity沁)=吐磅E)s(x,y)表示用戶x和y的相似性。6) 覆蓋率 CoverageCOV(L) = A/n/MMn表示推薦列表L中不同的電影個數(shù),M為系統(tǒng)電彫庫中電影總數(shù)。在本文實現(xiàn)的混合系統(tǒng)中,總共有1500部電影,1200個用戸,總共6500個評分,以 此為測試條件。設(shè)圧不同的推薦列表長度L, Hits和diversity指標(biāo)的值如下表所示。表5不同推薦列表長度系統(tǒng)性能評價從上表可以看出,混合推薦系統(tǒng)中,不同列表長度L下系統(tǒng)性能是相對穩(wěn)左的。下而 的表6給出了混合推薦系統(tǒng)與傳統(tǒng)算法在準(zhǔn)確度P、召回率R、F和多樣性四個方面的結(jié)果 比較。從該表中可以發(fā)現(xiàn),混合推薦算法比傳統(tǒng)算法的準(zhǔn)確性方而有所提升。表6系統(tǒng)性能評價指標(biāo)對比從推薦系統(tǒng)的覆蓋率指標(biāo)來看,結(jié)果如下圖所示。從下圖可知,混合推薦系統(tǒng)在覆蓋率 指標(biāo)上市明顯髙于單純的基于內(nèi)容推薦系統(tǒng)。圖8覆蓋率比較結(jié)論本文電影推薦系統(tǒng)采用B/S模式的三層框架設(shè)計,分為表示層、業(yè)務(wù)層和數(shù)據(jù)層。采用 分層結(jié)構(gòu)只要目的是使各層之間相互獨立,各層不需要關(guān)注別層的內(nèi)部或者內(nèi)部實現(xiàn)機制。個性化推薦系統(tǒng)是當(dāng)前非常熱門的領(lǐng)域,融合了網(wǎng)絡(luò)和數(shù)據(jù)庫以及算法等技術(shù),在當(dāng)前 隨著互聯(lián)網(wǎng)的普及,網(wǎng)上娛樂要求不斷增加,個性化推
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 客戶溝通與反饋記錄
- 小王子遇見世界的觀后感
- 高中化學(xué)實驗設(shè)計與探究:化學(xué)反應(yīng)原理教案
- 《初高中英語語法比較與辨析教案》
- 不動產(chǎn)交易買賣協(xié)議書
- 中學(xué)生歷史事件故事讀后感
- 美容師儀器知識培訓(xùn)課件
- 血液++課件-2024-2025學(xué)年北師大版生物七年級下冊
- 紅色故事鐵道游擊隊的愛國主義教育解讀
- 教育資源整合及教育信息化建設(shè)方案
- 外周血管的介入治療課件
- 《當(dāng)代廣播電視概論》(廣播電視發(fā)明與技術(shù)基礎(chǔ))課件
- 核心能力模型庫(-勝任力模型-)
- 高中地理 紐約的發(fā)展 紐約的輻射功能 城市的輻射功能 作業(yè)設(shè)計
- 5.3.2.2函數(shù)的最大(?。┲?課件(共20張PPT)
- TSG-R0005-2022《移動式壓力容器安全技術(shù)監(jiān)察規(guī)程》(2022版)
- 2020 ACLS-PC-SA課前自我測試試題及答案
- 上市公司組織架構(gòu)策略
- DB34∕T 3968-2021 橋梁健康監(jiān)測系統(tǒng)運營維護與管理規(guī)范
- 加氣混凝土砌塊砌筑規(guī)范標(biāo)準(zhǔn)[詳]
- 定語從句漢譯英
評論
0/150
提交評論