版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、 基于項(xiàng)目協(xié)同過濾的電視產(chǎn)品營(yíng)銷推薦模型 檀亞寧金澤明陳輝摘 要:互聯(lián)網(wǎng)技術(shù)的快速發(fā)展和應(yīng)用拓展使我們迎來了三網(wǎng)融合的時(shí)代,為傳統(tǒng)廣播電視媒介帶來了發(fā)展機(jī)遇。節(jié)目數(shù)據(jù)的劇增一方面豐富了電視節(jié)目的內(nèi)容,另一方面卻為用戶選擇帶來了困難,這就要求電視運(yùn)營(yíng)商建立合理的個(gè)性化推薦模型。該文采用基于物品的協(xié)同過濾的個(gè)性化推薦算法,通過分析用戶觀看收視信息數(shù)據(jù)、電視產(chǎn)品信息數(shù)據(jù),同時(shí)考慮到目前傳統(tǒng)的互聯(lián)網(wǎng)資源推薦系統(tǒng)大都是針對(duì)個(gè)體推薦,在對(duì)家庭不同成員的推薦時(shí)可能會(huì)出現(xiàn)適得其反的情況,綜合考慮整個(gè)家庭成員的點(diǎn)播集合,構(gòu)成了家庭用戶完整的歷史觀看記錄,分析每個(gè)家庭成員的偏好,建立電視產(chǎn)品營(yíng)銷推薦模型,做出節(jié)目
2、的個(gè)性化推薦。同時(shí)對(duì)不同節(jié)目的標(biāo)簽進(jìn)行組成分析,以數(shù)據(jù)圖的形式更加直觀地展示在結(jié)果中,用以了解不同時(shí)期標(biāo)簽的熱度與關(guān)注度,從而進(jìn)一步得出影視作品的熱度,對(duì)不同時(shí)期的推薦偏好做出指導(dǎo)性建議。Key:基于物品的協(xié)同過濾 個(gè)性化推薦 節(jié)目標(biāo)簽 數(shù)據(jù)處理:TP31 :A :1672-3791(2019)11(b)-0214-03Abstract: The rapid development and application of Internet technology has ushered in the era of triple play, which has brought opportuniti
3、es for the development of traditional broadcast and television media. The dramatic increase of program data has on the one hand enriched the content of television programs and on the other hand brought difficulties to user selection. This requires television operators to establish a reasonable perso
4、nalized recommendation model. This article adopts a personalized recommendation algorithm based on item-based collaborative filtering, and analyzes users viewing information data and TV product information data, taking into account that the current traditional Internet resource recommendation system
5、s are mostly for individual recommendations, and are recommended for different family members. There may be counterproductive situations in which the on-demand collection of the entire family member is taken into account, constitutes a complete historical viewing record of the family user, analyzes
6、the preferences of each family member, establishes a television product marketing recommendation model, and makes a personalized recommendation of the program.At the same time, the composition of the labels of different programs is analyzed and displayed in the results in the form of data graphs mor
7、e intuitively to understand the heat and attention of the labels in different periods, thereby further obtaining the popularity of film and television works and recommending preferences for different periods. Make guidelines.Key Words: Collaborative filtering based on items; Personalized recommendat
8、ion; Program labels; Data processing協(xié)同過濾推薦系統(tǒng)1是個(gè)性化信息服務(wù)的重要組成部分,可以實(shí)現(xiàn)主動(dòng)精準(zhǔn)地為用戶推薦感興趣的信息。隨著互聯(lián)網(wǎng)上信息的增長(zhǎng)和用戶個(gè)性化需求的提高,推薦系統(tǒng)的應(yīng)用日益廣泛,成為電子商務(wù)、社會(huì)網(wǎng)絡(luò)、視頻和音樂點(diǎn)播等個(gè)性化服務(wù)的核心技術(shù)?;诖耍撐膰@電視產(chǎn)品的營(yíng)銷推薦系統(tǒng)及其若干關(guān)鍵模型與推薦算法實(shí)現(xiàn)了基于項(xiàng)目協(xié)同過濾的電視產(chǎn)品營(yíng)銷推薦的工作,并且經(jīng)過一些對(duì)比分析實(shí)驗(yàn),證明了基于項(xiàng)目協(xié)同過濾算法在推薦系統(tǒng)上具有一定優(yōu)勢(shì),并總結(jié)歸納了該文的優(yōu)缺點(diǎn),提出了改進(jìn)方向。1 相關(guān)工作數(shù)據(jù)預(yù)處理1.1 用戶及節(jié)目特征將所給數(shù)據(jù)進(jìn)行處理和分析,分
9、析其中用戶特征即觀看時(shí)長(zhǎng)、資源熱度以及資源關(guān)注度;分析其中節(jié)目特征即節(jié)目地區(qū)、節(jié)目語種、節(jié)目類型。1.2 正則表達(dá)式原本數(shù)據(jù)中存在如:“【】”,“(高清)”,“(10)”等附加信息,對(duì)于直接獲取到節(jié)目原本的名字造成了一定程度的干擾,該文利用Python中的正則表達(dá)式來去除存在于原節(jié)目名稱中的干擾字符串。如寄生獸(高清)經(jīng)過正則表達(dá)式除去干擾后為寄生獸。2 模型建立模型建立流程如圖1所示。2.1 基于項(xiàng)目的協(xié)同過濾算法基于項(xiàng)目的協(xié)同過濾通過分析項(xiàng)目之間的相似性進(jìn)行推薦,算法假設(shè):對(duì)于一些資源,如果很多的用戶對(duì)它的打分比較類似,那么當(dāng)前用戶對(duì)它的打分也會(huì)比較類似。算法將尋找與當(dāng)前資源評(píng)分最相似的資
10、源作為此資源的最近鄰居,通過當(dāng)前用戶對(duì)當(dāng)前資源最近鄰居的評(píng)分來預(yù)測(cè)他對(duì)此資源的評(píng)分。這里只以皮爾森相關(guān)系數(shù)為例。設(shè)Uab為對(duì)資源a和b都評(píng)價(jià)過的用戶的集合,那么相關(guān)相似性的皮爾森系數(shù)可表示為:(1)上式中,ru,a、ru,b代表用戶u對(duì)資源a和b的打分,和表示是大量用戶對(duì)資源a和b的打分的均值2。接下來對(duì)用戶評(píng)分進(jìn)行預(yù)測(cè):(2)2.2 協(xié)同過濾推薦將經(jīng)過上述清洗的數(shù)據(jù)用作模型的原始數(shù)據(jù),按照觀看的時(shí)間順序?qū)⒚總€(gè)用戶的觀看數(shù)據(jù)平均分為2份,其中較早的數(shù)據(jù)作為模型的訓(xùn)練數(shù)據(jù),較晚的數(shù)據(jù)作為模型的驗(yàn)證數(shù)據(jù)3,用來計(jì)算推薦結(jié)果的準(zhǔn)確率及召回率。首先剔除數(shù)據(jù)的異常值,剔除異常值的數(shù)據(jù)按照時(shí)間順序排序,然
11、后將排序后的數(shù)據(jù)讀入到列表中,對(duì)每一個(gè)用戶編號(hào)的觀看數(shù)據(jù)進(jìn)行均分處理。然后獲取訓(xùn)練數(shù)據(jù),導(dǎo)入到模型中進(jìn)行訓(xùn)練,輸出推薦的節(jié)目及推薦指數(shù)(見圖2)。3 實(shí)驗(yàn)及結(jié)果分析3.1 實(shí)驗(yàn)數(shù)據(jù)與評(píng)估指標(biāo)3.1.1 實(shí)驗(yàn)數(shù)據(jù)此次實(shí)驗(yàn)所采用的是“泰迪杯”數(shù)據(jù)挖掘挑戰(zhàn)賽平臺(tái)的數(shù)據(jù),共計(jì)445278條數(shù)據(jù),其中包括了用戶收視信息、電視產(chǎn)品信息數(shù)據(jù)和用戶基本信息3個(gè)方面。3.1.2 評(píng)估指標(biāo)精確率(precision)的公式是,它計(jì)算的是所有“正確被檢索的item(TP)”占所有“實(shí)際被檢索到的(TP+FP)”的比例。召回率(recall)的公式是,它計(jì)算的是所有“正確被檢索的item(TP)”占所有“應(yīng)該檢索到的
12、item(TP+FN)”的比例。3.2 實(shí)驗(yàn)結(jié)果采用基于項(xiàng)目的協(xié)同過濾算法,根據(jù)上述分成的前期訓(xùn)練數(shù)據(jù)以及后期的評(píng)判數(shù)據(jù),此用戶的推薦準(zhǔn)確率為20.000%,召回率為16.000%。4 結(jié)論與展望該文通過對(duì)用戶觀看收視信息數(shù)據(jù)、電視產(chǎn)品信息數(shù)據(jù)等進(jìn)行基于項(xiàng)目協(xié)同過濾的算法處理,實(shí)現(xiàn)了單個(gè)家庭的個(gè)性化節(jié)目推薦,同時(shí)考慮了單個(gè)家庭不同用戶偏好不同的情況,實(shí)現(xiàn)了推薦結(jié)果的標(biāo)簽豐富性,同時(shí)綜合標(biāo)簽的數(shù)據(jù)圖結(jié)果,在推薦結(jié)果中考慮了熱度偏好,較好地實(shí)現(xiàn)了個(gè)性化推薦。在實(shí)際調(diào)查后,我們還發(fā)現(xiàn)目前存在著用戶不愿過多對(duì)接收的資源評(píng)分、打標(biāo)簽等致使資源提供者需要花費(fèi)更多的精力分析用戶對(duì)資源的使用情況、用戶性別年齡、地區(qū)等基本屬性缺失,且難以從觀看節(jié)目準(zhǔn)確判斷等問題。因此,在系統(tǒng)的用戶交互上應(yīng)采取觀看后星級(jí)打分手段,有償積分長(zhǎng)評(píng)短評(píng)等策略,進(jìn)一步完成標(biāo)簽補(bǔ)全,同時(shí)在用戶進(jìn)行賬號(hào)注冊(cè)時(shí)可完成對(duì)性別年齡這些基本特征的補(bǔ)全。在分析過程中應(yīng)意識(shí)到電視賬號(hào)不具有手機(jī)號(hào)碼的普及性,一個(gè)家庭可以共用一個(gè)電視賬號(hào),因此賬號(hào)注冊(cè)只能獲取家庭成員之
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 某村年度工作總結(jié)
- 信息技術(shù)(第2版)(拓展模塊)教案3-模塊3 3.3 大數(shù)據(jù)工具
- 中班秋季安全教育教案20篇
- 班級(jí)心理健康教育工作計(jì)劃
- 課時(shí)7 七年級(jí) Unit 7 2025年中考英語(仁愛版)一輪復(fù)習(xí)基礎(chǔ)練(含答案)
- 【中考考點(diǎn)基礎(chǔ)練】階段訓(xùn)練三 第11~15章 2025年中考物理總復(fù)習(xí) (廣東)(含答案)
- 高中物理第三章相互作用實(shí)驗(yàn):探究互成角度力的合成課件粵教版必修第一冊(cè)
- 2013-2018年中國(guó)噻吩行業(yè)發(fā)展前景與投資戰(zhàn)略規(guī)劃分析報(bào)告
- 2024至2030年中國(guó)數(shù)碼彩激紙數(shù)據(jù)監(jiān)測(cè)研究報(bào)告
- 2024至2030年中國(guó)感應(yīng)擦鞋機(jī)數(shù)據(jù)監(jiān)測(cè)研究報(bào)告
- 小學(xué)數(shù)學(xué)西南師大五年級(jí)上冊(cè)四小數(shù)混合運(yùn)算教案
- 韓昌黎文集韓愈文集
- 小學(xué)四年級(jí)美術(shù)學(xué)業(yè)質(zhì)量監(jiān)測(cè)試題
- 求職個(gè)人簡(jiǎn)歷表格【范本模板】
- 《企業(yè)財(cái)務(wù)分析》課程思政教學(xué)案例
- VFP數(shù)據(jù)庫(kù)操作常用命令
- 滬科版七年級(jí)上冊(cè)數(shù)學(xué)教學(xué)課件3.2 第3課時(shí) 比例與和、差、倍、分問題
- 中國(guó)旅游地理(第七版)第03章中國(guó)旅游資源地理
- syb游戲模塊 基本企業(yè)周期
- 上消化道出血病歷模板書寫規(guī)范范文
- 《幼兒園大班第一學(xué)期家長(zhǎng)會(huì)》 PPT課件
評(píng)論
0/150
提交評(píng)論