




已閱讀5頁(yè),還剩16頁(yè)未讀, 繼續(xù)免費(fèi)閱讀
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
此文檔收集于網(wǎng)絡(luò),如有侵權(quán),請(qǐng)聯(lián)系網(wǎng)站刪除今日頭條個(gè)性化資訊推薦技術(shù)分析資訊產(chǎn)品近幾年持續(xù)火爆,賺足了人們的眼球。以今日頭條披露的數(shù)據(jù)為例:日活躍用戶超過(guò)一億,單用戶日均使用時(shí)長(zhǎng)超過(guò) 76分鐘,資訊類產(chǎn)品的火爆程度可見(jiàn)一斑。資訊類產(chǎn)品的火爆讓BAT巨頭坐臥不安,紛紛站出來(lái)反擊。手機(jī)百度除了搜索框之外,大部分已經(jīng)被一條條新聞?wù)紦?jù)。阿里則是依托UC瀏覽器上線了自己的頭條。騰訊在騰訊新聞之外,從頭搞起了天天快報(bào)。頭條為何能取得成功?很多人會(huì)說(shuō)是頭條的個(gè)性化推薦技術(shù)做得好,個(gè)人認(rèn)為其實(shí)不盡然。本文羅列了相關(guān)的個(gè)性化推薦技術(shù),特別是資訊推薦常用的算法,帶大家從“內(nèi)行”的角度來(lái)解密下個(gè)性化資訊推薦技術(shù)。希望讀者讀后能發(fā)自內(nèi)心地覺(jué)得:頭條其實(shí)也就那么回事。本文主體分以下三個(gè)大的部分。除此以外也會(huì)在最后用一小節(jié)展望下個(gè)性化資訊推薦的未來(lái)。1. 個(gè)性化資訊產(chǎn)品:先介紹資訊推薦產(chǎn)品是什么,著重分析其業(yè)務(wù)特點(diǎn)。2. 個(gè)性化推薦方案:接著介紹資訊推薦所需的技術(shù),著重分析其技術(shù)難點(diǎn)。3. 個(gè)性化推薦算法:最后介紹業(yè)界常用的個(gè)性化推薦算法。個(gè)性化資訊產(chǎn)品資訊推薦產(chǎn)品要解決用戶需求很簡(jiǎn)單,一句就可以概括:為用戶找到有趣的資訊。而做到這個(gè)需求就要做好兩個(gè)關(guān)鍵點(diǎn):1. 新聞聚合。用戶希望在一個(gè)產(chǎn)品里獲取任何他想要或者可能想要的東西,這就要求產(chǎn)品要聚合其他app、網(wǎng)站、甚至線下媒體里的各種資訊,這也是最基本的一個(gè)產(chǎn)品特性。2. 個(gè)性化。要去最大程度地理解、猜測(cè)用戶的興趣,結(jié)合興趣為其推薦相關(guān)資訊,這是資訊產(chǎn)品后期衍生出來(lái)的一個(gè)產(chǎn)品特性。更進(jìn)一步,如果將上述兩個(gè)關(guān)鍵點(diǎn)展開(kāi),一個(gè)好的個(gè)性化資訊產(chǎn)品就要具備以下亮點(diǎn):1.時(shí)效性這是所有資訊類產(chǎn)品共同的特性,而不僅僅是資訊推薦類產(chǎn)品。人們總是希望通過(guò)你的產(chǎn)品看到最近發(fā)生了什么,而不是很久之前的老新聞。2.精準(zhǔn)性每天發(fā)生的事情有很多,對(duì)應(yīng)的新聞稿子也非常多,如果每個(gè)都看,信息過(guò)載的問(wèn)題會(huì)讓人吃不消。你能否猜出我的興趣,并精準(zhǔn)地推薦感興趣的新聞才是用戶關(guān)心的,也是用戶能直接感受到的體驗(yàn)。3.豐富性這點(diǎn)恰是很多用戶最容易忽略的一個(gè)點(diǎn)。其實(shí)很多用戶才不管這個(gè)資訊類產(chǎn)品是怎么推出來(lái)的,對(duì)于單個(gè)用戶而言,其第一訴求必然是通過(guò)這個(gè)產(chǎn)品來(lái)了解世界,知道每天都在發(fā)生什么,所以新聞的豐富性是最最基本的。4.排他性每天描述同一事件稿子很多,在自媒體時(shí)代這個(gè)問(wèn)題更加突出,但用戶只會(huì)用有限時(shí)間去了解這件事,而不是去研究所有關(guān)于這件事的報(bào)道,更不想甄別不同報(bào)道的差異。所以,用戶往往需要的是一個(gè)事情的一兩個(gè)報(bào)道,保證給我差異化的內(nèi)容是必須的。5.熱門(mén)性誰(shuí)都不想在周圍朋友們討論熱點(diǎn)事件時(shí),自己是個(gè)懵逼,什么都不知道。這點(diǎn)很關(guān)鍵,跟精準(zhǔn)性和個(gè)性化看起來(lái)有點(diǎn)背道而馳,但人性天生就有求同的天性。沒(méi)有同樣的話題,生活將會(huì)失去太多色彩,不知道該和人交流什么。6.高質(zhì)量媒體質(zhì)量層次不齊,有的文章寫(xiě)得很好很炫,讀的時(shí)候很過(guò)癮,但一旦你發(fā)現(xiàn)它是一個(gè)假新聞或者歪曲報(bào)道,你還是對(duì)這類文章嗤之以鼻。新聞可以高于事實(shí),但不能背離事實(shí)。7.合法性人總是對(duì)非法的事情感興趣,如黃賭毒之類。而對(duì)于被壓抑的需求,則更是感興趣,如色情之類。但一個(gè)偉大的產(chǎn)品,首先必須是一個(gè)合法的產(chǎn)品。所以,一切盡在不言中了。個(gè)性化推薦方案要做到上一節(jié)提到的產(chǎn)品特性,有兩條路可以走:人工運(yùn)營(yíng)和算法推薦。在類頭條產(chǎn)品出現(xiàn)之前,請(qǐng)新聞方面專業(yè)人才來(lái)運(yùn)營(yíng)是最穩(wěn)妥的方式。但人工運(yùn)營(yíng)成本越來(lái)越高,局限性越來(lái)越明顯。走算法推薦的路,在張揚(yáng)個(gè)性的年代,是一條必由之路。下表簡(jiǎn)要對(duì)比下兩者的差別。推薦算法應(yīng)用在資訊類產(chǎn)品時(shí)有一些挑戰(zhàn),這也是資訊推薦能否做好的關(guān)鍵所在??蓴U(kuò)展性推薦本質(zhì)是建立user和item的關(guān)聯(lián),一般問(wèn)題要么是user側(cè)量級(jí)大,要么是item側(cè)量級(jí)大,而資訊推薦是典型的“雙大”場(chǎng)景。又由于是高度依賴個(gè)性化的場(chǎng)景,還不能簡(jiǎn)單地將某一側(cè)大幅降維,所以可擴(kuò)展性顯得尤為重要。稀疏性資訊的高度個(gè)性化自然而然的帶來(lái)一個(gè)很棘手的問(wèn)題就是稀疏性。舉個(gè)最簡(jiǎn)單的例子,如果將user和item的 點(diǎn)擊行為用矩陣形式表示出來(lái),會(huì)發(fā)現(xiàn)比一般問(wèn)題更多的0項(xiàng)存在。而稀疏問(wèn)題是一直困擾機(jī)器學(xué)習(xí)高效建模的一大難題。冷啟動(dòng)每天都有大量的新聞產(chǎn)生,如何將如此多的新聞快速、合理地冷啟動(dòng),盡快將高質(zhì)量的新聞推給合適的用戶是個(gè)大問(wèn)題。時(shí)效性不同于商品、書(shū)籍、電影、視頻等的推薦,新聞一大特點(diǎn)是生命周期非常短,有的甚至只有幾個(gè)小時(shí)。如何在最短的時(shí)間里把新聞推給感興趣的人,在新聞進(jìn)入“暮年”之前發(fā)揮它的最大價(jià)值是個(gè)非常重要的問(wèn)題。質(zhì)量保證新聞本身量大,且時(shí)效性強(qiáng),如何在短時(shí)間里快速評(píng)估每篇稿子的質(zhì)量和合法性,做到最高效、最精準(zhǔn)的內(nèi)容審核是個(gè)大課題。動(dòng)態(tài)性這里的動(dòng)態(tài)性主要體現(xiàn)為用戶興趣隨時(shí)間改變、當(dāng)前熱點(diǎn)隨時(shí)間改變。用戶在一天里的不同時(shí)刻、不同地點(diǎn)、不同上下文里的閱讀興趣都有所差別,動(dòng)態(tài)在變化。個(gè)性化推薦算法圍繞上面這幾個(gè)挑戰(zhàn),業(yè)界各大資訊類產(chǎn)品在做推薦時(shí)想出了各種招兒來(lái)解決,接下來(lái),我們就梳理下業(yè)界經(jīng)典的做法。這里以產(chǎn)品為主線,以具體要解決的問(wèn)題為輔線來(lái)進(jìn)行梳理,會(huì)集中介紹下Google News、Yahoo Today、今日頭條等產(chǎn)品的推薦算法,并著重介紹下深度學(xué)習(xí)在這個(gè)領(lǐng)域的最新進(jìn)展。Google NewsGoogle News是一款經(jīng)典的資訊推薦產(chǎn)品,也是后來(lái)者競(jìng)相模仿的對(duì)象。2007年,Google News在www上首次發(fā)表論文Google News Personalization: Scalable Online Collaborative Filtering公開(kāi)資訊推薦技術(shù)。該論文的做法非常自然、簡(jiǎn)潔,從論文題目就能看出是CF的落地上線。Google是這樣想的:鑒于大家都覺(jué)得CF是推薦領(lǐng)域公認(rèn)的有效算法,那將其直接用在產(chǎn)品上效果自然也不會(huì)太差。但經(jīng)典的CF有個(gè)巨大的問(wèn)題,無(wú)論是user-based還是item-based,當(dāng)你要算任意兩個(gè)user或者兩個(gè)item之間相似度的時(shí)候,計(jì)算量會(huì)非常巨大。因?yàn)镃F的計(jì)算量直接取決于特征維數(shù)和user、item pairs的數(shù)目,而資訊類產(chǎn)品這兩個(gè)數(shù)目都非常巨大:1. 每個(gè)user、item的特征因?yàn)榇蠖嗍瞧毓?、點(diǎn)擊等行為類特征,而資訊類產(chǎn)品這些行為發(fā)生的cost很小幾乎可以忽略不計(jì),導(dǎo)致維度往往比較高;2. 資訊類產(chǎn)品的user數(shù)目和item數(shù)目都很大,這和一般領(lǐng)域往往只有一方比較大是不同的。Google這篇論文的核心就是將CF改造為支持大規(guī)模計(jì)算的方法。其原理也很簡(jiǎn)單:將用戶事先分成群,再做user-based CF時(shí)實(shí)際變成了(user) cluster-based CF。這樣在工程實(shí)現(xiàn)上就簡(jiǎn)化了很多,線上只需要記錄每群用戶喜歡什么(實(shí)際做法是用到了基于的內(nèi)存key-value系統(tǒng),key為資訊ID,而value則是資訊在用戶群上的各種統(tǒng)計(jì)值)。一個(gè)用戶來(lái)了之后,先找到其對(duì)應(yīng)的群,再推薦這個(gè)群喜歡的資訊就好。而線下則借助Map-Reduce實(shí)現(xiàn)了MinHash、PLSI兩種聚類分群算法,定時(shí)把最新分群結(jié)果推到線上。為什么Google News會(huì)先選擇協(xié)同過(guò)濾算法呢?除了CF算法在其他場(chǎng)景有成功的應(yīng)用之外,還有一個(gè)重要的特點(diǎn):CF是一個(gè)依賴用戶行為數(shù)據(jù)就可以work的算法,它不像其他基于內(nèi)容推薦的算法對(duì)NLP能力要求很高。選擇CF,則繞過(guò)了NLP這個(gè)攔路虎(有經(jīng)驗(yàn)的人都知道,NLP是一個(gè)長(zhǎng)期積累的過(guò)程,很難一開(kāi)始就做到比較出色的程度)。透過(guò)這篇文章,我們也不難發(fā)現(xiàn)工業(yè)界解決實(shí)際問(wèn)題時(shí)的一個(gè)基本套路:重頭做一個(gè)模型時(shí),會(huì)選擇最經(jīng)典的一個(gè)實(shí)現(xiàn),然后快速上線解決一大半問(wèn)題。結(jié)合前面總結(jié)的資訊推薦的挑戰(zhàn),可以看到該算法主要解決了可擴(kuò)展性問(wèn)題。我們也不難發(fā)現(xiàn)這個(gè)user cluster-based的算法也有一些明顯的缺點(diǎn):1)它不能解決新用戶、新資訊的冷啟動(dòng),因?yàn)闆](méi)有行為數(shù)據(jù)來(lái)支撐CF運(yùn)轉(zhuǎn);2)推薦精度不夠高,沒(méi)有做到真正的個(gè)性化。這是cluster-based CF算法本身的特點(diǎn)決定的;3)實(shí)時(shí)性不夠。用戶聚類不能做到快速更新,這導(dǎo)致了對(duì)用戶最新興趣把握有不及時(shí)的風(fēng)險(xiǎn)。這些問(wèn)題在Google News的另一篇論文中得到了解決。Google News在www 2010上放出了Personalized News Recommendation Based on Click Behavior。這篇文章重點(diǎn)解決推薦精準(zhǔn)性和新資訊的冷啟動(dòng)問(wèn)題,文章想法也很樸素自然,主要是基于貝葉斯理論進(jìn)行建模。他們假設(shè)用戶興趣有兩個(gè)方面:個(gè)人不斷變化的興趣以及當(dāng)前新聞熱點(diǎn)。在具體建模之前,作者先基于歷史數(shù)據(jù)進(jìn)行了統(tǒng)計(jì)分析,驗(yàn)證了他們的假設(shè),得到如下基本結(jié)論:用戶的興趣是隨時(shí)間變化的,新聞熱點(diǎn)也是隨時(shí)間變化的。還有一個(gè)比較比較有趣的結(jié)論是不同地區(qū)同一時(shí)間的新聞熱點(diǎn)是不一樣的。下圖是不同地區(qū)不同時(shí)刻體育類新聞的閱讀占比。這幅圖縱軸是體育新聞閱讀量在該地區(qū)總新聞閱讀量的占比,越高表示該地區(qū)的用戶越喜歡看體育新聞。橫軸則是時(shí)間點(diǎn),用黑線標(biāo)示出的三個(gè)時(shí)間點(diǎn)從右到左則分別對(duì)應(yīng)奧運(yùn)會(huì)、歐洲杯以及美國(guó)職業(yè)棒球大聯(lián)盟進(jìn)行時(shí)。而圖中的三條不同(顏色)標(biāo)示的線則代表西班牙、美國(guó)、英國(guó)三個(gè)地區(qū)。不難發(fā)現(xiàn),這副圖不僅揭示了同一地區(qū)用戶對(duì)體育新聞的感興趣程度是隨時(shí)間變化的,更揭示出西班牙、英國(guó)等國(guó)家更愛(ài)看體育新聞。方法主要建模用戶對(duì)當(dāng)前某類新聞的感興趣的程度,這取決于兩個(gè)方面:用戶對(duì)這類新聞的興趣度以及當(dāng)前某類新聞的熱度。通過(guò)貝葉斯理論,這兩個(gè)方面可以直接用如下公式聯(lián)系在一起:其中分子左半部分表示用戶當(dāng)前對(duì)某類新聞感興趣的概率,它是通過(guò)最近不同時(shí)間段用戶對(duì)某類新聞感興趣的程度來(lái)匯總計(jì)算,而用戶某個(gè)時(shí)間段內(nèi)對(duì)一類新聞感興趣的程度則通過(guò)下式計(jì)算。這個(gè)公式粗看起來(lái)比較復(fù)雜,實(shí)際含義其實(shí)很簡(jiǎn)單,可以理解為簡(jiǎn)單統(tǒng)計(jì)下某類新聞閱讀量占用戶該時(shí)間段內(nèi)所有新聞閱讀量的比例即可。而分子右半部分表示當(dāng)前本地區(qū)某類新聞的熱度(這類新聞被該地區(qū)點(diǎn)擊的概率),實(shí)際也是統(tǒng)計(jì)一下短時(shí)間內(nèi)對(duì)這類新聞的用戶點(diǎn)擊占比得到的??傮w來(lái)看,該算法是非常簡(jiǎn)潔自然的,它針對(duì)CF遺留的問(wèn)題進(jìn)行了很好的解決:1)引入新聞?lì)悇e解決了新新聞的冷啟動(dòng);2)引入用戶興趣解決了個(gè)性化和推薦精確度的問(wèn)題。但新用戶冷啟動(dòng)還有優(yōu)化的空間,因?yàn)榘凑者@個(gè)方法,同一地區(qū)不同新用戶推薦的都是該地區(qū)最熱門(mén)的內(nèi)容。Yahoo TodayYahoo Today團(tuán)隊(duì)2009年在WWW上發(fā)表 Personalized Recommendation on Dynamic Content Using Predictive Bilinear Models,重點(diǎn)解決資訊推薦里的冷啟動(dòng)問(wèn)題。不同于上一篇google news的做法,這篇文章試圖同時(shí)解決新用戶和新資訊的冷啟動(dòng)。本文的基本假設(shè):用戶畫(huà)像能刻畫(huà)用戶的閱讀興趣,新聞的畫(huà)像也可以表示新聞的點(diǎn)擊率,而用戶喜歡一條新聞的程度則取決于靜態(tài)預(yù)測(cè)和動(dòng)態(tài)預(yù)測(cè)兩個(gè)方面,都是用feature-based learning方法來(lái)建模用戶對(duì)資訊感興趣的程度。具體來(lái)講,用戶xi對(duì)資訊zj的興趣得分如下計(jì)算。所謂的 bilinear model 的含義當(dāng)你隱去一個(gè)自變量時(shí),另一個(gè)自變量和因變量成線性關(guān)系。比如下式不考慮z時(shí),s和x成線性關(guān)系;不考慮x時(shí),s和z也成線性關(guān)系。進(jìn)一步如果將用戶和資訊的特征分為靜態(tài)和動(dòng)態(tài)兩大類,則上式可寫(xiě)為:最后一個(gè)等式后面的第一項(xiàng)是靜態(tài)預(yù)測(cè)得分,第二項(xiàng)則是動(dòng)態(tài)預(yù)測(cè)的得分。所以當(dāng)一個(gè)新的用戶到來(lái)時(shí),第二項(xiàng)的特征是沒(méi)有,相當(dāng)于僅用用戶的畫(huà)像等靜態(tài)特征來(lái)解決新用戶的預(yù)測(cè)問(wèn)題。當(dāng)一個(gè)新資訊時(shí),也是同樣的道理。靜態(tài)特征如搜集到的用戶的年齡、性別、地域等基礎(chǔ)屬性,以及從其他途徑獲取的如在相似產(chǎn)品上的行為、其他場(chǎng)景上的歷史信息等,還有資訊的類目、主題等。而動(dòng)態(tài)特征如用戶在Yahoo Today上的各種閱讀、點(diǎn)擊、評(píng)分以及加工出來(lái)的某條資訊、某類資訊分時(shí)間段的各種統(tǒng)計(jì)值等。有了預(yù)測(cè)分s,和真實(shí)的label (比如用戶是否點(diǎn)擊一個(gè)資訊r(i,j)做個(gè)比較就能得到機(jī)器學(xué)習(xí)訓(xùn)練時(shí)的反饋信息。本文優(yōu)化目標(biāo)是基于貝葉斯理論推導(dǎo)出來(lái)的最大化后驗(yàn)概率(maximum-a-posteriori, MAP),而優(yōu)化方法則采用熟知的梯度下降法(gradient-descent, GD)。2010年,Yahoo又發(fā)表了一篇更加有效解決冷啟動(dòng)的文章A Contextual-Bandit Approach to Personalized News Article Recommendation。這篇文章基于傳統(tǒng)的Explore-Exploit(EE)套路,大家可能比較熟悉的是為新item隨機(jī)一部分流量讓其曝光,得到一些反饋,然后模型才能對(duì)其有較好的建模能力,這是最nave的EE策略。稍微高大上一點(diǎn)的做法則是upper confidence bound(UCB)策略: 假設(shè)有K個(gè)新item沒(méi)有任何先驗(yàn),每個(gè)item的回報(bào)也完全不知道。每個(gè)item的回報(bào)均值都有個(gè)置信區(qū)間,而隨著試驗(yàn)次數(shù)增加,置信區(qū)間會(huì)變窄,對(duì)應(yīng)的是最大置信邊界向均值靠攏。如果每次投放時(shí),我們選擇置信區(qū)間上限最大的那個(gè),則就是UCB策略。這個(gè)策略的原理也很好理解,說(shuō)白了就是實(shí)現(xiàn)了兩種期望的效果:1. 均值差不多時(shí),每次優(yōu)先給統(tǒng)計(jì)不那么充分的資訊多些曝光;2. 均值有差異時(shí),優(yōu)先出效果好的。而yahoo這篇文章,則是對(duì)UCB進(jìn)行了優(yōu)化,因?yàn)閁CB對(duì)item沒(méi)有任何先驗(yàn)知識(shí),而linUCB可以引入一些先驗(yàn)知識(shí)。比如你在推薦新聞時(shí),可能發(fā)現(xiàn)娛樂(lè)類新聞天然比體育類新聞點(diǎn)擊率高。如果能把這個(gè)信息作為先驗(yàn)知識(shí)考慮進(jìn)EE策略中,就可以加速EE的效率。LinUCB假設(shè)每次曝光的回報(bào)是和Feature(user, item) 成linear關(guān)系的,然后使用model預(yù)估期望點(diǎn)擊和置信區(qū)間來(lái)加速收斂。深度學(xué)習(xí)篇日益紅火的深度學(xué)習(xí)也在不斷影響著資訊推薦,在這一節(jié)就簡(jiǎn)要review下最近爆出來(lái)的幾篇相關(guān)文章,大致可以分為兩類:1)embedding技術(shù)。此時(shí)深度學(xué)習(xí)主要用來(lái)學(xué)習(xí)user/item的embedding也就是通常意義上的user/item的表示形式,每個(gè)user/item可以表示為一個(gè)向量,向量之間的相似度可以用來(lái)改善推薦。這里深度學(xué)習(xí)的重點(diǎn)是用來(lái)學(xué)習(xí)合理的表示;2)使用深度學(xué)習(xí)直接對(duì)預(yù)測(cè)目標(biāo)建模。此時(shí)深度學(xué)習(xí)的重點(diǎn)放在最終要解決的問(wèn)題上。初看起來(lái)似乎第一種形式不如后者來(lái)得直接,但第一種形式在實(shí)際應(yīng)用中通常能起到簡(jiǎn)化架構(gòu)、快速解決問(wèn)題的功效,還能作為一個(gè)基礎(chǔ)特征來(lái)改進(jìn)線上其他環(huán)節(jié)的效果。下面我們分別選擇一兩篇有代表性的文章來(lái)進(jìn)行科普。Yahoo Japan的新聞推薦團(tuán)隊(duì)利用denoising autoencode的技術(shù)來(lái)學(xué)習(xí)新聞的vector表示。Autoencode大家可能比較熟悉,它通過(guò)最小化變換前后信號(hào)的誤差來(lái)求解,而denoising則是對(duì)輸入隨機(jī)加入一些噪聲,再對(duì)其進(jìn)行變換輸出,最終是通過(guò)最小化加噪聲后的輸出和原始(不加噪聲)輸入之間的差異來(lái)求解。應(yīng)用中不少結(jié)果表明,這種方法比傳統(tǒng)的autoencode學(xué)習(xí)到的vector效果更好。具體示意圖如下。但這種方法是經(jīng)典的無(wú)監(jiān)督學(xué)習(xí)套路,直觀來(lái)看和應(yīng)用場(chǎng)景中要求相似新聞的vector也要盡量相似沒(méi)有直接的關(guān)聯(lián)(這里單單從優(yōu)化目標(biāo)來(lái)看,實(shí)際上由于語(yǔ)料的天然性質(zhì)或者人們用語(yǔ)習(xí)慣,這個(gè)相似性的要求已經(jīng)間接隱含在優(yōu)化目標(biāo)里了)。而新聞?dòng)泻芏嗳藗兙庉嫼没蛘咂渌P彤a(chǎn)生好的類別信息,假如A、B新聞都是體育類,C是教育類的,通常意義上來(lái)講和相似度是比和要高的。這是在訓(xùn)練深度學(xué)習(xí)時(shí)已知的先驗(yàn)知識(shí),如果能把它加入到優(yōu)化目標(biāo)中,學(xué)習(xí)到的vector就能更好的表達(dá)相似度信息,于是有了下面的方法。如圖所示,通過(guò)在原始autoencode的優(yōu)化目標(biāo)中加入“同類新聞相似度大于不同類新聞相似度”這一項(xiàng),我們就可以把先驗(yàn)知識(shí)作為約束加到模型中。Yahoo Japan的人實(shí)驗(yàn)證明了如此得到的vector確實(shí)能更好的表示(相似度信息)。微軟研究院也提出過(guò)一種很有趣的得到item表示的方法。作者利用用戶的搜索日志,同一個(gè)query下,搜索引擎往往返回n篇doc,用戶一般會(huì)點(diǎn)擊相關(guān)的doc,不太相關(guān)的一般不會(huì)點(diǎn),利用這個(gè)反饋信息也可以訓(xùn)練神經(jīng)網(wǎng)絡(luò)。具體示意圖如下,這里的優(yōu)化目標(biāo)就是要求點(diǎn)擊的一個(gè)doc_i的預(yù)測(cè)得分p(D_i|Q)要高于不點(diǎn)擊的,論文基于這個(gè)信息構(gòu)造除了損失函數(shù),也就得到了最終機(jī)器學(xué)習(xí)可以優(yōu)化的一個(gè)目標(biāo)。目前只介紹了如何得到item的vector,實(shí)際推薦中要用到的一般是user對(duì)一個(gè)item的興趣程度,只有在得到user vector后才能通過(guò)算user和item的相似度來(lái)度量這個(gè)興趣程度。那么如何得到user的vector呢?了解的同學(xué)可能能想到,既然我們已經(jīng)得到了新聞的item的表示,想辦法把他們傳到user側(cè)不就行了么?確實(shí)如此,一種簡(jiǎn)單的做法是把用戶近期點(diǎn)過(guò)的所有新聞的vector取個(gè)平均或者加權(quán)平均就可以得到user的vector了。但這種模式還有優(yōu)化的空間:1)用戶點(diǎn)擊是一個(gè)序列,每次點(diǎn)擊不是獨(dú)立的,如果把序列考慮進(jìn)去就有可能得到更好的表示;2)點(diǎn)擊行為和曝光是有聯(lián)系的,點(diǎn)擊率更能體現(xiàn)用戶對(duì)某個(gè)或某類新聞的感興趣程度。鑒于這兩點(diǎn),我們很容易想到通過(guò)深度學(xué)習(xí)里經(jīng)典的解決序列學(xué)習(xí)的RNN方法,Yahoo japan的人使用的就是一個(gè)經(jīng)典的RNN特例:LSTM。訓(xùn)練時(shí)將用戶的曝光和點(diǎn)擊行為作為一個(gè)序列,每次有點(diǎn)或不點(diǎn)這樣的反饋,就很容易套用LSTM訓(xùn)練得到user的vector,具體做法如下圖所示。微軟還發(fā)表了A Multi-View Deep Learning Approach for Cross Domain User Modeling in Recommendation Systems,文章提出了一種有趣的得到user vector的方法,這是一個(gè)典型的multi-view learning的方法?,F(xiàn)在很多公司都不僅僅只有一個(gè)產(chǎn)品,而是有多個(gè)產(chǎn)品線。比如微軟可能就有搜索、新聞、appstore、xbox等產(chǎn)品,如果將用戶在這些產(chǎn)品上的行為(反饋)統(tǒng)一在一起訓(xùn)練一個(gè)深度學(xué)習(xí)網(wǎng)絡(luò),就能很好的解決單個(gè)產(chǎn)品上(用戶)冷啟動(dòng)、稀疏等問(wèn)題。具體網(wǎng)絡(luò)結(jié)構(gòu)如下,總體的優(yōu)化目標(biāo)是保證在所有視圖上user和正向反饋的item的相似度大于隨機(jī)選取的無(wú)反饋或者負(fù)向反饋的相似度,并且越大越好。用數(shù)學(xué)公式形式化出來(lái)是:對(duì)應(yīng)的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如下圖所示。今日頭條作為國(guó)內(nèi)當(dāng)紅的個(gè)性化推薦產(chǎn)品,今日頭條技術(shù)經(jīng)歷了三個(gè)階段:1)早期以非個(gè)性化推薦為主,重點(diǎn)解決熱文推薦和新文推薦,這個(gè)階段對(duì)于用戶和新聞的刻畫(huà)粒度也比較粗,并沒(méi)有大規(guī)模運(yùn)用推薦算法。2)中期以個(gè)性化推薦算法為主,主要基于協(xié)同過(guò)濾和內(nèi)容推薦兩種方式。協(xié)同過(guò)濾技術(shù)和前面介紹的大同小異,不再贅述?;趦?nèi)容推薦的方式,則借助傳統(tǒng)的NLP、word2vec和LDA對(duì)新聞?dòng)辛烁嗟目坍?huà),然后利用用戶的正反饋(如點(diǎn)擊,閱讀時(shí)長(zhǎng)、分享、收藏、評(píng)論等)和負(fù)反饋(如不感興趣等)建立用戶和新聞標(biāo)簽之間的聯(lián)系,從而來(lái)進(jìn)行統(tǒng)計(jì)建模。3)當(dāng)前以大規(guī)模實(shí)時(shí)機(jī)器學(xué)習(xí)算法為主,用到的特征達(dá)千億級(jí)別,能做到分鐘級(jí)更新模型。 架構(gòu)分為兩層(圖來(lái)自頭條架構(gòu)師的分享): 檢索層,有多個(gè)檢索分支,拉出用戶感興趣的新聞候選; 打分層,基于用戶特征、新聞特征、環(huán)境特征三大類特征使用實(shí)時(shí)學(xué)習(xí)進(jìn)行建模打分。值得一提的是,實(shí)際排序時(shí)候并不完全按照模型打分排序,會(huì)有一些特定的業(yè)務(wù)邏輯綜合在一起進(jìn)行最終排序并吐給用戶。任何一種算法都有其局限性,業(yè)務(wù)要結(jié)合自己產(chǎn)品的特點(diǎn),選擇合適的算法解決特定的小問(wèn)題,融合各種算法解決一個(gè)大問(wèn)題。另外要設(shè)計(jì)合理的實(shí)驗(yàn)和放量機(jī)制,以在有限的影響內(nèi),最大程度地利用真實(shí)的用戶行為來(lái)修正算法判定的結(jié)果。比如,可以先放5%的流量來(lái)試探用戶對(duì)新聞的興趣,并用模型進(jìn)行建模;再用15%的流量來(lái)修正模型的效果,進(jìn)行優(yōu)勝劣汰;最后將真正置信的推薦結(jié)果推送到全量用戶。個(gè)性化資訊推薦的未來(lái)個(gè)資訊消費(fèi)是人的基本需求,個(gè)性化資訊推薦讓我們能更好地消費(fèi)資訊,享受生活的快樂(lè)。個(gè)性化資訊推薦還有很長(zhǎng)的路要走,目前面世的產(chǎn)品僅僅邁出了第一步,看起來(lái)有模有樣,實(shí)際上問(wèn)題多多。例如被吐槽最多的一個(gè)問(wèn)題:用戶一天看了很多,但睡前閉目一想,記住的很少,對(duì)自己有用的更是鳳毛麟角。這只是一個(gè)表象,背后其實(shí)暴露了很多現(xiàn)有推薦的問(wèn)題。要做好一個(gè)資訊推薦產(chǎn)品,不單單精準(zhǔn)推薦技術(shù)需要演進(jìn),呈現(xiàn)形式、交互方式、產(chǎn)品形態(tài)、內(nèi)容生態(tài)等等都需要去探索,最最重要的要想清楚以下幾個(gè)本質(zhì)問(wèn)題: 人為什么需要閱讀? 人為什么會(huì)消費(fèi)資訊? 用戶為什么需要到你這閱讀資訊? 好的閱讀體驗(yàn)到底是什么,如何量化? 產(chǎn)品推薦的基因是什么?加油吧,個(gè)性化資訊推薦!參考文獻(xiàn):1. 桑賡陶, 把握市場(chǎng)、產(chǎn)品和技術(shù)的動(dòng)態(tài)匹配韓國(guó)三星電子公司產(chǎn)品開(kāi)發(fā)戰(zhàn)略演變的基本原則及其對(duì)中國(guó)企業(yè)的啟示2. Personalized Recommendation on Dynamic Content Using Predictive Bilinear Modelswww, 20093. Google News Personalization: Scalable Online Collaborative Filtering www,20074./techblogyahoo/dee
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年北京裝飾裝修合同范本
- 慢阻肺護(hù)理查房
- 小班愛(ài)眼護(hù)眼活動(dòng)總結(jié)
- 藥物滲漏不良事件分析
- 2025年人力資源管理試題含答案
- 膜性腎病的臨床護(hù)理
- 醫(yī)學(xué)人衛(wèi)教材配套建設(shè)要點(diǎn)
- 人音版小學(xué)音樂(lè)五年級(jí)上冊(cè)《外婆的澎湖灣》教學(xué)設(shè)計(jì)
- 七年級(jí)英語(yǔ)語(yǔ)法總結(jié)模版
- 教室衛(wèi)生大掃除活動(dòng)總結(jié)模版
- 2022萬(wàn)能試驗(yàn)機(jī)驗(yàn)收規(guī)范
- 西部計(jì)劃考試考題及答案
- 《低鉀血癥病人護(hù)理》課件
- 消防水池防水合同
- 2025年供港活牛供宰與屠宰設(shè)備采購(gòu)合同
- 2024綠城地產(chǎn)代建項(xiàng)目合作協(xié)議范本9篇
- 2024上海市招聘社區(qū)工作者考試題及參考答案
- 企業(yè)貸款知識(shí)培訓(xùn)
- 教科版三年級(jí)下冊(cè)科學(xué)全冊(cè)同步練習(xí)(一課一練)
- 餐飲服務(wù)自查記錄表
- 垃圾分類測(cè)試題(含答案)
評(píng)論
0/150
提交評(píng)論