基于用戶的協(xié)同過濾推薦技術(shù)_第1頁(yè)
基于用戶的協(xié)同過濾推薦技術(shù)_第2頁(yè)
基于用戶的協(xié)同過濾推薦技術(shù)_第3頁(yè)
基于用戶的協(xié)同過濾推薦技術(shù)_第4頁(yè)
基于用戶的協(xié)同過濾推薦技術(shù)_第5頁(yè)
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、基于用戶的協(xié)同過濾保舉技能摘要隨著因特網(wǎng)普及利用和電子商務(wù)迅猛生長(zhǎng),保舉體系已成為緊張研究范疇,人們對(duì)保舉技能作了普及的研究。本性化的保舉體系以本性化方法向用戶保舉商品,幫助用戶尋到他們所必要的商品,并便捷地完成購(gòu)置歷程。先容了電子商務(wù)體系中的協(xié)同過濾保舉技能,詳細(xì)闡發(fā)了基于用戶的協(xié)同過濾保舉算法,同時(shí)指出了它的長(zhǎng)處和缺點(diǎn)。關(guān)鍵詞電子商務(wù)協(xié)同過濾保舉體系保舉技能當(dāng)前,電子商務(wù)體系迅猛生長(zhǎng),隨之而來地出現(xiàn)了電子商務(wù)體系中的信息“超載征象。海量的物品信息無疑增長(zhǎng)了用戶購(gòu)置所需物品的難度,使得用戶很難敏捷正確地尋到本身真正中意的商品。為此,很多電子商務(wù)網(wǎng)站引入了保舉體系,以進(jìn)步用戶的點(diǎn)擊率,變網(wǎng)站的

2、欣賞者為購(gòu)置者,進(jìn)步用戶購(gòu)置樂成率和交織販賣本領(lǐng),進(jìn)而提拔網(wǎng)站的美譽(yù)度和用戶對(duì)網(wǎng)站的忠誠(chéng)度。所謂電子商務(wù)保舉體系是在相識(shí)和學(xué)慣用戶的需求與愛好的底子上為用戶提供商品信息和發(fā)起,模擬商家向用戶保舉其大概感愛好的商品,幫助用戶完成購(gòu)置歷程。提供本性化辦事已經(jīng)成為進(jìn)一步進(jìn)步網(wǎng)絡(luò)內(nèi)容辦事質(zhì)量急需辦理的緊張課題之一,也是將來網(wǎng)絡(luò)內(nèi)容辦事的一個(gè)生長(zhǎng)標(biāo)的目的。如今,險(xiǎn)些全部知名電子商務(wù)網(wǎng)站,諸如亞馬遜、dn、ebay、淘寶網(wǎng)等都接納了各式百般差異本性化程度的保舉體系。保舉體系中最焦點(diǎn)和關(guān)鍵的是所接納的保舉技能,它決定了保舉體系性能的優(yōu)劣。因此,增強(qiáng)對(duì)電子商務(wù)體系本性化保舉技能研究具有非常緊張的現(xiàn)實(shí)意義。如今

3、,重要的保舉技能有:基于內(nèi)容保舉、協(xié)同過濾保舉、基于關(guān)聯(lián)規(guī)矩保舉、基于效用保舉、基于知識(shí)保舉和組合保舉。此中,協(xié)同過濾保舉是應(yīng)用最早和最為樂成的技能之一,而基于用戶的協(xié)同過濾保舉又是最輕易明白的一種技能。一、協(xié)同過濾保舉協(xié)同過濾保舉技能在本性化保舉體系中應(yīng)用最廣,重要的可分為基于用戶和基于工程標(biāo)協(xié)同過濾算法。它一樣平常接納比來鄰技能,利用用戶的汗青愛好信息盤算用戶之間的間隔,然后利用目的用戶的“比來鄰人對(duì)商品評(píng)價(jià)的加權(quán)評(píng)代價(jià)來猜測(cè)目的用戶對(duì)特定商品的愛好程度,體系從而按照這一愛好程度來對(duì)目的用戶舉行保舉。協(xié)同過濾最大長(zhǎng)處是對(duì)保舉工具沒有特別的要求,能處置懲罰如音樂、影戲等如許非布局化的龐大工具

4、。協(xié)同過濾是基于如許的假設(shè):為一用戶尋到他真正感愛好的內(nèi)容的好要領(lǐng)是起首尋到與此用戶有相似愛好的其他用戶,然后將他們感愛好的內(nèi)容保舉給此用戶?;趨f(xié)同過濾的保舉體系可以說是從用戶的角度來舉行相應(yīng)保舉的,而且是主動(dòng)的,即用戶得到的保舉是體系從購(gòu)置形式或欣賞舉動(dòng)等隱式得到的,不必要用戶積極地尋到得當(dāng)本身愛好的保舉信息,如填寫一些觀察表格等。協(xié)同過濾保舉的一樣平常步調(diào)是:生意業(yè)務(wù)數(shù)據(jù)庫(kù)丈量用戶間相似性探求相似用戶盤算商品的購(gòu)置大概性按照購(gòu)置大概性保舉商品。二、基于用戶的協(xié)同過濾保舉1.算法基于用戶的協(xié)同過濾是到如今為止現(xiàn)實(shí)應(yīng)用中最為樂成的本性化保舉技能,算法的根本頭腦是將具有雷同愛好的用戶感愛好的工

5、程保舉給目的用戶。假設(shè)目的用戶對(duì)工程標(biāo)評(píng)價(jià)與他的“比來鄰人相似,而目的用戶對(duì)某個(gè)工程標(biāo)評(píng)價(jià)可以從他的“比來鄰人的評(píng)價(jià)中綜合得到?;谟脩舻膮f(xié)同過濾保舉算法重要包羅三個(gè)歷程:(1)表現(xiàn):創(chuàng)立一個(gè)用戶-工程評(píng)價(jià)矩陣形貌用戶對(duì)工程標(biāo)評(píng)價(jià)。用戶的斷定和偏好明白地表現(xiàn)為一個(gè)*n的用戶-工程評(píng)價(jià)矩陣r,這里是用戶數(shù),n是工程數(shù),r=(rij),元素rij表現(xiàn)用戶i對(duì)工程j的評(píng)價(jià)。在電子商務(wù)保舉體系中,元素rij既可表現(xiàn)用戶是否購(gòu)置商品(比方0大概1),也可表現(xiàn)用戶對(duì)商品的偏好程度(比方評(píng)分從1到10)。(2)天生“鄰人:通過盤算全部用戶對(duì)之間的相似度形成“鄰人。盤算體系中目的用戶與其他全部用戶的相似度,以

6、尋出k個(gè)最相似用戶集“比來鄰人。k-“比來鄰人依相似度排序。(3)產(chǎn)生保舉:通過加權(quán)目的用戶“鄰人對(duì)目的工程標(biāo)評(píng)價(jià)產(chǎn)生保舉。按照“比來鄰人集,可盤算目的用戶對(duì)工程標(biāo)猜測(cè)評(píng)代價(jià),進(jìn)而產(chǎn)生保舉。假定用戶i的“比來鄰人集為si,用戶i對(duì)工程x的猜測(cè)評(píng)代價(jià)為pi,x,用戶i和用戶j的相似度為si(i,j),用戶i和用戶j的均勻評(píng)代價(jià)別離為,那么有:2.相似度盤算要領(lǐng)盤算兩個(gè)用戶之間相似度的要領(lǐng)重要有三種:余弦相似度、相干相似度以及修正的余弦相似度,分述如下:(1)余弦相似度:每個(gè)用戶的評(píng)分作為n維工程空間中的一個(gè)向量。假設(shè)某個(gè)用戶沒有對(duì)一個(gè)工程評(píng)價(jià),那么其默認(rèn)評(píng)代價(jià)設(shè)為0。兩個(gè)用戶i和j之間的相似性通

7、過盤算兩個(gè)向量和夾角的余弦得到,記為si(i,j),盤算公式如下:(2)相干相似度:在余弦相似度盤算中沒有思量差異用戶之間評(píng)價(jià)范疇的差異。相干相似度通過減去用戶對(duì)工程均勻評(píng)代價(jià)來落服上述缺陷。兩個(gè)用戶i和j之間的相似性通過盤算pearsn相干性得到。假定用戶i和用戶j配合評(píng)價(jià)的工程聚集為,那么相干相似度盤算公式如下:此中:ri,x為用戶i對(duì)工程j的評(píng)代價(jià),和別離為用戶i和用戶j的均勻評(píng)代價(jià)。(3)修正的余弦相似度:在相干相似度盤算公式中,假設(shè)同時(shí)思量用戶i和用戶j的評(píng)價(jià)工程聚集,那么得到修正的余弦相似度盤算公式如下:此中:ii和ij別離為用戶i和用戶j的評(píng)價(jià)工程聚集。3.算法長(zhǎng)處和缺點(diǎn)基于用戶

8、的協(xié)同過濾算法很輕易明白,與其他浩繁現(xiàn)實(shí)應(yīng)用中的保舉算法比擬表現(xiàn)出較高的保舉精度,它具有如下一些長(zhǎng)處:(1)可以或許過濾難以舉行呆板主動(dòng)內(nèi)容闡發(fā)的信息,如藝術(shù)品,音樂等。(2)共享其別人的履歷,制止了內(nèi)容闡發(fā)的不完全和不正確,而且可以或許基于一些龐大的,難以表述的觀點(diǎn)如信息質(zhì)量、小我私家咀嚼舉行過濾。(3)有保舉新信息的本領(lǐng)??梢詣?chuàng)造內(nèi)容上完全不相似的信息,用戶對(duì)保舉信息的內(nèi)容事先是意料不到的,可以創(chuàng)造用戶埋伏的但本身尚未創(chuàng)造的愛好偏好。(4)可以或許有效的利用其他相似用戶的反響信息,較少用戶的反響量,加速本性化學(xué)習(xí)的速率。固然基于用戶的協(xié)同過濾作為一種典范的保舉技能有其相稱的應(yīng)用,但隨著電子

9、商務(wù)體系范圍的不竭擴(kuò)大,用戶空間和工程空間急劇增長(zhǎng),該算法也存在以下缺點(diǎn):希罕性:在一個(gè)大型電子商務(wù)體系中,用戶涉及的信息量相稱有限,用戶評(píng)價(jià)工程數(shù)少于總工程數(shù)的10%,造成評(píng)價(jià)矩陣數(shù)據(jù)相稱希罕,難以尋到相似用戶集,導(dǎo)致保舉結(jié)果大大低落。冷開始:這個(gè)題目可看作是極度嚴(yán)峻的希罕性題目。一方面,它很難向新用戶提供本性化保舉辦事;另一方面,在這種環(huán)境下,僅有少量評(píng)價(jià)數(shù)據(jù)不成能產(chǎn)生正確保舉。擴(kuò)展性:基于用戶的協(xié)同過濾算法的盤算量隨著用戶和工程標(biāo)增長(zhǎng)而急劇增長(zhǎng),其最壞環(huán)境下的盤算龐大度為(n)。對(duì)付一個(gè)典范的具有成百上萬(wàn)萬(wàn)用戶和工程標(biāo)電子商務(wù)體系,算法將遭碰到嚴(yán)峻的擴(kuò)展性題目。三、結(jié)論基于用戶的協(xié)同過濾雖是一種較為樂成的保舉技能,但也存在著希罕性、冷開始、擴(kuò)展性和正確性題目。為了辦理這些題目,如今常用聚類闡發(fā)的要領(lǐng),它大概將“比來鄰人搜刮工具限定在最相近的聚類中,大概用聚類的質(zhì)心提取保舉結(jié)果,但并不克不及從底子上辦理以上題目,這些都有待進(jìn)一步研究。參考文獻(xiàn):1趙亮胡乃靜張守志:本性化保舉算法

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論