


下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領
文檔簡介
1、2.2.1 余弦相似度度量為了找到相似物品,需要定義一種相似度度量標準。在基于物品的推薦方法中,余弦相似度由于效果精確, 已經(jīng)被證實是一種標準的度量體系。這種度量標準用兩個n維向量之間的夾角來測算相似度。這種方法也 被廣泛用于信息檢索和文本挖掘,用來比較兩份文本文檔,其中文檔可以表示為詞語的向量。將兩個物品a和b用對應的評分向量和 來表示,其相似度可以定義如下:符號表示向量間的點積,表示向量的歐式長度,即向量自身點積的平方根。物品 5 和物品 1 的余弦相似度因此可以計算為:sim(/571) = 0 陽51CTtjBPH1相似度值介于0和1之間,越接近1則表示越相似。基本的余弦方法不會考慮用
2、戶評分平均值之間的差異。 改進版的余弦方法能夠解決這個問題,做法是在評分值中減去平均值。相應地,改進余弦方法的取值在 1 到+1 之間,就像 Pearson 方法一樣。設U為所有同時給物品a和b評分的用戶集,改進的余弦相似度計算如下:我們因此可以對原始的評分數(shù)據(jù)集進行變換,用評分值相對于平均評分值的偏差取代原始值,如表2-2所示。表 2-2均值調(diào)整評分數(shù)據(jù)庫物品1 物品2 物品3 物品4 物品5Alice1.00-1.000.000.00?用戶10.60-1.40-0.400.600.60續(xù))續(xù))物品1物品2物品3物品4物品5用戶20.20-0.800.20-0.801.20用戶3-0.20-0.20-2.202.800.80用戶4-1.802.202.20-0.80-1.80物品5 和物品1 的改進余弦相似度值為:確定物品間的相似度之后,我們可以通過計算Alice對所有與物品5相似物品的加權(quán)評分總和來預測Alice對物品 5 的評分。形式上,我們預測用戶 u 對物品 p 的評分為:技術(shù)成技術(shù)成就像在基于用戶的方法
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 學校無煙環(huán)境長效管理自評報告范文
- 水利工程中施工測量的操作施工方案
- 農(nóng)產(chǎn)品行業(yè)市場分析及投資策略報告
- 農(nóng)用機械維保方案與實施方法
- 職場精英精力管理:行業(yè)趨勢與市場潛力分析報告
- 商業(yè)地產(chǎn)職業(yè)生涯發(fā)展研究報告
- 新能源電池行業(yè)研究報告:市場現(xiàn)狀與未來機遇
- 基于BIM的光伏建筑一體化設計與優(yōu)化-洞察闡釋
- 虛擬現(xiàn)實技術(shù)提升文化遺產(chǎn)沉浸式體驗的研究-洞察闡釋
- 非屏蔽雙絞線網(wǎng)絡安全感知與防護算法研究-洞察闡釋
- 2025全國英語等級考試(PETS)二級試卷真題匯編與解析
- 成都銀河磁體股份有限公司高精度、高潔凈度硬盤用粘結(jié)釹鐵硼磁體擴建項目環(huán)評報告
- 企業(yè)內(nèi)部控制體系構(gòu)建與優(yōu)化研究
- 混凝土部分應知應會題庫
- 《建筑與市政工程施工現(xiàn)場臨時用電安全技術(shù)標準JGJT46-2024》知識培訓
- 木箱包裝合同協(xié)議
- 碼頭項目事故案例
- 針灸美容整形培訓課件
- 2025年湖南電氣職業(yè)技術(shù)學院單招職業(yè)傾向性考試題庫附答案
- 管道施工應急預案
- 2025年1月國家開放大學法學本科《中國法律史》期末紙質(zhì)考試試題及答案
評論
0/150
提交評論