基于音樂類型分類和個性診斷的 移動混合音樂推薦系統(tǒng)_第1頁
基于音樂類型分類和個性診斷的 移動混合音樂推薦系統(tǒng)_第2頁
基于音樂類型分類和個性診斷的 移動混合音樂推薦系統(tǒng)_第3頁
基于音樂類型分類和個性診斷的 移動混合音樂推薦系統(tǒng)_第4頁
基于音樂類型分類和個性診斷的 移動混合音樂推薦系統(tǒng)_第5頁
已閱讀5頁,還剩14頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、基于音樂類型分類和個性診斷的移動混合音樂推薦系統(tǒng)Aristomenis S. Lampropoulos Paraskevi S. Lampropoulou George A. Tsihrintzis網(wǎng)上發(fā)表:2011年2月2日施普林格科學(xué)+商業(yè)媒體公司2011摘要:為了運(yùn)作成一個移動服務(wù)項目,本文提出了一個級聯(lián)混合音樂推薦系統(tǒng)。具體地說,該推薦系統(tǒng)是實現(xiàn)一個基于音樂類型分類和個性診斷推薦處理的集成固件。移動用戶能夠通過他/她的手機(jī)簡單地給系統(tǒng)發(fā)送一個示例查詢音樂文件,在回應(yīng)移動用戶的查詢時,系統(tǒng)推薦的音樂不僅屬于同類音樂流派查詢結(jié)果,同時作為考慮其他用戶偏好和用戶評級的一種嘗試。推薦系統(tǒng)機(jī)制是

2、依靠個性診斷協(xié)同過濾技術(shù)來實現(xiàn)的。與現(xiàn)有的協(xié)同過濾和基于內(nèi)容的推薦技術(shù)相比。該系統(tǒng)應(yīng)用最小絕對誤差和順序得分標(biāo)準(zhǔn)的系統(tǒng),比較結(jié)果充分展示出該系統(tǒng)具有較高的性能。關(guān)鍵字:推薦系統(tǒng)級聯(lián)混合方法個性診斷移動服務(wù)簡介推薦系統(tǒng)被定義為這樣一個系統(tǒng),人們輸入建議,系統(tǒng)提供合適的接受者。今天,這個術(shù)語包括更廣泛的含義,是指給用戶提供個性化的推薦結(jié)果或幫助用戶實現(xiàn)興趣的程序或在有可能的最大空間上的有用對象。因為豐富的實際應(yīng)用,推薦系統(tǒng)形成一個重要的研究領(lǐng)域。明顯的,推薦系統(tǒng)功能類似于社交建議并且減少信息量,對用戶沒有興趣并且沒有用途。因此,可以考慮推薦系統(tǒng)作為類似于搜索引擎或信息檢索系統(tǒng)。然而,推薦系統(tǒng)不同于

3、搜索引擎和信息檢索系統(tǒng),不僅給推薦人查詢結(jié)果,還使用其嵌入式個性化機(jī)制來選擇對象(項目),滿足具體查詢用戶的需求。因此,推薦系統(tǒng)不象搜索引擎和信息檢索系統(tǒng),它提供給用戶的信息更合適更有價值,防止用戶淹沒在大量需要瀏覽和檢查的信息中。與搜索引擎和信息檢索系統(tǒng)相比,推薦系統(tǒng)進(jìn)行的事項目“匹配“。這意味著搜索引擎或一個信息檢索系統(tǒng)試圖形式和返回一個與檢索項目相匹配的查詢排序名單。動態(tài)相關(guān)性學(xué)習(xí)技術(shù)可以根據(jù)用戶偏好給系統(tǒng)提供提煉查詢結(jié)果的能力,因此,系統(tǒng)可以提供一個簡單的推薦信息表。更復(fù)雜的搜索引擎如谷歌利用其他“權(quán)威性”標(biāo)準(zhǔn),旨在盡可能為用戶提供有用的結(jié)果,但仍不是一種個性化的方式。推薦系統(tǒng)的研究結(jié)

4、合了近期快速發(fā)展的移動技術(shù),并且繼續(xù)被手機(jī)技術(shù)和移動網(wǎng)絡(luò)技術(shù)的革新所推進(jìn)?,F(xiàn)代手機(jī)依靠其內(nèi)在能力提供多媒體服務(wù)。內(nèi)置了照相機(jī)、收音機(jī)、媒體播放器和其他生成和處理多媒體數(shù)據(jù)的模塊。這些優(yōu)勢導(dǎo)致用戶不僅把手機(jī)當(dāng)成基本通話工具,更把它視為娛樂和存儲設(shè)備。除此之外,近幾年一系列對手機(jī)存儲容量的限制也被排除。隨著移動技術(shù)的快速發(fā)展,移動寬帶用戶創(chuàng)作音樂庫文件已經(jīng)實現(xiàn)。明顯的,操縱大量數(shù)據(jù)越來越成為復(fù)雜耗時的過程,一致移動用戶不能有效管理音樂文件資源。這個事實促成一個能推薦給其用戶合適音樂的系統(tǒng)。因此,期望一個給用戶查詢結(jié)果的推薦系統(tǒng),并且能夠嘗試預(yù)測用戶是否對推薦音樂有興趣。具體地說,音樂推薦系統(tǒng)根據(jù)用

5、戶的相似之處嘗試推薦給用戶一些音樂文件,這樣,用戶的個性化也被嵌入到推薦系統(tǒng)之中。我們當(dāng)前的工作重點是建設(shè)一個在擁有很少甚至沒有用戶偏好甚至沒有用戶偏好數(shù)據(jù)的情況下,能適應(yīng)不斷變化的用戶偏好的推薦系統(tǒng),該系統(tǒng)能迅速反饋給用戶所希望查詢的結(jié)果。眾所周知,協(xié)同過濾技術(shù)患有不協(xié)作、用戶偏見、冷啟動等問題,我們建立的是基于內(nèi)容檢索和個人偏好診斷的協(xié)作過濾系統(tǒng)。具體來說,本文的組織結(jié)構(gòu)如下:第二部分回顧之前的相關(guān)工作,第三介紹我們已經(jīng)開發(fā)出來系統(tǒng)。第四部分描述了后端整合到系統(tǒng)的推薦技術(shù)。第五部分對基于最小絕對錯誤和得分排序標(biāo)準(zhǔn)的評價結(jié)果的推薦技術(shù)的評估。最后,在第六部分,插入描繪了系統(tǒng)的未來研究方向。2

6、 相關(guān)工作常規(guī)的推薦技術(shù)室系統(tǒng)過濾,具體的說,協(xié)同過濾技術(shù)就是在考慮其他人對部分音樂的排序等級而推薦給用戶的一種技術(shù)。例如,有目標(biāo)用戶喜歡音樂A和B,現(xiàn)有一部分用戶喜歡音樂A、B、C,音樂C可能將會被推薦給這個目標(biāo)用戶。換句話說,也就是推薦給目標(biāo)用戶的是消費偏好相似的其他一組用戶的內(nèi)容。由于其本身的特性,協(xié)同過濾已經(jīng)普遍用于預(yù)測各種偏好問題,如網(wǎng)絡(luò)新聞、電子商務(wù)、數(shù)字圖書館等。在文獻(xiàn)中,協(xié)同過濾技術(shù)一再應(yīng)用在移動環(huán)境中。例如,MobiTip就是利用協(xié)同過濾技術(shù)預(yù)測基于新的或用戶提供更新的電影數(shù)據(jù)變化率。類似的,我們在8提到的,最早之一的音樂推薦系統(tǒng)就是用協(xié)同過濾技術(shù)。這個系統(tǒng)利用WEB過濾過的

7、數(shù)據(jù)來支撐節(jié)目播放列表。所以被稱作“基于系統(tǒng)過濾的推薦引擎”。他們的系統(tǒng)產(chǎn)生的是基于用戶播放列表內(nèi)容的推薦。另一方面,基于內(nèi)容的推薦系統(tǒng)是基于系統(tǒng)通過關(guān)聯(lián)特征發(fā)現(xiàn)對象的興趣。這些系統(tǒng)學(xué)習(xí)基于用戶相關(guān)項目特征的興趣文件。然后,推薦系統(tǒng)在沒有匹配興趣的情況下建立起來。為進(jìn)一步改進(jìn)推薦性能和消除每個獨立推薦技術(shù)的缺點,考慮使用各種混合技術(shù)。一種混合的推薦方法是基于內(nèi)容預(yù)測和系統(tǒng)過濾技術(shù)?;趦?nèi)容的預(yù)測部分可以解決依靠相關(guān)性項目來預(yù)測不相關(guān)項目等級的稀疏矩陣和第一評估者問題。由于混合方法的性能通常依賴于精確的基于內(nèi)容預(yù)測,支持向量機(jī)通常被應(yīng)用到基于內(nèi)容的預(yù)測任務(wù)中。更具體的說,混合推薦系統(tǒng)可以分為以下

8、幾類:- 聯(lián)合分離推薦;- 增加基于內(nèi)容特征協(xié)作模式;- 增加協(xié)作特征的內(nèi)容模式;- 單一統(tǒng)一推薦模式。第一類混合推薦系統(tǒng)包括兩個獨立協(xié)作和基于內(nèi)容的系統(tǒng)。有四種不同的方法結(jié)合兩個分離的系統(tǒng):加權(quán)混合方法: 輸出(評級)獲得個人推薦系統(tǒng)組合在一起以產(chǎn)生一個單一的最后的建議或者使用線性組合7或18投票方案P-Tango系統(tǒng)最初給兩個推薦系統(tǒng)相等的權(quán)重,但逐漸地根據(jù)用戶的評級來調(diào)整預(yù)測權(quán)重。系統(tǒng)保持兩個過濾方法相互獨立,保證發(fā)揮各自的優(yōu)勢。切換權(quán)重方法:系統(tǒng)在推薦技術(shù)之間進(jìn)行切換,并且選擇對當(dāng)前狀況推薦質(zhì)量較好的推薦技術(shù)。該技術(shù)一個典型的例子是日學(xué)習(xí)推薦系統(tǒng),它選擇具有較高可信度的推薦子系統(tǒng)。這種

9、方法的另外一個例子是在27提到的,它選擇根據(jù)提供的推薦結(jié)果與用戶評級一致性較高的基于內(nèi)容或協(xié)同過濾技術(shù)。分區(qū)混合法:在這種方法中,結(jié)果從不同的推薦子系統(tǒng)同時給出。一個例子是在25提到的基于電視播出和用戶偏好系統(tǒng)信息的文字描述。推薦系統(tǒng)在最后的推薦結(jié)果中同時給出這兩種技術(shù)的推薦結(jié)果。梯度混合法: 在這種方法中,先用一種技術(shù)產(chǎn)生一個粗略的候選結(jié)果,再采用第二種技術(shù)對粗選結(jié)果進(jìn)行精確選擇。這種方法比加權(quán)混合方法的各種應(yīng)用技術(shù)在所有預(yù)測項目上都更有效。因為第一級過濾已把候選項進(jìn)行了過濾,所以這種混合方法計算任務(wù)更小。然而,這種方法對于低優(yōu)先級推薦時對無用數(shù)據(jù)具有更高的兼容性。換句話說,這種梯度混合方法

10、可以分析兩個梯度。第一級(基于內(nèi)容的方法或基于(協(xié)同)知識)選擇中間推薦結(jié)果。然后,第二級(基于內(nèi)容協(xié)同或基于知識協(xié)同方法)從第一級推薦結(jié)果中選擇更合適的項目。BurKe5開發(fā)了一個叫做EntreeC.的酒店推薦系統(tǒng)。這個系統(tǒng)首先用基于知識的方法選擇客戶的用餐偏好,在基于知識的方法中,創(chuàng)作者根據(jù)事先定義好的描述酒店特征的屬性構(gòu)造特征向量。這種方法與基于內(nèi)容的方法相似,然而,我們必須注意是在基于知識的屬于已被使用并且元數(shù)據(jù)是獨立于內(nèi)容的。這些酒店用協(xié)同方法進(jìn)行等級排序。除前面提到的方法之外,最近的推薦系統(tǒng)包括下面方法:在9里,作者提出了一個上下文感知的音樂推薦系統(tǒng),該系統(tǒng)是就內(nèi)容檢索,音樂本體和

11、領(lǐng)域?qū)S眯g(shù)語諸如精神和心里情景。創(chuàng)建了情緒狀態(tài)轉(zhuǎn)換模型(ESTM),來描繪復(fù)雜的人類情感并且能夠把用戶的心里情景和喜好用COMUS來評估。音樂推薦系統(tǒng)基于當(dāng)前的、用戶想要的、ESTM已經(jīng)完成低等級特征算法分類。ALBANESE ET AL.2,提出了另外一種方法,該方法融合了隱藏在使用日志中的低等級特征的信息使用模式和用于預(yù)測用戶行為的語義描述符來提供有效的推薦信息。在這個推薦系統(tǒng)中,作者介紹了多通道瀏覽器和多通道對象來模擬用戶并發(fā)瀏覽多類型對象。在系統(tǒng)原型上進(jìn)行了廣泛的試驗,得到了良好的試驗結(jié)果。在10里,創(chuàng)建者提出了一個基于用戶上下文的框架來為周圍媒體服務(wù)。擬議的框架包含了動態(tài)確定上下文并

12、提供媒體用戶需求。該框架能隨著時間的變化適應(yīng)媒體服務(wù),并且能根據(jù)環(huán)境靈活的更新用戶喜好。3 推薦系統(tǒng)綜述我們的推薦系統(tǒng)是一個固件系統(tǒng)。具體地說,我們的系統(tǒng)允許移動用戶通過他/她的移動終端發(fā)送實例音樂到音樂庫查詢和與需求音樂相似的音樂文件名進(jìn)行查詢。在前述的預(yù)備工作中13-15,開發(fā)系統(tǒng)的動機(jī)是減少現(xiàn)有移動音樂推薦系統(tǒng)的局限性。具體的說,我們的系統(tǒng)是不需要操作的系統(tǒng),并且不需要應(yīng)用程序接口或特別的客戶端安裝。該系統(tǒng)使用支持所有手機(jī)的推送技術(shù)。推送就是在不需要用戶明確需求的情況下給移動用戶發(fā)送一條信息。信息發(fā)送可能是人到人或應(yīng)用到人甚至應(yīng)用到應(yīng)用。一些推送應(yīng)用的例子包括預(yù)警信息、股票行情和每日星座

13、。在這幾種情況中,有用戶定制服務(wù)和根據(jù)用戶喜好推送的預(yù)警信息。在WAP推送中,允許推送發(fā)起者傳送推送內(nèi)容并且傳遞指令到推送網(wǎng)關(guān),然后推送網(wǎng)關(guān)根據(jù)傳送指令推送內(nèi)容到WAP客戶端(諸如“客戶”或“終端”)。典型的是推送發(fā)起者是運(yùn)行在WEB服務(wù)器中的應(yīng)用程序。它與推送網(wǎng)關(guān)通過推送接受協(xié)議進(jìn)行通信。推送網(wǎng)關(guān)通過空中接口協(xié)議傳送推送內(nèi)容到客戶。前段推薦水平依靠開放資源技術(shù)和仿真模型工具。編程使用JAVA語言。一些完成前段運(yùn)行水平的服務(wù)已經(jīng)實現(xiàn)。我們使用開放資源軟件WAP Push SDKV2.0版本來實現(xiàn)推送協(xié)議。推送代理網(wǎng)關(guān)已經(jīng)使用開放資源軟件Kannel.Kannel是開服昂資源WAP網(wǎng)關(guān)。最后,對

14、形同運(yùn)行說明和評估,我們使用Developer Platform 2.0 SDK-Nokia 6230平臺版本。它是Nokia Developer Platform 2.0SDK 仿真規(guī)范。SDK提供媒體內(nèi)容和J2ME平臺應(yīng)用的環(huán)境。另外,雖然推薦系統(tǒng)算法是基于先進(jìn)的久經(jīng)考驗的辨識/機(jī)器學(xué)習(xí)技術(shù),推薦系統(tǒng)程序與用戶交互非常簡單,不需要用戶有先進(jìn)的技巧。的確,用戶通過多媒體終端發(fā)起的服務(wù),包含用戶通過音頻文件發(fā)起推薦處理程序。推薦處理過程有兩步組成。第一步,處理程序區(qū)分用戶提交的音樂文件流派,然后第二步推薦系統(tǒng)按照以下程序進(jìn)行。協(xié)同過濾技術(shù)應(yīng)用把選擇的歌曲文件排列在較高的等級序列。推薦結(jié)果的內(nèi)容

15、傳送格式不需要呈現(xiàn)給用戶,因為這樣將引起用戶不必要的高消費。推薦系統(tǒng)反饋給用戶簡單的推送信息來代替。每一個推送消息與推薦音樂文件列表進(jìn)行連接。然后,用戶可以選擇推薦音樂文件或者通過提供排序等價更新系統(tǒng)提供的推薦列表。隨后,系統(tǒng)根據(jù)用戶排序等級更新推薦列表。推送技術(shù)允許系統(tǒng)在沒有用戶發(fā)送信息的情況下更新推薦文件列表。連接都有命名,一邊用戶根據(jù)連接名稱選擇是否從WEB服務(wù)器下載這些音樂文件到他的手機(jī)?,F(xiàn)實中,通信系統(tǒng)是一個前段到后端的多層級體系結(jié)構(gòu)。前段包括實現(xiàn)用戶通信的模塊,移動網(wǎng),應(yīng)用程序。后端是指實現(xiàn)推薦機(jī)制的模塊。本文設(shè)計的推薦系統(tǒng)允許音樂數(shù)據(jù)庫是分布式的并且和后端代理網(wǎng)關(guān),推送發(fā)起者,前

16、段無線接入?yún)f(xié)議服務(wù)器相分離。4基于音樂類型分類和個性診斷的混合音樂推薦方案如上一節(jié)所述,用于方案實現(xiàn)的后端包含所有模塊。具體而言,我們中間件系統(tǒng)后端包含兩個方面。第一,采用徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)支持向量機(jī)分類器,從而增強(qiáng)內(nèi)容信息,以便于在音樂類型分類系統(tǒng)查詢支持的音樂文件。第二,利用現(xiàn)有特定用戶或其他用戶的評級以提供個性化的方案。本推薦機(jī)制的目的在于返回音頻/音樂搜索結(jié)果,而不僅僅是查詢同類型的音頻/音樂和內(nèi)容相似的文件。但也考慮到用戶喜好的每一個音樂文件的評級。(如圖1)具體步驟如下:1. 用戶通過提交詢問(目的音樂)進(jìn)行初始查詢,特征提取器提取對應(yīng)30個音頻詳情的一組值。2. 第一,分類標(biāo)識查

17、詢音樂文件的類型。第二,推薦程序?qū)⒏鶕?jù)用戶喜好返回歌曲。更確切的說,一級分類器識別音樂查詢文件類型的信心。判決值(信心)是查詢特定類別幅度的差額。選擇對應(yīng)最高判定值分類器類型。3. 第二級采用個性診斷方法,返回一個推薦列表。數(shù)據(jù)庫中的每個音樂文件可以關(guān)聯(lián)五個評分等級。另外,每個音樂類型被細(xì)分成4個等級0,1,2,3。4. 最后,用戶既能夠選擇并下載音頻/音樂或提供推薦項目評級,還可以收到新的推薦列表。4.1SVM分類器支持向量機(jī)(SVM)是尋找單獨數(shù)據(jù)點最佳超平面途徑,概括最優(yōu)數(shù)據(jù)的監(jiān)督分類系統(tǒng)。超平面即所謂的每類的最近點距離最大化的最大間隔超平面。令S =S1,S2, . . . , Sn其

18、中,SjRd是對應(yīng)音樂數(shù)據(jù)庫文件的一組d維特征向量。任何超平面分離的兩個數(shù)據(jù)類(二進(jìn)制或二分類)形式如(1)。圖1 推薦方案 (1)其中,f:Rd-1,+1。SVM分類器得到解決二次規(guī)劃問題如 (2)約束條件:(3)最佳解決方案的決策函數(shù)如下: (4)支持向量機(jī)的一個顯著特征是僅有一小部分的Wi系數(shù)為非零。相應(yīng)的Si對(邊緣支持向量)和完整定義輸出標(biāo)簽的決策功能。設(shè)定訓(xùn)練模式只出現(xiàn)在點乘積項(Si)(Sj),這里定義一個核心函數(shù)K(Si,Sj)=(Si)(Sj)映射到多維空間并進(jìn)行點積運(yùn)算。我們引用的具體的高斯函數(shù)為K(si, s j) =在第一步的音樂推薦過程中多類而非出現(xiàn)二元分類問題。為解

19、決這一問題,本文理由協(xié)同分類技術(shù)通過分類集合致力于空間的特定視圖,包括原始空間的分解。分為以下兩個步驟:第一,訓(xùn)練的二進(jìn)制SVM分類器對其中每個特定類的對象進(jìn)行分類。第二,與第一步的分類結(jié)果相結(jié)合,以得出最終的分類決策。集成分類器,遵循反對(OAO)或成對策略。OAO方法是通過在成對類之間培訓(xùn)二進(jìn)制SVM。因此,OAO模式為K(K-1)/2 二進(jìn)制SVM解決K類分類問題。每個K(K-1)/2 SVM為目的類投一票,并將票數(shù)最高的分配給輸入樣本X。4.2個性診斷推薦過程實現(xiàn)的第二層是個性診斷技術(shù)。這一層面的主要特點是,有意義概率語義的預(yù)測,此外,假設(shè)每個用戶的喜好構(gòu)成其基本人格類型的一個特征。因

20、此,考慮到在線用戶已知的項目評級,這使得估計他/她與另一用戶有相同的性格類型的概率成為可能。用戶可以看到給定用戶采用“真”收視率向量的個性類型。一個真正的評級不同于一定量的(高斯)噪聲下用戶給出的實際報告評級。特定用戶個性類型,個性診斷方法估計的是系統(tǒng)相同性格類型中給定用戶的概率,從而,估計用戶喜好新項目的概率。19對每個用戶Uk的個性類型歸納如下,其中K=1,2,m,Um=u1,u2,um,用戶Uk的優(yōu)選條件是In=i1,i2,in: (5)Rture(Uk,il)其中,ilIn,l=1,2,n代表項目il的用戶Uk的真正評級。關(guān)鍵在于區(qū)別“真”的用戶評級和(已知)用戶評級報告。推薦系統(tǒng)的設(shè)

21、計者是不能直接訪問真正的用戶喜好的評級編碼。然而,用戶提供的報告評級應(yīng)用于推薦系統(tǒng)。據(jù)推測,用戶給出的評級報告包括高斯噪聲。假設(shè)用戶可以在不同情況下,相同的項目,根據(jù)上下文的不同評級報告。因此,我們可以認(rèn)為一個項目il的用戶評級報告服從獨立正態(tài)分布Rture(Uk,il)。特別是: (6)其中是空閑變量,X是推薦系統(tǒng)的用戶評級報告,y是無噪聲條件下用戶Uk報告評級值。此外,假設(shè)用戶評估項目組R代表目標(biāo)人群的個性類型的分布。因此,考慮到這樣的假設(shè),制定先驗概率,在線用戶Ua對應(yīng)的向量v,根據(jù)v其他用戶的速率作為給定的的頻率,因此,明確計算出現(xiàn),并非我們簡單定義。是一個隨機(jī)變量,可以取值m,(R(

22、u1), R(u2), . . . , R(um),每個概率為1/m: (7)結(jié)合(6)和(7),并給出在線用戶的評級,可以運(yùn)用貝葉斯法則計算出在線用戶相同性格類型占其他用戶的概率。 (8)因此,計算每個用戶Uk數(shù)量,可以計算得到不可見項目IJ在線用戶的評級分布。這個概率分布,推薦系統(tǒng)所產(chǎn)生的在線用戶Ua項目IJ預(yù)期評級。(9)該模型被描述為貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)中一個典型的診斷模型,如下:首先,觀察到評級和計算概率,每個人的個性類型使用的原因(8)。評級可以被視為“癥狀”,而個性類型為“病”,導(dǎo)致這些癥狀出現(xiàn)在診斷模型中。其次,可為不可見項目計算出等級值的概率(9),返回預(yù)測推薦系統(tǒng)最有可能的評級。

23、個性診斷另外一層意思,在線用戶評級被認(rèn)為是通過選擇其他用戶之一均勻隨機(jī)高斯噪聲添加到他/她的評級“產(chǎn)生”??筛鶕?jù)在線用戶評級推斷出他/她實際上是其他用戶之一,計算得到其他項目評級的概率。5推薦系統(tǒng)評估設(shè)定用戶組U = u1, u2, . . . , um,音樂數(shù)據(jù)庫中相關(guān)項目I = i1, i2, . . . , in,用于音樂推薦系統(tǒng)的實現(xiàn)。數(shù)據(jù)庫中的每一個音樂文件對應(yīng)于30維向量空間V,要求參與我們實驗的每個用戶為數(shù)據(jù)庫中每個項目分配唯一的評級值。設(shè)R(u, i)為用戶U分配給項目I的評級值,通過以下公式定義四類: (10)為了說明本推薦方法的性能,研究采用從4類西方音樂選出400個音樂文

24、件。具體地,集合包含了四類西方音樂中每個30S持續(xù)時間的100個音樂文件(見表1)。表1 classes of western music為捕獲某些方面具體的應(yīng)用功能,音頻信號可以以多種形式表示。特征提取的大量重要的工作更適合于描述和模擬音樂信號。本文中,采用Tzanetakis和Cook 28, 29最初提議的特定30維客觀特征。值得一提的是,這不僅提供了低級別音樂信號的統(tǒng)計特性表示方法,也包含高水平心理聲學(xué)算法信息的提取??傊?,這些功能表現(xiàn)出有節(jié)奏的內(nèi)容(節(jié)奏,節(jié)拍和速度信息),音樂信號音調(diào),旋律及和聲的描述。這些文件被15個用戶分配評級值,用戶至少對150個音樂文件聲明他們的觀點。正如之

25、前提到的評級值按照數(shù)值規(guī)模從1(低優(yōu)優(yōu)先級)到3(高優(yōu)先級),評級為0表示相應(yīng)的文件沒有評級值,因此被視為非首選。分類算法,采用基于RBF-SVM分類器,設(shè)=0.1,所有30維空間向量歸到0,1區(qū)間。使用十倍交叉驗證評估方法對第一級分類精度進(jìn)行計算。進(jìn)行評估的數(shù)據(jù)集和的90%用于訓(xùn)練,另外10%用于測試。過程中,對與不相交的分區(qū)迭代的結(jié)果取平均值。準(zhǔn)確的說,十倍交叉驗證結(jié)果見表2,其中N=10,MA:平均精度,ME:平均誤差,SD:標(biāo)準(zhǔn)差,SEM:標(biāo)準(zhǔn)差。 (11)表2 Musical genre classification fold analysis (12) (13) (14)音樂類型分

26、類推薦系統(tǒng)的平均精度見表3。表3 Accuracy%鑒于推薦方法的評估效率,對每個用戶的評級采用十倍交叉驗證程序。因此,每個用戶的數(shù)據(jù)集合中90%用于訓(xùn)練,10%用于測試。每一段,系統(tǒng)從每個類型查詢十塊共收錄40個音樂文件。過程中,對與不相交的分區(qū)迭代的結(jié)果取平均值。最后,對所有用戶的結(jié)果取平均值,采用平均值絕對誤差(MAE)和評級標(biāo)準(zhǔn)等級(RS)對預(yù)測方法準(zhǔn)確性進(jìn)行評價。MAE是推薦系統(tǒng)評估效率最常采用的方法。更確切的講,MAE對用戶U,段K的定義如下:(15)其中,P(u, k) 是正模式,即查詢文件所屬特定類型模式。另一方面,N(u, k)是負(fù)模式,不屬于特定類型的模式,但作為第一級分類

27、類型的模式。Ru,k(v)是用戶給定的評估值,u,k(v)是系統(tǒng)預(yù)測的評估值。RS假定根據(jù)用戶預(yù)測項目評級將推薦系統(tǒng)以列表的方式呈現(xiàn)給用戶。具體地,RS評估用戶項目排名清單,被視為用戶預(yù)期效用乘以用戶實用項目效用。一個項目效用的計算,如觀察評級差異,默認(rèn)值,域中性評級,它可以是評級表的中點或數(shù)據(jù)集合的平均值。查看項目等價增加呈指數(shù)衰減的概率。從形式上看RS是段K,特定用戶Ui的項目排名清單,根據(jù)指標(biāo)j降序排列Rui,k(vj),由下式給出: 16)進(jìn)行多次實驗后,與其他三個推薦方案即兩個協(xié)同過濾方案,一種混合方案相比,具體在以下三個方面:(1)CF Pearson相關(guān)系數(shù)為基準(zhǔn),(2)CF個性診斷,(3)混合音樂類型分類與Pearson相關(guān)系數(shù)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論