以豆瓣網(wǎng)和國家圖書館為案例的網(wǎng)上書目推薦系統(tǒng)研究_第1頁
以豆瓣網(wǎng)和國家圖書館為案例的網(wǎng)上書目推薦系統(tǒng)研究_第2頁
以豆瓣網(wǎng)和國家圖書館為案例的網(wǎng)上書目推薦系統(tǒng)研究_第3頁
免費預(yù)覽已結(jié)束,剩余1頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、DOI :10.15941/j44.issn1001 0424.2008.08.003館 學(xué) 研 究 2008.8以豆瓣網(wǎng)和中國館為案例的網(wǎng)目推薦系統(tǒng)研究范旭【摘 要】現(xiàn)有網(wǎng)目推薦系統(tǒng)根據(jù)應(yīng)用服務(wù)理念的不同可以分為Web 2.0 型和傳統(tǒng)型, 根據(jù)其使用的過濾技術(shù)可以分為非個性化推薦、 基于屬性的推薦、 基于相關(guān)用戶的推薦和基于用戶知識結(jié)構(gòu)的推薦。書目推薦的開展應(yīng)當(dāng)遵循性、 可行性、 時效性這三個原則。本文通過對豆瓣網(wǎng)和中國館的網(wǎng)目推薦服務(wù)的, 從有用性、 易用性、 滿意度、 可找到性、 普及性和可靠性六個方面對它們進行了比較, 概括了傳統(tǒng)型網(wǎng)目推薦系統(tǒng)的優(yōu)勢和改進意見?!尽繒客扑]館導(dǎo)讀 豆

2、瓣網(wǎng) 中國館Abstract :Acco d ng tothe se v ce va ue , on ne b b og aph cecommenda t on system s d v ded nto twof te techno ogy, the e a e f ve types oftypes:web 2.0 type and t ad t onatype. On the base ofecommendat on system :NonPe sona zed Recommendat on, Att butedBased Recommendat on , Peop eBased Recom

3、menda t on. Bb og aph c ecommenda t on se v cetoPeop e Co e at on and Know edgeshou d fo ow th ee p nc p es :accu acy,feas b ty and t me ness.Th ough the case study of Douban.Comand Nat ona L b a y of Chna , th s pape compa es them f om s x aspects:usefu , usabe , des ab e , f ndab e , access b e an

4、d c ed b e. The advantages of t ad t ona type on ne b b og aph c ecommendat onsystems as we as the op nons on ts mp ovement a e p oposed.Key words :b b og aphc ecommendat on L b a y of Chnab a y ecommenda t on b b og aphyDouban.ComNa t ona隨著網(wǎng)絡(luò)的普及, 各種書目信息的泛濫和對用戶有價值的書目信息匱乏形成了鮮明的對比, 多元化的信息服務(wù)改變著人們的閱讀習(xí)慣,

5、 閱讀率連年下降。1 一方面, Web 2.0 相關(guān)技術(shù)在商業(yè)讀書和購書的應(yīng)用給書目推薦注入了新的活力, 使其呈現(xiàn)出新的特點。另一方面, 在商業(yè)書目導(dǎo)航功能有所削弱。1 現(xiàn)有網(wǎng)目推薦系統(tǒng)的類型的包圍下,館傳統(tǒng)的讀者導(dǎo)讀、根據(jù)服務(wù)理念的不同, 現(xiàn)有的網(wǎng)目推薦系統(tǒng)可以分為傳統(tǒng)型和 Web2.0 型, 傳統(tǒng)型書目推薦的服務(wù)之前就已經(jīng)開展的書目推薦服務(wù)放到網(wǎng)絡(luò)這個載體, 其服務(wù)的方式依靠用戶主動獲取, 只是將館在網(wǎng)絡(luò)和理念并沒有本質(zhì)上的變化。而 Web 2.0 型的網(wǎng)目推薦服務(wù)系統(tǒng)則是大量運用 Web 2.0 的技術(shù), 一改傳統(tǒng)書目推薦服務(wù)信息從館員或到用戶單向傳遞的特征, 關(guān)注的重點從轉(zhuǎn)向用戶, 呈

6、現(xiàn)出多向信息交流的交互性特點。根據(jù)其使用的科學(xué)技術(shù), 網(wǎng)目推薦系統(tǒng)可以細分為以下幾個類型:1.1非個性化推薦 (Non Pe sona zed Recommenda t on)非個性化推薦的書目單純地由用戶的點擊數(shù)、 借閱數(shù)的累加運算的結(jié)果決定, 并沒有考慮用戶的特性, 所有的客戶得到的推薦都是相同的。例如高校數(shù)字館可以向所有系統(tǒng)的讀者推薦本月度最暢銷的書, 借閱的雜志等 。2 但也能從宏觀的層面上反映讀者關(guān)心的熱點。1.2基于屬性的推薦 (Att buted Based Recommendat on)推薦主要基于的屬性特征, 需要客戶輸入他所需要的屬性特征。例如高校數(shù)字館的讀者可以通RESE

7、ARCH ES I N LIBRARY SCIENCE45過輸入來界定資料的類型:書籍、 雜志、 期刊、 報紙、 會議等等 。3 傳統(tǒng)館推薦服務(wù)中的按分類查看以及按主題推薦就是基于的類屬性進行集體的推薦, 隨著tag 的推廣使用, 大眾分類法對傳統(tǒng)的館分類方式進行了補充和發(fā)展, 使得 Web 2.0 型的書目推薦系統(tǒng)的聚類推廣功能更加符合大眾的使用習(xí)慣, 也對傳統(tǒng)的館分類方法產(chǎn)生了一定影響。1.3基于相關(guān)用戶的推薦 (Peop e to Peop e Co e at on)推薦系統(tǒng)根據(jù)目前客戶與其他已經(jīng)使用了商品的其他客戶之間的相關(guān)性進行推薦。例如高校數(shù)字館可以對某計算機學(xué)院的讀者推薦其他與其

8、相類似 (相同、 研究方向等)的讀者借閱查看的資料。4 在 Web 2.0 型的推薦系統(tǒng)中, 最常見的是利用 sns 的性軟件, 自動追蹤用戶的使用, 將用戶根據(jù)其喜好的相似性進行關(guān)聯(lián), 通過相關(guān)用戶的使用進行推薦, 達到協(xié)同過濾的作用。相關(guān)用戶推薦改變了以往書目推薦基于 “ 圖書” 的特征, 從 “用戶” 出發(fā), 在處理一些非結(jié)構(gòu)化的讀物如視聽資料的推薦中效果比較好。但基于相關(guān)用戶的協(xié)同過濾算法也會受到數(shù)據(jù)庫初建立時用戶使用題影響, 需要結(jié)合其他過濾技術(shù)來完善性能。不足難以產(chǎn)生關(guān)聯(lián)、 用戶使用過多后運算效率低下的問1.4基于用戶知識結(jié)構(gòu)的推薦 (Know edge Based Recomme

9、ndat on )通過推斷用戶的需要進行推測, 系統(tǒng)要具有 “特定能夠滿足特定用戶需要” 的知識, 來推導(dǎo)出用戶需要與某一的相互關(guān)系, 例如推薦系統(tǒng)可以根據(jù)某讀者的歷史借閱數(shù)據(jù)和文獻數(shù)據(jù)之間的分析, 獲得讀者的潛在知識需求, 對讀者進行建議。5 詳盡的用戶描述是這種書目推薦系統(tǒng)的基礎(chǔ)。當(dāng)中也能夠引入一些權(quán)重的計算來分析2 網(wǎng)的流行度和權(quán)威性。6目推薦系統(tǒng)的評價模型書目推薦必須遵循推薦的初級階段是性、 可行性、 時效性三個原則才能獲得比較好的推薦效果。性就是個性化, 書目群體的書目推薦, 而最理想的書目推薦是為每個讀者 “量體裁衣” 的個人書目推薦系統(tǒng)??尚行灾傅氖丘^推薦的書目是否能夠真的轉(zhuǎn)化為

10、讀者的閱讀行為, 當(dāng)中涉及了書目推薦數(shù)量的可行性和獲取推薦書目全文或是實體的可行性兩個方面。根據(jù)信息構(gòu)建理論, 選擇的項目最好在 57 項之間, 以免影響用戶做出正確的決定 。7 而獲取全文或?qū)嶓w的可行性是指在信息的獲取活動中有著 “最小努力原則” 的情況下, 用戶會傾向于選擇那些路徑最短、 能量消耗最小的方法, 如果獲取的不便大于不使用的不便, 信息獲取行為就不會發(fā)生 。8 時效性則是指書目推薦工作需要根據(jù)、 科學(xué)活動的變化進行經(jīng)常性的調(diào)整和修訂。本次分析的評價模型基于信息構(gòu)建中PeteMo v e 的用戶體驗蜂窩模型, 該模型從以下七個方面對信息服務(wù)進行評價 9 :第一, 有用性 (Use

11、fu ),的是服務(wù)是否能夠?qū)τ脩舢a(chǎn)生幫助,是是否從用戶的角度出發(fā), 不斷對服務(wù)進行改進。第二, 易用性 (Usa b e), 包括了使用幫助和反饋系統(tǒng)等輔助系統(tǒng), 評價服務(wù)是否讓用戶很容易地掌握使用方法。第三, 滿意度 (Des ab e), 評價服務(wù)的用戶青睞程度這種非理性因素的指標(biāo), 當(dāng)中包括了服務(wù)的宣傳、 品牌的樹立等具體方面。第四, 可找到性 (F ndab e), 評價服務(wù)是否能從多個路徑獲取,的導(dǎo)航系統(tǒng)性能的指標(biāo)。第五, 普及性 (Access b e), 指的是服務(wù)對于世界上超過百分之十的身體殘疾人群的普及程度, 如視障人群的盲文書書目推薦服務(wù)?,F(xiàn)在, 普及性只是基于道德層次的評

12、價指標(biāo), 但是隨著的進步,服務(wù)的普及性將從的層面確立下來。第六, 可靠性 (C ed b e), 研究的是用戶對于服務(wù)的信任程度以及相關(guān)的因素。第七, 價值性 (V a uab e), 對于服務(wù)的概括性評價, 通常可以通過 “會再次使用服務(wù)” 和 “再次使用服務(wù)” 響較大,3 網(wǎng)兩個選項簡單地總括服務(wù)對于用戶的價值, 受到用戶書目推薦信息需求的急迫程度、 單次服務(wù)的感受影對于用戶的樣本穩(wěn)定性要求較高, 難以通過小型的目推薦系統(tǒng)的案例來獲得, 因而這次并沒有涉及這個指標(biāo)。為了深入了解網(wǎng)目推薦系統(tǒng)的具體運行情況, 筆者選取了在眾多商業(yè)性讀書社區(qū)中選取了人氣極高的豆瓣網(wǎng)和館網(wǎng)目推薦系統(tǒng)做得比較好的中

13、國館。豆瓣網(wǎng)的 “友鄰” “ 小組” 具有典型的Web 2.0 技術(shù)色彩,了一定的改良。3.1豆瓣和中國而中國館的網(wǎng)目推薦系統(tǒng)囊括了常見的書目推薦方式, 并根據(jù)網(wǎng)絡(luò)的特點進行館網(wǎng)目推薦系統(tǒng)各項指標(biāo)的比較豆瓣的書目推薦理念來自于口碑式的方式, 即對多數(shù)人做選擇最有效的幫助來自于親友和同事。即使不能和千萬人一一結(jié)交, 卻知道成千上萬人的口味, 這對其中每一個人都多少會有幫助。10 因而, 豆瓣的推薦系統(tǒng)有著去 “中心化” 的特點 11 , 即關(guān)注的是每個用戶的閱讀習(xí)慣特征, 為每個用戶都提供、 交流意見的平臺,46館 學(xué) 研 究 2008.8并以此為起點進行書目推薦。而中國館的書目推薦則倚重于館員

14、和學(xué)科的專業(yè)知識, 主要以館員的信息單向傳遞為主,同時也注意到了用戶在書目推薦中的積極性, 因應(yīng)需要而做出了一定調(diào)整。具體各項指標(biāo)的比較如下表:表 1豆瓣網(wǎng)和中國館的網(wǎng)目推薦服務(wù)比較3.1.1有用性比較有用性比較中的面向用戶項的實際上是書目推薦的性。其中,性、 個性化程度最高的是需要用類型Web 2.0 型傳統(tǒng)型代表豆瓣中國館書目推薦形式最受歡迎的新評論豆瓣猜你會喜歡友鄰新書排行榜分類瀏覽專題推薦熱點書刊排行榜新書推薦文津圖書獎有用性面向用戶所有人注冊用戶注冊用戶所有人所有人所有人除基本書目著錄信息以外的推薦內(nèi)容展開介紹頁獲得用戶評論 , 回應(yīng), 主題, 及用戶常用無推薦書目數(shù)量6 種5 種3

15、0 種12 種20 種根據(jù)專題內(nèi)容 50 種左右20種 中文期 刊 9 種 外文9種10種獲獎10 種推薦30種更新速度即時即時即時每周即時定時每月每月每年易用性推薦書目服務(wù)獲得方式個人友鄰設(shè)置或網(wǎng)站首頁首頁導(dǎo)航首頁導(dǎo)航首頁導(dǎo)航首頁首頁實體獲取方式通過進入購物到館輔助檢索功能搜索引擎沒有沒有沒有搜索引擎用戶與間信息反饋機制站務(wù)讀者指南讀者指南讀者指南讀者推薦滿意度其他書目推薦服務(wù)配合宣傳在全局導(dǎo)航條、 局部導(dǎo)航條及輔助導(dǎo)航條均有對其他推薦服務(wù)的宣傳輔助導(dǎo)航條中的其他書目推薦服務(wù)輔助導(dǎo)航條中的其他書目推薦服務(wù)輔助導(dǎo)航條中的其他書目推薦服務(wù)報告情況介紹可到達性不同書目推薦服務(wù)能否一步互相轉(zhuǎn)換可以可

16、以可以可以不可以普及性特殊人群的書目推薦沒有沒有可靠性信息發(fā)布來源用戶館員館員館員讀者推薦、 專家評審RESEARCH ES I N LIBRARY SCIENCE47戶留下使用的 “豆瓣猜” 和 “友鄰” 。豆瓣的 “最受歡迎新評論” 、 中國館的 “ 熱點書刊排行榜” 和 “ 文津獎” 都是基于熱點投票、 點擊或借閱次數(shù)的疊加, 能夠在總體上反映出大眾閱讀的關(guān)注點。基本書目著錄信息指的是書名、 責(zé)任者、“除基本書目著錄信息以外的推薦內(nèi)容” 這項、時間、 分類號和等大體揭示內(nèi)容的項目, 而的則是對推薦的內(nèi)容是否有比較全面的解釋, 豆瓣的書目推薦服務(wù)結(jié)構(gòu)化的程度比較低, 經(jīng)過幾次點擊, 總是會

17、回到對具體某種的介紹頁面中來, 相關(guān)的信息包括了用戶的評論, 以其為主題的討論區(qū), 以及大眾根據(jù)經(jīng)提供了足夠的信息讓讀者進行選擇。的理解對其屬性用 tag 的方式做的主題揭示, 應(yīng)該說, 它已推薦書目數(shù)量反映的是數(shù)量方面的可行性, “豆瓣猜” 和 “友鄰” 由于性已經(jīng)比較強, 因此提供的選擇范圍比較小。而中國專題推薦有著全面反映某一主題物的要求, 因此提供的推薦書目比較多, 但能夠滿足深入了解某一主題的閱讀需求。在豆瓣里, 分類瀏覽有著與主題推薦相同的聚類功能, 但是由于 tag 標(biāo)注的受控性比較差, 因而較難達到和館相同的主題推薦效果。更新速度體現(xiàn)的是推薦書目對于時刻在改變的閱讀習(xí)慣的反應(yīng)能

18、力, 雖然受制于新書累積和比較, 但它還是利用計算機技術(shù)盡量縮短書目推薦的周期。3.1.2易用性比較需要一段時間進行Web 2.0 型和傳統(tǒng)型的網(wǎng)目推薦都已經(jīng)注意到了書目推薦服務(wù)需要通過最短的路徑被用戶獲取, 用戶在主頁上不超過兩個就能獲取這項服務(wù)。豆瓣更是把書目推薦作為的主要內(nèi)容,首頁占版面最大的就是 “最受歡迎的新評論” 和 “ 豆瓣猜” 。實際的閱讀行為發(fā)生有賴于實體的獲取。雖然沒有館藏作為后盾, 但豆瓣提供了進入購物網(wǎng)上的,用戶能通過最少的點擊來實體。而中國館提供了館藏的索書號, 用戶需要到館進行借閱。, 增強推薦書目的易用性。豆瓣的導(dǎo)航條旁邊設(shè)置了站內(nèi)輔助的檢索功能能夠幫助用戶更好地

19、所需的搜索引擎, 方便用戶獲取新的書目推薦服務(wù),不致在多次的后。而傳統(tǒng)型的網(wǎng)目推薦由于結(jié)構(gòu)化程度高, 網(wǎng)頁用戶和的交互性信息交流,數(shù)量少, 因而對輔助搜索引擎的關(guān)注度較低。間的交流有助于用戶獲得幫助信息。豆瓣網(wǎng)設(shè)有站務(wù), 能讓用戶和間進行雙向而傳統(tǒng)型的中國館使用的是結(jié)構(gòu)化的讀者指南, 信息的傳遞基本上還是單向的。在 “ 文津獎” 中, 這一特點有所改進, 疇。3.1.3滿意度比較館設(shè)置了讀者推薦的反饋機制, 但仍不屬于及時提供幫助信息的范對于推薦系統(tǒng)的整體宣傳, 無論是 Web 2.0 型的還是傳統(tǒng)型的網(wǎng)目推薦都有著整個品牌的宣傳意識,在其中一個書目推薦子系統(tǒng)中都能方便地獲得其他推薦服務(wù)的信息

20、。由于 “文津獎” 是一個相對于館的活動, 因此,3.1.4 可找到性比較可找到性研究的是網(wǎng)的問題。3.1.5 普及性比較令人惋惜的是, 除了它并沒有提供其他推薦服務(wù)的信息。目推薦服務(wù)的信息孤島問題。Web 2.0 和傳統(tǒng)型的網(wǎng)目推薦服務(wù)都沒有這方面館的專題推薦服務(wù)能在推薦身體殘疾相關(guān)專題的時候能勉強算得上是普及性的書目推薦服務(wù), 兩者都沒有設(shè)置專門的書目推薦服務(wù)照顧到占據(jù)世界人口百分之十的殘疾3.1.6可靠性比較??煽啃约磿客扑]信息對的真實反映程度, 豆瓣網(wǎng)的各項服務(wù)由于信息來自于用戶, 雖當(dāng)中不乏各領(lǐng)域的專業(yè), 但就整體來說, 信息的來源 大眾在權(quán)威性和可靠性程度方面不如館員及學(xué)科。4

21、對于傳統(tǒng)型的網(wǎng)目推薦系統(tǒng)的啟示總體來說, 與Web 2.0 型的網(wǎng)目推薦系統(tǒng)相比, 傳統(tǒng)型的網(wǎng)目推薦系統(tǒng)并不占優(yōu)勢, 除了以下兩點:第一, 推薦信息的可控性和可靠性。具體表現(xiàn)在主題推薦對于同一主題物的全面推薦和館員、 學(xué)科提供信息的全文性 ;第二 , 獲取實體的成本優(yōu)勢。館有著館藏的優(yōu)勢, 能吸引希望用較低成本獲取的用戶。在傳統(tǒng)型網(wǎng)目推薦系統(tǒng)的改進過程中, 需要注意發(fā)揮這兩點競爭優(yōu)勢。4.1引入先進的過濾技術(shù)48館 學(xué) 研 究 2008.8這當(dāng)中包括了關(guān)注之間關(guān)聯(lián)的基于屬薦、 關(guān)注用戶之間關(guān)聯(lián)的基于相關(guān)用戶推薦和關(guān)于用戶的基于用戶知識結(jié)構(gòu)的推薦。這三種推薦系統(tǒng)滿足用戶變化發(fā)展的閱讀習(xí)慣的程度逐

22、漸增強, 但個性化的推薦常常需要用戶的登陸使用和意見表達。對于網(wǎng)目推薦系統(tǒng)的隱性用戶, 可以通過借用用戶閱讀喜好的模型來進行較為有性和時效性的書目推薦。4.2加入用戶之間、 用戶館員間的信息交流機制傳統(tǒng)型的網(wǎng)目推薦存在著信息單向的弊端, 用戶通常只是信息的接受者。要活躍閱讀的氛圍,就需要加入交互性且便利的信息機制, 如效仿豆瓣網(wǎng)的意見表達系統(tǒng), 加入讀者書評, 書評意見及站務(wù)交流的等。4.3改進推薦獲取的便利性在館藏的支撐下, 傳統(tǒng)型的網(wǎng)目推薦活動有著獲取的成本優(yōu)勢。因此, 必須縮短書目推薦到借閱的路徑, 使之成為讀者使用傳統(tǒng)型網(wǎng)目推薦的一個賣點??梢試L試在推薦書目的條目后添加預(yù)約借閱的按鍵,

23、 簡化用戶到館、 借閱的步驟。注釋 5 年來閱讀率持續(xù)走低 http: www bj popss gov cn bjpssweb n9795c5 a spx , 2008 03 2 4 5 謝琳惠 推薦系統(tǒng)在高校數(shù)字館的應(yīng)用研究 現(xiàn)代情報, 2006 ( ):72 74 3 6 黃曉斌 網(wǎng)絡(luò)信息過濾原理與應(yīng)用 北京:北京館, 2005 7 8 9基于信息構(gòu)建 ( A) 的 Web2 0研究 陶青上海:華東師范大學(xué), 2007馬費成, 李綱, 查先進 信息管理:大學(xué), 200Peter Morv e User ex per ence des gn http:www semant cstud os

24、 com pub c at ons semant cs 000029 php, 2008 03 0 豆瓣網(wǎng) htt p: www hoodong com entryv ew do? doc t t e=%E8 %B %86 %E7%93 %A3 %E7 %BD %9 , 2008 03 阿北 豆瓣的去中心化 () http:b og douban com , 2008 03范 旭 中山大學(xué)資訊管理系。(上接第 43 頁)備可以采用開源的L nux 軟件完成,科學(xué)版, 萬長征( 0):仲2005 (3):443在校園網(wǎng)中應(yīng)用DHCP 服務(wù) 計算機與現(xiàn)代化, 2006 3滿足小型電子閱覽46室的需求。如果是大型的電子閱覽室, 最好采用防火墻或者高檔路由設(shè)備作為 NAT

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論