文獻(xiàn)分類與編目:網(wǎng)絡(luò)信息分類之大眾分類法_第1頁
文獻(xiàn)分類與編目:網(wǎng)絡(luò)信息分類之大眾分類法_第2頁
文獻(xiàn)分類與編目:網(wǎng)絡(luò)信息分類之大眾分類法_第3頁
文獻(xiàn)分類與編目:網(wǎng)絡(luò)信息分類之大眾分類法_第4頁
文獻(xiàn)分類與編目:網(wǎng)絡(luò)信息分類之大眾分類法_第5頁
已閱讀5頁,還剩67頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

公眾分類法(Folksonomy)主要內(nèi)容

引言

公眾分類法的產(chǎn)生與發(fā)展公眾分類法的特點

幾點建議

Folksonomy興起網(wǎng)絡(luò)社群概念興起1990’sBlogs,用戶導(dǎo)向的metadata2003Del.icio.us

開啟非階層式的關(guān)鍵詞分類做法軟件應(yīng)用定義卷標(biāo)(Tagging)的盛行2004由ThomasVanderWal透過mailinglist提出Folksonomy此字眼Folksonomy一詞是與Taxonomy(學(xué)科分類學(xué)或?qū)<曳诸悾φ瞻l(fā)展而來何為FolksonomyFolksonomy是一個創(chuàng)造詞,是由社會性書簽服務(wù)中最具特色的自定義標(biāo)簽(Tag)功能衍生而來。Folksonomy=Floks+Taxonomy,F(xiàn)olks在英文中是比較口語化的詞,表示一群人,一伙人的意思。Taxonomy則是指分類法,它是信息構(gòu)架(InformationArchitecture)中一個重要部分。而Folksonomy是是指一種由使用者以任意關(guān)鍵字進(jìn)行分類的協(xié)同工作。它由“群眾”自發(fā)性定義的平面非等級標(biāo)簽分類,也稱為“分眾分類”,也有人將之解釋為SocialClassification。Folksonomy內(nèi)涵:

簡單理解這個概念就是Tags(標(biāo)簽)。Folksonomy就是由網(wǎng)絡(luò)信息用戶自發(fā)為某類信息定義一組標(biāo)簽進(jìn)行描述,并最終根據(jù)標(biāo)簽被使用的頻次選用高頻標(biāo)簽作為該類信息類名的一種為網(wǎng)絡(luò)信息分類的方法。標(biāo)簽是如何社會化的?Ciro采用統(tǒng)計學(xué)和概率論的方法對del.icio.us并NConnotea中的tag進(jìn)行了統(tǒng)計分析,構(gòu)架了用戶使用合作性標(biāo)簽的隨機(jī)模型,該模型包含兩個要素:對于他人標(biāo)記活動感知的用戶偏好機(jī)制以及系統(tǒng)中tag的時效性。盡管用戶個體的認(rèn)知過程是復(fù)雜的,個體的分類、標(biāo)記標(biāo)簽的行為是錯綜復(fù)雜的,但是在合作性標(biāo)簽系統(tǒng)內(nèi),用戶普遍的標(biāo)記行為卻遵循著簡單的活動模式。Scott采用模型和圖表研究了用戶使用合作性標(biāo)簽系統(tǒng)的規(guī)律以及合作性標(biāo)簽系統(tǒng)的結(jié)構(gòu)、使用標(biāo)簽的頻率、各種標(biāo)簽的應(yīng)用、相關(guān)標(biāo)簽使用的穩(wěn)定性的分析,認(rèn)為tag反映了用戶興趣的發(fā)展變化。標(biāo)簽社會化過程中的馬太效應(yīng)在協(xié)作過濾過程中,較為熱門的標(biāo)簽會在標(biāo)簽云圖(tagcloud)中以醒目的方式推薦給其他用戶,該標(biāo)簽的認(rèn)知度將隨之不斷提高,而那些較少被人過問的非熱門標(biāo)簽隨著時間流逝會逐漸淡出人們的視野,并最終以“協(xié)作過濾”的形式被用戶遺忘和拋棄?!盁衢T”與“淘汰”標(biāo)簽影響著用戶個體和群體的標(biāo)注行為,這種情況可以理解為標(biāo)簽選擇利用過程中馬太效應(yīng)影響的結(jié)果。在這個優(yōu)勝劣汰的過程中,那些利用率高的少部分標(biāo)簽慢慢積累下來,形成了核心詞匯,從而使大眾分類法本身具有了一定的穩(wěn)定性。作為一個標(biāo)簽元數(shù)據(jù)系統(tǒng),大眾分類法因為受到大量微觀個體信息行為與宏觀協(xié)作模式的制約作用兩方面影響,所以具備一定的動態(tài)自我進(jìn)化功能。標(biāo)簽形成過程舉例當(dāng)我在收藏S時,自定義了“門戶”,“中國”,“新聞”這3個關(guān)鍵詞作為標(biāo)簽,而其他人在收藏S時也自定義了自己的關(guān)鍵詞作為標(biāo)簽。而最后系統(tǒng)統(tǒng)計出來使用“門戶”,“中國”,“新聞”這個3個關(guān)鍵詞來定義S的頻率最高,那么這3個詞就是用戶對S的分眾分類-Folksonomy。如同……比如公司中團(tuán)隊協(xié)作時,會有一組員工通過在墻上或者在白板上擺放卡片來征詢大部分人的意見,這樣就可以確定對某種信息進(jìn)行分類的方法,這種方法具有很高的可能性,因為是大部分人推薦的。

產(chǎn)生原因

Internet是一個巨大的信息量豐富的知識庫,需要采取有效的信息組織方式和檢索方式才能更加有效地利用它獲取知識。網(wǎng)絡(luò)信息的“爆炸性”增長挑戰(zhàn)了等級結(jié)構(gòu)和分面分類的極限,傳統(tǒng)分類法因受到其昂貴的維護(hù)費(fèi)用和學(xué)習(xí)成本、漫長的更新周期和復(fù)雜的使用局限,不能很好地滿足互聯(lián)網(wǎng)知識組織的需求,使得非專業(yè)用戶開始尋求新的分類方式來組織網(wǎng)絡(luò)信息資源。產(chǎn)生原因(續(xù))分眾分類使得傳統(tǒng)分類法擺脫了固化的現(xiàn)象,并且跟大眾的認(rèn)知程度密切的結(jié)合起來在群體用戶和信息之間建立了一個聯(lián)系橋梁。這種分類是平面化的,沒有等級層次的劃分,雖然它相對不夠嚴(yán)謹(jǐn),缺乏準(zhǔn)確度,但是在社會性軟件中,這種平面延伸的分類方法卻在無形之中成為形成了溝通的渠道和網(wǎng)絡(luò),而且方便,靈活,不受條件限制這種以自定義標(biāo)簽形式的分眾分類在現(xiàn)下流行的社會性網(wǎng)絡(luò)服務(wù)中得到了廣泛的應(yīng)用,del.icio.us

,F(xiàn)lickr,43things等等。關(guān)于Tag在社會性軟件中應(yīng)用是一個很值得關(guān)注的趨勢Folksonomy應(yīng)用:

寬公眾分類法(BroadFolksonomy)特點:面向大眾,擁有大量異質(zhì)用戶。這里的異質(zhì)是指用戶在認(rèn)知能力、知識結(jié)構(gòu)和興趣領(lǐng)域上具有一定差異,每個用戶都可能用自己的語言對社區(qū)中現(xiàn)有或尚未添加的內(nèi)容提供與眾不同的標(biāo)簽,每一個內(nèi)容都存在相當(dāng)多的標(biāo)簽來描述。它所構(gòu)建的是一個大眾分類體系平臺。其原理如右圖所示。

Folksonomy應(yīng)用:寬公眾分類法(BroadFolksonomy)如右圖的曲線所示:對于一個網(wǎng)絡(luò)資源對象,可能存在5種標(biāo)簽來描述它,其中使用最多的是tag2,說明這是被最廣泛接受的詞匯,而曲線的尾端可能會出現(xiàn)很多通用性較差、較不常用的tags,形成長尾(long-tail)。寬公眾分類提供了一種工具,能夠了解用戶的用詞習(xí)慣,抽取準(zhǔn)確的受控詞。

Folksonomy應(yīng)用:窄公眾分類法(NarrowFolksonomy)特點:用戶特質(zhì)因為用戶在知識結(jié)構(gòu)和興趣領(lǐng)域上具有很大的同質(zhì)性。所以窄公眾分類的可以用于為某一領(lǐng)域或?qū)I(yè)的信息或知識提供共享平臺。

Folksonomy的應(yīng)用公眾分類法自2005年初被提出以來受到廣泛的關(guān)注,并在快速演化和升級,隨著大眾持續(xù)的需求和新的技術(shù)手段的加盟,它推陳出新的速度要快于目前元數(shù)據(jù),成為目前海量網(wǎng)絡(luò)資源組織的熱點研究方向。Tag正在開始Web環(huán)境下對信息“分類”的一種革命性的改變。這是一種廣大民眾參與信息分類的規(guī)?;鳂I(yè)。在用戶充分參與的前提下,公眾分類法可提高知識組織效率,成為網(wǎng)絡(luò)資源組織和信息檢索的重要輔助手段。

Folksonomy的應(yīng)用Folksonomy的應(yīng)用相當(dāng)廣泛,可以說所有Web2.0的網(wǎng)站都多少都具有類似功能。具體的功能就是讓用戶自行標(biāo)記(Tagging),提供標(biāo)簽。依資源類型區(qū)分是最常見的應(yīng)用方式,如替書目、書簽、圖像、影片、博客(Blog)等各類資源進(jìn)行標(biāo)記,不同資源類型型的標(biāo)記方式自然有所差異?;旧?,缺乏文字說明的資源(如圖像、影片),更需要使用者提供標(biāo)簽。主要是因為這些對象缺乏文字說明,也沒有脈絡(luò)可循,若有大量標(biāo)簽,對查詢一定有相當(dāng)大的幫助。Folksonomy應(yīng)用在Folksonomy的相關(guān)網(wǎng)站中,大部分的資源是來自他人已建置好的資源。例如網(wǎng)站是由他人所建立,使用者個人只是針對這些網(wǎng)站提供標(biāo)簽或注解。如Del.icio.us是針對已經(jīng)存在的網(wǎng)站做描述、CiteULike是針對已出版或發(fā)表在網(wǎng)路上的文章做描述。但也有些資源是來自使用者個人,如Flickr的圖片多是由個人相簿集結(jié)而成在眾多的Folksonomy相關(guān)網(wǎng)站中,大部分并不區(qū)分適用對象。例如:YouTube、Technorati都是人人可以使用與給定標(biāo)簽的網(wǎng)站。但也有不少網(wǎng)站的使用對象并非一般大眾,例如:CiteULike即明顯地是以學(xué)術(shù)性群體為主要使用對象。以大眾為主的標(biāo)記網(wǎng)站,可以想見其范疇及質(zhì)量必然很難控制;而以特定群體為對象的網(wǎng)站,其標(biāo)簽質(zhì)量及可用性相對較高根據(jù)Golder&Huberman(2006)研究,大約有7種類型:主題(如Web_design)、類型(如book)、書簽建立者、修飾類別(即本身無意義,而是用來修飾其它標(biāo)簽)、主觀感受(如useful)、個人色彩(如my開頭的標(biāo)簽),以及任務(wù)(如to_read)等。如一個想找工作的人,可能對Amazon網(wǎng)站所給的關(guān)鍵字是“jobsearch”,等到找到工作,Amazon可能就變成“bookstore”,所以關(guān)鍵字是隨任務(wù)而改變的。以下以Folksonomy中最具代表性的Del.icio.us網(wǎng)站為例,介紹其相關(guān)功能Del.ici.ous(美味書簽)對folksonomy的成功應(yīng)用書簽管理的發(fā)展大體經(jīng)歷了三個階段,第一個階段就是IE最初提供的收藏夾功能。這種收藏功能僅是一種靜態(tài)的、沒有相互關(guān)聯(lián)的簡單收集狀態(tài)。漸漸地這種情況已不能滿足大家的需求了,此時,又產(chǎn)生了第二階段:用單機(jī)型的專業(yè)收藏程序來管理手頭的網(wǎng)址收藏。其缺陷也是明顯的,一方面是需要大家在不同的機(jī)器上安裝客戶端程序,一方面是沒辦法方法地共享給其他朋友們使用;隨著需求的不斷提高,新型的、基于互聯(lián)網(wǎng)功能“網(wǎng)絡(luò)收藏夾”應(yīng)運(yùn)而生,del.icio.us就是這樣一個非常不錯的工具。

delicious,其中文含義是“美味”的意思,大抵相當(dāng)于可以把感興趣的網(wǎng)址組合在一起,像提供美食一樣為大家提供網(wǎng)址的共享及其相互的關(guān)系。網(wǎng)址管理方式的不同,不但對你個人應(yīng)用網(wǎng)絡(luò)獲取信息產(chǎn)生了巨大的影響,而且還對網(wǎng)絡(luò)信息內(nèi)容的傳播與創(chuàng)新,都產(chǎn)生了重大的作用。Del.ici.ous對folksonomy的成功應(yīng)用作為目前網(wǎng)絡(luò)上最大的書簽類站點,Del.icio.us的迅速崛起以及在網(wǎng)絡(luò)上迅速流傳開來,標(biāo)志著互聯(lián)網(wǎng)上社會性軟件(socialsoftware)的復(fù)興。Del.ici.ous對folksonomy的成功應(yīng)用Del.icio.us.在網(wǎng)絡(luò)上展露頭腳,大部分得益于其自身的標(biāo)簽累計功能。這種功能在用戶數(shù)量增加時而隨之增加。所形成的大的協(xié)作框架協(xié)議就稱之為“分眾分類法”(Folksonomy),這種分類方法對原有的網(wǎng)絡(luò)導(dǎo)航模式進(jìn)行了更新。使用時,用戶可以對自己收藏的書簽進(jìn)行標(biāo)簽(tag),然后通過含有標(biāo)簽關(guān)鍵詞的界面對其進(jìn)行導(dǎo)航。這樣就可以不用使用專門的條目分類技術(shù)(taxonomy)。除此之外,如果Del.icio.us.對其所有用戶的書簽種類進(jìn)行信息聚合,從而可以在用戶規(guī)模以及標(biāo)簽內(nèi)容的基礎(chǔ)上給每一個用戶提供方便易得的分眾分類標(biāo)簽服務(wù)。Del.icio.us

使用介紹Del.icio.usHomepageFoodTaginDel.icio.usAmazon網(wǎng)站上的標(biāo)簽應(yīng)用亞馬遜網(wǎng)站有一個方便讀者的功能,稱作標(biāo)簽(tag)。給圖書貼標(biāo)簽就是給一本書加上關(guān)鍵詞,或者將一本圖書歸類,加上類別說明。例如,一個攝影愛好者給一本自己喜愛的圖書注上“攝影”的標(biāo)簽,然后他可以在亞馬遜網(wǎng)站上利用“攝影”這個標(biāo)簽搜索其他被人貼上“攝影”標(biāo)簽的圖書。讀者也可以給一本書貼上多個不同的標(biāo)簽,從不同的側(cè)面反映該書的內(nèi)容,便于搜索類似的圖書。任何讀者都可以將亞馬遜網(wǎng)站上任何圖書貼上標(biāo)簽,任何人的標(biāo)簽都能被其他讀者看到(讀者也可以將自己的標(biāo)簽設(shè)定為保密)。Amazon網(wǎng)站上的標(biāo)簽應(yīng)用Amazon現(xiàn)在可以允許用戶使用關(guān)鍵字對商品進(jìn)行標(biāo)簽分類,這些用戶自己選擇的關(guān)鍵字可能是很隨意的。隨著時間的推移,這就會衍生出自己的folksonomy分類方法,通過這種方法用戶可以使用Amazon站點為其他用戶添加數(shù)據(jù),這其實就是一種自定義分類法.用戶可以點擊標(biāo)簽欄目中“seemostpopulartags”來查找流行的分類標(biāo)簽/

對用戶來說,Amazon的添加標(biāo)簽tagging功能不僅強(qiáng)化了站內(nèi)搜索,還具有個性化標(biāo)識產(chǎn)品、增強(qiáng)互動等多方面的作用。博物館中對folksonomy的應(yīng)用加拿大多倫多大學(xué)教授JenniferTrant和美國丹佛藝術(shù)博物館BruceWyman博物館想讓參觀者交流他們的收藏和觀點,因此博物館收藏支持社會性書簽,并且提供基于大眾分類法的檢索,這給開放的博物館一種新的闡釋,相對圖書館而言,反映了參觀者的觀點。在博物館和參觀者之間合作的隔閡:專業(yè)語言與博物館參觀者的大眾語言,幫助個體看到個人的意義和公眾收藏的意義。Steve博物館是一個合作性的博物館和博物館信息學(xué)界的專業(yè)人士正在發(fā)展一種工具和技術(shù),正在開發(fā)藝術(shù)博物館中社會性書簽和大眾分類法文本間的關(guān)系。標(biāo)簽系統(tǒng)設(shè)計與應(yīng)用Cameron建立了基于資源、用戶和標(biāo)簽的網(wǎng)絡(luò)標(biāo)簽?zāi)P?,然后?2個標(biāo)簽系統(tǒng)為例,設(shè)計了標(biāo)簽系統(tǒng)的模塊和系統(tǒng)屬性,這些模塊為:使用標(biāo)簽的權(quán)限、標(biāo)簽的聚集、標(biāo)簽支持,供給、資源的類型、來源、資源的鏈接、群體在系統(tǒng)中的連通性。分析了用戶添力ntag時的7種動機(jī)即未來檢索、貢獻(xiàn)和分享、注意力的吸引、競爭、自我表現(xiàn)、觀點表達(dá)等以及這7種動機(jī)對標(biāo)簽系統(tǒng)的不同影響,并在flicker中進(jìn)行了實驗。應(yīng)用folksonomy進(jìn)行網(wǎng)絡(luò)資源評價日本東京大學(xué)學(xué)者

SatoshiNiwa,TakuoDoi,ShinichiHoniden在第三屆國際信息技術(shù)大會—新的一代會議上,《基于大眾分類法的網(wǎng)頁評價系統(tǒng)研究》一文中,通過協(xié)作性的過濾來構(gòu)建網(wǎng)頁評價體系已經(jīng)有很多嘗試了,但是系統(tǒng)在這個領(lǐng)域的覆蓋是非常的嚴(yán)格,因為收集用戶偏愛網(wǎng)頁上的數(shù)據(jù)是非常的困難,同時,因特網(wǎng)上的網(wǎng)頁實在是太多。因此,他提出了一種通過正在流行的大眾分類法和社會系書簽工具來構(gòu)建覆蓋整個網(wǎng)絡(luò)的新的網(wǎng)頁評價系統(tǒng)的方法。WebPageRecommenderSystembasedonFolksonomyMiningforITNG’06Submissions/persagen/DLAbsToc.jsp?resourcePath=/dl/proceedings/&toc=comp/proceedings/itng/2006/2497/00/2497toc.xml&DOI=10.1109/ITNG.2006.140現(xiàn)已采用標(biāo)簽系統(tǒng)的網(wǎng)站/bookmark.html這些基于網(wǎng)絡(luò)的合作系統(tǒng)可以:建立共享詞條數(shù)據(jù)庫形成扁平狀的元數(shù)據(jù)詞表進(jìn)行元數(shù)據(jù)檢索捕捉各自感興趣領(lǐng)域的變化發(fā)現(xiàn)新趨勢Folksonomy的特點首先,是由個人自發(fā)性定義(自由性)第二,標(biāo)簽分類是公開共享的,可以被所有人看到(共享性)其三,是由用戶群體定義的頻率來決定(社群性)其四,結(jié)構(gòu)是平面化的,并且具有動態(tài)性其五,標(biāo)簽穩(wěn)定性來源于大量用戶對標(biāo)簽的社會性協(xié)作過濾機(jī)制通常,大家會認(rèn)為“大眾分類法”就是使用自訂的標(biāo)簽(tagging)進(jìn)行分類。但是使用者自行標(biāo)簽與大眾分類仍然有所不同。如Gmail的標(biāo)簽分類也是一種自訂關(guān)鍵字的分類方法,不過它并不能說是大眾分類法,因為使用者彼此之間并不能分享分類的資訊。Folksonomy的內(nèi)涵與功能(1)普通用戶參與和主導(dǎo)信息的組織,用戶間通過協(xié)作完成對信息的分類組織;用戶能夠?qū)Y源的意義進(jìn)行標(biāo)注,以便于再次查找和使用,同時使個人的資源能夠被其他用戶發(fā)現(xiàn)和分享。從結(jié)構(gòu)上來講,Folksonomy是一種平面的結(jié)構(gòu),沒有等級體系。(2)Folksonomy具有社群聚合的功能,并且能夠反映不同社群對相同事物的不同認(rèn)識,從而建立不同知識體系間的聯(lián)系,具有強(qiáng)大的知識聚合及共享功能。(3)Folksonomy賦予了用戶基于標(biāo)簽的檢索、瀏覽和定制功能。Folksonomy能夠通過特定的標(biāo)簽聚合整個信息空間中的相似內(nèi)容,在資源極其豐富的背景下,Folksonomy能夠幫助用戶發(fā)現(xiàn)感興趣的內(nèi)容。Folksonomy與元數(shù)據(jù)比較:

方面元數(shù)據(jù)Folksonomy定義關(guān)于數(shù)據(jù)的數(shù)據(jù)(dataaboutdata)關(guān)于數(shù)據(jù)的標(biāo)簽(tagaboutdata)目的組織信息以方便用戶使用組織信息以方便用戶使用制作人專業(yè)人士公眾(網(wǎng)絡(luò)用戶)制作成本高低維護(hù)費(fèi)用大?。◣捉诹悖└轮芷陂L即時規(guī)范性分類架構(gòu)事先制定、嚴(yán)謹(jǐn)、準(zhǔn)確、標(biāo)準(zhǔn)、規(guī)范、權(quán)威分類架構(gòu)未事先制定、標(biāo)簽因人而異、自由標(biāo)注,品質(zhì)參差不齊便利性復(fù)雜、麻煩簡單、方便時效性滯后適時直觀性差及時反映大眾興趣熱點與發(fā)展趨勢覆蓋面小越來越廣Folksonomy優(yōu)點:

與傳統(tǒng)分類法相比,這種分類法的特點在于它并沒有采用預(yù)先制定的信息分類法和詞表,而是用戶根據(jù)個人的使用習(xí)慣,以自定義的自由詞為數(shù)字資源對象進(jìn)行標(biāo)注和分類。所以公眾分類法比傳統(tǒng)的等級分類和分面分類法更接近用戶大眾并易于被他們接受,自由靈活是其突出的優(yōu)點。用戶可以對其感興趣的內(nèi)容進(jìn)行標(biāo)識,提供一個或者多個標(biāo)簽,或什么也不作,僅瀏覽他人的標(biāo)簽。人們不必了解DCMI修飾符,也不必查詢杜威十進(jìn)制分類法(DDC)。Folksonomy優(yōu)點:用戶對內(nèi)容進(jìn)行標(biāo)注后,他人可立刻看到這些標(biāo)簽,如果認(rèn)為標(biāo)簽不合適,還可以自行增加新的標(biāo)簽,因此共建共享是其另一重要特色。常用的標(biāo)簽按字順排列,形成標(biāo)簽云圖(TagCloud)。這種TagCloud不同于傳統(tǒng)的、針對文字本身的關(guān)鍵字檢索,而是一種模糊化、智能化的分類。Folksonomy優(yōu)點

動態(tài)更新是其有別于傳統(tǒng)分類法的又一個重要特色。動態(tài)更新是隨著人們使用不同標(biāo)簽標(biāo)識內(nèi)容信息,被使用最多的標(biāo)簽就最能說明這條信息的特點。一些使用頻率低的標(biāo)簽逐漸“淡出”人們的視野,而那些使用頻率高的標(biāo)簽會在標(biāo)簽云圖以字號變大的形式反映出來,這種更新可讓人隨時發(fā)現(xiàn)當(dāng)前人們關(guān)注的“熱點”和“走勢”。Folksonomy缺點:缺乏層次性(lackofhierarchy)

公眾分類法與傳統(tǒng)分類法的一個顯著不同是:它是一種平面的分類方式,系統(tǒng)在整體信息的組織上,是一個用詞構(gòu)成的平面結(jié)構(gòu),因而很難使用它來揭示復(fù)雜的關(guān)系。Folksonomy缺點:表達(dá)概念的模糊性

基于公眾分類法的數(shù)字資源采用的是根據(jù)用戶自定義的詞,進(jìn)行描述、分類和檢索,這就造成了標(biāo)簽的模糊性,主要表現(xiàn)在以下四個方面:①缺乏語義精確性(lackofsemanticprecision)由于用戶認(rèn)知程度不同,對標(biāo)簽詞義的理解各異,導(dǎo)致對同一事物的揭示存在很大的差異。比如在同一標(biāo)簽下,可能會發(fā)現(xiàn)彼此完全沒有關(guān)系的內(nèi)容。②缺乏同義詞控制(lackofsynonymcontrol)由于用戶用詞習(xí)慣的不同,會出現(xiàn)大量的同義詞,例如不同的詞表達(dá)同一的概念:土豆/馬鈴薯,又如一個詞的不同寫法:web2/web20/web2.0,還有同一個詞在英語中用戶可能會使用單數(shù)或復(fù)數(shù)形式,等等。③詞的多義性問題。比如“china”這個標(biāo)簽,到底指中國,還是指瓷器。④用戶標(biāo)簽五花八門,可能會產(chǎn)生大量“噪音”,加重系統(tǒng)負(fù)擔(dān),降低分類的準(zhǔn)確性。這些都會造成查找的困難。幾點建議

對于公眾分類法在目前的應(yīng)用中存在的精確性和缺乏層次等問題,如果能與目錄分類法(Taxonomy)相結(jié)合,然后再對能夠用作標(biāo)簽的詞匯進(jìn)行控制,(controlledvocabulary)那將是很好的解決途徑。幾點建議⑴對Tag進(jìn)行排序除了按照字順和權(quán)重排序之外,還有多種形式,包括動態(tài)形式,如結(jié)合相關(guān)反饋、合作過濾、點擊次數(shù)等。幾點建議⑵對Tags進(jìn)行聚類為了達(dá)到更好地揭示資源之間的相互關(guān)系,對Tags進(jìn)行聚類能夠幫助用戶通過一個tag更快地發(fā)現(xiàn)與之相關(guān)的內(nèi)容。以賓夕法尼亞大學(xué)(UniversityofPennsylvania)圖書館的“PennTag”項目[6]為例,圖6是用戶點擊“film”這個標(biāo)簽之后,出現(xiàn)的按照字順排列的與film相關(guān)的(relatedtofilm)內(nèi)容。幾點建議⑶對Tag進(jìn)行層級化現(xiàn)在的標(biāo)簽是平面結(jié)構(gòu),不能很好地反映他們之間的層次關(guān)系。如果可以與敘詞表結(jié)合使用,利用已有的敘詞表中的層級關(guān)系,希望將來可以實現(xiàn)從平面的標(biāo)簽到網(wǎng)狀的概念地圖(ConceptMaps)。幾點建議⑷對Tag進(jìn)行規(guī)范化由于標(biāo)簽完全由用戶自行創(chuàng)建,這種自由導(dǎo)致了標(biāo)簽的表示法不規(guī)范,例如:拼寫錯誤,單復(fù)數(shù)形式混用,另外,由于目前大多數(shù)應(yīng)用系統(tǒng)只支持單個詞,用戶為了更清楚地表達(dá)自己的意思,往往會使用符號來形成復(fù)合詞,例如:目前一些del.icio.us(即“美味書簽”,當(dāng)前網(wǎng)絡(luò)上最大的書簽類站點)的用戶使用如下的Tag來表示編程語言:Programming/C++,Programming/Java和Programming/XHTML等。幾點建議

右圖5是隨機(jī)抽取的一定數(shù)量的帶有連接符號的復(fù)合詞,顯示了用戶使用符號的多樣性。通過圖5我們可以發(fā)現(xiàn),最經(jīng)常被使用到的是連接符“-”,其次是下劃線“_”。針對標(biāo)簽寫法不規(guī)范的問題,應(yīng)該制定通用的標(biāo)準(zhǔn)表示方法,并提示用戶遵循這些標(biāo)準(zhǔn)對網(wǎng)絡(luò)資源進(jìn)行添加標(biāo)簽的活動。例如,采用拼寫檢查機(jī)制,當(dāng)用戶輸入錯誤的或不存在的詞時,系統(tǒng)會出現(xiàn)提示和輸入建議;而對于復(fù)合詞,應(yīng)當(dāng)規(guī)定規(guī)范的表示方法。幾點建議

另外,通過使用同義詞環(huán)方法——當(dāng)用戶在添加了tag和數(shù)據(jù)源之后,系統(tǒng)管理員可以對這些數(shù)據(jù),根據(jù)統(tǒng)計得到的勢曲線進(jìn)行分析,挑選出相關(guān)的同義詞,構(gòu)成同義詞環(huán),幫助提高準(zhǔn)確性。同時同義詞環(huán)的方法也可以用于處理同一詞的單復(fù)數(shù)形式,同一詞的不同語言表示。不強(qiáng)行要求環(huán)中的某一個詞被當(dāng)作“正式詞”,而是每一個詞都可以作為正式詞;同義詞環(huán)可以一組一組逐步建立,隨著檢索環(huán)境的變化和網(wǎng)站內(nèi)容的變化而隨時增加新的同義詞環(huán)。參word文檔Tagcloud標(biāo)簽云圖2002年JimFlanagan首度應(yīng)用tagclouds做主題展示方式.Flickr,Technorati和Blogs在設(shè)計領(lǐng)域推動了它的應(yīng)用,如今Spiegel.de,O2-online等大公司都在用它。它實際上是一種特定領(lǐng)域信息的可視化表現(xiàn)方式:將主題詞(按使用頻率統(tǒng)計出來的)重要性與字體大小對應(yīng)。按字順或時間排序Tag字體大小代表的是在某一文獻(xiàn)中出現(xiàn)的頻率,或者是使用該tag標(biāo)引的文獻(xiàn)數(shù)量,即熱門度。它也是內(nèi)容的分類標(biāo)準(zhǔn),字號越大代表該類資源越多。一目了然,簡單易用每個tag都附加有原文鏈接,可以打開相關(guān)資源并進(jìn)行編輯。Del.icio.usTagcloudFolksonomy標(biāo)簽云示例2:Folksonomy中文標(biāo)簽云Tagcloud類型靜態(tài)動態(tài)靜態(tài)Tagcloud生成工具tagcloud網(wǎng)站:/

直接輸入一個網(wǎng)址進(jìn)行分析,或者手動輸入不同網(wǎng)址及其對應(yīng)的關(guān)鍵詞Rainmaker/rainmaker/

tagcrowd/在線的網(wǎng)絡(luò)服務(wù)應(yīng)用,它可以提供把你網(wǎng)頁的關(guān)鍵字密度以一個可視化、漂亮的標(biāo)簽云顯示出來。(使用了CSS和HTML)。

支持輸入文本,提交網(wǎng)頁地址,上傳文本文件,它就會自動抓取頁面里面的關(guān)鍵詞,并根據(jù)關(guān)鍵詞的使用頻率生成一個標(biāo)簽云和相應(yīng)的代碼,若要使用,你只需要把代碼粘貼到你的網(wǎng)頁就可以了??梢赃M(jìn)行最大顯示數(shù)量等限制

TagcloudgeneratorTagCloudGenerator

這個工具同樣可以生成一個靜態(tài)的標(biāo)簽云圖,你只需要輸入你的網(wǎng)頁地址,或是手動輸入Tag的關(guān)鍵詞和網(wǎng)頁。還可以配置標(biāo)簽云的背景顏色,輸出寬高,Tag鏈接的文字顏色,是否使用下劃線以及是實線還是虛張,文字字體,以及Tag字體的最大尺寸和最小尺寸,標(biāo)簽云的排版等。這是一個可定性比較強(qiáng)的靜態(tài)標(biāo)簽云生成器,可惜的是不支持中文Tag,但要注意的是:如果是直接輸入網(wǎng)址獲取關(guān)鍵詞來生成Tagcloud,中文關(guān)鍵詞會顯示亂碼,不過,你可以手動進(jìn)行更改或者直接手動輸入中文關(guān)鍵詞,這樣就可以解決亂碼問題可以在自動生成網(wǎng)頁tags時選擇顯示的tag數(shù)量(30),并刪除不需要的tags會顯示出主題以及所在的網(wǎng)頁,主題也特別美觀,顏色也不錯tagCloud.de

這是一個德國網(wǎng)站提供的標(biāo)簽云生成器,功能較少,不過可以加入自己的CSS樣式文件,比較適合對CSS有一定基礎(chǔ)者支持生成英文和德文的Tagcloud。中文同樣是亂碼不管是哪個標(biāo)簽云生成器,所有生成的亂碼,其實都可以在生成代碼后再把亂碼更改成中文字符就可以了。只是那要好像就變得麻煩了。Rainmaker這個標(biāo)簽云生成器的功能也比較多,定制性強(qiáng)。其最大的特點是,你可以排除你不想要生成的標(biāo)簽。WebpagesasGraphs/static/htmlgraph/輸入網(wǎng)址即可生成,截圖編輯后放入自己的空間或博客需要安裝Java插件動態(tài)Tagcloud生成方式Makecloud/將自己的rssfeedURL(如博客網(wǎng)址)或網(wǎng)站copy到本網(wǎng)站,獲得一段代碼;將代碼復(fù)制到自己的博客源代碼中想要插入云圖處,即可在自己的博客上顯示動態(tài)標(biāo)簽如果沒有rssfeed,則從任意網(wǎng)站或任意文本等途徑生成云圖,或下載其合作軟件FeedM生成RSSfeed,上面有自帶的云圖生成器tagcloudmashup:集成不同來源的tagMakecloud的mashup功能(集成不同網(wǎng)站的新聞)/tag_cloud_mashup.html

Makecloud的個人主頁動態(tài)標(biāo)簽功能(個人主頁插件)/widget.html

Tagacloud(登記并顯示不同網(wǎng)站的tag)tagacloud/不同網(wǎng)站主tag的集成地,允許大眾將自己的博客、主頁等用一個tag和幾個關(guān)鍵詞登記到該網(wǎng)站,再按最新標(biāo)簽、熱門程度、關(guān)鍵詞、搜索排名等順序生成各網(wǎng)站tag的云圖2006年12月份左右建立,一開始只是接受獨立域名的網(wǎng)站或博客,2007年已開通了對

,

,

,

,

,

這幾個知名BSP用戶的支持。EncoreInnovativeInterfaces公司專注于開發(fā)Encore,一個基于Millennium技術(shù)的新的發(fā)現(xiàn)服務(wù)平臺。Encore的特點預(yù)計包括動態(tài)生成基于主題詞表、分面導(dǎo)航的“熱門”標(biāo)簽云圖。Innovative召募到14家開發(fā)伙伴協(xié)助創(chuàng)建Encore,包括賓漢頓大學(xué),納什維爾公共圖書館和耶魯大學(xué)戈德曼法律圖書館及其他單位。Tagcloud分析文本的來源網(wǎng)站頁面:輸入網(wǎng)址本地文檔:上傳一段文字:插入Tagcloud目前用途總結(jié)顯示研究熱點說明發(fā)展趨勢脈絡(luò)查找同道者(如delicious)Tagcloud難點不同來源的mashup不同文字的兼容多層次的顯示方式Tagcloud發(fā)展趨勢Tagline分層次的Tagcloudtagline基于時間的tagline制作工具TaglineGenerator-Timeline-basedTagClouds(基于php5)。演示及源代碼下載:http://chir.ag/tech/download/tagline/

另外一個結(jié)合flash的對圖片(來自flickr網(wǎng)站)的tagline說明:/2006/07/taglines.html

演示:/taglines/

分層次tagcloud/除了輸入網(wǎng)址生成tagcloud之外,還允許在一級云圖下再加入關(guān)鍵詞搜索并形成二級云圖仍然是一個平面tagcloud,不能直接顯示tags之間的等級關(guān)系沒有數(shù)量的限制,將所有能展示的tag全部標(biāo)出,tags過于龐大不美觀展望tagclouds下一步朝什么方向發(fā)展、有何用途?標(biāo)簽云圖與可視化圖像有什么內(nèi)在關(guān)聯(lián),對信息(知識)的聚合和管理有什么更深層的意義,它們是否可以互相結(jié)合,進(jìn)一步改進(jìn)?會不會像許多新奇技術(shù)一樣因為用處不大而曇花一現(xiàn)?三、Taxonomy與Folksonomy的比較項目TaxonomyFolksonomy目的以利他

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論