網(wǎng)絡(luò)信息組織對傳統(tǒng)信息組織的借鑒-模板_第1頁
網(wǎng)絡(luò)信息組織對傳統(tǒng)信息組織的借鑒-模板_第2頁
網(wǎng)絡(luò)信息組織對傳統(tǒng)信息組織的借鑒-模板_第3頁
網(wǎng)絡(luò)信息組織對傳統(tǒng)信息組織的借鑒-模板_第4頁
網(wǎng)絡(luò)信息組織對傳統(tǒng)信息組織的借鑒-模板_第5頁
已閱讀5頁,還剩4頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

網(wǎng)絡(luò)信息組織對傳統(tǒng)信息組織的借鑒

【內(nèi)容提要】本文以絡(luò)信息組織繼承和發(fā)展傳統(tǒng)信息組織的方法為切入點,從四個方面論述了絡(luò)信息組織對傳統(tǒng)信息組織的借鑒,這四個方面包括用體系分類法完善信息資源分類體系;用分面分類法改進絡(luò)信息組織;用分類主題一體化改造絡(luò)信息組織;建立一套科學(xué)的絡(luò)信息分類體系。最后提出了絡(luò)信息組織研究和工作的發(fā)展趨勢。

【摘

題】信息資源建設(shè)

1引言

信息組織是采用各種方法和手段使信息有序化的過程。它通過揭示信息間內(nèi)在的邏輯關(guān)系,對信息進行加工、整理、提煉,使之系統(tǒng)化、濃縮化,從而達到便于信息傳遞和交流的目的。傳統(tǒng)信息組織,主要是指對文獻信息的組織,即使在采用計算機技術(shù)后,所處理的信息對象仍主要是文獻信息,并進行人工著錄、分類、標(biāo)引,組織形式大多通過手工編制的目錄、索引、文摘等。在絡(luò)環(huán)境下,信息資源多以數(shù)據(jù)庫、信息庫的形式存在,電子信息占主導(dǎo)地位,信息組織的對象逐漸多樣化,范圍也隨之?dāng)U大,它不再停留在對文獻特征的描述,而是深入到知識單元、信息單元。

從本質(zhì)上講,絡(luò)信息組織是對絡(luò)中的節(jié)點(服務(wù)器)中的各種格式的文件和數(shù)據(jù)庫(或信息庫)中的各個信息單元(如數(shù)據(jù)項)的組織。具體地講,絡(luò)信息組織有兩層含義,一是某一特定絡(luò)服務(wù)器(站)的信息組織;二是對整個絡(luò)信息(站集合)的組織。前者是絡(luò)局部(節(jié)點)的信息組織,后者是絡(luò)全局的信息組織。前者的工作主要由各節(jié)點的站開發(fā)和維護人員來完成,后者由專門的信息服務(wù)公司,通過搜索引擎來完成。兩者對圖書情報部門的信息組織均有借鑒意義。本文主要以后者為研究對象,即整個絡(luò)的信息組織。

傳統(tǒng)信息組織主要包括分類法、主題法、索引法、文摘法等。與傳統(tǒng)分類法相比,絡(luò)信息組織在立類與列類、分類標(biāo)識與分類對象的對應(yīng)關(guān)系、分類標(biāo)引過程、分類標(biāo)引等方面存在明顯的區(qū)別;與傳統(tǒng)主題法相比,絡(luò)信息組織在搜索引擎對主題檢索的支持以及元數(shù)據(jù)的產(chǎn)生和運用等方面存在很大區(qū)別;與傳統(tǒng)索引法相比,在索引對象、索引類型、索引生成以及使用目的等方面存在許多不同;與傳統(tǒng)文摘法比較,在編制方式、編制速度、編制質(zhì)量以及與主題法的結(jié)合程度等方面也存在著差別。

比較和分析絡(luò)信息組織與傳統(tǒng)信息組織有利于展現(xiàn)兩者的優(yōu)缺點,從而為絡(luò)信息組織繼承和發(fā)展傳統(tǒng)信息組織提供了借鑒,促進絡(luò)信息組織的進一步改進和完善。

本文以此為出發(fā)點,深刻認(rèn)識這兩種各有千秋的信息組織方法,提供理論和方法上的依據(jù),并以此為切入點,從四個方面來論述絡(luò)信息組織方法與傳統(tǒng)信息組織方法之間的相互借鑒關(guān)系,以使兩者相得益彰、共同發(fā)展,從而在實際工作中利用相關(guān)成果改進現(xiàn)有工作,以滿足現(xiàn)代信息用戶的需求。

2借鑒體系分類法完善信息資源分類體系

從體系分類法的角度看,絡(luò)信息資源分類體系確實存在著一些低級錯誤,改正這些錯誤將有利于絡(luò)信息資源分類的科學(xué)化和規(guī)范化,有利于提高查全率和查準(zhǔn)率,尤其是提高查準(zhǔn)率。

類目設(shè)置缺乏規(guī)律性和層次的不平衡性

在絡(luò)信息分類中,其類目設(shè)置往往同時采用多個標(biāo)準(zhǔn),運用每個標(biāo)準(zhǔn)設(shè)類時缺少完整性,有時甚至在同一層次上列出不同等級的類目,致使同位類設(shè)置顯得混亂,缺乏規(guī)律性,增加了用戶通過瀏覽查找信息的難度。因而,需借鑒體系分類法的立類原則,一般采用同一標(biāo)準(zhǔn),類目級別往往不能混淆。此外,有些絡(luò)信息的類目劃分只有兩三層,有些則多達十多層,類目層次顯得不均衡,應(yīng)當(dāng)在現(xiàn)有基礎(chǔ)上作適當(dāng)調(diào)整,盡量使同位類下的層次保持均衡。

類目劃分缺少一致性

不同搜索引擎的類目劃分都有自己的體系,相互之間缺乏一致性。比如,Sohu將“留學(xué)與移民”放在“工商經(jīng)濟”類,“易”在文學(xué)類下列出“人文歷史和宗教”類,Yahoo將“音樂”放在“綜合參考”下予以重復(fù)反映,這些做法明顯欠妥。理想地,各個搜索引擎的類目劃分應(yīng)當(dāng)大體相仿,使用戶有章可循。

依據(jù)缺少提示

目前,用戶在使用瀏覽性檢索工具時,不能直接找到所需類名,必須逐級翻閱查找。有時為了找到一個類目,需要讀取十多個頁面,頗為費時費力。為了用戶查找方便,應(yīng)當(dāng)提供一個分類法使用說明,以便用戶參考、熟悉、研究之用,并能使其快速找到所需信息。此外,可以考慮使用一些技術(shù)手段,比如,當(dāng)用戶把鼠標(biāo)放到某一類目上時。可自動顯示其下級類目。

3借鑒分面分類法改進絡(luò)信息組織

分面分類法在對傳統(tǒng)信息組織的優(yōu)化上曾起到了很大的作用,在絡(luò)環(huán)境下,借鑒分面分類法,可對絡(luò)信息組織進行優(yōu)化。實際上,現(xiàn)行的搜索引擎中也包含分面分類法的思想,但粗糙和不規(guī)范。比如,在“sina”搜索引擎的關(guān)鍵詞的查詢反饋結(jié)果中,在同一頁面上包含目錄、站、新聞標(biāo)題、新聞全文、頻道內(nèi)容、頁、商品信息、消費場所、中文址、滬深行情、軟件、游戲等各類信息的綜

理想的絡(luò)信息資源檢索語言應(yīng)當(dāng)是分類主題一體化語言。例如,在搜索引擎進行關(guān)鍵詞檢索時,可選擇在所有站點或僅在此目錄下進行檢索,而且輸出關(guān)鍵詞檢索結(jié)果時,列出相應(yīng)的分類檢索路徑。

目前這種思路在“sina”搜索引擎中得以實現(xiàn)。例如,如果想查找“紅樓夢”的相關(guān)信息,可在搜索框內(nèi)鍵入關(guān)鍵詞“紅樓夢”,并單擊旁邊的搜索按鈕,新浪搜索會先返回目錄搜索結(jié)果“文學(xué)藝術(shù)>各類藝術(shù)>文學(xué)>各類文學(xué)>小說>古典小說>四大古典名著>紅樓夢”,接下來就是關(guān)于“紅樓夢”的站的搜索結(jié)果。

有趣的是,在現(xiàn)行的搜索引擎中,不但體現(xiàn)了分類主題一體化思想,還根據(jù)實際需要在搜索結(jié)果中體現(xiàn)了分類、主題、文摘以及新聞服務(wù)四位一體的思想。比如,中文雅虎的搜索結(jié)果會從數(shù)據(jù)庫中找出以下五個部分,按照順序列出搜索結(jié)果:

分類類目分類

站名稱主題

站描述文摘

相關(guān)頁主題

Yahoo!中國的相關(guān)新聞新聞服務(wù)

但是,要實現(xiàn)絡(luò)信息的真正的分類主題一體化,還要做好以下三個方面的工作:

建立一個結(jié)構(gòu)簡明的知識分類體系,通過對信息資源的系統(tǒng)分類,實現(xiàn)對絡(luò)信息的宏觀控制。這樣的知識分類體系必須堅持科學(xué)性與實用性的統(tǒng)一,結(jié)構(gòu)要清晰,整個體系是動態(tài)的,可以采用超文本系統(tǒng)進行管理。

建立一個智能化的控制詞表,實現(xiàn)作者語言與用戶檢索語言的控制和轉(zhuǎn)換??刂圃~表應(yīng)當(dāng)支持后控,以提高受控詞的利用率和用戶的交互能力。

建立分類體系與控制詞表的系統(tǒng),即將標(biāo)引語言納入分類體系,這樣既可以用自然語言直接檢索,也可以在任何類下進行語詞檢索,從而較好實現(xiàn)分類與主體的兼容。在搜索引擎生成索引數(shù)據(jù)庫時形成包括分類標(biāo)識和關(guān)鍵詞標(biāo)識的索引,同時分別為分類標(biāo)識和關(guān)鍵詞標(biāo)識生成倒排擋,這樣既加快了檢索速度,又能同時以分類標(biāo)識和關(guān)鍵詞進行檢索,提高查準(zhǔn)率。

5絡(luò)信息組織的目標(biāo)——建立一套科學(xué)的絡(luò)信息分類體系

建立一套科學(xué)的絡(luò)信息分類體系,必須明確基本的分類原則。

絡(luò)信息分類的基本原則

確定絡(luò)信息分類原則必須根據(jù)絡(luò)信息的特點:

直接性原則

分類的層次不宜太多,不應(yīng)該出現(xiàn)轉(zhuǎn)換十多次還找不到所需信息的情況。一般來說,類目在6層以下比較符合人們的習(xí)慣。

數(shù)據(jù)保證原則

絡(luò)信息分類法是面向整個絡(luò)信息資源的,分類對象要明確地擴大到絡(luò)上一切可以利用的資源,讓各種類型的絡(luò)信息資源都能在分類法中找到相應(yīng)的位置。

自然性和實用性原則

絡(luò)是面向大眾的,所用的類名基本上應(yīng)當(dāng)是自然語言,以滿足廣大普通用戶的信息需求。同時,絡(luò)信息分類的類目要少而精,要實用,不應(yīng)該僅僅為了美觀等因素而設(shè)立一些用處不大的類目。

快捷性原則

每一類名都應(yīng)有與其對應(yīng)的一個快捷鍵或類號,以便于熟練的用戶進行快速查找。傳統(tǒng)分類法在這方面有相當(dāng)杰出的成就(如類名索引等),毫無疑問,編制絡(luò)信息分類法時應(yīng)當(dāng)對這些成就加以研究和借鑒。

關(guān)于《絡(luò)信息分類法》的構(gòu)建

傳統(tǒng)分類體系與絡(luò)分類體系的相互借鑒和改造,使得編制一部絡(luò)信息分類法成為可能,在具體做法上,應(yīng)注意以下幾點:

以傳統(tǒng)分類主題為基礎(chǔ),構(gòu)建多維的分類體系

在欄目設(shè)置上,為了便于用戶瀏覽,可以適當(dāng)靈活處理,建立多維的分類模式。但這種變化必須是以傳統(tǒng)分類主題理論體系為基礎(chǔ)的。例如,為了突出重點,在欄目設(shè)置上可以不追求知識體系的完整性,一個子類可以隸屬于多個母類(類似于主題詞表的“范疇索引”),一個母類可以采用多重標(biāo)準(zhǔn)進行劃分(即多重列表),少數(shù)大類(如“國家地區(qū)”)下可以涵蓋各大類內(nèi)容的體系,并利用超文本把類與類、類與信息記錄之間起來,實現(xiàn)用戶訪問時的多重入口,自由跳轉(zhuǎn)。

按需設(shè)類,突出重點,便于瀏覽

一方面,因為一般用戶對事物的認(rèn)識要比對學(xué)科的認(rèn)識更為直觀和清晰,按主題和事物劃分可以降低用戶瀏覽時的認(rèn)識負(fù)擔(dān)。因此,站欄目應(yīng)根據(jù)實際需要而設(shè),并且盡可能地刪除與主題無關(guān)的欄目。另一方面,類目的規(guī)范程

度主要地由用戶群的結(jié)構(gòu)而定。

此外,為了便于用戶以最快捷的方式訪問到站提供的熱門欄目和信息,在欄目的設(shè)置上,可以不拘泥與原有分類體系的邏輯層次劃分,而是根據(jù)信息量和訪問頻率提升某些重要欄目的級位,將站最有價值的內(nèi)容放到突出位置。例如,中文雅虎和搜狐在欄目設(shè)置上,“計算機和互聯(lián)”這一熱門欄目就列為一級欄目,與其屬概念“科學(xué)與技術(shù)”并列。

控制類目級別,減少欄目層次

站的欄目設(shè)置與劃分的目的是讓用戶以最快的方式找到想要訪問的頁面信息,如果嚴(yán)格按照傳統(tǒng)分類體系設(shè)置欄目,很可能會將用戶感興趣的頁面埋藏在5、6層頁面之下,顯然這會讓用戶失去繼續(xù)瀏覽的興趣。因此,在欄目設(shè)置和劃分時,應(yīng)將大多數(shù)欄目的層次控制在3、4層為宜,專業(yè)性強的欄目可以適當(dāng)延伸。

為了控制欄目層次,欄目設(shè)置可以不局限于單一標(biāo)準(zhǔn)的邏輯劃分,而是使用若干標(biāo)準(zhǔn)同時對某一上級欄目進行劃分,建立若干從屬于上級欄目的平行的子欄目。這樣,具有不同知識結(jié)構(gòu)、帶著不同檢索目的、使用不同分類標(biāo)準(zhǔn)的用戶都可以在同一級欄目上找到所需的信息,從而滿足絡(luò)用戶多途徑、多角度的檢索特性。

絡(luò)信息分類法與主題詞表的結(jié)合

絡(luò)信息分類法的著眼點絕非只是分類法本身,而且要順應(yīng)分類主題一體化的發(fā)展。因此,必須考慮到絡(luò)信息分類法與主題詞表的結(jié)合。這個主題詞表可以是編制絡(luò)信息分類法同時編制的,或者現(xiàn)行絡(luò)信息主題詞表中較好的。主題詞表中的詞應(yīng)能被分類體系完全囊括,而且應(yīng)具有嚴(yán)格的對應(yīng)關(guān)系。

6結(jié)語

隨著互聯(lián)的飛速發(fā)展以及用戶信息需求的變化,迫切要求采用高質(zhì)量的絡(luò)信息組織方法??傮w上說,目前絡(luò)信息組織的實踐和研究工作出現(xiàn)了以下發(fā)展趨勢:

多媒體信息檢索

基于文本方式的多媒體信息檢索不僅缺乏直觀性,而且還有一定的主觀性,因此無法充分揭示多媒體信息的內(nèi)涵,從而影響檢索效果?;趦?nèi)容特征的多媒體信息檢索針對圖像畫面、聲音和影像內(nèi)容特征,這正是多媒體信息檢索的發(fā)展方向。

現(xiàn)在有一小部分搜索引擎支持多媒體信息檢索,比如,Alta

Vista支持MP3/音頻、視頻等檢索服務(wù),lycos提供搜索圖像和聲音文件的功能。但是,這種多媒體信息檢索往往停留在多媒體的形式檢索上,即只給出多媒體信息的形式信息(如多媒體文件的擴展名和多媒體標(biāo)題和文字解說等),并以此作為檢索點。

智能搜索引擎

伴隨著計算機智能技術(shù)的發(fā)展,智能信息檢索(intelligent

information

retrieval)作為人工智能的一個獨立分支得到了迅速發(fā)展。智能檢索模型主要分為兩大類:一類是基于機器學(xué)習(xí)的大范圍信息檢索系統(tǒng);一類是智能化的用戶個性化信息檢索系統(tǒng)。前者以提高信息檢索系統(tǒng)質(zhì)量為主要目的,以滿足用戶從關(guān)鍵詞檢索到知識檢索的需要,后者則以推動信息服務(wù)個性化為主要目的。

搜索引擎進一步細(xì)分

目前出現(xiàn)了元搜索引擎、搜索引擎之搜索引擎等新的搜索引擎類型。

元搜索引擎不同于獨立的搜索引擎,它沒有自己的數(shù)據(jù)庫,而是將用戶的檢索請求進行轉(zhuǎn)換處理后,提交給預(yù)先選定的獨立搜索引擎,并將所有查詢結(jié)果以統(tǒng)一的格式呈現(xiàn)出來,彌補了獨立搜索引擎搜索不全的缺點,提高了檢索的全面性,如metacrawler等。目前,中文元搜索引擎數(shù)目很少。

搜索引擎之搜索引擎不同于元搜索引擎,它的目的不是檢取最終信息,而是檢索可利用的工具信息,相當(dāng)于傳統(tǒng)文獻信息組織中的目錄之目錄。它對搜索引擎站點進行分類管理,并對所收錄的各家搜索引擎站點的覆蓋范圍、更新頻率、檢索效率等進行評價,給用戶選擇利用合適的搜索引擎提供有價值的參考?!癝ina”的“搜索首頁>引擎世界”就是一個搜索引擎之搜索引擎。此外,中文站.:s://也提供這種功能。

搜索引擎的發(fā)展將對人們信息利用能力產(chǎn)生不可估量的影響,圖書情報界的同仁更會以自己的成果造福于信息用戶。

【參考文獻】

王知津.現(xiàn)代索引文摘法[M].北京圖

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論