信息組織與分類編目.ppt_第1頁
信息組織與分類編目.ppt_第2頁
信息組織與分類編目.ppt_第3頁
信息組織與分類編目.ppt_第4頁
信息組織與分類編目.ppt_第5頁
已閱讀5頁,還剩34頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、、信息組織和分類列表,南京市農(nóng)業(yè)大學(xué)信息管理科劉磊LXX _H) SNS:個(gè)人網(wǎng)絡(luò);問:2297370769,概述,1,互聯(lián)網(wǎng)的發(fā)展趨勢2,網(wǎng)絡(luò)環(huán)境下的信息組織和分類目錄3,信息組織和分類目錄之間的關(guān)系4,信息組織的基本工作,1,互聯(lián)網(wǎng)的發(fā)展趨勢(1)發(fā)展速度(主機(jī)、用戶、網(wǎng)站)2009年2)網(wǎng)絡(luò)用戶數(shù)比較截至2007年底,我國網(wǎng)絡(luò)用戶已達(dá)到2.1億人,居世界第二位(2008年六月世界第一位)。比1997年10月增加了300倍以上,占中國人口總數(shù)的16%。2010年普及率為34.3%,4個(gè)指標(biāo)增長比較分析,3)WWW網(wǎng)站數(shù)比較截至2007年底,我國WWW網(wǎng)站數(shù)為1,

2、500,000個(gè),與1997年10月相比,WWW網(wǎng)站總數(shù)最初為1400個(gè)中的1000倍。2010年達(dá)到了1270多倍。4)國際出口帶寬總?cè)萘勘容^,截至2007年底,我國國際出口帶寬總?cè)萘繛?68,927米,1997年首次調(diào)查結(jié)果為25.4米的14757倍,2010年為43956倍。在牙齒指標(biāo)中,國際出口帶寬增長率最快。問題:為什么出口帶寬增長率高于其他指標(biāo)?4茄子指標(biāo)增長比較分析(繼續(xù)),1)社會(huì)原因用戶信息要求(面向市場)。2)技術(shù)原因IT 4定律(摩爾定律、貝爾定律、公會(huì)定律、馬特卡爾夫定律)。3)經(jīng)濟(jì)原因信息經(jīng)濟(jì)(電子商務(wù)、網(wǎng)絡(luò)經(jīng)濟(jì)、數(shù)字經(jīng)濟(jì))正隨著IT 4法則的推進(jìn)而興起。(2)互聯(lián)網(wǎng)

3、迅猛發(fā)展的原因,2003年六月谷歌搜索網(wǎng)頁30億個(gè),2004年十一月谷歌副總裁比爾科蘭在谷歌數(shù)據(jù)庫中公布了超過80億個(gè)網(wǎng)頁。從2003年開始:中國網(wǎng)頁基本增長了一倍,2003年網(wǎng)頁3億個(gè),2008年161億個(gè),2009年336億個(gè),比2008年增加了一倍以上,比2003年增加了100倍以上。2010年十一月,新興搜索引擎Blekko CEO richiscorenta表示,由于網(wǎng)頁總量突破了1萬億韓元,“垃圾信息也呈現(xiàn)快速增長的趨勢”。他還說:“我們將使用大規(guī)模的手動(dòng)手段整理這些內(nèi)容?!币虼耍麄鳌笆苄湃巍钡膬?nèi)容。(3)網(wǎng)絡(luò)環(huán)境下信息資源的發(fā)展?fàn)顩r1)信息的楊怡龐大、快速增長,2)信息內(nèi)容豐富

4、,網(wǎng)絡(luò)信息資源內(nèi)容豐富,復(fù)蓋范圍廣,復(fù)蓋各學(xué)科各領(lǐng)域,種類多樣,幾乎涵蓋一切。網(wǎng)絡(luò)信息包括統(tǒng)一的監(jiān)管機(jī)構(gòu)和發(fā)布標(biāo)準(zhǔn)、變化、變更、新生、消亡等,隨時(shí)發(fā)生,質(zhì)量參差不齊,重復(fù)嚴(yán)重(我國重復(fù)網(wǎng)頁比例約為25%),難以控制。3)信息質(zhì)量差異增加,網(wǎng)絡(luò)超文本、超媒體、集成提供信息,除文本信息外,還包括圖表、圖形、圖像、聲音、動(dòng)畫、視頻等。提供豐富的學(xué)習(xí)和娛樂功能。4)信息形式多樣,5)信息交流方式多樣,現(xiàn)代社會(huì)信息高度分散的無序性,人們利用信息的高度選擇性和尖銳矛盾,信息組織通過人工和機(jī)器有序地添加信息,形成信息資源,從而形成有效利用(例如,搜索引擎谷歌和百度的發(fā)展,新興搜索引擎Blekko的谷歌挑戰(zhàn))

5、,從這一角度看,信息組織是信息管理的一種挑戰(zhàn),2、在網(wǎng)絡(luò)環(huán)境下,信息組織和分類目錄(1)在網(wǎng)絡(luò)環(huán)境下,信息組織的需要,隨著互聯(lián)網(wǎng)的普及和升級(jí)(web 1.0-web 2.0),數(shù)字文本復(fù)制的便利性和自由發(fā)布的可能性急劇增加。但是,社會(huì)信息的增加并不意味著用戶獲取信息的增加。相反,無序的信息不僅對(duì)信息的使用沒有幫助,而且加劇了信息增長和使用的矛盾。人們生動(dòng)地說牙齒情況是“信息過載,知識(shí)不足”。越來越多的人認(rèn)識(shí)到“原始信息本身不能創(chuàng)造價(jià)值”,有效的組織必須根據(jù)特定的要求集中和揭示才能創(chuàng)造價(jià)值。要有效地開發(fā)和利用信息資源,必須用適當(dāng)?shù)姆椒刂坪吞幚?。信息組織是核心措施之一。(1)網(wǎng)絡(luò)環(huán)境下信息組織的

6、需要(繼續(xù)),(2)信息組織的概念和目的,1)概念:信息組織也稱為信息資源組織,根據(jù)信息檢索需求以文本和不同類型的信息源為目標(biāo)。通過對(duì)內(nèi)容、特性等的分析選擇2)目的:建立信息資源收集系統(tǒng)和搜索工具,使人們開發(fā)和利用信息資源。(3)信息載體(媒體)對(duì)信息組織的意義,信息交流方式(媒體)有皮鞋、印刷方式、數(shù)字方式。以記錄方式(包括印刷型紙和數(shù)字硬盤、光碟)通信,可以克服口語交流的局限性,促進(jìn)信息組織。(4)信息源和文獻(xiàn)的關(guān)系,信息源或信息體通常指所有記錄格式的信息載體,但更注重新媒體格式的強(qiáng)調(diào)。因此,廣義上,文獻(xiàn)、消息來源、信息體是同義詞或同義詞。(5)信息組織過程、信息組織過程包括索引和說明???/p>

7、制語言和規(guī)則稱為信息組織的規(guī)范。這些規(guī)范包括信息源外部說明的規(guī)范(例如文檔目錄規(guī)則和各種元數(shù)據(jù),如MARC)牙齒。還包括內(nèi)容說明的搜索語言(例如,各種文獻(xiàn)分類表和規(guī)則、各種規(guī)范的主題語和規(guī)則等)。信息組織各種形式的圖書館目錄,信息組織各種形式的搜索引擎,1)作業(yè):圖書記錄,網(wǎng)頁快照等原始信息源的記錄。直接組織遠(yuǎn)視信息本身。例如,圖書以一定的方式排列,標(biāo)題排列法、分類排列法、固定排列法(如時(shí)間順序)等。2)類型:根據(jù)搜索工具的對(duì)象和特性劃分類型A文獻(xiàn)目錄。B組織按搜索工具的標(biāo)識(shí)特征(如搜索引擎C索引數(shù)據(jù)庫)劃分類型A外部特征的信息(如作者姓名、標(biāo)題、機(jī)構(gòu)名稱等)B內(nèi)部特性的信息組織(如分類編號(hào)、

8、主題語言)C引文關(guān)系的信息組織(根據(jù)參考關(guān)系(如SCI),日志論文中交叉參考關(guān)系的信息組織。(6)信息組織的工作和類型,原始信息說明:提供外部要素和內(nèi)部要素記錄檢索點(diǎn):包括外部特性的所有者姓名、標(biāo)題、機(jī)構(gòu)名稱等內(nèi)部特征的分類編號(hào)、主題語、原始信息內(nèi)容的富集:內(nèi)容摘要或摘要編寫。(7)信息組織的處理方式,(1)信息組織和分類列表之間的完整和部分,與基礎(chǔ)的關(guān)系擴(kuò)大信息組織包括以打印文獻(xiàn)為主體的文獻(xiàn)列表,分類索引和專題索引,以網(wǎng)絡(luò)信息為主體的網(wǎng)站,搜索引擎,數(shù)據(jù)庫,數(shù)字圖書館等信息組織方法。(2)在網(wǎng)絡(luò)環(huán)境下,分類目錄仍然是信息組織的重要方法。網(wǎng)絡(luò)資源指南(如雅虎)參考了文獻(xiàn)分類的原理,外國圖書館在

9、線公共搜索目錄(OPAC=在線公共訪問目錄)已經(jīng)用于網(wǎng)絡(luò)信息資源搜索。傳統(tǒng)的分類目錄和網(wǎng)絡(luò)信息組織徐璐滲透。,3,信息組織和分類目錄之間的關(guān)系,所謂信息索引,也稱為文檔索引,是指主要分析信息的內(nèi)容屬性,一種搜索語言(例如,分類編號(hào)G203表示信息資源和管理,G202表示信息處理技術(shù))。用激光代替激光、西紅柿代替西紅柿等規(guī)范的主題語來表達(dá)分析的屬性或特征,從而授予信息或文獻(xiàn)搜索標(biāo)志的過程。這種方式的信息組織主要采用兩種茄子基本方法分類和主題法。4,信息組織的基本工作(1)信息索引、索引過程一般由兩部分組成:一,分析專題,了解和確認(rèn)信息的內(nèi)容屬性,然后將這些屬性總結(jié)為主題,用自然語言表達(dá),分析專題

10、概念之間或?qū)n}概念元素之間的結(jié)構(gòu)關(guān)系。二是轉(zhuǎn)換徽標(biāo)。即,通過用專業(yè)搜索語言的徽標(biāo)或詞來表達(dá)總結(jié)信息(文獻(xiàn))內(nèi)容的專題概念或概念元素,構(gòu)成特定格式的搜索徽標(biāo)。例如,對(duì)番茄病蟲害防治的專題索引是番茄病蟲害防治法首先進(jìn)行主題分析,牙齒書主要討論番茄病蟲害和防治方法。例如,用漢語主題詞表進(jìn)行主題索引等內(nèi)容分析后,可以在西紅柿第一方“書”的漢語拼音Xi中直接確認(rèn)西紅柿。結(jié)果西紅柿不是正式的主題詞,因此只能使用其學(xué)名“西紅柿”,(2)用信息索引過程、中國圖書館分類進(jìn)行分類索引,在專題分析后用S436.412(西紅柿病蟲害及預(yù)防)進(jìn)行標(biāo)記。分析過程如下:西紅柿是一種農(nóng)作物,所以在分類表中首先尋找S農(nóng)業(yè)科學(xué)(

11、1急流),第二階段認(rèn)為S農(nóng)業(yè)科學(xué)下有S1農(nóng)業(yè)基礎(chǔ)科學(xué)、S2農(nóng)業(yè)工程、S3農(nóng)學(xué)、S4植物保護(hù)等2急流,應(yīng)該根據(jù)其內(nèi)容分類為S4植物保護(hù)。在下一類中,發(fā)現(xiàn)S436園藝作物病蟲害,(2)信息索引過程,專題規(guī)律是通過專題名稱公開和組織信息或文獻(xiàn)內(nèi)容的方法。分類是通過學(xué)科知識(shí)的分類體系揭示和組織信息或文獻(xiàn)內(nèi)容的方法。兩個(gè)茄子的共同點(diǎn):兩者都需要對(duì)信息文獻(xiàn)進(jìn)行專題分析,以揭示信息(文獻(xiàn))內(nèi)容。通常使用預(yù)先準(zhǔn)備好的專業(yè)語言工具(主題語匯或分類表)。給定的搜索標(biāo)志都是對(duì)信息文獻(xiàn)專題概念的表達(dá)。兩者的區(qū)別:1)表達(dá)專題概念的識(shí)別形式和特征不同。2)標(biāo)識(shí)公開、組織信息、文檔的角度不同。3)分類和主題法的功能、作用

12、是互補(bǔ)的。(3)分類和主題法的比較,信息描述是記錄遠(yuǎn)視文獻(xiàn)外部特征,提供所有者、標(biāo)題等搜索路徑。下圖:(4)信息說明、信息說明是記錄的結(jié)果元數(shù)據(jù)中介、對(duì)原始信息的各種操作以及信息說明(元數(shù)據(jù))的作用如下:標(biāo)識(shí):確定要配置的信息并單獨(dú)說明,以便用戶標(biāo)識(shí)配置的信息對(duì)象。導(dǎo)航:提供有關(guān)信息資源位置的信息,以便用戶訪問和使用。搜索:在描述數(shù)據(jù)中提供搜索點(diǎn),使用戶可以輕松地搜索和利用資源??蛇x:記錄信息資源的特征,使用戶能夠確定信息資源的使用價(jià)值,從而確定資源的使用情況。(5)信息說明的作用,元數(shù)據(jù)是關(guān)于數(shù)據(jù)的數(shù)據(jù)或關(guān)于數(shù)據(jù)的結(jié)構(gòu)化數(shù)據(jù)。元數(shù)據(jù)的意義是逐步發(fā)展的。初始元數(shù)據(jù)主要是網(wǎng)絡(luò)信息的描述數(shù)據(jù),網(wǎng)絡(luò)

13、信息資源的組織(例如,用HTML描述網(wǎng)頁的數(shù)據(jù));此后,它逐漸擴(kuò)展到各種電子格式信息的描述性數(shù)據(jù),如MARC和DC。因?yàn)閭鹘y(tǒng)書目數(shù)據(jù)和數(shù)字信息的說明數(shù)據(jù)本質(zhì)上沒有區(qū)別。因此,現(xiàn)在的元數(shù)據(jù)術(shù)語實(shí)際上可以應(yīng)用于各種類型的信息源的說明記錄。即網(wǎng)絡(luò)快照是元數(shù)據(jù)。電子文本說明數(shù)據(jù)元數(shù)據(jù);目錄數(shù)據(jù)也是元數(shù)據(jù),例如手動(dòng)創(chuàng)建的目錄目錄唱片和機(jī)器讀取目錄唱片MARC。(6)元數(shù)據(jù)(Metadata)、元數(shù)據(jù)(metadata description),(Metadata description)包括多種信息類型、書籍、期刊、磁帶、錄像帶、cd-r通常是從信息源中提取的一些外部或內(nèi)容特性,例如標(biāo)題、版本、發(fā)布數(shù)據(jù)和相關(guān)說明等。實(shí)際上,元數(shù)據(jù)意義與傳統(tǒng)文學(xué)領(lǐng)域中的記錄類

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論