信息組織 第6章 信息排檢法_第1頁
信息組織 第6章 信息排檢法_第2頁
信息組織 第6章 信息排檢法_第3頁
信息組織 第6章 信息排檢法_第4頁
信息組織 第6章 信息排檢法_第5頁
已閱讀5頁,還剩46頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第六章信息排檢法信息組織信息排檢法信息排檢法,全稱為信息編排檢索方法,是指將各種信息有序存儲在信息系統(tǒng)、方便人們檢索所需信息的編排方法。編排的目的是為了檢索,檢索則需要按編排的規(guī)則去進(jìn)行。排與檢是前后連接、密不可分的。因此,信息排檢法從信息組織角度看是“編排法”,而從信息檢索角度看是“檢索法”,所以統(tǒng)稱為信息排檢法。目前比較常用的方法有字序排檢法(包括音序排檢法和形序排檢法)、分類排檢法、主題排檢法、時序排檢法、地序排檢法及其他排檢法。如果說信息著錄和信息標(biāo)引是對信息描述生成信息的特征標(biāo)識,那么信息排檢就是對這些標(biāo)識進(jìn)行排序,組成有序的信息集合,以便于獲取所需要的信息。目錄壹字序法貳類序法叁時序法肆地序法及其他排檢法1字序法1字序法字序法(字序排檢法),又稱為字順排檢法(字順法)或查字法,是按一定的順序排檢單字或復(fù)詞的一種方法,本質(zhì)上是利用事物名稱字順排檢信息的方法?,F(xiàn)代中英文字詞典常用的排檢法就是字序法。字序法建立在信息資源所用文字基礎(chǔ)上,文字有中外文字之分,漢字有字音與字形之別。在聯(lián)合國發(fā)表的《2005年世界主要語種、分布和應(yīng)用力調(diào)查報告》上,漢語被排在第二位,僅次于英語,排在德語、法語、俄語、西班牙語、日語之前。音序檢字法和部首檢字法是漢字檢字法中最受歡迎的兩種檢字法。它們已經(jīng)廣泛地應(yīng)用于現(xiàn)代漢語字詞典等工具書的編纂,成為中國當(dāng)代兩大主流檢字法。外文字序排檢法依據(jù)其語言字母的固定次序排序。1.1漢字音序排檢法1

.漢語拼音字母排檢法漢語拼音排檢法,又稱為漢語拼音檢字法,簡稱拼音法,是一種依照漢字的漢語拼音字母順序來編排詞目的排檢方法。漢語拼音字母排檢法是目前中文信息排序使用最廣泛的一種方法。此法依據(jù)我國1958年2月11日公布的《漢語拼音方案》,采用26個拉丁字母作為漢語拼音,排列次序依照國際慣例,從A到Z。我國現(xiàn)行的一般語文性字典、詞典等工具書大多采用漢語拼音法,如《新華字典》《現(xiàn)代漢語詞典》《漢語主題詞表》和《中國分類主題詞表》(第二卷)等。漢語拼音字母排檢法的主要優(yōu)點如下。方法簡單、易于掌握。作為信息編排方法,任何具有漢語拼音和漢語語言文字基礎(chǔ)的中、外讀者可以很快熟悉和掌握。查找文獻(xiàn)快速、準(zhǔn)確。讀者只需知道讀音,就可以直接找到相關(guān)信息。比較科學(xué),符合國際上工具書按字順編排的習(xí)慣,也適用于計算機(jī)檢索。漢語拼音字母排檢法的主要缺點是要求使用者必須學(xué)會普通話,發(fā)音要求準(zhǔn)確等。1.1漢字音序排檢法2.注音字母排檢法注音字母排檢法又稱注音字母音序法。注音字母音序法中的注音字母是以北京語音為標(biāo)準(zhǔn)的一套字母。它是《漢語拼音方案》公布實施之前,為漢字注音和推廣普通話而設(shè)計的一套音標(biāo)。注音字母是中國歷史上第一套法定的拼音字母,它的公布和使用是漢字注音走向拼音化的開端。1958年《漢語拼音方案》公布前,注音字母是中國40多年中一直通行的漢字注音符號,對于統(tǒng)一漢字讀音、推廣普通話、普及拼音知識起著重要的作用。注音符號在當(dāng)時的人文背景中采用的是傳統(tǒng)的民族形式的字母,這從文字發(fā)展的角度看是不明智的。它的缺點是在標(biāo)注漢字時,與漢字的區(qū)別不大,沒有采用音素拼寫法,符號本身也沒有徹底音素化,其中有好幾個韻母可以進(jìn)一步分解為更小的語音單位,字母拼寫與實際讀音仍未切合,沒有采用國際通行的拉丁字母方便。1.1漢字音序排檢法3.韻部排檢法韻部排檢法,也稱為“聲韻法”,是我國古代按音韻排列漢字的一種方法。漢字字音都是單音節(jié),每個音節(jié)都由聲、韻、調(diào)組成。把韻母相同的字集中排列在一起就構(gòu)成一個韻部。按韻部編排的字典稱為“韻書”。我國在不同的歷史時期有不同的韻部。中國古代影響較大的韻部系統(tǒng)有《廣韻》和《詩韻》。韻部排檢法先按聲分部,然后在每部之下列若干韻。古代文人作詩講究“平”“仄”兩音。其實“平”是指平聲,“仄”指古漢語中的上、去、入三聲。按韻部排列的工具書主要用于查檢古代的字書、韻書、類書等。要查找古代資料,必須會用這種檢索方法。用此法編的工具書有《永樂大典》《佩文韻府》《辭通》《經(jīng)籍纂詁》《九史同姓名略》(按條目首字分韻編排)等。1.1漢字音序排檢法4.威妥瑪式拼音排檢法韻部排檢法,也稱為“聲韻法”,是我國古代按音韻排列漢字的一種方法。漢字字音都是單音節(jié),每個音節(jié)都由聲、韻、調(diào)組成。把韻母相同的字集中排列在一起就構(gòu)成一個韻部。按韻部編排的字典稱為“韻書”。我國在不同的歷史時期有不同的韻部。中國古代影響較大的韻部系統(tǒng)有《廣韻》和《詩韻》。韻部排檢法先按聲分部,然后在每部之下列若干韻。古代文人作詩講究“平”“仄”兩音。其實“平”是指平聲,“仄”指古漢語中的上、去、入三聲。按韻部排列的工具書主要用于查檢古代的字書、韻書、類書等。要查找古代資料,必須會用這種檢索方法。用此法編的工具書有《永樂大典》《佩文韻府》《辭通》《經(jīng)籍纂詁》《九史同姓名略》(按條目首字分韻編排)等。1.1漢字音序排檢法5.聲部排檢法聲部排檢法是將漢字按古聲母分類排列漢字的方法?,F(xiàn)在沿用的是唐宋時古人歸納出的36個字母:見、溪、群、疑、端、透、定、泥、知、徹、澄、娘、幫、謗、并、明、非、敷、奉、微、精、清、從、心、邪、照、穿、床、審、禪、影、曉、匣、喻、來、日。按古聲母法編排的詞典性著作有清代王引之編著的《經(jīng)傳釋詞》等。1.2漢字形序排檢法漢字的形體結(jié)構(gòu)具有某些共同的特點,加以歸納分類,尋求規(guī)律,依次排列,即成為檢索漢字的一種主要方法。查字時,從漢字的字形去檢索其讀音和字義,符合人們從形出發(fā)求音求義的查字要求。形序排檢法就是根據(jù)漢字的形體結(jié)構(gòu)特征及書寫方式,依次編排和查檢漢字的方法。常用的形序法有部首排檢法、筆畫筆形法和四角號碼法等。形序排檢法要求對字的部首查找準(zhǔn)確,對字的筆形、寫法掌握準(zhǔn)確。1.2漢字形序排檢法1.部首排檢法部首排檢法又稱部首查字法,是根據(jù)漢字部首偏旁的結(jié)構(gòu)特點排檢漢字的方法,簡稱部首法。它是我國工具書的傳統(tǒng)排檢法,是根據(jù)漢字的形體結(jié)構(gòu)特點,利用其偏旁(漢字的各個組成部分)的同一性來編排條目的方法。漢字的形體結(jié)構(gòu),除少數(shù)屬獨體字外,大多是合體字,即由形旁(也稱義符)和聲旁(也稱聲符)組成的形聲字,彼此之間具有一部分相同的形體,把這些形體相同的部分歸為一類,稱為偏旁或部首。在獨體字中,有的本身就是部首。部首按筆畫數(shù)多少排序,筆畫數(shù)相同的部首依起筆筆形排序。同屬一個部首的字,先按筆畫數(shù)(一般不包括部首的筆畫數(shù))排序,筆畫數(shù)相同者,再依起筆筆形排序。把部首按順序加以排列檢字就是部首排檢法,它是我國工具書中最普通的一種排檢方法。從東漢許慎的《說文解字》到《康熙字典》《中華大字典》《辭?!返榷疾捎昧诉@種方法。1.2漢字形序排檢法2.筆畫筆形法筆畫是漢字的基本構(gòu)件,筆畫構(gòu)成字形,漢字由筆畫構(gòu)成。筆畫筆形法是按照筆畫數(shù)目和起筆(首筆)筆形的先后次序排檢漢字的方法。筆畫有三種應(yīng)用形式。第一種是先按筆畫多少來歸并漢字,筆畫少的在前,多的在后;筆畫數(shù)相同者,再依起筆筆形排序。筆畫和筆形均相同的字,則依其字形結(jié)構(gòu)排序。第二種形式是先按筆畫多少來歸并漢字,筆畫數(shù)相同的,再依部首歸類排列先后順序。第三種形式是先按筆形分類,統(tǒng)一筆形后再按筆畫順序排列,這樣的排檢方法也叫筆順法。按筆畫多少排序的優(yōu)點是排檢原理簡單,易學(xué)易檢,使用方便,只要識字就會使用。掌握筆畫法的前提是要能辨清一個字的筆畫。1.2漢字形序排檢法3.號碼法號碼法是根據(jù)漢字的筆形結(jié)構(gòu)進(jìn)行編碼排列,然后根據(jù)號碼順序檢字的方法。號碼法是形序排檢法的一種變形,它把漢字分解為若干種筆形,每種筆形用數(shù)字作為代碼,然后把每個字的筆形代碼連接為號碼,再按號碼大小排列的一種檢字方法。這種方法的優(yōu)點是只要記住筆形代碼、號碼的位置次序,則數(shù)字簡單明了,檢索迅速,使用便利。其缺點是學(xué)習(xí)和掌握比較困難,只有經(jīng)過反復(fù)練習(xí),才能運用自如。常用的工具書中主要有四角號碼法、中國字庋擷法;在計算機(jī)信息存儲系統(tǒng)中有五筆字型法等。1.2漢字形序排檢法3.號碼法(1)四角號碼法四角號碼排檢法(四角號碼法),又稱四角號碼查字法,由原上海商務(wù)印書館王云五先生(1888—1979)創(chuàng)制。四角號碼法是根據(jù)漢字方塊形體的特點,用數(shù)字來描述漢字四角的筆形,使每個漢字擁有一組數(shù)碼,再按號碼的順序編排漢字先后次序的排檢方法。它將漢字四個角上的筆形歸為10類,并分別用0~9共10個數(shù)字代表。筆形名稱:頭橫豎點叉插方角八小。對應(yīng)號碼:0123456789。1.2漢字形序排檢法3.號碼法(2)中國字庋擷法中國字庋擷法中的“庋擷”(guǐxié)二字的意思是放入、取出,是根據(jù)漢字的形體結(jié)構(gòu),把字形和筆形變成數(shù)碼的一種排檢法,1931年由哈佛–燕京學(xué)社引得編纂處負(fù)責(zé)人洪業(yè)所創(chuàng)。具體說來,中國字庋擷法是:將所有漢字分為“中、國、字、庋、擷”等五種字體;“庋”之義為“放入”,“擷”之義為“取出”,全稱即為“中國字編入檢出”之意,與檢字法名實相符,且有助于學(xué)習(xí)使用者記憶。(3)五筆字型法五筆字型法是供計算機(jī)信息處理用的漢字編碼法,由查字法發(fā)展而來,是王永民于1983年8月發(fā)明的一種漢字輸入法。之所以稱為五筆,是將漢字筆畫分為橫、豎、撇、捺、折五種。根據(jù)漢字的字形結(jié)構(gòu),五筆字型法選定了130個部首作為字根,加以分類、編碼,并將其排在25個英文鍵位上。其他號碼法還有起筆筆形號碼法、六位筆形號碼法、三角號碼法、五碼查字法等,這些號碼法尚未推廣,只有少數(shù)幾種工具書使用。1.3外文字順法世界上有2000多種語言,多數(shù)有文字,適用范圍超過5000萬人的語言有13種,其中聯(lián)合國正式的工作語言有中、英、俄、西班牙、法、阿拉伯語6種語言。不同的文字有不同的字順排檢法。例如,西文字順排檢法以拉丁字母順序排檢西方文字。字母順序排檢法最常用。外語詞典里的單詞都是按字母表字母順序排列的,這在全世界都是統(tǒng)一的。各種語言的字母數(shù)量不盡相同,英語詞典和法語詞典按26個字母排序,西班牙語詞典按28個字母排序,俄語詞典按33個字母排序,阿拉伯語詞典按28個字母排序,韓國語詞典按40個字母排序,吸收了許多漢字的日語詞典按《五十音圖》排序。字母順序排檢法就是機(jī)械地按字母順序排列,使用者不必預(yù)先掌握或記住任何既定的組織體系或排列方法,直接利用已知的或設(shè)想適用的檢索詞即可查到所需信息。1.3外文字順法字母順序排檢法有兩種不同的應(yīng)用形式。第一種是逐詞排列法,即wordbyword。以參與排檢的各個獨立的詞為排檢單位,逐詞相比,凡第一個詞相同時則比第二個詞,第二個詞相同時則再比第三個,以此類推。第二種是逐字母排列法,即letterbyletter。所有參與排列的項目,無論是單詞、詞組或句子,不管其字?jǐn)?shù)的多少或長短,均視為一個排列單位,按字母逐個相比。如表6-1所示。1.3外文字順法逐字母排列法將標(biāo)目用詞連起來作為一個單元逐個字母進(jìn)行排比次序,其優(yōu)點是規(guī)則簡單,排列方便,但不便于集中相同的單詞,破壞字面成族,因而很少被采用。逐詞排列法以詞為單位,單詞內(nèi)再按字母的先后次序編排,這種排列法有字面成族的效果,能集中所有相同的詞,比較符合人們的檢索習(xí)慣,比逐字母排列法科學(xué)。因而在實際應(yīng)用中,“wordbyword”排檢法應(yīng)用較廣,國內(nèi)外大多數(shù)圖書館的字順目錄幾乎都采用此種排檢法。俄文字順排檢法主要按照33個俄文字母的順序排列。也有兩種排檢方式,即逐字母排檢和逐詞排檢。日文字順排檢法有3種情況:①按照五十音圖的順序采用平假名排檢;②按照五十音圖的順序采用片假名排檢;③借用漢字排檢法按照部首筆畫等方式排檢。2類序法2.1學(xué)科體系分類排檢法由于人們一般都是在某個專業(yè)領(lǐng)域范圍內(nèi)從事科研、生產(chǎn)、教學(xué)、管理等活動的,習(xí)慣于從學(xué)科、專業(yè)角度出發(fā)來檢索獲取知識和信息。學(xué)科體系分類排檢法是將詞目、條目按其知識內(nèi)容的學(xué)科屬性,根據(jù)事先確定好的學(xué)科分類體系分門別類地加以歸并集中,按一定邏輯順序進(jìn)行排檢的方法。學(xué)科體系排檢法不僅是信息管理領(lǐng)域處理各類信息資源的基本手段和方式,也是檢索者按學(xué)科專業(yè)瀏覽和使用參考工具書的基本方法,很多百科全書、手冊、年鑒等多采用此法編排條目。用此種排檢法排列信息時,首先采用依照人為預(yù)先編制的分類法,采用其規(guī)定的學(xué)科專業(yè)概念及對應(yīng)的系列分類號作信息內(nèi)容標(biāo)識,通過分類號的排序來排檢信息。學(xué)科體系分類排檢法通常選一種分類表(法)作為依據(jù),也有不采用通行的分類體系而采用自編分類體系的,但都是按照學(xué)科體系歸類的一種分類排檢法。2.1學(xué)科體系分類排檢法學(xué)科體系分類排檢法中的分類號(排檢標(biāo)識)是如何排序的呢?我們以《中圖法》(第五版)為例,簡單探討圖書文獻(xiàn)被分類標(biāo)引的分類號即排檢標(biāo)識的排序問題。例如,《漢字的世界:中國文化的原點》標(biāo)引為H12-49;《中國歷代家訓(xùn)文獻(xiàn)敘錄》標(biāo)引為B823.1;《民間藝術(shù)考察與設(shè)計》標(biāo)引為J06;《食品安全社會共治》標(biāo)引為TS201.6;《數(shù)字影視短片創(chuàng)作》標(biāo)引為J93-39;《健康是生產(chǎn)力》標(biāo)引為A811.694;《接近于無限透明》標(biāo)引為I247.57;《測量不確定度評定方法與實踐》標(biāo)引為TB9;《面向電子商務(wù)的多屬性智能談判系統(tǒng)研究》標(biāo)引為F713.361.1;《創(chuàng)新生態(tài)視角下的科學(xué)普及》標(biāo)引為N4;《中國典型區(qū)域城市化過程及其生態(tài)環(huán)境效應(yīng)》標(biāo)引為X321.2;《中華民族精神家園的生命精神研究》標(biāo)引為C955.2;《學(xué)術(shù)規(guī)范通論》標(biāo)引為G31;《網(wǎng)絡(luò)文學(xué)批評理論與實踐》標(biāo)引為I207.999-53;《中國創(chuàng)意產(chǎn)業(yè)集群與區(qū)域經(jīng)濟(jì)發(fā)展研究》標(biāo)引為G124。對這些標(biāo)引文獻(xiàn)的分類號排序,換言之,這些分類標(biāo)識在信息檢索系統(tǒng)中的邏輯順序應(yīng)是:A811.694;B823.1;C955.2;F713.361.1;G124;G31;H12-49;I207.999-53;I247.57;J06;J93-39;N4;TB9;TS201.6;X321.2。2.1學(xué)科體系分類排檢法學(xué)科體系分類排檢法的突出不足在于:在檢索者通過采用分類法組織的信息系統(tǒng)檢索細(xì)小而專深的主題又不知分類號的情況下,檢索時要逐層瀏覽,檢索效率低下。檢索者須熟悉該系統(tǒng)所運用的分類法,包括其所規(guī)定的類目體系涵蓋的主題概念及概念劃分標(biāo)準(zhǔn)、類目排列規(guī)則、編碼規(guī)則和標(biāo)識排列細(xì)則等很多技術(shù)性問題,這對于普通的檢索者來說是困難的。因此,鑒于學(xué)科體系分類排檢法是按人為規(guī)定的一套號碼進(jìn)行排檢的,其直觀性較差,所以一般不會在檢索系統(tǒng)中獨立使用,都會配備其他檢索途徑的字順目錄或索引。2.2事物性質(zhì)分類排檢法事物性質(zhì)分類排檢法是按同一類事物范疇的性質(zhì)進(jìn)行分類排檢的方法,即把信息知識內(nèi)容按事物屬性分類,把相同范疇的事物匯聚在一起。這種方法中的各事物概念之間沒有嚴(yán)格的系統(tǒng)性,一般按實際存在的事物性質(zhì)劃分類別。古代的類書、政書和現(xiàn)代的年鑒、手冊及某些辭書等多采用此法編排。這種方法是我國第一部詞典《爾雅》開創(chuàng)的?!稜栄拧贩譃?9篇,后面16篇是分類詞匯。例如,“釋親”是把有關(guān)家族關(guān)系的詞匯匯集在一起加以解釋。后來一些解釋詞語的書也沿用這種排列方法。由于所收集的信息所處領(lǐng)域不同、收集范圍的不同、功用不同及古今分類標(biāo)準(zhǔn)的不一致,因此資料的歸類相差較大,使用按分類法編排的工具時,應(yīng)先了解所用分類體系,以確定所查資料的具體類目,并注意相關(guān)類的查閱。2.3網(wǎng)絡(luò)信息分類排檢法大多數(shù)網(wǎng)站、搜索引擎參照文獻(xiàn)分類法的形式或類目體系,按事物性質(zhì)設(shè)計分類導(dǎo)航體系,建立分類目錄。例如,雅虎的分類目錄按字母順序,將所有普通信息分成40多個大類。根據(jù)用戶訪問頻度,通常在主頁上方只顯示幾個常用類目,其他類目以“更多”(more)加以鏈接?;ヂ?lián)網(wǎng)上的更多站點信息分類組織是以事物為中心列類。其分類排檢的主要特點有以下3點。①直接以語詞組織信息,未采用傳統(tǒng)分類法的標(biāo)記符號表達(dá)信息主題,直接以語詞表達(dá)類目體系,采用鏈接技術(shù)鏈接網(wǎng)絡(luò)文獻(xiàn),比使用分類標(biāo)記更加方便直觀、易于理解。②排列方式簡便。對同位類的排列,主要有三種方式。字順方式,即同一上位類區(qū)分出來的類目按字順方式排序;每個類目下分出的子目再按下級類目的字順排列,形成一個層層展開的字順分類系統(tǒng)。字順方式雖然未能揭示同位類之間的內(nèi)容聯(lián)系,但是方便用戶查找特定類目。以檢索頻率確定同位類的排列次序,在同位類中首先列舉高頻類,突出熱門主題,方便多數(shù)用戶使用。按照信息資源產(chǎn)生或入庫時間排列。③類目體系不穩(wěn)定,動態(tài)性強(qiáng)。由于網(wǎng)絡(luò)信息的動態(tài)性,使得網(wǎng)絡(luò)分類體系在通過鏈接與網(wǎng)絡(luò)信息建立聯(lián)系時,根據(jù)網(wǎng)絡(luò)資源的發(fā)展變化會及時增設(shè)新類或重復(fù)反映相關(guān)類目。2.4主題詞排檢法主題詞排檢法是以表征事物名稱或概念的詞語字順為依據(jù)對信息進(jìn)行編排、查檢的方法。主題詞排檢法是按表達(dá)信息內(nèi)容的主題詞來排檢信息,其主題詞是指對信息資源進(jìn)行主題標(biāo)引后的規(guī)范化的自然語詞。作為標(biāo)識符號的“規(guī)范化自然語詞”——主題詞,是一種概括了信息資源的中心內(nèi)容,又用來標(biāo)引和檢索信息資源的標(biāo)準(zhǔn)詞匯。主題詞排檢法一般不受學(xué)科領(lǐng)域?qū)訉觿澐指拍畹南拗?,便于將不同學(xué)科專業(yè)、不同研究領(lǐng)域的相同主題信息集中一處,提供按主題詞字順檢索特定主題信息的途徑。主題詞排檢法專指度高,檢索目標(biāo)直觀。主題詞排檢法在國外是比較常用的方法,幾乎每種檢索工具都有主題詞排檢途徑。主題語言在網(wǎng)絡(luò)信息組織中的應(yīng)用目前主要表現(xiàn)為關(guān)鍵詞語言在網(wǎng)絡(luò)搜索引擎中的廣泛應(yīng)用。國外大量標(biāo)題詞表和敘詞表在圖書館網(wǎng)站的書目信息檢索系統(tǒng)、網(wǎng)絡(luò)聯(lián)機(jī)數(shù)據(jù)庫檢索系統(tǒng)得到采用。2.5網(wǎng)絡(luò)信息關(guān)鍵詞排檢法在互聯(lián)網(wǎng)上,任何人都可以不受限制地自由出版、發(fā)布自己的網(wǎng)頁,分布式存儲成為網(wǎng)絡(luò)環(huán)境中信息資源存在的主要形式,它區(qū)別于傳統(tǒng)信息資源集中存儲,又由于其信息海量和動態(tài)性強(qiáng),難以有效控制。目前,對網(wǎng)絡(luò)信息資源的組織管理有兩種:

①依賴人工編制的主題目錄,圖書館和信息專業(yè)人員通過對互聯(lián)網(wǎng)的信息進(jìn)行篩選、組織和評論,編制超文本的主題目錄,這些目錄雖然質(zhì)量很高,但編制速度無法適應(yīng)互聯(lián)網(wǎng)信息的增長速度;②依賴自動技術(shù),計算機(jī)專業(yè)人員設(shè)計開發(fā)檢索軟件,對網(wǎng)頁自動搜集、加工和標(biāo)引。這種方式可向用戶提供關(guān)鍵詞、詞組或自然語言的檢索。因此,在網(wǎng)絡(luò)與計算機(jī)時代,主題語言的優(yōu)勢得到了放大,表現(xiàn)出強(qiáng)大的生命力。其中關(guān)鍵詞法在網(wǎng)絡(luò)信息組織與檢索中應(yīng)用最為廣泛。眾所周知,關(guān)鍵詞語言不是一種嚴(yán)格意義上的標(biāo)引語言,但由于它在標(biāo)引和檢索中所發(fā)揮的類似于主題語言的作用,因而被視為一種準(zhǔn)主題語言。在網(wǎng)絡(luò)中,幾乎每個搜索引擎都具有關(guān)鍵詞檢索功能,這意味著搜索引擎的索引數(shù)據(jù)都采用了關(guān)鍵詞法進(jìn)行信息組織。2.5網(wǎng)絡(luò)信息關(guān)鍵詞排檢法搜索引擎對信息進(jìn)行排序,目前主要運用PageRankTM技術(shù)(網(wǎng)頁級別)、超文本匹配分析技術(shù)、內(nèi)容相關(guān)度評價技術(shù)等?;陉P(guān)鍵詞的搜索引擎在決定網(wǎng)頁的相關(guān)性排序時,一般遵循以下三大定律。(1)地點和頻率法地點和頻率法最主要的算法就是看網(wǎng)頁關(guān)鍵詞出現(xiàn)的地點和頻率。搜索引擎先檢查標(biāo)題中含有關(guān)鍵字的網(wǎng)頁并認(rèn)為它比其他網(wǎng)頁的相關(guān)性更強(qiáng)。出現(xiàn)頻率是搜索引擎決定相關(guān)性的另一個因素。搜索引擎會分析關(guān)鍵字在網(wǎng)頁中出現(xiàn)的頻率并與其他網(wǎng)頁相比,關(guān)鍵字出現(xiàn)頻率較高的網(wǎng)頁被認(rèn)為相關(guān)性更好。(2)人氣質(zhì)量定律人氣質(zhì)量定律是搜索引擎的第二定律,它是受科學(xué)引文索引機(jī)制啟發(fā)而提出的??茖W(xué)引文索引機(jī)制認(rèn)為被引用次數(shù)多的論文就是權(quán)威論文、好論文,那么在網(wǎng)上誰的網(wǎng)頁被鏈接次數(shù)多,就認(rèn)為該網(wǎng)頁的質(zhì)量高、人氣旺。再結(jié)合相應(yīng)的鏈接文字分析,就可以對檢索結(jié)果排序了。Google、百度都采用了該定律。(3)自信心定律人氣質(zhì)量定律解決的僅是技術(shù)層面的問題,然而搜索引擎融合了技術(shù)、文化和市場等各層面的因素。解決搜索引擎公司的生存和發(fā)展問題需要搜索引擎的第三定律——自信心定律。即向那些網(wǎng)站的擁有者們拍賣他們網(wǎng)站在檢索結(jié)果中的排名,誰付的錢多,誰的網(wǎng)站就排在前面,且付費是根據(jù)網(wǎng)民點擊該網(wǎng)站的情況來計算的,僅在檢索結(jié)果中出現(xiàn)并不需要付費。3時序法3時序法時序排檢法,簡稱時序法,又稱為年代排檢法、編年排檢法、紀(jì)年排檢法。時序法是按照文獻(xiàn)信息的寫作、發(fā)表和出版年代或事物發(fā)生、發(fā)展的時間順序或人物生卒年月日、生平經(jīng)歷的先后次序編排查檢信息的方法。時序排檢法按時間的順序組合文獻(xiàn)信息素材,即以信息的形成時間為排檢標(biāo)識,按時間順序組織信息。大事記、傳記資料、生平資料等多以時間為線索組織信息。個人生卒年表、年譜及其著述目錄,或采用順時序法或采用逆時序法進(jìn)行編排。時序法便于理清事物發(fā)展的脈絡(luò),從中可查考某些帶有規(guī)律性的知識記錄。此外,時序排檢法多用來作為社會科學(xué)文獻(xiàn)檢索語言的輔助方法,常用于輔助分類表,起進(jìn)一步細(xì)分的作用,如歷史類按時序劃分為古代史、近代史、現(xiàn)代史等。3.1歷法常識世界各國各民族在不同的歷史時期記載時間的方法各不相同,各種文獻(xiàn)中時間的記載又都以當(dāng)時當(dāng)?shù)厮玫臍v法為依據(jù),因而我們在閱讀和研究古今中外的文獻(xiàn)時,必須注意時間的查檢與換算。世界各國的歷法主要有三種:陽歷、陰歷,陰陽歷。陽歷,又叫太陽歷,即現(xiàn)行歷法,它曾經(jīng)由羅馬教皇八世格列高利于公元1582年修訂,所以也稱為“格列歷”。根據(jù)天文歷法,陽歷是以回歸年為基礎(chǔ)的。地球繞太陽公轉(zhuǎn)一周是365天5小時48分46秒(稱回歸年),即365.2422天,因此規(guī)定一年為365天,每隔三年加一個閏年(閏年2月29天)。陰歷,又稱為太陰歷,是以月亮的圓缺、晦明的變化為基礎(chǔ)來制定的?,F(xiàn)在阿拉伯國家使用的回歷就是陰歷的一種。陰歷規(guī)定1年為12個月,單月為大月,每月30天;雙月為小月,每月29天,交替相間,以使歷月平均長度接近于朔望月。3.1歷法常識陽歷完全依據(jù)地球的繞日公轉(zhuǎn),陰歷的歷法完全根據(jù)月亮的運動,陰陽歷則是兩者并用。它同時考慮太陽和月亮的運動,把回歸年和塑望月并列為制歷的基本周期。由于陽歷一個回歸年是365.2422天,陰歷的一年是354.3671天,這兩種歷法年每年相差10余天,因此每19年置7個閏年。凡閏年定為13個月。這種歷法始于我國夏代,故稱為“夏歷”,也稱為“中歷”,俗稱“陰歷”或“農(nóng)歷”。陰陽歷的歷月長度和回歷一樣,有大小月之分:大月30天,小月29天。但農(nóng)歷歷月的安排卻不同于回歷,回歷中大小月機(jī)械地相間排列,而農(nóng)歷大小月要經(jīng)過推算后決定,比回歷更加精密。農(nóng)歷規(guī)定月初必合朔,月朔之日定為初一。由于兩個朔望月的長度并不正好為59天,因而一年中的大、小月數(shù)也不一定相等,有時可能連續(xù)出現(xiàn)兩個大月或小月,以使歷月的平均長度盡可能與朔望月相近,其剩余的差數(shù)則依靠閏月來調(diào)節(jié)。3.2中國古代的時序法王公在位紀(jì)年法是我國最早的紀(jì)年法。這種紀(jì)年法按照一個國王或諸侯在位的年數(shù)紀(jì)年,依次稱為元年、一年、二年、三年……直到離位時為止。殷商和西周時代以此紀(jì)年,如周平王四十九年、晉惠公元年。1.王公在位紀(jì)年法年號是帝王在位時用來紀(jì)年的名號。這種紀(jì)年法一般認(rèn)為始于漢武帝建元(公元前140年)。漢武帝即位那年稱為建元元年,其中“建元”就是年號。自此以后,歷代皇帝都使用年號紀(jì)年。中間改換年號叫改元。明、清時代一個皇帝常常只用一個年號,所以人們用年號來稱呼皇帝,如“崇禎皇帝”“康熙皇帝”等。農(nóng)民起義政權(quán)也使用年號紀(jì)年。這種紀(jì)年法一直用到清朝末年。史書記載中,采用年號紀(jì)年的同時還采用廟號、謚號、尊號等紀(jì)年。2.帝王年號紀(jì)年法3.2中國古代的時序法天干和地支合稱為干支。天干是甲、乙、丙、丁、戊、己、庚、辛、壬、癸的總稱,是我國古代表示次序的符號,也叫十干;地支是子、丑、寅、卯、辰、巳、午、未、申、酉、戌、亥的總稱,也是古人表示次序的符號,也叫十二支。十干和十二支循環(huán)相配,互相錯綜組合紀(jì)年,可組成六十對干支,因而稱作“六十干支”,因是錯綜組合,故名“六十花甲子”(通常也用來以指代六十歲,即花甲之年),如表6-2所示。這個表通常稱為“甲子表”。如甲子為第一年,乙丑為第二年,丙寅為第三年……六十年為一周。一周完了,再由甲子年起,周而復(fù)始,循環(huán)下去。我們在日歷上看到的己巳年、庚午年,就是按干支紀(jì)年這種方法排列下來的。3.干支紀(jì)年法3.2中國古代的時序法歲星紀(jì)年法和太歲紀(jì)年法是戰(zhàn)國時期的以天象為基礎(chǔ)的紀(jì)年法。歲星就是木星,在天體中運行一周約12年。用木星的這種運行規(guī)律來紀(jì)年就是歲星紀(jì)年。天文學(xué)家把木星的運行軌道分為12等份,叫12次,并且按順序起12個名字:星紀(jì)、玄枵、娵訾、降婁、大梁、實沈、鶉首、鶉火、鶉尾、壽星、大火、析木。木星每年行經(jīng)一次,稱為一年。假如某年歲星運行到玄枵范圍,這一年就記為“歲在玄枵”,第二年則記為“歲在娵訾”,其余以此類推,12年周而復(fù)始。4.歲星紀(jì)年法和太歲紀(jì)年法3.2中國古代的時序法十二生肖也被稱為十二年獸。在中國的歷法上有十二只年獸依次輪流當(dāng)值,所以我們的中國年就有以鼠、牛、虎、兔、龍、蛇、馬、羊、猴、雞、狗和豬應(yīng)用在歷法上。即常說的:子鼠、丑牛、寅虎、卯兔、辰龍、巳蛇、午馬、未羊、申猴、酉雞、戌狗、亥豬。生肖紀(jì)年法就是用12種動物名稱(叫十二生肖或十二屬相)與12地支相配來紀(jì)年的一種方法。12年一循環(huán),如表6-3所示。這種紀(jì)年法在東漢王充的《論衡》、許慎的《說文解字》中就有記載。5.生肖紀(jì)年法3.2中國古代的時序法我國古代紀(jì)月法主要有三種。其一是數(shù)序紀(jì)月法,是我國最早的紀(jì)月法,即1~12月的月數(shù),歲首稱正月,秦時又曾改稱為端月。第二種是地支紀(jì)月法(十二地支)。古人常以十二地支配稱十二個月,每個地支前要加上特定的“建”字。例如,杜甫《草堂即事》詩:“荒村建子月,獨樹老夫家。”“建子月”是按周朝紀(jì)月法,指農(nóng)歷十一月。第三種是時節(jié)紀(jì)月法。例如,《古詩十九首》:“孟冬寒氣至,北風(fēng)何慘栗。”,“孟冬”指農(nóng)歷十月;陶淵明《擬古詩九首》中“仲春遘時雨”,“仲春”指農(nóng)歷二月。此外,還有花木紀(jì)月法(如一月楊、二月杏、三月桃、四月槐、六月荷等)。6.古代紀(jì)月法3.2中國古代的時序法我國古代紀(jì)日法主要有以下4種。(1)數(shù)序紀(jì)日法《梅花嶺記》:“二十五日,城陷,忠烈拔刀自裁。”歸有光《項脊軒志》:“三五之夜,明月半墻?!逼渲械摹叭濉敝皋r(nóng)歷十五日。(2)干支紀(jì)日法干支紀(jì)日法就是每天用一對干支表示,逐日記錄,60日后再重復(fù)。這種紀(jì)日法是我國古代歷法中很重要的組成部分,而且使用非常早,可以說是我國最古的一種紀(jì)日方法。如《詩經(jīng)》《春秋》(3)月相紀(jì)日法月相紀(jì)日法是指用“朔、胐、望、既望、晦”等表示月相的特稱來紀(jì)日。每月第一天叫朔,每月初三叫胐,月中叫望(小月十五日、大月十六日),望后一天叫既望,每月最后一天叫晦。例如,蘇軾《赤壁賦》:“壬戌之秋,七月既望?!保?)干支月相兼用法干支置前,月相列后。例如,姚鼐《登泰山記》:“戊申晦,五鼓,與子潁坐日觀亭?!?.古代紀(jì)日法3.2中國古代的時序法我國古代主要有如下兩種計時法。(1)天色紀(jì)時法古人最初是根據(jù)天色的變化將一晝夜劃分為十二個時辰,它們的名稱是:夜半、雞鳴、平旦、日出、食時、隅(yú)中、日中、日昳(yì)、晡(bū)時、日入、黃昏、人定。(2)地支紀(jì)時法以十二地支來表示一晝夜十二時辰的變化。近代又把每個時辰細(xì)分為初正,這就等于把一晝夜分為24小時。午時是現(xiàn)在的11:00~13:00,所以人們就稱“午時”中間的12:00為中午或正午,稱天亮到12:00以前為上午,12:00以后到黃昏以前為下午。古天色紀(jì)時、地支紀(jì)時與現(xiàn)代的鐘點序數(shù)紀(jì)時對應(yīng)關(guān)系表如表6-4所示。8.古代紀(jì)時法3.2中國古代的時序法我國古代把夜晚分成五個時段,古時常夜間擊鼓報更(古時用滴漏計時,夜間憑漏刻傳更),所以古人常以鼓代更,稱為五更、五鼓,或稱五夜。每更分為五點,每點約等于現(xiàn)代的24分鐘。例如,《孔雀東南飛》中“仰頭相向鳴,夜夜達(dá)五更”,《群英會蔣干中計》中“伏枕聽時,軍中鼓打二更”,《李愬雪夜入蔡州》中“四鼓,恕至城下,無一人知者”。夜間鐘點與時辰對應(yīng)表如表6-5所示。8.古代紀(jì)時法3.3時序法的應(yīng)用利用古代按時序法編排的文獻(xiàn)及閱讀古籍,首先要熟悉古代的計時方法。目前世界上通行的公元紀(jì)年中,把傳說中的基督教創(chuàng)始人耶穌誕生的那一年作為公元元年,相當(dāng)于我國漢平帝元始元年。這以前的年份稱“公元前”,以后的年份稱“公元”。在閱讀、研究,特別是注釋古文獻(xiàn)時,常常需要把上述的古代紀(jì)年改換成公元紀(jì)年。時序法常用于一些時間概念比較強(qiáng)的參考工具,如年表、大事記、年譜、人物傳記等。利用按時序法編排的工具書進(jìn)行檢索時,如利用“生卒年表”或“年譜”來查考人物資料,需要輔以人名索引才能使用。時序法在強(qiáng)調(diào)時間性的信息排檢中尤顯重要。例如,在編制和使用地方文獻(xiàn)索引數(shù)據(jù)庫中,時間排序法就有重要作用。在輸入的每條索引數(shù)據(jù)中都包含一個時間項,以便盡可能準(zhǔn)確地標(biāo)出地方文獻(xiàn)中事件發(fā)生的時間。4地序法及其他排檢法4.1地序法地序法,即地序排檢法,是指按照信息中涉及地理位置或行政區(qū)域名稱為標(biāo)識來排檢信息的方法。地序法主要用于地域特征比較明顯的信息系統(tǒng)或工具書中,可以把同一地域的有關(guān)信息素材集中在一起,全面地反映某一地區(qū)、某一國家、城市、鄉(xiāng)鎮(zhèn)等的歷史和現(xiàn)狀,如《中國地方志綜錄》。地序法以信息的形成地區(qū)或信息內(nèi)容所反映的地區(qū)為序化符號,按行政區(qū)劃排列法來組織信息。利用地序法進(jìn)行信息排序時,一般有序可循。地序法主要用于編制和檢索地理和地方資料的工具書,可以用在研究查考自然資源及經(jīng)濟(jì)開發(fā)的工具書中,如編制地圖集、有關(guān)地理資料、方志目錄、地方資料等工具書;各類圖書中凡涉及世界各國和國內(nèi)各地區(qū)的,也采用地序法。4.2其他排檢法譜序法是按照機(jī)構(gòu)建制、血緣關(guān)系依次編排文獻(xiàn)的方法。常見的檢索工具如《歷代職官表》(清,紀(jì)昀等編,上海古籍出版社1989年影印本)。其所列的76個表即以清代官制為綱,從中央到地方逐級排列各政權(quán)機(jī)構(gòu)的職官,附官名索引,是按官名查檢的工具書;世襲表和族譜則按照血緣關(guān)系依次排列,如洪秀全家的《洪氏宗譜校補(bǔ)本》(1981年版)。1.譜序法代碼排序法是在某一社會領(lǐng)域采用有一定行業(yè)或?qū)I(yè)含義的代碼來序化信息的方法。如用郵政編碼組織信件,用身份證、學(xué)號組織人群信息,用地址碼(門牌號)組織住戶信息等。文獻(xiàn)編號(如專利號、報告號、標(biāo)準(zhǔn)號等)在組織各類信息方面有著重要作用。代碼排序法在特定的專業(yè)領(lǐng)域是專業(yè)信息序化的重要方法,具有簡單易用、唯一、標(biāo)準(zhǔn)等特點。2.代碼排序法4.2其他排檢法引證關(guān)系排序法利用信息之間的引證與被引證關(guān)系來組織信息,如利用文獻(xiàn)之間的引證關(guān)系所組織的各種引文索引系統(tǒng)。引證關(guān)系排序法不僅是組織信息的一種獨特方法,還是進(jìn)行各種評價研究的基礎(chǔ)。3.引證關(guān)系排序法權(quán)值排序法即賦予不同信息以不同的權(quán)值,以權(quán)值大小為依據(jù)組織信息的方法,實質(zhì)是按照信息的重要性大小來組織信息的方法。例如,決策方案的選擇、教學(xué)質(zhì)量的評估等都涉及權(quán)值組織法;報紙在版面安排上,最重要的信息總是放在頭版頭條的位置;電視節(jié)目的安排,總是把重要節(jié)目放在黃金時間播出。4.權(quán)值排序法4.2其他排檢法根據(jù)某類用戶、某用戶或用戶某方面的特殊需求組織信息的方法,如股票信息、旅游信息、證券信息等,利用信息中其他特性如顏色、重量、速度等其他特征來組織信息等。眾所周知,信息存儲系統(tǒng)的信息要滿足不同使用者的需求,因此要充分考慮不同使用者的能力和需求,盡量運用多種排檢方法以有利于滿足不同查閱者的需求?!缎氯A字典

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論