主題類型的要領(lǐng)及主題檢索標(biāo)識(shí)詞序公式的擴(kuò)展_第1頁
主題類型的要領(lǐng)及主題檢索標(biāo)識(shí)詞序公式的擴(kuò)展_第2頁
主題類型的要領(lǐng)及主題檢索標(biāo)識(shí)詞序公式的擴(kuò)展_第3頁
主題類型的要領(lǐng)及主題檢索標(biāo)識(shí)詞序公式的擴(kuò)展_第4頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、信息主題類型分析的要領(lǐng) 及漢語主題檢索標(biāo)識(shí)構(gòu)成公式的擴(kuò)展 顧瀟華 一、信息標(biāo)引時(shí)主題類型判斷1、主題類型的判斷是分類標(biāo)引和主題標(biāo)引工作的重要基礎(chǔ)判斷主題類型是做信息標(biāo)引工作時(shí)主題分析的第一步。因此,也等于是整個(gè)信息標(biāo)引工作得第一步。 因?yàn)?,無論分類標(biāo)引還是主題標(biāo)引都要做主題分析。主題分析時(shí),首先要判斷主題類型,然后才能做接 下來的其他各個(gè)主題分析環(huán)節(jié)或全部信息標(biāo)引各環(huán)節(jié)的工作。所以,主題類型的判斷是分類標(biāo)引和主題 標(biāo)引工作的重要基礎(chǔ)。2、信息主題的類型1)按信息主題數(shù)量分:?jiǎn)沃黝}:信息內(nèi)容只涉及一個(gè)中心對(duì)象或問題,如:鋼;還可以是只涉 及一個(gè)中心對(duì)象或問題但帶有其他因素,女口:鋼的抗拉性,鋼是

2、中心問題,抗拉性是其他因素。多 主題:文本信息涉及兩個(gè)或多個(gè)事物對(duì)象和問題,如:攝影與空中攝影,攝影、空中攝影都是中心對(duì)象 或問題。2)按信息主題中主題概念的數(shù)量及關(guān)系分:?jiǎn)卧黝}:只有一個(gè)中心對(duì)象作為主題概念,如: 普通生物學(xué)。復(fù)合主題:有兩個(gè)以上主題概念,即:除了中心問題還有其他概念,如鋼的抗拉性。 聯(lián)結(jié)型主題:一般有兩個(gè)中心對(duì)象或問題并被一個(gè)聯(lián)結(jié)詞連接,如:激光在醫(yī)學(xué)中的應(yīng)用,激光、醫(yī)學(xué) 是中心對(duì)象,“應(yīng)用”是起聯(lián)結(jié)作用的聯(lián)結(jié)詞。3)前兩種劃分方法的聯(lián)系:?jiǎn)沃黝}包括:?jiǎn)卧黝}(鋼)和復(fù)合主題(概念交叉型、概念限定 型、概念聯(lián)結(jié)型);多主題包括:并列多主題(河流與湖泊)和從屬多主題(攝影和

3、空中攝影);4)復(fù)合主題類型:概念交叉型:如噴氣式垂直起落飛機(jī),是由噴氣式飛機(jī)和垂直起落飛機(jī)這兩 個(gè)概念(兩個(gè)中心問題)交叉組成;概念限定型:如汽車車身,汽車這一中心問題被車身這一其他因 素限定;概念聯(lián)結(jié)型:如;激光在醫(yī)學(xué)中的應(yīng)用,激光、醫(yī)學(xué)是中心因素,被應(yīng)用這一聯(lián)結(jié)詞聯(lián)結(jié)。另外還有一些主題類型的劃分角度,如按信息內(nèi)容被表達(dá)程度劃分的,按專業(yè)角度劃分的等等。但 上述基礎(chǔ)主題類型是關(guān)鍵方面。所以本文僅探討所列出的主題類型的判斷要領(lǐng)3、判斷主題類型要領(lǐng)的具體實(shí)施步驟當(dāng)拿到被分析的文本,無論是紙質(zhì)文獻(xiàn)信息,還是其他載體形式的信息,信息標(biāo)引時(shí)判斷主題類型 要采用排除法一步一步進(jìn)行。首先,判斷被標(biāo)引對(duì)象

4、是單主題還是多主題,如果有兩個(gè)研究的中心問題 的概念,要看在表達(dá)信息內(nèi)容的題名或語句中有無聯(lián)結(jié)詞,如:“作用”、“影響、”“應(yīng)用”、“關(guān)系”等 字樣,有這些字樣的信息,其主題類型一般為概念聯(lián)結(jié)型復(fù)合主題,就可以依照概念聯(lián)結(jié)型復(fù)合主題的 要求做分類標(biāo)引和主題標(biāo)引的后續(xù)工作;如果沒有上述聯(lián)結(jié)詞字樣,說明不是概念聯(lián)結(jié)型復(fù)合主題,這 時(shí)可以判斷文本是多主題,就可以依照多主題的要求做分類標(biāo)引和主題標(biāo)引的后續(xù)工作;如果不是多主 題,在單主題的情況下還需要判斷是單元主題還是復(fù)合主題,如果是單元主題,就可以依照單元主題的 要求做分類標(biāo)引和主題標(biāo)引后續(xù)工作;如果不是單元主題,在復(fù)合主題的情況下“優(yōu)先考慮是否為概

5、念 交叉型復(fù)合主題”,如果是概念交叉型復(fù)合主題,就可以依照概念交叉型復(fù)合主題的要求做分類標(biāo)引和 主題標(biāo)引的后續(xù)工作;如果不是概念交叉型復(fù)合主題,才能判斷信息的主題類型為概念限定型復(fù)合主題, 然后依照概念限定型復(fù)合主題的要求做分類標(biāo)引和主題標(biāo)引后續(xù)的工作。的確,需記錄在檢索數(shù)據(jù)庫或 說檢索工具中的信息大多是概念限定型復(fù)合主題的信息,但此要領(lǐng)的關(guān)鍵就是要在排除了其他所有主題 類型后,才能判斷信息為概念限定型復(fù)合主題,而不能拿到被標(biāo)引的文本就認(rèn)為信息的主題類型是概念 限定型的復(fù)合主題,這種排除法就是保證準(zhǔn)確判斷主題類型的要領(lǐng)。 二、對(duì)漢語主題檢索標(biāo)識(shí)因素構(gòu)成和詞串序列擴(kuò)展探討的意義盡管現(xiàn)在信息組織領(lǐng)

6、域研究大多圍繞漢語分詞、自動(dòng)標(biāo)引、語義網(wǎng)和本體等等新問題進(jìn)行,信息主 題的因素及檢索標(biāo)識(shí)詞序等問題看上去已成熟,沒什么可研究的。但是,由于絕大多數(shù)國(guó)內(nèi)外圖書館仍 然使用 MARC 描述信息,其中的 6 主題功能模塊各字段的形成離不開主題因素及詞串序列的應(yīng)用。 另外,在版編目也需提供依據(jù)主題因素構(gòu)成和詞序規(guī)則來形成其主題檢索標(biāo)識(shí)項(xiàng)目。還有,除搜索引擎 這種檢索數(shù)據(jù)庫的形成其各個(gè)環(huán)節(jié)是自動(dòng)化的外,就是中國(guó)學(xué)術(shù)期刊網(wǎng)等等檢索數(shù)據(jù)庫也是需要人工處 理一些檢索標(biāo)識(shí)。所以,應(yīng)在已有的概念限定型復(fù)合主題的因素構(gòu)成和詞串序列的基礎(chǔ)上擴(kuò)展出其他主 題類型的因素構(gòu)成和詞串序列。這種擴(kuò)展,對(duì)分類標(biāo)引工作有部分作用,

7、對(duì)主題標(biāo)引實(shí)際工作和信息管 理類專業(yè)的信息組織課程及圖情檔工作業(yè)務(wù)培訓(xùn)的教學(xué)十分有益。概念限定型復(fù)合主題的因素構(gòu)成及詞串序列是所有信息組織的資料或教材都介紹的,即:主題構(gòu)成 的因素及其序列可分為主體因素(研究對(duì)象,即:中心對(duì)象或問題、材料、方法、過程、條件等)、通 用因素、位置因素、時(shí)間因素、文獻(xiàn)類型因素等五種。一般來說,主題因素最全的一條信息也就由這五 種因素構(gòu)成。須強(qiáng)調(diào)的是,共同表達(dá)一條信息主題的每個(gè)主題詞語必定屬于其中的某個(gè)因素,各個(gè)因素 分別表示屬于該因素的主題詞語在主題標(biāo)識(shí)詞串中的職能,而主題詞串中的各個(gè)主題都必須按照五個(gè)因 素或范疇面的規(guī)定詞序排列,形成一種主題詞串的序列公式:A(

8、A1A2A3A4A5)BCDE式中:A為主體因素(Al表示研究對(duì)象,A2表示材料,A3表示方法,A4表示過程,A5表示條 件);B表示通用因素;C表示位置因素,D表示時(shí)間因素;E表示文獻(xiàn)類型因素。假如有一條信息的題目為:二十世紀(jì)中國(guó)財(cái)政學(xué)學(xué)科發(fā)展論文集,其主體因素是財(cái)政學(xué)、通用因素 是學(xué)科發(fā)展、位置因素是中國(guó)、時(shí)間因素是二十世紀(jì)、文獻(xiàn)類型因素是論文集。該題的主題標(biāo)識(shí)結(jié)果則 是:財(cái)政學(xué)學(xué)科發(fā)展中國(guó)二十世紀(jì)論文集。主體因素是信息內(nèi)容涉及的研究對(duì)象,其他因素是 對(duì)研究對(duì)象的限定,該題的研究對(duì)象是財(cái)政學(xué)、但不討論財(cái)政學(xué)的全部范圍,只研究財(cái)政學(xué)的學(xué)科發(fā)展, 還只是中國(guó)的財(cái)政學(xué),不是現(xiàn)在、不是未來、只是剛

9、剛過去的二十世紀(jì)的,不是期刊,不是報(bào)紙,只是 論文集。所謂限定就是指限定了研究對(duì)象的范圍。此題包括的主題因素是最全的、五個(gè)因素都具備的一 個(gè)限定型復(fù)合主題舉例,但有些信息內(nèi)容可能沒有一些因素或范疇面,比如:河北檔案,主體因素是檔 案,位置因素是河北,即只研究河北的檔案問題,其他檔案問題不是此“河北檔案”課題涉及的范圍, 而且該題沒有通用因素、時(shí)間因素和文獻(xiàn)類型因素。概念限定型復(fù)合主題的因素和詞串序列已眾所周知,但還有其他主題類型的信息。其他主題類型也 應(yīng)該有其因素構(gòu)成和詞串序列形式。但是到目前為止,無論主題標(biāo)引實(shí)際工作還是信息組織的教學(xué)工作, 沒有明確規(guī)定其他類型的因素構(gòu)成和詞串序列公式。一般

10、認(rèn)為仿照概念限定型復(fù)合主題的因素和詞串序 列規(guī)定自行處理即可。本文認(rèn)為,明確指出或拓展出其他主題類型的因素構(gòu)成和詞串序列是十分必要的, 可借此解決主題標(biāo)引結(jié)果的不規(guī)范性和不確定性,因此具有較高的現(xiàn)實(shí)意義。 三、主題構(gòu)成因素和詞串序列的擴(kuò)展1、多主題的因素構(gòu)成和詞串序列公式:多主題是指信息主題的主體因素有兩個(gè)以上,即有兩個(gè)以上的研究對(duì)象,如“圖書館學(xué)情報(bào)學(xué)與檔 案學(xué)”,該題有三個(gè)研究對(duì)象,即三個(gè)主體因素,一個(gè)是“圖書館學(xué)”,一個(gè)是“情報(bào)學(xué)”,第三個(gè)是“檔 案學(xué)”,該題沒有其他因素。多主題信息的標(biāo)引結(jié)果要求有幾個(gè)主體因素就有幾個(gè)主題檢索標(biāo)識(shí)結(jié)果, 一般形成兩個(gè)以上主題檢索標(biāo)識(shí),如“河流與湖泊”,其

11、主題檢索標(biāo)識(shí)結(jié)果是:1) 河流2) 湖泊從而可得出:多主題的因素由多個(gè)主體因素構(gòu)成,其詞串序列公式:1)A2) A (或更多的只有一個(gè)主體因素的檢索標(biāo)識(shí),看課題涉及到幾個(gè)研究對(duì)象)。另外,即便有其他因素,因其研究對(duì)象有兩個(gè)以上,也屬于多主題信息,如“西藏的河流與湖泊”, 西藏是位置性限定因素,西藏作為該題的限定因素。其主題檢索標(biāo)識(shí)結(jié)果:1) 河流西藏2) 湖泊西藏從而可以得出帶有其他因素的多主題的詞串序列公式:1)AB(AC 或 AD 或 AE)2)AB(AC 或 AD 或 AE)上述公式表明,多主題的主體因素可以被任何因素限定,并且有幾個(gè)主體因素(研究對(duì)象)就有幾 個(gè)帶限定因素的多主題檢索標(biāo)

12、識(shí)結(jié)果。當(dāng)然,每個(gè)詞串公式也可以同時(shí)帶有若干限定因素,比如:)A BD, 2)ABC。2、概念交叉型復(fù)合主題的因素構(gòu)成和詞串序列公式 概念交叉型復(fù)合主題的信息其研究對(duì)象一般是指研究對(duì)象是用幾個(gè)概念交叉語詞組合成的,這種情 況下有幾個(gè)概念參與交叉就有幾個(gè)主體因素,如“高鈦合金鋼”是由三個(gè)主題概念詞交叉而成的,即: 高合金鋼、鈦鋼、不銹鋼。其標(biāo)引結(jié)果為:高合金鋼:鈦鋼:不銹鋼若用詞串序列公式中的A表示主體因素,概念交叉型復(fù)合主題的詞串序列公式為:A: A: A(按規(guī)定,用“:”做各詞之間的組配符號(hào))。雖然說概念交叉型復(fù)合主題是由兩個(gè)以上主體因素交叉構(gòu)成,但有時(shí)帶有其他因素,比如“超音速 轟炸機(jī)結(jié)構(gòu)

13、設(shè)計(jì)”,其主題檢索標(biāo)識(shí)結(jié)果:超音速飛機(jī):轟炸機(jī)結(jié)構(gòu)設(shè)計(jì)。因此構(gòu)成用兩種符號(hào)組配 成的檢索標(biāo)識(shí)結(jié)果,其詞串序列公式為:A: AB (通用因素參與限定)A; AC (空間因素參與限定)A; AD (時(shí)間因素參與限定)A; A一E。(文獻(xiàn)類型因素參與限定) 當(dāng)然,每個(gè)詞串公式也可以同時(shí)帶有若干限定因素,比如: A: ABC。3、單元主題的因素構(gòu)成和詞串序列公式單元主題實(shí)質(zhì)上就是一條信息涉及某一事物所有的方面,研究對(duì)象就只有一個(gè),而且內(nèi)容涉及研究對(duì)象的所有方面,比如“普通語言學(xué)”,其研究對(duì)象就是普通語言學(xué),構(gòu)成因素也就只有一個(gè),因涉及 其所有方面,所以就僅有主體因素沒有其他任何限定的因素。那么,“普通

14、語言學(xué)”的標(biāo)引結(jié)果為: 普通語言學(xué)從而可以得出單元主題的因素只由一個(gè)主體因素構(gòu)成,其詞串序列公式:A單元主題的標(biāo)引結(jié)果非常簡(jiǎn)明單純。4、概念聯(lián)結(jié)型復(fù)合主題的因素構(gòu)成和詞串序列公式概念聯(lián)結(jié)型復(fù)合主題一般涉及兩個(gè)事物,因此也就有兩個(gè)研究對(duì)象或說兩個(gè)主體因素,并有一個(gè)起聯(lián)結(jié)作用的通用因素語詞(應(yīng)用、影響、關(guān)系、作用等)聯(lián)結(jié),比如“激光在醫(yī)學(xué)中的應(yīng)用”、“森林對(duì) 氣候的影響”、“圖書館學(xué)與情報(bào)學(xué)的關(guān)系”、“信息資源在企業(yè)戰(zhàn)略決策中的作用”等等。這些題目的標(biāo) 引結(jié)果分別為:激光應(yīng)用醫(yī)學(xué)森林影響氣候圖書館學(xué)關(guān)系情報(bào)學(xué) 信息資源作用企業(yè)戰(zhàn)略決策 概念聯(lián)結(jié)型復(fù)合主題的兩個(gè)事物都可作為主題檢索標(biāo)識(shí)結(jié)果的主標(biāo)目,即:都可到詞串序列中的第 一個(gè)詞的位置作檢索入口詞,也就是常說的“輪排”。但是,輪排時(shí)要對(duì)聯(lián)結(jié)詞做相應(yīng)的改動(dòng),如:信 息資源對(duì)企業(yè)戰(zhàn)略決策的影響企業(yè)戰(zhàn)略決策影響因素信息資源。若用詞序公式中的A表示

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論