情報(bào)檢索語(yǔ)言:第八章 一體化醫(yī)學(xué)語(yǔ)言系統(tǒng)_第1頁(yè)
情報(bào)檢索語(yǔ)言:第八章 一體化醫(yī)學(xué)語(yǔ)言系統(tǒng)_第2頁(yè)
情報(bào)檢索語(yǔ)言:第八章 一體化醫(yī)學(xué)語(yǔ)言系統(tǒng)_第3頁(yè)
情報(bào)檢索語(yǔ)言:第八章 一體化醫(yī)學(xué)語(yǔ)言系統(tǒng)_第4頁(yè)
情報(bào)檢索語(yǔ)言:第八章 一體化醫(yī)學(xué)語(yǔ)言系統(tǒng)_第5頁(yè)
已閱讀5頁(yè),還剩49頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、一、UMLS的產(chǎn)生背景二、UMLS的建立與發(fā)展三、UMLS的組成四、UMLS的支持性軟件工具五、UMLS的應(yīng)用第八章 一體化醫(yī)學(xué)語(yǔ)言系統(tǒng)一、UMLS的產(chǎn)生背景 20世紀(jì)中葉是情報(bào)語(yǔ)言學(xué)研究中人工語(yǔ)言發(fā)展的鼎盛時(shí)期,20世紀(jì)末葉是人工語(yǔ)言與自然語(yǔ)言相結(jié)合的新興階段。 自然語(yǔ)言由于存在詞匯的同義、多義現(xiàn)象,詞匯的模糊性和不確定性,詞匯量的巨大,詞間關(guān)系不明晰等問(wèn)題,不可能單純使用它進(jìn)行檢索,所以需要用一種受控檢索語(yǔ)言對(duì)檢索和標(biāo)引所用的詞匯進(jìn)行控制,把用戶的語(yǔ)言和標(biāo)引人員的語(yǔ)言統(tǒng)一起來(lái)。 由于信息量的擴(kuò)充, 給人工語(yǔ)言的處理帶來(lái)了很大的困難。一、UMLS的產(chǎn)生背景工作量大效率低一致性差詞表的不完備性

2、影響了標(biāo)引的質(zhì)量標(biāo)引人員與檢索人員都必需熟悉詞表才能工作,使用非常不便。二、UMLS的建立與發(fā)展目的:旨在建立一個(gè)計(jì)算機(jī)化的可持續(xù)發(fā)展的生物醫(yī)學(xué)檢索語(yǔ)言集成系統(tǒng)和機(jī)讀信息資源指南系統(tǒng),其目的在于提高計(jì)算機(jī)程序“理解”用戶提問(wèn)中生物醫(yī)學(xué)詞匯涵義的能力,并利用這種理解幫助用戶通過(guò)多種交互檢索程序,克服由于不同系統(tǒng)檢索語(yǔ)言差異性和不同數(shù)據(jù)庫(kù)相關(guān)信息的分散性所造成的諸多信息檢索問(wèn)題。二、UMLS的建立與發(fā)展原則:1.多學(xué)科、多研究小組協(xié)同開(kāi)發(fā)原則 UMLS是一項(xiàng)規(guī)模宏大而又相當(dāng)復(fù)雜的長(zhǎng)期研究和開(kāi)發(fā)項(xiàng)目,需要多學(xué)科專家、多研究小組參與協(xié)作研究。所以美國(guó)國(guó)立醫(yī)學(xué)圖書館內(nèi)部成立了一個(gè)多學(xué)科研究小組,同時(shí)以競(jìng)

3、爭(zhēng)和合同方式組織了許多以全美各地大學(xué)為基礎(chǔ)的醫(yī)學(xué)情報(bào)研究小組。 2.集中開(kāi)發(fā)與分散開(kāi)發(fā)相結(jié)合的原則 UMLS的研究小組集中開(kāi)發(fā)、維護(hù)和修訂其產(chǎn)品,同時(shí)向廣大用戶分發(fā)其產(chǎn)品。只要用戶同意向NLM提供反饋信息以及遵守其版權(quán),即可免費(fèi)獲得。發(fā)展階段:1986年-1988年初始階段。研究和開(kāi)發(fā)的重點(diǎn)是調(diào)查用戶需求、開(kāi)發(fā)研究工具、 確定UMLS的性能及其實(shí)施方案、界定系統(tǒng)組成等。在此階段主要界定了UMLS的三個(gè)組成部分即超級(jí)敘詞表、語(yǔ)義網(wǎng)絡(luò)、情報(bào)源圖譜,并且進(jìn)行了包括MeSH、SNOMED、CMIT和PDQ詞表在內(nèi)的聯(lián)接試驗(yàn)。 1989年-1991年發(fā)展階段。開(kāi)發(fā)的重點(diǎn)是迅速研制和發(fā)行三個(gè)UMLS產(chǎn)品的

4、試驗(yàn)版,同時(shí)繼續(xù)開(kāi)展用戶調(diào)查和UMLS功能開(kāi)發(fā)。 1992年至今應(yīng)用階段。1996年UMLS新增了一個(gè)組成部分即“專家詞典”。在此階段,許多研究機(jī)構(gòu)利用UMLS 進(jìn)行基于Internet的應(yīng)用開(kāi)發(fā),如決策支持系統(tǒng)DX plain、文獻(xiàn)檢索系統(tǒng)Web medicine、臨床Web搜索系統(tǒng)Clin web、醫(yī)學(xué)世界檢索Medical world search以及集成化的Med weaver等。二、UMLS的建立與發(fā)展(一)超級(jí)敘詞表(Metathesaurus)(二)語(yǔ)義網(wǎng)絡(luò)( Semantic Network)(三)情報(bào)源圖譜(Information sources Map )(四)專家詞典(S

5、pecialist Lexicon)三、UMLS的構(gòu)成超級(jí)詞表是生物醫(yī)學(xué)的概念、術(shù)語(yǔ)、詞匯及其涵義、等級(jí)范疇的集成。語(yǔ)義網(wǎng)絡(luò)是為建立概念、術(shù)語(yǔ)間相互關(guān)系而設(shè)計(jì)的,它為超級(jí)詞表中的所有概念標(biāo)明了類別和語(yǔ)義類型。信息源圖譜是一個(gè)有關(guān)各種生物醫(yī)學(xué)數(shù)據(jù)庫(kù)的范圍、位置、詞表、語(yǔ)法及獲取條件的信息。專家詞典則包括英語(yǔ)詞匯數(shù)據(jù)庫(kù)及其配套程序。相互聯(lián)系,結(jié)合使用的一個(gè)整體。 超級(jí)敘詞表是UMLS的核心詞匯部分,其英文名稱“Metathesaurus”的前綴 Meta取自韋伯氏英語(yǔ)詞典對(duì)“Meta”前綴的第二種解釋,即“更綜合,卓越超?!?。在多種意義上,超級(jí)敘詞表的確勝過(guò)包攬的特定詞表和分類表。超級(jí)敘詞表是大型

6、的、多詞源、多語(yǔ)種的生物醫(yī)學(xué)詞庫(kù),包括概念、術(shù)語(yǔ)、詞匯及其等級(jí)范疇、屬性以及詞間關(guān)系等。(一)超級(jí)敘詞表(Metathesaurus)超級(jí)敘詞表在收詞方面的特點(diǎn): 收詞量大:收錄來(lái)自近200種生物醫(yī)學(xué)受控詞表、術(shù)語(yǔ)表、分類表、專家系統(tǒng)中的詞匯、詞典及工具性詞表等,可大致分為以下類型: 為病案記錄系統(tǒng)而設(shè)計(jì)的各種術(shù)語(yǔ)表 ,如國(guó)際系統(tǒng)醫(yī)學(xué)術(shù)語(yǔ)集(SNOMED); 用作統(tǒng)計(jì)報(bào)告和列表的大型疾病和病程分類表, 如國(guó)際疾病分類修訂第 10 版及其他各版; 用于記錄與精神病學(xué)、護(hù)理、醫(yī)療器械、藥物副作用等數(shù)據(jù)有關(guān)的專業(yè)化詞表,如:精神失常診斷和統(tǒng)計(jì)手冊(cè)、護(hù)理診斷分類; 專家診斷系統(tǒng)或聯(lián)機(jī)數(shù)據(jù)庫(kù)中的疾病及其

7、他可查詢術(shù)語(yǔ) ,如麻省總醫(yī)院研制開(kāi)發(fā)的DX plain專家診斷系統(tǒng); 情報(bào)檢索系統(tǒng)所使用的敘詞表,如MeSH表及其葡萄牙語(yǔ)、西班牙語(yǔ)、法語(yǔ)、德語(yǔ)、俄語(yǔ)等各種譯本; 醫(yī)學(xué)詞典,如多蘭氏圖解醫(yī)學(xué)辭典、醫(yī)生現(xiàn)行工作術(shù)語(yǔ); 工具性詞表,如校對(duì)詞表、校對(duì)詞表術(shù)語(yǔ)的美式英語(yǔ)與超級(jí)敘詞表概念的等同參照 。 選擇性:超級(jí)敘詞表對(duì)來(lái)源詞表以及同一種詞表的不同版本中的詞均是選擇性收錄。例如,超級(jí)敘詞表2005年AA版收錄了國(guó)際疾病分類(修訂第10版)(ICD-10)的詞匯13490個(gè)、ICD-10美國(guó)版1107個(gè)、ICD-10澳大利亞版25588個(gè)、ICD-9臨床版20176個(gè)。 動(dòng)態(tài)性:從2002年開(kāi)始,超級(jí)敘

8、詞表進(jìn)行季度更新,詞匯有增有減,但總的趨勢(shì)是在增長(zhǎng)。例如,1997年第8版的超級(jí)敘詞表收錄了來(lái)源于30多種生物醫(yī)學(xué)詞表和分類表的能表達(dá)33萬(wàn)多個(gè)概念的739439個(gè)詞匯;2001年12版收錄了83萬(wàn)個(gè)概念,190萬(wàn)個(gè)詞;2002年第13版超級(jí)敘詞表收錄了776940個(gè)概念共210萬(wàn)個(gè)詞。到2011年,超級(jí)敘詞表包含有260 萬(wàn)個(gè)概念,2016年最新版,超級(jí)敘詞表包含來(lái)自199個(gè)詞表的325萬(wàn)個(gè)概念 概念組織:三級(jí)結(jié)構(gòu)模式 超級(jí)敘詞表是依據(jù)概念(concept)或其涵義(meaning)組織起來(lái)的,其根本目的是將相同概念的交替名稱和不同的語(yǔ)詞形式聯(lián)系在一起,并識(shí)別不同概念之間的聯(lián)系。因此,可以說(shuō)

9、概念是超級(jí)敘詞表組織系統(tǒng)的中心。 表達(dá)同一概念可以有多個(gè)術(shù)語(yǔ),對(duì)于同一概念的不同術(shù)語(yǔ)以及不同的變異形式,超級(jí)敘詞表采用三級(jí)結(jié)構(gòu)模式,即概念(I 級(jí))-術(shù)語(yǔ)(II 級(jí))-詞串(III 級(jí)),將一個(gè)概念的多種不同術(shù)語(yǔ)連同多個(gè)變異詞串有序地組織在一起。對(duì)于不同的概念,超級(jí)敘詞表采用多種“關(guān)系”概念如相關(guān)概念、組配概念、共現(xiàn)概念等來(lái)描述不同概念之間的關(guān)系。 在Meta中的每一個(gè)概念都會(huì)被指定一個(gè)概念識(shí)別符(Concept Unique Identifier , 簡(jiǎn)稱CUI)。CUI本身不具意義,只用作鏈接的指針。而每一個(gè)表達(dá)概念含義的字符串(name or string),不管是大小寫的分別或拼寫上的

10、不同,凡是有差異者均視為一個(gè)獨(dú)立的字符串,而分別賦予不同的字符串識(shí)別符(String Unique Identifier, 簡(jiǎn)稱SUI)。由于Meta實(shí)際上是由英文款目所構(gòu)成的,所以不同詞型間表達(dá)相同概念的語(yǔ)詞要能連結(jié)在一起,就必須依賴術(shù)語(yǔ)標(biāo)識(shí)符(Lexicon Unique Identifier, 簡(jiǎn)稱LUI)的指引。 Concept (CUI)Terms (LUIs)Strings (SUIs)C0004238 Atrial Fibrillation (preferred) Atrial Fibrillations Auricular Fibrillation Auricular Fibr

11、illationsL0004238 Atrial Fibrillation (preferred) Atrial FibrillationsS0016668 Atrial Fibrillation (preferred)S0016669 Atrial FibrillationsL0004327 (synonym) Auricular Fibrillation Auricular FibrillationsS0016899 Auricular Fibrillation (preferred)S0016900 (plural variant) Auricular Fibrillations在Met

12、a中展示了不同概念間的各種關(guān)系,而這些關(guān)系的建立,有些是取自原有的索引表架構(gòu),有些則是在建構(gòu)Meta時(shí)所賦與的。例如“Atrial Fibrillation” (心房纖維顫動(dòng))和“Arrhythmia”(心律失常)在MeSH中是以層級(jí)架構(gòu)來(lái)展示二詞間的隸屬關(guān)系。但“Atrial Fibrillation”在本質(zhì)上也是一種“Arrhythmia” ,在MeSH中卻沒(méi)有被展現(xiàn),此即Meta在建構(gòu)時(shí)所新添的關(guān)系。另外,有時(shí)也會(huì)有來(lái)自其它詞典所建立起來(lái)的概念關(guān)系應(yīng)用到Meta上。例如概念詞“Paroxysmal Atrial Fibrillation” (陣發(fā)性心房纖維顫動(dòng))在Meta中被指引為“At

13、rial Fibrillation” 的下位詞(Narrowed term),即是取自MeSH, ICD-9, SNOMED等索引表中所建立的架構(gòu)。 UMLS與傳統(tǒng)詞表概念間關(guān)系揭示的比較 語(yǔ)義網(wǎng)絡(luò)是為建立概念、術(shù)語(yǔ)間錯(cuò)綜復(fù)雜的關(guān)系而設(shè)計(jì)的,它為超級(jí)敘詞表中所有概念提供了語(yǔ)義類型、語(yǔ)義關(guān)系和語(yǔ)義結(jié)構(gòu)。目前,語(yǔ)義網(wǎng)絡(luò)包括了134種語(yǔ)義類型和54種語(yǔ)義關(guān)系。(二)語(yǔ)義網(wǎng)絡(luò)( Semantic Network)超級(jí)敘詞表中的每一個(gè)概念至少被標(biāo)引(分配)一種語(yǔ)義類型。語(yǔ)義類型是通過(guò)計(jì)算機(jī)程序指定的或在人工復(fù)審過(guò)程中增加的,它既是超級(jí)敘詞表與語(yǔ)義網(wǎng)絡(luò)之間的連接,也是超級(jí)敘詞表與情報(bào)源圖譜(ISM)的連接

14、之一。語(yǔ)義網(wǎng)絡(luò)為超級(jí)敘詞表提供了指定給每一個(gè)概念至少一種語(yǔ)義類型的信息,同時(shí)語(yǔ)義類型也指定給情報(bào)源圖譜中特定的數(shù)據(jù)庫(kù),以表達(dá)情報(bào)資源之間的內(nèi)在聯(lián)系。UMLS的語(yǔ)義網(wǎng)絡(luò)不僅運(yùn)用了常規(guī)的語(yǔ)義控制手段,如語(yǔ)義等級(jí)、屬分、相關(guān)關(guān)系控制,而且在語(yǔ)義規(guī)范和語(yǔ)義關(guān)系分析、延伸等多方面有許多創(chuàng)新。語(yǔ)義網(wǎng)絡(luò)是試圖建立一種語(yǔ)義類型及其相互關(guān)系的權(quán)威規(guī)則,用以標(biāo)引每一個(gè)超級(jí)敘詞概念,或表達(dá)概念之間可能存在的相互關(guān)系。語(yǔ)義網(wǎng)絡(luò)的這種權(quán)威規(guī)則,既在文字上,也從等級(jí)關(guān)系或非等級(jí)關(guān)系上界定語(yǔ)義類型及其相互間可能存在的關(guān)系與內(nèi)在涵義。 語(yǔ)義類型目前語(yǔ)義類型主要分為生物體、解剖結(jié)構(gòu)、生物功能、化學(xué)、事件、客觀物體、概念和觀念等

15、。這些語(yǔ)義類型的高層分為“物”和“事”兩大類,并由此層層展開(kāi)形成“樹(shù)形結(jié)構(gòu)” 。由全部語(yǔ)義類型形成的等級(jí)結(jié)構(gòu)中,每一語(yǔ)義類型除有一個(gè)樹(shù)狀等級(jí)號(hào)之外,還被賦予一個(gè)語(yǔ)義類型代碼,如T071、T001等,這些代碼并無(wú)實(shí)質(zhì)上的含義。語(yǔ)義關(guān)系鏈將語(yǔ)義類型連結(jié)成為語(yǔ)義網(wǎng)絡(luò)。 在UMLS語(yǔ)義網(wǎng)絡(luò)中,語(yǔ)義類型可以看成是有層次結(jié)構(gòu)的“節(jié)點(diǎn)”,而把這些節(jié)點(diǎn)連成網(wǎng)的連接,稱為“鏈”(Link),“鏈”所表達(dá)的是語(yǔ)義類型之間的“關(guān)系”(Relationship)。這種“鏈”可分為兩類: 等級(jí)關(guān)系鏈(H) is a 一種。上、下位概念。 相關(guān)關(guān)系鏈(R) :分為五大類 物理上相關(guān)(physically-related-

16、to), 空間上相關(guān)(spatially-related-to), 功能上相關(guān)(functionally-related-to), 時(shí)間上相關(guān)(temporally-related-to), 概念上相關(guān)(conceptully-related-to) 。H.等級(jí)關(guān)系鏈isaR.相關(guān)關(guān)系鏈(1)物理上相關(guān)1.的部分2.由組成3.包含4.與相連5.分開(kāi)(2.)空間上相關(guān)1.位于2.與相鄰3.包圍,周圍4.穿過(guò)(3)功能上相關(guān)1.影響1. 1管理1. 2治療1. 3干擾1. 4并發(fā)1. 5與相互作用1. 6預(yù)防2.帶來(lái)、造成 2. 1產(chǎn)生 2. 2引起3.執(zhí)行 3. 1實(shí)施 3. 2展示 3. 3練

17、習(xí)4.發(fā)生于情況下 4. 1.的進(jìn)程5.使用6.現(xiàn)象表達(dá)7.證實(shí)8.的結(jié)果、效果(4)時(shí)間上相關(guān)1.與同時(shí)發(fā)生2.先于發(fā)生(5)概念上相關(guān)1.的評(píng)價(jià)2.的程度、等級(jí)3.分析 3. 1分析評(píng)估的影響4.的測(cè)量值5.測(cè)量6.診斷7.的特性8.衍生的9.的發(fā)育階段10.的方法11.的概念部分12.之中的焦點(diǎn)問(wèn)題 Mediastinum縱隔 saccular viscus囊狀臟器 esophagus食管 Left phrenic nerve 左隔神經(jīng) Heart valves心臟瓣膜 Fetal heart胎兒心臟 Angina pectoris心絞痛 Cardiotonic Agents強(qiáng)心劑 Ti

18、ssue Donors組織捐贈(zèng)者Heart心臟Body Part,Organ or Organ Component身體部位,器官或器官組成Fully Formed Anatomical Structure完全成型的解剖學(xué)結(jié)構(gòu)Embryonic Structure胚胎結(jié)構(gòu)Disease or Syndrome疾病或綜合癥PopulationGroup人群UMLS超級(jí)敘詞PharmacologicSubstance藥物UMLS語(yǔ)義網(wǎng)絡(luò)語(yǔ)義關(guān)系rel 語(yǔ)義類型語(yǔ)義關(guān)系的等級(jí)繼承規(guī)則和繼承阻斷 在語(yǔ)義類型等級(jí)結(jié)構(gòu)的高層節(jié)點(diǎn)之間的語(yǔ)義關(guān)系,在任何可能的情況下都是固定的,正如上例所列舉的語(yǔ)義關(guān)系“影響”鏈

19、接的這些高層語(yǔ)義類型節(jié)點(diǎn)。而且高層語(yǔ)義類型之間的語(yǔ)義關(guān)系,一般地可通過(guò)等級(jí)結(jié)構(gòu)(isa鏈)繼承給這些節(jié)點(diǎn)的所有子類。 在有些情況下,如果按照語(yǔ)義類型的等級(jí)結(jié)構(gòu)及鏈的繼承規(guī)則,會(huì)使語(yǔ)義類型與語(yǔ)義關(guān)系的連接產(chǎn)生歧義。例如,語(yǔ)義關(guān)系“的進(jìn)程”存在于語(yǔ)義類型“生物體功能”和“生物體”之間,“生物體功能”有一個(gè)子類是“心理功能”,而植物也是一種“生物體”,按照繼承規(guī)則,心理過(guò)程也是一種“植物的活動(dòng)、功能或狀態(tài)”,顯然,植物不可能有“心理過(guò)程”。不能繼承的鏈稱為阻斷 。語(yǔ)義網(wǎng)絡(luò)使概念之間語(yǔ)義關(guān)系的準(zhǔn)確細(xì)致表達(dá) MeSH樹(shù)狀范圍表所表達(dá)的MeSH上位詞與下位詞之間的關(guān)系,只是簡(jiǎn)單的較泛指與較專指關(guān)系。例如,

20、MeSH“羊水”(Amnioticfluid)是MeSH“胚胎”(Embryo)的一個(gè)下位詞: Embryo A16.254 Amniotic fluid A16.254.72 在UMLS語(yǔ)義網(wǎng)絡(luò)中,Embryo標(biāo)引的語(yǔ)義類型是“胚胎結(jié)構(gòu)”(Embryonicstructure),Amnioticfluid標(biāo)引的語(yǔ)義類型是“機(jī)體物質(zhì)”(Body Substance),語(yǔ)義關(guān)系標(biāo)引的是“周圍”(Surround)。所以“羊水”與“胚胎”之間的關(guān)系就被確切地表達(dá)為“胚胎結(jié)構(gòu)周圍的機(jī)體物質(zhì)”。 情報(bào)源圖譜是一個(gè)關(guān)于生物醫(yī)學(xué)機(jī)讀情報(bào)資源的數(shù)據(jù)庫(kù),這些情報(bào)源多種多樣,不僅涵蓋生物醫(yī)學(xué)研究、臨床實(shí)踐和生物

21、倫理學(xué)的主要書目數(shù)據(jù)庫(kù),還包括專家系統(tǒng),來(lái)自醫(yī)學(xué)史聯(lián)機(jī)圖像庫(kù)、可視化人類計(jì)劃等圖像數(shù)據(jù)庫(kù),以及有關(guān)遺傳學(xué)、蛋白質(zhì)和核酸序列、藥物、毒物學(xué)、環(huán)境衛(wèi)生的事實(shí)數(shù)據(jù)庫(kù)。 其目的是利用超級(jí)敘詞表和語(yǔ)義網(wǎng)絡(luò)實(shí)現(xiàn)以下功能:理解情報(bào)源與特定提問(wèn)的相關(guān)性,以便選取最合適的情報(bào)源;為用戶提供特定情報(bào)源的范圍、功能和檢索條件等人工可讀的信息。自動(dòng)鏈接相關(guān)情報(bào)源;在一個(gè)或多個(gè)情報(bào)源中自動(dòng)檢索并自動(dòng)組織檢索的結(jié)果。 (三)情報(bào)源圖譜(Information sources Map ) 專家詞典是一個(gè)包含眾多生物醫(yī)學(xué)詞匯的英語(yǔ)詞典。它是在美國(guó)國(guó)立醫(yī)學(xué)圖書館自然語(yǔ)言處理專家系統(tǒng)項(xiàng)目基礎(chǔ)上開(kāi)發(fā)出來(lái)的。每個(gè)詞條記錄均詳細(xì)描述自

22、然語(yǔ)言處理系統(tǒng)所需要的詞典信息,包括句法、形式和結(jié)構(gòu)的拼寫信息,同時(shí)提供詞典工具和程序供超級(jí)敘詞表和專家詞典確定英語(yǔ)詞匯的范圍以及識(shí)別生物醫(yī)學(xué)術(shù)語(yǔ)和文本中詞的詞形變異,是進(jìn)行檢索、標(biāo)引和詞匯處理的有力工具。 (四)專家詞典(Specialist Lexicon) 每條詞匯記錄均記錄了它的句法、詞法和字法信息。詞條由詞或詞組組成。所有詞條均共享它們的基本形式和拼寫變異。詞的基本形式包括詞的不變形式、名詞的單數(shù)形式、動(dòng)詞的原形以及形容詞和副詞的原級(jí)形式。詞形變異有名詞的單復(fù)形式、動(dòng)詞的規(guī)則與不規(guī)則變化形式、形容詞和副詞的原級(jí)、比較級(jí)、最高級(jí)形式等。專家詞典能識(shí)別11種句法分類和引語(yǔ)部分:動(dòng)詞、名詞

23、、形容詞、副詞、助詞、語(yǔ)氣詞、代詞、介詞、連詞、補(bǔ)語(yǔ)、定語(yǔ)。 專家辭典提供的自然語(yǔ)言處理工具如下表:(四)專家詞典(Specialist Lexicon)專家詞典工具1.UMLS的術(shù)語(yǔ)服務(wù)UTS2.UMLS的安裝和定制工具M(jìn)etamorphoSys3.UMLS概念的文本映射工具M(jìn)etaMap4.UMLS語(yǔ)義表達(dá)工具SemRep四、UMLS的支持性軟件工具UMLS 術(shù)語(yǔ)服務(wù)( UMLS Terminology Services,UTS)UMLS 術(shù)語(yǔ)服務(wù)于2010 年12月上線,取代了之前的UMLS 知識(shí)源服務(wù)器( UMLS Knowledge Source Server,UMLSKS) 。UT

24、S 通過(guò)基于瀏覽器和Web 服務(wù)客戶端提供對(duì)UMLS 知識(shí)源的瀏覽、查詢和數(shù)據(jù)獲取,主要工具包括: 超級(jí)敘詞表瀏覽器 、語(yǔ)義網(wǎng)絡(luò)瀏覽器和SNOMED CT 瀏覽器,這些瀏覽器能夠查詢和獲得UMLS 的概念、語(yǔ)義類型、語(yǔ)義關(guān)系和SNOMED CT的內(nèi)容。2.UMLS的安裝和定制工具 MetamorphoSys MetamorphoSys 是對(duì)UMLS 進(jìn)行本地安裝和對(duì)UMLS 進(jìn)行定制化裁減的工具。用戶可以通過(guò)該工具選擇安裝超級(jí)敘詞表、語(yǔ)義網(wǎng)絡(luò)、專家辭典中的一項(xiàng)或多項(xiàng)內(nèi)容。當(dāng)選擇安裝超級(jí)敘詞表時(shí),安裝向?qū)г试S用戶創(chuàng)建超級(jí)敘詞表的子集,即可以選擇去掉某些來(lái)源的數(shù)據(jù)文件,或者通過(guò)選項(xiàng)設(shè)置和過(guò)濾器進(jìn)行定制和裁減,達(dá)到縮小容積、滿足個(gè)性化要求的目的。3.UMLS概念的文本映射工具M(jìn)etaMap MetaMap 是一個(gè)實(shí)現(xiàn)自由文本到UMLS 概念映射的工具,即標(biāo)記出生物醫(yī)學(xué)文本中所含有的UMLS超級(jí)敘詞表概念。MetaMap 的應(yīng)用非常廣泛,如Medline數(shù)據(jù)檢索,有研究表明,它能夠提高M(jìn)edline文獻(xiàn)信息檢索的效果;同時(shí),MetaMap 在數(shù)據(jù)挖掘領(lǐng)域也有廣泛的應(yīng)用,包括臨床發(fā)現(xiàn)、發(fā)現(xiàn)文獻(xiàn)中的藥物與疾病關(guān)系等;此外,MetaMap 也是NLM 自動(dòng)標(biāo)引系統(tǒng)的實(shí)現(xiàn)基礎(chǔ),用于為半自動(dòng)和全自動(dòng)標(biāo)引生成推薦術(shù)語(yǔ)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論