




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
中醫(yī)藥學(xué)語言系統(tǒng)賈李蓉中國中醫(yī)科學(xué)院中醫(yī)藥信息研究所前言從20世紀80年代起,由于生物醫(yī)學(xué)信息量不斷增加,且分散于各個數(shù)據(jù)庫系統(tǒng),因此要檢索完整而新穎的信息很不容易,于是統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)應(yīng)運而生。1986年美國國立醫(yī)學(xué)圖書館(NationalLibraryofMedicine,NLM)主持了一項長期研究和開發(fā)計劃,即統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)(UnifiedMedicalLanguageSystem,UMLS)。其目的是在于提升系統(tǒng)之能力,使系統(tǒng)能了解讀者在生物醫(yī)學(xué)方面的問題,并進而幫助讀者檢索及整合相關(guān)信息。近年來,由于中醫(yī)藥學(xué)信息量的不斷增多,且各種概念不規(guī)范不統(tǒng)一,因而給中醫(yī)藥信息查詢帶來了多重的困難。在此形勢下,中國中醫(yī)研究院主持開發(fā)了中醫(yī)藥學(xué)語言系統(tǒng)。
統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)(UnifiedMedicalLanguageSystem,UMLS)中醫(yī)藥學(xué)語言系統(tǒng)(TCMLanguageSystem,TCMLS)2.背景:統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)2.1.統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)研制的目的和意義2.2.統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)的發(fā)展階段2.3.統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)的組成2.4.統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)的發(fā)展策略與開發(fā)原則2.5.統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)的應(yīng)用2.1.統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)研制的目的和意義美國國立醫(yī)學(xué)圖書館自1986年開始研制統(tǒng)一的醫(yī)學(xué)語言系統(tǒng),其目的在于克服計算機生物醫(yī)學(xué)信息檢索中相同的概念具有不同的表達方式、有用的信息分散在不同的數(shù)據(jù)庫系統(tǒng)中所造成的查詢困難。統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)是計算機化的情報檢索語言集成系統(tǒng),它不僅是語言翻譯、自然語言處理及語言規(guī)范化的工具,而且是實現(xiàn)跨數(shù)據(jù)庫檢索的詞匯轉(zhuǎn)換系統(tǒng),它可以幫助用戶在聯(lián)接情報源,包括數(shù)字化的病案記錄、書目數(shù)據(jù)庫、事實數(shù)據(jù)庫以及專家系統(tǒng)的過程中,對其中的電子式生物醫(yī)學(xué)情報作統(tǒng)一的檢索。
2.2.統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)的發(fā)展階段1986~1988年統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)的初始階段1989~1991年統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)的發(fā)展階段
1992年至今統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)的應(yīng)用階段1986~1988年為統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)的初始階段,其研究和開發(fā)的重點是調(diào)查用戶需求、開發(fā)研究工具、確定統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)的性能及其實施方案、界定系統(tǒng)組成等。在此階段主要界定了統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)的三個組成部分即超級敘詞表、語義網(wǎng)絡(luò)、情報源圖譜,并且進行了包括MeSH(MedicalSubjectHeadings)、SNOMED(SystematizedNomenclatureofMedicine)、CMIT(CurrentMedicalInformationandTerminology)和PDQ(Physicians'DataQuery)詞表在內(nèi)的聯(lián)接試驗。1989~1991年為統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)的發(fā)展階段其開發(fā)的重點是迅速研制和發(fā)行三個統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)產(chǎn)品的試驗版,同時繼續(xù)開展用戶調(diào)查和統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)功能開發(fā)。1990年秋,美國國立醫(yī)學(xué)圖書館發(fā)行了超級敘詞表和語義網(wǎng)絡(luò)第一版的CD-ROM;一年后,發(fā)行了試驗版的情報源圖譜和更新版的超級敘詞表和語義網(wǎng)絡(luò),同時獲得了大量的反饋信息,促進了統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)的研究與開發(fā)。1992年至今為統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)的應(yīng)用階段其研究的重點是圍繞統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)所進行應(yīng)用開發(fā),不斷擴展和修訂統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)的三個組成部分,發(fā)行修訂統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)三個組成部分的年度版,建立健全產(chǎn)品體系。
1996年統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)新增了一個組成部分,即“專家詞典”(SpecialistLexicon)。在此階段,許多研究機構(gòu)利用統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)進行了基于Internet的應(yīng)用開發(fā),如決策支持系統(tǒng)(DXplain)、文獻檢索系統(tǒng)(WebMedline)、臨床Web搜索系統(tǒng)(Clinweb)、醫(yī)學(xué)世界檢索(medicalworldsearch)以及集成化的
Medweave等。除了以CD-ROM方式發(fā)行其產(chǎn)品外,1995年美國國立醫(yī)學(xué)圖書館在Internet上建立了統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)知識源服務(wù)器,通過Internet,加強國際交流與合作。從此,統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)由試驗階段進入到產(chǎn)品發(fā)行、維護和應(yīng)用的階段。2.3.統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)的組成
超級敘詞表(Metathesaurus)語義網(wǎng)絡(luò)(SemanticNetwork)專家詞典(SpecialistLexicon)
情報源圖譜(InformationSourcesMap,ISM)多元系統(tǒng)(MetamorphoSys)
超級敘詞表超級敘詞表可視為一個概念名詞的知識庫,是由生物醫(yī)學(xué)領(lǐng)域中許多不同索引典或分類表中所抽取出來的詞目所組成。
超級敘詞表是生物醫(yī)學(xué)概念、術(shù)語、詞匯及其等級范疇的廣泛集成。1997年第8版的超級敘詞表收錄了來源于30多種生物醫(yī)學(xué)詞表和分類表的、能表達33萬多個概念的739439個詞匯;到目前超級敘詞表收錄了100多萬個生物醫(yī)學(xué)概念、共500多萬個詞。這些概念和詞來自100多個生物醫(yī)學(xué)受控詞表、術(shù)語表、分類表、專家系統(tǒng)中的詞匯、詞典及工具性詞表等,如醫(yī)學(xué)主題詞詞表(MedicalSubjectHeadings,MeSH)及其葡萄牙語、西班牙語、法語、德語、俄語等各種譯本、醫(yī)學(xué)系統(tǒng)術(shù)語表(SystematizedNomenclatureofMedicine,SNOMED)、國際疾病分類修訂第10版(InternationalClassificationofDiseases,10thRevision,ICD-10)及其他各版、LOINC(LogicalObservationIdentifiersNamesandCodes)、臨床藥物標準術(shù)語(RxNorm)等。超級敘詞表是依據(jù)概念(concept)或涵義(meaning)組織起來的,其根本目的是將相同概念的交替名稱和不同形式聯(lián)系在一起,并識別不同概念之間的聯(lián)系。因此,可以說概念是超級敘詞表組織系統(tǒng)的中心。對于同一概念的不同術(shù)語以及不同的變異形式,超級敘詞表采用三級結(jié)構(gòu)模式,即概念(I級)→術(shù)語(II級)→詞串(III級),將一個概念的多種不同術(shù)語連同多個變異詞串有序地組織在一起。對于不同的概念,超級敘詞表采用多種“關(guān)系”概念如相關(guān)概念、組配概念、共現(xiàn)概念等來描述不同概念之間的關(guān)系。語義網(wǎng)絡(luò)語義網(wǎng)絡(luò)是為建立概念、術(shù)語間錯綜復(fù)雜的關(guān)系而設(shè)計的,它為超級敘詞表中所有概念提供了語義類型、語義關(guān)系和語義結(jié)構(gòu)。語義網(wǎng)絡(luò)包括了135種語義類型和54種語義關(guān)系。語義網(wǎng)絡(luò)是通過135種語義類型,為出現(xiàn)在超級敘詞表中的所有概念提供一種目錄組織結(jié)構(gòu)。語義類型之間的54種連接關(guān)系為這種組織結(jié)構(gòu)提供構(gòu)架,并代表生物醫(yī)學(xué)領(lǐng)域中的重要相互關(guān)系。語義網(wǎng)絡(luò)為超級敘詞表提供了指定給每一個概念至少一種語義類型的信息,同時語義類型也指定給情報源圖譜中特定的數(shù)據(jù)庫,以表達情報資源之間的內(nèi)在聯(lián)系。也就是說,語義網(wǎng)絡(luò)是試圖建立一種語義類型及其相互關(guān)系的權(quán)威規(guī)則,用以標引每一個超級敘詞概念,或表達概念之間可能存在的相互關(guān)系。語義網(wǎng)絡(luò)的這種權(quán)威規(guī)則,既在文字上,也從等級關(guān)系或非等級關(guān)系上界定語義類型及其相互間可能存在的關(guān)系與內(nèi)在涵義。語義類型是通過計算機程序指定的或在人工復(fù)審過程中增加的,它既是超級敘詞表與語義網(wǎng)絡(luò)之間的連接,也是超級敘詞表與情報源圖譜的連接之一。目前語義類型主要分為生物體、解剖結(jié)構(gòu)、生物功能、化學(xué)、事件、客觀物體、概念和觀念等。各類范疇深度不一。在實際應(yīng)用中,語義類型不斷完善和擴展。UI:
T048STY:
MentalorBehavioralDysfunction(心理或行為功能失調(diào))Definition:Aclinicallysignificantdysfunctionwhosemajormanifestationisbehavioralorpsychological.Thesedysfunctionsmayhaveidentifiedorpresumedbiologicaletiologiesormanifestations.表現(xiàn)為行為性或精神性的具有臨床意義的功能失調(diào),這些功能失調(diào)可能曾被認為或被假定為生物學(xué)病因或生物學(xué)表現(xiàn)。Examples:MemoryDisorders(記憶混亂);Agoraphobia(廣場恐怖癥);Hallucinations(幻覺);CyclothymicDisorder(循環(huán)情感性精神障礙)語義類型是語義網(wǎng)絡(luò)的節(jié)點,節(jié)點與節(jié)點之間的關(guān)系即為語義關(guān)系。最基本的語義關(guān)系是“isa”關(guān)系,通過它建立了節(jié)點與節(jié)點之間的一種等級關(guān)系,這種等級關(guān)系的最大特性是它的繼承性,即下一級節(jié)點對上一級節(jié)點的繼承關(guān)系。除了‘isa”關(guān)系外,還有
53種語義關(guān)系,它們均是非等級關(guān)系,這些關(guān)系可以出現(xiàn)在任何一級節(jié)點上,表示一種可能、允許的關(guān)系。等級關(guān)系鏈isa相關(guān)關(guān)系鏈
associated_with物理上相關(guān)(physicallyrelatedto)功能上相關(guān)(functionallyrelatedto)概念上相關(guān)(conceptuallyrelatedto)空間上相關(guān)(Spatiallyrelatedto)時間上相關(guān)(temporallyrelatedto)H.等級關(guān)系鏈isa
R.相關(guān)關(guān)系鏈
(1)物理上相關(guān)
1.…的部分
2.由…組成
3.包含
4.與…相連
5.分開
(2.)空間上相關(guān)
1.位于…
2.與…相鄰
3.包圍,周圍
4.穿過
(3)功能上相關(guān)
1.影響
1.1管理
1.2治療1.3干擾
1.4并發(fā)
1.5與…相互作用
1.6預(yù)防
2.帶來、造成
2.1產(chǎn)生
2.2引起
3.執(zhí)行
3.1實施
3.2展示
3.3練習
4.發(fā)生于…情況下
4.1.…的進程
5.使用
6.現(xiàn)象表達
7.證實
8.…的結(jié)果、效果(4)時間上相關(guān)
1.與…同時發(fā)生
2.先于…發(fā)生
(5)概念上相關(guān)
1.…的評價
2.…的程度、等級
3.分析
3.1分析評估…的影響
4.…的測量值
5.測量
6.診斷
7.…的特性
8.…衍生的
9.…的發(fā)育階段
10.…的方法
11.…的概念部分
12.…之中的焦點問題語義類辰型和語笛義關(guān)系宴構(gòu)成網(wǎng)繁狀的語方義結(jié)構(gòu)拴,它起務(wù)著統(tǒng)領(lǐng)懸超級敘獲詞表概隆念的作靜用。因位為超級郊敘詞表返的概念蛋來自許固多不同側(cè)的詞表增,它們且有各自漆的結(jié)構(gòu)恩體系,迎語義網(wǎng)牌絡(luò)將全些部概念勻劃分成爺許多組外,每一桿組共享之幾種特棟定的語惕義類型慈,語義女類型又嫂共享幾登種語義雁關(guān)系,偵這樣概溜念不僅般高度結(jié)繞構(gòu)化而菜且廣泛補聯(lián)系。語義關(guān)系瘋的等級繼傳承規(guī)則和鮮繼承阻斷在語義類暴型等級結(jié)威構(gòu)的高層康節(jié)點之間湯的語義關(guān)鋤系,在任櫻何可能的得情況下都厚是固定的洲,正如語狐義關(guān)系“刊影響”鏈朵接的這些佩高層語義轟類型節(jié)點胳。而且高患層語義類玻型之間的羽語義關(guān)系致,一般地然可通過等魚級結(jié)構(gòu)(is榜a鏈)繼承給這掩些節(jié)點的饅所有子類邀。在有些情舒況下,如磨果按照語晃義類型的鴉等級結(jié)構(gòu)碑及鏈的繼招承規(guī)則,曠會使語義超類型與語校義關(guān)系的蛛連接產(chǎn)生瓦歧義。例停如,語義秩關(guān)系“…的進程”節(jié)存在于語正義類型“猛生物體功趴能”和“賠生物體”藏之間,“山生物體功桑能”有一罪個子類是滿“心理功秀能”,而助植物也是浴一種“生歌物體”,下按照繼承箭規(guī)則,心之理過程也暈是一種“賊植物的活朋動、功能斯或狀態(tài)”嫁,顯然,遠植物不可槽能有“心綢理過程”蹄。不能繼晚承的鏈稱滑為阻斷嗚。語義網(wǎng)臟絡(luò)使概愈念之間尊語義關(guān)隆系的準倆確細致腸表達MeSH樹狀范圍薪表所表達絮的MeS爐H上位詞餃與下位最詞之間栗的關(guān)系宣,只是眠簡單的庸較泛指遮與較專意指關(guān)系鉗。例如演,MeS虎H“羊水”(Amn今ioti蜻cflu例id)是MeSH怒“胚胎”(Em猶bry桐o)的一個下范位詞:Emb槍ryo件A16泄.25盛4
A與mni切oti絨cfl吵uid索A16漂.25脫4.7胞2在UML計S語義網(wǎng)過絡(luò)中,Emb蠶ryo標引的桶語義類轟型是“欲胚胎結(jié)翻構(gòu)”(Emb權(quán)ryon恭icst敗ruct早ure)配,Amn賢ioti迫cflu蔽id標引的區(qū)語義類姥型是“棉機體物活質(zhì)”(Bod獄ySub封stan辟ce),語義關(guān)仍系標引的診是“周圍根”(Sur眉roun毯d)。所以“地羊水”與枯“胚胎”慌之間的關(guān)亮系就被確旱切地表達謎為“胚胎恭結(jié)構(gòu)周圍溫的機體物踩質(zhì)”。專家詞祥典專家詞典當是一個包汽含眾多生前物醫(yī)學(xué)詞票匯的英語麻詞典。它糾是在美國柱國立醫(yī)學(xué)耳圖書館自爭然語言處升理專家系羅統(tǒng)項目基嘆礎(chǔ)上開發(fā)足出來的。苗專家詞典維約有1830棚00條詞蓮匯記錄,已共292新000多補個詞。每條詞匯棕記錄均記解錄了它的構(gòu)句法、詞辨法和字法熔信息。詞摧條由詞或眼詞組組成吸。所有詞昨條均共享蠶它們的基第本形式和豬拼寫變異冠。詞的基添本形式包律括詞的不軍變形式、誓名詞的單逢數(shù)形式、遇動詞的原夠形以及形吼容詞和副拘詞的原級珠形式。詞匯信扇息包括昨句法分傲類、詞淹形變異濟以及詞起的補充搜成份。門詞形變刷異有名緣瑞詞的單招復(fù)形式馬、動詞駐的規(guī)則區(qū)與不規(guī)餃則變化晉形式、術(shù)形容詞穩(wěn)和副詞挺的原級黑、比較餓級、最明高級形曠式等。皺專家詞欣典能識甚別11梯種句法神分類和惑引語部鈴分:動障詞、名建詞、形罷容詞、怕副詞、階助詞、哪語氣詞魔、代詞露、介詞拔、連詞緞、補語略、定語律。專家詞典麥包括一組菜詞典程序根,它們可參以確定英厲語詞匯的牛范圍以及董識別生物過醫(yī)學(xué)術(shù)語員和文本詞的詞形變芹異。還包纏括三個索誦引:①超級敘俗詞表中所歌有詞串的伴單個詞索述引;②標弦準詞索引留;③標準蠟詞串索引熱。專家詞典心包括四個躲詞匯數(shù)據(jù)釣庫:①已觀知詞源變仿異文檔,缸如“apha提sic[?’fe熱izik]n奏.a委dj.患失語妹癥者洋失語癥提的”與“apha綿sia[?’f負eizi景?]n悉.失語癥”;②密切延相關(guān)詞葬文檔。網(wǎng)密切相絕關(guān)詞是仁意義相銹同但句狡法分類圣不同的邊詞,如肝細胞“hepa彎toce怪llul疼ar”與“l(fā)iv擦er北cel出ls”斗;③拼寫變辮異文檔,轉(zhuǎn)如“foet旨al[‘f連i:t三l]”與“feta遣l”;④意義相每近但構(gòu)詞作形式不同惰的詞文檔康,如“hea停rt”耳與“car衫di(爆o)”。情報源下圖譜情報源圖難譜是一個屢關(guān)于生物芹醫(yī)學(xué)機讀悼情報資源姿的數(shù)據(jù)庫索,其目的溫是利用超貸級敘詞表沒和語義網(wǎng)餃絡(luò)實現(xiàn)以雞下功能:動測度情報藝源與特定摔提問的相室關(guān)性,以久便選取最棋合適的情餓報源;為鳴用戶提供晶特定情報安源的范圍權(quán)、功能和臂檢索條件蠢等人工可庸讀的信息車;自動連哄接相關(guān)情是報源;在媽一個或多費個情報源殖中自動檢慌索并自動鹽組織檢索鑄的結(jié)果。在情報源駐圖譜中,董從4個方足面對情報臺源進行標偽引:①超級敘尤詞表中的MeSH類詞表;②超級堆敘詞表軟中的主困題詞和碎副主題辜詞組配秒;③統(tǒng)幅一的醫(yī)顛學(xué)語言恢系統(tǒng)語趙義網(wǎng)絡(luò)如的語義漫類型;報④統(tǒng)一幻玉的醫(yī)學(xué)奇語言系筋統(tǒng)語義鴨網(wǎng)絡(luò)的哀語義關(guān)勉系。多元系障統(tǒng)(Meta洞morp牧hoSy川s)多元系統(tǒng)歌是統(tǒng)一的貝醫(yī)學(xué)語言樂系統(tǒng)新建雜立的一個飼可以為用賣戶提供個經(jīng)性化服務(wù)孕的系統(tǒng)。消它包含統(tǒng)寧一的醫(yī)學(xué)災(zāi)語言系統(tǒng)礦的所有版雞本??梢酝惭b一個兵或多個統(tǒng)被一的醫(yī)學(xué)弊語言系統(tǒng)循的知識資酷源。如果句用戶選擇腿統(tǒng)一的醫(yī)怕學(xué)語言系便統(tǒng)的超級建敘詞表,臟用戶可以零指定一個滅用戶化的擁超級敘詞態(tài)表的子集欄。系統(tǒng)可綿以排除不畝必要的或鎖者是本地表用戶不許早可的詞匯而,還可以亦從大量的麗數(shù)據(jù)中進宮行選擇和亂過濾。2.4.統(tǒng)一的醫(yī)必學(xué)語言系架統(tǒng)的發(fā)展高策略與開裂發(fā)原則多學(xué)科偽、多研揮究小組親協(xié)同開盲發(fā)原則集中開發(fā)悼與分散開正發(fā)相結(jié)合屋的原則資金保蕉障原則2.5.統(tǒng)一的醫(yī)茶學(xué)語言系興統(tǒng)的應(yīng)用電子數(shù)宇據(jù)處理凝系統(tǒng)管理信垮息系統(tǒng)決策支瓦持系統(tǒng)統(tǒng)一的醫(yī)室學(xué)語言系幫統(tǒng)可將分題散的情報初源集成為逢統(tǒng)一的機盡讀生物醫(yī)軍學(xué)信息資駝源,大大提許高了信息拒檢索系統(tǒng)陽的效率。瓜目前已被類廣泛應(yīng)用升于信息系疲統(tǒng)的智能劍化檢索、挖自然語言劉系統(tǒng)研究邁、專業(yè)詞搜表的編制糖、自動標可引、醫(yī)學(xué)冶專業(yè)搜索曉引擎的開柳發(fā)、醫(yī)學(xué)萍圖像的描脖述及獲取島、課程分員析等方面鞋。統(tǒng)一的蛛醫(yī)學(xué)語榆言系統(tǒng)責在電子道數(shù)據(jù)處愈理系統(tǒng)殃的應(yīng)用察主要表你現(xiàn)在電柴子病案癥系統(tǒng)。們荷蘭E蜘ras若mus窩大學(xué)控(R五ott它erd權(quán)am膽)E果rik罵M國van梨Mu較lli興gen峰計劃開犯發(fā)一個乒通過統(tǒng)茶一的醫(yī)伶學(xué)語言愧系統(tǒng)獲漏取CP掉R(T迎h(huán)e吧Cen虎ter爺Fo取rP資ubl猾ic杯Res忌our咱ces鬼)數(shù)據(jù)溪的系統(tǒng)恥。美國芬護理學(xué)砍會(忍Th盆eA鹽mer甘ica修nN錯urs竹es拍Ass胖oci曉ati辰on虛,A蓄NA謠)開它發(fā)了一蟲個基于欣統(tǒng)一的吼醫(yī)學(xué)語戴言系統(tǒng)粉的CP撈R數(shù)據(jù)毒系統(tǒng)。UML搖S地址:3.中醫(yī)藥爹學(xué)語言娃系統(tǒng)簡護介3.1.背景3.2.設(shè)計思想錫及原則3.3.組成語言系蔥統(tǒng)的建緩立是自飛然語言慚處理的穗基礎(chǔ)研科究,國牲外從20世紀90年代起低進入高斜峰研究灶期,并泊取得了亡重大的慰進展。堅美國國坐家圖書肚館建立暫的語言勵支持系午統(tǒng),為打醫(yī)學(xué)信允息數(shù)字乞化及其罩利用創(chuàng)察造了條綿件。中醫(yī)藥學(xué)舍的發(fā)展同眨樣需要語感言系統(tǒng)的沃支持,因搖此建立中敵醫(yī)藥語言尤系統(tǒng)是中錯醫(yī)藥信息磚學(xué)需要研窩究的主要賽問題之一惰。3.1儉.中醫(yī)藥語疾言系統(tǒng)背弓景中醫(yī)藥語言現(xiàn)狀(現(xiàn)代碼文獻收喘詞已超過60萬條)多樣性(宣同名異物冬)(異物謝同名)無標準化夏(缺少國蕩標)無統(tǒng)一寇機讀詞麗庫缺少系統(tǒng)挎結(jié)構(gòu)中醫(yī)藥疫學(xué)科歷欠經(jīng)千年抓,產(chǎn)生膛了大量旨的概念與術(shù)序語,多種賴語義詞即匯差異敘,阻礙幕了中醫(yī)源藥數(shù)字序化的發(fā)頭展。數(shù)據(jù)DATA知識KNOW距LEDG問E挖掘MINI訊NG百科全書喘及中英詞勸典等術(shù)語眠、名詞。中醫(yī)藥學(xué)幸科收詞:輕中醫(yī)藥學(xué)造教材、辭達典、專家軟詞典。臨床病例蜓與臨床用鹿語收詞。相關(guān)學(xué)萄科:名愿詞委與轎醫(yī)學(xué)、跡生物、鏡化學(xué)等畢相關(guān)收潤詞。古文獻收刑詞:中醫(yī)釀藥學(xué)科古撓文獻中收蟲詞。中醫(yī)藥暮及中醫(yī)趴藥相關(guān)舌的可控浪詞表。國家標準憶中的中醫(yī)坊與中藥相逮關(guān)名詞與條術(shù)語。國際醫(yī)痕學(xué)相關(guān)撫標準及屯國際專保業(yè)與中貿(mào)醫(yī)藥相令關(guān)的可弟控詞表氧。痛苦:太多同物完異名、同鋸名異物,浴無法作出棵正確判斷伸!為什么診要建立TCM籃LS?國際醫(yī)學(xué)配詞典等。3.2設(shè)計思想中醫(yī)藥緩學(xué)語言沉系統(tǒng)是燒依照中擱醫(yī)藥語搜言特點涉及學(xué)科痕體系、福按照本華體論原尋理設(shè)計蛇而研制紀的語言翁系統(tǒng),恩其目的翼是為中削醫(yī)藥學(xué)架科的數(shù)敞字化與磨標準化匠提供必泉要的工再具,解嚼決相同塔的概念域具有不柔同的表乖達方式尋,同樣噸的表達偉形式表翅示不同儀的概念波;同時堆利用本際系統(tǒng),款進一步的提示中盜醫(yī)藥學(xué)筒概念間狐的相互汽關(guān)聯(lián)。貓中醫(yī)藥蘭學(xué)一體田化語言敵系統(tǒng)是泰個繁雜爐龐大的旋系統(tǒng),并其基本立設(shè)計思茅路是借烈鑒美國盜統(tǒng)一的姑醫(yī)學(xué)語幸言系統(tǒng)到的原理優(yōu)與構(gòu)架酒,將中口醫(yī)藥學(xué)儀概念中用隱含的知各種語崇義關(guān)系慕全部提毛取出來扛,形成邊關(guān)系表搶,并以釀此為中掘心,建睜立學(xué)科次術(shù)語概心念與概偽念、概添念與名貢詞、概放念與含廉義、名教詞與名節(jié)詞之間翻的內(nèi)在僻聯(lián)系,標形成一幻玉個網(wǎng)狀為的信息私表示結(jié)修構(gòu)。方法:從礙四方面入向手研究中醫(yī)藥一體化語言中醫(yī)藥此一體化線語言系膀統(tǒng)系統(tǒng)中醫(yī)藥為知核心以中醫(yī)以藥為核道心,其堤他學(xué)科栽疊加:閉中醫(yī)藥潑信息化過程中使描用與利用報的所有相仇關(guān)的學(xué)科閑與概念、躁術(shù)語中醫(yī)藥語還言結(jié)構(gòu)體眾系一體化態(tài):建立、融入中醫(yī)藥術(shù)抖語表達方內(nèi)式一體化冠:詞條屬散性中醫(yī)藥筑概念定護義與釋臭義形式昂一體化嗽:回答桿是什揮么、關(guān)聯(lián)關(guān)系傅是什么、壤學(xué)科中的放位置是什衛(wèi)么相同概虹念詞一奸體化:訓(xùn)無論文因字、圖淡表、正曠名與異名、浴正確與討誤用海量語言川術(shù)語集成鐵為基礎(chǔ):怪制定收詞珍范圍、順微序規(guī)范化訴網(wǎng)狀結(jié)裝構(gòu)解釋持概念的看語義歸鳳類與關(guān)滅聯(lián):多水平控室制:詞匯腐、形態(tài)、煮語義、語崖用;本體論改與詮釋飼論相結(jié)捎合設(shè)計分層辯結(jié)構(gòu)與網(wǎng)張狀立體結(jié)估構(gòu);符合語言租體系,限拾定與約定軋復(fù)雜度;采用歸納外定性,將傾同類事物罵合并;參照UMLS的整體饅結(jié)構(gòu),祝保持兼爛容性與囑包容性爆;系統(tǒng)保持憐靈活性與剃可擴展性晨;Prot鍋égé程序3.2設(shè)計原則系統(tǒng)設(shè)匠計以中纖醫(yī)藥學(xué)這科為核央心,保孕持中醫(yī)醫(yī)藥學(xué)科惡的特性系統(tǒng)設(shè)計危體現(xiàn)學(xué)科犯相關(guān)性與甚包容性系統(tǒng)設(shè)計斥符合語言汽體系系統(tǒng)設(shè)嗓計采用齊語義歸臣納方法邊,將同稀類事物杏合并定烘性系統(tǒng)設(shè)計鑰參照統(tǒng)一雜的醫(yī)學(xué)語蕉言系統(tǒng)的懇結(jié)構(gòu),保伯持系統(tǒng)的際兼容性系統(tǒng)保持歌靈活性與抽可擴展性研究內(nèi)宰容:設(shè)計詞祝條屬性結(jié)狹構(gòu)總體系誰統(tǒng)設(shè)計概念詞屬性定餐義四種可控詞表的結(jié)構(gòu)比嘉較中醫(yī)藥民概念的語義類槍型設(shè)計(127種)建立中折醫(yī)藥一級分績類體系(16)中醫(yī)藥語服義的關(guān)聯(lián)關(guān)捕系(58種)事件與飾物質(zhì)二大類的布結(jié)構(gòu)展開以中醫(yī)竹五、六摩版教材的里學(xué)科分扛類為依據(jù)立體表恭達關(guān)系等級關(guān)與系相關(guān)關(guān)系秋(時間、空厲間、概念、功能謀、物理)完成概鎮(zhèn)念詞屬性設(shè)計語料庫(收詞40萬)語義關(guān)血聯(lián)關(guān)系(127萬)中醫(yī)學(xué)挺科結(jié)構(gòu)標準詞典教材臨床術(shù)語其他定義實現(xiàn)語義表達語言集悼成與規(guī)刊范建立數(shù)擁據(jù)庫做基礎(chǔ)語坡言平臺共享平攏臺檢索飼查詢應(yīng)引用工具數(shù)據(jù)挖峽掘與知塑識再現(xiàn)抬支撐條啄件數(shù)據(jù)分發(fā)移(十三家堪)Templates數(shù)據(jù)加婆工DATADATADATA合并整汗理學(xué)科分犯類語義提夫取數(shù)據(jù)查詢LogTCM墊LS平臺選取數(shù)崖?lián)?..綁.標準、懂教材、遞辭典、絲式工具書顛、臨床海術(shù)語…設(shè)計結(jié)拜構(gòu)TCM招LS的建立流緊程圖中醫(yī)藥一匹體化語言母系統(tǒng)一級公學(xué)科分類絡(luò)(16)1.中醫(yī)基礎(chǔ)理論(包括中醫(yī)生理、心理)BasicmaterialinhumanbodyinChinesemedicine2.中醫(yī)學(xué)說與相關(guān)學(xué)科(包括中醫(yī)各家學(xué)說、中醫(yī)流派、學(xué)術(shù)思想、學(xué)術(shù)觀點)RelatedcourseinChinesemedicine3.病因病機與診斷EtiologicalfactorsandpathogenesisandDiagnosis4.疾?。òㄗC候、癥狀)Chinesemedicinedisease5.治則治法Curativeprinciplesandtherapeuticmethods6.中藥學(xué)(包括藥劑學(xué)、調(diào)劑學(xué)、制劑學(xué)、制藥工藝、工程。注:此類下只包括單味藥)Chineseherbs7.方劑學(xué)(包括中成藥)Prescriptions8.中藥化學(xué)TCDchemical9.藥用動植物學(xué)(包括礦物藥、海洋藥、真菌藥等)Medicinalanimalsandplants10.預(yù)防與養(yǎng)生學(xué)(只包括古代氣功部分,不要現(xiàn)代氣功部分)Chinesemedicineprevention11.針灸學(xué)(包括腧穴學(xué)、經(jīng)絡(luò)學(xué))AcupunctureandMoxibustion12.人文科學(xué)Humanities13.醫(yī)學(xué)信息學(xué)與文獻學(xué)MedicalInformaticsandLiteratures14.自然科學(xué)、物理科學(xué)PhysicalSciencesandPhysics15.衛(wèi)生醫(yī)療機構(gòu)管理OrganizationandAdministration16.地理學(xué)Geography3.3.組成基礎(chǔ)詞腳庫系統(tǒng)語義系齡統(tǒng)基礎(chǔ)詞庫駕系統(tǒng)這個系統(tǒng)桿是整個中調(diào)醫(yī)藥學(xué)語哄言系統(tǒng)的綢核心及最莖基本的素蘆材,是在孟對現(xiàn)存各頁種主題詞叛表、分類從表、數(shù)據(jù)挪庫、工具伯書中有關(guān)排詞匯進行風分析、選去擇和組織饒的基礎(chǔ)上邪產(chǎn)生的一醬個大型詞叔庫。本系患統(tǒng)基礎(chǔ)詞控庫涵蓋可卸控詞表與晃中醫(yī)藥學(xué)允科系統(tǒng)及傻與中醫(yī)藥辰學(xué)科相關(guān)岸聯(lián)的生物百、植物、狗化工等自摩然與人文殿科學(xué)專業(yè)監(jiān)詞匯?;{礎(chǔ)詞庫建也立在全面碰、廣泛、鹿準確、嚴埋謹?shù)幕A(chǔ)獲上,最終差形成超級攤基礎(chǔ)詞庫迫。詞條屬性飾符合中醫(yī)略藥學(xué)科自奧然語言與怕可控詞的膚雙重屬性念。用準確縫、完整的艷方式揭示攻與表達中父醫(yī)藥學(xué)科粒及相關(guān)術(shù)囑語。這個壟系統(tǒng)可以濟相當于統(tǒng)腰一的醫(yī)學(xué)備語言系統(tǒng)缺的超級敘偏詞表和專識家詞典。其中超級爬敘詞表部圓分的收詞攻范圍是中寒醫(yī)藥及相被關(guān)的可控檢詞表:包轉(zhuǎn)括“中國挑中醫(yī)藥乖學(xué)主題獸詞表”袋、“醫(yī)薪學(xué)主題棒詞表(MeSH廊詞表)”、“《中國圖舊書館圖書迷分類法·醫(yī)學(xué)順專業(yè)分零類表》(第涉四版)”、“斬中醫(yī)藥臂學(xué)主題抓詞表”廚等。詞典部妹分的收蘭詞范圍披包括:安中醫(yī)藥要學(xué)教材睛、辭典變、標準矩、專家撈詞典;狹相關(guān)學(xué)聚科(包渠括醫(yī)學(xué)項、生物棚、化學(xué)看等)收劈燕詞;中嶼醫(yī)藥學(xué)蔬古代文夏獻收詞植;臨床捏病例與鞭臨床用悉語收詞幟;國家敞標準中軋的中醫(yī)娃與中藥訊相關(guān)名酷詞與術(shù)競語;百明科全書減及中英褲詞典中割的相關(guān)核術(shù)語、花名詞;冤國際醫(yī)跌學(xué)相關(guān)混標準及逢國際專型業(yè)可控攀詞表中塘相關(guān)詞屆語;國啦際醫(yī)學(xué)睡詞典等奸。詞語屬愉性:概責念為詞忙條基本領(lǐng)單位,束形成概罷念(正毅名)、調(diào)字符串猾(術(shù)語宿詞)二乏級結(jié)構(gòu)偷,分成加兩個不麻同的域簡值。不蓮?fù)g(shù)語斃表達同貼一概念顧的詞語縫要能連湊結(jié)在一摘起,形妹成二者脖的關(guān)聯(lián)堂。例如彎,“肺”頸與“霸華蓋”澆;“心仙腎不交顧”與“婆水火不睡濟”等裝同一概楚念的兩卻種表達鄰方法。賣另外,偷當同一直個術(shù)語略表示不抽同的概派念時,沫采取的買是用定否義區(qū)別獅,根據(jù)掠定義分壩類的原各則。如得,“太映陽”一卸詞,在痰中醫(yī)藥喇學(xué)里既茶可指太壯陽穴,狹又可指忌太陽經(jīng)邁。這類骨詞在中泄醫(yī)藥學(xué)允的基礎(chǔ)醒詞庫里城就根據(jù)田定義區(qū)合別并進企行分類家。語義系深統(tǒng)中醫(yī)藥腿學(xué)語言蒙系統(tǒng)綜遼合各類珍可控表愚的結(jié)構(gòu)尤特征,師以中醫(yī)山藥學(xué)科嫁及相關(guān)暑學(xué)科知騎識為主坊干,同哲時對照籃統(tǒng)一的飛醫(yī)學(xué)語肯言系統(tǒng)拘的結(jié)構(gòu)浸特點,余設(shè)計中談醫(yī)藥學(xué)挽語言系蹤蝶統(tǒng)詞表漠的結(jié)構(gòu)彈。整體悉結(jié)構(gòu)設(shè)握計原則連必須符凳合中醫(yī)某藥學(xué)結(jié)毫構(gòu)特點猴,同時閑能滿足閱現(xiàn)有中批醫(yī)藥數(shù)卡字化需著求。以錯中醫(yī)藥萬學(xué)為基忽礎(chǔ),涉沒及與其筐相關(guān)聯(lián)叢的學(xué)科表,如醫(yī)男學(xué)、生櫻物學(xué)、醬制藥工陸藝等等語義類微型:以蹤蝶
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 資格認證:國際物流師試題及答案
- 現(xiàn)代貨物運輸鏈條試題及答案
- CPSM考試臨場發(fā)揮技巧總結(jié)及試題及答案
- 體育防溺水課件
- 山東省即墨一中2025年高三3月份第一次模擬考試化學(xué)試卷含解析
- 生態(tài)系統(tǒng)的結(jié)構(gòu)層次分析試題及答案
- 2024年國際物流政策解讀試題及答案
- 適合2024年證券從業(yè)資格考試的學(xué)習曲線試題及答案
- 基因突變的影響及其機制試題及答案
- 2024年供應(yīng)鏈環(huán)境分析與應(yīng)對-試題及答案
- 2024年徐州礦務(wù)集團第二醫(yī)院高層次衛(wèi)技人才招聘筆試歷年參考題庫頻考點附帶答案
- 裝配式建筑深化設(shè)計-1.2.3 裝配式建筑深化設(shè)計拆分原47課件講解
- 淹溺安全培訓(xùn)課件
- 【MOOC】園林植物應(yīng)用設(shè)計-北京林業(yè)大學(xué) 中國大學(xué)慕課MOOC答案
- 2024年中國汽車出口與投資國別指南-泰國篇-中國汽車工業(yè)協(xié)會
- 《鐵路軌道維護》課件-小型機械打磨鋼軌作業(yè)
- 代謝相關(guān)(非酒精性)脂肪性肝病防治指南2024年版解讀
- 臨床護理實踐指南2024版
- 政府采購評審專家考試試題庫(完整版)
- 第六單元 共同面對的全球性問題 知識清單
- 教育資源共享平臺
評論
0/150
提交評論