版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第七章人工智能與自然語言檢索本章目錄第一節(jié)引言第二節(jié)人工智能技術(shù)第三節(jié)智能檢索第四節(jié)自然語言檢索第五節(jié)跨語言檢索
信息存儲(chǔ)與檢索》第一節(jié)引言人工智能技術(shù)在信息檢索領(lǐng)域的應(yīng)用,使其檢索系統(tǒng)的智能化水平得到了顯著提高。以自然語言理解技術(shù)為基礎(chǔ)的信息檢索系統(tǒng)將把信息檢索從目前基于關(guān)鍵詞層面提高到基于知識(shí)層面,對(duì)知識(shí)有一定的理解與處理能力。信息存儲(chǔ)與檢索》第二節(jié)人工智能技術(shù)7.2.1專家系統(tǒng)17.2.2數(shù)據(jù)挖掘27.2.3知識(shí)發(fā)現(xiàn)337.2.4信息抽取與知識(shí)抽取4信息存儲(chǔ)與檢索》7.2.1專家系統(tǒng)
(一)專家系統(tǒng)的特征(1)具備某個(gè)應(yīng)用領(lǐng)域的專家級(jí)知識(shí);(2)能模擬專家的思維;(3)能達(dá)到專家級(jí)的解題水平。信息存儲(chǔ)與檢索》7.2.1專家系統(tǒng)專家系統(tǒng)與傳統(tǒng)的計(jì)算機(jī)程序的區(qū)別(1)編程思想不同專家系統(tǒng)=知識(shí)庫(kù)+推理機(jī)傳統(tǒng)程序=數(shù)據(jù)+算法(2)解釋功能不同(3)求解能力不同(4)處理對(duì)象不同(5)求解問題的方式不同信息存儲(chǔ)與檢索》7.2.1專家系統(tǒng)(二)專家系統(tǒng)的工作原理專家系統(tǒng)的工作方式運(yùn)用知識(shí),進(jìn)行推理專家系統(tǒng)的組成部分知識(shí)庫(kù)推理機(jī)知識(shí)獲取人機(jī)接口數(shù)據(jù)庫(kù)解釋機(jī)構(gòu)信息存儲(chǔ)與檢索》7.2.2
數(shù)據(jù)挖掘
(一)數(shù)據(jù)挖掘的含義與標(biāo)準(zhǔn)數(shù)據(jù)挖掘是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的實(shí)際應(yīng)用數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識(shí)的過程。目前,數(shù)據(jù)挖掘的標(biāo)準(zhǔn)化包括以下三個(gè)標(biāo)準(zhǔn):CRISP-DM;PMML;OLEDBForDM。信息存儲(chǔ)與檢索》7.2.2
數(shù)據(jù)挖掘(二)數(shù)據(jù)挖掘的功能自動(dòng)預(yù)測(cè)趨勢(shì)和行為。關(guān)聯(lián)分析。聚類。概念描述偏差檢測(cè)信息存儲(chǔ)與檢索》7.2.2
數(shù)據(jù)挖掘(三)數(shù)據(jù)挖掘的主要技術(shù)決策樹法,輸出結(jié)果容易理解,實(shí)用效果好,影響也較大。神經(jīng)網(wǎng)絡(luò)法,更適合用于非線性數(shù)據(jù)和含噪聲的數(shù)據(jù),在市場(chǎng)數(shù)據(jù)分析和建模方面有廣泛的應(yīng)用。遺傳算法,適合于聚類分析,它簡(jiǎn)單而且優(yōu)化的效果好。統(tǒng)計(jì)分析方法是利用統(tǒng)計(jì)學(xué)、概率論的原理對(duì)數(shù)據(jù)庫(kù)中的信息進(jìn)行統(tǒng)計(jì)分析,從而找出它們之間的關(guān)系和規(guī)律。信息存儲(chǔ)與檢索》7.2.2
數(shù)據(jù)挖掘粗集方法,適合于不精確、不確定、不完全的信息分類和知識(shí)獲取。可視化方法,是一種輔助方法,它用比較直觀的圖形圖表方式來表現(xiàn)挖掘出來的模式,大大拓寬了數(shù)據(jù)的表達(dá)和理解力,使用戶更加了解挖掘出的數(shù)據(jù)。信息存儲(chǔ)與檢索》7.2.3知識(shí)發(fā)現(xiàn)(一)知識(shí)發(fā)現(xiàn)的定義知識(shí)發(fā)現(xiàn)是從大量數(shù)據(jù)集中辨識(shí)出有效的、新穎的、潛在有用的、并可被理解的模式的高級(jí)處理過程。信息存儲(chǔ)與檢索》7.2.3知識(shí)發(fā)現(xiàn)(二)知識(shí)發(fā)現(xiàn)的過程知識(shí)發(fā)現(xiàn)過程可以歸納為三個(gè)步驟:數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)挖掘、結(jié)果解釋和評(píng)價(jià)。信息存儲(chǔ)與檢索》7.2.3知識(shí)發(fā)現(xiàn)(三)知識(shí)發(fā)現(xiàn)平臺(tái)SPSS為用戶提供揭示客戶關(guān)系、預(yù)測(cè)客戶行為的解決方案,并把客戶關(guān)系管理和商業(yè)智能有機(jī)的結(jié)合在一起,建立與客戶之間的互動(dòng)關(guān)系。IntelligentMiner具有典型數(shù)據(jù)集自動(dòng)生成、關(guān)聯(lián)發(fā)現(xiàn)、序列規(guī)律發(fā)現(xiàn)、概念性分類和可視化顯示等功能。Clementine提供了一個(gè)可視化的快速建立模型的環(huán)境。它由數(shù)據(jù)獲取、探查、整理、建模和報(bào)告等部分組成。信息存儲(chǔ)與檢索》7.2.3知識(shí)發(fā)現(xiàn)MSMiner是一種多策略知識(shí)發(fā)現(xiàn)平臺(tái),能夠提供快捷有效的數(shù)據(jù)挖掘解決方案,提供多種知識(shí)發(fā)現(xiàn)方法。SASEnterpriseMiner通過收集分析各種統(tǒng)計(jì)資料和客戶購(gòu)買模式,幫助企業(yè)發(fā)現(xiàn)業(yè)務(wù)的趨勢(shì),解釋已知的事實(shí),預(yù)測(cè)未來的結(jié)果,并識(shí)別出完成任務(wù)所需的關(guān)鍵因素,以實(shí)現(xiàn)增加收人、降低成本的目標(biāo)。信息存儲(chǔ)與檢索》7.潔2.請(qǐng)4信息探抽取楊與知堆識(shí)抽障?。ㄒ粍t)信教息抽偵取信息舉抽取候是從典一段府文本害中抽懷取信望息,勁并將良其形政成結(jié)國(guó)構(gòu)化紗、規(guī)窗范化匯的數(shù)粥據(jù)。信息窩抽取姓和信巷息檢借索有韻本質(zhì)胖的區(qū)敗別:律信息羞檢索舌的目混的是伸根用責(zé)戶的請(qǐng)查詢皇請(qǐng)求孫從文餅檔庫(kù)難中找榨出相號(hào)關(guān)的幣文檔槽,用淋戶必伸須從柴找到版的文休檔中亂提取劫自己柏所要夏的信刺息;卸而信頑息抽極取直爬接從兼文檔納中取植出相錯(cuò)關(guān)信廢息點(diǎn)勇,不吧需要疼用戶客對(duì)文藥檔做鋒進(jìn)一頑步分旱析。透這兩寸種技旗術(shù)是狗互補(bǔ)糞的,釣若結(jié)遙合起堆來可許以為井文本差處理虜提供永強(qiáng)大療的工興具。信息母存儲(chǔ)澡與檢泳索》7.除2.屋4信息漆抽取縱與知司識(shí)抽胞?。ǘ穑┬派钕⒊殡S取技粉術(shù)的眠評(píng)測(cè)盞指標(biāo)抽全園率可據(jù)粗略丈地看洽成是臨測(cè)量煎正確攀抽取架的信尿息比匆例,皮而抽謠準(zhǔn)率荷用來或測(cè)量獸抽出廳的信疫息中怎有多凍少是麥正確民的。訂計(jì)算覆公式左如下遭:R=抽出劈燕的正畏確信脊息點(diǎn)丸數(shù)/所有關(guān)正確楚的信險(xiǎn)息點(diǎn)舉數(shù)P=抽出腿的正逼確信覽息點(diǎn)鞏數(shù)/所有波抽出傅的信捧息點(diǎn)遺數(shù)兩者琴的取可值在0和1之間斑,通堆常兩氏者是幻玉反比挺關(guān)系F值評(píng)反價(jià)方艷法:式中狀,β是一偵個(gè)預(yù)吩設(shè)值接,決們定對(duì)P側(cè)重賀還是農(nóng)對(duì)R側(cè)重爆,通鍬常設(shè)越定為1,這藏樣用F這個(gè)泊數(shù)值野就可滑反映甩系統(tǒng)柏的質(zhì)全量。信息領(lǐng)存儲(chǔ)句與檢酸索》7.造2.六4信息皆抽取貓與知可識(shí)抽賢?。ㄈぃ┲咀R(shí)抽蜘取知識(shí)衛(wèi)抽取眨是從冊(cè)現(xiàn)有密的信且息(畫尤其耐是非箱結(jié)構(gòu)雅化的拳文本查)中沖抽取虧結(jié)構(gòu)昆化的積、上眼下文孕依賴撫的知洗識(shí)的形過程專。知識(shí)男抽取布起源彈于傳珍統(tǒng)信愚息抽挨取而拳又有副別于肌信息楊抽取圾:傳常統(tǒng)的夢(mèng)信息踏抽取縫并不佛試圖總從內(nèi)六容上最全面爭(zhēng)地、厘深層霸次地喉理解俯文檔忠,而個(gè)知識(shí)膝抽取遙則建壘立在漁信息壩抽取擊的基火礎(chǔ)之膚上,擋使用星了語竹義網(wǎng)手技術(shù)駕,從步知識(shí)稠表示霉和推什理的順角度砌來實(shí)黎現(xiàn)知持識(shí)的薪自動(dòng)(半自貢動(dòng))抽取玩。信息五存儲(chǔ)如與檢潛索》7.3.1智能檢索接口17.3.2智能檢索技術(shù)27.3壤.3智能檢索怕系統(tǒng)糟與應(yīng)計(jì)用3第三命節(jié)蹤蝶智腎能檢奴索信息草存儲(chǔ)繁與檢趴索》7.介3.安1智能油檢索鬼接口智能湊檢索黑接口繁用于央完成徐智能什檢索篩系統(tǒng)追的信菜息輸吉入輸什出工霸作,法它是低系統(tǒng)躁和用羨戶交鹽流的鐮界面墊,它采能理賺解、滋分析丑用戶青的自淹然語族言提乳問,孕并產(chǎn)斑生適謊合用采戶的校結(jié)果法,還腐具有柏解釋池功能漲,對(duì)侵自己止的行橡為做吼出解柱釋。智能葬檢索畜接口珠能向浴用戶喂提供酬友好仿的界鑒面,攏完成減各種喇交互績(jī)活動(dòng)做;檢煮驗(yàn)用右戶輸徑入和裕系統(tǒng)肅輸出譜的正綁確性刃、一頑致性月;控伐制程田序流您程,吳對(duì)用版戶輸軍入作福出快筐速反陽(yáng)應(yīng)或獲者控漁制其奮它設(shè)比備正豬確有寒效地宰工作疏。信息競(jìng)存儲(chǔ)午與檢煎索》7.甩3.臘1智能麻檢索沖接口設(shè)計(jì)肝智能動(dòng)檢索索接口冰應(yīng)考狡慮的春?jiǎn)栴}9條可蠻用性薦原則人機(jī)幕對(duì)話娘簡(jiǎn)明梁、自晚然,霞用戶懲用自藏然語膏言檢勾索,編檢索躬工具落可以皇識(shí)別藝自然靠語言與并作掠出反拌饋使用虛用戶你的語心言,吐可以柏跨語雷言檢周索應(yīng)具堡備自暮學(xué)習(xí)場(chǎng)功能短,自庭動(dòng)識(shí)疼別用母戶的狐興趣普并根錦據(jù)用醫(yī)戶使竄用習(xí)舟慣自誓動(dòng)修休正、年完善店用戶閃興趣才,在張搜索畝時(shí)根飄據(jù)用緩戶興領(lǐng)趣進(jìn)鏟行優(yōu)員化排圈序,賢形成岔符合穗人性否化要野求的賤搜索哄結(jié)果來,減嚴(yán)輕用茄戶的以記憶雹負(fù)擔(dān)促進(jìn)載一致稻性的偵實(shí)現(xiàn)提供伴返回緊信息提供年清楚滴的出木口標(biāo)吩記對(duì)于愚用戶刷經(jīng)常姐使用乓的動(dòng)狠作提芬供快淹捷鍵洽,方蕉便用甲戶操鵝作提供澡有效潛的出貧錯(cuò)處涉理信后息能夠指防止無出錯(cuò)考慮娃人和貨機(jī)器童兩個(gè)圈方面涂的因繳素交叉飄樹索掩引和羞對(duì)象盈的分綢解匹期配與浪綜合信息糟存儲(chǔ)倉(cāng)與檢飯索》7.絲式3.皇2智能岔檢索水技術(shù)(一幸)自箭然語羊言處償理技演術(shù)信息番檢索伙中常孟常使嶼用到享的自壓然語廳言處鵲理技餐術(shù)包去括(1)去栗除禁摘用詞(2)分域詞(藏如農(nóng)薪作物?。?)取把詞根夫(形緣瑞如or匆g、Eu汪ro矮pe)(4)短甩語識(shí)南別(5)命脖名實(shí)葬體識(shí)脂別(6)指殿代消唉解(7)詞窮義消充歧(8)用隊(duì)?wèi)舨檠踉兊墓舷纾ǘ牵┗诟盘四畹奈ㄕZ義介智能習(xí)檢索散技術(shù)系統(tǒng)宰基于序?qū)Ω诺饶顑?nèi)躺涵的候理解機(jī)以及槍用戶籌提交蹈的關(guān)掀鍵詞向所表擱達(dá)的凍概念忘作為期搜索贊依據(jù)瘡,能純同時(shí)雜對(duì)該羨詞的恭同義追詞、翼近義宣詞、姿廣義才詞、淹狹義詞詞進(jìn)直行檢聰索。(三塊)基陷于Ag民en傍t的智昏能檢蛇索技醉術(shù)基于灣多Ag嘗en僵t的智蘿能檢維索體戴系主桂要包鐮括Us猶er白A賤ge塞nt、Sp廚id挽er收A塌ge同nt和Co頃ll帥ec棒to論r沿Ag列en密t。信息賞存儲(chǔ)小與檢挖索》7.秩3.斗3智能墳檢索飯系統(tǒng)淺與應(yīng)付用(一蛙)智言能檢疫索系鬼統(tǒng)的自組成含和功己能智能休信息均檢索球系統(tǒng)刷由知鞭識(shí)庫(kù)圓、文張本處認(rèn)理和巾智能魚接口于三部兆分組傍成。智能嬸檢索靈系統(tǒng)張一般交具有她以下園功能沒:(1)能傾理解判自然見語言攝,允慎許用喊自然坐語言坊提出俯各種政詢問懂。(2)具床有推坡理能沫力,攪能根隸據(jù)存憶儲(chǔ)的悉事實(shí)些,演洪繹出努所需第要的掀答案級(jí)。(3)系潮統(tǒng)擁批有一年定常房誠(chéng)識(shí)性繳知識(shí)載,以傲補(bǔ)充辱學(xué)科憶范圍菠的專朋業(yè)知榨識(shí)。信息丈存儲(chǔ)歇與檢鑄索》7.肚3.協(xié)3智能房誠(chéng)檢索苦系統(tǒng)民與應(yīng)帥用(二猜)幾狹種典寶型的革智能框信息階檢索草系統(tǒng)Sa爸vv撓yS須ea管rc駁h系統(tǒng)侵是一限個(gè)應(yīng)碑用了澤元搜廉索技被術(shù)的州中介雪搜索蜜系統(tǒng)洽,它禮采用爺基于商經(jīng)驗(yàn)幣學(xué)習(xí)秒的優(yōu)農(nóng)化選傳擇搜同索引牌擎方古法,山具有棒智能趣地選垮擇多蕩個(gè)遠(yuǎn)暴程搜呆索引積擎以飄及與鏡其交湖互的恭能力。Ex醫(yī)ci達(dá)te應(yīng)用靠了檢牢索詞鴉“智奴能概僚念提弊取”哭技術(shù)憂,對(duì)般用戶翼輸入致的關(guān)菊鍵字娘進(jìn)行戚擴(kuò)展。一些郵用戶畝個(gè)性徒化信蓬息檢給索系毒統(tǒng),如We惱bW刮at洋ch儀er、Sh科oP形Bo房誠(chéng)t、Fa帶b等,趁都是鵲一些他基于Ag旅en弄t的智滅能化誰的程血序,合主要碼通過哈學(xué)習(xí)覆用戶項(xiàng)的歷怕史關(guān)套聯(lián)信哄息,與在線蝕引導(dǎo)語用戶煩檢索盜感興若趣的咬信息打。信息皂存儲(chǔ)恨與檢護(hù)索》7.4漏.2基于促語法耍分析綱的自猛然語支言檢他索2第四幸節(jié)惡自含然語藝言檢畜索7.4.1自然語言理解
17.4蛾.3基于痕語義鋼分析淺的自掌然語烤言檢伐索337.4姐.4基于秧本體作的自布然語欠言檢狂索4信息冶存儲(chǔ)喚與檢提索》7.室4.門1自然護(hù)語言將理解(一暖)自揉然語窄言理灰解的肯原理自然用語言俊理解躺分為貼語音促理解竄和書構(gòu)面理棉解兩裕個(gè)方限面。語音血理解啟是指門用口揉語語箭音輸別入,范使計(jì)葛算機(jī)雅“聽栗懂”準(zhǔn)語音協(xié)信號(hào)焰,用慶文字藥或語揭音合票成輸怖出應(yīng)幕答。書面辜理解病是指?jìng)溆梦膬鲎州敵耆?,更使?jì)乘算機(jī)柜“看鏟懂”肺文字溜符號(hào)艙,也的用文煉字輸莫出應(yīng)蹄答。信息形存儲(chǔ)及與檢逗索》7.血4.核1自然截語言定理解(二亡)自秩然語條言理離解的烘層次(1)語死音學(xué)捆層次過,對(duì)游語言匯聲音己的識(shí)末別、強(qiáng)理解拼和合腸成。(2)詞滑形學(xué)腫層次恐,對(duì)左各種括詞形新和詞享的可銀識(shí)別棵部分饒的處恥理。(3)詞已匯學(xué)皂層次途,重末點(diǎn)在赴于對(duì)羅詞操?zèng)]作和熱詞匯丸系統(tǒng)望的控奇制。(4)句長(zhǎng)法層針次,甩它與認(rèn)語言星結(jié)構(gòu)沈單元掛的鑒學(xué)別有開關(guān)。(5)語炸義層在次,物對(duì)自淚然語核言文亮本意謝義的跪識(shí)別族、理驕解和讀表示。(6)語嚷用學(xué)借層次府,涉真及上糖下文判和語默言交耀際環(huán)蔬境以西及背耽景意券義和導(dǎo)聯(lián)想隸意義伏的語獄義分抹析。信息墊存儲(chǔ)存與檢悲索》7.棗4.聯(lián)1自然束語言業(yè)理解(三亡)自嚴(yán)然語散言理升解在勝信息理檢索燒中的希應(yīng)用自然酷語言綢理解潑在信額息檢叉索中忠的應(yīng)蓮用可忍以體姻現(xiàn)在嫁一個(gè)庭或多垃個(gè)語伶言處戴理層形次上伐,既釀可以醬僅應(yīng)架用于眉查詢辭,也嘆可以峽同時(shí)接應(yīng)用格于查趕詢和悠被檢荒索的貌文本蟻。由箭于語惰言的分各個(gè)灣層次挖都包灘含了只一定北的含叔義,曠能夠炎傳遞竟一定辜的信俯息,專每個(gè)碗層次運(yùn)上的帽自然夫語言給理解碰都能覽對(duì)提血高檢艘索效缺率有港一定這程度斜的幫肺助。信息眠存儲(chǔ)宅與檢拖索》7.賢4.步2基于零語法序分析吊的自縮慧然語娘言檢魄索(一在)基曾于詞猾法分證析的貫自然鳴語言熟檢索詞法黑分析顧方法蒼對(duì)文岸本、畫網(wǎng)頁(yè)伏首先威進(jìn)行偉詞語信切分撈,然非后通族過詞某頻統(tǒng)拍計(jì)和涉詞出呈現(xiàn)位振置的低判斷嬸,在短文本閣和網(wǎng)搭頁(yè)中紡提取及主題華詞和較概念劍詞,筆作為礦索引掏。同怎樣從蒸用戶浙提問洞中篩開選出戚有檢進(jìn)索意蠢義的拿一個(gè)艇或多角個(gè)詞湖單元鋒,各它個(gè)單斑元詞凝之間慨構(gòu)建暢相應(yīng)讀的邏絮輯關(guān)核系?;诳ㄔ~法慰分析女的方糟法主待要包廉括加拐權(quán)統(tǒng)移計(jì)法忍、N元法兄、統(tǒng)計(jì)井學(xué)習(xí)棒方法觸。信息件存儲(chǔ)潑與檢浪索》7.待4.正2基于嗚語法惠分析拼的自女然語訂言檢癢索(二繭)自練然語掛言檢腰索中報(bào)的句令法分予析句法固分析盼是對(duì)蹄句子輝和短專語的只結(jié)構(gòu)伏進(jìn)行桂分析跳。句芒法分貪析的跌方法明有很川多,芒有短羨語結(jié)離構(gòu)語盡法、間格語抬法、搏擴(kuò)充曾轉(zhuǎn)移惱網(wǎng)絡(luò)外和功牙能語輔法等材。句淹法處拘理,些即根光據(jù)文率字的語語法備知識(shí)目,通詳過對(duì)吹句型局結(jié)構(gòu)手的分獅析,換自動(dòng)壇抽取狗復(fù)雜器的標(biāo)月識(shí)單括元來肚代替粘由統(tǒng)蛾計(jì)方匯法得峽到的酒關(guān)鍵肅詞進(jìn)耽行標(biāo)州引。信息假存儲(chǔ)瓣與檢懇索》7.玩4.廁3基于揉語義綿分析排的自鼓然語奔言檢歉索(一泉)語晉義分呆析理蓋論語義滲分析藥理論煉涉及騙到語兼義分譽(yù)析方毒法的銀語義低關(guān)系雙類型劃和語停義關(guān)筍系的迎形式羊化表垮示等圣內(nèi)容囑。語壘義關(guān)賀系類彎型是吵指某狂種標(biāo)撐準(zhǔn)歸葡納句附子內(nèi)緩各部嬌分之馳間的折語義投關(guān)系立共性滅,語塵義關(guān)慣系的亞形式移化表傻示是章指從映各種敘句子陜的具涼體語隆義中懲抽象晃概括渠出共武同的蜂語義爭(zhēng)關(guān)系閱適用錢的符患號(hào)表挑示?,F(xiàn)有蝦的語啞義分桿析理益論主女要有呆:格龜語法皮、語配義網(wǎng)注絡(luò)、痛概念諸從屬姓理論各和框個(gè)架分頓析法碼等信息料存儲(chǔ)簽與檢占索》7.久4.痕3基于做語義當(dāng)分析展的自喉然語猶言檢綠索(二橡)自美然語述言檢如索中暴的語摧義分干析在自史然語報(bào)言檢櫻索中夸,語本義分債析是飲在詞替法分倒析和林句法唉分析抹的基魂礎(chǔ)上覽進(jìn)行歷的,窄這三跪個(gè)分鼠析步荷驟的塌組合巖方式般有語旺義解色釋方料式、亞語義仿分析志方式乘、句補(bǔ)法語勵(lì)義混素合方久式和悠語義榨驅(qū)動(dòng)嫩方式醉。詞法遭分析句法源分析語義稠分析詞法叛分析句法糞分析語義深分析詞法饞分析句法階分析語義襯分析詞法膨分析句法秧分析語義啟分析a)語走義解業(yè)釋b)語義析分析c)句法綠語義脂混合d)語義用驅(qū)動(dòng)信息長(zhǎng)存儲(chǔ)索與檢息索》7.抗4.冤4基于躲本體摩的自芬然語勞言檢洲索(一河)本爬體在裕自然罷語言縮慧檢索疊中的漢作用本體美在自搏然語肢言檢亡索系福統(tǒng)中作的作諸用體錫現(xiàn)在臭三個(gè)分方面帖:改善婆對(duì)信想息源憤的處沙理;優(yōu)化美用戶蘭界面赴;輔助信自然菠語言斥處理舉過程炸。信息喊存儲(chǔ)細(xì)與檢維索》7.膜4.某4基于村本體仰的自招然語犯言檢胳索(二波)基港于本泥體的樓自然喝語言脊檢索察實(shí)現(xiàn)肯方法基于披本體障的自靈然語育言檢彎索系秀統(tǒng)整血體上御由本譯體管養(yǎng)理模樹塊、探問題獸處理久模塊述、文葵本預(yù)付處理悶?zāi)K關(guān)、信匹息檢朋索模竊塊、慘庫(kù)文鈴件管上理模傲塊組圓成,雜實(shí)現(xiàn)攜算法移概括甜如下泊:(1)在只領(lǐng)域浴專家疊的幫巖助下爹,建字立相稀關(guān)領(lǐng)鉆域的臉本體中。(2)收途集信管息源檔中的騰數(shù)據(jù)肅,并拾參照獸已建惠立的唇本體朋,把參收集務(wù)來的陷數(shù)據(jù)我按規(guī)蓬定的偵格式撞存儲(chǔ)盤在元材數(shù)據(jù)補(bǔ)庫(kù)中壇。(3)按冠照本瓜體把錫查詢猛請(qǐng)求燭轉(zhuǎn)換坦成規(guī)濾定的咽格式蓋,從遵元數(shù)伙據(jù)庫(kù)繡中匹令配出斜符合思條件弓的數(shù)攤據(jù)集聲合。(4)檢肺索的笨結(jié)果已經(jīng)過苦定制時(shí)處理技后,娃返回恩給用盲戶。信息蜻存儲(chǔ)傲與檢村索》7.5勾.2跨語言暴檢索講中的嫂語言控資源27.5.1跨語言檢索實(shí)現(xiàn)模式17.5保.3跨語誓言檢賽索的堵關(guān)鍵征技術(shù)337.5鞏.4提問延式翻汪譯的姐幾種挑方法4第五像節(jié)激跨坦語言鑄檢索信息顛存儲(chǔ)創(chuàng)與檢妻索》7.文5.圓1跨語添言檢肺索實(shí)耍現(xiàn)模莊式(一沫)提紡問式衣翻譯辱方法在信濱息檢爪索之遠(yuǎn)前,將提偽問式箭的語宅種轉(zhuǎn)擔(dān)化翻煙譯成帆所要費(fèi)檢索請(qǐng)信息從的信行息語貪種。(二菌)文嚷獻(xiàn)翻擋譯方呢法不對(duì)罵提問惱式進(jìn)火行翻巾譯,朝而是穗把數(shù)聰據(jù)庫(kù)翅中用瘋目標(biāo)茅語言宣描述名的文勾獻(xiàn)翻瞞譯成凡與提藥問描赴述相民一致稍的源份語言助形式(三勵(lì))提炎問式—文獻(xiàn)逢翻譯禍方法首先弦將源險(xiǎn)語言垂提問饅式翻董譯成葉目標(biāo)貓語言皺提問須式,亞然后嶺與目貢標(biāo)語袖言描邊述的測(cè)信息遣庫(kù)進(jìn)犧行匹遼配,木再把難檢索梯結(jié)果使的全樹部或某部分遞翻譯扶成源欠語言驕描述手的信蚊息。信息闊存儲(chǔ)跨與檢藍(lán)索》7.劫5.亞1跨語月言檢仗索實(shí)蹈現(xiàn)模烏式(四績(jī))中財(cái)間翻輕譯方踏法將源賣語言茂翻譯晨成中綢間語逮言(計(jì)可以墻是一味種或湊多種基),嗚然后論再將遼中間僚語言毛翻譯站成目?jī)x標(biāo)語趕言(乖利用喇多種視中間雁語言驕時(shí)需燙要合岸并)欣。(五即)不只翻譯蚊方法不需盾要詞祝典、閥詞表選和機(jī)唇器翻翼譯系亭統(tǒng),也不籌存在辜翻譯抵過程糕中消生除歧貨義問眠題,具有箭很高向的靈討活性盆和適免應(yīng)性信息盆存儲(chǔ)動(dòng)與檢理索》7.擾5.攤1跨語畫言檢迷索實(shí)跪現(xiàn)模固式(六?。p有名捉詞音值譯法音譯麥方法舌根據(jù)旺處理刊的方膛向可戒以區(qū)快分成桐正向脫音譯佛與反兇向音燭譯。(七襲)基超于本愁體的束轉(zhuǎn)換擠方法基于罰本體伏的模抖型主軋要分隨為三擱個(gè)部帶分:異基于模字典照的翻勉譯模峽塊、皮
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 不動(dòng)產(chǎn)抵押協(xié)議標(biāo)準(zhǔn)格式2024年版
- 寧波2025年浙江寧波高新區(qū)衛(wèi)生系統(tǒng)招聘高層次人才5人筆試歷年典型考點(diǎn)(頻考版試卷)附帶答案詳解
- 專用消防施工現(xiàn)場(chǎng)合作合同(2024年版)版
- 2025至2030年中國(guó)女裝裙數(shù)據(jù)監(jiān)測(cè)研究報(bào)告
- 2025至2030年中國(guó)沖擊式反轉(zhuǎn)氣動(dòng)螺絲批數(shù)據(jù)監(jiān)測(cè)研究報(bào)告
- 2025至2030年中國(guó)上通道上進(jìn)風(fēng)燃燒器數(shù)據(jù)監(jiān)測(cè)研究報(bào)告
- 2025年中國(guó)防靜電手腕帶檢測(cè)儀市場(chǎng)調(diào)查研究報(bào)告
- 2025年中國(guó)橡膠擠出條市場(chǎng)調(diào)查研究報(bào)告
- 2025年中國(guó)工業(yè)網(wǎng)筘市場(chǎng)調(diào)查研究報(bào)告
- 2025年中國(guó)叉車整機(jī)市場(chǎng)調(diào)查研究報(bào)告
- 2024屆九省聯(lián)考英語試題(含答案解析、MP3及錄音稿)
- 倉(cāng)庫(kù)消防知識(shí)安全培訓(xùn)
- 從事專業(yè)與所學(xué)專業(yè)不一致專業(yè)技術(shù)人員申報(bào)職稱崗位任職合格證明附件6
- 我國(guó)房屋建筑模板技術(shù)的研究綜述
- 人教版小學(xué)三年級(jí)上冊(cè)數(shù)學(xué)豎式筆算練習(xí)題
- 航天科工集團(tuán)在線測(cè)評(píng)題
- 山東省濰坊新2025屆高三語文第一學(xué)期期末經(jīng)典試題含解析
- (新版)吉林一級(jí)健康管理師高頻核心題庫(kù)300題(含答案)
- JT-T-1344-2020純電動(dòng)汽車維護(hù)、檢測(cè)、診斷技術(shù)規(guī)范
- 2024年湖北省武漢市中考語文試卷真題(含答案)
- 天津市八校2023-2024學(xué)年高三年級(jí)下冊(cè)聯(lián)合模擬考試數(shù)學(xué)試題(二)(含答案解析)
評(píng)論
0/150
提交評(píng)論