自然語(yǔ)言處理課件_第1頁(yè)
自然語(yǔ)言處理課件_第2頁(yè)
自然語(yǔ)言處理課件_第3頁(yè)
自然語(yǔ)言處理課件_第4頁(yè)
自然語(yǔ)言處理課件_第5頁(yè)
已閱讀5頁(yè),還剩48頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、前 言目錄7.1 自然語(yǔ)言處理應(yīng)用場(chǎng)景7.2 自然語(yǔ)言處理基本功能模塊7.3 文本處理7.4 機(jī)器翻譯7.5 應(yīng)用案例7.1 自然語(yǔ)言處理應(yīng)用場(chǎng)景 先通過(guò)一個(gè)案例說(shuō)明自然語(yǔ)言處理中常用的術(shù)語(yǔ)及其代表的知識(shí)平面。 由下圖可以看出,自然語(yǔ)言處理系統(tǒng)首先把指令“刪除文件B”在音位學(xué)平面轉(zhuǎn)化成序列“shan chu # wenjian # bi”;然后在形態(tài)學(xué)平面把這個(gè)音位序列轉(zhuǎn)化為語(yǔ)素序列“刪除”,“文件”,“B”;接著在詞匯平面把這個(gè)語(yǔ)素序列轉(zhuǎn)化為字詞序列并標(biāo)注出相應(yīng)的詞性:(刪除,VERB),(“文件”,NOUN)(“B”,ID);在句法學(xué)平面進(jìn)行句法分析,得到這個(gè)單詞序列的句法結(jié)構(gòu),用樹(shù)形圖表

2、示;在語(yǔ)義學(xué)平面得到這個(gè)句法結(jié)構(gòu)的語(yǔ)義解釋:刪除文件(“B”);在語(yǔ)用學(xué)平面得到這個(gè)指令的語(yǔ)用解釋“rm-i B”,此處用的是UNIX系統(tǒng)的指令符號(hào)和書(shū)寫(xiě)規(guī)范,最后計(jì)算機(jī)執(zhí)行這個(gè)命令。自然語(yǔ)言處理過(guò)程7.2 自然語(yǔ)言處理基本功能模塊7.2.1 詞匯自動(dòng)處理詞匯是語(yǔ)言的建筑材料,是語(yǔ)言描述的中心。漢語(yǔ)詞匯的自動(dòng)處理主要分為文本的自動(dòng)分詞和自動(dòng)標(biāo)注。先看兩個(gè)文檔:文檔1:學(xué)校有關(guān)于人工智能的書(shū)籍,學(xué)校開(kāi)設(shè)人工智能課程。文檔2:學(xué)校推動(dòng)教學(xué)改革,推動(dòng)人工智能課程改革。然后對(duì)文檔1、文檔2進(jìn)行如下分詞:文檔1:學(xué)校|有|關(guān)于|人工智能|的|書(shū)籍,|學(xué)校|開(kāi)設(shè)|人工智能|課程。文檔2:學(xué)校|推動(dòng)|教學(xué)|

3、改革|,推動(dòng)|人工智能|課程|改革。上述分詞其實(shí)是我們根據(jù)自己民族語(yǔ)言習(xí)慣人工進(jìn)行的分詞,人工智能要解決的是機(jī)器怎樣進(jìn)行中文分詞。工程上,已經(jīng)解決了機(jī)器怎樣進(jìn)行中文分詞。怎樣解決的呢?以文檔2為例,增加文檔2的另一種分詞結(jié)果,和上述文檔2的分詞羅列如下:文檔2:學(xué)校|推動(dòng)|教學(xué)|改革|,推動(dòng)|人工智能|課程|改革。 A1 A2 A3 A4 A5 A6 A7 A8學(xué)校|推動(dòng)|教學(xué)改革|,推動(dòng)|人工|智能|課程改革。 B1 B2 B3 B4 B5 B6 B7 下面會(huì)構(gòu)建語(yǔ)料庫(kù),機(jī)器能根據(jù)語(yǔ)料庫(kù)自動(dòng)計(jì)算上面兩種不同分詞方式各自出現(xiàn)的概率,哪個(gè)概率大就使用哪個(gè)分詞方式。 人工智能應(yīng)用中,通常將現(xiàn)代漢語(yǔ)

4、分為15類(lèi):名詞、時(shí)間詞、方位詞、數(shù)詞、量詞、代詞、區(qū)別詞、動(dòng)詞、趨向動(dòng)詞、能愿動(dòng)詞、形容詞、副詞、介詞、連詞、助詞。 自動(dòng)詞類(lèi)標(biāo)注的關(guān)鍵是排除兼類(lèi)詞歧義,所謂兼類(lèi)詞也就是詞類(lèi)的歧義,這是漢語(yǔ)自動(dòng)處理的難點(diǎn)之一。 試比較:我在北京上學(xué)(“在”為介詞,“上”為動(dòng)詞) 我在床上(“在”為動(dòng)詞,“上”為方位詞) 上面的例子中,“在”為“動(dòng)-介”兼類(lèi),“上”為“方位-動(dòng)”兼類(lèi)。漢語(yǔ)中往往越是常用的詞,不同的用法就越多,兼類(lèi)現(xiàn)象也就越多。7.2.2 句法自動(dòng)處理 就漢語(yǔ)文本來(lái)說(shuō),經(jīng)過(guò)詞匯自動(dòng)處理,每個(gè)詞都從連續(xù)的漢字流中被切分出來(lái),詞與詞之間出現(xiàn)了空白,并且都被標(biāo)注了供機(jī)器處理的各種信息。然而,經(jīng)過(guò)詞匯

5、自動(dòng)處理之后,句子中詞與詞之間的詞法關(guān)系,句子中詞組與詞組之間的結(jié)構(gòu)關(guān)系,仍然是不清楚的,需要進(jìn)一步處理,這就是句法自動(dòng)處理。 下面通過(guò)一個(gè)簡(jiǎn)單的喬姆斯基形式語(yǔ)法類(lèi)型G演示計(jì)算機(jī)自動(dòng)識(shí)別句子的各個(gè)句法單位以及他們之間的相互關(guān)系的過(guò)程,這個(gè)過(guò)程英文為parsing,可譯為自動(dòng)句法分析,設(shè)語(yǔ)法類(lèi)型G為: 先予以說(shuō)明:S是初識(shí)符號(hào),它屬于集合VN,集合VN中的符號(hào)是用來(lái)描述語(yǔ)法的,可將NP、VP、V依次解釋為名詞短語(yǔ)、動(dòng)詞短語(yǔ)、動(dòng)詞。VT是該語(yǔ)言中的詞匯,是終極符號(hào)。 P叫做重寫(xiě)規(guī)則,共有(i)(v)五條,箭頭左邊的符號(hào)簡(jiǎn)稱為規(guī)則左邊,右邊的符號(hào)簡(jiǎn)稱為規(guī)則右邊,VN,VT,S,P四元組定義了語(yǔ)法G=

6、(VN,VT,S,P)。我們用該語(yǔ)法G分析句子“熊貓吃竹葉”。首先,從初始狀態(tài)S開(kāi)始,寫(xiě)出句子“熊貓吃竹葉”的推導(dǎo)過(guò)程:推導(dǎo)過(guò)程 所用規(guī)則S 開(kāi)始NPVP (i)NPVNP(ii)熊貓VNP(iv)熊貓吃NP(v)熊貓吃竹葉(iv)上述推導(dǎo)過(guò)程,也就是句子的生成過(guò)程,可用下圖的句法樹(shù)形圖表示:句法樹(shù)形圖 其次,我們采用自低向上剖析(buttom-up parsing)方法剖析句子“熊貓吃竹葉”,將句子切分為如下形式: 熊貓|吃|竹葉 根據(jù)重寫(xiě)規(guī)則(iv),可得如下剖析圖 熊貓|吃|竹葉 NP_ 然后,剖析符號(hào)串“NP|吃|竹葉”,先檢查語(yǔ)法G中有沒(méi)有右部為NP的重寫(xiě)規(guī)則,檢查結(jié)果是沒(méi)有。再檢查

7、符號(hào)串“NP|吃|竹葉”中的第二個(gè)詞“吃”,根據(jù)規(guī)則(V)可得如下剖析圖 熊貓|吃|竹葉 NP_ V_ 剖析過(guò)程中,要在語(yǔ)法G容許的范圍內(nèi),盡量把符號(hào)串的語(yǔ)法符號(hào)NP,V等組合起來(lái)。先檢查語(yǔ)法G中有沒(méi)有右部為NP的重寫(xiě)規(guī)則,檢查結(jié)果是沒(méi)有,再檢查語(yǔ)法G中有沒(méi)有把NP和V組合起來(lái)的重寫(xiě)規(guī)則,檢查結(jié)果也是沒(méi)有。隨后檢查符號(hào)串“NP|V|竹葉”中的第二項(xiàng)V,根據(jù)規(guī)則(iii),可得如下剖析圖 熊貓|吃|竹葉 NP_ V_ VP_ 繼續(xù)剖析,此時(shí)語(yǔ)法G中重寫(xiě)規(guī)則(i)的右邊為符號(hào)串NP VP,重寫(xiě)規(guī)則(iv)的右邊為“竹葉”,此處該應(yīng)用重寫(xiě)規(guī)則(i)呢還是(iv)呢?經(jīng)過(guò)試驗(yàn),該應(yīng)用重寫(xiě)規(guī)則(iv),

8、可得如下剖析圖: 熊貓|吃|竹葉 NP_ V_ NP_ VP_ 繼續(xù)剖析,可以發(fā)現(xiàn)支配V的這個(gè)VP語(yǔ)法符號(hào)不能引導(dǎo)我們找到成功的途徑,需要去掉VP,這叫做采用“回溯”(backtracking)的方法,可得如下剖析圖: 熊貓|吃|竹葉 NP_ V_ NP_ 應(yīng)用重寫(xiě)規(guī)則(ii),可得如下剖析圖:熊貓|吃|竹葉 NP_ V_ NP_ _VP_ 再應(yīng)用重寫(xiě)規(guī)則(i),可得如下剖析圖: 熊貓|吃|竹葉 NP_ V_ NP_ _VP_ S S的跨度從句首開(kāi)始,到句末結(jié)束,覆蓋了整個(gè)句子,因此句子剖析成功。7.2.3 語(yǔ)義自動(dòng)處理 語(yǔ)義分析是自然語(yǔ)言處理的最基礎(chǔ)的功能模塊,本小節(jié)只簡(jiǎn)要介紹義素分析法、語(yǔ)

9、義網(wǎng)絡(luò)的形式模型 1.義素分析法 義素是意義的基本要素,也是詞的意義的區(qū)別特征,或者說(shuō),詞的意義是一些語(yǔ)義特征(即義素)的總和,例如,“哥哥”的意思是+人 +親屬 +同胞 +年長(zhǎng) +男性等義素的總和,“妹妹”的意思是+人 +親屬 +同胞 -年長(zhǎng) -男性等義素的總和。“+”表示肯定,“-”表示否定,這樣-男性就是+女性。一組詞的義素可以用義素矩陣來(lái)表示,漢語(yǔ)中表同胞的親屬詞的義素矩陣如表 所示 可見(jiàn),義素矩陣反映了相應(yīng)親屬詞的基本語(yǔ)義特征,義素分析法是語(yǔ)義形式化描述的一種好辦法。2.語(yǔ)義網(wǎng)絡(luò) 語(yǔ)義網(wǎng)絡(luò)可以較好的描述人類(lèi)的聯(lián)想記憶,可用有向圖表示,該有向圖由三元組(結(jié)點(diǎn)1,弧,結(jié)點(diǎn)2)連接而成的,

10、如圖所示,可將該三元組視為構(gòu)圖的積木。語(yǔ)義網(wǎng)絡(luò)三元組的表示法 結(jié)點(diǎn)表示概念,弧是有方向、有標(biāo)記的,弧的方向體現(xiàn)了結(jié)點(diǎn)1為主,結(jié)點(diǎn)2為輔,弧上的標(biāo)記表示結(jié)點(diǎn)1的屬性或結(jié)點(diǎn)1與結(jié)點(diǎn)2之間的關(guān)系。從邏輯表示的方法來(lái)看,語(yǔ)義網(wǎng)絡(luò)中的一個(gè)三元組相當(dāng)于一個(gè)二元謂詞,語(yǔ)義網(wǎng)絡(luò)內(nèi)各個(gè)概念之間的關(guān)系,主要由ISA,PART-OF,IS等謂詞來(lái)表示。這樣命題“墻上有黑板”,可以表示為下圖PART-OF關(guān)系 當(dāng)用語(yǔ)言網(wǎng)絡(luò)來(lái)表述事件時(shí),語(yǔ)義網(wǎng)絡(luò)中結(jié)點(diǎn)之間的關(guān)系,還可以是施事(AGENT)、受事(PATIENT)、位置(LOCATION)等。例如,“張忠老師幫助王林同學(xué)”這一事件可以表示為圖事件的語(yǔ)義網(wǎng)絡(luò)7.3 文本處

11、理7.3.1 文本特征1. 詞袋模型 詞袋模型是一種常用的提取文本特征的數(shù)學(xué)模型,它將一篇文檔看作是一個(gè)裝有若干詞語(yǔ)的袋子,這樣就僅考慮了詞語(yǔ)在文檔中出現(xiàn)的次數(shù),而忽略了詞語(yǔ)的順序以及句子的結(jié)構(gòu),這種簡(jiǎn)化是建模所必要的,事實(shí)證明也很有效。例如: 文檔1:學(xué)校有關(guān)于人工智能的書(shū)籍,學(xué)校開(kāi)設(shè)人工智能課程。 依照漢語(yǔ)理解習(xí)慣,我們將文檔1拆分成詞語(yǔ)并標(biāo)記詞語(yǔ)出現(xiàn)的次數(shù),這樣形成的集合: (學(xué)校:2),(有:1),(關(guān)于:1),(人工智能:2),(的:1),(書(shū)籍:1),(開(kāi)設(shè):1),(課程:1) 就是文檔1對(duì)應(yīng)的“詞袋”(bag-of-word) 詞袋模型對(duì)文檔1進(jìn)行了很大的簡(jiǎn)化,但仍保留了文檔1的

12、關(guān)鍵信息,我們通過(guò)“人工智能”、“書(shū)籍”、“課程”等詞語(yǔ)仍然可以知道文檔1與學(xué)習(xí)人工智能有關(guān),這正是詞袋模型的用處。例 7.1 寫(xiě)出文檔2對(duì)應(yīng)的詞袋。文檔2:學(xué)校推動(dòng)教學(xué)改革,推動(dòng)人工智能課程改革。 解: (學(xué)校:1),(推動(dòng):2),(教學(xué):1),(改革:2),(人工智能:1),(課程:1) 文本處理包含像期刊、微信、網(wǎng)頁(yè)等許多不同種類(lèi),實(shí)際應(yīng)用中,通常將要處理的文本收集一起做成語(yǔ)料庫(kù),然后提取語(yǔ)料庫(kù)中所有出現(xiàn)的詞語(yǔ),并形成一個(gè)詞典。例如增加文檔3。 文檔3:國(guó)家推動(dòng)人工智能產(chǎn)業(yè)發(fā)展。 構(gòu)建一個(gè)包含三篇文檔的語(yǔ)料庫(kù): 文檔1:學(xué)校有關(guān)于人工智能的書(shū)籍,學(xué)校開(kāi)設(shè)人工智能課程。 文檔2:學(xué)校推動(dòng)教

13、學(xué)改革,推動(dòng)人工智能課程改革。 文檔3:國(guó)家推動(dòng)人工智能產(chǎn)業(yè)發(fā)展。 根據(jù)語(yǔ)料庫(kù)提取所有出現(xiàn)過(guò)的詞語(yǔ)形成詞典: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 學(xué)校 有 關(guān)于 人工智能 的 書(shū)籍 開(kāi)設(shè) 課程 推動(dòng) 教學(xué) 改革 國(guó)家 產(chǎn)業(yè) 發(fā)展 “的”、“了”、“也”等這類(lèi)不攜帶任何主題信息的高頻詞稱為停止詞,構(gòu)建詞典時(shí)我們通常不會(huì)去除停止詞。統(tǒng)計(jì)每篇文檔中每個(gè)詞語(yǔ)出現(xiàn)的次數(shù),如表上述統(tǒng)計(jì)結(jié)果即是三篇文檔的詞計(jì)數(shù)向量文檔1:(2,1,1,2,1,1,1,1,0,0,0,0,0,0)文檔2:(1,0,0,1,0,0,0,1,2,2,1,0,0,0)文檔3:(0,0,0,1,0,0,

14、0,0,1,0,0,1,1,1)語(yǔ)料庫(kù)詞典統(tǒng)一了各文檔詞計(jì)數(shù)向量的維數(shù)。3.詞頻率與逆文檔頻率(tf-idf) 前面已經(jīng)計(jì)算出了一篇文檔的詞頻率tf(term frequency)。詞頻率越大,這個(gè)詞語(yǔ)在這篇文檔中出現(xiàn)的次數(shù)就越多,這個(gè)詞語(yǔ)對(duì)這篇文檔的重要性就越大,信息檢索中,就是要在大量文檔形成的語(yǔ)料庫(kù)中,查找出那些對(duì)關(guān)鍵詞語(yǔ)重要的文檔,詞頻率tf只包含詞語(yǔ)的信息,未包含語(yǔ)料庫(kù)的信息,這個(gè)包含語(yǔ)料庫(kù)信息的指標(biāo)叫逆文檔頻率idf(inverse document frequency)。 假定語(yǔ)料庫(kù)中總共有D篇文檔,語(yǔ)料庫(kù)形成的詞典中第i個(gè)詞語(yǔ)在某篇文檔中出現(xiàn)過(guò),計(jì)數(shù)一次,假設(shè)共有Di篇文檔出現(xiàn)

15、了第i個(gè)詞語(yǔ),那么第i個(gè)詞語(yǔ)的文檔頻率即為dfi=Di/D,這個(gè)詞語(yǔ)的逆文檔頻率為文檔頻率的負(fù)對(duì)數(shù),即idfi=-logDi/D,由于DiD,負(fù)號(hào)保證了idf大于等于0。4.文檔特征 將一個(gè)詞語(yǔ)在某篇文檔中的詞頻率tf與該詞語(yǔ)的逆文檔頻率(idf)相乘,就是該詞語(yǔ)在這篇文檔中的詞頻率-逆文檔頻率(tf-idf),詞頻率-逆文檔頻率是對(duì)詞頻率的一種修正。 一篇文檔,將該文檔的詞頻向量中的頻率值修正為詞頻率-逆文檔頻率,得到這篇文檔的詞頻率-逆文檔頻率向量,它就是文檔的特征。 兩個(gè)向量夾角的余弦值按公式(7.1)計(jì)算,對(duì)兩個(gè)tf-idf文檔向量而言,由tf-idf0,所以余弦值介于0到1之間。從三

16、角形的基本原理可知,如果兩個(gè)向量夾角的余弦值越大,那這兩個(gè)向量代表的文檔就越相似。0度角的余弦值是1,代表文檔是相同的或者非常相似。文檔如果表現(xiàn)為正交向量,其值則接近于0。7.4 機(jī)器翻譯 語(yǔ)言是有限手段的無(wú)限運(yùn)用,人們使用和理解的句子范圍都是無(wú)限的。機(jī)器翻譯的實(shí)質(zhì),就是把源語(yǔ)言中無(wú)限數(shù)量的句子,通過(guò)有限的規(guī)則,自動(dòng)轉(zhuǎn)換為目標(biāo)語(yǔ)言中無(wú)限數(shù)目的句子。喬姆斯基說(shuō):一個(gè)人的語(yǔ)言知識(shí)是以某種方式體現(xiàn)在人腦這個(gè)有限的機(jī)體之中的,因此,語(yǔ)言知識(shí)就是一個(gè)由某種規(guī)則和原則構(gòu)成的有限系統(tǒng)。但是一個(gè)會(huì)說(shuō)話的人卻能講出并理解他從未聽(tīng)到過(guò)的句子,而且這種能力是無(wú)限的,人們使用和理解的句子范圍都是無(wú)限的。7.4.1 基

17、于規(guī)則的機(jī)器翻譯 基于規(guī)則的機(jī)器翻譯,采用規(guī)則型語(yǔ)言模型,它以生成語(yǔ)言學(xué)為基礎(chǔ),人工編制語(yǔ)言規(guī)則,這些語(yǔ)言規(guī)則主要來(lái)自語(yǔ)言學(xué)家掌握的語(yǔ)言學(xué)知識(shí),難免有主觀性和片面性。 一個(gè)完整的機(jī)器翻譯過(guò)程可以分為如下六個(gè)步驟: 源語(yǔ)言詞法分析; 源語(yǔ)言句法分析; 源語(yǔ)言目標(biāo)語(yǔ)言詞匯轉(zhuǎn)換; 源語(yǔ)言目標(biāo)語(yǔ)言結(jié)構(gòu)轉(zhuǎn)換; 目標(biāo)語(yǔ)言句法生成; 目標(biāo)語(yǔ)言詞法生成。機(jī)器翻譯金字塔 可以看出,這個(gè)機(jī)器翻譯金字塔的左側(cè)是源語(yǔ)言的分析,右側(cè)是目標(biāo)語(yǔ)言的生成,中間是源語(yǔ)言到目標(biāo)語(yǔ)言的轉(zhuǎn)換。源語(yǔ)言的分析獨(dú)立于目標(biāo)語(yǔ)言的生成,只是在轉(zhuǎn)換部分才同時(shí)涉及源語(yǔ)言和目標(biāo)語(yǔ)言,這種“獨(dú)立分析-獨(dú)立生成-相關(guān)轉(zhuǎn)換”的思想,成為了基于規(guī)則的機(jī)器翻

18、譯的原則。7.4.2 基于統(tǒng)計(jì)的機(jī)器翻譯 基于統(tǒng)計(jì)的機(jī)器翻譯,采用統(tǒng)計(jì)語(yǔ)言模型,以分析大規(guī)模語(yǔ)料庫(kù)為基礎(chǔ),計(jì)算機(jī)利用模型中的概率參數(shù),可以估計(jì)出自然語(yǔ)言中語(yǔ)言成分出現(xiàn)的可能性,相對(duì)客觀和全面。 基于統(tǒng)計(jì)的機(jī)器翻譯,把機(jī)器翻譯問(wèn)題看成是一個(gè)噪聲信道問(wèn)題: 可以這樣來(lái)看機(jī)器翻譯:一種語(yǔ)言T由于經(jīng)過(guò)了一個(gè)噪聲信道而發(fā)生了扭曲變形,在信道的另一端呈現(xiàn)出另一種語(yǔ)言S。語(yǔ)言T是信道意義上的輸入,在翻譯意義上就是目標(biāo)語(yǔ)言,語(yǔ)言S是信道意義上的輸出,在翻譯意義上就是源語(yǔ)言。從這種觀點(diǎn)來(lái)看,一種語(yǔ)言中的任何一個(gè)句子都有可能是另外一種語(yǔ)言中的某幾個(gè)句子的譯文,只是這些句子的可能性各不相同,機(jī)器翻譯就是要找出其中可

19、能性最大的句子,也就是對(duì)所有可能目標(biāo)語(yǔ)言T計(jì)算出概率最大的一個(gè)作為源語(yǔ)言S的譯文。7.4.3 神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯 神經(jīng)語(yǔ)言模型NLM(neural language model)使用詞的分布式表示對(duì)自然語(yǔ)言序列建模,將每個(gè)詞予以編碼,識(shí)別兩個(gè)相似的詞,共享一個(gè)詞(及其上下文)和其他類(lèi)似詞(和上下文之間)的統(tǒng)計(jì)強(qiáng)度。統(tǒng)計(jì)語(yǔ)言模型為每個(gè)詞學(xué)習(xí)的分布式表示,允許模型處理具有類(lèi)似共同特征的詞來(lái)實(shí)現(xiàn)這種共享。例如,假設(shè)詞“狗”和“貓”映射到具有許多屬性的表示,則包含詞“貓”的句子可以告知模型對(duì)包含詞“狗”的句子做出預(yù)測(cè),反之亦然。這些詞表示有時(shí)稱為詞嵌入,這樣在嵌入空間中,具有相似含義的詞彼此鄰近。機(jī)器翻

20、譯的編碼器-解碼器框架的總體思想 神經(jīng)機(jī)器翻譯系統(tǒng)使用神經(jīng)語(yǔ)言模型。首先使用RNN模型(也可以是CNN)讀取輸入序列并產(chǎn)生概括輸入序列的數(shù)據(jù)結(jié)構(gòu),簡(jiǎn)稱這個(gè)概括為“上下文”C,上下文C可以是向量或者張量,如圖7-10中的“中間的語(yǔ)義表示”。然后利用另外一個(gè)RNN模型讀取上下文C并且生成目標(biāo)語(yǔ)言的句子。7.5 科大訊飛翻譯機(jī)2.0 訊飛翻譯機(jī)2.0是科大訊飛于2018年4月20日推出的新一代人工智能翻譯產(chǎn)品,如圖7-26所示。訊飛翻譯機(jī)2.0,145.5mm*52.5mm*13.4mm比較小巧,重量?jī)H有120g隨身攜帶非常方便。金屬的外殼使得其在耐用性上也有不錯(cuò)的表現(xiàn)。后置一顆1300萬(wàn)像素?cái)z像頭,專門(mén)用來(lái)進(jìn)行拍攝翻譯使用。攝像頭的下方是一顆“SOS”緊急呼救按鈕。 訊飛翻譯機(jī)2.0采用語(yǔ)音識(shí)別技術(shù)、自然語(yǔ)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論