專利文獻(xiàn)日英機(jī)器翻譯的質(zhì)量改進(jìn)措施_第1頁(yè)
專利文獻(xiàn)日英機(jī)器翻譯的質(zhì)量改進(jìn)措施_第2頁(yè)
專利文獻(xiàn)日英機(jī)器翻譯的質(zhì)量改進(jìn)措施_第3頁(yè)
專利文獻(xiàn)日英機(jī)器翻譯的質(zhì)量改進(jìn)措施_第4頁(yè)
專利文獻(xiàn)日英機(jī)器翻譯的質(zhì)量改進(jìn)措施_第5頁(yè)
已閱讀5頁(yè),還剩8頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

12三月2024專利文獻(xiàn)日英機(jī)器翻譯的質(zhì)量改進(jìn)措施前言(JapanPatentInformationOrganization,日本特許情報(bào)機(jī)構(gòu))致力于各種專利文獻(xiàn)翻譯任務(wù)(日-英,英-日)。雖然翻譯仍需由人工完成,但機(jī)器翻譯的采用正成為提高翻譯效率不可或缺的手段。

有效提高專利文獻(xiàn)機(jī)器翻譯質(zhì)量措施的研究專利文獻(xiàn)日英機(jī)器翻譯的質(zhì)量改進(jìn)措施Japio的質(zhì)量改進(jìn)措施Japio并不開(kāi)發(fā)機(jī)器翻譯引擎。Japio在不改動(dòng)機(jī)器翻譯引擎的情況下采用下面兩種措施提高機(jī)器翻譯的質(zhì)量:1.專利文獻(xiàn)翻譯的技術(shù)術(shù)語(yǔ)庫(kù)2.專利源文檔的預(yù)編輯處理專利文獻(xiàn)日英機(jī)器翻譯的質(zhì)量改進(jìn)措施專利技術(shù)術(shù)語(yǔ)庫(kù)為了描述新的發(fā)明,新的技術(shù)術(shù)語(yǔ)不斷被引入到專利文獻(xiàn)中。商業(yè)的機(jī)器翻譯詞典基本上是靜態(tài)的。

↓Japio基于真實(shí)的專利文獻(xiàn)創(chuàng)建并更新技術(shù)術(shù)語(yǔ)庫(kù)Japio技術(shù)術(shù)語(yǔ)庫(kù)專利文獻(xiàn)日英機(jī)器翻譯的質(zhì)量改進(jìn)措施技術(shù)術(shù)語(yǔ)庫(kù)的創(chuàng)建/更新日語(yǔ)英語(yǔ)句對(duì)齊的專利文獻(xiàn)平行語(yǔ)料庫(kù)技術(shù)術(shù)語(yǔ)列表技術(shù)術(shù)語(yǔ)抽取程序○プラスミドplasmid×プライマー配列methodofremoving×プレス車輪組立體seedplanterpress○ファージ抗體phageantibody○ベール積載裝置baleloader:::?

_

?人工評(píng)價(jià)/修正Japio技術(shù)術(shù)語(yǔ)庫(kù)800,000條記錄,每年增加100,000條專利文獻(xiàn)日英機(jī)器翻譯的質(zhì)量改進(jìn)措施源于技術(shù)術(shù)語(yǔ)庫(kù)的機(jī)器翻譯詞典Japio技術(shù)術(shù)語(yǔ)庫(kù)Japio基于技術(shù)術(shù)語(yǔ)庫(kù)編輯機(jī)器翻譯詞典,服務(wù)于專利文獻(xiàn)翻譯Japio機(jī)器翻譯詞典商業(yè)機(jī)器翻譯引擎與詞典+在重疊詞條中選詞是技術(shù)術(shù)語(yǔ)詞典的關(guān)鍵因素專利文獻(xiàn)日英機(jī)器翻譯的質(zhì)量改進(jìn)措施Japio機(jī)器翻譯詞典:選詞方法Japio采取兩種對(duì)策解決選詞問(wèn)題#1:收錄復(fù)合詞

-優(yōu)點(diǎn):翻譯變化較少(=準(zhǔn)確度高)-缺點(diǎn):出現(xiàn)頻率較低(=性價(jià)比低)#2:基于在真實(shí)專利中的出現(xiàn)頻率賦予優(yōu)先權(quán)-優(yōu)點(diǎn):簡(jiǎn)單、自動(dòng)(=性價(jià)比高)-缺點(diǎn):不夠精確(=準(zhǔn)確度低)專利文獻(xiàn)日英機(jī)器翻譯的質(zhì)量改進(jìn)措施Japio機(jī)器翻譯詞典的效能評(píng)價(jià)通過(guò)將Japio機(jī)器翻譯詞典加入商業(yè)機(jī)器翻譯引擎改進(jìn)100個(gè)專利文獻(xiàn)語(yǔ)句中的技術(shù)術(shù)語(yǔ)翻譯JapaneseEnglish感光體Photosensitiveness?photoreceptor予備収束reservefocus?preliminaryfocus冗長(zhǎng)行tediousline?redundantline最外層externallayer?outmostlayer::不多,但基本的術(shù)語(yǔ)得以改進(jìn)。專利文獻(xiàn)日英機(jī)器翻譯的質(zhì)量改進(jìn)措施源文檔的預(yù)編輯處理專利文獻(xiàn)語(yǔ)句的特性與當(dāng)前的機(jī)器翻譯技術(shù)不相適應(yīng)-非常長(zhǎng)而且很復(fù)雜-特殊的行文方式-缺少主語(yǔ)/賓語(yǔ)有效措施:源文檔的預(yù)編輯處理建立技術(shù)日語(yǔ)-技術(shù)文獻(xiàn)(包括專利)基本行文規(guī)則以更適應(yīng)于機(jī)器翻譯專利文獻(xiàn)日英機(jī)器翻譯的質(zhì)量改進(jìn)措施技術(shù)日語(yǔ)基本規(guī)則超過(guò)50%的根據(jù)技術(shù)日語(yǔ)(原型)改寫的語(yǔ)句顯示機(jī)器翻譯準(zhǔn)確性得到了提高。Example1:消除歧義図2に示す例では、二つのソース単語(yǔ)「show」のうち、枠36によって示すものがターゲット言語(yǔ)「mise」に翻訳されている。IntheexampleshowninFig.2,whatisshownwithframe36amongtwosourcewords“show”istranslatedintothetargetword“mise.”図2に示す例では、二つのソース単語(yǔ)「show」のうち、枠36によって示す単語(yǔ)がターゲット言語(yǔ)「mise」に翻訳されている。IntheexampleshowninFig.2,thewordshownwithframe36amongtwosourcewords“show”istranslatedintothetargetword“mise.”原句技術(shù)日語(yǔ)專利文獻(xiàn)日英機(jī)器翻譯的質(zhì)量改進(jìn)措施技術(shù)日語(yǔ)基本規(guī)則Example2:語(yǔ)句的縮短/拆分好ましくは、機(jī)械翻訳裝置は、予め準(zhǔn)備された、第1の言語(yǔ)と第2の言語(yǔ)との対訳コーパスに出現(xiàn)するチャンク対と、各チャンク対の対訳コーパス中での出現(xiàn)頻度とを検出し、當(dāng)該チャンク対と、當(dāng)該チャンク対の頻度からなる重みとをチャンク対記憶手段に記憶させるための手段をさらに含む。好ましくは、機(jī)械翻訳裝置は、以下の処理を行う手段をさらに備える。(1)予め準(zhǔn)備された、第1の言語(yǔ)と第2の言語(yǔ)との対訳コーパスに出現(xiàn)するチャンク対と、各チャンク対の対訳コーパスでの出現(xiàn)頻度とを検出する(2)當(dāng)該チャンク対と、當(dāng)該チャンク対の頻度からなる重みとをチャンク対記憶手段で記憶する原句技術(shù)日語(yǔ)專利文獻(xiàn)日英機(jī)器翻譯的質(zhì)量改進(jìn)措施技術(shù)日語(yǔ)基本規(guī)則Example2:語(yǔ)句的縮短/拆分Achunkpairwhichappearsinabilingualcorpusofthe1stlanguageandthe2ndlanguagewithwhichamachinetranslationdevicewaspreparedbeforehandpreferably,Frequencyofappearanceininsideofabilingualcorpusofeachchunkpairisdetected,andameansformakingachunkversusamemorymeasurememorizethechunkpairconcernedanddignitywhichconsistsoffrequencyofthechunkpairconcernedisincludedfurther.Preferably,amachinetranslationdeviceisfurtherprovidedwithameanstoperformthefollowingprocessings.(1)Detectingachunkpairwhichappearsinabilingualcorpusofthe1stlanguageandthe2ndlanguagewhichwerepreparedbeforehand,andfrequencyofappearanceinabilingualcorpusofeachchunkpair.(2)Memorizingthechunkpairconcernedandweightwhichconsistsoffrequencyofthechunkpairconcernedbyachunkpairmemorymeasure.原句的機(jī)器翻譯輸出技術(shù)日語(yǔ)的機(jī)器翻譯輸出專利文獻(xiàn)日英機(jī)器翻譯的質(zhì)量改進(jìn)措施技

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論