版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
Computer-AssistedTranslationTranslationMemoryToolsMachineTranslationTheCorpus-BasedApproachTranslationMemory(翻譯記憶)NotMachineTranslation(MT)Esselink:“Atechnologythatenablestheusertostoretranslatedphrasesorsentencesinaspecialdatabaseforlocalre-useorshareduseoveranetwork.TMsystemsworkbymatchingtermsandsentencesinthedatabasewiththoseinthesourcetext.Ifamatchisfound,thesystemproposestheready-madetranslationinthetargetlanguage.”技術原理:用戶利用已有的原文和譯文,建立起一個或多個翻譯記憶庫(TranslationMemory),在翻譯過程中,系統(tǒng)將自動搜索翻譯記憶庫中相同或相似的翻譯資源(如句子、段落),給出參考譯文,使用戶避免無謂的重復勞動,只需專注于新內(nèi)容的翻譯。翻譯記憶庫同時在后臺不斷學習和自動儲存新的譯文,變得越來越“聰明”,效率越來越高。幾乎所有翻譯記憶廠家都會告訴用戶:有了TM,你永遠不必對同一句話翻譯兩遍!翻譯記憶優(yōu)缺點:翻譯質量有保證隨著使用時間匹配成功率逐步提高特別適用于重復率高的文本翻譯,例如公司的產(chǎn)品說明書的新版本翻譯與語言無關,適用于各種語言對缺點是匹配成功率不高,特別是剛開始使用時CurrentexamplesofTMtoolsSDLTradosStudio2009/2011/2014Wordfast(Classic/Pro)TransitNXTDVXOmegaTMemoQ
AcrossMultiTrans
SDLTradosStudio
SDL
Trados是世界上最流行的計算機輔助翻譯(CAT)軟件,在全球擁有13萬多客戶,全球500強企業(yè)有超過90%的公司都在使用SDLTrados來為日常的本地化翻譯工作服務,SDLTrados為他們克服了在不同國家地區(qū)的文化、語言障礙,從而為他們的全球化鋪平了發(fā)展道路。
用戶:微軟、Cisco、Intel、HP、Compaq、DELL、Oracle、SAP、宏碁(Acer)、德國大眾、上海大眾、西門子、朗訊、北方電訊、Wal-Mart(沃爾瑪)、聯(lián)合國、歐盟、國際貨幣基金組織、雅虎、新浪、深圳華為、深圳中興、上海貝爾阿爾卡特、廣州石化等。MachineTranslation國內(nèi)市場上的翻譯軟件(四大類):全文翻譯(專業(yè)翻譯):雅信CAT2.5
在線翻譯:火云譯客、金山快譯.net2001、華建的“翻譯網(wǎng)上通”
漢化軟件:東方快車3000
電子詞典:金山詞霸.net2001
金山快譯:我過去一直有三輛汽車。我無法在我的小車庫中使他們保持所有的。我停車了在我的房子周圍的某處。但是我昨天偷一輛汽車。東方快車:我過去常有3輛汽車。我都不能把他們放在我的小車庫。在我的房子附近我停車了某地。但是我把了一輛汽車昨天被偷竊。例:
Iusedtohavethreecars.Icouldn’tkeepthemallinmysmallgarage.Iparkedsomewherearoundmyhouse,butIhadacarstolenyesterday.例:Hewasintheseventhheavenlastnight.金山快譯:他昨晚是在第七天堂方面;東方快車:昨晚他在第7天堂;參考譯文:昨晚他欣喜若狂。
Yourbrainhastwoparts:theleftandtheright.Yourleftbrainhasnothingright,andyourrightbrainhasnothingleft。
你的大腦有兩部分:左邊的和好的。左腦有什么權利,你的右腦有一無所有
你的大腦有兩部分:左和右。你的左腦沒有正確的,你的右腦沒剩下什么東西。(白癡,腦殘,胸無點墨)MT限制:人名翻譯習語翻譯文學作品翻譯成語典故的翻譯存在語義歧義時人名:金庸LouisCha—JinYong
彭定康——Patten(ChristopherFrancispattern)LarryPage(拉里·佩奇)——佩奇習語:海誓山盟-eternal
asolemnpledgeoflovetocarrycoaltoNewcastle
運煤到紐卡斯爾禍起蕭墻(Troublebreaksoutathome)Harris別狗咬呂洞賓,不識好人心。MT:Thedogbitelvdongbindoesnotknowgoodhearts.
HT:Don'tbitethehandthatfeedsyou.成語典故:文學作品:明月幾時有,把酒問青天MT:Whenthemoonis,wineaskbluesky.HT:Whenwillthemoonbeclearandbright?Withacupofwineinmyhand,Iaskthebluesky.Shesailedintotheroom.有道:她順利地進了房間。參考:她儀態(tài)萬方的走進了房間。歧義:他說:“她這個人真有意思(funny)”。她說:“他這個人怪有意思的(funny)”。于是人們以為他們有了意思(wish),并讓他向她意思意思(express)。他火了:“我根本沒有那個意思(thought)”!她也生氣了:“你們這么說是什么意思(intention)”?事后有人說:“真有意思(funny)”。也有人說:“真沒意思(nonsense)
”。語料庫(Corpora)的定義按照一定的原則組織在一起的真實的自然語言數(shù)據(jù)(包括書面語和口語)的集合,主要用于研究自然語言的規(guī)律,特別是統(tǒng)計語言學模型的訓練以及相關系統(tǒng)的評價和評測。一個由大量在真實環(huán)境中使用的語言信息所集成的專供研究使用的資料庫。Corpus-basedsystem
基于語料庫的機器翻譯系統(tǒng)概念:不同于基于規(guī)則的機譯系統(tǒng)由詞典和語法規(guī)則庫構成翻譯知識庫,基于語料庫的機譯系統(tǒng)是以語料庫的應用為核心,由經(jīng)過劃分并具有標注的語料庫構成知識庫,以統(tǒng)計規(guī)律為主。分類:
(1)基于統(tǒng)計(Statistics-based)的機器翻譯
(2)基于實例(Example-based)的機器翻譯基于統(tǒng)計(Statistics-based)的機器翻譯統(tǒng)計機器翻譯的基本思想是通過對大量的平行語料進行統(tǒng)計分析,構建統(tǒng)計翻譯模型,進而使用此模型進行翻譯。通俗地說,源語到目的語的翻譯是一個概率統(tǒng)計問題,任何一個目的語句子都有可能是任何一個源語句的譯文,只是概率不同,機器翻譯的任務就是找到概率最大的句子。具體方法是將翻譯看做對原文通過模型轉換為譯文的解碼過程。
1、模型問題:就是為機器翻譯建立概率模型,也就是要定義源語到目的語的翻譯概率的計算方法。
2、訓練問題:利用語料庫來得到這個模型的所有參數(shù)。
3、解碼問題:在已知模型和參數(shù)的基礎上,對于任何一個輸入的源語言句子,去查找概率最大的譯文我是一個學生Iamastudent詞語對齊實例源短語表短語組合表例句:Wedochickenright.1.我們做雞是對的。2.我們做雞正點耶。3.我們就是做雞的,我們有做雞的權利。4.我們只做雞的右半邊。5.我們可以做雞,對吧?6.我們行使了雞的權利。7.我們只做右邊的雞。8.我們讓雞向右看齊。9.我們只做正版的雞!10.只有朝右才是好雞。11.我們有雞的權利!12.只有我們可以做雞!13.我們“正在”做雞好不好?14.向右看,有雞。15.我們讓雞變右撇子。16.我們一定要把雞打成右派!17.我們做的是“右派”的雞!(麥當勞做的是“左派”的雞?。?8.我們只做右撇子雞!19.我們干雞的右邊。20.我們把雞搞正?。ㄔ瓉硎峭岬模?1.我們“躲”在雞的右懷里。22.我們做雞,怎么啦?23.雞的左邊留給麥當勞干。24.我們知道怎么做雞。25.我們知道如何做“雞”。26.雞做得對!27.你知道我們正在做雞。28.我們只做正點的雞!29我們烹雞的方式最正確。/我們是烹雞專家。應用:Google的在線翻譯已為人熟知,其背后的技術即為基于統(tǒng)計的機器翻譯方法,基本運行原理是通過搜索大量的雙語網(wǎng)頁內(nèi)容,將其作為語料庫,然后由計算機自動選取最為常見的詞與詞的對應關系,最后給出翻譯結果。此外,Bing翻譯和百度翻譯等優(yōu)缺點:翻譯質量的高低主要取決于概率模型的好壞和語料庫的覆蓋能力?;趯嵗‥xample-based)機器翻譯提出:最早是由日本的機器翻譯專家長尾真1981年提出的。基本思想:在已經(jīng)收集的雙語實例庫中找出與待翻譯部分最相似的翻譯實例,再對實例的譯文通過替換,刪除或增加等一系列變形操作,實現(xiàn)翻譯?;趯嵗臋C器翻譯系統(tǒng)主要由兩個數(shù)據(jù)庫(實例庫和同義詞庫)以及兩個模式(檢索模式和調(diào)整模式)組成。
實例庫(雙語語料庫)同義詞庫(語義詞庫、詞典詞庫)↙↘↙↘待翻譯句子→相似實例檢索→重組與調(diào)整→翻譯結果待翻譯句子:Fathergoestobedat11intheevening.相似句子:Mothergetsupat6inthemorning.
母親早上六點起床。重組調(diào)整:父親晚上11點上床。我給瑪麗一支筆——IgaveMaryapen.我給湯姆一本書——Ig
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年發(fā)布:高精尖醫(yī)療器械研發(fā)與生產(chǎn)合同
- 2024年工程咨詢服務商合同
- 文化藝術行業(yè)人員行為強戒管理
- 勞動合同解除與離職手續(xù)
- 2024年光伏發(fā)電項目開發(fā)與建設合同
- 農(nóng)業(yè)生產(chǎn)標準化管理辦法
- 保稅區(qū)工程招投標異議樣本
- 礦山入口安全評估
- 煙草種植園環(huán)保項目合同
- 煤礦開采鋼結構安全協(xié)議
- 《中藥竹罐治療頸椎病的應用進展綜述【3000字論文】》
- 第六章革命軍隊建設和軍事戰(zhàn)略的理論
- 年度取用水計劃申請表
- 文網(wǎng)文業(yè)務發(fā)展報告(XX單位)
- 硬筆書法章法課件
- 養(yǎng)老院老人入院風險告知書4篇
- 智能制造專業(yè)群建設(智能制造業(yè)專業(yè)技術學校創(chuàng)業(yè)計劃)課件整理
- 鋼直梯安全驗收(檢查)表
- 設備基礎施工方案及安全措施
- 用電安全檢查記錄表
- 部編版語文六年級上冊《口語交際》專項練習
評論
0/150
提交評論