機(jī)器翻譯和計(jì)算機(jī)輔助翻譯_第1頁(yè)
機(jī)器翻譯和計(jì)算機(jī)輔助翻譯_第2頁(yè)
機(jī)器翻譯和計(jì)算機(jī)輔助翻譯_第3頁(yè)
機(jī)器翻譯和計(jì)算機(jī)輔助翻譯_第4頁(yè)
機(jī)器翻譯和計(jì)算機(jī)輔助翻譯_第5頁(yè)
已閱讀5頁(yè),還剩16頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、機(jī)器翻譯和計(jì)算機(jī)輔助翻譯機(jī)器翻譯和計(jì)算機(jī)輔助翻譯 MT& CAT邵白楊 劉洋 劉娜 鄧雯 馬雪機(jī)器翻譯機(jī)器翻譯機(jī)器翻譯(Machine Translation),又稱(chēng)為自動(dòng)翻譯,是利用計(jì)算機(jī)把一種自然源語(yǔ)言轉(zhuǎn)變?yōu)榱硪环N自然目標(biāo)語(yǔ)言的過(guò)程,它是自然語(yǔ)言處理(Natural Language Processing)的一個(gè)分支,與計(jì)算語(yǔ)言學(xué)(Computational Linguistics)、自然語(yǔ)言理解(Natural Language Understanding)之間存在著密不可分的關(guān)系。一、機(jī)器翻譯簡(jiǎn)史一、機(jī)器翻譯簡(jiǎn)史機(jī)器翻譯的研究歷史可以追溯到20世紀(jì)四五十年代,學(xué)界一般將其劃分為

2、如下四個(gè)階段:1開(kāi)創(chuàng)期(1946-1964) 1954年,美國(guó)喬治敦大學(xué)(Georgetown University)在IBM公司協(xié)同下,用IBM-701計(jì)算機(jī)首次完成了英俄機(jī)器翻譯試驗(yàn),向公眾和科學(xué)界展示了機(jī)器翻譯的可行性,從而拉開(kāi)了機(jī)器翻譯研究的序幕。中國(guó)開(kāi)始這項(xiàng)研究也并不晚,早在1956年,國(guó)家就把這項(xiàng)研究列入了全國(guó)科學(xué)工作發(fā)展規(guī)劃,課題名稱(chēng)是“機(jī)器翻譯、自然語(yǔ)言翻譯規(guī)則的建設(shè)和自然語(yǔ)言的數(shù)學(xué)理論”。1957年,中國(guó)科學(xué)院語(yǔ)言研究所與計(jì)算技術(shù)研究所合作開(kāi)展俄漢機(jī)器翻譯試驗(yàn),翻譯了9種不同類(lèi)型的較為復(fù)雜的句子。從20世紀(jì)50年代開(kāi)始到20世紀(jì)60年代前半期,機(jī)器翻譯研究呈不斷上升的趨勢(shì)。2

3、受挫期(受挫期(1964-1975)1964年,為了對(duì)機(jī)器翻譯的研究進(jìn)展作出評(píng)價(jià),美國(guó)科學(xué)院成立了語(yǔ)言自動(dòng)處理咨詢(xún)委員會(huì)(Automatic Language Processing Advisory Committee,簡(jiǎn)稱(chēng)ALPAC委員會(huì)),開(kāi)始了為期兩年的綜合調(diào)查分析和測(cè)試。1966年11月,該委員會(huì)公布了一個(gè)題為語(yǔ)言與機(jī)器的報(bào)告(簡(jiǎn)稱(chēng)ALPAC報(bào)告),該報(bào)告全面否定了機(jī)器翻譯的可行性,并建議停止對(duì)機(jī)器翻譯項(xiàng)目的資金支持。這一報(bào)告的發(fā)表給了正在蓬勃發(fā)展的機(jī)器翻譯當(dāng)頭一棒,機(jī)器翻譯研究陷入了近乎停滯的僵局。無(wú)獨(dú)有偶,在此期間,中國(guó)爆發(fā)了“十年文革”,基本上這些研究也停滯了。機(jī)器翻譯步入蕭條期

4、。3恢復(fù)期(恢復(fù)期(1975-1989)進(jìn)入70年代后,隨著科學(xué)技術(shù)的發(fā)展和各國(guó)科技情報(bào)交流的日趨頻繁,國(guó)與國(guó)之間的語(yǔ)言障礙顯得更為嚴(yán)重,傳統(tǒng)的人工作業(yè)方式已經(jīng)遠(yuǎn)遠(yuǎn)不能滿(mǎn)足需求,迫切地需要計(jì)算機(jī)來(lái)從事翻譯工作。4新時(shí)期:(新時(shí)期:(1990現(xiàn)在)現(xiàn)在)隨著Internet的普遍應(yīng)用,世界經(jīng)濟(jì)一體化進(jìn)程的加速以及國(guó)際社會(huì)交流的日漸頻繁,傳統(tǒng)的人工作業(yè)的方式已經(jīng)遠(yuǎn)遠(yuǎn)不能滿(mǎn)足迅猛增長(zhǎng)的翻譯需求,人們對(duì)于機(jī)器翻譯的需求空前增長(zhǎng),機(jī)器翻譯迎來(lái)了一個(gè)新的發(fā)展機(jī)遇。國(guó)際性的關(guān)于機(jī)器翻譯研究的會(huì)議頻繁召開(kāi),中國(guó)也取得了前所未有的成就,相繼推出了一系列機(jī)器翻譯軟件,例如“譯星”、“雅信”、“通譯”、“華建”等。

5、 二二 機(jī)器翻譯的優(yōu)缺點(diǎn)機(jī)器翻譯的優(yōu)缺點(diǎn)弊端:很粗糙,使用者必須先作譯前編輯;相應(yīng)地會(huì)增加成本,進(jìn)而導(dǎo)致成本高于人的翻譯。優(yōu)點(diǎn):一、準(zhǔn)確無(wú)誤地完成了翻譯定額;二、譯文也將隨著語(yǔ)言學(xué)家和程序編制人員探索如何更好地處理語(yǔ)言而得到改進(jìn);三、成本也正在穩(wěn)定下降;四、有助于全世界的學(xué)者及時(shí)了解現(xiàn)代發(fā)展的情況。機(jī)器翻譯當(dāng)前存在機(jī)器翻譯當(dāng)前存在的兩大突出問(wèn)題的兩大突出問(wèn)題:一、尚無(wú)法做到確認(rèn)不同講話人的等值語(yǔ)音二、在處理語(yǔ)義的組成部分上,仍有問(wèn)題三三 機(jī)器翻譯的推動(dòng)作用機(jī)器翻譯的推動(dòng)作用推動(dòng)社會(huì)的進(jìn)步推動(dòng)社會(huì)的進(jìn)步 人類(lèi)想盡一切辦法研制并完成了一個(gè)一個(gè)的機(jī)器翻譯系統(tǒng),開(kāi)發(fā)了一個(gè)一個(gè)的翻譯軟件,推動(dòng)了經(jīng)濟(jì)的發(fā)

6、展,社會(huì)的進(jìn)步,消除了世界人與人之間的語(yǔ)言障礙,溝通了整個(gè)世界,促進(jìn)了交流,加快了全球化進(jìn)程。提高翻譯效率提高翻譯效率 隨著機(jī)器翻譯研究水平不斷提高,翻譯領(lǐng)域也取得了前所未有的成就。在我們的翻譯工作中,我們可以借助各種翻譯系統(tǒng)或軟件完成翻譯任務(wù),這樣可以提高翻譯的速度和準(zhǔn)確度,提高了翻譯工作的效率。促進(jìn)其他領(lǐng)域發(fā)展促進(jìn)其他領(lǐng)域發(fā)展 機(jī)器翻譯涉足數(shù)學(xué)、計(jì)算機(jī)科學(xué)、語(yǔ)言學(xué)、翻譯學(xué)等多門(mén)學(xué)科領(lǐng)域,需要這些學(xué)科強(qiáng)勁的發(fā)展,豐厚的成果作基礎(chǔ),從而促進(jìn)了這些領(lǐng)域的發(fā)展。四四 機(jī)器翻譯的前景:機(jī)器翻譯的前景:1、用計(jì)算機(jī)分析語(yǔ)言將在處理語(yǔ)言材料方面帶來(lái)重大變革2、計(jì)算機(jī)將使我們重新獲得控制現(xiàn)有各種語(yǔ)言中所可

7、利用的大量情報(bào)的能力3、機(jī)器翻譯的研制成功,必將快速排除交流情報(bào)的障礙計(jì)算機(jī)輔助翻譯計(jì)算機(jī)輔助翻譯計(jì)算機(jī)輔助翻譯(Computer aided translation,CAT)類(lèi)似于CAD(計(jì)算機(jī)輔助設(shè)計(jì)),能夠幫助翻譯者優(yōu)質(zhì)、高效、輕松地完成翻譯工作。 它不同于以往的機(jī)器翻譯軟件,不依賴(lài)于計(jì)算機(jī)的自動(dòng)翻譯,而是在人的參與下完成整個(gè)翻譯過(guò)程。與人工翻譯相比,質(zhì)量相同或更好,翻譯效率可提高一倍以上。CAT使得繁重的手工翻譯流程自動(dòng)化,并大幅度提高了翻譯效率和翻譯質(zhì)量。計(jì)算機(jī)輔助翻譯是一個(gè)廣泛的和不精確的術(shù)語(yǔ),涵蓋了一系列的工具,從非常簡(jiǎn)單到更復(fù)雜的。主要功能主要功能在翻譯過(guò)程中,存在著大量重復(fù)或

8、相似的句子和片段。采用人工筆譯哪怕是最簡(jiǎn)單的句子, 也需要書(shū)寫(xiě)一遍。 CAT技術(shù)具有自動(dòng)記憶和搜索機(jī)制,可以自動(dòng)存儲(chǔ)用戶(hù)翻譯的內(nèi)容。當(dāng)用戶(hù)翻譯某個(gè)句子時(shí),系統(tǒng)自動(dòng)搜索用戶(hù)已經(jīng)翻譯過(guò)的句子,如果當(dāng)前翻譯的句子用戶(hù)曾經(jīng)翻譯過(guò),會(huì)自動(dòng)給出以前的翻譯結(jié)果;對(duì)于相似的句子,也會(huì)給出翻譯參考和建議。CAT是一個(gè)具有自學(xué)習(xí)功能的軟件,它會(huì)隨著用戶(hù)的使用,學(xué)習(xí)新的單詞、語(yǔ)法和句型,為用戶(hù)節(jié)省更多的時(shí)間。CAT還配有增強(qiáng)工具CAM (Computer Aided Match),可將用戶(hù)以前翻譯過(guò)的資料轉(zhuǎn)換為可以重復(fù)使用的記憶庫(kù)。這樣,用戶(hù)就無(wú)需重復(fù)以前的勞動(dòng),從而提高翻譯速度和準(zhǔn)確性。核心技術(shù)核心技術(shù)CAT技術(shù)

9、的核心是翻譯記憶技術(shù),當(dāng)翻譯在不停地工作時(shí),CAT則在后臺(tái)忙于建立語(yǔ)言數(shù)據(jù)庫(kù)。這就是所謂的翻譯記憶。每當(dāng)相同或相近的短語(yǔ)出現(xiàn)時(shí),系統(tǒng)會(huì)自動(dòng)提示用戶(hù)使用記憶庫(kù)中最接近的譯法。用戶(hù)可以根據(jù)自己的需要采用、舍棄或編輯重復(fù)出現(xiàn)的文本。輔助功能輔助功能對(duì)于CAT技術(shù)來(lái)說(shuō),另一個(gè)重要組成部分則是術(shù)語(yǔ)管理。廣義的說(shuō),翻譯中出現(xiàn)的任何詞匯,如果有重復(fù)使用的必要,都可以作為術(shù)語(yǔ)進(jìn)行保存,保存的術(shù)語(yǔ)集合則成為術(shù)語(yǔ)庫(kù)。術(shù)語(yǔ)庫(kù)也可以重復(fù)利用,不僅僅是在本次翻譯,還可以在以后的項(xiàng)目或其他人的翻譯工作中重復(fù)使用,不但提高工作效率,更重要的是解決翻譯一致性問(wèn)題。當(dāng)前的翻譯機(jī)構(gòu)必須倚重翻譯技術(shù),越來(lái)越多的大中型翻譯機(jī)構(gòu)要求加

10、盟的專(zhuān)職和兼職譯員掌握諸如Trados、Wordfast等主流的TM軟件計(jì)算機(jī)輔助翻譯基本過(guò)程計(jì)算機(jī)輔助翻譯基本過(guò)程詞匯復(fù)用:系統(tǒng)提供大容量的專(zhuān)業(yè)詞庫(kù),為用戶(hù)節(jié)省查詞典的時(shí)間,可自動(dòng)進(jìn)行詞頻記憶并按詞頻排序,用戶(hù)只要點(diǎn)擊鼠標(biāo)或按快捷鍵即可完成句子翻譯。句子復(fù)用:采用先進(jìn)的翻譯記憶( TM)技術(shù),把用戶(hù)翻譯的原文句子和譯文自動(dòng)記憶到數(shù)據(jù)庫(kù)中。翻譯過(guò)程中,通過(guò)搜索引擎,自動(dòng)查找記憶庫(kù),對(duì)需要翻譯的內(nèi)容進(jìn)行快速分析、對(duì)比,保證相同的句子永遠(yuǎn)不要翻譯第二遍。模糊匹配復(fù)用:一旦發(fā)現(xiàn)與記憶庫(kù)中例句相同或相似的句子,將根據(jù)與原文的匹配情況,系統(tǒng)自動(dòng)給出翻譯建議,用戶(hù)可選擇自動(dòng)匹配替換,直接得到翻譯結(jié)果,避免

11、重復(fù)性勞動(dòng),提高工作效率。片段復(fù)用:如果當(dāng)前翻譯的句子與記憶庫(kù)中例句有相同的片段時(shí),系統(tǒng)會(huì)給出提示,作為翻譯時(shí)的參考。翻譯項(xiàng)目管理翻譯項(xiàng)目管理項(xiàng)目管理是多語(yǔ)翻譯和多語(yǔ)軟件本地化項(xiàng)目的關(guān)鍵因素。術(shù)語(yǔ)詞庫(kù)準(zhǔn)備:在翻譯開(kāi)始之前,項(xiàng)目經(jīng)理準(zhǔn)備術(shù)語(yǔ)詞庫(kù)和例句庫(kù),由同一項(xiàng)目中的所有翻譯者共享。術(shù)語(yǔ)詞庫(kù)準(zhǔn)備可大大影響項(xiàng)目的成本,還可以統(tǒng)一用詞和相同句的譯法。材料接收和完成:翻譯者收到項(xiàng)目經(jīng)理所發(fā)來(lái)的需翻譯的材料和術(shù)語(yǔ)詞庫(kù),就可用翻譯軟件打開(kāi)文件,進(jìn)行翻譯。翻譯時(shí),翻譯者可使用翻譯記憶和術(shù)語(yǔ)詞庫(kù),并不斷的把新的語(yǔ)言片斷加入到翻譯記憶中,也不斷把新的術(shù)語(yǔ)詞匯加入到詞庫(kù)中。翻譯完成后,翻譯者以目的語(yǔ)言代替源語(yǔ)言,建立一個(gè)與源語(yǔ)言文件布局完全一致的目的語(yǔ)言文件。再通過(guò)電子郵件的形式,發(fā)送給項(xiàng)目經(jīng)理。隨著全球經(jīng)濟(jì)的發(fā)展和各國(guó)之間交流的增多,對(duì)語(yǔ)言翻譯的需求將會(huì)進(jìn)一步增加。在這樣的背景下,如何更加高效、高質(zhì)的處理語(yǔ)言轉(zhuǎn)換已經(jīng)成為眾多機(jī)構(gòu)和公司共同關(guān)心的問(wèn)題。計(jì)算機(jī)輔助翻譯技術(shù)正是在這種背景下應(yīng)運(yùn)而生,它能夠幫助翻譯者優(yōu)質(zhì)、高效、輕松地完成翻譯工作。前景前景翻譯產(chǎn)業(yè)化的重要途徑就是翻譯信息化,CAT技術(shù)的研究,就是為了適應(yīng)現(xiàn)代計(jì)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論