2023機(jī)器翻譯技術(shù)及產(chǎn)業(yè)應(yīng)用藍(lán)皮書_第1頁
2023機(jī)器翻譯技術(shù)及產(chǎn)業(yè)應(yīng)用藍(lán)皮書_第2頁
2023機(jī)器翻譯技術(shù)及產(chǎn)業(yè)應(yīng)用藍(lán)皮書_第3頁
2023機(jī)器翻譯技術(shù)及產(chǎn)業(yè)應(yīng)用藍(lán)皮書_第4頁
2023機(jī)器翻譯技術(shù)及產(chǎn)業(yè)應(yīng)用藍(lán)皮書_第5頁
已閱讀5頁,還剩65頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

機(jī)器翻譯技術(shù)及產(chǎn)業(yè)應(yīng)用藍(lán)皮書中國外文局翻譯院|中國翻譯協(xié)會翻譯技術(shù)委員會|百度翻譯卷首語4.2.3助力中華文化“走出去”結(jié)束語《藍(lán)皮書》在2023中國翻譯協(xié)會年會“未來已來:翻譯技術(shù)主題論壇”上,由中國外文局2023年4月科技賦能翻譯事業(yè)發(fā)展是時(shí)代大勢機(jī)器翻譯技術(shù)及產(chǎn)業(yè)應(yīng)用藍(lán)皮書翻譯是國際傳播能力建設(shè)的重要環(huán)節(jié)界讀懂中國的積極貢獻(xiàn)。在2019年9月致中國外文局成立70周年賀信和2022年8月給外文出版社機(jī)器翻譯技術(shù)及產(chǎn)業(yè)應(yīng)用藍(lán)皮書機(jī)器翻譯技術(shù)不斷發(fā)展創(chuàng)新菲勒基金會自然科學(xué)部主任韋弗(W.Weaver)和英國工程師布斯(A.D.Booth)就提出了利神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯:近年來,深度學(xué)習(xí)的迅速發(fā)展推動了機(jī)器翻譯的技術(shù)變革,神經(jīng)網(wǎng)絡(luò)譯過程,將源語言映射(編碼)到高維向量空間,并通過神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換(解碼)為目標(biāo)語言。相比產(chǎn)業(yè)發(fā)展三年行動計(jì)劃(2018-2020年)》均將機(jī)器翻譯列為重要發(fā)展方向。隨著我國綜合國力的機(jī)器翻譯技術(shù)及產(chǎn)業(yè)應(yīng)用藍(lán)皮書統(tǒng)譯文的準(zhǔn)確度可以達(dá)到90%以上。同翻譯技術(shù)的使用能夠降低翻譯成本(94.7%)及提高效率(95%)。4.多語言翻譯市場需求巨大,相關(guān)研究和應(yīng)用發(fā)展迅速年1月,已有151個(gè)國家和32個(gè)國際組織與中國簽署共建“一帶一路”合作文件1,其中涉及的語5.翻譯模式由文本翻譯擴(kuò)展到跨模態(tài)翻譯,應(yīng)用場景愈加豐富機(jī)器翻譯技術(shù)及產(chǎn)業(yè)應(yīng)用藍(lán)皮書機(jī)器翻譯技術(shù)及產(chǎn)業(yè)應(yīng)用藍(lán)皮書4.多模態(tài)融合的機(jī)器翻譯技術(shù)需進(jìn)一步探索步提升譯文質(zhì)量、拓展應(yīng)用場景。例如,在同聲傳譯中,演講者的幻燈片材料、語音語調(diào)、肢體語言等多模態(tài)信息都有助于提升機(jī)器同傳質(zhì)量。2023年,中國外文局翻譯院智能翻譯實(shí)驗(yàn)室發(fā)布了《語言服務(wù)行業(yè)的機(jī)器翻譯使用情況調(diào)研問卷》,根據(jù)問卷收集到的反饋數(shù)據(jù),目前語言服務(wù)行業(yè)對多模態(tài)融合的機(jī)器翻譯技術(shù)有較大需求。如圖1所示,超過70%的受訪者表示有圖片轉(zhuǎn)文字功能的需求,超過65%的受訪者有語音轉(zhuǎn)寫功能的需求。您希望能增加哪些附加功能搭配機(jī)器翻譯使用?在質(zhì)量評價(jià)體系、人機(jī)協(xié)作模式、語料庫建設(shè)等方面,需結(jié)合技術(shù)發(fā)展形勢和市場需求,加快相關(guān)標(biāo)準(zhǔn)的研制工作。如對機(jī)器翻譯質(zhì)量的評價(jià),目前仍主要基于BLEU(BilingualEvaluationUnderstudy)等自動評價(jià)指標(biāo)以及面向通用場景的流利度、準(zhǔn)確度等人工評價(jià)指標(biāo)。在具體應(yīng)用時(shí),應(yīng)結(jié)合具體需求制定合適的評價(jià)流程和評價(jià)標(biāo)準(zhǔn)。此外,也應(yīng)針對系統(tǒng)性能、硬件要求等制定相應(yīng)規(guī)范。在人機(jī)協(xié)作模式方面,同樣亟需制定相關(guān)行業(yè)標(biāo)準(zhǔn),明確人與機(jī)器的關(guān)系、在翻譯過程中發(fā)揮的不同作用以及承擔(dān)的不同責(zé)任,以此更好促進(jìn)新技術(shù)應(yīng)用發(fā)展,推動形成健康的行業(yè)生態(tài)。機(jī)器翻譯技術(shù)及產(chǎn)業(yè)應(yīng)用藍(lán)皮書根據(jù)《語言服務(wù)行業(yè)的機(jī)器翻譯使用情況調(diào)研問卷》收集到的反饋數(shù)據(jù),如圖2、圖3所示,僅有不到30%的受訪企業(yè)表示會區(qū)分輕度和深度譯后編輯,并制定不同規(guī)范標(biāo)準(zhǔn)。在日常進(jìn)行“機(jī)器翻譯+譯后編輯”的人機(jī)結(jié)合服務(wù)模式時(shí),語言服務(wù)提供方會面臨客戶對譯后編輯程度的要求不明確、譯后編輯的工作量難以預(yù)估及如何定價(jià)等問如果不能直接采用,機(jī)器翻譯結(jié)果需要進(jìn)行編輯,是否會針對修改程度區(qū)分輕度譯后編輯和深度譯后編輯,并就此制定不同的規(guī)范標(biāo)準(zhǔn)?圖2:輕度和深度譯后編輯區(qū)分相比常規(guī)的人工翻譯任務(wù),您認(rèn)為譯后編輯任務(wù)常存在哪些問題?圖3:相比人工翻譯任務(wù),譯后編輯任務(wù)存在的問題產(chǎn)業(yè)級機(jī)器翻譯系統(tǒng)及產(chǎn)品形式技術(shù)特征4.全生命周期安全保障能力機(jī)器翻譯技術(shù)及產(chǎn)業(yè)應(yīng)用藍(lán)皮書系統(tǒng)架構(gòu)收集大規(guī)模訓(xùn)練數(shù)據(jù)(包括雙語平行語料、單語語料、詞典等),并根據(jù)應(yīng)用需求基于深度學(xué)2.部署發(fā)布3.產(chǎn)品及應(yīng)用安全策略是人工智能系統(tǒng)的一個(gè)重要組成部分,機(jī)器翻譯也不例外。一個(gè)實(shí)用的機(jī)器翻譯系統(tǒng)應(yīng)該構(gòu)建全生命周期的安全策略,包括認(rèn)證和授權(quán)機(jī)制、數(shù)據(jù)隔離、數(shù)據(jù)加密、監(jiān)控審計(jì)等方面,保障在存儲和傳輸過程中語料、模型和用戶相關(guān)信息的數(shù)據(jù)安全。此外,在具體應(yīng)用場景中,可根據(jù)需求靈活設(shè)計(jì)和開發(fā)安全策略,例如針對不同硬件和系統(tǒng)環(huán)境進(jìn)行模型適配調(diào)整,針對高時(shí)空開銷的場景進(jìn)行模型壓縮等。產(chǎn)品及應(yīng)用部署發(fā)布模型訓(xùn)練PCAPP小程序插件翻譯硬件APVSDK神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯核心模型數(shù)據(jù)及系統(tǒng)安全策略系統(tǒng)部署圖4:產(chǎn)業(yè)級機(jī)器翻譯系統(tǒng)流程圖機(jī)器翻譯技術(shù)及產(chǎn)業(yè)應(yīng)用藍(lán)皮書產(chǎn)品形式機(jī)器翻譯產(chǎn)業(yè)現(xiàn)狀及應(yīng)用案例譯速度要快;第三,翻譯成本要低。相比于人工翻譯,機(jī)器翻譯在速度和成本方面具有天機(jī)器翻譯技術(shù)及產(chǎn)業(yè)應(yīng)用藍(lán)皮書產(chǎn)業(yè)應(yīng)用現(xiàn)狀及趨勢司(GlobalMarketInsights)發(fā)布的調(diào)研報(bào)告,2021年機(jī)器翻譯市場規(guī)模超過8億美元,預(yù)計(jì)2022到2030年的年復(fù)合增長率將超過30%3。機(jī)器翻譯技術(shù)及產(chǎn)業(yè)應(yīng)用藍(lán)皮書中國翻譯及語言服務(wù)行業(yè)發(fā)展報(bào)告》,“機(jī)器翻譯+譯后編輯”的人機(jī)結(jié)合服務(wù)模式得到市場普遍認(rèn)同,90.1%的翻譯及語言服務(wù)企業(yè)認(rèn)為采用該模式提高了效率。如圖5、圖6所示,根據(jù)《語言服務(wù)行業(yè)的機(jī)器翻譯使用情況調(diào)研問卷》收集到的反饋數(shù)據(jù),超過80%的受訪者認(rèn)為未來五年內(nèi)機(jī)器翻譯會普及到更多領(lǐng)域,超過85%的受訪者認(rèn)為“機(jī)器翻譯+譯后編輯”的工作模式會在更大范圍您是否同意未來五年內(nèi)機(jī)器翻譯會普及到更多領(lǐng)域?圖5:未來五年內(nèi)機(jī)器翻譯領(lǐng)域拓展預(yù)期您是否認(rèn)同“機(jī)器翻譯+譯后編輯”的工作模式在未來將得到更大范圍的應(yīng)用?圖6:“機(jī)器翻譯+譯后編輯”模式推廣預(yù)期機(jī)器翻譯技術(shù)及產(chǎn)業(yè)應(yīng)用藍(lán)皮書4.機(jī)器翻譯成為譯員的得力助手和有效補(bǔ)充5.機(jī)器翻譯拓寬了翻譯市場產(chǎn)業(yè)應(yīng)用案例4.2.1賦能企業(yè)全球化發(fā)展中國石油化工集團(tuán)有限公司(下文簡稱“中石化”)業(yè)務(wù)遍及全球70個(gè)國家和地區(qū),擁有數(shù)機(jī)器翻譯技術(shù)及產(chǎn)業(yè)應(yīng)用藍(lán)皮書4.2.2助力各行各業(yè)數(shù)字化建設(shè)2023年,中共中央、國務(wù)院印發(fā)了《數(shù)字中國建設(shè)整體布局規(guī)劃》,規(guī)劃指出,建設(shè)數(shù)字中低34%,為客戶帶來更大的業(yè)務(wù)價(jià)值和經(jīng)濟(jì)效益。4.2.3助力中華文化“走出去”機(jī)器翻譯技術(shù)及產(chǎn)業(yè)應(yīng)用藍(lán)皮書2.機(jī)器翻譯為網(wǎng)絡(luò)文學(xué)出海插上“翅膀”占比達(dá)72%。中國作家協(xié)會發(fā)布的《2021中國網(wǎng)絡(luò)文學(xué)藍(lán)皮書》顯示,2021年網(wǎng)絡(luò)文學(xué)海外市自然手語翻譯引擎,準(zhǔn)確度達(dá)到90%以上。在2022年冬奧會上,百度Al手語主播上線央視冬奧賽3.翻譯筆4.智能手機(jī)機(jī)器翻譯技術(shù)及產(chǎn)業(yè)應(yīng)用藍(lán)皮書5.智能音箱機(jī)器翻譯發(fā)展趨勢和建議進(jìn)步顯著。諸如ChatGPT、文心一言等機(jī)器翻譯技術(shù)及產(chǎn)業(yè)應(yīng)用藍(lán)皮書趨勢展望3.機(jī)器翻譯模型的靈活性及智能交互能力提升發(fā)展建議4.加大技術(shù)普及,鼓勵(lì)語言服務(wù)及各行業(yè)利用機(jī)器翻譯提升效率機(jī)器翻譯技術(shù)及產(chǎn)業(yè)應(yīng)用藍(lán)皮書技術(shù)發(fā)展日新月異,深刻影響著人們的生產(chǎn)生活方式。在人類文明的進(jìn)程中,跨越語言鴻溝是人們一直以來的愿望,也是人們密切協(xié)作的基礎(chǔ)和保障。機(jī)器翻譯技術(shù)的不斷進(jìn)步,將人類溝通無礙的這一夢想逐漸變?yōu)楝F(xiàn)實(shí)。新技術(shù)的不斷涌現(xiàn),勾勒出更大的想象空間。同時(shí),我們也需要清醒地認(rèn)識到,在人類歷史上,沒有哪一項(xiàng)技術(shù)的成熟是一蹴而就的,需要在長期的應(yīng)用中不斷地發(fā)展和完善。機(jī)器翻譯也是如此。它必將在技術(shù)浪潮中揚(yáng)帆遠(yuǎn)航,為幫助人們跨越語言鴻溝作出更大貢獻(xiàn)。機(jī)器翻譯技術(shù)及產(chǎn)業(yè)應(yīng)用藍(lán)皮

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論