• 現(xiàn)行
  • 正在執(zhí)行有效
  • 2021-04-30 頒布
  • 2021-11-01 實施
?正版授權
GB/T 40035-2021雙語平行語料加工服務基本要求_第1頁
GB/T 40035-2021雙語平行語料加工服務基本要求_第2頁
GB/T 40035-2021雙語平行語料加工服務基本要求_第3頁
GB/T 40035-2021雙語平行語料加工服務基本要求_第4頁
GB/T 40035-2021雙語平行語料加工服務基本要求_第5頁
免費預覽已結束,剩余19頁可下載查看

下載本文檔

免費下載試讀頁

文檔簡介

ICS03080993524030

;

CCSA.10...

中華人民共和國國家標準

GB/T40035—2021

雙語平行語料加工服務基本要求

Basicrequirementsforbilingualparallelcorpusprocessingservice

2021-04-30發(fā)布2021-11-01實施

國家市場監(jiān)督管理總局發(fā)布

國家標準化管理委員會

GB/T40035—2021

目次

前言

…………………………Ⅲ

范圍

1………………………1

規(guī)范性引用文件

2…………………………1

術語和定義

3………………1

總則

4………………………2

基本要求

5…………………3

服務提供方

5.1…………………………3

語料加工人員

5.2………………………3

服務環(huán)境

5.3……………3

加工內(nèi)容

5.4……………3

加工結果

5.5……………3

完整性

5.5.1…………………………3

準確性

5.5.2…………………………3

可用性

5.5.3…………………………4

規(guī)范性

5.5.4…………………………4

語料加工工具

5.6………………………4

可靠性

5.6.1…………………………4

易用性

5.6.2…………………………4

本地化界面

5.6.2.1…………………4

操作功能

5.6.2.2……………………4

幫助系統(tǒng)

5.6.2.3……………………5

效率

5.6.2.4…………………………5

兼容性

5.6.3…………………………5

加工流程

6…………………5

預處理

6.1………………5

語料準備

6.1.1………………………5

清洗

6.1.2……………5

去重

6.1.3……………5

脫敏

6.1.4……………5

語料對齊

6.2……………6

語料審核

6.3……………6

服務內(nèi)容

7…………………6

需求溝通

7.1……………6

客戶協(xié)議

7.2……………6

項目管理

7.3……………6

加工環(huán)節(jié)

7.4……………6

GB/T40035—2021

交付內(nèi)容

7.5……………7

質(zhì)量保證期

7.6…………………………7

服務評價與改進

7.7……………………7

數(shù)據(jù)安全

8…………………7

數(shù)據(jù)備份

8.1……………7

文檔管理與日志

8.2……………………7

數(shù)據(jù)存儲

8.3……………7

附錄資料性雙語平行語料加工人員的培訓

A()………8

附錄資料性雙語語料加工的元數(shù)據(jù)

B()………………9

附錄資料性文件常見編碼格式

C()TXT……………11

附錄資料性格式規(guī)范

D()TMX………………………12

附錄資料性文件的命名規(guī)則編碼格式及文件格式

E()、……………14

參考文獻

……………………15

GB/T40035—2021

前言

本文件按照標準化工作導則第部分標準化文件的結構和起草規(guī)則的規(guī)定

GB/T1.1—2020《1:》

起草

。

請注意本文件的某些內(nèi)容可能涉及專利本文件的發(fā)布機構不承擔識別專利的責任

。。

本文件由全國語言與術語標準化技術委員會提出并歸口

(SAC/TC62)。

本文件起草單位中國標準化研究院中國翻譯協(xié)會上海一者信息科技有限公司上海佑譯信息科

:、、、

技有限公司中譯語通科技股份有限公司北京悅爾信息技術有限公司蘇州聯(lián)躍科技有限公司四川語

、、、、

言橋信息技術有限公司北京百度網(wǎng)訊科技有限公司沈陽雅譯網(wǎng)絡技術有限公司上海智膳合網(wǎng)絡科

、、、

技有限公司北京語言大學北京郵電大學

、、。

本文件主要起草人劉智洋張井葉劍柴瑛黃寶榮羅慧芳蒙永業(yè)朱勵張雪濤王海濤朱憲超

:、、、、、、、、、、、

韓林濤鄭春萍何中軍于立梅張春良甘克勤張寶林

、、、、、、。

GB/T40035—2021

雙語平行語料加工服務基本要求

1范圍

本文件規(guī)定了雙語平行語料加工服務的基本要求加工流程服務內(nèi)容和數(shù)據(jù)安全等內(nèi)容

、、。

本文件適用于以原文和譯文為對象的以文字為表達形式的數(shù)字化雙語語料加工服務其他數(shù)字化

、,

文本的語料加工也可參照使用也適用于對語料對齊工具的評價

,。

2規(guī)范性引用文件

本文件沒有規(guī)范性引用文件

。

3術語和定義

下列術語和定義適用于本文件

。

31

.

文本text

以字符符號詞短語段落句子表格或其他字符排列形成的數(shù)據(jù)用于表達意義其解釋基本上

、、、、、、,,

取決于讀者對于某種自然語言或人工語言的知識

來源

[:GB/T4894—2009,4.1.1.2.4]

32

.

語料corpus

溫馨提示

  • 1. 本站所提供的標準文本僅供個人學習、研究之用,未經(jīng)授權,嚴禁復制、發(fā)行、匯編、翻譯或網(wǎng)絡傳播等,侵權必究。
  • 2. 本站所提供的標準均為PDF格式電子版文本(可閱讀打印),因數(shù)字商品的特殊性,一經(jīng)售出,不提供退換貨服務。
  • 3. 標準文檔要求電子版與印刷版保持一致,所以下載的文檔中可能包含空白頁,非文檔質(zhì)量問題。

評論

0/150

提交評論