標(biāo)準(zhǔn)解讀

《GB/T 41813.1-2022 信息技術(shù) 智能語(yǔ)音交互測(cè)試方法 第1部分:語(yǔ)音識(shí)別》是一項(xiàng)國(guó)家標(biāo)準(zhǔn),旨在為智能語(yǔ)音識(shí)別系統(tǒng)的性能評(píng)估提供一套科學(xué)、統(tǒng)一的測(cè)試方法。該標(biāo)準(zhǔn)適用于各類智能語(yǔ)音識(shí)別系統(tǒng)或產(chǎn)品的測(cè)試,包括但不限于智能家居設(shè)備、車載信息娛樂(lè)系統(tǒng)以及個(gè)人助手等場(chǎng)景下的應(yīng)用。

根據(jù)標(biāo)準(zhǔn)內(nèi)容,首先定義了語(yǔ)音識(shí)別測(cè)試的基本術(shù)語(yǔ)和概念,如準(zhǔn)確率、召回率、響應(yīng)時(shí)間等關(guān)鍵指標(biāo)。接著詳細(xì)描述了進(jìn)行語(yǔ)音識(shí)別測(cè)試時(shí)所需遵循的一般原則,強(qiáng)調(diào)測(cè)試環(huán)境應(yīng)盡可能模擬實(shí)際使用條件以確保結(jié)果的有效性和可靠性。

對(duì)于具體的測(cè)試流程,《GB/T 41813.1-2022》給出了明確指導(dǎo),包括測(cè)試前準(zhǔn)備(如選擇合適的語(yǔ)料庫(kù))、執(zhí)行測(cè)試(涵蓋不同類型的輸入數(shù)據(jù))及后續(xù)的數(shù)據(jù)分析步驟。此外,還特別指出了幾種常見(jiàn)的測(cè)試類型,比如命令詞識(shí)別測(cè)試、連續(xù)語(yǔ)音轉(zhuǎn)寫(xiě)測(cè)試等,并對(duì)每種類型提出了具體要求。

在測(cè)試過(guò)程中,標(biāo)準(zhǔn)建議采用多樣化的語(yǔ)料來(lái)覆蓋廣泛的應(yīng)用場(chǎng)景,同時(shí)也要考慮到不同語(yǔ)言、方言等因素的影響。通過(guò)設(shè)定合理的評(píng)價(jià)指標(biāo)體系,可以全面衡量被測(cè)系統(tǒng)的性能表現(xiàn),從而幫助開(kāi)發(fā)者更好地理解其產(chǎn)品在現(xiàn)實(shí)世界中的適用性。


如需獲取更多詳盡信息,請(qǐng)直接參考下方經(jīng)官方授權(quán)發(fā)布的權(quán)威標(biāo)準(zhǔn)文檔。

....

查看全部

  • 現(xiàn)行
  • 正在執(zhí)行有效
  • 2022-10-12 頒布
  • 2023-05-01 實(shí)施
?正版授權(quán)
GB/T 41813.1-2022信息技術(shù)智能語(yǔ)音交互測(cè)試方法第1部分:語(yǔ)音識(shí)別_第1頁(yè)
GB/T 41813.1-2022信息技術(shù)智能語(yǔ)音交互測(cè)試方法第1部分:語(yǔ)音識(shí)別_第2頁(yè)
GB/T 41813.1-2022信息技術(shù)智能語(yǔ)音交互測(cè)試方法第1部分:語(yǔ)音識(shí)別_第3頁(yè)
GB/T 41813.1-2022信息技術(shù)智能語(yǔ)音交互測(cè)試方法第1部分:語(yǔ)音識(shí)別_第4頁(yè)
GB/T 41813.1-2022信息技術(shù)智能語(yǔ)音交互測(cè)試方法第1部分:語(yǔ)音識(shí)別_第5頁(yè)
免費(fèi)預(yù)覽已結(jié)束,剩余15頁(yè)可下載查看

下載本文檔

GB/T 41813.1-2022信息技術(shù)智能語(yǔ)音交互測(cè)試方法第1部分:語(yǔ)音識(shí)別-免費(fèi)下載試讀頁(yè)

文檔簡(jiǎn)介

ICS3524001

CCSL.77.

中華人民共和國(guó)國(guó)家標(biāo)準(zhǔn)

GB/T418131—2022

.

信息技術(shù)智能語(yǔ)音交互測(cè)試方法

第1部分語(yǔ)音識(shí)別

:

Informationtechnology—Intelligentspeechinteractiontestingmethod—

Part1Seechreconition

:pg

2022-10-12發(fā)布2023-05-01實(shí)施

國(guó)家市場(chǎng)監(jiān)督管理總局發(fā)布

國(guó)家標(biāo)準(zhǔn)化管理委員會(huì)

GB/T418131—2022

.

目次

前言

…………………………Ⅲ

引言

…………………………Ⅳ

范圍

1………………………1

規(guī)范性引用文件

2…………………………1

術(shù)語(yǔ)和定義

3………………1

概述

4………………………2

測(cè)試準(zhǔn)備和執(zhí)行

5…………………………2

測(cè)試數(shù)據(jù)集

5.1…………………………2

測(cè)試工具

5.2……………3

測(cè)試設(shè)備

5.3……………3

測(cè)試環(huán)境

5.4……………4

測(cè)試執(zhí)行

5.5……………4

測(cè)試結(jié)果

5.6……………4

功能測(cè)試方法

6……………4

語(yǔ)音信號(hào)采集

6.1………………………4

語(yǔ)音轉(zhuǎn)文字

6.2…………………………5

語(yǔ)音喚醒

6.3……………5

前端信號(hào)處理

6.4………………………5

說(shuō)話人分離

6.5…………………………5

語(yǔ)言信息識(shí)別

6.6………………………6

語(yǔ)音識(shí)別后處理

6.7……………………6

性能測(cè)試方法

7……………6

語(yǔ)音識(shí)別效果

7.1………………………6

語(yǔ)音識(shí)別效率

7.2………………………7

語(yǔ)音喚醒效果

7.3………………………8

前端信號(hào)處理效果

7.4…………………9

說(shuō)話人分離效果

7.5……………………10

語(yǔ)言信息識(shí)別效果

7.6…………………10

系統(tǒng)穩(wěn)定性

7.7…………………………11

參考文獻(xiàn)

……………………12

GB/T418131—2022

.

前言

本文件按照標(biāo)準(zhǔn)化工作導(dǎo)則第部分標(biāo)準(zhǔn)化文件的結(jié)構(gòu)和起草規(guī)則的規(guī)定

GB/T1.1—2020《1:》

起草

。

本文件是信息技術(shù)智能語(yǔ)音交互測(cè)試方法的第部分已經(jīng)發(fā)布

GB/T41813《》1。GB/T41813

了以下部分

:

第部分語(yǔ)音識(shí)別

———1:;

第部分語(yǔ)義理解

———2:。

請(qǐng)注意本文件的某些內(nèi)容可能涉及專利本文件的發(fā)布機(jī)構(gòu)不承擔(dān)識(shí)別專利的責(zé)任

。。

本文件由全國(guó)信息技術(shù)標(biāo)準(zhǔn)化技術(shù)委員會(huì)提出并歸口

(SAC/TC28)。

本文件起草單位中國(guó)電子技術(shù)標(biāo)準(zhǔn)化研究院科大訊飛股份有限公司小米通訊技術(shù)有限公司華

:、、、

為終端有限公司深圳市優(yōu)必選科技股份有限公司中國(guó)電信集團(tuán)有限公司思必馳科技股份有限公司

、、、、

中國(guó)科學(xué)院自動(dòng)化研究所中國(guó)醫(yī)學(xué)科學(xué)院生物醫(yī)學(xué)工程研究所哈爾濱工業(yè)大學(xué)海信視像科技股份

、、、

有限公司馬上消費(fèi)金融股份有限公司騰訊科技北京有限公司沈陽(yáng)新松機(jī)器人自動(dòng)化股份有限公

、、()、

司深圳市人馬互動(dòng)科技有限公司平安科技深圳有限公司安徽咪鼠科技有限公司涇豐科技深圳

、、()、、()

有限公司北京捷通華聲科技股份有限公司北京百度網(wǎng)訊科技有限公司深圳市北科瑞聲科技股份有

、、、

限公司阿里云計(jì)算有限公司云從科技集團(tuán)股份有限公司網(wǎng)易杭州網(wǎng)絡(luò)有限公司南京云問(wèn)網(wǎng)絡(luò)技

、、、()、

術(shù)有限公司聯(lián)想北京有限公司福州數(shù)據(jù)技術(shù)研究院有限公司國(guó)家網(wǎng)絡(luò)軟件產(chǎn)品質(zhì)量監(jiān)督檢驗(yàn)中

、()、、

心濟(jì)南中汽研天津汽車工程研究院有限公司華南理工大學(xué)山東省計(jì)算中心國(guó)家超級(jí)計(jì)算濟(jì)南

()、()、、(

中心中科極限元杭州智能科技股份有限公司神思電子技術(shù)股份有限公司鄭州中業(yè)科技股份有限

)、()、、

公司中汽數(shù)據(jù)天津有限公司中國(guó)電器科學(xué)研究院有限公司上海計(jì)算機(jī)軟件技術(shù)開(kāi)發(fā)中心北京愛(ài)

、()、、、

數(shù)智慧科技有限公司

。

本文件主要起草人董建徐洋吳國(guó)綱馬萬(wàn)鐘朱亞軍賈一君周立君宋文林袁杰楊震

:、、、、、、、、、、

田定書(shū)錢彥旻陶建華花云飛蒲江波劉斌李海峰王峰楊春勇蘇丹張鋒馮海洪劉國(guó)濤

、、、、、、、、、、、、、

任軍民陳楠刑啟洲魏韜李笑如黃石磊汪淼淼李軍胡光龍楊萌孟憲明溫正棋鹿飛方斌

、、、、、、、、、、、、、、

王岳井焜李介張瑩蔡立志徐向民高永超張晴晴

、、、、、、、。

GB/T418131—2022

.

引言

智能語(yǔ)音交互在智能家居智能客服移動(dòng)終端車載終端以及智慧教育智慧醫(yī)療智能辦公服務(wù)

、、、、、、

機(jī)器人等諸多領(lǐng)域應(yīng)用廣泛已成為當(dāng)前人機(jī)交互的重要方式之一隨著智能語(yǔ)音交互越來(lái)越深入到

,。

生產(chǎn)生活的方方面面需要對(duì)智能語(yǔ)音交互的系統(tǒng)參考框架基礎(chǔ)技術(shù)要求互聯(lián)網(wǎng)接口要求等進(jìn)行統(tǒng)

,、、

一規(guī)范在這方面國(guó)家已制定了支撐智能語(yǔ)音交互系統(tǒng)的基礎(chǔ)性國(guó)家標(biāo)準(zhǔn)在此基礎(chǔ)上也需要用統(tǒng)

。,。,

一的測(cè)試方法和評(píng)價(jià)標(biāo)準(zhǔn)來(lái)對(duì)智能語(yǔ)音交互系統(tǒng)的能力進(jìn)行評(píng)測(cè)為智能語(yǔ)音交互相關(guān)的產(chǎn)品和服務(wù)

,

提供評(píng)測(cè)的基礎(chǔ)方法和依據(jù)

。

信息技術(shù)智能語(yǔ)音交互測(cè)試方法為所有部分信息技術(shù)智能語(yǔ)

GB/T41813《》GB/T36464()《

音交互系統(tǒng)提供基礎(chǔ)通用的測(cè)試方法智能語(yǔ)音交互包括語(yǔ)音識(shí)別語(yǔ)義理解和語(yǔ)音合成三個(gè)基本環(huán)

》。、

節(jié)各環(huán)節(jié)所涉及的測(cè)試對(duì)象測(cè)試項(xiàng)目測(cè)試環(huán)境和測(cè)試方法均有所不同信息技術(shù)

,、、。GB/T41813《

智能語(yǔ)音交互測(cè)試方法旨在確立和描述適用于智能語(yǔ)音交互各環(huán)節(jié)的通用測(cè)試項(xiàng)和通用測(cè)試方法擬

》,

由三個(gè)部分構(gòu)成

。

第部分語(yǔ)音識(shí)別目的在于為智能語(yǔ)音交互應(yīng)用中的語(yǔ)音識(shí)別環(huán)節(jié)提供通用測(cè)試項(xiàng)和通

———1:。

用測(cè)試方法

。

第部分語(yǔ)義理解目的在于為智能語(yǔ)音交互應(yīng)用中的語(yǔ)義理解環(huán)節(jié)提供通用測(cè)試項(xiàng)和通

———2:。

用測(cè)試方法

。

第部分語(yǔ)音合成目的在于為智能語(yǔ)音交互應(yīng)用中的語(yǔ)音合成環(huán)節(jié)提供通用測(cè)試項(xiàng)和通

———3:。

用測(cè)試方法

。

GB/T418131—2022

.

信息技術(shù)智能語(yǔ)音交互測(cè)試方法

第1部分語(yǔ)音識(shí)別

:

1范圍

本文件描述了智能語(yǔ)音交互測(cè)試中語(yǔ)音識(shí)別系統(tǒng)的通用測(cè)試項(xiàng)和通用測(cè)試方法

本文件適用于智能語(yǔ)音服務(wù)提供商用戶和第三方檢測(cè)機(jī)構(gòu)對(duì)智能語(yǔ)音交互應(yīng)用的語(yǔ)音識(shí)別系統(tǒng)

、

測(cè)試的設(shè)計(jì)和實(shí)施

。

2規(guī)范性引用文件

下列文件中的內(nèi)容通過(guò)文中的規(guī)范性引用而構(gòu)成本文件必不可少的條款其中注日期的引用文

。,

件僅該日期對(duì)應(yīng)的版本適用于本文件不注日期的引用文件其最新版本包括所有的修改單適用于

,;,()

本文件

。

中文語(yǔ)音識(shí)別系統(tǒng)通用技術(shù)規(guī)范

GB/T21023

所有部分信息技術(shù)智能語(yǔ)音交互系統(tǒng)

GB/T36464()

3術(shù)語(yǔ)和定義

所有部分界定的以及下列術(shù)語(yǔ)和定義適用于本文件

GB/T36464()。

31

.

語(yǔ)音識(shí)別speechrecognition

將人類的聲音信號(hào)轉(zhuǎn)化為文字或者指令的過(guò)程

。

來(lái)源

溫馨提示

  • 1. 本站所提供的標(biāo)準(zhǔn)文本僅供個(gè)人學(xué)習(xí)、研究之用,未經(jīng)授權(quán),嚴(yán)禁復(fù)制、發(fā)行、匯編、翻譯或網(wǎng)絡(luò)傳播等,侵權(quán)必究。
  • 2. 本站所提供的標(biāo)準(zhǔn)均為PDF格式電子版文本(可閱讀打?。驍?shù)字商品的特殊性,一經(jīng)售出,不提供退換貨服務(wù)。
  • 3. 標(biāo)準(zhǔn)文檔要求電子版與印刷版保持一致,所以下載的文檔中可能包含空白頁(yè),非文檔質(zhì)量問(wèn)題。

評(píng)論

0/150

提交評(píng)論