CESA -2019-3-003人工智能芯片面向端側(cè)的深度學(xué)習(xí)芯片測(cè)試指標(biāo)與測(cè)試方法

上傳人：搬*** IP屬地：浙江上傳時(shí)間：2024-07-10 格式：PDF 頁(yè)數(shù)：17 大小：748.77KB 積分：11 舉報(bào) 版權(quán)申訴

CESA -2019-3-003人工智能芯片面向端側(cè)的深度學(xué)習(xí)芯片測(cè)試指標(biāo)與測(cè)試方法_第2頁(yè)

CESA -2019-3-003人工智能芯片面向端側(cè)的深度學(xué)習(xí)芯片測(cè)試指標(biāo)與測(cè)試方法_第3頁(yè)

CESA -2019-3-003人工智能芯片面向端側(cè)的深度學(xué)習(xí)芯片測(cè)試指標(biāo)與測(cè)試方法_第4頁(yè)

CESA -2019-3-003人工智能芯片面向端側(cè)的深度學(xué)習(xí)芯片測(cè)試指標(biāo)與測(cè)試方法_第5頁(yè)

已閱讀5頁(yè)，還剩12頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

在提交反饋意見時(shí)，請(qǐng)將您知道

ICS

的相關(guān)專利連同支持性文件一并

附上

團(tuán)體標(biāo)準(zhǔn)

T/CESAXXXX—2019

人工智能芯片面向端側(cè)的深度學(xué)習(xí)芯片

測(cè)試指標(biāo)與測(cè)試方法

AIChipsTestIndexandTestMethodofDeepLearningChipsforTerminalSide

（征求意見稿）

2019--發(fā)布2019-XX-實(shí)施

中國(guó)電子工業(yè)標(biāo)準(zhǔn)化技術(shù)協(xié)會(huì)發(fā)布

T/CESAXXXX-2019

前??言

本標(biāo)準(zhǔn)依據(jù)GB/T1.1—2009《標(biāo)準(zhǔn)化工作導(dǎo)則第1部分：標(biāo)準(zhǔn)的結(jié)構(gòu)和編寫》給出的規(guī)則起草。

請(qǐng)注意本文件的某些內(nèi)容可能涉及專利。本文件的發(fā)布機(jī)構(gòu)不承擔(dān)識(shí)別這些專利的責(zé)任。

本標(biāo)準(zhǔn)由全國(guó)信息技術(shù)標(biāo)準(zhǔn)化技術(shù)委員會(huì)(SAC/TC28)提出并歸口。

本標(biāo)準(zhǔn)起草單位：

本標(biāo)準(zhǔn)主要起草人：

T/CESAXXXX-2019

人工智能芯片面向端側(cè)的深度學(xué)習(xí)芯片測(cè)試指標(biāo)與測(cè)試方法

1范圍

本標(biāo)準(zhǔn)規(guī)定了對(duì)端側(cè)深度學(xué)習(xí)芯片進(jìn)行功能、性能測(cè)試的測(cè)試指標(biāo)、測(cè)試方法和要求，適用于通用

端側(cè)深度學(xué)習(xí)芯片。本標(biāo)準(zhǔn)只規(guī)定端側(cè)深度學(xué)習(xí)芯片基準(zhǔn)測(cè)試的一般原則，針對(duì)具體端側(cè)深度學(xué)習(xí)芯片

產(chǎn)品應(yīng)制定相應(yīng)的測(cè)試細(xì)則。

本標(biāo)準(zhǔn)適用于第三方機(jī)構(gòu)對(duì)通用端側(cè)深度學(xué)習(xí)芯片進(jìn)行性能測(cè)試與評(píng)估，也適用于端側(cè)深度學(xué)習(xí)芯

片產(chǎn)品的采購(gòu)、設(shè)計(jì)。

2規(guī)范性引用文件

下列文件對(duì)于本文件的應(yīng)用是必不可少的。凡是注日期的引用文件，僅注日期的版本適用于本文件。

凡是不注日期的引用文件，其最新版本（包括所有的修改單）適用于本文件。

GB/T5271.31-2006信息技術(shù)詞匯第31部分：人工智能機(jī)器學(xué)習(xí)

GB/T5271.34-2006信息技術(shù)詞匯第34部分：人工智能神經(jīng)網(wǎng)絡(luò)

20190851-T-469信息技術(shù)人工智能術(shù)語(yǔ)

T/CESA1026-2018人工智能深度學(xué)習(xí)算法評(píng)估規(guī)范

3術(shù)語(yǔ)和定義

下列術(shù)語(yǔ)和定義適用于本文件。

3.1

機(jī)器學(xué)習(xí)Machinelearning

一種程序或系統(tǒng)，用于根據(jù)輸入數(shù)據(jù)構(gòu)建（訓(xùn)練）預(yù)測(cè)模型。這種系統(tǒng)會(huì)利用學(xué)到的模型根據(jù)從分

布（訓(xùn)練該模型時(shí)使用的同一分布）中提取的新數(shù)據(jù)（以前從未見過的數(shù)據(jù)）進(jìn)行實(shí)用的預(yù)測(cè)。機(jī)器學(xué)

習(xí)還指與這些程序或系統(tǒng)相關(guān)的研究領(lǐng)域。

3.2

深度學(xué)習(xí)DeepLearning

機(jī)器學(xué)習(xí)中一種基于對(duì)數(shù)據(jù)進(jìn)行表征學(xué)習(xí)的方法，通過組合低層特征形成更加抽象的高層表示屬性

類別或特征，以發(fā)現(xiàn)數(shù)據(jù)的分布式特征表示。

3.3

卷積神經(jīng)網(wǎng)絡(luò)Convolutionalneuralnetwork

T/CESAXXXX-2019

機(jī)器學(xué)習(xí)中一種基于對(duì)數(shù)據(jù)進(jìn)行表征學(xué)習(xí)的方法，通過組合低層特征形成更加抽象的高層表示屬性

類別或特征，以發(fā)現(xiàn)數(shù)據(jù)的分布式特征表示。

3.4

循環(huán)神經(jīng)網(wǎng)絡(luò)RecurrentNeuralNetwork

一種神經(jīng)網(wǎng)絡(luò)，是一類以序列（sequence）數(shù)據(jù)為輸入，在序列的演進(jìn)方向進(jìn)行遞歸（recursion）

且所有節(jié)點(diǎn)（循環(huán)單元）按鏈?zhǔn)竭B接的遞歸神經(jīng)，網(wǎng)絡(luò)具有短期記憶能力的神經(jīng)網(wǎng)絡(luò)。

3.5

遞歸神經(jīng)網(wǎng)絡(luò)Recursiveneuralnetwork

深度學(xué)習(xí)（deeplearning）算法之一，具有樹狀階層結(jié)構(gòu)且網(wǎng)絡(luò)節(jié)點(diǎn)按其連接順序?qū)斎胄畔⑦M(jìn)行

遞歸的人工神經(jīng)網(wǎng)絡(luò)（ArtificialNeuralNetwork,ANN）。

3.6

層Layer

神經(jīng)網(wǎng)絡(luò)中的一組神經(jīng)元，負(fù)責(zé)處理一組輸入特征，或一組神經(jīng)元的輸出。

3.7

推理Inference

在機(jī)器學(xué)習(xí)中，推斷通常指將訓(xùn)練過的模型應(yīng)用于無標(biāo)簽樣本，進(jìn)而來做出預(yù)測(cè)的過程。

3.8

批次Batch

模型訓(xùn)練的一次迭代（即一次梯度更新）中使用的樣本集。

3.9

批次大小Batchsize

一個(gè)批次中的樣本數(shù)。批次大小在訓(xùn)練和推斷期間通常是固定的。

3.10

測(cè)試集testset

數(shù)據(jù)集的子集，用于在模型經(jīng)由驗(yàn)證集的初步驗(yàn)證之后測(cè)試模型。

4縮略語(yǔ)

下列縮略語(yǔ)適用于本文件。

T/CESAXXXX-2019

mAP:平均精度均值（MeanAveragePrecision）

mIoU:平均交并比（MeanIntersectionoverUnion）

FAR:誤識(shí)率(FalseAcceptRate)

FRR:拒識(shí)率(FalseRejectRate)

IR:識(shí)別正確率（IdentificationRate）

WER:詞錯(cuò)誤率（WordErrorRate）

SER:句錯(cuò)誤率（SentenceErrorRate）

5技術(shù)要求

5.1測(cè)試框架

針對(duì)端側(cè)深度學(xué)習(xí)芯片的測(cè)試，主要是根據(jù)本標(biāo)準(zhǔn)中規(guī)定的評(píng)估方法，對(duì)其每個(gè)測(cè)試指標(biāo)進(jìn)行評(píng)估。

詳細(xì)內(nèi)容見“5試驗(yàn)方法”。

5.2測(cè)試對(duì)象

端側(cè)人工智能處理器，具體形式有以下兩種：

（1）端側(cè)人工智能處理器芯片（卡）：指以芯片卡形態(tài)進(jìn)行使用的人工智能芯片，如FPGA以及ASIC

等人工智能芯片（卡），可通過PCIE等接口與測(cè)試主機(jī)連接；

（2）搭載人工智能處理器的端側(cè)產(chǎn)品。

5.3測(cè)試網(wǎng)絡(luò)架構(gòu)

1）控制主機(jī)處理器架構(gòu)：X86架構(gòu)或ARM架構(gòu)。

2）支持主流的機(jī)器學(xué)習(xí)框架：Tensorflow、Caffe、MindSpore等。

5.4測(cè)試場(chǎng)景信息

1）典型應(yīng)用場(chǎng)景：計(jì)算機(jī)視覺任務(wù)（圖像分類、目標(biāo)檢測(cè)、語(yǔ)義分割等）和自然語(yǔ)言處理任務(wù)；

2）數(shù)據(jù)集：公開數(shù)據(jù)集或真實(shí)應(yīng)用場(chǎng)景數(shù)據(jù)集；

3）模型：經(jīng)典神經(jīng)網(wǎng)絡(luò)模型或自定義模型。

6測(cè)試方法

6.1測(cè)試指標(biāo)

主要測(cè)試指標(biāo)如表1所示：

表1應(yīng)用場(chǎng)景測(cè)試指標(biāo)

類型主要指標(biāo)

1.1平均前向推理時(shí)間

端側(cè)芯片1.2最大吞吐性能

1.3前向處理延遲性能

T/CESAXXXX-2019

1.4功耗

1.5能效比

6.2測(cè)試指標(biāo)描述

6.2.1平均前向推理時(shí)間

指模型完成一個(gè)樣本的推斷所需要時(shí)間。在圖像處理相關(guān)領(lǐng)域，利用指標(biāo)每秒幀率（FramePer

Second，F(xiàn)PS）評(píng)估速度，即每秒內(nèi)可以處理的圖片數(shù)量。

6.2.2最大吞吐性能

指單芯片或者多芯片在前向推理過程或訓(xùn)練過程中可同時(shí)處理的最大樣本數(shù)量。

6.2.3前向處理延遲性能

硬件在進(jìn)行前向推理計(jì)算過程中，從圖片輸入完成到計(jì)算結(jié)果開始輸出之間的時(shí)間間隔。

6.2.4功耗

進(jìn)行模型推斷過程中，芯片（或其所在測(cè)試板）或搭載人工智能處理器的云的平均功率。

6.2.5能效比

進(jìn)行模型推斷過程中，單芯片或者多芯片單位時(shí)間內(nèi)執(zhí)行運(yùn)算的次數(shù)與芯片功耗之比。

6.3測(cè)試類型

6.3.1通用測(cè)試

參照附錄中“典型場(chǎng)景測(cè)試參照表”，針對(duì)不同領(lǐng)域采用公開數(shù)據(jù)集和經(jīng)典神經(jīng)網(wǎng)絡(luò)模型對(duì)端側(cè)深

度學(xué)習(xí)芯片進(jìn)行測(cè)試，驗(yàn)證端側(cè)深度學(xué)習(xí)芯片在使用所屬應(yīng)用領(lǐng)域主流公開數(shù)據(jù)集及主流神經(jīng)網(wǎng)絡(luò)模型

時(shí)的功能及性能特征。

6.3.2專用測(cè)試

采用用戶提供的真實(shí)應(yīng)用場(chǎng)景數(shù)據(jù)集（公開可獲?。┗蛘咂渥远x神經(jīng)網(wǎng)絡(luò)模型對(duì)端側(cè)深度學(xué)習(xí)芯

片進(jìn)行測(cè)試，驗(yàn)證其端側(cè)深度學(xué)習(xí)芯片在使用真實(shí)應(yīng)用場(chǎng)景數(shù)據(jù)集或者自定義神經(jīng)網(wǎng)絡(luò)模型時(shí)的功能及

性能特征。

6.4指標(biāo)測(cè)試方法

6.5.1平均前向推理時(shí)間

平均前向推理時(shí)間的單位是ms（毫秒）。

指被測(cè)硬件使用神經(jīng)網(wǎng)絡(luò)模型平均預(yù)測(cè)一單位測(cè)試數(shù)據(jù)所需要的時(shí)間。

計(jì)算公式：

平均前向推理時(shí)間=

注：

T/CESAXXXX-2019

總預(yù)測(cè)時(shí)間：被測(cè)硬件使用神經(jīng)網(wǎng)絡(luò)模型，在測(cè)試數(shù)據(jù)集上完成測(cè)試所使用的總計(jì)算時(shí)間（硬件一

次處理一單位的測(cè)試數(shù)據(jù)）。

總測(cè)試樣本數(shù)量：指測(cè)試數(shù)據(jù)集中樣本的總數(shù)量。

6.5.2最大吞吐性能

硬件在進(jìn)行訓(xùn)練和前向推理計(jì)算過程中，單位時(shí)間內(nèi)能輸入的最大樣本數(shù)量。

可以在訓(xùn)練和前向推理計(jì)算前，通過不斷調(diào)整參數(shù)，增加單位時(shí)間內(nèi)輸入樣本的數(shù)量，來最終確定

硬件的最大吞吐性能。

6.5.3前向處理延遲性能

前向處理延遲的單位是ms（毫秒）

硬件在進(jìn)行前向推理計(jì)算過程中，從圖片輸入完成到計(jì)算結(jié)果開始輸出之間的時(shí)間間隔。

計(jì)算公式：

前向處理延遲=當(dāng)前幀處理結(jié)果開始輸出的時(shí)刻-當(dāng)前幀輸入完成時(shí)刻

6.5.4功耗

功耗的單位是watt（瓦特）。

指執(zhí)行測(cè)試期間的被測(cè)硬件平均功耗。

針對(duì)不同形態(tài)的被測(cè)對(duì)象使用對(duì)應(yīng)的功耗測(cè)試方法，對(duì)被測(cè)硬件在執(zhí)行測(cè)試期間的功耗情況進(jìn)行記

錄，最終通過計(jì)算得到該硬件的平均功耗情況。

6.5.5能效比

能效比的單位是：images/sec/watt（處理圖像數(shù)量/秒/瓦特）。針對(duì)自然語(yǔ)言處理任務(wù)，能效比

的單位是：word/sec/watt(處理單詞數(shù)量/秒/瓦特)。

計(jì)算公式：

能效比=

注：

總計(jì)算操作數(shù)量：指用于測(cè)試的神經(jīng)網(wǎng)絡(luò)模型中，所有計(jì)算操作的總數(shù)量和。

功耗：指執(zhí)行測(cè)試期間的硬件平均功耗。

T/CESAXXXX-2019

附錄通用端側(cè)深度學(xué)習(xí)芯片測(cè)試參數(shù)參照表

測(cè)試測(cè)試神經(jīng)關(guān)鍵指標(biāo)

分類編號(hào)應(yīng)用場(chǎng)景推理精度

數(shù)據(jù)集網(wǎng)絡(luò)模型推理速率處理延遲功耗

ResNet-50,

ResNet-101，

圖像分類

ImageNetVGG-16，top-1,top-5

1（準(zhǔn)確識(shí)別圖片

Inception-v3，算法準(zhǔn)確率

中的物體類別）

MobileNet

計(jì)算目標(biāo)檢測(cè)Faster-RCNN

機(jī)視2（定位物體位置，并MicrosoftCOCO(withFPN)，mAPFPS

覺任標(biāo)注物體類別）YoloV3,SSD

務(wù)語(yǔ)義分割mswatt

VOC2012SegNet，U-Net，

3（識(shí)別圖像中mIoU,F-Score

CitescapeFCN,Deeplabv3+

所有像素類別）

FAR、FRR、

人臉識(shí)別（根據(jù)人面CASIA-WebFaceDeepID3,

4Identification

部特征識(shí)別身份）LFWArcFace

Rate

聯(lián)合國(guó)平行語(yǔ)料庫(kù)、

自然1機(jī)器翻譯AIChallenger文本seq2seqBLEU，METEOR翻譯速度

語(yǔ)言翻譯數(shù)據(jù)集

處理THCHS30

DFSMN

任務(wù)2語(yǔ)音識(shí)別AISHELLWER、SER識(shí)別速度

DFCNN

AudioSet

6.2.1應(yīng)用場(chǎng)景描述說明：

6.31.圖像分類及分類效果評(píng)估

任務(wù)為準(zhǔn)確識(shí)別圖片中的物體類別，擬采用模型ResNet-50、ResNet-101、VGG16、Inception-v3和

MobileNet，數(shù)據(jù)集為ImageNet。

衡量圖像分類效果的性能評(píng)價(jià)指標(biāo)為：

Top-1準(zhǔn)確率：圖像分類結(jié)果中排名第一的分類類別與實(shí)際結(jié)果相同的準(zhǔn)確率；

Top-5準(zhǔn)確率：圖像分類結(jié)果中排名前五的分類類別包含實(shí)際結(jié)果的準(zhǔn)確率。

T/CESAXXXX-2019

6.42.目標(biāo)檢測(cè)及檢測(cè)效果評(píng)估

任務(wù)為在給定的圖片中精確找到物體所在位置、并標(biāo)注出物體的類別。包括兩階段模型（Faster

R-CNN）和一階段模型（YoloV3、SSD），數(shù)據(jù)集為VOC、COCO。

衡量目標(biāo)檢測(cè)效果的性能評(píng)價(jià)指標(biāo)為：

平均精度均值（MeanAveragePrecision,mAP）：數(shù)據(jù)集中所有類別的平均精度的均值。

計(jì)算公式：

平均精度均值=所有類別的平均精度值之和/所有類別的數(shù)目

6.53.語(yǔ)義分割及分割效果評(píng)估

任務(wù)為逐像素的標(biāo)注任務(wù)，即為輸入圖像中每一個(gè)像素賦予預(yù)先設(shè)定的類別，選取模型為

Deeplabv3+，SegNet，U-Net和FCN，數(shù)據(jù)集VOC2012和Citescape。

衡量圖像語(yǔ)義分割任務(wù)的性能評(píng)價(jià)指標(biāo)為：

平均交并比（MeanIntersectionoverUnion，mIoU）：所有類別的交并比IoU的平均值。計(jì)算真實(shí)

值（groundtruth）和預(yù)測(cè)值（predictedsegmentation）兩個(gè)集合的交集和并集之比，即為每個(gè)類別的交

并比IoU。

F分?jǐn)?shù)：綜合權(quán)衡精確率和召回率的指標(biāo)。

計(jì)算公式：

PrecisionRecall

F?Score=

β2Precision+Recall

注：

精確率(Precision)：識(shí)別正確的結(jié)果在所識(shí)別出的結(jié)果中所占的比率；

召回率(Recall)：識(shí)別正確的結(jié)果占數(shù)據(jù)集中所有要識(shí)別出的總數(shù)的比率。

6.64.人臉識(shí)別及識(shí)別效果評(píng)估

任務(wù)為在給定的人臉中準(zhǔn)確的識(shí)別出人的特征，選區(qū)模型為DeepID3和ArcFace，數(shù)據(jù)集為WebFace

和LFW。身份衡量人臉識(shí)別效果采取的性能評(píng)價(jià)指標(biāo)為：

T/CESAXXXX-2019

誤識(shí)率(FalseAcceptRate,FAR)：此處表示將其他人誤作指定人員的概率；拒識(shí)率(FalseRejectRate,

FRR)：此處表示將指定人員誤作其它人員的概率；識(shí)別正確率（IdentificationRate）：此處表示

正確識(shí)別人次與參與識(shí)別的注冊(cè)人員總?cè)舜沃取?/p>

6.75.機(jī)器翻譯及效果評(píng)估

任務(wù)為將給定的中文、英文或其他語(yǔ)言文本翻譯成另外一種制定語(yǔ)言的過程。使用模型seq2seq，

數(shù)據(jù)集采用聯(lián)合國(guó)平行語(yǔ)料庫(kù)、AIChallenger文本翻譯數(shù)據(jù)集。

衡量機(jī)器翻譯效果采取的性能評(píng)價(jià)指標(biāo)為：

BLEU（bilingualevaluationunderstudy）：用于評(píng)價(jià)機(jī)器譯文與參考譯文的相似度。

計(jì)算公式：

BLEU=同時(shí)出現(xiàn)在機(jī)器譯文和參考譯文中的詞的個(gè)數(shù)/機(jī)器譯文的單詞數(shù)目

METEOR（MetricforEvaluationofTranslationwithExplicitOrdering）:用于評(píng)價(jià)機(jī)器學(xué)習(xí)翻譯系統(tǒng)

的指標(biāo)，為對(duì)應(yīng)最佳候選譯文和參考譯文之間的準(zhǔn)確率和召回率的調(diào)和平均。

6.語(yǔ)音識(shí)別及效果評(píng)估

任務(wù)為將給定的中文或英文語(yǔ)音識(shí)別為文字，采用的模型為阿里巴巴的DFSMN，科大訊飛的

DFCNN，數(shù)據(jù)集采用THCHS30、AISHELL、AudioSet。

衡量語(yǔ)音識(shí)別的性能測(cè)試指標(biāo)為：

詞錯(cuò)誤率（WER）：語(yǔ)音識(shí)別后插入(/替換/刪除)的詞的總個(gè)數(shù)占標(biāo)準(zhǔn)的詞序列中詞的個(gè)數(shù)的百分

比。

句錯(cuò)誤率（SER）：句子中如果有一個(gè)詞識(shí)別錯(cuò)誤，那么這個(gè)句子被認(rèn)為識(shí)別錯(cuò)誤，SER即句子識(shí)

別錯(cuò)誤的個(gè)數(shù)占句子總數(shù)的百分比。

T/CESAXXXX-2019

中國(guó)電子工業(yè)標(biāo)準(zhǔn)化技術(shù)協(xié)會(huì)（CESA）是全國(guó)電子信息產(chǎn)業(yè)標(biāo)準(zhǔn)化組織和標(biāo)準(zhǔn)化工作者自愿組成的

社會(huì)團(tuán)體。廣泛聯(lián)系全國(guó)電子信息產(chǎn)業(yè)標(biāo)準(zhǔn)化機(jī)構(gòu)和標(biāo)準(zhǔn)化工作者，協(xié)助政府部門搞好電子信息產(chǎn)業(yè)標(biāo)

準(zhǔn)化工作，開拓信息技術(shù)領(lǐng)域的標(biāo)準(zhǔn)化工作是中國(guó)電子工業(yè)標(biāo)準(zhǔn)化技術(shù)協(xié)會(huì)的主要工作內(nèi)容之一。中國(guó)

境內(nèi)從事科研開發(fā)、制造、營(yíng)銷和服務(wù)的企事業(yè)單位、高等院校、社會(huì)組織和個(gè)人均可隨時(shí)向中國(guó)電子

工業(yè)標(biāo)準(zhǔn)化技術(shù)協(xié)會(huì)團(tuán)體標(biāo)準(zhǔn)工作部提出團(tuán)體標(biāo)準(zhǔn)項(xiàng)目建議。

中國(guó)電子工業(yè)標(biāo)準(zhǔn)化技術(shù)協(xié)會(huì)標(biāo)準(zhǔn)按照《電子工業(yè)標(biāo)準(zhǔn)化技術(shù)協(xié)會(huì)協(xié)會(huì)團(tuán)體標(biāo)準(zhǔn)管理辦法》進(jìn)行制

定和管理。

在本標(biāo)準(zhǔn)實(shí)施過程中，如發(fā)現(xiàn)需要修改或補(bǔ)充之處，請(qǐng)將意見和有關(guān)資料寄至中國(guó)電子工業(yè)標(biāo)準(zhǔn)化

技術(shù)協(xié)會(huì)，以便修訂時(shí)參考。

本標(biāo)準(zhǔn)版權(quán)歸中國(guó)電子工業(yè)標(biāo)準(zhǔn)化技術(shù)協(xié)會(huì)所有。

中國(guó)電子工業(yè)標(biāo)準(zhǔn)化技術(shù)協(xié)會(huì)地址：北京市海淀區(qū)萬(wàn)壽路27號(hào)

電話子郵箱：standards@

網(wǎng)址：

T/XXXXXXXX—XXXX

前??言...............................................................................................................................................................II

人工智能芯片面向端側(cè)的深度學(xué)習(xí)芯片測(cè)試指標(biāo)與測(cè)試方法....................................................................1

1范圍.....................................................................................................................................................................1

2規(guī)范性引用文件.................................................................................................................................................1

3術(shù)語(yǔ)和定義.........................................................................................................................................................1

4縮略語(yǔ).................................................................................................................................................................2

5技術(shù)要求.............................................................................................................................................................3

5.1測(cè)試框架.........................................................................................................................................................3

5.2測(cè)試對(duì)象.........................................................................................................................................................3

5.3測(cè)試網(wǎng)絡(luò)架構(gòu).................................................................................................................................................3

5.4測(cè)試場(chǎng)景信息.................................................................................................................................................3

6測(cè)試方法.............................................................................................................................................................3

6.1測(cè)試指標(biāo).....................................................................................................................................................3

6.2測(cè)試指標(biāo)描述.................................................................................................................................................4

6.2.1平均前向推理時(shí)間.................................................................................................................................4

6.2.2最大吞吐性能..........................................................................................................................................4

6.2.3前向處理延遲性能.................................................................................................................................4

6.2.4功耗.........................................................................................................................................................4

6.2.5能效比.....................................................................................................................................................4

6.3測(cè)試類型.........................................................................................................................................................4

6.3.1通用測(cè)試.................................................................................................................................................4

6.3.2專用測(cè)試.................................................................................................................................................4

6.4指標(biāo)測(cè)試方法.................................................................................................................................................4

6.5.1平均前向推理時(shí)間.................................................................................................................................4

6.5.2最大吞吐性能.........................................................................................................................................5

6.5.3前向處理延遲性能.................................................................................................................................5

6.5.4功耗.........................................................................................................................................................5

6.5.5能效比.....................................................................................................................................................5

附錄通用端側(cè)深度學(xué)習(xí)芯片測(cè)試參數(shù)參照表..............................................................6

T/CESAXXXX-2019

人工智能芯片面向端側(cè)的深度學(xué)習(xí)芯片測(cè)試指標(biāo)與測(cè)試方法

1范圍

本標(biāo)準(zhǔn)規(guī)定了對(duì)端側(cè)深度學(xué)習(xí)芯片進(jìn)行功能、性能測(cè)試的測(cè)試指標(biāo)、測(cè)試方法和要求，適用于通用

產(chǎn)品應(yīng)制定相應(yīng)的測(cè)試細(xì)則。

片產(chǎn)品的采購(gòu)、設(shè)計(jì)。

2規(guī)范性引用文件

下列文件對(duì)于本文件的應(yīng)用是必不可少的。凡是注日期的引用文件，僅注日期的版本適用于本文件。

凡是不注日期的引用文件，其最新版本（包括所有的修改單）適用于本文件。

GB/T5271.31-2006信息技術(shù)詞匯第31部分：人工智能機(jī)器學(xué)習(xí)

GB/T5271.34-2006信息技術(shù)詞匯第34部分：人工智能神經(jīng)網(wǎng)絡(luò)

20190851-T-469信息技術(shù)人工智能術(shù)語(yǔ)

T/CESA1026-2018人工智能深度學(xué)習(xí)算法評(píng)估規(guī)范

3術(shù)語(yǔ)和定義

下列術(shù)語(yǔ)和定義適用于本文件。

3.1

機(jī)器學(xué)習(xí)Machinelearning

一種程序或系統(tǒng)，用于根據(jù)輸入數(shù)據(jù)構(gòu)建（訓(xùn)練）預(yù)測(cè)模型。這種系統(tǒng)會(huì)利用學(xué)到的模型根據(jù)從分

習(xí)還指與這些程序或系統(tǒng)相關(guān)的研究領(lǐng)域。

3.2

深度學(xué)習(xí)DeepLearning

機(jī)器學(xué)習(xí)中一種基于對(duì)數(shù)據(jù)進(jìn)行表征學(xué)習(xí)的方法，通過組合低層特征形成更加抽象的高層表示屬性

類別或特征，以發(fā)現(xiàn)數(shù)據(jù)的分布式特征表示。

3.3

卷積神經(jīng)網(wǎng)絡(luò)Convolutionalneuralnetwork

T/CESAXXXX-2019

機(jī)器學(xué)習(xí)中一種基于對(duì)數(shù)據(jù)進(jìn)行表征學(xué)習(xí)的方法，通過組合低層特征形成更加抽象的高層表示屬性

類別或特征，以發(fā)現(xiàn)數(shù)據(jù)的分布式特征表示。

3.4

循環(huán)神經(jīng)網(wǎng)絡(luò)RecurrentNeuralNetwork

一種神經(jīng)網(wǎng)絡(luò)，是一類以序列（sequence）數(shù)據(jù)為輸入，在序列的演進(jìn)方向進(jìn)行遞歸（recursion）

且所有節(jié)點(diǎn)（循環(huán)單元）按鏈?zhǔn)竭B接的遞歸神經(jīng)，網(wǎng)絡(luò)具有短期記憶能力的神經(jīng)網(wǎng)絡(luò)。

3.5

遞歸神經(jīng)網(wǎng)絡(luò)Recursiveneuralnetwork

深度學(xué)習(xí)（deeplearning）算法之一，具有樹狀階層結(jié)構(gòu)且網(wǎng)絡(luò)節(jié)點(diǎn)按其連接順序?qū)斎胄畔⑦M(jìn)行

遞歸的人工神經(jīng)網(wǎng)絡(luò)（ArtificialNeuralNetwork,ANN）。

3.6

層Layer

神經(jīng)網(wǎng)絡(luò)中的一組神經(jīng)元，負(fù)責(zé)處理一組輸入特征，或一組神經(jīng)元的輸出。

3.7

推理Inference

在機(jī)器學(xué)習(xí)中，推斷通常指將訓(xùn)練過的模型應(yīng)用于無標(biāo)簽樣本，進(jìn)而來做出預(yù)測(cè)的過程。

3.8

批次Batch

模型訓(xùn)練的一次迭代（即一次梯度更新）中使用的樣本集。

3.9

批次大小Batchsize

一個(gè)批次中的樣本數(shù)。批次大小在訓(xùn)練和推斷期間通常是固定的。

3.10

測(cè)試集testset

數(shù)據(jù)集的子集，用于在模型經(jīng)由驗(yàn)證集的初步驗(yàn)證之后測(cè)試模型。

4縮略語(yǔ)

下列縮略語(yǔ)適用于本文件。

T/CESAXXXX-2019

mAP:平均精度均值（MeanAveragePrecision）

mIoU:平均交并比（MeanIntersectionoverUnion）

FAR:誤識(shí)率(FalseAcceptRate)

FRR:拒識(shí)率(FalseRejectRate)

IR:識(shí)別正確率（IdentificationRate）

WER:詞錯(cuò)誤率（WordErrorRate）

SER:句錯(cuò)誤率（SentenceErrorRate）

5技術(shù)要求

5.1測(cè)試框架

詳細(xì)內(nèi)容見“5試驗(yàn)方法”。

5.2測(cè)試對(duì)象

端側(cè)人工智能處理器，具體形式有以下兩種：

（1）端側(cè)人工智能處理器芯片（卡）：指以芯片卡形態(tài)進(jìn)行使用的人工智能芯片，如FPGA以及ASIC

等人工智能芯片（卡），可通過PCIE等接口與測(cè)試主機(jī)連接；

（2）搭載人工智能處理器的端側(cè)產(chǎn)品。

5.3測(cè)試網(wǎng)絡(luò)架構(gòu)

1）控制主機(jī)處理器架構(gòu)：X86架構(gòu)或ARM架構(gòu)。

2）支持主流的機(jī)器學(xué)習(xí)框架：Tensorflow、Caffe、MindSpore等。

5.4測(cè)試場(chǎng)景信息

1）典型應(yīng)用場(chǎng)景：計(jì)算機(jī)視覺任務(wù)（圖像分類、目標(biāo)檢測(cè)、語(yǔ)義分割等）和自然語(yǔ)言處理任務(wù)；

2）數(shù)據(jù)

人人文庫(kù)> 全部分類> 辦公材料 > 辦公文檔

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

CESA -2019-3-003人工智能芯片面向端側(cè)的深度學(xué)習(xí)芯片測(cè)試指標(biāo)與測(cè)試方法

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

CESA -2019-3-003人工智能芯片 面向端側(cè)的深度學(xué)習(xí)芯片測(cè)試指標(biāo)與測(cè)試方法

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔

CESA -2019-3-003人工智能芯片面向端側(cè)的深度學(xué)習(xí)芯片測(cè)試指標(biāo)與測(cè)試方法