版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
在提交反饋意見時(shí),請(qǐng)將您知道
ICS
的相關(guān)專利連同支持性文件一并
附上
團(tuán)體標(biāo)準(zhǔn)
T/CESAXXXX—2019
人工智能芯片面向端側(cè)的深度學(xué)習(xí)芯片
測(cè)試指標(biāo)與測(cè)試方法
AIChipsTestIndexandTestMethodofDeepLearningChipsforTerminalSide
(征求意見稿)
2019--發(fā)布2019-XX-實(shí)施
中國(guó)電子工業(yè)標(biāo)準(zhǔn)化技術(shù)協(xié)會(huì)發(fā)布
T/CESAXXXX-2019
前??言
本標(biāo)準(zhǔn)依據(jù)GB/T1.1—2009《標(biāo)準(zhǔn)化工作導(dǎo)則第1部分:標(biāo)準(zhǔn)的結(jié)構(gòu)和編寫》給出的規(guī)則起草。
請(qǐng)注意本文件的某些內(nèi)容可能涉及專利。本文件的發(fā)布機(jī)構(gòu)不承擔(dān)識(shí)別這些專利的責(zé)任。
本標(biāo)準(zhǔn)由全國(guó)信息技術(shù)標(biāo)準(zhǔn)化技術(shù)委員會(huì)(SAC/TC28)提出并歸口。
本標(biāo)準(zhǔn)起草單位:
本標(biāo)準(zhǔn)主要起草人:
II
T/CESAXXXX-2019
人工智能芯片面向端側(cè)的深度學(xué)習(xí)芯片測(cè)試指標(biāo)與測(cè)試方法
1范圍
本標(biāo)準(zhǔn)規(guī)定了對(duì)端側(cè)深度學(xué)習(xí)芯片進(jìn)行功能、性能測(cè)試的測(cè)試指標(biāo)、測(cè)試方法和要求,適用于通用
端側(cè)深度學(xué)習(xí)芯片。本標(biāo)準(zhǔn)只規(guī)定端側(cè)深度學(xué)習(xí)芯片基準(zhǔn)測(cè)試的一般原則,針對(duì)具體端側(cè)深度學(xué)習(xí)芯片
產(chǎn)品應(yīng)制定相應(yīng)的測(cè)試細(xì)則。
本標(biāo)準(zhǔn)適用于第三方機(jī)構(gòu)對(duì)通用端側(cè)深度學(xué)習(xí)芯片進(jìn)行性能測(cè)試與評(píng)估,也適用于端側(cè)深度學(xué)習(xí)芯
片產(chǎn)品的采購(gòu)、設(shè)計(jì)。
2規(guī)范性引用文件
下列文件對(duì)于本文件的應(yīng)用是必不可少的。凡是注日期的引用文件,僅注日期的版本適用于本文件。
凡是不注日期的引用文件,其最新版本(包括所有的修改單)適用于本文件。
GB/T5271.31-2006信息技術(shù)詞匯第31部分:人工智能機(jī)器學(xué)習(xí)
GB/T5271.34-2006信息技術(shù)詞匯第34部分:人工智能神經(jīng)網(wǎng)絡(luò)
20190851-T-469信息技術(shù)人工智能術(shù)語(yǔ)
T/CESA1026-2018人工智能深度學(xué)習(xí)算法評(píng)估規(guī)范
3術(shù)語(yǔ)和定義
下列術(shù)語(yǔ)和定義適用于本文件。
3.1
機(jī)器學(xué)習(xí)Machinelearning
一種程序或系統(tǒng),用于根據(jù)輸入數(shù)據(jù)構(gòu)建(訓(xùn)練)預(yù)測(cè)模型。這種系統(tǒng)會(huì)利用學(xué)到的模型根據(jù)從分
布(訓(xùn)練該模型時(shí)使用的同一分布)中提取的新數(shù)據(jù)(以前從未見過的數(shù)據(jù))進(jìn)行實(shí)用的預(yù)測(cè)。機(jī)器學(xué)
習(xí)還指與這些程序或系統(tǒng)相關(guān)的研究領(lǐng)域。
3.2
深度學(xué)習(xí)DeepLearning
機(jī)器學(xué)習(xí)中一種基于對(duì)數(shù)據(jù)進(jìn)行表征學(xué)習(xí)的方法,通過組合低層特征形成更加抽象的高層表示屬性
類別或特征,以發(fā)現(xiàn)數(shù)據(jù)的分布式特征表示。
3.3
卷積神經(jīng)網(wǎng)絡(luò)Convolutionalneuralnetwork
1
T/CESAXXXX-2019
機(jī)器學(xué)習(xí)中一種基于對(duì)數(shù)據(jù)進(jìn)行表征學(xué)習(xí)的方法,通過組合低層特征形成更加抽象的高層表示屬性
類別或特征,以發(fā)現(xiàn)數(shù)據(jù)的分布式特征表示。
3.4
循環(huán)神經(jīng)網(wǎng)絡(luò)RecurrentNeuralNetwork
一種神經(jīng)網(wǎng)絡(luò),是一類以序列(sequence)數(shù)據(jù)為輸入,在序列的演進(jìn)方向進(jìn)行遞歸(recursion)
且所有節(jié)點(diǎn)(循環(huán)單元)按鏈?zhǔn)竭B接的遞歸神經(jīng),網(wǎng)絡(luò)具有短期記憶能力的神經(jīng)網(wǎng)絡(luò)。
3.5
遞歸神經(jīng)網(wǎng)絡(luò)Recursiveneuralnetwork
深度學(xué)習(xí)(deeplearning)算法之一,具有樹狀階層結(jié)構(gòu)且網(wǎng)絡(luò)節(jié)點(diǎn)按其連接順序?qū)斎胄畔⑦M(jìn)行
遞歸的人工神經(jīng)網(wǎng)絡(luò)(ArtificialNeuralNetwork,ANN)。
3.6
層Layer
神經(jīng)網(wǎng)絡(luò)中的一組神經(jīng)元,負(fù)責(zé)處理一組輸入特征,或一組神經(jīng)元的輸出。
3.7
推理Inference
在機(jī)器學(xué)習(xí)中,推斷通常指將訓(xùn)練過的模型應(yīng)用于無標(biāo)簽樣本,進(jìn)而來做出預(yù)測(cè)的過程。
3.8
批次Batch
模型訓(xùn)練的一次迭代(即一次梯度更新)中使用的樣本集。
3.9
批次大小Batchsize
一個(gè)批次中的樣本數(shù)。批次大小在訓(xùn)練和推斷期間通常是固定的。
3.10
測(cè)試集testset
數(shù)據(jù)集的子集,用于在模型經(jīng)由驗(yàn)證集的初步驗(yàn)證之后測(cè)試模型。
4縮略語(yǔ)
下列縮略語(yǔ)適用于本文件。
2
T/CESAXXXX-2019
mAP:平均精度均值(MeanAveragePrecision)
mIoU:平均交并比(MeanIntersectionoverUnion)
FAR:誤識(shí)率(FalseAcceptRate)
FRR:拒識(shí)率(FalseRejectRate)
IR:識(shí)別正確率(IdentificationRate)
WER:詞錯(cuò)誤率(WordErrorRate)
SER:句錯(cuò)誤率(SentenceErrorRate)
5技術(shù)要求
5.1測(cè)試框架
針對(duì)端側(cè)深度學(xué)習(xí)芯片的測(cè)試,主要是根據(jù)本標(biāo)準(zhǔn)中規(guī)定的評(píng)估方法,對(duì)其每個(gè)測(cè)試指標(biāo)進(jìn)行評(píng)估。
詳細(xì)內(nèi)容見“5試驗(yàn)方法”。
5.2測(cè)試對(duì)象
端側(cè)人工智能處理器,具體形式有以下兩種:
(1)端側(cè)人工智能處理器芯片(卡):指以芯片卡形態(tài)進(jìn)行使用的人工智能芯片,如FPGA以及ASIC
等人工智能芯片(卡),可通過PCIE等接口與測(cè)試主機(jī)連接;
(2)搭載人工智能處理器的端側(cè)產(chǎn)品。
5.3測(cè)試網(wǎng)絡(luò)架構(gòu)
1)控制主機(jī)處理器架構(gòu):X86架構(gòu)或ARM架構(gòu)。
2)支持主流的機(jī)器學(xué)習(xí)框架:Tensorflow、Caffe、MindSpore等。
5.4測(cè)試場(chǎng)景信息
1)典型應(yīng)用場(chǎng)景:計(jì)算機(jī)視覺任務(wù)(圖像分類、目標(biāo)檢測(cè)、語(yǔ)義分割等)和自然語(yǔ)言處理任務(wù);
2)數(shù)據(jù)集:公開數(shù)據(jù)集或真實(shí)應(yīng)用場(chǎng)景數(shù)據(jù)集;
3)模型:經(jīng)典神經(jīng)網(wǎng)絡(luò)模型或自定義模型。
6測(cè)試方法
6.1測(cè)試指標(biāo)
主要測(cè)試指標(biāo)如表1所示:
表1應(yīng)用場(chǎng)景測(cè)試指標(biāo)
類型主要指標(biāo)
1.1平均前向推理時(shí)間
端側(cè)芯片1.2最大吞吐性能
1.3前向處理延遲性能
3
T/CESAXXXX-2019
1.4功耗
1.5能效比
6.2測(cè)試指標(biāo)描述
6.2.1平均前向推理時(shí)間
指模型完成一個(gè)樣本的推斷所需要時(shí)間。在圖像處理相關(guān)領(lǐng)域,利用指標(biāo)每秒幀率(FramePer
Second,F(xiàn)PS)評(píng)估速度,即每秒內(nèi)可以處理的圖片數(shù)量。
6.2.2最大吞吐性能
指單芯片或者多芯片在前向推理過程或訓(xùn)練過程中可同時(shí)處理的最大樣本數(shù)量。
6.2.3前向處理延遲性能
硬件在進(jìn)行前向推理計(jì)算過程中,從圖片輸入完成到計(jì)算結(jié)果開始輸出之間的時(shí)間間隔。
6.2.4功耗
進(jìn)行模型推斷過程中,芯片(或其所在測(cè)試板)或搭載人工智能處理器的云的平均功率。
6.2.5能效比
進(jìn)行模型推斷過程中,單芯片或者多芯片單位時(shí)間內(nèi)執(zhí)行運(yùn)算的次數(shù)與芯片功耗之比。
6.3測(cè)試類型
6.3.1通用測(cè)試
參照附錄中“典型場(chǎng)景測(cè)試參照表”,針對(duì)不同領(lǐng)域采用公開數(shù)據(jù)集和經(jīng)典神經(jīng)網(wǎng)絡(luò)模型對(duì)端側(cè)深
度學(xué)習(xí)芯片進(jìn)行測(cè)試,驗(yàn)證端側(cè)深度學(xué)習(xí)芯片在使用所屬應(yīng)用領(lǐng)域主流公開數(shù)據(jù)集及主流神經(jīng)網(wǎng)絡(luò)模型
時(shí)的功能及性能特征。
6.3.2專用測(cè)試
采用用戶提供的真實(shí)應(yīng)用場(chǎng)景數(shù)據(jù)集(公開可獲?。┗蛘咂渥远x神經(jīng)網(wǎng)絡(luò)模型對(duì)端側(cè)深度學(xué)習(xí)芯
片進(jìn)行測(cè)試,驗(yàn)證其端側(cè)深度學(xué)習(xí)芯片在使用真實(shí)應(yīng)用場(chǎng)景數(shù)據(jù)集或者自定義神經(jīng)網(wǎng)絡(luò)模型時(shí)的功能及
性能特征。
6.4指標(biāo)測(cè)試方法
6.5.1平均前向推理時(shí)間
平均前向推理時(shí)間的單位是ms(毫秒)。
指被測(cè)硬件使用神經(jīng)網(wǎng)絡(luò)模型平均預(yù)測(cè)一單位測(cè)試數(shù)據(jù)所需要的時(shí)間。
計(jì)算公式:
平均前向推理時(shí)間=
注:
4
T/CESAXXXX-2019
總預(yù)測(cè)時(shí)間:被測(cè)硬件使用神經(jīng)網(wǎng)絡(luò)模型,在測(cè)試數(shù)據(jù)集上完成測(cè)試所使用的總計(jì)算時(shí)間(硬件一
次處理一單位的測(cè)試數(shù)據(jù))。
總測(cè)試樣本數(shù)量:指測(cè)試數(shù)據(jù)集中樣本的總數(shù)量。
6.5.2最大吞吐性能
硬件在進(jìn)行訓(xùn)練和前向推理計(jì)算過程中,單位時(shí)間內(nèi)能輸入的最大樣本數(shù)量。
可以在訓(xùn)練和前向推理計(jì)算前,通過不斷調(diào)整參數(shù),增加單位時(shí)間內(nèi)輸入樣本的數(shù)量,來最終確定
硬件的最大吞吐性能。
6.5.3前向處理延遲性能
前向處理延遲的單位是ms(毫秒)
硬件在進(jìn)行前向推理計(jì)算過程中,從圖片輸入完成到計(jì)算結(jié)果開始輸出之間的時(shí)間間隔。
計(jì)算公式:
前向處理延遲=當(dāng)前幀處理結(jié)果開始輸出的時(shí)刻-當(dāng)前幀輸入完成時(shí)刻
6.5.4功耗
功耗的單位是watt(瓦特)。
指執(zhí)行測(cè)試期間的被測(cè)硬件平均功耗。
針對(duì)不同形態(tài)的被測(cè)對(duì)象使用對(duì)應(yīng)的功耗測(cè)試方法,對(duì)被測(cè)硬件在執(zhí)行測(cè)試期間的功耗情況進(jìn)行記
錄,最終通過計(jì)算得到該硬件的平均功耗情況。
6.5.5能效比
能效比的單位是:images/sec/watt(處理圖像數(shù)量/秒/瓦特)。針對(duì)自然語(yǔ)言處理任務(wù),能效比
的單位是:word/sec/watt(處理單詞數(shù)量/秒/瓦特)。
計(jì)算公式:
能效比=
注:
總計(jì)算操作數(shù)量:指用于測(cè)試的神經(jīng)網(wǎng)絡(luò)模型中,所有計(jì)算操作的總數(shù)量和。
功耗:指執(zhí)行測(cè)試期間的硬件平均功耗。
5
T/CESAXXXX-2019
附錄通用端側(cè)深度學(xué)習(xí)芯片測(cè)試參數(shù)參照表
測(cè)試測(cè)試神經(jīng)關(guān)鍵指標(biāo)
分類編號(hào)應(yīng)用場(chǎng)景推理精度
數(shù)據(jù)集網(wǎng)絡(luò)模型推理速率處理延遲功耗
ResNet-50,
ResNet-101,
圖像分類
ImageNetVGG-16,top-1,top-5
1(準(zhǔn)確識(shí)別圖片
Inception-v3,算法準(zhǔn)確率
中的物體類別)
MobileNet
計(jì)算目標(biāo)檢測(cè)Faster-RCNN
機(jī)視2(定位物體位置,并MicrosoftCOCO(withFPN),mAPFPS
覺任標(biāo)注物體類別)YoloV3,SSD
務(wù)語(yǔ)義分割mswatt
VOC2012SegNet,U-Net,
3(識(shí)別圖像中mIoU,F-Score
CitescapeFCN,Deeplabv3+
所有像素類別)
FAR、FRR、
人臉識(shí)別(根據(jù)人面CASIA-WebFaceDeepID3,
4Identification
部特征識(shí)別身份)LFWArcFace
Rate
聯(lián)合國(guó)平行語(yǔ)料庫(kù)、
自然1機(jī)器翻譯AIChallenger文本seq2seqBLEU,METEOR翻譯速度
語(yǔ)言翻譯數(shù)據(jù)集
處理THCHS30
DFSMN
任務(wù)2語(yǔ)音識(shí)別AISHELLWER、SER識(shí)別速度
DFCNN
AudioSet
6.2.1應(yīng)用場(chǎng)景描述說明:
6.31.圖像分類及分類效果評(píng)估
任務(wù)為準(zhǔn)確識(shí)別圖片中的物體類別,擬采用模型ResNet-50、ResNet-101、VGG16、Inception-v3和
MobileNet,數(shù)據(jù)集為ImageNet。
衡量圖像分類效果的性能評(píng)價(jià)指標(biāo)為:
Top-1準(zhǔn)確率:圖像分類結(jié)果中排名第一的分類類別與實(shí)際結(jié)果相同的準(zhǔn)確率;
Top-5準(zhǔn)確率:圖像分類結(jié)果中排名前五的分類類別包含實(shí)際結(jié)果的準(zhǔn)確率。
6
T/CESAXXXX-2019
6.42.目標(biāo)檢測(cè)及檢測(cè)效果評(píng)估
任務(wù)為在給定的圖片中精確找到物體所在位置、并標(biāo)注出物體的類別。包括兩階段模型(Faster
R-CNN)和一階段模型(YoloV3、SSD),數(shù)據(jù)集為VOC、COCO。
衡量目標(biāo)檢測(cè)效果的性能評(píng)價(jià)指標(biāo)為:
平均精度均值(MeanAveragePrecision,mAP):數(shù)據(jù)集中所有類別的平均精度的均值。
計(jì)算公式:
平均精度均值=所有類別的平均精度值之和/所有類別的數(shù)目
6.53.語(yǔ)義分割及分割效果評(píng)估
任務(wù)為逐像素的標(biāo)注任務(wù),即為輸入圖像中每一個(gè)像素賦予預(yù)先設(shè)定的類別,選取模型為
Deeplabv3+,SegNet,U-Net和FCN,數(shù)據(jù)集VOC2012和Citescape。
衡量圖像語(yǔ)義分割任務(wù)的性能評(píng)價(jià)指標(biāo)為:
平均交并比(MeanIntersectionoverUnion,mIoU):所有類別的交并比IoU的平均值。計(jì)算真實(shí)
值(groundtruth)和預(yù)測(cè)值(predictedsegmentation)兩個(gè)集合的交集和并集之比,即為每個(gè)類別的交
并比IoU。
F分?jǐn)?shù):綜合權(quán)衡精確率和召回率的指標(biāo)。
計(jì)算公式:
PrecisionRecall
F?Score=
β2Precision+Recall
注:
精確率(Precision):識(shí)別正確的結(jié)果在所識(shí)別出的結(jié)果中所占的比率;
召回率(Recall):識(shí)別正確的結(jié)果占數(shù)據(jù)集中所有要識(shí)別出的總數(shù)的比率。
6.64.人臉識(shí)別及識(shí)別效果評(píng)估
任務(wù)為在給定的人臉中準(zhǔn)確的識(shí)別出人的特征,選區(qū)模型為DeepID3和ArcFace,數(shù)據(jù)集為WebFace
和LFW。身份衡量人臉識(shí)別效果采取的性能評(píng)價(jià)指標(biāo)為:
7
T/CESAXXXX-2019
誤識(shí)率(FalseAcceptRate,FAR):此處表示將其他人誤作指定人員的概率;拒識(shí)率(FalseRejectRate,
FRR):此處表示將指定人員誤作其它人員的概率;識(shí)別正確率(IdentificationRate):此處表示
正確識(shí)別人次與參與識(shí)別的注冊(cè)人員總?cè)舜沃取?/p>
6.75.機(jī)器翻譯及效果評(píng)估
任務(wù)為將給定的中文、英文或其他語(yǔ)言文本翻譯成另外一種制定語(yǔ)言的過程。使用模型seq2seq,
數(shù)據(jù)集采用聯(lián)合國(guó)平行語(yǔ)料庫(kù)、AIChallenger文本翻譯數(shù)據(jù)集。
衡量機(jī)器翻譯效果采取的性能評(píng)價(jià)指標(biāo)為:
BLEU(bilingualevaluationunderstudy):用于評(píng)價(jià)機(jī)器譯文與參考譯文的相似度。
計(jì)算公式:
BLEU=同時(shí)出現(xiàn)在機(jī)器譯文和參考譯文中的詞的個(gè)數(shù)/機(jī)器譯文的單詞數(shù)目
METEOR(MetricforEvaluationofTranslationwithExplicitOrdering):用于評(píng)價(jià)機(jī)器學(xué)習(xí)翻譯系統(tǒng)
的指標(biāo),為對(duì)應(yīng)最佳候選譯文和參考譯文之間的準(zhǔn)確率和召回率的調(diào)和平均。
6.語(yǔ)音識(shí)別及效果評(píng)估
任務(wù)為將給定的中文或英文語(yǔ)音識(shí)別為文字,采用的模型為阿里巴巴的DFSMN,科大訊飛的
DFCNN,數(shù)據(jù)集采用THCHS30、AISHELL、AudioSet。
衡量語(yǔ)音識(shí)別的性能測(cè)試指標(biāo)為:
詞錯(cuò)誤率(WER):語(yǔ)音識(shí)別后插入(/替換/刪除)的詞的總個(gè)數(shù)占標(biāo)準(zhǔn)的詞序列中詞的個(gè)數(shù)的百分
比。
句錯(cuò)誤率(SER):句子中如果有一個(gè)詞識(shí)別錯(cuò)誤,那么這個(gè)句子被認(rèn)為識(shí)別錯(cuò)誤,SER即句子識(shí)
別錯(cuò)誤的個(gè)數(shù)占句子總數(shù)的百分比。
8
T/CESAXXXX-2019
中國(guó)電子工業(yè)標(biāo)準(zhǔn)化技術(shù)協(xié)會(huì)(CESA)是全國(guó)電子信息產(chǎn)業(yè)標(biāo)準(zhǔn)化組織和標(biāo)準(zhǔn)化工作者自愿組成的
社會(huì)團(tuán)體。廣泛聯(lián)系全國(guó)電子信息產(chǎn)業(yè)標(biāo)準(zhǔn)化機(jī)構(gòu)和標(biāo)準(zhǔn)化工作者,協(xié)助政府部門搞好電子信息產(chǎn)業(yè)標(biāo)
準(zhǔn)化工作,開拓信息技術(shù)領(lǐng)域的標(biāo)準(zhǔn)化工作是中國(guó)電子工業(yè)標(biāo)準(zhǔn)化技術(shù)協(xié)會(huì)的主要工作內(nèi)容之一。中國(guó)
境內(nèi)從事科研開發(fā)、制造、營(yíng)銷和服務(wù)的企事業(yè)單位、高等院校、社會(huì)組織和個(gè)人均可隨時(shí)向中國(guó)電子
工業(yè)標(biāo)準(zhǔn)化技術(shù)協(xié)會(huì)團(tuán)體標(biāo)準(zhǔn)工作部提出團(tuán)體標(biāo)準(zhǔn)項(xiàng)目建議。
中國(guó)電子工業(yè)標(biāo)準(zhǔn)化技術(shù)協(xié)會(huì)標(biāo)準(zhǔn)按照《電子工業(yè)標(biāo)準(zhǔn)化技術(shù)協(xié)會(huì)協(xié)會(huì)團(tuán)體標(biāo)準(zhǔn)管理辦法》進(jìn)行制
定和管理。
在本標(biāo)準(zhǔn)實(shí)施過程中,如發(fā)現(xiàn)需要修改或補(bǔ)充之處,請(qǐng)將意見和有關(guān)資料寄至中國(guó)電子工業(yè)標(biāo)準(zhǔn)化
技術(shù)協(xié)會(huì),以便修訂時(shí)參考。
本標(biāo)準(zhǔn)版權(quán)歸中國(guó)電子工業(yè)標(biāo)準(zhǔn)化技術(shù)協(xié)會(huì)所有。
中國(guó)電子工業(yè)標(biāo)準(zhǔn)化技術(shù)協(xié)會(huì)地址:北京市海淀區(qū)萬(wàn)壽路27號(hào)
電話子郵箱:standards@
網(wǎng)址:
A
9
T/XXXXXXXX—XXXX
目次
前??言...............................................................................................................................................................II
人工智能芯片面向端側(cè)的深度學(xué)習(xí)芯片測(cè)試指標(biāo)與測(cè)試方法....................................................................1
1范圍.....................................................................................................................................................................1
2規(guī)范性引用文件.................................................................................................................................................1
3術(shù)語(yǔ)和定義.........................................................................................................................................................1
4縮略語(yǔ).................................................................................................................................................................2
5技術(shù)要求.............................................................................................................................................................3
5.1測(cè)試框架.........................................................................................................................................................3
5.2測(cè)試對(duì)象.........................................................................................................................................................3
5.3測(cè)試網(wǎng)絡(luò)架構(gòu).................................................................................................................................................3
5.4測(cè)試場(chǎng)景信息.................................................................................................................................................3
6測(cè)試方法.............................................................................................................................................................3
6.1測(cè)試指標(biāo).....................................................................................................................................................3
6.2測(cè)試指標(biāo)描述.................................................................................................................................................4
6.2.1平均前向推理時(shí)間.................................................................................................................................4
6.2.2最大吞吐性能..........................................................................................................................................4
6.2.3前向處理延遲性能.................................................................................................................................4
6.2.4功耗.........................................................................................................................................................4
6.2.5能效比.....................................................................................................................................................4
6.3測(cè)試類型.........................................................................................................................................................4
6.3.1通用測(cè)試.................................................................................................................................................4
6.3.2專用測(cè)試.................................................................................................................................................4
6.4指標(biāo)測(cè)試方法.................................................................................................................................................4
6.5.1平均前向推理時(shí)間.................................................................................................................................4
6.5.2最大吞吐性能.........................................................................................................................................5
6.5.3前向處理延遲性能.................................................................................................................................5
6.5.4功耗.........................................................................................................................................................5
6.5.5能效比.....................................................................................................................................................5
附錄通用端側(cè)深度學(xué)習(xí)芯片測(cè)試參數(shù)參照表..............................................................6
I
T/CESAXXXX-2019
人工智能芯片面向端側(cè)的深度學(xué)習(xí)芯片測(cè)試指標(biāo)與測(cè)試方法
1范圍
本標(biāo)準(zhǔn)規(guī)定了對(duì)端側(cè)深度學(xué)習(xí)芯片進(jìn)行功能、性能測(cè)試的測(cè)試指標(biāo)、測(cè)試方法和要求,適用于通用
端側(cè)深度學(xué)習(xí)芯片。本標(biāo)準(zhǔn)只規(guī)定端側(cè)深度學(xué)習(xí)芯片基準(zhǔn)測(cè)試的一般原則,針對(duì)具體端側(cè)深度學(xué)習(xí)芯片
產(chǎn)品應(yīng)制定相應(yīng)的測(cè)試細(xì)則。
本標(biāo)準(zhǔn)適用于第三方機(jī)構(gòu)對(duì)通用端側(cè)深度學(xué)習(xí)芯片進(jìn)行性能測(cè)試與評(píng)估,也適用于端側(cè)深度學(xué)習(xí)芯
片產(chǎn)品的采購(gòu)、設(shè)計(jì)。
2規(guī)范性引用文件
下列文件對(duì)于本文件的應(yīng)用是必不可少的。凡是注日期的引用文件,僅注日期的版本適用于本文件。
凡是不注日期的引用文件,其最新版本(包括所有的修改單)適用于本文件。
GB/T5271.31-2006信息技術(shù)詞匯第31部分:人工智能機(jī)器學(xué)習(xí)
GB/T5271.34-2006信息技術(shù)詞匯第34部分:人工智能神經(jīng)網(wǎng)絡(luò)
20190851-T-469信息技術(shù)人工智能術(shù)語(yǔ)
T/CESA1026-2018人工智能深度學(xué)習(xí)算法評(píng)估規(guī)范
3術(shù)語(yǔ)和定義
下列術(shù)語(yǔ)和定義適用于本文件。
3.1
機(jī)器學(xué)習(xí)Machinelearning
一種程序或系統(tǒng),用于根據(jù)輸入數(shù)據(jù)構(gòu)建(訓(xùn)練)預(yù)測(cè)模型。這種系統(tǒng)會(huì)利用學(xué)到的模型根據(jù)從分
布(訓(xùn)練該模型時(shí)使用的同一分布)中提取的新數(shù)據(jù)(以前從未見過的數(shù)據(jù))進(jìn)行實(shí)用的預(yù)測(cè)。機(jī)器學(xué)
習(xí)還指與這些程序或系統(tǒng)相關(guān)的研究領(lǐng)域。
3.2
深度學(xué)習(xí)DeepLearning
機(jī)器學(xué)習(xí)中一種基于對(duì)數(shù)據(jù)進(jìn)行表征學(xué)習(xí)的方法,通過組合低層特征形成更加抽象的高層表示屬性
類別或特征,以發(fā)現(xiàn)數(shù)據(jù)的分布式特征表示。
3.3
卷積神經(jīng)網(wǎng)絡(luò)Convolutionalneuralnetwork
1
T/CESAXXXX-2019
機(jī)器學(xué)習(xí)中一種基于對(duì)數(shù)據(jù)進(jìn)行表征學(xué)習(xí)的方法,通過組合低層特征形成更加抽象的高層表示屬性
類別或特征,以發(fā)現(xiàn)數(shù)據(jù)的分布式特征表示。
3.4
循環(huán)神經(jīng)網(wǎng)絡(luò)RecurrentNeuralNetwork
一種神經(jīng)網(wǎng)絡(luò),是一類以序列(sequence)數(shù)據(jù)為輸入,在序列的演進(jìn)方向進(jìn)行遞歸(recursion)
且所有節(jié)點(diǎn)(循環(huán)單元)按鏈?zhǔn)竭B接的遞歸神經(jīng),網(wǎng)絡(luò)具有短期記憶能力的神經(jīng)網(wǎng)絡(luò)。
3.5
遞歸神經(jīng)網(wǎng)絡(luò)Recursiveneuralnetwork
深度學(xué)習(xí)(deeplearning)算法之一,具有樹狀階層結(jié)構(gòu)且網(wǎng)絡(luò)節(jié)點(diǎn)按其連接順序?qū)斎胄畔⑦M(jìn)行
遞歸的人工神經(jīng)網(wǎng)絡(luò)(ArtificialNeuralNetwork,ANN)。
3.6
層Layer
神經(jīng)網(wǎng)絡(luò)中的一組神經(jīng)元,負(fù)責(zé)處理一組輸入特征,或一組神經(jīng)元的輸出。
3.7
推理Inference
在機(jī)器學(xué)習(xí)中,推斷通常指將訓(xùn)練過的模型應(yīng)用于無標(biāo)簽樣本,進(jìn)而來做出預(yù)測(cè)的過程。
3.8
批次Batch
模型訓(xùn)練的一次迭代(即一次梯度更新)中使用的樣本集。
3.9
批次大小Batchsize
一個(gè)批次中的樣本數(shù)。批次大小在訓(xùn)練和推斷期間通常是固定的。
3.10
測(cè)試集testset
數(shù)據(jù)集的子集,用于在模型經(jīng)由驗(yàn)證集的初步驗(yàn)證之后測(cè)試模型。
4縮略語(yǔ)
下列縮略語(yǔ)適用于本文件。
2
T/CESAXXXX-2019
mAP:平均精度均值(MeanAveragePrecision)
mIoU:平均交并比(MeanIntersectionoverUnion)
FAR:誤識(shí)率(FalseAcceptRate)
FRR:拒識(shí)率(FalseRejectRate)
IR:識(shí)別正確率(IdentificationRate)
WER:詞錯(cuò)誤率(WordErrorRate)
SER:句錯(cuò)誤率(SentenceErrorRate)
5技術(shù)要求
5.1測(cè)試框架
針對(duì)端側(cè)深度學(xué)習(xí)芯片的測(cè)試,主要是根據(jù)本標(biāo)準(zhǔn)中規(guī)定的評(píng)估方法,對(duì)其每個(gè)測(cè)試指標(biāo)進(jìn)行評(píng)估。
詳細(xì)內(nèi)容見“5試驗(yàn)方法”。
5.2測(cè)試對(duì)象
端側(cè)人工智能處理器,具體形式有以下兩種:
(1)端側(cè)人工智能處理器芯片(卡):指以芯片卡形態(tài)進(jìn)行使用的人工智能芯片,如FPGA以及ASIC
等人工智能芯片(卡),可通過PCIE等接口與測(cè)試主機(jī)連接;
(2)搭載人工智能處理器的端側(cè)產(chǎn)品。
5.3測(cè)試網(wǎng)絡(luò)架構(gòu)
1)控制主機(jī)處理器架構(gòu):X86架構(gòu)或ARM架構(gòu)。
2)支持主流的機(jī)器學(xué)習(xí)框架:Tensorflow、Caffe、MindSpore等。
5.4測(cè)試場(chǎng)景信息
1)典型應(yīng)用場(chǎng)景:計(jì)算機(jī)視覺任務(wù)(圖像分類、目標(biāo)檢測(cè)、語(yǔ)義分割等)和自然語(yǔ)言處理任務(wù);
2)數(shù)據(jù)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度幼兒園窗簾安裝與兒童安全合同4篇
- 2025版?zhèn)€人自愿離婚協(xié)議及共同債務(wù)處理協(xié)議2篇
- 二零二四年玩具租賃與銷售合作合同3篇
- 專屬2024版加工承攬合作協(xié)議版
- 2025年度電商企業(yè)物流倉(cāng)儲(chǔ)智能化改造合同3篇
- 二零二四年南京市住宅房產(chǎn)抵押租賃合同3篇
- 二零二五年度電熱水器產(chǎn)品質(zhì)量檢測(cè)與監(jiān)督合同3篇
- 二零二五年度打樁工程風(fēng)險(xiǎn)評(píng)估與控制合同4篇
- 二零二五年度光伏發(fā)電廠房項(xiàng)目投資合作協(xié)議3篇
- 2025年度個(gè)人分包工程合同(智慧停車場(chǎng)建設(shè))
- 體育概論(第二版)課件第三章體育目的
- 無人駕駛航空器安全操作理論復(fù)習(xí)測(cè)試附答案
- 建筑工地春節(jié)留守人員安全技術(shù)交底
- 默納克-NICE1000技術(shù)交流-V1.0
- 蝴蝶蘭的簡(jiǎn)介
- 老年人心理健康量表(含評(píng)分)
- 《小兒靜脈輸液速度》課件
- 營(yíng)銷人員薪酬標(biāo)準(zhǔn)及績(jī)效考核辦法
- 醫(yī)院每日消防巡查記錄表
- 運(yùn)輸企業(yè)重大危險(xiǎn)源辨識(shí)及排查制度
- 運(yùn)動(dòng)技能學(xué)習(xí)與控制課件第五章運(yùn)動(dòng)中的中樞控制
評(píng)論
0/150
提交評(píng)論