信息技術(shù) 人工智能小樣本機(jī)器學(xué)習(xí)樣本量和算法要求

上傳人：搬*** IP屬地：浙江上傳時(shí)間：2024-07-21 格式：PDF 頁(yè)數(shù)：26 大小：1.05MB 積分：11 舉報(bào) 版權(quán)申訴

信息技術(shù) 人工智能小樣本機(jī)器學(xué)習(xí)樣本量和算法要求_第2頁(yè)

信息技術(shù) 人工智能小樣本機(jī)器學(xué)習(xí)樣本量和算法要求_第3頁(yè)

信息技術(shù) 人工智能小樣本機(jī)器學(xué)習(xí)樣本量和算法要求_第4頁(yè)

信息技術(shù) 人工智能小樣本機(jī)器學(xué)習(xí)樣本量和算法要求_第5頁(yè)

已閱讀5頁(yè)，還剩21頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶(hù)提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

ICS35.240在提交反饋意見(jiàn)時(shí)，請(qǐng)將您知道的相關(guān)專(zhuān)利連同

L70支持性文件一并附上

團(tuán)體標(biāo)準(zhǔn)

T/CESAXXXX—XXXX

信息技術(shù)人工智能小樣本機(jī)器學(xué)習(xí)樣本

量和算法要求

Informationtechnology-Artificialintelligence-Samplesizeandalgorithm

requirementsforfew-shotlearning

（征求意見(jiàn)稿）

XXXX-XX-XX發(fā)布XXXX-XX-XX實(shí)施

中國(guó)電子工業(yè)標(biāo)準(zhǔn)化技術(shù)協(xié)會(huì)發(fā)布

T/XXXXXXXX—XXXX

前??言

本標(biāo)準(zhǔn)按照GB/T1.1-2009給出的規(guī)則起草。

請(qǐng)注意本文件的某些內(nèi)容可能涉及專(zhuān)利。本文件的發(fā)布機(jī)構(gòu)不承擔(dān)識(shí)別這些專(zhuān)利的責(zé)任。

本標(biāo)準(zhǔn)由中國(guó)電子技術(shù)標(biāo)準(zhǔn)化研究院提出并歸口。

本標(biāo)準(zhǔn)起草單位：

本標(biāo)準(zhǔn)主要起草人：

T/XXXXXXXX—XXXX

信息技術(shù)人工智能小樣本機(jī)器學(xué)習(xí)樣本量和算法要求

1范圍

本標(biāo)準(zhǔn)規(guī)定了小樣本機(jī)器學(xué)習(xí)算法在不同場(chǎng)景情況下的樣本量及算法的要求。

本標(biāo)準(zhǔn)適用于小樣本量機(jī)器學(xué)習(xí)相關(guān)產(chǎn)品。

2規(guī)范性引用文件

下列文件對(duì)于本文件的應(yīng)用是必不可少的。凡是注日期的引用文件，僅所注日期的版本適用于本文

件。凡是不注日期的引用文件，其最新版本（包括所有的修改單）適用于本文件。

ISO3534-1:2006統(tǒng)計(jì)學(xué)詞匯及符號(hào)第1部分：一般統(tǒng)計(jì)術(shù)語(yǔ)與用于概率的術(shù)語(yǔ)（Statistics--

Vocabularyandsymbols--Part1:Generalstatisticaltermsandtermsusedinprobability）

3術(shù)語(yǔ)和定義

下列術(shù)語(yǔ)和定義適用于本文件。

3.1

樣本量samplesize

樣本中包含的個(gè)體（或抽樣單元）的數(shù)目。

[ISO3534-1:2006,定義3.7]

3.2

小樣本smallsample

數(shù)量較少或不足的樣本量。

3.3

小樣本機(jī)器學(xué)習(xí)few-shotlearning

樣本數(shù)據(jù)量較少或不足情況下的機(jī)器學(xué)習(xí)。

4縮略語(yǔ)

以下縮略語(yǔ)適用于本文件。

AP：平均精確率（AveragePrecision）

AUC：ROC曲線覆蓋區(qū)域面積（AreaUnderCurveROC）

mAP：平均精確率均值（MeanAveragePrecision）

MOS：平均主觀意見(jiàn)得分（MeanOpinionScore）

ROC曲線：接受者操作特性曲線（ReceiverOperatingCharacteristicCurve）

T/XXXXXXXX—XXXX

5小樣本機(jī)器學(xué)習(xí)樣本量和算法要求

5.1算法要求描述項(xiàng)

算法要求包含評(píng)價(jià)要素、指標(biāo)屬性、量化方法和量化范圍四個(gè)部分，含義分別為：

a)評(píng)價(jià)要素：每個(gè)評(píng)價(jià)指標(biāo)項(xiàng)的具體評(píng)價(jià)內(nèi)容和要求；

b)指標(biāo)屬性：每個(gè)評(píng)價(jià)指標(biāo)的屬性為“定性指標(biāo)”和“定量指標(biāo)”之一；

c)量化方法：每個(gè)評(píng)價(jià)指標(biāo)的量化方法；

d)量化范圍：每個(gè)評(píng)價(jià)指標(biāo)的取值范圍。

5.2算法要求量化方法

5.2.1精確率/查準(zhǔn)率

精確率是被模型預(yù)測(cè)為正的正樣本（真正例）占預(yù)測(cè)為正的樣本的比例。精確率見(jiàn)式（1）。

P...............................................................................(1)

TPFP

式中：

P——精確率/查準(zhǔn)率；

TP——被判定為正樣例，實(shí)際為正樣例數(shù)目；

FP——被判定為正樣例，實(shí)際為負(fù)樣例數(shù)目。

5.2.2交叉精確率

交叉精確率是多次交叉抽樣計(jì)算的精確率的平均值。交叉精確率見(jiàn)式（2）。

crossPseti............................................................................(2)

式中：

crossP——交叉精確率；

P——第i次測(cè)試樣本隨機(jī)抽樣子集合的精確率；

seti

k——抽樣次數(shù)。

5.2.3召回率/查全率

召回率是被模型預(yù)測(cè)為正的正樣本（真正例）占實(shí)際正樣本的比例。召回率見(jiàn)式（3）。

R...............................................................................(3)

TPFN

式中：

R——召回率/查全率；

TP——被判定為正樣例，實(shí)際為正樣例數(shù)目；

FN——被判定為負(fù)樣例，實(shí)際為正樣例數(shù)目。

5.2.4交叉召回率

交叉召回率是多次交叉抽樣得到的召回率的平均值。交叉召回率見(jiàn)式（4）。

crossRseti...........................................................................(4)

式中：

T/XXXXXXXX—XXXX

crossR——交叉召回率；

R——第i次測(cè)試樣本隨機(jī)抽樣子集合的召回率；

seti

k——抽樣次數(shù)。

5.2.5準(zhǔn)確率/正確率

準(zhǔn)確率是模型預(yù)測(cè)正確的結(jié)果占所有分類(lèi)結(jié)果的比例。準(zhǔn)確率/正確率見(jiàn)式（5）。

TPTN

A.....................................................................(5)

TPTNFPFN

式中：

A——準(zhǔn)確率/正確率；

TP——被判定為正樣例，實(shí)際為正樣例數(shù)目；

TN——被判定為負(fù)樣例，實(shí)際為負(fù)樣例數(shù)目；

FP——被判定為正樣例，實(shí)際為負(fù)樣例數(shù)目；

FN——被判定為負(fù)樣例，實(shí)際為正樣例數(shù)目。

5.2.6交叉準(zhǔn)確率

交叉準(zhǔn)確率是多次交叉抽樣得到的準(zhǔn)確率的平均值。交叉準(zhǔn)確率見(jiàn)式（6）。

crossAseti............................................................................(6)

式中：

crossA——交叉準(zhǔn)確率；

A——第i次測(cè)試樣本隨機(jī)抽樣子集合的準(zhǔn)確率；

seti

k——抽樣次數(shù)。

5.2.7F值

F值是精確率和召回率的加權(quán)調(diào)和平均值，表達(dá)對(duì)精確率/召回率的不同偏好。F值見(jiàn)式（7）。

21PR

F.........................................................................(7)

2PR

式中：

——調(diào)和因子；

P——精確率；

R——召回率。

5.2.8交叉F值

交叉F值是多次交叉抽樣得到的F值的平均值。交叉F值見(jiàn)式（8）。

crossFseti...........................................................................(8)

式中：

crossF——交叉F值；

F——第i次測(cè)試樣本隨機(jī)抽樣子集合的F值；

seti

k——抽樣次數(shù)。

T/XXXXXXXX—XXXX

5.2.9接受者操作特性曲線

接受者操作特性曲線是根據(jù)預(yù)測(cè)結(jié)果對(duì)樣例進(jìn)行排序，按順序逐個(gè)把樣例作為正例進(jìn)行預(yù)測(cè)，每次

計(jì)算出假正率和真正率，分別以它們?yōu)闄M縱坐標(biāo)作ROC曲線圖。橫縱坐標(biāo)見(jiàn)式（9）、式（10）。

FPR............................................................................(9)

TNFP

TPR..........................................................................(10)

TPFN

式中：

FPR——假正率；

TPR——真正率；

FP——被判定為正樣例，實(shí)際為負(fù)樣例數(shù)目；

TN——被判定為負(fù)樣例，實(shí)際為負(fù)樣例數(shù)目；

TP——被判定為正樣例，實(shí)際為正樣例數(shù)目；

FN——被判定為負(fù)樣例，實(shí)際為正樣例數(shù)目。

5.2.10ROC曲線覆蓋區(qū)域面積

AUC通過(guò)對(duì)ROC曲線下各部分求和得到，比較AUC大小是判斷模型優(yōu)劣的標(biāo)準(zhǔn)之一。

5.2.11平均精確率

根據(jù)預(yù)測(cè)結(jié)果對(duì)樣例進(jìn)行排序，按順序逐個(gè)將樣例作為正例進(jìn)行預(yù)測(cè)，每次計(jì)算當(dāng)前的精確率和召

回率，最終計(jì)算精確率的平均值。以召回率為橫軸，精確率為縱軸作曲線。平均精確率就是精確率-召

回率曲線下的面積。

5.2.12交叉平均精確率

測(cè)試樣本中多次交叉抽樣子集合的平均精確率的均值。交叉平均精確率見(jiàn)式（11）。

kAP

crossAPseti.......................................................................(11)

式中：

crossAP——交叉平均精確率；

AP——第i次測(cè)試樣本隨機(jī)抽樣子集合的AP值；

seti

k——抽樣次數(shù)。

5.2.13平均精確率均值

各類(lèi)別平均精確率的均值。平均精確率均值見(jiàn)式（12）。

APi

mAPi1..........................................................................(12)

式中：

mAP——平均精確率均值；

第類(lèi)樣本的平均精確率；

APi——i

n——樣本的總類(lèi)別數(shù)。

5.2.14交叉平均精確率均值

測(cè)試樣本中多次交叉抽樣子集合的mAP的均值。交叉平均精確率均值見(jiàn)式（13）。

T/XXXXXXXX—XXXX

kmAP

crossmAPseti....................................................................(13)

式中：

crossmAP——交叉平均精確率均值；

mAP——第i次測(cè)試樣本隨機(jī)抽樣子集合的mAP值；

seti

k——抽樣次數(shù)。

5.2.15目標(biāo)身份匹配錯(cuò)次數(shù)

同一個(gè)目標(biāo)在上一幀和當(dāng)前幀匹配的身份號(hào)不一致，視為身份號(hào)匹配錯(cuò)一次。

5.2.16目標(biāo)身份重復(fù)次數(shù)

跟蹤過(guò)程中，一個(gè)目標(biāo)匹配出的身份總數(shù)量。

5.2.17跟蹤穩(wěn)定率

衡量目標(biāo)跟蹤準(zhǔn)確程度，結(jié)合誤檢數(shù)量,漏檢數(shù)量,匹配錯(cuò)次數(shù),給出整體跟蹤性能的度量。跟蹤穩(wěn)

定率見(jiàn)式（14）。

TPi,t.............................................................................(14)

式中：

TP——跟蹤穩(wěn)定率；

t——幀圖像序列號(hào)；

i——跟蹤算法輸出的單目標(biāo)框；

i時(shí)刻算法輸出的第個(gè)目標(biāo)框與目標(biāo)框標(biāo)簽的誤差；

dt——ti

時(shí)刻算法輸出結(jié)果和標(biāo)簽匹配上的目標(biāo)框數(shù)量。

ct——t

5.2.18跟蹤準(zhǔn)確率

衡量目標(biāo)跟蹤穩(wěn)定程度，描述了目標(biāo)被精確跟蹤的程度，并通過(guò)邊界框重疊和邊界框間的距離度量。

跟蹤準(zhǔn)確率見(jiàn)式（15）。

mtfptmmet

TA1t.............................................................(15)

式中：

TA——跟蹤準(zhǔn)確率；

t——幀圖像序列號(hào)；

時(shí)刻標(biāo)簽中未被匹配的目標(biāo)個(gè)數(shù)；

mt——t

時(shí)刻誤檢數(shù)量；

fpt——t

時(shí)刻匹配錯(cuò)次數(shù)；

mmet——t

時(shí)刻目標(biāo)框標(biāo)簽的數(shù)量。

gt——t

T/XXXXXXXX—XXXX

5.2.19交并比

目標(biāo)檢測(cè)中，產(chǎn)生的候選框與原標(biāo)記框的交疊率。交并比見(jiàn)式（16）。

areaCareaG

IOU...............................................................(16)

areaCareaG

式中：

IOU——交并比；

areaC——候選框區(qū)域面積；

areaG——原標(biāo)記框區(qū)域面積。

5.2.20交叉熵

用于度量?jī)蓚€(gè)概率分布間的差異性信息。交叉熵見(jiàn)式（17）。

Hp,qpxlogqx...........................................................(17)

i1ii

式中：

Hp,q——交叉熵；

的真實(shí)概率分布；

pxi——xi

的預(yù)測(cè)概率分布；

qxi——xi

n——測(cè)試集的大小。

5.2.21均方誤差

觀測(cè)值與真值之差的平方的期望值。均方誤差見(jiàn)式（18）。

Xbos,iXmodel,i

MSEi1.............................................................(18)

式中：

MSE——均方誤差；

第次的觀測(cè)值；

Xbos,i——

第次的真值；

Xmodel,i——

n——觀測(cè)

信息技術(shù) 人工智能 小樣本機(jī)器學(xué)習(xí)樣本量和算法要求

文檔簡(jiǎn)介

信息技術(shù) 人工智能小樣本機(jī)器學(xué)習(xí)樣本量和算法要求