版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
YD/TXXXX—20XX
目次
目次...............................................................................I
前言..................................................................................II
1范圍.................................................................................1
2規(guī)范性引用文件.......................................................................1
3術(shù)語(yǔ)和定義...........................................................................1
4縮略語(yǔ)...............................................................................1
5測(cè)試環(huán)境.............................................................................2
6測(cè)試工具.............................................................................2
7信號(hào)分析.............................................................................4
8測(cè)試預(yù)設(shè)條件與要求...................................................................7
附錄A.............................................................................8
A.1預(yù)同步.............................................................................8
A.2粗同步.............................................................................8
A.3精細(xì)同步...........................................................................9
A.4自校驗(yàn)............................................................................12
附錄B............................................................................13
B.1連續(xù)丟失的活動(dòng)語(yǔ)音幀數(shù)量與分?jǐn)?shù)系數(shù)k...............................................13
B.2插入的空幀或算法引入的合成語(yǔ)音幀數(shù)量與分?jǐn)?shù)系數(shù)h...................................13
B.3語(yǔ)音間漏幀數(shù)量與分?jǐn)?shù)系數(shù)l1........................................................13
B.4句首漏幀數(shù)量與分?jǐn)?shù)系數(shù)l2..........................................................14
B.5a句與b句整合后的分?jǐn)?shù)系數(shù)g.......................................................14
附錄C............................................................................16
C.1ITU-TP.501中文語(yǔ)音信號(hào)(全頻帶語(yǔ)音)............................................16
C.2本標(biāo)準(zhǔn)建議的中文普通話(huà)語(yǔ)音信號(hào)....................................................16
I
YD/TXXXX—20XX
前言
本文件按照GB/T1.1-2020《標(biāo)準(zhǔn)化工作導(dǎo)則第1部分:標(biāo)準(zhǔn)化文件的結(jié)構(gòu)和起草規(guī)則》的規(guī)定起
草。
請(qǐng)注意本文件的某些內(nèi)容可能涉及專(zhuān)利。本文件的發(fā)布機(jī)構(gòu)不承擔(dān)識(shí)別專(zhuān)利的責(zé)任。
本文件由中國(guó)通信標(biāo)準(zhǔn)化協(xié)會(huì)提出并歸口。
本文件起草單位:中國(guó)信息通信研究院、中國(guó)電信集團(tuán)有限公司、中國(guó)移動(dòng)通信集團(tuán)有限公司、華
為技術(shù)有限公司、中興通訊股份有限公司。
本標(biāo)準(zhǔn)主要起草人:趙澎、秦巖、郭雯、王偉、黃毅華、許向東、程寶平、雷珺、陳民、吳慶航、
張葉蒙、黃敏峰、樊兆賓、馬偉、劉紅軍。
II
移動(dòng)互聯(lián)網(wǎng)網(wǎng)絡(luò)質(zhì)量評(píng)分方法語(yǔ)音通話(huà)
1范圍
本文件規(guī)定了移動(dòng)互聯(lián)網(wǎng)網(wǎng)絡(luò)端到端語(yǔ)音傳輸質(zhì)量通用客觀測(cè)試方法,包含算法、測(cè)試設(shè)備要
求及操作等方法。
本文件適用于現(xiàn)有的移動(dòng)通信網(wǎng)絡(luò)與有線(xiàn)網(wǎng)絡(luò),窄帶、寬帶、超寬帶和全頻帶語(yǔ)音傳輸,包含
但不限于AMR、EVS等語(yǔ)音編解碼方式。
2規(guī)范性引用文件
下列文件中的內(nèi)容通過(guò)文中的規(guī)范性引用而構(gòu)成本文件必不可少的條款。其中,注日期的引用
文件,僅該日期對(duì)應(yīng)的版本適用于本文件;不注日期的引用文件,其最新版本(包括所有的修改單)
適用于本文件。
性能、服務(wù)質(zhì)量和體驗(yàn)質(zhì)量術(shù)語(yǔ)(Vocabularyforperformance,qualityof
ITU-TP.10(2017)
serviceandqualityofexperience)
ITU-TP.56(1993)激活語(yǔ)音水平的客觀測(cè)量
ITU-TP.501(2012)電話(huà)測(cè)量用測(cè)試信號(hào)(Testsignalsforuseintelephonometry)
傳輸質(zhì)量的主觀判斷的方法(Methodsforsubjectivedeterminationof
ITU-TP.800(1996)
transmissionquality)
YD/T1538-2021數(shù)字移動(dòng)終端音頻性能通用測(cè)試方法
YD/T1885-2016移動(dòng)通信手持機(jī)有線(xiàn)耳機(jī)接口技術(shù)要求和測(cè)試方法
3術(shù)語(yǔ)和定義
下列術(shù)語(yǔ)和定義適用于本文件。
3.1
窄帶語(yǔ)音narrowbandspeech
在20Hz-4000Hz范圍外沒(méi)有顯著信號(hào)分量的信號(hào),通常主要語(yǔ)音能量集中在300Hz-
3400Hz范圍內(nèi)。
[來(lái)源:ITU-TP.10——2017,6.166,6.167]
設(shè)置格式[BINGO]:字體顏色:自動(dòng)設(shè)置
3.2
寬帶語(yǔ)音widebandspeech
在20Hz-8000Hz范圍外沒(méi)有顯著信號(hào)分量的信號(hào),標(biāo)稱(chēng)語(yǔ)音信號(hào)頻率寬度大于300Hz-
3400Hz的語(yǔ)音傳輸,通常理解為100Hz-7000Hz。
[來(lái)源:ITU-TP.10——2017,6.320,6.321]
3.3
超寬帶語(yǔ)音superwidebandspeech
在20Hz-14000Hz范圍外沒(méi)有顯著信號(hào)分量的信號(hào),標(biāo)稱(chēng)語(yǔ)音信號(hào)頻率寬度大于100Hz-
7000Hz的語(yǔ)音傳輸,通常理解為500Hz-14000Hz。
[來(lái)源:ITU-TP.10——2017,6.320,6.321]
3.4
全頻帶語(yǔ)音fullbandspeech
在10Hz-20000Hz范圍外沒(méi)有顯著信號(hào)分量的信號(hào),標(biāo)稱(chēng)語(yǔ)音信號(hào)頻率寬度大于50Hz-
14000Hz的語(yǔ)音傳輸,通常理解為20Hz-20000Hz。
[來(lái)源:ITU-TP.10——2017,6.99,6.100]
4縮略語(yǔ)
1
ACR絕對(duì)類(lèi)別評(píng)級(jí)AbsoluteCategoryRating
AMR自適應(yīng)多速率編碼AdaptiveMultiRate
ARL聲參考電平AcousticReferenceLevel
EPC演進(jìn)的分組核心網(wǎng)EvolvedPacketCore
EVS增強(qiáng)型語(yǔ)音通話(huà)服務(wù)EnhancedVoiceServices
FB全頻帶FullBand
IMSIP多媒體子系統(tǒng)IPMultimediaSubsystem
LTE長(zhǎng)期演進(jìn)LongTermEvolution
MGCF媒體網(wǎng)關(guān)控制功能MediaGatewayControlFunction
MOS平均意見(jiàn)分MeanOpinionScore
MS移動(dòng)臺(tái)MobileStation
P-CSCF代理呼叫會(huì)話(huà)控制功能Proxy-CallSessionControlFunction
POI互連點(diǎn)(公共交換電話(huà)網(wǎng)絡(luò))PointofInterconnection(withPSTN)
SBC會(huì)話(huà)邊緣控制SessionBorderControl
S-CSCF服務(wù)呼叫會(huì)話(huà)控制功能Serving-CallSessionControlFunction
SWB超寬帶SuperWideBand
THD+N總諧波失真+噪聲TotalHarmonicDistortion+Noise
VoLTE長(zhǎng)期演進(jìn)語(yǔ)音承載VoiceoverLongTermEvolution
VoNR新空口承載語(yǔ)音VoiceoverNewRadio
5測(cè)試環(huán)境
5.1網(wǎng)絡(luò)條件
以VoLTE注冊(cè)用戶(hù)發(fā)起呼叫為例,圖1為VoLTE注冊(cè)用戶(hù)與被叫呼叫的流程圖與移動(dòng)互聯(lián)網(wǎng)網(wǎng)絡(luò)
架構(gòu)。
圖1VoLTE呼叫流程,主叫為IMS用戶(hù),被叫為/非IMS用戶(hù)
現(xiàn)網(wǎng)環(huán)境下,主被叫可在同蜂窩不同蜂窩下建立語(yǔ)音通路。建議主被叫在同運(yùn)營(yíng)商網(wǎng)絡(luò)環(huán)境
/設(shè)置格式[BINGO]:非突出顯示
下進(jìn)行測(cè)試,測(cè)試結(jié)果中應(yīng)注明主被叫所在的基本網(wǎng)絡(luò)條件,如電路域、分組域、同/不同小區(qū)、
同/跨運(yùn)營(yíng)商等。
6測(cè)試工具
6.1測(cè)試信號(hào)
6.1.1參考語(yǔ)音信號(hào)
2
建議采用中文普通話(huà)作為測(cè)試用參考語(yǔ)音信號(hào),可選用ITU-TP.501推薦的中文普通話(huà)語(yǔ)音
設(shè)置格式[BINGO]:非突出顯示
信號(hào),由母語(yǔ)是中文普通話(huà)的中青年男性與女性各兩位,分別單人錄制聲音,每人兩句話(huà),前句記
為a句,后句記為b句。也可采用本文件推薦的中文語(yǔ)音信號(hào)(詳見(jiàn)附錄C)。
參考語(yǔ)音信號(hào)也可自行錄制,但應(yīng)滿(mǎn)足以下基本要求。
a)信號(hào)為單聲道全頻帶(20Hz—20000Hz)錄制,PCM編碼、16位、48kHz采樣率,平均活
動(dòng)語(yǔ)音電平需調(diào)整到-26dBov(overload,相對(duì)于系統(tǒng)過(guò)載點(diǎn)的電平)。
b)該參考信號(hào)文本應(yīng)選用常用詞,整句語(yǔ)法簡(jiǎn)單,且好理解;讀句子時(shí),應(yīng)語(yǔ)速適中,語(yǔ)氣
自然,不夾雜情緒,聲音大小等與日常說(shuō)話(huà)相似,需有男聲和女聲。
c)語(yǔ)音信號(hào)的錄制應(yīng)在標(biāo)準(zhǔn)消聲室內(nèi)進(jìn)行,可使用自由場(chǎng)傳聲器(0°入射角)或全向傳聲
器,人嘴距傳聲器為10cm,環(huán)境噪聲應(yīng)低于30dB(A)SPL(SoundPressureLevels,聲壓級(jí))。
設(shè)置格式[BINGO]:字體:(默認(rèn))宋體,(中文)宋體
d)每個(gè)參考語(yǔ)音信號(hào)總時(shí)長(zhǎng)為8s,由兩句話(huà)構(gòu)成,期間有一靜音間隔,不大于2s,不小于1s,
第一句話(huà)前部為1s靜音間隔,兩句話(huà)(有效語(yǔ)音信號(hào))合計(jì)不少于3s,尾部靜音部分不少于1s。
e)參考語(yǔ)音信號(hào)中靜音間隔的本底噪聲不應(yīng)超過(guò)–84dBov(A)。
f)推薦采用中青年男女的中文普通話(huà),也可使用各地方言及不同年齡人群的聲音。
6.1.2采樣語(yǔ)音信號(hào)
經(jīng)由網(wǎng)絡(luò)端到端傳輸后的語(yǔ)音信號(hào),存在一定損傷,該降級(jí)語(yǔ)音信號(hào)通過(guò)被測(cè)系統(tǒng)后,在其接
收端的模擬電接口進(jìn)行單聲道全頻帶(20Hz—20000Hz)采樣,16位,48kHz采樣率。
采樣信號(hào)電平幅度建議為–26dBov,
采樣信號(hào)時(shí)長(zhǎng)應(yīng)不大于12s,建議為8s,與參考信號(hào)長(zhǎng)度一致。采樣信號(hào)頭部至a句起始點(diǎn),
應(yīng)不大于2s。采樣信號(hào)中可能會(huì)因網(wǎng)絡(luò)傳輸、信號(hào)變差等產(chǎn)生噪音,但應(yīng)沒(méi)有終端鈴聲、信號(hào)或語(yǔ)
音提示音等其它異常聲音。
6.2數(shù)據(jù)采集設(shè)備
6.2.1基本功能
數(shù)采設(shè)備可通過(guò)有線(xiàn)或無(wú)線(xiàn)(如WiFi等)方式,依照預(yù)設(shè)程序至少對(duì)兩臺(tái)(一對(duì))數(shù)字移動(dòng)終
端或模擬終端進(jìn)行單次或循環(huán)控制,可實(shí)現(xiàn)如下基本功能。
a)自動(dòng)撥打/接聽(tīng)電話(huà)。
b)控制音量鍵至預(yù)設(shè)等級(jí),若在測(cè)試中被誤碰觸音量鍵,應(yīng)能及時(shí)發(fā)現(xiàn)并調(diào)回預(yù)設(shè)狀態(tài)。
c)關(guān)閉第三方呼叫等待、提示音、語(yǔ)音識(shí)別等容易干擾采樣的聲音提示。
d)可通過(guò)標(biāo)準(zhǔn)3.5mm耳機(jī)接口,或其它音頻有線(xiàn)方式(Type-C、miniUSB等)對(duì)數(shù)字移動(dòng)終端
或模擬終端進(jìn)行語(yǔ)音信號(hào)的發(fā)送/接收(采集)。
e)系統(tǒng)應(yīng)具備通路驗(yàn)證、自檢功能。
不建議采用藍(lán)牙或其它無(wú)線(xiàn)方式對(duì)語(yǔ)音信號(hào)進(jìn)行發(fā)送/接收處理。
6.2.2基本性能要求
參考語(yǔ)音和采樣語(yǔ)音信號(hào)處理能力應(yīng)符合6.1測(cè)試信號(hào)的要求。耳機(jī)接口性能應(yīng)滿(mǎn)足YD/T
1885標(biāo)準(zhǔn)要求。
輸入接口:
頻率范圍20Hz–20kHz,±0.3dB;
本底噪聲不超過(guò)-70dB;
THD+N≤1%(100Hz–20kHz,在可輸入的標(biāo)稱(chēng)電平幅度下);
通道隔離度≥60dB。
輸出接口:
頻率范圍20Hz–20kHz,±0.3dB;
本底噪聲不超過(guò)-75dB;
THD+N≤1%(100Hz–20kHz,在可輸出的標(biāo)稱(chēng)電平幅度下);
通道隔離度≥60dB。
建議數(shù)據(jù)采集設(shè)備在控制兩臺(tái)終端設(shè)備,進(jìn)行發(fā)送/接收語(yǔ)音信號(hào)時(shí),同步觸發(fā)精度不大于1ms,
若大于1ms,則數(shù)采設(shè)備不具有網(wǎng)絡(luò)語(yǔ)音傳輸延時(shí)的測(cè)試能力。
6.3語(yǔ)音采集設(shè)備
6.3.1基本功能
3
語(yǔ)音采集終端設(shè)備,應(yīng)支持現(xiàn)有運(yùn)營(yíng)商全部網(wǎng)絡(luò)制式及頻段,支持AMR-NB、AMR-WB、EVRC-B
設(shè)置格式[BINGO]:非突出顯示
語(yǔ)、和EVS語(yǔ)音編解碼方式及多種速率。信號(hào)采集設(shè)備鏈接方式見(jiàn)圖2.
設(shè)置格式[BINGO]:居中,縮進(jìn):首行縮進(jìn):0字符
圖2語(yǔ)音采集設(shè)備鏈接示意圖
6.3.2性能要求
依照YD/T1538-2021規(guī)定的測(cè)試方法,應(yīng)滿(mǎn)足該標(biāo)準(zhǔn)附錄A中有關(guān)頭戴機(jī)模式下的全部技術(shù)
設(shè)置格式[BINGO]:縮進(jìn):首行縮進(jìn):7.4毫米
要求,并且在實(shí)驗(yàn)室網(wǎng)絡(luò)無(wú)損傷時(shí),通過(guò)耳機(jī)接口模擬電信號(hào)進(jìn)行發(fā)送/接收通路語(yǔ)音質(zhì)量測(cè)試,
窄帶語(yǔ)音質(zhì)量分?jǐn)?shù)不低于3.7,寬帶語(yǔ)音質(zhì)量分?jǐn)?shù)不低于4.3分,超寬帶和全頻帶語(yǔ)音質(zhì)量分?jǐn)?shù)不低
于4.5分。
6.4測(cè)試設(shè)備環(huán)境條件
測(cè)試設(shè)備應(yīng)在其標(biāo)稱(chēng)使用環(huán)境條件下進(jìn)行測(cè)試。若未標(biāo)稱(chēng)使用環(huán)境條件,建議按照如下使用條
件進(jìn)行。
溫度:0℃~40℃;
相對(duì)濕度:0~80%。
7信號(hào)分析
7.1基本原理
測(cè)試中,僅對(duì)單向通話(huà)時(shí),網(wǎng)絡(luò)語(yǔ)音傳輸質(zhì)量進(jìn)行評(píng)估分析。語(yǔ)音信號(hào)采樣后,分別進(jìn)行預(yù)處
設(shè)置格式[BINGO]:左,縮進(jìn):首行縮進(jìn):7.4毫米
理、采樣信號(hào)與參考信號(hào)時(shí)間同步對(duì)齊和分?jǐn)?shù)計(jì)算。信號(hào)分析步驟見(jiàn)圖3。
圖3信號(hào)分析步驟
4
7.2采樣信號(hào)的損傷類(lèi)型
模擬語(yǔ)音信號(hào)經(jīng)由電路域、分組域網(wǎng)絡(luò)損傷后的表現(xiàn),主要有圖3所示的三種類(lèi)型。
圖4網(wǎng)絡(luò)損傷典型類(lèi)型
圖4中:
m——已知參考信號(hào)的連續(xù)活動(dòng)語(yǔ)音幀幀數(shù),電平幅度不小于43dBov;
i——任意連續(xù)活動(dòng)語(yǔ)音幀所在位置;
k——某處丟失的活動(dòng)語(yǔ)音幀數(shù)量,1≤k≤m;
h——某處被插入任意位置的幀數(shù)量,為空白幀,或解碼器根據(jù)第i-1幀所模擬出的語(yǔ)音幀
等,h≥1,對(duì)照參考信號(hào)的活動(dòng)語(yǔ)音幀起止位置內(nèi),采樣信號(hào)總幀數(shù)變?yōu)閙+i;
q——從任意位置起,某處連續(xù)丟失的活動(dòng)語(yǔ)音幀數(shù)量為q,即原有活動(dòng)語(yǔ)音幀被空白幀或
解碼器根據(jù)第i-1幀所模擬出的語(yǔ)音幀等取代,對(duì)照參考信號(hào)的活動(dòng)語(yǔ)音幀起止位置內(nèi),采樣信
號(hào)總幀數(shù)m不變。
采樣信號(hào)的損傷,可能由一種或幾種類(lèi)型的組合,程度與出現(xiàn)的頻次不一。
7.3采樣信號(hào)與參考信號(hào)的時(shí)域?qū)R
參考信號(hào)與采樣信號(hào)均按照16位,48kHz采樣率,每幀信號(hào)時(shí)長(zhǎng)為21.33ms,時(shí)域?qū)R后,應(yīng)
滿(mǎn)足下列要求。
a)將參考信號(hào)的活動(dòng)語(yǔ)音幀,與采樣信號(hào)的活動(dòng)語(yǔ)音幀,按照時(shí)間軸對(duì)應(yīng)關(guān)系,計(jì)算出采樣
信號(hào)每幀的具體延時(shí),并做好標(biāo)記。
b)把采樣信號(hào)多余的活動(dòng)語(yǔ)音幀和多余的空白幀全部剔除。
c)將做好標(biāo)記的采樣語(yǔ)音信號(hào),按照固定延時(shí)順序重組。
d)信號(hào)同步后,最大單幀誤差不超過(guò)1幀。
采樣信號(hào)與參考信號(hào)時(shí)域?qū)R的方法有多種,附錄A推薦了一種信號(hào)對(duì)齊方法,可參照使用。
7.4分?jǐn)?shù)計(jì)算
采樣信號(hào)損傷的準(zhǔn)確量化,是分?jǐn)?shù)計(jì)算的前提與基礎(chǔ)。在采樣信號(hào)與參考信號(hào)對(duì)齊過(guò)程中,可
計(jì)算統(tǒng)計(jì)出信號(hào)損傷的類(lèi)別與程度。
ITU-TP.800給出了一系列與人主觀感受相匹配的語(yǔ)音質(zhì)量主觀評(píng)估方法,其中附錄B定義的
“聽(tīng)音——絕對(duì)類(lèi)別評(píng)級(jí)(ACR)”方法,即通常稱(chēng)之為平均意見(jiàn)分?jǐn)?shù)(MOS)。
由于人的感受與信號(hào)損傷類(lèi)型、程度等,并非線(xiàn)性關(guān)系,直接用損傷類(lèi)型、程度等組合方式線(xiàn)
性扣分,并不能與人的主觀感受較好匹配。
每個(gè)采樣信號(hào)的分?jǐn)?shù)計(jì)算基礎(chǔ)條件并不完全一樣,在各自基礎(chǔ)條件上,再采用與損傷類(lèi)型、程
度相關(guān)的扣分規(guī)則,得到的語(yǔ)音質(zhì)量分?jǐn)?shù)與主觀感受偏離度較低。此處給出了一種分?jǐn)?shù)計(jì)算方法,
可以主觀感受得到較好擬合。附錄A為此語(yǔ)音質(zhì)量分?jǐn)?shù)計(jì)算方法與ITU-TP.800的附錄B,ACR方法的
對(duì)比結(jié)果。
信號(hào)基礎(chǔ)分,通過(guò)對(duì)采樣語(yǔ)音信號(hào)對(duì)齊重組后的a句和b句,單獨(dú)進(jìn)行活動(dòng)語(yǔ)音幀進(jìn)行每幀分?jǐn)?shù)
計(jì)算,并分別求取平均值。
采樣信號(hào)有效語(yǔ)音幀幅值,
參考信號(hào)有效語(yǔ)音幀幅值,
??
?
?5
重組后的采樣信號(hào)的有效語(yǔ)音幀平均幅度:
…………()
?1
?
式中: