2024智能家用電器的語音交互技術第1部分_第1頁
2024智能家用電器的語音交互技術第1部分_第2頁
2024智能家用電器的語音交互技術第1部分_第3頁
2024智能家用電器的語音交互技術第1部分_第4頁
2024智能家用電器的語音交互技術第1部分_第5頁
已閱讀5頁,還剩13頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1II目 次前言 II引言 III1范圍 12規(guī)范性用文件 13術語和義 14智能家語音交分類 3智能家電語音互模塊業(yè)務系的邏輯系 3技術要求 56.1通用要求 56.2結(jié)構設計求 56.3安全要求 56.4功能要求 66.5性能要求 86.6可靠性要求 10標志、指和使說明 117.1標志、指示 117.2使用說明 11附錄A(規(guī)性)有語音互功能智能家特要求 12參考文獻 13PAGEPAGE10智能家用電器的語音交互技術第1部分:通用要求范圍(本文件適用于通過語音方式進行交互的智能家電的設計和開發(fā)。(GB/T34145—2017中文語音合成互聯(lián)網(wǎng)服務接口規(guī)范GB/T36464.2—2018信息技術智能語音交互系統(tǒng)第2部分:智能家居GB/T37036.5—2023信息技術移動設備生物特征識別第5部分:聲紋GB/T40660—2021信息安全技術生物特征識別信息保護基本要求GB/T41807—2022信息安全技術聲紋識別數(shù)據(jù)安全要求SJ/T11540—2015有源揚聲器通用規(guī)范下列術語和定義適用于本文件。3.1語音交互speechinteraction[來源:GB/T36464.2—2018,3.1]3.2語音識別speechrecognition[來源:GB/T21023—2007,3.1]3.33.43.5

語音合成speechsynthesis[來源:GB/T21024—2007,3.1]語音服務平臺speechserviceplatform為智能家電提供語音識別、語義理解、語音交互決策、語音合成等一項或多項服務的平臺。智能家電服務平臺intelligenthouseholdappliancesserviceplatform;smarthouseholdappliancesserviceplatform[修改:GB/T38052.1—2019,2.2.7]3.6聲源定位acousticsourcelocalization對發(fā)聲物體位置的判斷過程。[來源:GB/T36464.1—2020,3.28]3.7關機模式offmode(s)當家電的供電裝置連接到主電源時,未出現(xiàn)待機模式、網(wǎng)絡模式或活躍模式,且為持續(xù)的任何產(chǎn)品模式。帶有僅提示用戶產(chǎn)品是在關機位置的指示器,包括在關機模式的類別中。注:關機模式不同于斷開模式。關機模式也可稱作“靜態(tài)待機”模式。[來源:GB/T35758—2017,3.5]3.8

命令字識別commandwordrecognition一種基于語音識別語法的語音識別方式,是在語音識別語法規(guī)則限定的范圍內(nèi),對于給定的語音輸入,語音識別引擎給出語音識別語法覆蓋范圍內(nèi)的文本或拒識作為識別結(jié)果。[來源:GB/T34083—2017,3.3]3.9連續(xù)語音識別continuousspeechrecognition識別任意的連續(xù)語音,并給出相對應的文本。注:連續(xù)語音識別不限制用戶說話的詞匯、內(nèi)容和方式,用戶可以以任意說的形式輸入語音。[來源:GB/T34083—2017,3.4]3.10語義理解semanticunderstanding使功能單元理解人說話的意圖。[來源:GB/T36464.2—2018,3.11]3.11語音喚醒speechwake-up;voicetrigger處于音頻流監(jiān)聽狀態(tài)的語音交互系統(tǒng),在檢測到特定的特征或事件出現(xiàn)后,切換到命令字識別、連續(xù)語音識別等其他處理狀態(tài)的過程。[來源:GB/T36464.2—2018,3.13]3.12誤喚醒falsewake-up智能家電處于音頻流監(jiān)聽狀態(tài),無音頻流或者音頻流中沒有出現(xiàn)喚醒所需的特征或事件時,語音喚醒系統(tǒng)被喚醒的現(xiàn)象。[來源:GB/T36464.2—2018,3.14,有修改]3.13聲紋識別voiceprintrecognition11380—2008,3.1.6]3.14語音打斷speechinterruption[來源:GB/T36464.2—2018,3.18,有修改]3.15聲壓級soundpressurelevel聲壓信號的時間均方與基準值平方之比的以10為底的對數(shù)乘以10。注1:聲壓級用分貝(dB)表示。注2:基準值為20μPa。[來源:GB/T3785.1—2023,3.2]按語音交互功能是否需要聯(lián)網(wǎng)分為:離線/按拾音距離分為:≤1m;1m<3m<>5m按語音交互功能是否需要喚醒分為:免喚醒;——語音喚醒;——其他非語音方式喚醒(舉例:按鍵、手勢、系統(tǒng)調(diào)用喚醒)。智能家電的語音交互模塊和業(yè)務系統(tǒng)的邏輯關系示意圖見圖1。圖1智能家電的語音交互模塊和業(yè)務系統(tǒng)的邏輯關系示意圖注:智能家電的交互結(jié)果可以語音、文本、圖像等一種或多種形式組合輸出。智能家電的語音模塊包括前端處理模塊和語音處理模塊。((()在線型或離線/在線混合型語音智能家電的語音處理功能還可通過通信部件在語音服務平臺上實現(xiàn),語音處理功能可包括:語音識別、語義理解、交互決策、語音合成等??刂颇K獲取決策信息,對決策信息分析后對執(zhí)行模塊發(fā)出操控指令。執(zhí)行模塊接收控制模塊的操控指令后執(zhí)行,并將執(zhí)行的結(jié)果反饋給控制模塊。技術要求通用要求通過語音方式進行交互的智能家電應符合以下條款的要求,智能家電根據(jù)其類型還應符合附錄A的特殊要求。智能家電結(jié)構設計要求如下:15dB2dB。安全要求516方式;語音應符合GB/T40660—2021的要求。合GB/T41807功能要求/語音交互功能應能被用戶開啟和關閉。55dB(A70dB(A)。語音喚醒具有喚醒功能的家電,要求如下:語音識別應至少支持關鍵字識別(針對連續(xù)語音流中的特定關鍵字進行識別和檢出)、命令字識別、連續(xù)語音識別中的一種。語義理解宜支持語義理解功能。 注:非目標語音指令舉例:非目標人聲、電視發(fā)聲等。回聲消除宜支持對輸入語音中的回聲進行抑制,提升輸入語音信號的清晰度和可懂度。噪聲抑制宜支持對輸入語音中的背景噪聲進行抑制,提高輸入語音信號的信噪比。聲源定位可支持通過對聲源的平面角、方位角和聲源距離的計算,對發(fā)聲源進行定位。語音打斷開放性聊天可支持開放性聊天功能,能夠在隨機的語音對話中穩(wěn)定保持話題延續(xù)性的能力。多方言/可支持多方言/多語種混用能力,要求如下:可具有(多)語種識別能力:智能家電可自動對輸入語音所屬的某個或多個(2個及以上)(多(2智能家電可支持真人語音操控,也可支持語音錄制或合成方式的語音操控。(合成的語音音頻數(shù)據(jù)格式應符合GB/T34145—2017中表2的要求。語音提示語音提示功能可被開啟和關閉。語音報警智能家電無法識別輸入音頻時,宜給予相關提示。學習能力智能家電的語音交互系統(tǒng)具有軟件升級和數(shù)據(jù)更新功能,要求如下:聲紋識別可具有聲紋識別功能,應符合GB/T37036.5—2023第7章要求。性能要求揚聲器性能智能家電的揚聲器性能宜符合SJ/T11540—20154.4和4.5的要求。拾音距離智能家電根據(jù)廠商標注的拾音距離分類,按照表1的測試距離要求進行測試,喚醒成功率和交互成功率應符合6.5.4和6.5.7的要求。表1拾音距離的測試距離拾音距離分類測試距離近程語音智能家電1m中程語音智能家電3m遠程語音智能家電5m超遠程語音智能家電按制造商聲明的距離進行測試喚醒成功率針對需要喚醒的智能家電,滿足表1拾音距離要求,喚醒成功率要求如下:(40dB(A)≤45dB(A≥95%;(55dB(A)≤60dB(A)≥90%。喚醒成功率計算方法見公式(1)。????

=??????×100%……(1)????式中:??r——喚醒成功率;??????——正確喚醒次數(shù);????——總喚醒次數(shù)。誤喚醒頻度針對需要喚醒的智能家電,誤喚醒頻度應≤1次/24h。針對需要喚醒的智能家電,喚醒響應時間應≤1000ms。喚醒時延計算方法見公式(2)。Twak=Tr-Te (2)式中:Twakms;Tr交互成功率表1交互成功率序號測試語料集可選/必選指令交互成功率(低噪環(huán)境)指令交互成功率(高噪環(huán)境)1本機功能操控語料集必選95%90%2泛化后的本機功能操控語料集必選90%85%3語音交互綜合測試語料集可選85%80%交互成功率的計算方法見公式(3)。式中:????——交互成功率;????

=????+??

×100%……(3)注:以家電本體執(zhí)行的準確性統(tǒng)計交互成功的次數(shù),即語音反饋控制成功,但家電本體未正確執(zhí)行,記為交互失敗。離線語音交互的響應時間不應大于2000ms,在線語音交互響應時間不應大于3000ms。交互響應時間的計算方法見公式(4)。????????=?????????……(4)式中:????????——響應時間;????——家電本體交互給出反饋的開始時刻;????——語音輸入結(jié)束的時刻。智能家電如支持語音打斷功能,語音打斷成功率應符合:≥95%;≥90%(5)式中:????——語音打斷成功率;

????

=????×100%……(5)??N——交互過程中需要執(zhí)行打斷操控的次數(shù);????——被語音交互系統(tǒng)正確響應的次數(shù)。語義拒識率 90%。GB/T37036.5—20238.1.1可靠性要求無故障運行智能家電在72h的測試時間內(nèi),接受持續(xù)的語音交互測試,智能家電功能應能保持正常,如出現(xiàn)家電宕機、語音交互功能無法使用情況則該項測試不合格。容錯性智能家電的容錯性要求如下:語音溫度上升1.℃還是語音易恢復性智能家電出現(xiàn)故障或宕機后,通過自身修復或簡單操作可重新恢復語音交互的正常使用。在線型或離線/在線混合型語音智能家電的語音交互應有斷網(wǎng)恢復功能,要求如下:60s應有斷電恢復功能:6.6.4環(huán)境適應性具體品類智能家電的環(huán)境適應性按照具體品類

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論