




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
ICS03.060A11團(tuán) 體 標(biāo) 準(zhǔn)T/CQJR006—2023銀業(yè)便服務(wù) 方智能技要求Bankingconvenienceservice—Intelligentdialectservice—Technicalrequirement2023-11-20發(fā)布 2023-11-20實(shí)施重慶市金融學(xué)會(huì)發(fā)布T/CQJR006—2023T/CQJR006—2023目 次前言 II引言 III范圍 1規(guī)范性引用文件 1術(shù)語、定義和縮略語 1方言智能服務(wù)系統(tǒng)通用功能框架 2語音交互界面要求 2語音采集 2語音播報(bào) 3輸入輸出 3環(huán)境噪聲適應(yīng)能力 3語種適應(yīng)能力 3數(shù)據(jù)資源要求 3音頻數(shù)據(jù) 3文本數(shù)據(jù) 3前端處理要求 3語音喚醒 4聲源定位 4聲紋識(shí)別 4語音增強(qiáng) 4格式轉(zhuǎn)換 5重采樣 5語音處理要求 5語音處理概述 5語音模塊 5語義模塊 6知識(shí)庫模塊 7服務(wù)渠道 7服務(wù)渠道概述 7服務(wù)渠道功能概述 7電話銀行 7手機(jī)銀行 7網(wǎng)點(diǎn)智能機(jī)具 8普惠金融服務(wù)點(diǎn)及離行式便民金融服務(wù)終端 8參考文獻(xiàn) 9前 言本文件按照GB/T1.1—2020《標(biāo)準(zhǔn)化工作導(dǎo)則 第1部分標(biāo)準(zhǔn)化文件的結(jié)構(gòu)和起草規(guī)則的規(guī)定起草。請注意本文件的某些內(nèi)容可能涉及專利。本文件的發(fā)布機(jī)構(gòu)不承擔(dān)識(shí)別這些專利的責(zé)任。本文件由重慶農(nóng)村商業(yè)銀行股份有限公司提出。本文件由重慶市金融學(xué)會(huì)歸口。本文件起草單位:重慶農(nóng)村商業(yè)銀行股份有限公司、浙江網(wǎng)商銀行股份有限公司、重慶富民銀行股份有限公司、馬上消費(fèi)金融股份有限公司。II引 言“十四五”規(guī)劃綱要提出要“優(yōu)先發(fā)展農(nóng)業(yè)農(nóng)村,全面推進(jìn)鄉(xiāng)村振興”,大量農(nóng)村、老年人群不會(huì)上網(wǎng)、不會(huì)使用智能手機(jī),在出行、就醫(yī)、消費(fèi)等日常生活中遇到不便,無法充分享受智20222025年)》明確“公平普惠”的基本原則,提出合理運(yùn)用金融科技手段“彌合地域間、群體間、機(jī)構(gòu)間的數(shù)字化鴻溝,讓金融科技發(fā)展成果更廣泛、更深入、更公平地惠及廣大人民群眾”,2022年《中國銀保監(jiān)會(huì)辦公廳關(guān)于銀行業(yè)保險(xiǎn)業(yè)數(shù)字化轉(zhuǎn)型的指導(dǎo)意見》提出“推進(jìn)個(gè)人金融服務(wù)數(shù)字化轉(zhuǎn)型”“加強(qiáng)大字版、語音版、民族語言版、簡潔版等應(yīng)用軟件功能建設(shè)”。通過自然語言交互為社會(huì)各群體,尤其是農(nóng)村地區(qū)和中老年客群,提供無障礙金融服務(wù),是打通普惠金融最后一公里,助力鄉(xiāng)村振興戰(zhàn)略的有效途徑。全國各地方言種類眾多,通常分為十大方言:官話方言、晉方言、吳方言、閩方言、客家方本文件在考慮上述情況的基礎(chǔ)上,給出了銀行業(yè)金融機(jī)構(gòu)方言智能服務(wù)技術(shù)要求。III銀行業(yè)便民服務(wù)方言智能服務(wù)技術(shù)要求范圍本文件適用于銀行方言智能服務(wù)相關(guān)工作,包括但不限于產(chǎn)品設(shè)計(jì)、軟件研發(fā)、測試和運(yùn)行維護(hù)、業(yè)務(wù)管理、系統(tǒng)管理、客戶服務(wù)等。規(guī)范性引用文件下列文件中的內(nèi)容通過文中的規(guī)范性引用而構(gòu)成本文件必不可少的條款。其中,注日期的引用文件,僅該日期對應(yīng)的版本適用于本文件;不注日期的引用文件,其最新版本(包括所有的修改單)適用于本文件。GB/T11460信息技術(shù)漢字字型要求和檢測方法GB18030信息技術(shù)中文編碼字符集GB/T21024—2007中文語音合成系統(tǒng)通用技術(shù)規(guī)范GB/T34083—2007GB/T34145—2007SJ/T11380—2008自動(dòng)聲紋識(shí)別(說話人識(shí)別)技術(shù)規(guī)范ISO2156BPoRefrenedataforfinncilservicesSpecificationforthedescriptionofbankingproductsorservices(BPoS))術(shù)語、定義和縮略語下列術(shù)語和定義適用于本文件。方言智能服務(wù) intelligentdialectservice基于人工智能方言識(shí)別技術(shù),在線上線下各服務(wù)渠道(3.4),向客戶(3.3)提供銀行產(chǎn)品服務(wù)(3.2)。銀行產(chǎn)品服務(wù)bankingproductorserviceBPoS供應(yīng)商為滿足客戶的金融需求或與金融相關(guān)的需求而向客戶(3.3)提供的輸出。[來源:ISO21586:2020,3.3]客戶customer期望獲得,或已經(jīng)獲得某BPoS(3.2)(即銀行產(chǎn)品或銀行服務(wù))的個(gè)人或組織。[來源:ISO21586:2020,3.5]1服務(wù)渠道servicechannel提供方言智能服務(wù)(3.1)的電子銀行渠道,包括電話銀行、手機(jī)銀行、自助機(jī)具等。方言智能服務(wù)系統(tǒng)通用功能框架方言智能服務(wù)系統(tǒng)(以下簡稱系統(tǒng))包括語音交互界面、前端處理、語音處理、服務(wù)接口、銀行服務(wù)渠道、銀行金融業(yè)務(wù)處理、數(shù)據(jù)資源等功能單元,系統(tǒng)宜在金融機(jī)構(gòu)本地部署,其中:語音交互界面提供系統(tǒng)與人直接進(jìn)行語音交互的人機(jī)界面,包括語音信號(hào)輸入、輸出以及由前端處理、語音處理支撐的語音能力;數(shù)據(jù)資源包括系統(tǒng)處理的音頻數(shù)據(jù)和文本數(shù)據(jù);前端處理提供語音喚醒、聲源定位、聲紋識(shí)別、語音增強(qiáng)、格式轉(zhuǎn)換、重采樣等功能;語音處理提供語音模塊、語義模塊、知識(shí)庫模塊對語音的單獨(dú)處理及聯(lián)動(dòng)調(diào)優(yōu);服務(wù)接口提供外部設(shè)備/設(shè)施調(diào)用系統(tǒng)語音服務(wù)的接口;銀行金融業(yè)務(wù)處理對語音處理結(jié)果轉(zhuǎn)換為對應(yīng)的應(yīng)用指令并反饋業(yè)務(wù)響應(yīng)結(jié)果;銀行服務(wù)渠道包括電話銀行、手機(jī)銀行、網(wǎng)點(diǎn)智能機(jī)具、便民金融服務(wù)終端等電子服務(wù)渠道。圖1 方言智能服務(wù)系統(tǒng)通用功能框架語音交互界面要求語音采集系統(tǒng)應(yīng)通過傳聲器或者麥克風(fēng)陣列等具備語音采集能力的拾音設(shè)備對語音進(jìn)行采集;宜根據(jù)不同的拾音距離,提供近場拾音和/或遠(yuǎn)場拾音中的一種。并滿足如下要求:2APPAPP——通過網(wǎng)點(diǎn)智能柜員機(jī)、離行式便民金融服務(wù)終端等智能機(jī)具服務(wù)渠道采集語音,系統(tǒng)可盡量復(fù)用現(xiàn)有機(jī)具和拾音設(shè)備,在現(xiàn)有設(shè)備不能滿足服務(wù)需求時(shí),應(yīng)新增拾音設(shè)備。語音播報(bào)系統(tǒng)應(yīng)通過音頻播放設(shè)備對語音進(jìn)行播報(bào),滿足以下要求——語音播報(bào)宜同步提供播報(bào)文本顯示,供客戶核對業(yè)務(wù)辦理信息;——應(yīng)支持播放語音所需的性能要求,如音頻格式、帶寬等;——支持語音播放調(diào)節(jié)功能,能夠?qū)φZ音播放速度、音量等進(jìn)行調(diào)節(jié)。輸入輸出系統(tǒng)應(yīng)支持中文普通話及地方方言輸入輸出。環(huán)境噪聲適應(yīng)能力系統(tǒng)應(yīng)在銀行營業(yè)網(wǎng)點(diǎn)、離行式便民金融服務(wù)終端等服務(wù)渠道正常環(huán)境噪音下能進(jìn)行語音交互,確保人機(jī)交互可用。語種適應(yīng)能力系統(tǒng)可由低到高提供以下幾個(gè)等級普通話/方言適應(yīng)能力,宜支持c)中適應(yīng)能力。在發(fā)起語音交互時(shí),由客戶選擇接受方言或普通話服務(wù);系統(tǒng)自動(dòng)判斷客戶使用方言/普通話,提供相應(yīng)語種服務(wù);系統(tǒng)自適應(yīng)提供方言/普通話服務(wù),支持客戶方言/普通話混用。數(shù)據(jù)資源要求音頻數(shù)據(jù)系統(tǒng)音頻數(shù)據(jù)主要用于語音識(shí)別和語音合成,要求如下:——在銀行金融機(jī)構(gòu)內(nèi)部場景采集的音頻數(shù)據(jù)宜在行內(nèi)本地存儲(chǔ);GB/T34083—20171GB/T34083—20171注1:贛方言、徽方言、平話土話。注2:次方言指方言區(qū)內(nèi)細(xì)分方言。文本數(shù)據(jù)系統(tǒng)的文本數(shù)據(jù)主要用于各功能單元之間的信息傳輸、交換和共享,要求如下:——應(yīng)與具體操作系統(tǒng)和平臺(tái)無關(guān),并且可擴(kuò)展;——宜是結(jié)構(gòu)化數(shù)據(jù),便于系統(tǒng)處理;——中文編碼字符應(yīng)符合GB18030的規(guī)定,并依據(jù)GB/T11460進(jìn)行檢測;——中文語音合成數(shù)據(jù)交換格式應(yīng)符合GB/T21024—2007中第5章的要求。前端處理要求3語音喚醒命令字喚醒——系統(tǒng)應(yīng)支持使用預(yù)先定義的命令字來對系統(tǒng)進(jìn)行語音喚醒;——系統(tǒng)宜支持普通話和方言命令字語音喚醒;——不同銀行服務(wù)渠道預(yù)定義語音喚醒命令字宜保持一致。自定義喚醒命令字在手機(jī)銀行等客戶自有設(shè)備服務(wù)渠道,系統(tǒng)宜支持客戶自定義語音喚醒命令字。多喚醒命令字系統(tǒng)宜支持使用不同命令字進(jìn)行語音喚醒;可根據(jù)指定的喚醒命令字進(jìn)入對應(yīng)的業(yè)務(wù)辦理狀態(tài)或模式。多音頻流監(jiān)聽系統(tǒng)在進(jìn)行語音喚醒時(shí),應(yīng)支持同時(shí)監(jiān)聽多個(gè)音頻流。聲源定位系統(tǒng)應(yīng)支持通過對聲源的平面角、方位角和聲源距離的計(jì)算,來對發(fā)聲源進(jìn)行定位。聲紋識(shí)別一般要求系統(tǒng)應(yīng)支持下列聲紋識(shí)別功能:——文本相關(guān)的聲紋識(shí)別;——文本無關(guān)的聲紋識(shí)別;——指定文本的聲紋識(shí)別;——聲紋模型訓(xùn)練;——聲紋模型自適應(yīng);——聲紋確認(rèn);——聲紋辨認(rèn);——聲紋檢出;——聲紋追蹤;——語言相關(guān)的聲紋識(shí)別;——語言無關(guān)的聲紋識(shí)別;上述功能描述和要求應(yīng)符合SJ/T11380—2008第3章的要求。聲紋文本獲取聲紋輔助身份認(rèn)證在滿足法律法規(guī)和監(jiān)管要求的前提下,可通過聲紋識(shí)別輔助客戶身份認(rèn)證。語音增強(qiáng)噪聲抑制4系統(tǒng)應(yīng)支持對輸入語音中的背景噪聲進(jìn)行抑制,提高語音的信噪比?;祉懴到y(tǒng)應(yīng)支持對輸入語音中的晚期混響進(jìn)行抑制,提升語音信號(hào)的清晰度和可懂度。格式轉(zhuǎn)換系統(tǒng)應(yīng)支持將音頻的格式轉(zhuǎn)換到另外一種格式,以滿足語音處理的要求。重采樣系統(tǒng)應(yīng)支持改變數(shù)字語音信號(hào)的采樣率,以滿足語音處理的要求。語音處理要求語音處理概述系統(tǒng)宜聯(lián)動(dòng)語音、語義、知識(shí)庫模塊,對語音識(shí)別進(jìn)行聯(lián)動(dòng)調(diào)優(yōu),提升方言識(shí)別準(zhǔn)確率。語音模塊客戶語音識(shí)別要求系統(tǒng)宜支持下列客戶語音識(shí)別:——使用普通話;——使用地方方言;——普通話和地方方言混用;——使用帶有方言口音的普通話;語音識(shí)別模型官話方言等與普通話相近的地方方言,宜使用“普通話—方言”混合模型,與普通話差異較大的地方方言宜使用“先分類—后識(shí)別”分類識(shí)別模型。注3:八種次方言。注4:“普通話—方言”混合模型是指同時(shí)使用普通話和方言語料訓(xùn)練的語音識(shí)別模型,無論客戶使用方言或/和普通話,均使用該模型進(jìn)行識(shí)別。注5:類結(jié)果,調(diào)用普通話識(shí)別模型或方言識(shí)別模型進(jìn)行識(shí)別。語音識(shí)別功能系統(tǒng)應(yīng)支持下列全部或者大部分語音識(shí)別功能:——自定義語法;——個(gè)性化識(shí)別;——識(shí)別結(jié)果多候選;——自定義熱詞;——自定義同義詞庫;——自定義錯(cuò)別字詞庫;——識(shí)別結(jié)果進(jìn)階;——語音信息識(shí)別;——說話人信息識(shí)別。5話者分流在理財(cái)銷售雙錄等雙人對話或多人會(huì)話場景下,系統(tǒng)應(yīng)支持按說話人將語音信息分流。遠(yuǎn)近場音頻處理涉及客戶個(gè)人信息、金融交易信息的服務(wù)場景,應(yīng)使用近場音頻處理,避免客戶信息泄露;語音識(shí)別方式系統(tǒng)應(yīng)支持關(guān)鍵字識(shí)別、命令字識(shí)別及連續(xù)語音識(shí)別。語音合成類型系統(tǒng)宜支持下列一種或多種類型語音合成:——普通話語音合成;——方言語音合成;——男聲語音合成;——女聲語音合成;——多種音色語音合成;——多種音調(diào)語音合成;——多種語速語音合成;——多種語氣語音合成。語音合成功能系統(tǒng)應(yīng)支持下列全部或大部分語音合成功能:——流式語音合成;——多種合成文本編碼;——自定義分詞;——自定義讀音;——合成文本位置信息;——文本分詞和拼音信息;——音頻時(shí)間信息。上述功能描述和要求應(yīng)符合GB/T34145—2017中4.2和4.3的要求。語義模塊自定義語義詞典系統(tǒng)能支持自定義語義詞典。自定義語義庫系統(tǒng)能支持自定義語義庫。語義聯(lián)動(dòng)調(diào)優(yōu)系統(tǒng)宜支持通過模糊識(shí)別、語義抽取、語義排序等方式糾正方言語音識(shí)別錯(cuò)誤,理解用戶意圖?!:R(shí)別,系統(tǒng)應(yīng)能夠處理錯(cuò)別字、同義字、多字少字問題?!Z義抽取,系統(tǒng)在交互過程中,應(yīng)抽取語義要素和用戶的關(guān)鍵意圖?!Z義排序,系統(tǒng)能在語義理解結(jié)果中給出多個(gè)排序后的理解結(jié)果,供用戶進(jìn)行選擇或二次確認(rèn)。6知識(shí)庫模塊知識(shí)類型應(yīng)支持以下類型知識(shí):——文庫或/和文檔;——FAQ(常見問題解答);——百科類知識(shí)圖譜。知識(shí)構(gòu)建方法可支持以下幾個(gè)等級知識(shí)構(gòu)建方法,宜采用b)、c)知識(shí)構(gòu)建方法:人工知識(shí)構(gòu)建;半自動(dòng)知識(shí)構(gòu)建,在執(zhí)行自動(dòng)知識(shí)抽取后,由人工校對錄入;全自動(dòng)知識(shí)構(gòu)建。知識(shí)庫聯(lián)動(dòng)調(diào)優(yōu)在方言語音識(shí)別效果不佳時(shí),可以通過知識(shí)檢索引導(dǎo)客戶,明確客戶意圖。服務(wù)渠道服務(wù)渠道概述金融機(jī)構(gòu)應(yīng)宜以下一個(gè)或多個(gè)服務(wù)渠道提供方言智能服務(wù):——電話銀行;——手機(jī)銀行;——網(wǎng)點(diǎn)智能機(jī)具;——普惠金融服務(wù)點(diǎn)及離行式便民金融服務(wù)終端。服務(wù)渠道功能概述各服務(wù)渠道宜提供以下一項(xiàng)或多項(xiàng)方言智能服務(wù)功能:——方言智能導(dǎo)航(IVR),客戶可通過方言語音命令導(dǎo)航至所需服務(wù);——方言智能填單,客戶可通過方言語音輸入文本信息,系統(tǒng)自動(dòng)識(shí)別填寫;——方言對話交互,客戶可使用方言語音與系統(tǒng)進(jìn)行自然語言交互,支持單輪問答、多輪對話;——方言智能控制,客戶可使用方言控制交互UI界面、物聯(lián)網(wǎng)設(shè)備等;——方言播報(bào),可使用方言播報(bào)業(yè)務(wù)辦理信息、人機(jī)交互信息。電話銀行電話銀行渠道方言服務(wù)宜滿足如下要求:——宜同時(shí)提供方言智能語音服務(wù)及按鍵式服務(wù)供客戶選擇;——宜提供方言智能導(dǎo)航、方言智能填單、方言對話交互功能;——客戶可通過方言語音命令切換到人工服務(wù);——宜在客戶使用方言智能填單輸入身份證號(hào)、銀行卡號(hào)、交易金額等信息后,語音播報(bào)填單信息,由客戶確認(rèn);——不應(yīng)使用語音輸入交易密碼等敏感信息。手機(jī)銀行手機(jī)銀行等移動(dòng)金融客戶端應(yīng)用渠道方言服務(wù)宜滿足如下要求:7——宜支持方言智能導(dǎo)航、方言智能填單、方言對話交互功能;——宜提供方言語音控制功能,模擬移動(dòng)金融客戶端應(yīng)用觸摸、物理按鍵等操作,提供無障礙服務(wù);——宜提供文字朗讀功能,播報(bào)移動(dòng)金融客戶端應(yīng)用UI界面文字信息。網(wǎng)點(diǎn)智能機(jī)具網(wǎng)點(diǎn)智能機(jī)具渠道方言服務(wù)宜滿足如下要求:——宜支持方言智能導(dǎo)航、方言智能填單、方言對話交互功能,可提供方言智能控制功能;——智能機(jī)具宜提示客戶,系統(tǒng)提供方言語音服務(wù);——智能機(jī)具宜提供分離式話筒、聽筒,降低廳堂開放環(huán)境客戶語音信息泄露風(fēng)險(xiǎn);——智能機(jī)具宜支持方言語音命令呼叫網(wǎng)點(diǎn)工作人員。注:分離式聽筒和話筒是指客戶能貼耳使用的聽筒和話筒,可采用有線或無線方式與網(wǎng)點(diǎn)智能機(jī)具連接。普惠金融服務(wù)點(diǎn)及離行式便民金融服務(wù)終端普惠金融服務(wù)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 中外服裝史知到課后答案智慧樹章節(jié)測試答案2025年春德州學(xué)院
- 銀川市重點(diǎn)中學(xué)2025屆高三下學(xué)期教學(xué)質(zhì)量監(jiān)測(三模)英語試題含解析
- 新疆哈密市第十五中學(xué)2024-2025學(xué)年高三(高補(bǔ)班)下學(xué)期期末語文試題試卷含解析
- 吉首大學(xué)《給排水管道工程》2023-2024學(xué)年第二學(xué)期期末試卷
- 郴州思科職業(yè)學(xué)院《傳熱學(xué)基礎(chǔ)》2023-2024學(xué)年第二學(xué)期期末試卷
- 江西財(cái)經(jīng)大學(xué)現(xiàn)代經(jīng)濟(jì)管理學(xué)院《運(yùn)籌學(xué)》2023-2024學(xué)年第二學(xué)期期末試卷
- 河北交通職業(yè)技術(shù)學(xué)院《醫(yī)用生物材料C》2023-2024學(xué)年第二學(xué)期期末試卷
- 工程造價(jià)咨詢依據(jù)
- 2025年衛(wèi)浴柜行業(yè)現(xiàn)狀分析:全球衛(wèi)浴柜市場規(guī)模將達(dá)410億美元
- 2025年茶飲市場分析:規(guī)模、競爭與未來展望
- 水的組成發(fā)現(xiàn)史
- 葫蘆絲基礎(chǔ)教程-課件
- 優(yōu)秀-敦煌壁畫課件
- 普法講座-治安管理處罰法課件
- 飼料和飼料添加劑管理?xiàng)l例解讀課件
- 英語新課標(biāo)(英文版)
- 小腸疾病分類及應(yīng)用SmallIntestinalDisease課件
- 消防控制室值班記錄1
- 安全生產(chǎn)費(fèi)用投入計(jì)劃表
- 2022年江蘇醫(yī)藥職業(yè)學(xué)院單招考試面試試題及答案解析
- 三年級語文下冊第三單元語文園地三(說課稿)
評論
0/150
提交評論