




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
智能座艙語音交互系統(tǒng)認(rèn)知主講教師:課程導(dǎo)入01語音交互系統(tǒng)的概念02語音交互系統(tǒng)的基礎(chǔ)技術(shù)03主流車載語音助手功能04語音交互系統(tǒng)的特點(diǎn)PART01語音交互系統(tǒng)的概念一、語音交互系統(tǒng)的概念語音交互系統(tǒng)(VoiceUserInterface,VUI)通俗地說就是駕乘人員通過自己開口說話的方式用語言給車機(jī)下達(dá)指令,以滿足駕乘人員的行車駕乘需求。(一)基本概念PART02語音交互系統(tǒng)的基礎(chǔ)技術(shù)二、語音交互系統(tǒng)的基礎(chǔ)技術(shù)(一)基礎(chǔ)技術(shù)語音喚醒語音識別自然語言處理語音合成語音增強(qiáng)音效增強(qiáng)自然語言理解對話管理自然語言生成二、語音交互系統(tǒng)的基礎(chǔ)技術(shù)(二)語音增強(qiáng)由于汽車內(nèi)部的噪聲源較多,這些噪聲會減弱用戶人聲音頻信號的特征,直接影響語音識別的準(zhǔn)確性。通常采用基于麥克風(fēng)陣列的語音增強(qiáng)技術(shù),可有效抑制噪聲產(chǎn)生的影響,保證較干凈的用戶人聲音頻信號輸入語音交互系統(tǒng),提高語音識別的準(zhǔn)確率。二、語音交互系統(tǒng)的基礎(chǔ)技術(shù)(三)語音喚醒語音喚醒是語音交互技術(shù)的第一入口,當(dāng)語音交互系統(tǒng)在休眠狀態(tài)時(shí),用戶可以通過指定的喚醒詞使其從休眠狀態(tài)進(jìn)入激活狀態(tài),來開啟語音交互對話。二、語音交互系統(tǒng)的基礎(chǔ)技術(shù)(四)語音識別語音識別就是將用戶的語音轉(zhuǎn)換為文本,并且保留語速、音量、停頓等語音特征信息。通過語音增強(qiáng)技術(shù)對用戶聲音進(jìn)行處理;對增強(qiáng)后的語音進(jìn)行關(guān)鍵特征的提??;通過聲學(xué)模型匹配對提取到的語音關(guān)鍵特征進(jìn)行轉(zhuǎn)換,得到一個類似于漢語拼音的發(fā)聲信息;通過語言模型與發(fā)聲信息進(jìn)行詞或字的對比。二、語音交互系統(tǒng)的基礎(chǔ)技術(shù)(五)自然語言處理自然語言處理是語音交互技術(shù)最難的環(huán)節(jié),將用戶人聲音頻信號抽象成能夠讓機(jī)器理解的表示形式。自然語言理解:通過分析語音識別后的文本語義和語法,并從文本語言中獲得文本含義。對話管理:機(jī)器通過對話對接用戶接下來可能會發(fā)生的動作,進(jìn)行管理決策并更新對話狀態(tài),然后不斷重復(fù)直到結(jié)束。自然語言生成:機(jī)器通過對話管理后的決策,生成為回復(fù)給用戶的文本。二、語音交互系統(tǒng)的基礎(chǔ)技術(shù)(六)語音合成語音合成是語音交互技術(shù)的出口,機(jī)器將文本轉(zhuǎn)換為給用戶聽的語音,完成一次語音交互。基本原理將任意文字信息通過語言處理進(jìn)行斷句,再通過韻律處理規(guī)劃合成語音的音階、音高、音長、音強(qiáng)等音素,使合成的語音能夠正確地表達(dá)說話人所要表達(dá)的意圖,使其聽起來更自然,最后把文字信息對應(yīng)的音素單元進(jìn)行拼接,通過聲學(xué)處理輸出語音合成后的音頻。二、語音交互系統(tǒng)的基礎(chǔ)技術(shù)(七)音效增強(qiáng)音效增強(qiáng)是基于車內(nèi)復(fù)雜的噪聲環(huán)境以及揚(yáng)聲器位置造成的復(fù)雜聲場環(huán)境,通過加入高級環(huán)繞算法,對合成好的音頻進(jìn)行專業(yè)聲學(xué)處理。未經(jīng)專業(yè)聲學(xué)處理的音響系統(tǒng)會丟失聲音的定位信息,不能還原聲音的左右空間感與前后縱深感,聲音雜亂無章、互相干擾。PART03主流車載語音助手功能三、主流車載語音助手功能(一)語音交互功能語音交互功能主要包括語音識別、語音合成。通過語音交互功能,系統(tǒng)能夠通過用戶的語音指令,從而實(shí)現(xiàn)各應(yīng)用程序的功能控制。同時(shí),針對接收到的語音指令,系統(tǒng)能夠給予用戶正確的語音反饋。三、主流車載語音助手功能(二)語音資訊查詢語音資訊查詢是車載語音系統(tǒng)的輔助功能,用戶通過全語音交互的形式即可實(shí)現(xiàn)信息的自主查詢功能,從而在提高系統(tǒng)執(zhí)行效率的同時(shí),避免了用戶注意力的分散,保障了用戶的駕駛安全。三、主流車載語音助手功能(三)娛樂功能娛樂功能是車載語音系統(tǒng)的核心功能,用戶可通過控制指令實(shí)現(xiàn)音樂應(yīng)用程序的打開、關(guān)閉,實(shí)現(xiàn)對歌曲播放模式的控制。三、主流車載語音助手功能(四)語音控制車輛原有設(shè)備針對車輛內(nèi)的空調(diào)、車窗、天窗等設(shè)備,通過采用全語音交互的方式,從而使系統(tǒng)控制更為快捷、便利。相較于傳統(tǒng)的觸摸屏幕的形式,語音交互不會分散用戶的注意力,能夠用戶的行車安全。PART04語音交互系統(tǒng)的特點(diǎn)四、語音交互系統(tǒng)的特點(diǎn)(一)語音交互系統(tǒng)的優(yōu)點(diǎn)解放雙手和雙眼通過語言交互可以將手和眼睛空起來處理其他事情,在需要多感官協(xié)同的場景下效率更高。使用門檻低針對老人、小孩、失明的人群,無法使用文字交互,語音交互會為其帶來極大的便利。更舒適的第三空間對于用戶來說,智能汽車不再是冰冷的機(jī)器,而是可以聊天交流的對象。更自然的控制流程對新用戶更加友好,哪怕沒看過說明書,也能通過“所說即所得”的方式使用服務(wù)。優(yōu)點(diǎn)四、語音交互系統(tǒng)的特點(diǎn)(二)語音交互系統(tǒng)的缺點(diǎn)接收效率比較低在獲取外界有效信息時(shí),人類的視覺要強(qiáng)過聽覺。用戶的心理負(fù)擔(dān)用戶處在一個比較開放的需要顧
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 后備干部培訓(xùn)心得體會
- 中孕期超聲系統(tǒng)篩查
- DB43-T 2867-2023 砂石畫工藝規(guī)范
- 煤礦安全生產(chǎn)法培訓(xùn)教案
- 初中數(shù)學(xué)人教版八年級上冊 第十四章《三角形》單元復(fù)習(xí)課 教學(xué)設(shè)計(jì)(含課后檢測)
- 聯(lián)盟客服考試題及答案
- 潰瘍性結(jié)腸炎護(hù)理措施
- 大運(yùn)會培訓(xùn)考試題及答案
- 采暖入門培訓(xùn)課件
- 主管班培訓(xùn)開訓(xùn)
- 眼科護(hù)理中的醫(yī)療事故與風(fēng)險(xiǎn)管理
- 煤礦崗位標(biāo)準(zhǔn)化作業(yè)流程
- 《合理使用抗生素》課件
- 數(shù)字美的智慧工業(yè)白皮書-2023.09
- 橋梁施工進(jìn)度圖
- 某啤酒廠安全現(xiàn)狀評價(jià)設(shè)計(jì)報(bào)告書模板
- 廣西桂林市2022-2023學(xué)年高二下學(xué)期期末質(zhì)量檢測數(shù)學(xué)試題(含答案解析)
- 內(nèi)墻抹灰安全技術(shù)交底
- 中學(xué)美術(shù)校本教材《素描》
- 國開2023年春《理工英語1》機(jī)考網(wǎng)考期末復(fù)習(xí)資料參考答案
- 《幼兒生活活動保育》課程標(biāo)準(zhǔn)
評論
0/150
提交評論