體驗了6款車載智能語音助手后的總結(jié)

上傳人：y*** IP屬地：廣東上傳時間：2022-11-12 格式：DOCX 頁數(shù)：9 大小：57.07KB 積分：5.88 舉報 版權(quán)申訴

已閱讀5頁，還剩4頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認領(lǐng)

文檔簡介

體驗了6款車載智能語音助手后的總結(jié)智能汽車可以分為兩大塊：自動駕駛和智能座艙。自動駕駛主要研究的是怎么從A點移動到B的點；而智能座艙主要研究的是，在移動的過程中，怎么給車艙內(nèi)的用戶創(chuàng)造更好的生活體驗?，F(xiàn)在大家提成出了一個新的概念：智能座艙是第三生活空間。即繼家庭、工作以外的另一個生活空間。目前在智能座艙里比較核心的一個能力就是智能語音助手，通過智能語音助手幫助用戶去操控整個智能座艙，為用戶提供服務(wù)。本文主要討論的是智能座艙里的智能語音助手。一、車載智能語音助手目前都能做些什么？總的來說，車載語音助手可以給車機系統(tǒng)的應(yīng)用程序發(fā)送指令和給車機部件發(fā)送指令?？梢娂纯烧f，即在中控屏上看到的功能，都可以用語音的方式發(fā)送指令控制。主要分為兩大塊：1.操控娛樂信息操控娛樂信息是指控制中控屏里的娛樂信息應(yīng)用程序（非汽車部件），如播放音樂、查天氣、查股票、播放電影、播放電臺等。2.操控車機操控車機是指操控汽車零部件，如操控空調(diào)、車窗、座椅、氛圍燈等；但通常不會控制汽車行駛移動相關(guān)的功能，如不控制汽車行駛的速度、轉(zhuǎn)向等。小結(jié)通常座艙內(nèi)會有多個麥克風，能夠識別到用戶在哪個位置說話。比如坐在副駕駛的用戶說“打開車窗”，會打開副駕駛的車窗，不需要用戶說明要打開哪個車窗。目前主要是通過語音呼叫方式來喚醒語音助手，類似于智能音箱的喚醒方式。未來應(yīng)該會朝著多種喚醒方式的方向發(fā)展，如通過視覺的方式，看到用戶在調(diào)座椅，助手可以主動說“可以通過說話方式來調(diào)整座椅哦”。主動地給用戶提供服務(wù)，目前更多是被動的方式。有些廠商目前一次喚醒只能發(fā)送一條指令，未來應(yīng)該會朝著持續(xù)監(jiān)控用戶意圖的方式發(fā)展。目前理解用戶意圖基本只會通過語音的方式，未來肯定是朝著多模態(tài)的方向發(fā)展，如通過語音+視覺+各種傳感器等多緯度的信息理解用戶的意圖。二、各車型智能語音助手功能總結(jié)筆者通過線下體驗店體驗了6款車型的智能語音助手，記錄了體驗的感受。當然會有誤差或不準確，僅供大家參考。誤差的影響因素可能來自：環(huán)境網(wǎng)絡(luò)差、用戶操作不當、環(huán)境噪音等。1.比亞迪-漢關(guān)鍵字：中規(guī)中矩、無明顯短板也無明顯亮點基礎(chǔ)的控制汽車部件、控制媒體信息的能力都有；媒體信息的豐富度也很多、響應(yīng)速度和準確率也不錯。缺點：不支持一次喚醒多次對話。大多數(shù)場景不支持多輪交互（如先播放周杰倫的音樂，再說：再播放他的電影，不支持）。閑聊能力幾乎沒有，如說：“你好笨啊”、“我生氣了”，助手接不了話。2.零跑-C01關(guān)鍵字：基礎(chǔ)能力都有，但不穩(wěn)定基礎(chǔ)的控制汽車部件、控制媒體信息的能力都有；媒體信息的豐富度也很多、響應(yīng)速度和準確率也很高。支持一次喚醒，在一定時間內(nèi)可進行多次交互。缺點：說打開車窗、換個氛圍燈等對汽車零部件的控制指令，不穩(wěn)定，有時不執(zhí)行。大多數(shù)場景不支持多輪交互（如先播放周杰倫的音樂，再說：再播放他的電影，不支持）。閑聊的內(nèi)容幾乎沒有，如說：“你好笨啊”、“我生氣了”，助手接不了話。3.問界-M5關(guān)鍵詞：鴻蒙系統(tǒng)、多輪交互車機用的是鴻蒙系統(tǒng)，手機跟車機系統(tǒng)互聯(lián)互通（不是投屏）、響應(yīng)超快。支持一次喚醒，在一定時間內(nèi)可進行多次交。支持多意圖，如能識別并執(zhí)行“打開車窗和打開”。有多輪交互的能力，如先說：“把主駕駛座椅調(diào)成按摩”，再說“座椅調(diào)前一點”，能理解到說的是前排座再調(diào)前一點。支持根據(jù)人臉I(yè)D，記憶用戶偏好，如座椅位置。缺點：一系列都需要用的是華為的產(chǎn)品、限制比較多、應(yīng)用軟件必須要在鴻蒙系。閑聊的能力幾乎沒有，如說：“你好笨啊”、“我生氣了”，助手接不了。4.理想-L9關(guān)鍵詞：有驚喜、語音+視覺理解1）語音助手支持語音+視覺方式結(jié)合去理解用戶的意圖。比如，“打開這個”，邊說，邊用手指指著要操作的物體，就能識別。暫且不說有多方便，起碼算是語音和視覺一起識別用戶意圖的一個開始，后續(xù)有很多想象的空。2）支持一次喚醒，在一定時間內(nèi)可進行多次交。（沒有找到明顯的缺點）5.極氪-001關(guān)鍵詞：中規(guī)中矩、支持閑聊1）有一定的閑聊能力。2）支持一次喚醒，維持一段時間的交互。缺點：一些使用頻次低的功能，意圖的識別準確度還是比較低。不支持多輪交互，如“座椅調(diào)前一點”；再說“再調(diào)前點”，就每辦法識別了。6.特斯拉-Model3關(guān)鍵詞：語音助手跟國內(nèi)新勢力相比，不是同一個級別缺點：需要按住按鈕才能說話意圖缺乏泛化能力，基本要完全命中文案才會執(zhí)行很多命中了也沒辦法執(zhí)行指令總的來說【簡約】，能減的功能都給你減了。使用體驗評分根據(jù)個人的體驗，做了下評分，供大家參考。三、總結(jié)智能車載語音助手待優(yōu)化問題1.喚醒問題很多廠家的語音助手還是只能支持一次喚醒，一次對話的形式。若用戶需要連續(xù)跟助手對話時，交互的效率和體驗會大打折扣的。一次喚醒，一段時間內(nèi)支持監(jiān)測用戶多次說話，可能會引發(fā)誤理解的問題。用戶在跟其他人說話或者在唱歌，可能會給語音助手誤以為是在給它發(fā)指令，引發(fā)誤操作。2.低頻使用的功能待完善雖然很多廠家都標榜自己可見即可說，但實際上很多低頻操控的功能還不是很完善。比如說：調(diào)整座椅等，意圖的識別準確率偏低，意圖識別的顆粒度不夠細。3.多模態(tài)識別問題目前理解用戶意圖的方式還是比較單一，大多數(shù)只能通過語音理解。但在環(huán)境音比較嘈雜的情況下，理解的準確率度會偏低，如打開車窗后噪音比較大、車內(nèi)多乘客同時說話、媒體音量比較大時，都會影響助手對用戶意圖的理解。在這樣的環(huán)境下，如果讓語音+唇語+手勢等其他緯度結(jié)合去理解用戶的意圖，可以提升對用戶意圖理解的準確率，這也是未來大家爭相要突破的方向。4.多輪交互問題大多廠商的語音助手在多輪交互上的能力還是比較欠缺的，甚至沒有。比如，先說“放一首周杰倫的歌”，然后再說“放他的電影吧”，這時就識別不了是要放周杰倫的電影了。需要實現(xiàn)多輪的對話能力，還需要涉及怎么維持對話的狀態(tài)、記錄對話的槽位信息等等。用戶實際的對話場景是非常復雜的，如果讓語音助手看起來跟智能，有更加自然的對話效果，還是有很長的路要走的。5.閑聊、情感陪伴問題大多數(shù)廠商在閑聊（非執(zhí)行任務(wù)或指令）的場景下，能力還是很弱的，甚至是沒有的。比如說：“今天天氣真好”、“今天好開心啊”、“又下雨了怎么辦呢”等等，智能助理基本是無法接話的。處理執(zhí)行任務(wù)和指令是基礎(chǔ)能力，但

人人文庫> 全部分類> 行業(yè)資料 > 信息產(chǎn)業(yè)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責。
6. 下載文件中如有侵權(quán)或不適當內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

體驗了6款車載智能語音助手后的總結(jié)

文檔簡介

溫馨提示

最新文檔

評論

體驗了6款車載智能語音助手后的總結(jié)

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔