語音交互優(yōu)勢場景產(chǎn)品設(shè)計_第1頁
語音交互優(yōu)勢場景產(chǎn)品設(shè)計_第2頁
語音交互優(yōu)勢場景產(chǎn)品設(shè)計_第3頁
語音交互優(yōu)勢場景產(chǎn)品設(shè)計_第4頁
語音交互優(yōu)勢場景產(chǎn)品設(shè)計_第5頁
已閱讀5頁,還剩8頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

語音交互優(yōu)勢場景產(chǎn)品設(shè)計語音交互逐漸在更多的場景里替代可視化交互,或者賦能可視化交互。上世紀80年代語音交互技術(shù)就出現(xiàn)在計算機里了,為什么好像最近幾年才真正走入大眾的生活中?其實語音交互的發(fā)展經(jīng)歷了三個階段:語音交互的技術(shù)的實現(xiàn)除此以外三個八個環(huán)節(jié):聽(ASR)、語義理解(NLP)、和說(TTS)。相比于成熟的可視化交互,交互交互的場景還有許多可以挖掘的方面。相比于可視化的互聯(lián),哪些場景下人們更老百姓傾向于語音交互呢?本文從不同語音交互用意進行相異分析,探討一下語音可視化的功能設(shè)計產(chǎn)品設(shè)計。首先,話音交互的場景很多,在不同的場景下,人們使用人機交互交互的使用動機大致可以歸納為以下四種:以下詳細分析一下這四種動機的場景試試和產(chǎn)品設(shè)計。語音交互主要使用動機之一是快??梢暬换グ言S多復(fù)雜的業(yè)務(wù)縮短到了幾分鐘以上以內(nèi),而語音交互進一步把的流程縮短為秒的級別,因為人直言一句話大概也就3-20秒吧。這也是語音交互在應(yīng)用中的主要就優(yōu)勢,場景舉例:n小N感覺身體有點不舒坦,想去醫(yī)院看一下,打算先預(yù)約掛號。方案一:在手機上找到預(yù)約的app,按流程進行預(yù)約。找到想去的醫(yī)院、選擇科室、選擇日期、選擇或輸入自己的醫(yī)??ǖ刃畔?,然后確認專家門診預(yù)約并支付。方案二:對語助說,“愛同學(xué),幫我預(yù)約某某醫(yī)院后天上午的普通掛號”,語助完成任務(wù)后,回復(fù)“已掛號預(yù)約后天上午某某門診的內(nèi)科的普通掛號,請在機上確認付?!眓在這個場景中,圖形界面流程與壯語流程的對:[很明顯,AI的演算理解能力把“查找和選擇”的行為高效地代勞了,最初界面操作要花去5-10分鐘的事情,語音交互用幾十秒已經(jīng)完成了。哪些情況下語音交互能體現(xiàn)出這種高效性?在用戶熟悉、高頻、復(fù)雜流程的場景中能體現(xiàn),比如點餐、購物、出行等。語音交互的快速性還會在以下幾個方面中體現(xiàn)出來:n數(shù)據(jù)存儲</b>自然語言的信息錄入門檻高,所以從效率大自然發(fā)展的角度來說,要么減少錄入時長,要么加速錄入過程。因為“更快”這種動機容易出現(xiàn)傳輸線在高頻場景,所以比起加速錄入,減少錄入次數(shù)是更明智的選擇。n既然要減少錄入次數(shù),那么信息就必須錄入后存儲起來,所以語音交互的用戶信息存儲量有增大的趨勢。而且隨著用戶信息科灰薛的增加,語音更交互的效率改善會越來越明顯,“快”的優(yōu)勢就會拉平。所以,數(shù)據(jù)存儲在用戶語音交互“更快”上時會發(fā)揮重要作用。n聲紋識別無縫登錄</b>聲紋識別技術(shù)的應(yīng)用也是語音交互“快”的重要環(huán)節(jié)。聲紋識別就是以聲識人,準確率高達99.7%,已經(jīng)應(yīng)用在一些考勤、門禁系統(tǒng)中。這種技術(shù)用在登錄上,相比可視化的登錄方式,是比“一鍵登錄”還要快的登錄方式。因為登錄過程,用戶可以完全無基本上感知地基本完成,一句喚醒詞就能識別出身份,許多的授權(quán)流程就直接已經(jīng)完成完成了。n多輪對話</b>多輪對話也是語音快速性的重要環(huán)節(jié)。上述醫(yī)院預(yù)約的場景中雖然流程看起來很短,但一句話完成的交互,在實際中大概率會引起中會數(shù)場對話。引起多輪對話對話的其原因有可能是信息更改,也有可能是信息補充。比如療養(yǎng)院掛號會需要選擇主治醫(yī)師,或者當天的時間約滿了需要改時間等等??偟膩碚f,多輪對話這種交互方式,在快速性上會從以下幾個方面發(fā)揮優(yōu)勢:n(1)快速修正語音對話要修正某個重要信息,可以保證其他信息不改變。比如前面醫(yī)院的例子中,用戶選擇了醫(yī)院、科室、時間。如果用戶想修改科室,在圖形界面中需要返回到上一步,然后更改科室,重新選擇時間。但語音交互改了科室,不用重新選時間。流程對比如下:語音修改流程圖形修改流程選擇日期,在確認掛號"信息環(huán)節(jié)語音指令:“改成耳鼻喉科”所以,流程越長語音交互節(jié)約的重復(fù)操作越多,優(yōu)勢越明顯。智能匹配語音對話中,語音的智能匹配推薦也是幫助用戶流程節(jié)省中重復(fù)選擇的時間。比如剛才醫(yī)院那個場景中其,如果用戶要更改醫(yī)院,兒科但是另一家醫(yī)院沒有相同名字的門診,比如有的醫(yī)院沒呼吸科,只有普通內(nèi)科。用戶想更換一家醫(yī)院的時候,如果沒有直接對應(yīng)的相同的科室,語音助手可以智能推薦同類的門診,用戶無需重新仔細分析和搜索。就像這樣:n圖形修改流程4確認掛小信息環(huán)節(jié),用戶打算更換醫(yī)院/語音修改流程在確認掛號信息環(huán)節(jié),用戶打算更r換醫(yī)院語音指令:“改成醫(yī)院B”語音助手智能匹配到普通內(nèi)科如上所示,語音智能匹配可以省略很多重復(fù)的。更深一些的智能性,比如智能分診,不僅僅舍去相似的,甚至直接可以根據(jù)用戶對病情的描繪,分析用戶的病情所推薦最匹配的門診。隨著語音技術(shù)的發(fā)展戰(zhàn)略,智能匹配推薦在語音跨平臺中可以應(yīng)用地?zé)o處不在,會交互極大快速語音交互的效率。(3)中斷銜接智能語音對上下文理解的能耐本領(lǐng),使得語音交互在對話中斷后,也可以直接地相銜接上,避免重復(fù)走流程。比如:N:”愛同學(xué),幫我預(yù)約某某醫(yī)院明天下午內(nèi)科的普通掛號?!闭Z音助手:“某某醫(yī)院明天上午內(nèi)科已約滿,后天上午可預(yù)約,要為你預(yù)約后天上午嗎?”小N:“我想聽首歌。(用戶中斷了預(yù)約的交談)”語音助手:“好的,一起來聽音樂?!保ㄒ魳讽懫穑┬:“剛剛醫(yī)院預(yù)約改為上午吧?!保ㄓ脩翥暯由蠈υ挘┱Z音助手:(搜索嗯的對話記憶,以及用戶信息)“好的,已預(yù)約后天上午某某醫(yī)院的內(nèi)科的普通掛號,請在手機上才確認支付?!笨偟膩碚f,語音交互在高頻、復(fù)雜業(yè)務(wù)流程的場景中,相比圖形化交互,在快速性上還是有很多優(yōu)勢的。第二個語音交互動機是輕便性。在某些場景中,撤職語音交互的方式可以免去許多冗余的設(shè)備,比如:小P是AAA公司的員工,今天要給部門開會討論,開會前將ppt上傳到了云端。公司的語音系統(tǒng)存儲了所有員工的信息,小P在會議室時,對語音助手說,“小度,打開投影儀,打開人工智能調(diào)研PPT”,語音助手打開投影儀,查詢到小P的身份,登錄后訪問其云盤數(shù)據(jù),打開了PPTO在上述場景中,無語音交互流程和有語音交互流程對比:無語音交互有語音交互將PPT存儲到U盤/PC將PPT存入云盤將U盤/PC帶到會議室前往會議室到達會議室到達會議室T到達會議室用遙控器打開投影設(shè)備將U盤/PC連上投影對語音設(shè)備說:“語音助手,打開投影儀,打開云盤的某某PPT”語音助手識別其身份后為其打開投影儀和對應(yīng)PPT如上所示,有語音交互時,U盤這類存儲設(shè)備、PC和一些遙控設(shè)備雖然不需要了,整個投資過程是非常輕便的。第三個語音交互的動機是學(xué)習(xí)成本更低,換句話說,比可視化可視化更貼合用戶使用習(xí)慣。場景舉例:n小A剛開始學(xué)視頻軟件,但是總是記不住什么功能什么快捷鍵在什么位置?!霸趺床眉魣D片?”“先點擊上方菜單欄?!庇脩酎c擊后一步步引導(dǎo)?!霸趺葱薷念伾??”“點擊屏幕左邊第四個菜單欄???.”上述場景圖形交互與交互流程對比:越多越多,冗余性越嚴重。所以,場景交互的這種動機主要出現(xiàn)在學(xué)習(xí)和引導(dǎo)型的應(yīng)用語音中,比如老年人協(xié)助、兒童學(xué)習(xí)、步行導(dǎo)航等等。語音聲控交互的這個優(yōu)勢主要在易用性上體現(xiàn)出來。易用性(智能理解、眼耳配合)</b>易用性這方面體現(xiàn)的第一個方面是智能理解。當用戶提出疑問,語音助手通過語義理解能夠智能地為用戶匹配教程,比起搜索,語音助手還可以更加智能地判斷用戶在操作時所處在的處境,比如用戶已經(jīng)最合適了裁剪所給工具,但是比起方形裁剪工具,更適合用圓形裁剪技術(shù)手段更等等,智能語音可以結(jié)合上下文和其他信息更綜合地理解用戶的意圖。易用性的第二個方面是眼耳配合??次恼轮笇?dǎo)教程之時觸覺只用視覺獲取信息,教育學(xué)和做的過程不連貫,語音教程解放用戶雙眼,視覺專注于圖形化界面操作,聽覺接收指導(dǎo)內(nèi)部信息,學(xué)習(xí)過程更加連貫。其實聽覺接收文字信息的速度肯定是比不上視覺的,那為什么會更好呢?因為語音教程和圖形界面教程相比,用戶更加專注于眼前的滾輪操作,專注度更高,專注度才是學(xué)習(xí)效率提升才的重要。也就是說,語音教程其實是幫助用戶創(chuàng)造了更加沉浸式的學(xué)習(xí)體驗。第四種使用語音愈來愈交互的動機是被動信息成本更低,或者說,信息觸達用戶的方式更加高效。場景舉例:重要提醒,在家里的時候,比如A想設(shè)置一個1小時后的非常重要提醒事項,比起手機提醒,A選擇了用智能音箱提醒。因為相比Push提醒,語音提醒是一種更強的提醒。除了設(shè)置起來更簡便外,A怕錯過提醒信息,而喇叭般的音量確保A不會忘記整起事情。上述場景中,圖形觸達和語音觸達流程:圖形觸達語音觸達獲得信息語音助手語

音提醒收到手機推

圖形觸達語音觸達獲得信息語音助手語

音提醒收到手機推

送提醒拿起手機查

看獲得信息相比圖形觸達,語音交互

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論