版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
智能語音行業(yè)研究匯報(bào)一、智能語音:談入口太早,但不可或缺智能音箱是臺面上的狂歡,本質(zhì)還在顧客、數(shù)據(jù)和服務(wù)自11月Amazon推出收款基于語音交互的智能音箱Echo以來,科大訊飛公布智能音箱叮咚,google公布智能音箱GoogleHome。而進(jìn)入后來更是密集,5月聯(lián)想公布智能音箱,Amazon公布帶觸屏的EchoShow,微軟聯(lián)手音頻設(shè)備制造商哈曼.卡頓合作打造Invoke,6月蘋果公布HomePod。同步國內(nèi)BAT等互聯(lián)網(wǎng)巨頭也紛紛故意入局。智能音箱自身不是目的,爭奪的是背后的顧客、數(shù)據(jù)以及服務(wù)入口。其實(shí)基于語音交互技術(shù)的入口產(chǎn)品可以是音箱、電視等家居產(chǎn)品,甚至可以是室內(nèi)可及的智能設(shè)備,之因此選擇音箱作為突破口,只不過看重這樣一款在初期能承擔(dān)除交互之外其他功能的載體。對于顧客而言,需要的是可以將眾多繁雜的應(yīng)用和接口進(jìn)行封裝的工具,不再需要自己積極到每一種詳細(xì)應(yīng)用上獲取服務(wù),而是借助語音交互統(tǒng)一的入口提供。對于巨頭企業(yè)而言,目的在于借此獲得移動互聯(lián)網(wǎng)之后一種可以獲取顧客數(shù)據(jù)并持續(xù)提供服務(wù)的入口。單就智能音箱而言,交互體驗(yàn)和連接的服務(wù)是影響顧客選擇的重要原因。拋開智能音箱的設(shè)定,其本質(zhì)是一款基于語音進(jìn)行人機(jī)交互的智能硬件,在算法層面波及到降噪、遠(yuǎn)場識別、喚醒與打斷以及多輪會話、語義分析等自然語言理解技術(shù),硬件層面重要波及到進(jìn)行聲音采集的麥克風(fēng)陣列技術(shù)以及聲音播放時(shí)揚(yáng)聲器處理。軟硬件的協(xié)同配合方能使得人機(jī)交互更為自然。假如說播放音樂是老式音箱的重要功能,那么對于智能音箱而言,這已經(jīng)幾乎成為附帶選項(xiàng),互相之間拼的不是、或者說不只是音責(zé)問題,更多是人機(jī)交互的體驗(yàn),以及交互背后所能支撐和兼容的服務(wù)數(shù)量與質(zhì)量。無論是對接線上的互聯(lián)網(wǎng)服務(wù),還是線下智能家居系列產(chǎn)品,若無法形成產(chǎn)品、應(yīng)用以及數(shù)據(jù)的生態(tài)閉環(huán),則智能音箱的入口目的就難以到達(dá)。國內(nèi)智能音箱的慘淡銷量還與消費(fèi)習(xí)慣有關(guān),顧客培育需要時(shí)間。與AmazonEcho千萬量級銷量相比,國內(nèi)科大訊飛與京東聯(lián)合公布的叮咚音箱銷量似乎遜色不止一籌。除了在技術(shù)和應(yīng)用層面也許存在的差異之外,各自根植的土壤環(huán)境也有著先天的差異。若去掉“智能”的概念,智能音箱首先是個(gè)音箱,與歐美超過85%的家庭音箱普及率相比,國內(nèi)甚至局限性20%,在對音樂以及音箱設(shè)備的需求觀念上的差異導(dǎo)致音箱對歐美人群或許是“生活剛需”,而對國內(nèi)顧客或許目前還只是少部分人的愛好。正如前文所述,音箱只是恰好成為載體之一,最關(guān)鍵的仍然是物聯(lián)網(wǎng)時(shí)代智能終端的人機(jī)交互入口。信息獲取與體現(xiàn)決定語音交互成為階段性不可或缺的一環(huán)互聯(lián)網(wǎng)PC時(shí)代人機(jī)交互重要依賴鼠標(biāo)和鍵盤,移動互聯(lián)網(wǎng)時(shí)代觸摸屏交互成為標(biāo)配,那么人工智能時(shí)代的交互會由哪種方式主宰?基于語音控制的智能音箱還是智能電視?這些或許有也許成為智能家居入口,但即便AmazonEcho已然到達(dá)千萬級銷量及超過1萬項(xiàng)技能點(diǎn),似乎也局限性以成為人工智能時(shí)代交互入口的產(chǎn)品擔(dān)當(dāng)。從信息獲取以及體現(xiàn)的角度來看,交互入口的演變必然是從習(xí)慣到本能的革命。從信息獲取來看,研究表明,人的多種感覺器官從外界獲取信息來源=視覺60%+聽覺20%+觸覺15%+味覺3%+嗅覺2%。其中視覺、聽覺及觸覺合計(jì)高達(dá)95%,基于此或許就不難理解為何無論是互聯(lián)網(wǎng)時(shí)代的PC還是移動互聯(lián)網(wǎng)時(shí)代的智能機(jī),不僅無法離開鍵鼠套裝和觸摸傳感器,并且還無法離開那塊或大或小的顯示屏。從信息體現(xiàn)來看,1967年美國著名心理學(xué)家、傳播學(xué)家艾伯特梅拉比安等人通過大量試驗(yàn),提出人類在溝通中所有的體現(xiàn)信息=肢體語言信息55%+聲音信息38%+語言信息7%,或許這也能在一定程度上解釋為何各家智能音箱先后登場卻仍然未能挑起入口大梁。我們認(rèn)為,從鍵鼠輸入的抽象符號到觸摸屏直接的滑動與按壓,這已經(jīng)在一定程度上靠近了人類習(xí)慣,而未來的交互方式將更為靠近人的本能。語音或許是人機(jī)交互的階段性成果,基于語音的人機(jī)交互或許會成為某個(gè)特定場景的入口,但語音與肢體動作的融合或許更也許擔(dān)當(dāng)?shù)闷鹨环N時(shí)代的交互入口,至于更為遙遠(yuǎn)的未來,或許會有類似腦電波等其他方式。二、智能語音有關(guān)技術(shù)及發(fā)展歷史智能語音重要研究人機(jī)之間語音信息的處理和反饋問題,從體現(xiàn)形式來看,即研究怎樣通過語音實(shí)現(xiàn)人機(jī)交互,有關(guān)支撐技術(shù)重要可劃分為基礎(chǔ)語音技術(shù)、智能化技術(shù)以及大數(shù)據(jù)技術(shù)。語音識別精確率在引入深度學(xué)習(xí)之后得到迅速提高。語音目的在于使機(jī)器最終可以將識別語音中的內(nèi)容、說話人、語種等信息。在技術(shù)思緒經(jīng)歷了基于原則模板匹配和基于記錄模型(HMM)兩個(gè)階段;開始由微軟的俞棟、鄧力等與Hinton合作,在語音識別領(lǐng)域引入深度學(xué)習(xí)替代老式的特性提取,伴隨深度學(xué)習(xí)的引入以及在此基礎(chǔ)上派生的各類模型的組合,語音識別精確率大幅提高。3月IBM通過長短時(shí)記憶、WaveNet語言模型和三個(gè)強(qiáng)聲學(xué)模型的組合,在Switchboard數(shù)據(jù)集上電話語音識別錯(cuò)誤率減少到5.5%,無論是對比微軟測試成果給出的人類速記員5.9%錯(cuò)誤率還是本次IBM給出的人類5.1%,機(jī)器都已經(jīng)極為靠近人類水平。語音合成已經(jīng)有200數(shù)年悠久歷史,體現(xiàn)力尚有待繼續(xù)提高。在計(jì)算機(jī)技術(shù)出現(xiàn)之前重要模仿人體發(fā)聲原理制作對應(yīng)硬件,計(jì)算機(jī)技術(shù)出現(xiàn)后音質(zhì)、音色和自然度均有提高。伴隨技術(shù)演進(jìn),語音合成的復(fù)雜度、自然度和音質(zhì)都已獲得不錯(cuò)的成績,目前研究重點(diǎn)在于提高合成音的體現(xiàn)力,如語氣和情感等。聲紋識別目前也正向著深度學(xué)習(xí)方向發(fā)展,但不管是用老式算法還是深度學(xué)習(xí),都需要事先建立聲紋庫。聲紋識別重要根據(jù)語音波形反饋的說話人生理和行為特性,自動識別說話人身份,在安全性上可與指紋、掌形和虹膜等生物識別技術(shù)相媲美,目前已經(jīng)用于公安和司法系統(tǒng)證據(jù)鑒定中的身份鑒別,以及銀行支付過程的身份認(rèn)證。聲紋識別和語音識別結(jié)合,能通過識別內(nèi)容防止錄音假冒,和情緒識別結(jié)合,則可以感知識別對象與否處在受脅迫狀態(tài)。聲紋識別需要對應(yīng)的聲紋庫,且至少要保證合理的性別、年齡段、地區(qū)、口音、職業(yè)分布。測試樣本應(yīng)當(dāng)涵蓋文本內(nèi)容與否有關(guān)、采集設(shè)備、傳播信道、環(huán)境噪音、錄音回放、聲音模仿、時(shí)間跨度、采樣時(shí)長、健康狀況和情感原因等重要影響原因,因而聲紋數(shù)據(jù)庫成為聲紋識別技術(shù)突破的重要門檻。目前最全的是公安部的聲紋鑒別庫。自然語言理解目前尚處在淺層語義分析階段,大體包括詞法分析、句法分析、語義分析這三個(gè)既遞進(jìn)又互相包括的層面。目前機(jī)器對句子的理解還只能做到語義角色標(biāo)注層面,即標(biāo)出句中的句子成分和主被動關(guān)系等,屬于淺層語義分析技術(shù)。未來要讓機(jī)器更好地理解人類語言,并實(shí)現(xiàn)自然交互,尚有待深度學(xué)習(xí)等機(jī)器學(xué)習(xí)措施的進(jìn)步。多輪對話,重要建立在語音識別、合成以及自然語言理解等技術(shù)基礎(chǔ)之上,自然度和精確度有待提高。多輪對話系統(tǒng)一般分為任務(wù)型和閑聊型,任務(wù)型是協(xié)助顧客完畢詳細(xì)的某項(xiàng)事情,如:設(shè)置鬧鐘、查天氣等;而閑聊型是實(shí)現(xiàn)人機(jī)的情感聊天互動,如陪護(hù)型機(jī)器人。多輪對話相比單輪對話方式提高了顧客交互的自然度和精確度。對話管理是實(shí)現(xiàn)多輪對話系統(tǒng)的關(guān)鍵,功能分為對話狀態(tài)追蹤(DST)和對話決策(DialogPolicy),前者作用是更新對話狀態(tài),記錄到目前為止顧客所有的聊天記錄和系統(tǒng)行為,后者根據(jù)DST對話狀態(tài)產(chǎn)生系統(tǒng)行為,即決定下一步反饋或調(diào)用等行為。三、智能語音產(chǎn)業(yè)發(fā)展現(xiàn)實(shí)狀況市場規(guī)模迅速擴(kuò)大,且國內(nèi)增速明顯超過全球在移動互聯(lián)網(wǎng)、大數(shù)據(jù)、云計(jì)算、深度學(xué)習(xí)等技術(shù)的發(fā)展推進(jìn)下,智能語音技術(shù)漸趨成熟,行業(yè)發(fā)展進(jìn)入場景應(yīng)用布局階段。移動互聯(lián)網(wǎng)、智能家居、汽車、醫(yī)療、教育等領(lǐng)域的應(yīng)用帶動智能語音產(chǎn)業(yè)規(guī)模持續(xù)迅速增長。全球智能語音市場規(guī)模達(dá)62.1億美元,同比增長34.2%。中國智能語音產(chǎn)業(yè)市場規(guī)模也逐漸擴(kuò)大,40.3億元產(chǎn)業(yè)規(guī)模約占全球市場份額10%,且增速明顯高于全球市場,估計(jì)至份額占比將提高到14%。各要素齊發(fā)力,推進(jìn)智能語音形成完整產(chǎn)業(yè)鏈借用我們前序匯報(bào)中提出的人工智能商業(yè)化應(yīng)用“人機(jī)料法環(huán)”模型,智能語音產(chǎn)業(yè)在人才儲備、計(jì)算設(shè)施、數(shù)據(jù)積累、技術(shù)算法以及應(yīng)用場景等五要素共同推進(jìn)下已形成較為完整的產(chǎn)業(yè)鏈。從產(chǎn)業(yè)鏈角度,智能語音行業(yè)可分為四個(gè)部分?;A(chǔ)研究機(jī)構(gòu):語音合成、語音識別、聲紋識別等基礎(chǔ)技術(shù)的研發(fā)和技術(shù)輸出;語音語義數(shù)據(jù)提供商:為算法研究或技術(shù)輸出機(jī)構(gòu)提供語音、語義數(shù)據(jù)庫以及定制化的數(shù)據(jù)采集和處理;語音技術(shù)提供商:將基礎(chǔ)技術(shù)轉(zhuǎn)換為軟件或行業(yè)整體處理方案,提供嵌入式或平臺式的語音軟件服務(wù)、行業(yè)智能語音系統(tǒng)整體處理方案;智能語音應(yīng)用提供商:智能移動設(shè)備、智能車載系統(tǒng)、智能家居等智能終端廠商,以及輸入法、娛樂等各類APP或軟件客戶端等,從產(chǎn)品屬性來看重要包括消費(fèi)級產(chǎn)品和專業(yè)級行業(yè)應(yīng)用。算法紅利逐漸消失,一家獨(dú)大轉(zhuǎn)向多方競爭伴隨深度學(xué)習(xí)的引入和發(fā)展,智能語音的算法紅利正逐漸消失。Nuance自與ScanSoft合并后,成為全球最大的語音技術(shù)廠商,憑借自身先進(jìn)的語音識別、自然語言理解技術(shù)以及優(yōu)秀的語音處理方案在全球語音市場中占據(jù)62%,加上google、微軟合計(jì)占據(jù)超過85%。深度學(xué)習(xí)初次引入語音識別,隨即配合計(jì)算能力的提高和海量語音語料數(shù)據(jù)的積累,識別精確率得到大幅提高。盡管Nuance全球市場份額仍居第一,但已大幅下降至31.6%,而google、蘋果、微軟及科大訊飛市場份額增長較快,分別到達(dá)28.4%、15.4%、8.1%和4.5%。科技巨頭對于深度學(xué)習(xí)算法及機(jī)器學(xué)習(xí)框架的開源使得智能語音技術(shù)的調(diào)用變得更為簡樸,模塊化的設(shè)計(jì)使得應(yīng)用布署與實(shí)行門檻明顯減少。目前中國智能語音市場被科大訊飛、百度和蘋果占據(jù)絕大多數(shù)市場份額,三家合計(jì)達(dá)79%。其中,科大訊飛市場份額為44.2%,處在市場領(lǐng)先地位。百度進(jìn)入勢頭強(qiáng)勁,市場份額增長迅速。美國權(quán)威雜志《麻省理工科技評論》公布的十大突破技術(shù),百度硅谷的DeepSpeech2智能語音技術(shù)赫然在列。google、微軟、蘋果、百度等互聯(lián)網(wǎng)巨頭在資金、數(shù)據(jù)和2C應(yīng)用顧客拓展三方面優(yōu)勢明顯,各方強(qiáng)勢介入將使得全球智能語音行業(yè)由一家獨(dú)大演變成多方參與競爭的格局。技術(shù)驅(qū)動,場景應(yīng)用并借助數(shù)據(jù)形成正反饋,三者成為智能語音行業(yè)的重要壁壘。技術(shù)算法壁壘:伴隨智能語音技術(shù)的發(fā)展,語音識別技術(shù)日益成熟,開源語音識別工具減少了語音識別的門檻,但使用過程的穩(wěn)定性仍有待處理。語音識別技術(shù)進(jìn)入突破量變到質(zhì)變的臨界點(diǎn),有關(guān)技術(shù)和配套設(shè)施的研發(fā)可認(rèn)為企業(yè)筑起護(hù)城河,百度、搜狗、科大訊飛等企業(yè)安靜狀態(tài)下語音識別精確率大都到達(dá)97%,目前均在向更高精確率以及非原則環(huán)境下的應(yīng)用發(fā)展。應(yīng)用場景壁壘:2B應(yīng)用波及金融、電信、醫(yī)療、交通等行業(yè),這些行業(yè)對系統(tǒng)的穩(wěn)定性規(guī)定非常高,非常重視實(shí)際應(yīng)用案例狀況,會通過嚴(yán)格的招投標(biāo)選擇最具實(shí)力和經(jīng)驗(yàn)的智能語音技術(shù)和服務(wù)供應(yīng)商,一旦通過評測會保持穩(wěn)定合作,新企業(yè)進(jìn)入壁壘較高;2C應(yīng)用層面互聯(lián)網(wǎng)巨大具有商業(yè)應(yīng)用和信息入口優(yōu)勢。數(shù)據(jù)積累壁壘:智能語音在各場景應(yīng)用顧客體驗(yàn)和客戶粘度提高的關(guān)鍵是積累真實(shí)環(huán)境下的多種語音資料和文本資料進(jìn)行迭代優(yōu)化,智能語音應(yīng)用后形成數(shù)據(jù)閉環(huán)將不停提高壁壘優(yōu)勢。目前智能語音產(chǎn)業(yè)的參與者可以分為三大類型:從科研試驗(yàn)室走出來的獨(dú)立語音技術(shù)研發(fā)和服務(wù)提供商,如源于斯坦福研究院STAR試驗(yàn)室的Nuance、與中國科學(xué)技術(shù)大學(xué)合作的科大訊飛,圍繞智能語音技術(shù)研發(fā)到應(yīng)用各環(huán)節(jié)的初創(chuàng)企業(yè)。如思必馳、云知聲、出門問問、聲智科技、三角獸、驀然等創(chuàng)業(yè)企業(yè),但愿搶占下一代人機(jī)交互入口的科技巨頭,如蘋果、google、微軟、亞馬遜、百度、騰訊、搜狗等。開始,互聯(lián)網(wǎng)巨頭紛紛通過自主研發(fā)或者并購/參股的方式深入布局智能語音產(chǎn)業(yè)參股的方式深入布局智能語音產(chǎn)業(yè)。在智能語音上的布局重點(diǎn)圍繞虛擬助手,并且為占據(jù)一定的市場先機(jī),紛紛開始布局智能車載、智能家俱、智能醫(yī)療、可穿戴設(shè)備等細(xì)分市場。融合場景、借力硬件提高語音技術(shù)實(shí)用和穩(wěn)定性由于語音信號的多樣性和復(fù)雜性,在真實(shí)使用場景中,考慮到空間距離、背景噪音、其他人聲干擾、回聲、方言、口音等問題,精確率會大打折扣。提高現(xiàn)實(shí)場景中的顧客體驗(yàn)是智能語音技術(shù)完畢質(zhì)的突破的關(guān)鍵,波及技術(shù)包括遠(yuǎn)場語音識別、喚醒目的檢測、全雙工交互、個(gè)性化識別技術(shù)等。10月intel與科大訊飛宣布合作共同研發(fā)AI芯片,將麥克風(fēng)陣列、遠(yuǎn)場語音識別等功能集成到SOC當(dāng)中,形成完整的遠(yuǎn)場語音交互鏈條。目前近場、發(fā)音原則的語音識別已經(jīng)相稱成熟,手機(jī)端Siri即可視為這一類型,國內(nèi)科大訊飛、百度、搜狗等在近場、安靜環(huán)境下的語音識別精確率都已提高到97%以上。但對于遠(yuǎn)場語音識別而言,雖然從技術(shù)原理上來看與近場幾乎相似,但由于音源和麥克風(fēng)之間的空間距離增大,聲音傳播過程會受到其他人聲、回聲等影響,在詳細(xì)使用場景下精確率仍然對軟硬件都提高了技術(shù)規(guī)定。四、智能語音的應(yīng)用前景巨頭搶灘虛擬語音助手,并逐漸切入場景應(yīng)用語音交互的特點(diǎn)是簡樸、迅速、解放雙手和眼睛,在諸多場景可以給顧客帶來巨大的體驗(yàn)優(yōu)化。例如:防止繁瑣操作:手機(jī)眾多APP中直接用語音進(jìn)入一種應(yīng)用。很小或沒有屏幕:智能電視中用語音直接打開特定節(jié)目替代操作不便的遙控器、通過智能穿戴設(shè)備訪問互聯(lián)網(wǎng)。手眼無暇顧及:如開車過程、會議記錄。發(fā)掘語音數(shù)據(jù)的價(jià)值:如運(yùn)用電子病歷語音數(shù)據(jù)輔助診斷?;ヂ?lián)網(wǎng)女皇MaryMeeker在《互聯(lián)網(wǎng)趨勢》中指出,語音交互將成為人機(jī)交互的新范式。而實(shí)際上伴隨智能語音技術(shù)的逐漸成熟以及自然語言理解的發(fā)展,語音已經(jīng)成為不一樣場景下人與智能設(shè)備之間交互的重要手段。巨頭紛紛以虛擬語音助手切入智能語音應(yīng)用場景。由于物聯(lián)網(wǎng)波及太多領(lǐng)域,跨平臺、跨設(shè)備、跨品牌等諸多原因制約產(chǎn)業(yè)發(fā)展,統(tǒng)一原則是物聯(lián)網(wǎng)行業(yè)發(fā)展的基礎(chǔ),在此邏輯基礎(chǔ)上google、微軟、亞馬遜等科技巨頭紛紛以智能虛擬助手作為切入口,打造開放平臺、以開源形式吸引開發(fā)者構(gòu)建應(yīng)用開發(fā)生態(tài)。面向消費(fèi)級產(chǎn)品和專業(yè)級行業(yè)應(yīng)用,虛擬數(shù)字助手顧客數(shù)與市場規(guī)模迅速增長。語音、語義等有關(guān)技術(shù)的可用性逐漸提高,帶來虛擬數(shù)字助手市場的擴(kuò)張。從應(yīng)用方向和場景來看,重要用于消費(fèi)級產(chǎn)品和專業(yè)級行業(yè)應(yīng)用。消費(fèi)級市場重要是2C或2B2C,應(yīng)用于衣食住行等生活場景,如手機(jī)、智能車載、智能家居、可穿戴設(shè)備等。專業(yè)級行業(yè)應(yīng)用重要是2B,應(yīng)用于特定場景,如醫(yī)療、教育、呼喊中心、庭審等各個(gè)行業(yè)。根據(jù)Tractica的預(yù)測,活躍消費(fèi)者虛擬助手顧客數(shù)量將從3.9億上升至18億,活躍企業(yè)虛擬助手顧客數(shù)量將從1.55億上升至8.43億。虛擬助手市場規(guī)模將從16億美元增長至158億美元。消費(fèi)級產(chǎn)品應(yīng)用場景消費(fèi)級市場智能虛擬助手的功能是基于語音交互實(shí)現(xiàn)設(shè)備控制、日程管理、信息查詢、生活服務(wù)、情感陪伴等。首先可以通過開放平臺接入第三方應(yīng)用和服務(wù)豐富智能虛擬助手的功能,目前手機(jī)虛擬助手正是通過連接各類APP征服終端,另首先可植入智能硬件終端,向汽車、家居、可穿戴設(shè)備等產(chǎn)品延伸,建立消費(fèi)級智能語音產(chǎn)品的生態(tài)體系。智能語音+車載開車時(shí)雙手和雙眼被占用,語音交互成為該場景下最合適的交互方式。智能語音與汽車的結(jié)合重要為智能車載產(chǎn)品,通過語音完畢導(dǎo)航、音樂搜索與播放、信息聽寫等。伴隨車聯(lián)網(wǎng)的發(fā)展,未來將跟社交、娛樂、餐飲等服務(wù)深入結(jié)合,在保證安全的前提下提高駕乘體驗(yàn)。騰訊汽車等有關(guān)調(diào)研機(jī)構(gòu)的數(shù)據(jù)顯示智能車載系統(tǒng)的迭代更新過程中,語音交互的作用和重要性已經(jīng)越來越得到車主的承認(rèn)。IMSResearch估計(jì)到全球?qū)⒂?5%的新車搭載智能語音系統(tǒng)。在智能車載領(lǐng)域,Nuance、蘋果、google、科大訊飛、百度等語音識別巨頭分別推出DragonDrive車載語音開發(fā)平臺、CarPlay、AndroidAuto、汽車語點(diǎn)系統(tǒng)、CarLife等智能車載系統(tǒng),并紛紛與汽車廠商到達(dá)合作,搶占智能車載新興市場。智能語音+家居智能家居產(chǎn)業(yè)處在迅速發(fā)展期,語音控制逐漸成為常見技能點(diǎn)。智能語音可以跟電視、音響、空調(diào)、窗簾、燈具、玩具等多種家用設(shè)備和智能家居控制中樞系統(tǒng)相結(jié)合,通過語音交互實(shí)現(xiàn)一種入口控制所有功能。大數(shù)據(jù)及人工智能技術(shù)的推進(jìn)、關(guān)鍵技術(shù)與部件成本的下降以及產(chǎn)業(yè)聯(lián)盟原則化協(xié)議的建立帶來智能家居市場規(guī)模的迅速增長。Statista研究數(shù)據(jù)顯示,全球智能家居市場規(guī)模已經(jīng)到達(dá)168億美元,其中中國市場占7%,估計(jì)到全球智能家居市場規(guī)模將到達(dá)793億美元,中國市場份額上升至17%。國外互聯(lián)網(wǎng)巨頭紛紛以智能家居產(chǎn)品與智能語音相結(jié)合的方式進(jìn)入智能家居領(lǐng)域。蘋果于推出HomeKit智能家居平臺,并與Siri不停加強(qiáng)融合。亞馬遜推出的搭載Alexa的Echo智能音箱,通過語音可以實(shí)現(xiàn)播放音樂、新聞、網(wǎng)購下單、Uber叫車、定外賣等任務(wù),根據(jù)CIRP、RBCCapitalMarket等企業(yè)的估計(jì),自發(fā)售以來,Echo系列產(chǎn)品合計(jì)銷售量靠近一千萬臺,銷售額到達(dá)8-10億美元。google推出GoogleHome智能音箱,搭載GoogleAssistant虛擬助手,積極強(qiáng)化GoogleAssistant在智能家居領(lǐng)域的布局。從互聯(lián)網(wǎng)巨頭的布局可以看出智能語音與智能家居的融合是大勢所趨。智能語音+可穿戴設(shè)備可穿戴設(shè)備受硬件形態(tài)的約束,語音交互方式相比觸摸交互方式具有明顯優(yōu)勢。智能語音技術(shù)的引入可將設(shè)備從智能手機(jī)上解放出來,發(fā)明獨(dú)立體驗(yàn)。例如出門問問Ticwear內(nèi)置貼片式SIM芯片與3G通訊模塊,擁有獨(dú)立通訊號碼并可實(shí)現(xiàn)實(shí)時(shí)在線,支持包括語音撥號、短信、拍照,微信語音答復(fù),語音搜索等功能在內(nèi)的全中文語音交互。智能語音在可穿戴設(shè)備上的滲透增進(jìn)可穿戴設(shè)備產(chǎn)業(yè)及智能語音應(yīng)用的增長。蘋果公布無線耳機(jī)AirPods,能與蘋果手機(jī)上的Siri進(jìn)行語音交互。根據(jù)市場調(diào)研企業(yè)SliceIntelligence公布的美國無線耳機(jī)市場線上銷售狀況匯報(bào),蘋果公布的AirPods在上市銷售的一種月后迅速占據(jù)了無線耳機(jī)市場26%的市場份額。根據(jù)前瞻產(chǎn)業(yè)研究院的預(yù)測,中國健身及運(yùn)動類可穿戴設(shè)備市場規(guī)模將從90億元左右增長至244億元,年復(fù)合增長率達(dá)18%,智能語音在可穿戴設(shè)備上的滲透將增進(jìn)智能語音產(chǎn)業(yè)規(guī)模迅速增長。專業(yè)級行業(yè)應(yīng)用場景專業(yè)級市場虛擬助手合用于多種應(yīng)用場景,從實(shí)現(xiàn)功能來看重要形式有語音識別轉(zhuǎn)寫以及語音、語義內(nèi)容的分析,以醫(yī)療、教育和客服三個(gè)領(lǐng)域?yàn)槔Z音技術(shù)與場景的深度融合將為技術(shù)壁壘構(gòu)建應(yīng)用端的護(hù)城河。智能語音+醫(yī)療智能語音在醫(yī)療行業(yè)的應(yīng)用重要有三種:語音導(dǎo)診機(jī)器人;電子病歷語音錄入與轉(zhuǎn)寫、臨床匯報(bào)語音錄入與轉(zhuǎn)寫。語音錄入大大提高醫(yī)生工作效率和工作質(zhì)量;患者可以通過語音電子病歷系統(tǒng)下載打印,可以擁有完整、清晰易懂的病歷;醫(yī)院可以科學(xué)管理診斷過程和診斷信息。伴隨語音病歷的積累,運(yùn)用大數(shù)據(jù)技術(shù)和深度學(xué)習(xí)技術(shù)可以挖掘醫(yī)學(xué)案例語音資料的價(jià)值,實(shí)現(xiàn)智能輔助診斷。Nuance是全球智能語音醫(yī)療處理方案的龍頭企業(yè)。Nuance的醫(yī)療處理方案已經(jīng)覆蓋了全美72%的醫(yī)療機(jī)構(gòu),客戶遍及全球30多種國家,每年獲得3億多醫(yī)患交流數(shù)據(jù)。每年為超過50萬名醫(yī)生、1萬個(gè)醫(yī)療機(jī)構(gòu)提供服務(wù),醫(yī)療產(chǎn)品也實(shí)現(xiàn)了多樣化:臨床文檔改良(CDI)、臨床語音識別、實(shí)時(shí)聽寫、計(jì)算機(jī)輔助編碼、醫(yī)療質(zhì)量把控、移動云計(jì)算等。國內(nèi)科大訊飛也積極布局醫(yī)療領(lǐng)域,與北京
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 項(xiàng)目式德育課程設(shè)計(jì)
- 車站課程設(shè)計(jì)報(bào)告總結(jié)語
- 鎮(zhèn)江熱處理爐課程設(shè)計(jì)
- 瑞吉?dú)W影子課程設(shè)計(jì)理念
- 蓋帽墊片課程設(shè)計(jì)
- 運(yùn)算放大電路的課程設(shè)計(jì)
- 飲品知識課程設(shè)計(jì)
- 美術(shù)教法課程設(shè)計(jì)
- 跳繩系統(tǒng)課程設(shè)計(jì)論文
- 酮體代謝課程設(shè)計(jì)
- 醫(yī)院自助機(jī)培訓(xùn)
- 2024年支原體肺炎治療
- 成品油零售經(jīng)營資格申請表
- 保險(xiǎn)代理公司培訓(xùn)
- 關(guān)于水滸傳的題目單選題100道及答案解析
- 冠心病課件完整版本
- 磷化工產(chǎn)業(yè)鏈副產(chǎn)物資源農(nóng)業(yè)全量利用途徑分析
- 浙江省舟山市定海區(qū)2023-2024學(xué)年七年級上學(xué)期期末科學(xué)試題
- 倉庫安全培訓(xùn)考試題及答案
- 第六單元 中華民族的抗日戰(zhàn)爭 教學(xué)設(shè)計(jì) 2024-2025學(xué)年統(tǒng)編版八年級歷史上冊
- 公路工程標(biāo)準(zhǔn)施工招標(biāo)文件(2018年版)
評論
0/150
提交評論