語音助手行業(yè)發(fā)展報告2024-2025_第1頁
語音助手行業(yè)發(fā)展報告2024-2025_第2頁
語音助手行業(yè)發(fā)展報告2024-2025_第3頁
語音助手行業(yè)發(fā)展報告2024-2025_第4頁
語音助手行業(yè)發(fā)展報告2024-2025_第5頁
已閱讀5頁,還剩40頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

匯報人:溫怡菁2024-08-012024-2025語音助手行業(yè)發(fā)展報告contents目錄定義或者分類特點產(chǎn)業(yè)鏈發(fā)展歷程政治環(huán)境商業(yè)模式政治環(huán)境contents目錄經(jīng)濟環(huán)境社會環(huán)境技術環(huán)境發(fā)展驅(qū)動因素行業(yè)壁壘行業(yè)風險行業(yè)現(xiàn)狀行業(yè)痛點問題及解決方案行業(yè)發(fā)展趨勢前景機遇與挑戰(zhàn)競爭格局代表性企業(yè)01語音助手定義定義語音助手是以語音識別技術和語音合成技術為基礎,通過語音信息實現(xiàn)人機交互,給用戶反饋信息或替代用戶及企業(yè)執(zhí)行任務的虛擬助手。語音助手是機器感知與處理人類語音信息的應用,需要人工智能語音相關技術,如語音識別技術、語音合成技術以及自然語言處理技術的輔助,賦予其語音感知與處理能力。語音助手的應用場景廣闊,眾多智能設備通過接入語音助手提升智能化水平。語音助手具體的應用場景可分為消費級應用場景和行業(yè)應用場景。語音助手定義02產(chǎn)業(yè)鏈網(wǎng)絡設備、服務器、芯片、傳感器、存儲設備、控制系統(tǒng)、操作系統(tǒng)、數(shù)據(jù)庫、云服務平臺、大數(shù)據(jù)上游中游產(chǎn)業(yè)鏈010203語音助手產(chǎn)業(yè)鏈上游市場主體為基礎資源提供商,包括硬件供應商(如芯片供應商、服務器供應商和存儲供應商等)和軟件供應商(如云服務供應商和數(shù)據(jù)庫供應商等);中游市場主要由語音助手技術提供商組成,包括語音助手算法供應商、語音助手軟件應用供應商以及語音助手行業(yè)解決方案提供商,負責將語音助手技術轉化為具體應用或解決方案,為下游需求端提供服務。語音助手下游應用場景廣闊,覆蓋智能移動設備、智能家居、車載、金融以及客服等場景,涉及B端和C端用戶主體,包括各類型機構用戶、企業(yè)用戶和個人用戶。網(wǎng)絡設備、服務器、芯片、傳感器、存儲設備、控制系統(tǒng)、操作系統(tǒng)、數(shù)據(jù)庫、云服務平臺、大數(shù)據(jù)語音助手算法提供商、語音助手軟件提供商、語音助手解決方案提供商移動設備、車載場景、智能家居、金融場景、客服場景語音助手算法提供商、語音助手軟件提供商、語音助手解決方案提供商移動設備、車載場景、智能家居、金融場景、客服場景下游行業(yè)產(chǎn)業(yè)鏈產(chǎn)業(yè)鏈上游概述語音助手產(chǎn)業(yè)鏈上游市場由基礎資源供應商組成,涉及網(wǎng)絡設備、服務器、芯片、存儲、云服務、數(shù)據(jù)庫等軟、硬件供應商,負責為語音助手技術和產(chǎn)品開發(fā)商提供必要的資源支持。(1)芯片人工智能芯片作為語音助手產(chǎn)業(yè)的核心,芯片的技術成熟度影響語音助手的性能。人工智能芯片行業(yè)的技術門檻較高,高端芯片技術均被海外芯片巨頭壟斷,技術壁壘高。中國人工智能芯片依賴進口,導致語音助手服務商的制造成本居高不下,壓縮企業(yè)利潤空間。人工智能芯片按不同的應用場景可分為通用類人工智能芯片、云端人工智能芯片、終端人工智能芯片。①在通用類人工智能芯片領域,美國的英偉達占據(jù)主導地位,中國的人工智能芯片企業(yè)實力較薄弱,缺乏國際競爭力。②在云端人工智能芯片領域,英特爾、亞馬遜等海外企業(yè)占據(jù)較大的市場份額,部分中國企業(yè)陸續(xù)布局云端推斷市場,但競爭力較弱。③在終端人工智能芯片領域,中國企業(yè)取得較大進展寒武紀、地平線和深鑒科技等一批優(yōu)質(zhì)企業(yè)相繼誕生。(2)云服務云服務供應商為語音助手研發(fā)企業(yè)提供基礎設施平臺,解決語音助手技術研發(fā)廠商的數(shù)據(jù)存儲、運算以及調(diào)用問題。由于性價比、部署方式等因素,語音助手研發(fā)企業(yè)較多選用公有云服務。目前,公有云服務供應商有:①通過云服務產(chǎn)業(yè)鏈資源優(yōu)勢拓展至公有云服務行業(yè)的企業(yè),如電信運營商、網(wǎng)絡設備制造商、IDC廠商等,此類企業(yè)擁有較強的資金實力,加上本身處在公有云產(chǎn)業(yè)鏈上游,基礎設施方面優(yōu)勢明顯;②大型互聯(lián)網(wǎng)企業(yè),如亞馬遜、騰訊、阿里巴巴等,此類企業(yè)資金實力雄厚,客戶認可度高,設施齊備、技術成熟,具備發(fā)展公有云業(yè)務的有利條件;③傳統(tǒng)的軟件企業(yè),如Microsoft、Oracle、金蝶等,此類企業(yè)的軟件產(chǎn)品的市場認可度高,技術積累豐厚,客戶資源豐富,有利于向公有云市場拓展。除此之外,行業(yè)中存在不少新興的創(chuàng)業(yè)公司,如青云、Ucloud、七牛云等。行業(yè)產(chǎn)業(yè)鏈產(chǎn)業(yè)鏈中游概述語音助手產(chǎn)業(yè)鏈中游市場主體主要有語音助手算法提供商、行業(yè)解決方案提供商以及應用產(chǎn)品開發(fā)商。中國的語音助手廠商較多集研發(fā)算法、解決方案以及應用產(chǎn)品功能于一身,廠商自主研發(fā)語音助手算法,形成一整套語音助手關鍵技術方案,并將自主研發(fā)的語音助手算法以及技術方案內(nèi)嵌于硬件產(chǎn)品中,典型代表企業(yè)有百度、騰訊以及阿里巴巴。例如百度開發(fā)了度秘,并將度秘置于百度搜索、百度地圖、百度新聞等軟件產(chǎn)品以及百度音箱等硬件產(chǎn)品中。部分語音助手技術提供商專注于智能語音技術研發(fā),為下游應用領域提供定制化的語音技術解決方案,如OPPO手機的小歐助手和華為手機的小E助手均采用科大訊飛的語音技術解決方案。行業(yè)產(chǎn)業(yè)鏈產(chǎn)業(yè)鏈下游概述語音助手下游應用場景廣闊,涉及金融、醫(yī)療、教育、汽車、消費電子產(chǎn)品等行業(yè),其中智能手機、智能家居以及車載應用是語音助手在C端市場的主要應用場景;智能客服、機器人是目前語音助手在B端市場能產(chǎn)生營收的主要應用場景。目前語音助手技術發(fā)展并未成熟,語音助手的用戶體驗尚待提升。研究院調(diào)研數(shù)據(jù)顯示,用戶最在意語音助手的語義/語音識別準確度(占比達42%),62%的受訪用戶認為語音助手的語義/語音識別準確度有待提升。03發(fā)展歷程認知階段(1952-1980年)發(fā)展歷程以智能語音為核心,整合包含多元模式識別、大數(shù)據(jù)、RF、物聯(lián)網(wǎng)技術、云服務等技術的智能語音系統(tǒng)將在多個維度觸達行業(yè)的核心需求。深度神經(jīng)網(wǎng)絡技術的發(fā)展使得智能語音發(fā)生了質(zhì)的突堿,在一方面語音識別的淮確率大幅度提升,逼近人類水平,另―方面語義分析技術開始迅猛發(fā)展。智能語音進入商品市場。語音識別完成了從模版匹配到概率統(tǒng)計建模的過度。詞匯里得到大幅提升。語音合成的拼接問題得到了解決,智能語音技術正式進入進入公眾視野。首款語音識別系統(tǒng)問世,可基于簡單的模板匹配識別孤立的英文數(shù)字。同期語音合成技術已經(jīng)能夠合成較為自然的語音,但由于技術尚未成熟,落地出現(xiàn)困雅。起步階段(1980-2000年)發(fā)展應用階段(2001-2019年)融合應用階段(2020年-至今)04政治環(huán)境描述:《關于積極推進“互聯(lián)網(wǎng)+”行動的指導意見》:將“互聯(lián)網(wǎng)+人工智能”列為其中11項重點行動之一。2017年7月,印發(fā)《新一代人工智能發(fā)展規(guī)劃》,將人工智能上升至國家戰(zhàn)略,并確立了人工智能發(fā)展三步走的目標,為中國人工智能產(chǎn)業(yè)發(fā)力奠定制度基礎。發(fā)改委、科技部、工信部及中央網(wǎng)信辦:《“互聯(lián)網(wǎng)”+人工智能三年行動實施方案》:要求加快建設文獻、語音、圖像、視頻、地圖等多種類數(shù)據(jù)的海量訓練資源庫和基礎資源服務公共平臺,建設支撐超大規(guī)模深度學習的新型計算集群,建立完善產(chǎn)業(yè)公共服務平臺。進一步推進計算機視覺、智能語音處理、生物特征識別、自然語言理解、智能決策控制以及新型人機交互等關鍵技術的研發(fā)和產(chǎn)業(yè)化,為產(chǎn)業(yè)智能化升級夯實基礎。:《新一代人工智能發(fā)展規(guī)劃》:要求加快培育人工智能產(chǎn)業(yè)領軍企業(yè)。在無人機、語音識別、圖像識別等優(yōu)勢領域加快打造人工智能全球領軍企業(yè)和品牌,推動國內(nèi)優(yōu)勢企業(yè)、行業(yè)組織、科研機構、高校等聯(lián)合組建中國人工智能產(chǎn)業(yè)技術創(chuàng)新聯(lián)盟,支持龍頭骨干企業(yè)構建開源硬件工廠、開源軟件平臺,形成集聚各類資源的創(chuàng)新生態(tài),促進人工智能中小微企業(yè)發(fā)展,支持各類機構和平臺面向人工智能企業(yè)提供專業(yè)化服務。政治環(huán)境1政治環(huán)境1《關于積極推進“互聯(lián)網(wǎng)+”行動的指導意見》:將“互聯(lián)網(wǎng)+人工智能”列為其中11項重點行動之一。2017年7月,印發(fā)《新一代人工智能發(fā)展規(guī)劃》,將人工智能上升至國家戰(zhàn)略,并確立了人工智能發(fā)展三步走的目標,為中國人工智能產(chǎn)業(yè)發(fā)力奠定制度基礎。發(fā)改委、科技部、工信部及中央網(wǎng)信辦《“互聯(lián)網(wǎng)”+人工智能三年行動實施方案》:要求加快建設文獻、語音、圖像、視頻、地圖等多種類數(shù)據(jù)的海量訓練資源庫和基礎資源服務公共平臺,建設支撐超大規(guī)模深度學習的新型計算集群,建立完善產(chǎn)業(yè)公共服務平臺。進一步推進計算機視覺、智能語音處理、生物特征識別、自然語言理解、智能決策控制以及新型人機交互等關鍵技術的研發(fā)和產(chǎn)業(yè)化,為產(chǎn)業(yè)智能化升級夯實基礎?!缎乱淮斯ぶ悄馨l(fā)展規(guī)劃》:要求加快培育人工智能產(chǎn)業(yè)領軍企業(yè)。在無人機、語音識別、圖像識別等優(yōu)勢領域加快打造人工智能全球領軍企業(yè)和品牌,推動國內(nèi)優(yōu)勢企業(yè)、行業(yè)組織、科研機構、高校等聯(lián)合組建中國人工智能產(chǎn)業(yè)技術創(chuàng)新聯(lián)盟,支持龍頭骨干企業(yè)構建開源硬件工廠、開源軟件平臺,形成集聚各類資源的創(chuàng)新生態(tài),促進人工智能中小微企業(yè)發(fā)展,支持各類機構和平臺面向人工智能企業(yè)提供專業(yè)化服務?!洞龠M新一代人工智能產(chǎn)業(yè)發(fā)展三年行動計劃(2018-2020年)》鼓勵支持新一代語音識別框架、口語化語音識別、個性化語音識別、智能對話、音視頻融合、語音合成等技術的創(chuàng)新應用,在智能制造、智能家居等重點領域開展推廣應用。到2020年,實現(xiàn)多場景下中文語音識別平均準確率達到96%,5米遠場識別率超92%,用戶對話意圖識別準確率超90%。政治環(huán)境2《新一代人工智能產(chǎn)業(yè)創(chuàng)新重點任務揭榜工作方案》提出面向語音識別、視覺識別、自然語言處理等基礎領域及工業(yè)、醫(yī)療、金融、交通等行業(yè)領域建設高質(zhì)量人工智能訓練資源庫、標準測試數(shù)據(jù)集。到2020年,基礎語音、視頻圖像、文本對話等公共訓練數(shù)據(jù)量大幅提升,在工業(yè)、醫(yī)療、金融、交通等領域匯集一定規(guī)模的行業(yè)應用數(shù)據(jù),用于支持創(chuàng)業(yè)創(chuàng)新。《最高人民法院關于深化人民法院司法體制綜合配套改革的意見》全面提升語音識別技術在庭審語音同步轉錄中的應用效能,建成全國法院智能語音云平臺,實現(xiàn)全國法院語音識別的模型共享和統(tǒng)一管理?!蛾P于進一步優(yōu)化地方政務服務便民熱線的指導意見》提出加強自助下單、智能文本客服、智能語音等智能化應用,方便企業(yè)和群眾反映訴求建議。05商業(yè)模式06經(jīng)濟環(huán)境我國經(jīng)濟不斷發(fā)展,幾度趕超世界各國,一躍而上,成為GDP總量僅次于美國的唯一一個發(fā)展中國家。我國經(jīng)濟趕超我國人口基數(shù)大,改革開放后人才競爭激烈,大學生就業(yè)情況一直困擾著我國發(fā)展過程中。就業(yè)問題挑戰(zhàn)促進社會就業(yè)公平問題需持續(xù)關注并及時解決,個人需提前做好職業(yè)規(guī)劃、人生規(guī)劃。公平就業(yè)關注經(jīng)濟環(huán)境07社會環(huán)境關注就業(yè)公平與提前規(guī)劃促進社會就業(yè)公平問題需持續(xù)關注并及時解決,對于個人來說提前做好職業(yè)規(guī)劃、人生規(guī)劃也是人生發(fā)展的重中之重。政治體系與法治化進程自改革開放以來,政治體系日趨完善,法治化進程也逐步趨近完美,市場經(jīng)濟體系也在不斷蓬勃發(fā)展。總體發(fā)展穩(wěn)中向好我國總體發(fā)展穩(wěn)中向好,宏觀環(huán)境穩(wěn)定繁榮,對于青年人來說,也是機遇無限的時代。就業(yè)問題與人才競爭我國人口基數(shù)大,就業(yè)問題一直是發(fā)展過程中面臨的挑戰(zhàn),人才競爭激烈,大學生畢業(yè)后就業(yè)情況、失業(yè)人士困擾國家發(fā)展。當前的環(huán)境下我國經(jīng)濟不斷發(fā)展趕超世界各國,成為第二大經(jīng)濟體我國經(jīng)濟不斷發(fā)展,幾度趕超世界各國,一躍而上,成為GDP總量僅次于美國的唯一一個發(fā)展中國家。就業(yè)問題與人才競爭我國人口基數(shù)大,就業(yè)問題一直是發(fā)展過程中面臨的挑戰(zhàn),人才競爭激烈,大學生畢業(yè)后就業(yè)情況、失業(yè)人士困擾國家發(fā)展。關注就業(yè)公平與提前規(guī)劃促進社會就業(yè)公平問題需持續(xù)關注并及時解決,對于個人來說提前做好職業(yè)規(guī)劃、人生規(guī)劃也是人生發(fā)展的重中之重。08技術環(huán)境技術驅(qū)動技術環(huán)境的發(fā)展為行業(yè)帶來了新的機遇,是行業(yè)發(fā)展的重要驅(qū)動力。創(chuàng)新動力技術環(huán)境的不斷創(chuàng)新和進步,為行業(yè)的創(chuàng)新發(fā)展提供了有力支持。人才需求技術環(huán)境的發(fā)展促進了人才的需求和流動,為行業(yè)的人才隊伍建設提供了機遇。團隊建設技術環(huán)境的發(fā)展要求企業(yè)加強團隊建設,提高員工的技能和素質(zhì),以適應快速變化的市場需求。合作與交流技術環(huán)境的發(fā)展促進了企業(yè)間的合作與交流,推動了行業(yè)的整體發(fā)展。技術環(huán)境010203040509發(fā)展驅(qū)動因素發(fā)展驅(qū)動因素2015年以來,中央及各地方政府陸續(xù)出臺相關政策,積極支持人工智能產(chǎn)業(yè)的發(fā)展,并推進人工智能在各個細分領域的滲透和壯大。政策支持根據(jù)Gartner發(fā)布的2018年AI技術成熟度曲線,當前語音識別已經(jīng)進入實質(zhì)生產(chǎn)高峰期,意味著語音識別技術已被廣泛接受,規(guī)模化落地即將開始。此外,像自然語言處理、虛擬助理等相關智能語音技術歷經(jīng)淘洗之后即將落入,泡沫化低谷期,商業(yè)模式越來越成熟,也將進一步推動智能語音的落地。到2024年全球智能語音市場規(guī)模將達到215億美元,其中智慧醫(yī)療健康、智慧金融以及各類智能終端智能語音技術需求將成為主要的驅(qū)動因素。下游需求不斷增長終端人工智能芯片的發(fā)展,解決了數(shù)據(jù)在終端的運算問題,終端深度集成語音芯片將芯片和語音處理算法組合成模塊,置于終端設備中,賦予終端設備語音數(shù)據(jù)處理能力,當用戶向設備發(fā)送指令,麥克風接受語音信息并將其轉換成電信號,芯片模塊處理分析電信號,實現(xiàn)終端的實時數(shù)據(jù)處理,減少因數(shù)據(jù)傳輸造成的反應延時。此外,終端深度集成語音芯片擁有較大的數(shù)據(jù)存儲空間,可將語料數(shù)據(jù)保存于終端,保證隱私數(shù)據(jù)的安全性。終端深度集成語音芯片的發(fā)展,既能減少向云端傳輸?shù)臄?shù)據(jù)量,降低終端設備運行成本,又能提高語音助手的反應速度,提升用戶體驗,為語音助手的推廣應用提供堅實的基礎?;A硬件設施進步為行業(yè)發(fā)展提供基礎智能語音技術進步提升了語音助手的智能化程度,助力語音助手產(chǎn)品的推廣?,F(xiàn)階段的語音合成技術已接近人類的發(fā)音水平,語音助手開始擁有語調(diào)、情緒的變化,能更好地吸引用戶與其交互。智能語音技術的進步提高助手的智能程度10行業(yè)壁壘11行業(yè)風險12行業(yè)現(xiàn)狀市場情況描述行業(yè)現(xiàn)狀目前來看,搭載語音助手的設備產(chǎn)品主要為智能手機和可穿戴設備,但是在智能家居產(chǎn)品和只能車載產(chǎn)品方面,有著非常大的市場潛力。語音交互作為人工智能的必然趨勢,語音助手也將進一步的與各產(chǎn)業(yè)進行深度融合。隨著產(chǎn)品智能化的深入,搭載語音助手的智能終端數(shù)量將進一步增長。行業(yè)現(xiàn)狀01市場份額變化現(xiàn)階段,搭載語音助手的設備產(chǎn)品主要有智能手機、智能家居產(chǎn)品(如智能冰箱、智能空調(diào)、智能洗衣機、智能照明等)以及智能汽車,其中智能手機是語音助手的主要載體;智能家居產(chǎn)品豐富,且產(chǎn)品具有剛性需求,為語音助手提供豐富的落地載體選擇;智能汽車正逐步替代傳統(tǒng)汽車,其市場潛力帶動語音助手需求提升。2014-2018年間,中國語音助手市場規(guī)模實現(xiàn)快速增長,年復合增長率達76%。語音交互成為人工智能的必然趨勢,語音助手逐漸與各類型人工智能產(chǎn)品深度融合。隨著產(chǎn)品智能化的深入,搭載語音助手的智能設備數(shù)將逐步增長。由于中國居民消費水平提升,消費主力群體代際變遷等因素,搭載語音助手的智能設備的消費量將會有所增長,推動中國語音助手市場規(guī)模進一步擴大,到2023年,中國語音助手市場規(guī)模將增長至570.3億元人民幣。行業(yè)現(xiàn)狀02市場情況智能家居的最終形態(tài)是實現(xiàn)全屋產(chǎn)品的智能化,為AoT的關鍵場景,而智能語音是智能家居不可缺少的部分,在燈光空調(diào)、電視、窗簾、門窗、背最音樂、安防、監(jiān)控控空制以及可編程定時控制等方面均有應用。我國智能家居市場當前正處于快速發(fā)展時期,智能語音的發(fā)展給智能家居的發(fā)展起到了奠基的作用。隨著智能家居越來越受到關注和喜愛,近幾年市場增長率一直保持在20%左右。2020年我國智能家居的市場規(guī)模達到2419億元,同比增長20%。行業(yè)現(xiàn)狀智能助手與語音購物對于那些公司來說,終極目標就是讓消費者借助自家智能語音助手實現(xiàn)無障礙語音購物。不少調(diào)查顯示,只有大約20%的用戶會借助自己的智能音箱購物。而每個月都會利用智能音箱購物的用戶比例,更是只有10%。根據(jù)相關調(diào)查,截至2018年八月,使用Alexa進行語音購物的用戶比例只有區(qū)區(qū)2%。于零售商而言,這顯然不是他們想看到的數(shù)據(jù)。其實,現(xiàn)實生活中,大多數(shù)人還是偏向于線下實體店購物。畢竟真正鐘愛語音購物的人,應該連1%都不到?;蛟S正是因為如此,亞馬遜近來已經(jīng)開始游說消費品牌在廣告和包裝上融入Alexa的購物語音命令。只不過,如果真想普及語音購物的話,智能音箱最好還是能配塊屏幕。畢竟購物還是以視覺和觸覺為主的體驗,對于僅支持語音技術的設備來說還不是很成熟,可選范圍會大大縮小。當然,整體看來,這一塊未來發(fā)展前景還是值得期待的。01各大品牌紛紛加入語音大戰(zhàn)根據(jù)市場營銷機構Digitas的調(diào)查,大約有85%的消費者曾經(jīng)在語音技術的支持下完成過購物。因此,現(xiàn)階段,各大品牌都想先發(fā)制人,利用語音技術作為競爭優(yōu)勢來提高自家產(chǎn)品和服務的銷售額。說不定,未來亞馬遜或谷歌的商戶需要特地拿出一筆費用,讓智能助手為自家產(chǎn)品打廣告。至于這些語音助手如何為消費者推薦商品,主要還是依據(jù)他們的購買歷史、消費偏好以及商品是否有貨、是否包郵等。當下,各大品牌主要還是利用語音技術來進行市場營銷,推廣自家產(chǎn)品。具體說來,它們會定期更新搜索關鍵詞以反映消費者真實搜索行為,同時也會提供更多網(wǎng)頁搜索內(nèi)容。0213行業(yè)痛點行業(yè)痛點010203目前的語音識別技術僅在特定領域、特定環(huán)境下達到實用化程度,業(yè)內(nèi)企業(yè)實現(xiàn)的97%的語音識別準確率較多是基于安靜室內(nèi)環(huán)境產(chǎn)生的人工測評結果,在實際使用場景中,尤其是在自由發(fā)音、強噪聲、多人同時發(fā)聲、遠端聲場等環(huán)境下,機器的語音識別性能并不理想。在語音助手的真實使用場景中,方言、噪音、遠場、斷句等情況不可避免,語音采集地點變更導致的環(huán)境及背景噪音差異、語音信號傳輸載體方式多樣導致的傳輸信道差異,都將造成語音信號的頻譜畸變,導致語音系統(tǒng)難以準確識別用戶話語,對用戶需求的理解產(chǎn)生偏差。語音識別技術的成熟度將影響語音助手應用產(chǎn)品生態(tài)的構建與發(fā)展,語音識別技術仍需提升抗干擾能力,其“魯棒性”問題亟待解決。語音識別技術未解決實際場景識別問題語音助手的自然語言理解能力與人類助手的自然語言理解能力相差甚遠,語音助手為用戶帶來的人機交互體驗不佳,與用戶的生活結合程度依舊不深。語音助手與用戶日常生活的結合深度較大程度上取決于語音助手的人機交互能力,擁有良好交互能力的語音助手能方便用戶支配,但機器的人機交互能力受自然語言理解能力的影響,目前機器對自然語言的理解準確度不高,導致用戶對語音助手的人機交互體驗不佳。機器由于難以擁有生活常識、文化背景和人類風俗習慣知識儲備,對于作為文化載體的自然語言,無法結合具體的語言環(huán)境、風俗習慣等因素分析語言內(nèi)容,只能通過系統(tǒng)設定的規(guī)則機械地分析源語的語法結構,語言邏輯無法處理,對于復雜句子結構或一詞多義的情況,機器的理解能力有限。機器不具備上下文功能,無法將聊天中的信息與上下文關聯(lián),遇到一詞多義的情況,機器無法像人類般基于已有知識儲備和上下文環(huán)境確定多義詞的意思,導致語音助手無法準確判定用戶的意圖,人機交互不順暢。機器的自然語言理解能力仍顯不足現(xiàn)階段數(shù)據(jù)是人工智能發(fā)展的基石,海量數(shù)據(jù)為訓練人工智能提供原材料。中國人口基數(shù)龐大,可所產(chǎn)生海量的數(shù)據(jù)資源為智能語音的發(fā)展提供充足的訓練素材,但目前中國的智能語音行業(yè)仍缺乏一個標準的跨平臺數(shù)據(jù)共享系統(tǒng),巨頭企業(yè)掌握大量數(shù)據(jù)資源,不對外開放,不利于小企業(yè)或初創(chuàng)企業(yè)的數(shù)據(jù)積累。與此同時,各企業(yè)利用自有數(shù)據(jù)資源獨立研發(fā),各類型語音軟件系統(tǒng)兼容度不高,進一步阻礙數(shù)據(jù)資源的自由流通。缺少數(shù)據(jù)的智能語音企業(yè)難以提高模型的識別準確度,影響產(chǎn)品的投放以及市場份額的拓展,企業(yè)的發(fā)展受限不利于行業(yè)的快速擴張。缺少統(tǒng)一的數(shù)據(jù)共享系統(tǒng)在一定程度上會制約中國智能語音行業(yè)的快速發(fā)展,未來,相關部門需要對數(shù)據(jù)共享制定規(guī)范與準則,幫助數(shù)據(jù)有效分享,促進數(shù)據(jù)資源的合理運作。數(shù)據(jù)孤島導致數(shù)據(jù)資源得不到全面開發(fā)14問題及解決方案15行業(yè)發(fā)展趨勢前景行業(yè)發(fā)展趨勢前景描述語音助手應用場景逐漸豐富:語音助手的場景化解決方案將逐漸豐富。語音交互方式作為人機交互的重要演進方向,正逐步滲透到人們的日常生活中,與各類型應用場景相結合。與場景貼合是技術實現(xiàn)商業(yè)化的主要途徑,為適應不同場景的語音交互需求,語音助手必須貼合不同應用場景,深入剖析場景真實環(huán)境,結合各行業(yè)專業(yè)知識體系,提供針對性的行業(yè)或應用解決方案。例如,在智能車載領域,語音助手企業(yè)開始從車內(nèi)真實環(huán)境出發(fā),為車廠量身定制具有語音控制、語音導航以及語音呼叫等功能的語音助手方案。在醫(yī)療領域,適用于醫(yī)療行業(yè)的語音助手被廣泛用于臨床文檔改良、臨床語音識別、輔助醫(yī)療質(zhì)量把控等工作中,充分協(xié)助醫(yī)護人員完成大量程序化的工作,推進智慧醫(yī)療的發(fā)展進程。語音助手技術巨頭科大訊飛已成功地為全國100多家醫(yī)院提供量身定制的智能醫(yī)療語音解決方案。隨著傳統(tǒng)行業(yè)業(yè)務處理智能化需求上漲,語音交互方式與傳統(tǒng)行業(yè)的結合將逐步加深,將為語音助手創(chuàng)造更多可投放場景。語音與視覺等模態(tài)相互融合:隨著人工智能的智能程度提升,語音、圖像、視頻等模態(tài)將趨于融合,語音助手可視化將成為可能。深度學習神經(jīng)網(wǎng)絡的引進使得語言模態(tài)、文字模態(tài)、圖像模態(tài)、視頻模態(tài)的編碼和解碼可在同一個深度學習框架下統(tǒng)一運行,不同模態(tài)的對象可被同一模式編碼與解碼,同一模式的編碼與解碼可使不同模態(tài)對象隨意融合,語音分析結果可與圖像分析結果結合應用。語音助手將可模擬人類的語言認知過程,將語音和視覺同時作為語音理解源,不僅通過聲音來獲取信息,同時還用眼睛觀察說話者口型、表情的變化,提升語言感知能力。類比人類的語言感知過程,智能人機交互也將向語音、圖像、視頻等多模態(tài)融合方向發(fā)展,語音助手通過收集聲音、語言、視覺、觸覺等感知信息,以自然語言處理為主,輔以唇語識別、表情認定、姿勢識別、情緒感知等技術,將數(shù)據(jù)多維度融合以實現(xiàn)人工智能從感知轉變?yōu)檎J知。語音助手市場前景廣闊:語音交互成為人工智能的必然趨勢,語音助手逐漸與各類型人工智能產(chǎn)品深度融合。隨著產(chǎn)品智能化的深入,搭載語音助手的智能設備數(shù)將逐步增長。搭載語音助手的智能設備的消費量亦會有所增長,推動中國語音助手市場規(guī)模進一步擴大。語音助手在智能駕駛的滲透率逐步提高:未來伴隨著科技的進一步發(fā)展,AI、人機&語音交互、5GC-V2X車聯(lián)網(wǎng)等技術的成熟,智能汽車的功能將進一步豐富,使得智能駕駛的滲透率逐步提高,進而帶動整個產(chǎn)業(yè)鏈市場規(guī)模的快速增加。隨著信息技術、網(wǎng)絡技術和人工智能的發(fā)展,智能車載系統(tǒng)將通過融合數(shù)字顯示、多屏作者互動、手勢操作、智能語音等多項技術,為汽車的駕乘人員提供全新的、直接的、多元的人車交互服務。在汽車產(chǎn)業(yè)領域,搭載基于智能語音的車載交互系統(tǒng)已經(jīng)成為主流。車載語音交互或?qū)⒊蔀闃伺?,打造車?nèi)交互新體驗行業(yè)發(fā)展趨勢前景語音助手應用場景逐漸豐富語音助手的場景化解決方案將逐漸豐富。語音交互方式作為人機交互的重要演進方向,正逐步滲透到人們的日常生活中,與各類型應用場景相結合。與場景貼合是技術實現(xiàn)商業(yè)化的主要途徑,為適應不同場景的語音交互需求,語音助手必須貼合不同應用場景,深入剖析場景真實環(huán)境,結合各行業(yè)專業(yè)知識體系,提供針對性的行業(yè)或應用解決方案。例如,在智能車載領域,語音助手企業(yè)開始從車內(nèi)真實環(huán)境出發(fā),為車廠量身定制具有語音控制、語音導航以及語音呼叫等功能的語音助手方案。在醫(yī)療領域,適用于醫(yī)療行業(yè)的語音助手被廣泛用于臨床文檔改良、臨床語音識別、輔助醫(yī)療質(zhì)量把控等工作中,充分協(xié)助醫(yī)護人員完成大量程序化的工作,推進智慧醫(yī)療的發(fā)展進程。語音助手技術巨頭科大訊飛已成功地為全國100多家醫(yī)院提供量身定制的智能醫(yī)療語音解決方案。隨著傳統(tǒng)行業(yè)業(yè)務處理智能化需求上漲,語音交互方式與傳統(tǒng)行業(yè)的結合將逐步加深,將為語音助手創(chuàng)造更多可投放場景。語音與視覺等模態(tài)相互融合隨著人工智能的智能程度提升,語音、圖像、視頻等模態(tài)將趨于融合,語音助手可視化將成為可能。深度學習神經(jīng)網(wǎng)絡的引進使得語言模態(tài)、文字模態(tài)、圖像模態(tài)、視頻模態(tài)的編碼和解碼可在同一個深度學習框架下統(tǒng)一運行,不同模態(tài)的對象可被同一模式編碼與解碼,同一模式的編碼與解碼可使不同模態(tài)對象隨意融合,語音分析結果可與圖像分析結果結合應用。語音助手將可模擬人類的語言認知過程,將語音和視覺同時作為語音理解源,不僅通過聲音來獲取信息,同時還用眼睛觀察說話者口型、表情的變化,提升語言感知能力。類比人類的語言感知過程,智能人機交互也將向語音、圖像、視頻等多模態(tài)融合方向發(fā)展,語音助手通過收集聲音、語言、視覺、觸覺等感知信息,以自然語言處理為主,輔以唇語識別、表情認定、姿勢識別、情緒感知等技術,將數(shù)據(jù)多維度融合以實現(xiàn)人工智能從感知轉變?yōu)檎J知。語音助手市場前景廣闊語音交互成為人工智能的必然趨勢,語音助手逐漸與各類型人工智能產(chǎn)品深度融合。隨著產(chǎn)品智能化的深入,搭載語音助手的智能設備數(shù)將逐步增長。搭載語音助手的智能設備的消費量亦會有所增長,推動中國語音助手市場規(guī)模進一步擴大。語音助手在智能駕駛的滲透率逐步提高未來伴隨著科技的進一步發(fā)展,AI、人機&語音交互、5GC-V2X車聯(lián)網(wǎng)等技術的成熟,智能汽車的功能將進一步豐富,使得智能駕駛的滲透率逐步提高,進而帶動整個產(chǎn)業(yè)鏈市場規(guī)模的快速增加。隨著信息技術、網(wǎng)絡技術和人工智能的發(fā)展,智能車載系統(tǒng)將通過融合數(shù)字顯示、多屏作者互動、手勢操作、智能語音等多項技術,為汽車的駕乘人員提供全新的、直接的、多元的人車交互服務。在汽車產(chǎn)業(yè)領域,搭載基于智能語音的車載交互系統(tǒng)已經(jīng)成為主流。車載語音交互或?qū)⒊蔀闃伺洌蛟燔噧?nèi)交互新體驗16機遇與挑戰(zhàn)17競爭格局競爭格局中國語音助手服務商可分為以百度為代表的互聯(lián)網(wǎng)巨頭企業(yè),以科大訊飛為代表的智能語音技術巨頭企業(yè)以及以云知聲為代表的深耕于垂直領域和細分場景的初創(chuàng)企業(yè)?;ヂ?lián)網(wǎng)巨頭企業(yè)擁有豐富的客戶資源以及完善的產(chǎn)品生態(tài),其可將自主研發(fā)的語音助手投放于自有產(chǎn)品生態(tài)中,同時可利用豐富的C端產(chǎn)品經(jīng)驗及用戶數(shù)據(jù)為語音助手的功能化設計提供基礎,基于用戶需求驅(qū)動產(chǎn)品的發(fā)展與落地。與此同時,互聯(lián)網(wǎng)巨頭企業(yè)通過開放語音平臺,以產(chǎn)業(yè)內(nèi)合作的方式,將語音助手植入合作伙伴的產(chǎn)品或相關業(yè)務場景中,實現(xiàn)其語音助手應用場景的快速構建,搶先占領廣闊的人工智能設備入口端。智能語音技術巨頭企業(yè)擁有較強的技術實力,在語音助手行業(yè)擁有先發(fā)優(yōu)勢,占據(jù)較大的市場份額。但隨著深度學習算法的成熟,語音數(shù)據(jù)的增長,語音模型開發(fā)難度以及成本有所下降,智能語音行業(yè)的技術壁壘逐漸被打破,智能語音科技企業(yè)的先發(fā)優(yōu)勢逐漸被削弱,較多企業(yè)有能力提供語音助手的算法模型,與語音技術巨頭企業(yè)形成激烈的競爭。智能語音技術巨頭企業(yè)原有的語音技術授權、提供語音算法模型、技術維護等業(yè)務模式的收入逐漸受限,部分智能語音巨頭企業(yè)開始從單一的智能語音技術提供商向全方位人工智能技術服務商轉型,將語音技術轉化為產(chǎn)品與服務,為下游各應用領域提供定制化語音助手產(chǎn)品與服務,進一步鞏固并增強語音技術優(yōu)勢。語音助手領域的初創(chuàng)企業(yè)較多以垂直領域和細分場景為突破口,研發(fā)單一場景或單一行業(yè)的語音助手產(chǎn)品或解決方案,避開與互聯(lián)網(wǎng)巨頭企業(yè)以及智能語音技術巨頭企業(yè)的直接競爭。相較于互聯(lián)網(wǎng)巨頭企業(yè)和智能語音技術巨頭企業(yè),初創(chuàng)企業(yè)的布局范圍較小,涉及的下游應用場景較狹窄,對于部分綜合實力欠缺的初創(chuàng)企業(yè),專注于語音助手應用的細分場景有助于提升企業(yè)在垂直領域的專業(yè)性。根據(jù)在行業(yè)前10語音助手企業(yè)擁有超過2年產(chǎn)品戰(zhàn)略規(guī)劃經(jīng)驗的專家分析,由于各企業(yè)開發(fā)和掌握的語音助手技術的本質(zhì)區(qū)別逐漸縮小,技術壁壘效應逐漸被削弱,基于技術銷售的商業(yè)模式難以為繼,技術已不再是企業(yè)構建商業(yè)模式的最主要基礎,全產(chǎn)業(yè)鏈布局及語音助手生態(tài)體系構建將成為語音助手服務商持續(xù)發(fā)展的主要途徑,應用場景的開發(fā)將是語音助手廠商未來的主要關注點。目前智能手機、智能家居以及智能車載三大場景發(fā)展基礎良好,需求較大,成為各類型廠商激烈爭奪的領域。競爭格局中國語音助手服務商可分為以百度為代表的互聯(lián)網(wǎng)巨頭企業(yè),以科大訊飛為代表的智能語音技術巨頭企業(yè)以及以云知聲為代表的深耕于垂直領域和細分場景的初創(chuàng)企業(yè)?;ヂ?lián)網(wǎng)巨頭企業(yè)擁有豐富的客戶資源以及完善的產(chǎn)品生態(tài),其可將自主研發(fā)的語音助手投放于自有產(chǎn)品生態(tài)中,同時可利用豐富的C端產(chǎn)品經(jīng)驗及用戶數(shù)據(jù)為語音助手的功能化設計提供基礎,基于用戶需求驅(qū)動產(chǎn)品的發(fā)展與落地。與此同時,互聯(lián)網(wǎng)巨頭企業(yè)通過開放語音平臺,以產(chǎn)業(yè)內(nèi)合作的方式,將語音助手植入合作伙伴的產(chǎn)品或相關業(yè)務場景中,實現(xiàn)其語音助手應用場景的快速構建,搶先占領廣闊的人工智能設備入口端。智能語音技術巨頭企業(yè)擁有較強的技術實力,在語音助手行業(yè)擁有先發(fā)優(yōu)勢,占據(jù)較大的市場份額。但隨著深度學習算法的成熟,語音數(shù)據(jù)的增長,語音模型開發(fā)難度以及成本有所下降,智能語音行業(yè)的技術壁壘逐漸被打破,智能語音科技企業(yè)的先發(fā)優(yōu)勢逐漸被削

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論