2022年中國智能語音轉(zhuǎn)寫行業(yè)研究報告_第1頁
2022年中國智能語音轉(zhuǎn)寫行業(yè)研究報告_第2頁
2022年中國智能語音轉(zhuǎn)寫行業(yè)研究報告_第3頁
2022年中國智能語音轉(zhuǎn)寫行業(yè)研究報告_第4頁
2022年中國智能語音轉(zhuǎn)寫行業(yè)研究報告_第5頁
已閱讀5頁,還剩77頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

留存探索語音內(nèi)容智能語音轉(zhuǎn)寫行業(yè)研究報告?2022.12iResearchInc.前言研究背景:在工具不發(fā)達的年代,會議記錄主要依靠人力完成,以多人合作的分工形式提升記錄效率。后隨著記錄工具不斷升級和專業(yè)培訓(xùn),人工轉(zhuǎn)寫的效率也在不斷提升,專業(yè)速錄師可依靠速錄機完成會議等場景的轉(zhuǎn)寫需求,但成本較高。后隨著互聯(lián)網(wǎng)及人工智能技術(shù)的不斷發(fā)展,智能語音轉(zhuǎn)寫產(chǎn)品應(yīng)運而生。尤其在2011年,大量研究人員轉(zhuǎn)向深度學習在智能語音領(lǐng)域的研究,利用大數(shù)據(jù)、機器學習和大算力“三駕馬車”,讓語音識別的識別準確度再一次得到明顯提升,智能語音技術(shù)迎來落地應(yīng)用的發(fā)展期?!惫び破涫?,必先利其器“,智能化的語音轉(zhuǎn)寫服務(wù)以價優(yōu)、質(zhì)高、便捷的優(yōu)勢滿足了轉(zhuǎn)寫記錄這一交流場景的需求痛點,并在遠程辦公、新媒體、國際化交流的需求背景下,未來保持強勁市場增長力。對此,艾瑞發(fā)布《中國智能語音轉(zhuǎn)寫行業(yè)研究報告》,從語音識別-智能轉(zhuǎn)寫產(chǎn)品角度出發(fā),確立智能語音轉(zhuǎn)寫服務(wù)的范圍定義,描繪智能語音轉(zhuǎn)寫服務(wù)的產(chǎn)業(yè)圖譜與需求市場,梳理智能語音轉(zhuǎn)寫服務(wù)在SaaS軟件服務(wù)及本地解決方案的不同產(chǎn)品形式、商業(yè)模式及廠商格局,并為中國智能語音轉(zhuǎn)寫行業(yè)的趨勢發(fā)展提供分析判斷,希望通過本報告,為讀者呈現(xiàn)中國智能語音轉(zhuǎn)寫的產(chǎn)業(yè)發(fā)展背景、行業(yè)廠商動態(tài)、產(chǎn)品發(fā)展機遇的多維視角,歡迎各界探討指正。研究對象:作為語音識別技術(shù)的產(chǎn)品應(yīng)用,智能語音轉(zhuǎn)寫產(chǎn)品是可以支持長音頻識別的語音轉(zhuǎn)文字服務(wù),分為實時語音轉(zhuǎn)寫與非實時語音轉(zhuǎn)寫,可為信息處理和數(shù)據(jù)挖掘提供基礎(chǔ)。研究方法:本報告通過業(yè)內(nèi)資深的專家訪談、桌面研究、產(chǎn)品對比研究、行業(yè)數(shù)據(jù)統(tǒng)計與行業(yè)規(guī)模推算輸出相應(yīng)研究成果。報告撰寫艾瑞咨詢產(chǎn)業(yè)數(shù)字化研究部人工智能研究組2?2022.12iResearchInc.3摘要智能語音產(chǎn)業(yè)發(fā)展智能語音轉(zhuǎn)寫產(chǎn)品智能語音轉(zhuǎn)寫市場智能語音轉(zhuǎn)寫趨勢洞察近年來,智能語音技術(shù)與互聯(lián)網(wǎng)、企業(yè)服務(wù)、消費硬件、傳媒、醫(yī)療健康等各行業(yè)的深度融合帶來了新的用戶需求增長和商業(yè)模式創(chuàng)新,創(chuàng)造產(chǎn)業(yè)經(jīng)濟價值、繁榮產(chǎn)業(yè)生態(tài),算法模型、優(yōu)質(zhì)數(shù)據(jù)集與多樣化應(yīng)用場景助力產(chǎn)業(yè)規(guī)模走高。部分智能語音產(chǎn)品如語音助手、語音轉(zhuǎn)寫、智能客服等取得產(chǎn)品價值突破或商業(yè)上的顯著成就,語音識別相關(guān)產(chǎn)品多已進入穩(wěn)步上升期。但在細分產(chǎn)品的交互體驗、使用效果、場景優(yōu)化等方面仍面臨長期求索。人們面對“AI”時希望得到的自然、類人、甚至高信息密度的交互體驗,仍然是一個宏偉的開放性課題。語音識別產(chǎn)品早期主要是語音聽寫,即用戶說一句、機器識別一句;后來發(fā)展成語音轉(zhuǎn)寫,更聚焦于人人交流場景。智能語音轉(zhuǎn)寫是可以支持長音視頻的語音轉(zhuǎn)文字服務(wù),附加產(chǎn)品服務(wù)、多語種翻譯、內(nèi)容分析等智能化功能,滿足用戶在會議、庭審、采訪、直播、視頻制作、客服質(zhì)檢等場景中的實時與非實時語音轉(zhuǎn)寫需求。隨著語音識別準確性及效率的提升、多語種與方言轉(zhuǎn)寫服務(wù)豐富,以及上下文糾正、標點過濾、自定義熱詞配置、聲紋角色分離、語音內(nèi)容分析提取等功能的逐步優(yōu)化,智能語音轉(zhuǎn)寫服務(wù)的商業(yè)化落地與多場景復(fù)用持續(xù)推進,成為語音識別產(chǎn)品的“排頭兵”。在人力成本、協(xié)同辦公、傳媒音視頻、會展交流、跨國溝通等多重因素驅(qū)動下,中國智能轉(zhuǎn)寫市場不斷注入需求活力,2021年中國智能語音轉(zhuǎn)寫市場規(guī)模已約為10億元。未來,隨著智能轉(zhuǎn)寫的技術(shù)突破、功能豐富及場景泛化,智能轉(zhuǎn)寫市場規(guī)模將加速上揚,預(yù)計2026年市場規(guī)模將達到38億。從產(chǎn)品形態(tài)來看,智能轉(zhuǎn)寫產(chǎn)品主要包括SaaS類產(chǎn)品與本地化部署解決方案兩大類。其中,SaaS市場頭部聚集效應(yīng)顯著,訊飛聽見與搜狗聽寫位列第一梯隊,訊飛聽見在轉(zhuǎn)寫準確率尤其是小語種和方言等、產(chǎn)品豐富度、品牌影響力和發(fā)展?jié)摿S度拔得頭籌。未來,SaaS形式API調(diào)用與垂類解決方案將形成合力,構(gòu)成智能語音轉(zhuǎn)寫產(chǎn)業(yè)既快且穩(wěn)的增長飛輪,高生態(tài)活性加硬解決方案實力的企業(yè)將更能突出重圍,搶占更多增量市場。從技術(shù)趨勢來看,語音識別技術(shù)的精度和速度仍取決于實際應(yīng)用環(huán)境,面對“混合語種”“嘈雜環(huán)境”下的“多人”“交互”“重疊”等多重因素交織的復(fù)雜語音場景,語音轉(zhuǎn)寫技術(shù)應(yīng)用仍有待突破;從場景價值來看,如今智能轉(zhuǎn)寫應(yīng)用領(lǐng)域大多僅服務(wù)于從語音到文字轉(zhuǎn)寫內(nèi)容的實現(xiàn),未來轉(zhuǎn)寫應(yīng)用可結(jié)合自然語言理解、機器學習、知識圖譜等AI技術(shù),拓展轉(zhuǎn)寫產(chǎn)品的場景邊界,深入挖掘轉(zhuǎn)寫內(nèi)容價值,以更高階、智能的輔助替代角色,為客戶提供問題預(yù)警、策略總結(jié)、決策分析等功能服務(wù);從廠商策略來看,各家將以構(gòu)建自身產(chǎn)品生態(tài),加強外部場景合作為策略核心,基于自身企業(yè)特點選擇差異化側(cè)重,共同推進轉(zhuǎn)寫技術(shù)的應(yīng)用滲透與市場發(fā)展。來源:艾瑞咨詢研究院自主研究繪制。智能語音轉(zhuǎn)寫行智能語音轉(zhuǎn)寫行業(yè)——發(fā)展背景篇1智能語音轉(zhuǎn)寫行業(yè)——智能語音轉(zhuǎn)寫行業(yè)——市場分析篇2智能語音轉(zhuǎn)智能語音轉(zhuǎn)寫行業(yè)典型企業(yè)案例3智能語音轉(zhuǎn)寫行智能語音轉(zhuǎn)寫行業(yè)——發(fā)展趨勢篇4協(xié)同辦公智能機器人智能客服傳媒制作智能家居來源:艾瑞研究院根據(jù)公開資料自主研究繪制。智協(xié)同辦公智能機器人智能客服傳媒制作智能家居來源:艾瑞研究院根據(jù)公開資料自主研究繪制。數(shù)字信息輸入輸出的重要載體,人工智能產(chǎn)業(yè)落地“先鋒軍”智能語音技術(shù)指通過聲音信號的前端處理、語音識別(ASR)、自然語言處理(NLP)、語音合成(TTS)等技術(shù)形成完濟價值、繁榮產(chǎn)業(yè)生態(tài)。智能語音產(chǎn)業(yè)的迅速發(fā)展促進了我國數(shù)字經(jīng)濟發(fā)展、提高了社會治理的智能化水平、推動了我國中國智能語音產(chǎn)業(yè)典型應(yīng)用場景及政策匯總(部分)發(fā)布日期相關(guān)機構(gòu)重點內(nèi)容,進一步加強12345平臺和網(wǎng)上12345能力建設(shè),開發(fā)智能推薦、語音11工業(yè)和信息化部批復(fù)組建國家智能語音創(chuàng)新中心,將圍繞多語種語音識別、語音合成、語義理解和專用人工智能語音芯片等研發(fā)方向,構(gòu)建集共性技術(shù)研發(fā)、測試驗證、中試孵化和成果轉(zhuǎn)移轉(zhuǎn)化于一體的創(chuàng)新平臺提出加強自助下單、智能文本客服、智能語音等智能化應(yīng)用,方便企業(yè)和群眾反映訴10鼓勵智能家居產(chǎn)品普及語音控制功能,推動基于智能語音識別技術(shù)的智能音箱、智能可穿戴設(shè)備及其他智能家電產(chǎn)品開發(fā),老年人可通過語音方式實現(xiàn)便捷化操作民法院全面提升語音識別技術(shù)在庭審語音同步轉(zhuǎn)錄中的應(yīng)用效能,建成全國法院智能語音云開展智能醫(yī)學影像識別、病理分型和多學科會診以及多種醫(yī)療健康場景下的智能語音技術(shù)應(yīng)用,提高醫(yī)療服務(wù)效率部首批國家新一代人工智能開放創(chuàng)新平臺,包括自動駕駛、城市大腦醫(yī)療影像和音大力發(fā)展電子公證、法律服務(wù)智能保障等業(yè)務(wù)模式,推進人工智能語音熱線和社交網(wǎng)?2022.12iResearchInc.5元,產(chǎn)業(yè)規(guī)模持續(xù)走高富的下游應(yīng)用場景創(chuàng)新,已進入規(guī)?;罡A段。我國頭部智能語音企業(yè)、大型互聯(lián)網(wǎng)企業(yè)等紛紛以“開放平臺+垂直賽、協(xié)同辦公、智慧醫(yī)療、在線教育、智能家居等垂直行業(yè)賽道,以語音為信息的出入口,構(gòu)建泛語音產(chǎn)業(yè)生態(tài)集群。20222019-2026年中國智能語音產(chǎn)業(yè)規(guī)模CAGRCAGR441.6%45.9%26.5%21.7%19.6%18.4%46939633127221559097735.2%2019202020212022e2023e2024e2025e2026e智能語音產(chǎn)業(yè)規(guī)模(億元)智能語音產(chǎn)業(yè)增速(%)注釋:智能語音典型產(chǎn)品包括對話機器人、智能硬件中的AI語音助手以及教育、醫(yī)療、司法、公安、互聯(lián)網(wǎng)等垂直行業(yè)中的智能語音產(chǎn)品及應(yīng)用。來源:艾瑞咨詢研究院根據(jù)專家訪談,結(jié)合艾瑞統(tǒng)計模型自主研究繪制。?2022.12iResearchInc.6?2022.12iResearchInc.7智能語音產(chǎn)業(yè)的產(chǎn)品成熟度多已進入穩(wěn)步上升期別準確NLP力對話引擎以及針對實際應(yīng)用中的算法優(yōu)化,智能語音技術(shù)的落地可用性不斷突破。但其背后涉及的聲學研究、模式識別研究、通用NLP研究及垂直場景的深度語義理2022年中國智能語音產(chǎn)品成熟度曲線分布產(chǎn)語音輸入法語音轉(zhuǎn)寫語音輸入法智能車載語音識別智能車載智能消費硬件智能語音開發(fā)平臺表示智能語音相關(guān)技術(shù)的智能消費硬件智能語音開發(fā)平臺表示智能語音相關(guān)技術(shù)的一階產(chǎn)品,可衍生出各細分領(lǐng)域的產(chǎn)品應(yīng)用。如智能客服+金融、基于語音助手的音箱等表示智能語音技術(shù)二階產(chǎn)品,如基于語音識別技術(shù)的智能語音轉(zhuǎn)寫產(chǎn)品、基于語成技術(shù)的語音播報等語音播報語音合成智能客服語音審核語音芯片聲紋識別語音芯片自然語言處理生成式AI(音頻)生產(chǎn)成熟期生產(chǎn)成熟期落地實踐期萌芽探索期飛躍發(fā)展期穩(wěn)步上升期階段技術(shù)落地初期階段,產(chǎn)品成熟度較低產(chǎn)品普及率提升,成熟度曲線處于緩慢爬坡期來源:艾瑞咨詢研究院自主研究及繪制。產(chǎn)品規(guī)?;瘧?yīng)用,成熟度快速增長成熟度趨于穩(wěn)定,產(chǎn)品及服務(wù)差異化競爭階段成熟度穩(wěn)定階段。但技術(shù)若出現(xiàn)跨越性突破,產(chǎn)品或回到飛躍發(fā)展階段?2022.12iResearchInc.801實時語音轉(zhuǎn)寫實時語音轉(zhuǎn)寫01實時語音轉(zhuǎn)寫實時語音轉(zhuǎn)寫(流式上傳-同步獲取):實時語音轉(zhuǎn)寫可將不限時長的音頻流實時識別為文字,并返回帶有時間戳的文字流;可用于直播實時字幕、實時會議記錄;也可配合機器翻譯,實現(xiàn)同傳功能。要輸出形態(tài),分為實時與非實時語音轉(zhuǎn)寫能濾、語氣詞過濾、自定義熱詞配置、聲紋角色分離、語音內(nèi)容分析提取等智能化服務(wù)功能的逐步優(yōu)化,智能語音轉(zhuǎn)寫服產(chǎn)品的“排頭兵”。智能語音轉(zhuǎn)寫產(chǎn)品定義與分類語音識語音識別作為智能交互中的一環(huán),進行語音識別,讓機器“理解”人類說的話語,而非以識別為最終產(chǎn)品目的語音轉(zhuǎn)寫:支持長音視頻的語音轉(zhuǎn)文字服務(wù),可為信息處理和數(shù)據(jù)挖掘提供基礎(chǔ)。0202非實時語音轉(zhuǎn)寫非實時語音轉(zhuǎn)寫(已錄制音頻文件上傳-異步獲取):非實時語音轉(zhuǎn)寫將長段音頻數(shù)據(jù)轉(zhuǎn)換成文本數(shù)據(jù)??捎糜谟耙曌帜恢谱?、會議訪談記錄轉(zhuǎn)寫、智能客服錄音質(zhì)檢等場景。來源:艾瑞咨詢研究院自主研究及繪制。?2022.12iResearchInc.9Step3音頻信號識別結(jié)果解碼搜索:對給定的特征向量序列和若干假設(shè)詞序列計算聲學模型分數(shù)和語言模型分數(shù),將總體輸出分數(shù)最高的Step3音頻信號識別結(jié)果解碼搜索:對給定的特征向量序列和若干假設(shè)詞序列計算聲學模型分數(shù)和語言模型分數(shù),將總體輸出分數(shù)最高的詞序列作為識別結(jié)果。0.850.950.700.85dakaikongtiao0.850.950.200.15ing5信號處理和特征提取解碼搜索聲音特征語言模型得分聲學模型得分語言模型聲學模型語言模型通過訓(xùn)練語料/數(shù)據(jù)(通常是文本形式)學習詞之間的相互關(guān)系,來估計假設(shè)詞序列的可能性,找出該聲音特征最有可能對應(yīng)的文字序列。的識別,得到相應(yīng)的單詞或者字符序列別系統(tǒng)由信號處理和特征提取、聲學模型(AcousticModel,AM)、語言模型(LanguageModel,LM)和解碼搜索語言模型的獲得需對預(yù)先收集好的海量語音、語言數(shù)據(jù)庫進行信號處理和知識挖掘訓(xùn)練。解碼過程中還存在一個“自適應(yīng)”智能語音轉(zhuǎn)寫產(chǎn)品核心——語音識別系統(tǒng)的技術(shù)結(jié)構(gòu)StepStep1信號處理和特征提?。盒盘柼幚砗吞卣魈崛。阂砸纛l模擬信號輸入,將其轉(zhuǎn)為數(shù)字信號,提取聲音特征,供聲學模型提取合適有代表性的特征向量。StepStep2聲聲學模型將聲學和發(fā)音學(Phonetics)的知識進行整合,以特征提取部分生成的特征為輸入,并為可變長特征序列生成聲學模型分數(shù)。來源:艾瑞根據(jù)CSDN等公開資料整理研究繪制。u概率統(tǒng)計方法主導(dǎo)概率統(tǒng)計識別:隱馬爾可夫模型u概率統(tǒng)計方法主導(dǎo)概率統(tǒng)計識別:隱馬爾可夫模型 (HMM)和高斯混合模型 (DMM)。GMM-HMM框架中,GMM用于對語音聲學特征的分布進行建模,HMM則用于對語音信號的時序性進行建模。自上世紀90年代語音識別聲學模型的區(qū)分性訓(xùn)練準則,語音u模板匹配方法主導(dǎo)模板匹配識別:提取語音信號的特征構(gòu)建參數(shù)模板,將測試語音與參考模板參數(shù)進行比較匹配,取距離最近的樣本所對應(yīng)的詞標注為該語音信號的發(fā)音。該方法可有效解決 ~1970s1970s~20062006~至今來源:艾瑞研究院根據(jù)公開資料自主研究繪制。技術(shù)商業(yè)落地進程進展。語言模型主要基于傳統(tǒng)的N-Gram方法(一種基于統(tǒng)計語言模型的算法)進行統(tǒng)計匹配。雖然目前也有深度神經(jīng)網(wǎng)絡(luò)音識別系統(tǒng)的重要組成部分,占據(jù)著大部分的計算資源并決定著語音識別系統(tǒng)的性能。2009年隨著深度學習技術(shù)發(fā)展,語音識別技術(shù)中聲學模型的突破路徑uu深度神經(jīng)網(wǎng)絡(luò)方法主導(dǎo)2006年:深度學習進入發(fā)展元年。2019年,Hinton將DNN應(yīng)用于語音的聲學建模;2011年底,微軟研究院將DNN技術(shù)應(yīng)用在了大詞匯量了語音識別錯誤率。從此語音識別進入DNN-HMM時代。此外LSTM(遞歸神經(jīng)網(wǎng)絡(luò)模型)具有長短時記憶端到端識別模型可去除HMM,直接從聲學特征輸入2017年以后:隨著各種深度神經(jīng)網(wǎng)絡(luò)以及端到端技術(shù)的興起,業(yè)界廠商紛紛發(fā)布及持續(xù)優(yōu)化各自聲學模型結(jié)構(gòu)。語音識別準確率持續(xù)提升。以科大訊飛為例,2010年中英文識別準確率只有60%左右,而在2021破98.33%。?2022.12iResearchInc.10?2022.12iResearchInc.11譯?提供語音轉(zhuǎn)寫服務(wù),對轉(zhuǎn)寫文本進行內(nèi)容追蹤、實時提醒、譯?提供語音轉(zhuǎn)寫服務(wù),對轉(zhuǎn)寫文本進行內(nèi)容追蹤、實時提醒、處理分析、風控質(zhì)檢等等操作品形態(tài)語產(chǎn)體從業(yè)人員、翻譯專業(yè)人士等各類群體的工作效率。智能語音轉(zhuǎn)寫產(chǎn)品的需求場景?提供會議記錄及會后整理,可?提供會議記錄及會后整理,可附加會議軟件等產(chǎn)品功能?提供字幕轉(zhuǎn)寫服務(wù),可附加音視頻編輯相關(guān)產(chǎn)品功能?提供語音轉(zhuǎn)寫服務(wù),在多語種環(huán)境下,附加實時/非實時翻譯功能?提供人機耦合服務(wù),譯員配合智能轉(zhuǎn)寫內(nèi)容優(yōu)化最終產(chǎn)出時來源:艾瑞研究院根據(jù)公開資料自主研究繪制。?對響應(yīng)時間要求更高,需進行模型蒸餾與模型優(yōu)化實實時會議記錄實實時庭審記錄實實時采訪轉(zhuǎn)寫實實時直播字幕實實時客服記錄實實時會議同傳?會會議紀要總結(jié)庭庭審數(shù)據(jù)錄入課課堂錄音分析對響應(yīng)時間要求相對較低,可通過閑時轉(zhuǎn)寫實現(xiàn)需求錯峰音音視頻字幕編輯黃黃暴等語音質(zhì)檢電電話銷售/客服?2022.12iResearchInc.12智能語音轉(zhuǎn)寫的價值意義轉(zhuǎn)寫市場,增量釋放更多潛在場景需求用,智能語音轉(zhuǎn)寫產(chǎn)品意義2)滿足更多潛在可被優(yōu)化需求本身場景存在潛在轉(zhuǎn)寫需求,但人力實現(xiàn)需要高成本或原本人力難以做到,而智能轉(zhuǎn)寫產(chǎn)品可開發(fā)該類潛在增量市場,釋放更多產(chǎn)值規(guī)模。1)優(yōu)化傳統(tǒng)轉(zhuǎn)寫人力服務(wù)傳統(tǒng)人工轉(zhuǎn)寫費時費力,且轉(zhuǎn)寫質(zhì)量與個人能力高度掛鉤,可借力智能轉(zhuǎn)寫產(chǎn)品提高存量市場的轉(zhuǎn)寫服務(wù)滲透率。通過智能語音轉(zhuǎn)寫產(chǎn)品撬動更多長尾需通過智能語音轉(zhuǎn)寫產(chǎn)品撬動更多長尾需求例:個人辦公場景,有會議內(nèi)容的潛在轉(zhuǎn)寫需求,出于時長與精力考量不會自做,出于成本考量不會外購,但可通過智能語音轉(zhuǎn)寫產(chǎn)品獲得優(yōu)質(zhì)高效、兼具性價比的轉(zhuǎn)寫服務(wù)。例:溝通交流場景,在多語種、方言溝通的日常交流環(huán)境中,存在潛在語音轉(zhuǎn)寫需求,可通過轉(zhuǎn)寫產(chǎn)品跨越語言障礙,實現(xiàn)高效溝通。來源:艾瑞研究院根據(jù)公開材料自主研究繪制。智能語音轉(zhuǎn)寫行智能語音轉(zhuǎn)寫行業(yè)——發(fā)展背景篇1智能語音轉(zhuǎn)寫行業(yè)——智能語音轉(zhuǎn)寫行業(yè)——市場分析篇2智能語音轉(zhuǎn)智能語音轉(zhuǎn)寫行業(yè)典型企業(yè)案例3智能語音轉(zhuǎn)寫行智能語音轉(zhuǎn)寫行業(yè)——發(fā)展趨勢篇4產(chǎn)品及解決方案提供商下游應(yīng)用領(lǐng)域辦公場景傳媒場景產(chǎn)品及解決方案提供商下游應(yīng)用領(lǐng)域辦公場景傳媒場景翻譯場景其他場景……業(yè)專業(yè)轉(zhuǎn)寫/譯廠商C端用戶G端政府2022年中國智能語音轉(zhuǎn)寫產(chǎn)業(yè)圖譜上游基礎(chǔ)設(shè)施上游基礎(chǔ)設(shè)施層服務(wù)14?2022.12iResearchInc.智能語音轉(zhuǎn)寫的發(fā)展驅(qū)力(1/5)寫可化解人工成本走高與質(zhì)量要求提升的發(fā)展矛盾據(jù),2020年中國租賃和商務(wù)服務(wù)業(yè)城鎮(zhèn)單位就業(yè)人員平均工資已達到92924元,相比十年前漲幅已達到1.35倍。人工轉(zhuǎn)2010-2020年中國租賃和商務(wù)服務(wù)業(yè)城鎮(zhèn)單位就業(yè)人員平均工資情況18.7%13.2%17.6%7.3%8.0%5.9%6.0%4.6%3.6%5.4%851478819092924724897678281393625386713146976531623956620102011201220132014201520162017201820192020租賃和商務(wù)服務(wù)業(yè)城鎮(zhèn)單位就業(yè)人員平均工資(元)平均工資增長率(%)來源:國家統(tǒng)計局,艾瑞研究院自主研究繪制。?2022.12iResearchInc.15智能語音轉(zhuǎn)寫的發(fā)展驅(qū)力(2/5)同在線辦公常態(tài)化,助力轉(zhuǎn)寫功能實現(xiàn)更多用戶觸達2022年月中國在線辦公用戶規(guī)模已躍升至4.7億,相比2020年6月增長幅度高達131.4%。如今疫情仍在延宕反復(fù),隨著2018年6月-2022年6月中國在線辦公用戶規(guī)模及使用率45.4%445.4%37.7%34.9%21.2%2.02020.62020.122021.62021.122022.6用戶規(guī)模(億人)使用率(%)來源:中國互聯(lián)網(wǎng)絡(luò)發(fā)展統(tǒng)計報告,艾瑞研究院自主研究繪制。?2022.12iResearchInc.辦公場景對智能轉(zhuǎn)寫產(chǎn)品的需求分析??相較傳統(tǒng)需要錄音筆與錄音應(yīng)用的場景,協(xié)同在線辦公平臺及會議應(yīng)用讓轉(zhuǎn)寫功能觸達到更多辦公人群,應(yīng)用滲透率進一步提升。硬件錄音e.g.錄音筆ü需要硬件設(shè)備專業(yè)辦公人士,高頻錄音場景,對會議轉(zhuǎn)寫有強件設(shè)備提供在線/離線轉(zhuǎn)寫服務(wù)。錄音應(yīng)用e.g.語音備忘錄ü需要額外錄音通過手機或電腦的錄音軟件錄音,隨后將錄音文會議應(yīng)用e.g.騰訊會議、訊飛聽見ü會議APP提供遠程會議平臺,通過會議APP錄制音視頻,為轉(zhuǎn)寫產(chǎn)品提供直接功能切入點。來源:艾瑞研究院自主研究繪制。?2022.12iResearchInc.162018.62018.122019.62020.32020.62020.122021.62021.122022.6智能語音轉(zhuǎn)寫的發(fā)展驅(qū)力(2018.62018.122019.62020.32020.62020.122021.62021.122022.6間進一步提升用戶對整體網(wǎng)絡(luò)視頻領(lǐng)域的關(guān)注度與滲透率。如今網(wǎng)絡(luò)視頻已然成為人們生活娛樂、了解信息的重要組成形式。2022年6月,中國網(wǎng)絡(luò)視頻用戶規(guī)模已經(jīng)達到9.9億人,占全部網(wǎng)民的94.6%。作。2018年6月-2022年6月中國網(wǎng)絡(luò)視頻(含短視頻)用戶規(guī)模及使用率94.1%94.5%93.7%93.4%94.5%94.6%888.7%88.8%87.5%用戶規(guī)模(億人)使用率(%)來源:中國互聯(lián)網(wǎng)絡(luò)發(fā)展統(tǒng)計報告,艾瑞研究院自主研究繪制。?2022.12iResearchInc.網(wǎng)絡(luò)視頻對智能轉(zhuǎn)寫產(chǎn)品的需求分析自媒體自媒體多語種轉(zhuǎn)寫,智能切分時間軸。生成帶時間戳,支持在線提升自媒體的字幕配置效率。為為外語視頻提供轉(zhuǎn)寫及翻譯服務(wù),可根據(jù)需要配置專業(yè)翻譯團隊,實現(xiàn)高效人機耦合,完成多語種的作及翻譯需求。長視頻編輯長視頻編輯語音內(nèi)容監(jiān)控服務(wù)于長視頻編輯工作者,片等,長視頻的語音轉(zhuǎn)寫更強調(diào)上下文,對語音技出更高要求。實時轉(zhuǎn)寫可實時識別直播內(nèi)容風險,并給出及時警告提示;非實時轉(zhuǎn)寫可對平臺內(nèi)容進行進一步甄別來源:中國互聯(lián)網(wǎng)絡(luò)發(fā)展統(tǒng)計報告,艾瑞研究院自主研究繪制。?2022.12iResearchInc.智能語音轉(zhuǎn)寫的市場環(huán)境(4/5)在2020年以前,會展行業(yè)多在線下舉行。面對國際語言的交流環(huán)境,會展行業(yè)的字幕轉(zhuǎn)寫產(chǎn)品大多采用線下人機耦合的而在疫情多點散發(fā)的情況下,會展活動的舉辦面臨很多不確定性因素。根據(jù)中國會展主辦機構(gòu)數(shù)字化調(diào)研報告顯示,2021年,疫情導(dǎo)致各類會展活動取消、延期、異地舉辦,會展活動選擇線上線下相結(jié)合模式舉辦成為常態(tài)。字幕轉(zhuǎn)寫產(chǎn)品形態(tài)也由原來線下的人機耦合形式逐漸傾向于線上SaaS服務(wù)形式,并可配合線上人工智能服務(wù)團隊或翻譯團隊提供實SaaS品滿足個人國際參會、實時翻譯的會展需求。2021年中國會展主辦機構(gòu)調(diào)研主要數(shù)據(jù)u數(shù)字化轉(zhuǎn)型態(tài)度超過90%的機構(gòu)對數(shù)字化轉(zhuǎn)型呈積極與樂觀態(tài)度,該比例相較于2020年提升6個百分點。u數(shù)字化收入占比根據(jù)調(diào)研顯示,超過60%的會展機構(gòu)能獲得各位數(shù)字化收入。但數(shù)字化收入占比有待提升。u數(shù)字化轉(zhuǎn)型方向31.3%的機構(gòu)認為數(shù)字化轉(zhuǎn)型是大方向,超過50%的機構(gòu)已經(jīng)開始數(shù)字化轉(zhuǎn)型嘗試。u雙線融合辦展趨勢根據(jù)調(diào)研顯示,近70%的主辦機構(gòu)選擇雙線融合辦展的方式,線上線下結(jié)合已成為會展常態(tài)。注釋:N=195。來源:《DRCEO:中國會展主辦機構(gòu)數(shù)字化調(diào)研2022》,艾瑞咨詢研究院整理及繪制。?2022.12iResearchInc.2021年中國會展主辦機構(gòu)辦展辦會方式線上會展成為線下舉辦的延伸助力,線上+線下呈現(xiàn)深度融合的發(fā)展趨勢73274901201020832261218純線下舉辦純線上舉辦線上+線下相結(jié)合舉辦1-3場(個)1-3場(個)6-10場(個)10場以上(個)以上均沒有舉辦(個)注釋:N=195以上均沒有舉辦(個)DRCEO,艾瑞咨詢研究院整理及繪制。?2022.12iResearchInc.智能語音轉(zhuǎn)寫的市場環(huán)境(5/5)解決出海生態(tài)下的復(fù)合型翻譯人才需求2016-2021年中國對外直接投資凈額12.3%16.3%-19.3%-9.6%-4.3%1788.21537.11582.91537.11369.111369.120172018201920202021中國對外直接投資凈額(億美元)增長率(%)來源:商務(wù)部、國家統(tǒng)計局和國家外匯管理局,艾瑞研究院繪制。?2022.12iResearchInc.2021年中國復(fù)合型翻譯人才需求情況類來源:中國翻譯協(xié)會《2022中國翻譯人才發(fā)展報告》,艾瑞研究院繪制。?2022.12iResearchInc.智能語音轉(zhuǎn)寫的行業(yè)規(guī)模持續(xù)注入,預(yù)計2026年市場規(guī)模達38億戶接受度日益成熟。據(jù)艾瑞研究院統(tǒng)計2021-2026年中國智能轉(zhuǎn)寫行業(yè)規(guī)模32.9%31.1%331.1%29.9%28.3%2292220212022e2023e2024e2025e2026e智能轉(zhuǎn)寫行業(yè)規(guī)模(億元)智能轉(zhuǎn)寫行業(yè)規(guī)模增長率(%)來源:艾瑞研究院根據(jù)桌研與專家訪談自主建模測算。?2022.12iResearchInc.20?2022.12iResearchInc.21智能語音轉(zhuǎn)寫的參與者類型需要。以細分領(lǐng)域切入?傳統(tǒng)轉(zhuǎn)寫或翻譯服務(wù)商,持續(xù)積累垂直轉(zhuǎn)寫需求客群,順應(yīng)智能轉(zhuǎn)寫技術(shù)發(fā)展,切入細分領(lǐng)域,提供人機耦合的優(yōu)化產(chǎn)品服務(wù)。?廠商代表:網(wǎng)易見外、迅捷語音以產(chǎn)品生態(tài)切入?依附公司產(chǎn)品生態(tài),見長于平臺化能力,在辦公、泛娛樂、教育等場景搭配軟硬件產(chǎn)品輸出轉(zhuǎn)寫能力,一般分為對內(nèi)與對外服務(wù)?廠商代表:阿里云、騰訊云、百度云、火山引擎來源:艾瑞研究院自主研究繪制。智能語音轉(zhuǎn)寫參與者類型分析專業(yè)轉(zhuǎn)寫/翻譯廠商語音技術(shù)廠商云服務(wù)廠商以語音技術(shù)切入?強于語音識別能力,為客戶提供語音轉(zhuǎn)寫接口、SaaS產(chǎn)品及全套解決方案等多樣化轉(zhuǎn)寫產(chǎn)品形式。?除軟件服務(wù)外,硬件設(shè)備是觸達用戶的核心端口,部分語音技術(shù)廠商選擇從AIoT領(lǐng)域切入,依托于智能耳機、智能錄音筆、智慧屏等智能硬件產(chǎn)品進一步開拓轉(zhuǎn)寫應(yīng)用場景?廠商代表:科大訊飛、搜狗部署解決方案智能語音轉(zhuǎn)寫的產(chǎn)品形態(tài)部署解決方案SaaS及本地化部署解決方案,均可結(jié)合智能硬件智能語音轉(zhuǎn)寫服務(wù)的產(chǎn)品形態(tài)主要包括SaaS類產(chǎn)品與本地化部署解決方案兩大類。以SaaS類產(chǎn)品為主,其核心是提供云端語音識別及轉(zhuǎn)寫服務(wù),根據(jù)客戶分類與應(yīng)用情景差異,包括輕量級的網(wǎng)頁版/APP/PC/小程序產(chǎn)品和提供給B/G端客戶的API開發(fā)接口。SaaS類產(chǎn)品的主要特點是價格相對便宜、便捷度較高;而本地化部署的解決方案主要是為了滿足客戶的智能語音轉(zhuǎn)寫產(chǎn)品形態(tài)提供封裝語音轉(zhuǎn)寫能力的API接口。下游應(yīng)用開提供封裝語音轉(zhuǎn)寫能力的API接口。下游應(yīng)用開音筆等智能終端廠商可進行集成等語音采集硬件為依托,調(diào)用云端語音識別及轉(zhuǎn)寫能力語音識別及轉(zhuǎn)寫服務(wù),主要服務(wù)于C端客戶或企業(yè)賬戶,企業(yè)賬戶或具備空間管理、協(xié)同編輯等增值服務(wù)。通過行業(yè)詞庫和模型優(yōu)化,產(chǎn)品可滿足傳媒、教培、金融、客服等多場景應(yīng)用需求通過硬件內(nèi)置芯片與本地詞庫,提提供單機版軟件/私有化部署通過硬件內(nèi)置芯片與本地詞庫,提供本地/離線轉(zhuǎn)寫服務(wù)。滿足對數(shù)供本地/離線轉(zhuǎn)寫服務(wù)。滿足對數(shù)據(jù)及網(wǎng)絡(luò)安全、便捷性及移動辦公等需求。移動端轉(zhuǎn)寫能力與實用性的提升,擴充轉(zhuǎn)寫功能的適用范圍需求與安全隱私需求,但部署成本高,主要面向?qū)?shù)據(jù)安全需求較高的大型企業(yè)或公檢法、廣電傳媒等政府客戶來源:艾瑞研究院根據(jù)公開資料自主研究繪制。?利用麥克風陣列,通過聲學技術(shù)保障拾音效果,以提升語音采集精準度。軟硬一體形式提升轉(zhuǎn)寫質(zhì)量及效率,并滿足會議、訪談等多類型需求場景?豐富消費級智能硬件產(chǎn)品形態(tài),提高收增長?2022.12iResearchInc.22智能語音轉(zhuǎn)寫產(chǎn)品的收費模式與用戶畫像SaaS類產(chǎn)品單筆訂單單筆付費按照時長和并智能語音轉(zhuǎn)寫產(chǎn)品的收費模式與用戶畫像SaaS類產(chǎn)品單筆訂單單筆付費按照時長和并發(fā)計費儲值卡(時長)一次性license按月/年訂閱制免費應(yīng)用后向廣告收費硬件付費+軟件服務(wù)免費個人用戶畫像:主要是學生、媒體工作者、IT/金融辦公人群等。主要來自于一二線城市的知識密集型行業(yè)。其中PC端使用者多為有強辦公需求的企事業(yè)單位用戶,更重電腦音頻編輯企業(yè)賬戶畫像:主要集中于影視劇后期、教培機構(gòu)等豐富的下游場景應(yīng)用客戶賦能下游手機、錄音設(shè)備等硬件廠商免費使用轉(zhuǎn)寫、翻譯等語言服務(wù)企業(yè)賬戶基礎(chǔ)收費模式同上,開通空間管理、協(xié)同編輯等增值服務(wù)集行業(yè)用戶的辦公效率提升利器,下游客戶類型豐富的邊際成本極低。這既給SaaS廠商帶來了相當可觀的邊際利潤,也讓廠商在面對同類競爭時得以在價格上做出更多讓步。速做大用戶量。后期營收增長依賴滿足準確率與實時率下的剛需客戶續(xù)費率、深耕多樣化場景以拓寬潛在客戶市場、軟硬2)本地部署解決方案可滿足政企客戶的定制化與安全隱私需求。但部署成本高,項目制報價形式涵蓋軟件服務(wù)、實施與本本地部署解決方案單機版軟件費用私私有化部署費用運維費用運維費用硬件設(shè)備費硬件設(shè)備費用用戶畫像:主要面向政府、高校及大型企業(yè)??蛻粜枰D(zhuǎn)寫功能的對接與嵌入,對于數(shù)據(jù)安全、可拓展、靈活性要求更高,包括對需求響應(yīng)的及時程度等來源:艾瑞研究院根據(jù)公開資料自主研究繪制。?2022.12iResearchInc.www?2022.12iResearchInc.?2022.12iResearchInc.24智能語音轉(zhuǎn)寫SaaS產(chǎn)品分析按需使用、快速響應(yīng)及多場景優(yōu)化APP出等操作。語音轉(zhuǎn)寫服務(wù)云計算技術(shù)發(fā)展,目前云端算力和網(wǎng)絡(luò)環(huán)境比較穩(wěn)定,SaaS轉(zhuǎn)寫產(chǎn)品的轉(zhuǎn)寫準確率和效率與私有化部署解決方案的用戶不是特別顯著。高便捷性、較低成本等優(yōu)勢使語音轉(zhuǎn)寫SaaS產(chǎn)品擁有龐大的終端消費群體。SaaS音筆、智能會議系統(tǒng)等各類硬件設(shè)備中。API轉(zhuǎn)寫引擎可支持遠程會議、線上會展、電商直播、短視頻、在線課堂等軟件應(yīng)用的智能語音轉(zhuǎn)寫SaaS智能語音轉(zhuǎn)寫SaaS產(chǎn)品特點絡(luò)提供服務(wù),用戶可多設(shè)備、多響應(yīng)響應(yīng)景需求模型及時迭代更新用、成本較低用、成本較低或根據(jù)調(diào)發(fā)量訂閱付費來源:艾瑞研究院根據(jù)公開資料自主研究繪制。用場景的客戶轉(zhuǎn)寫需求。可應(yīng)用于輕聲傳譯等領(lǐng)域智能語音轉(zhuǎn)寫SaaS產(chǎn)品發(fā)展環(huán)境捷應(yīng)用語音轉(zhuǎn)寫服務(wù)智能語音轉(zhuǎn)寫SaaS產(chǎn)品的普及推廣離不開我國云計算基礎(chǔ)設(shè)施的建設(shè)和技術(shù)成熟以及企業(yè)數(shù)字化轉(zhuǎn)型趨勢。我國云服務(wù)2016-2025年中國整體云服務(wù)市場規(guī)模及增速57.1%48.1%39.9%45.4%42.8%40.2%32.1%33.2%32.8%30.6%692256161210262016201720182019202020212022e2023e2024e2025e整體云服務(wù)市場規(guī)模(億元)整體云服務(wù)市場增速(%)來源:艾瑞咨詢研究院自主研究推算及繪制。?2022.12iResearchInc.2017-2019年中國企業(yè)云計算使用率58.658.6%66.1%41.4%33.9%45.3%54.7%201720182019沒有云計算應(yīng)用(%)有云計算應(yīng)用(%)來源:中國信通院來源:信通院《2020年云計算發(fā)展白皮書》,艾瑞咨詢研究院自主研究及繪制。?2022.12iResearchInc.智能語音轉(zhuǎn)寫SaaS產(chǎn)品競爭要素效率、產(chǎn)品豐富度是核心要素綜合賽道特征,艾瑞咨詢評估智能語音轉(zhuǎn)寫SaaS產(chǎn)品競爭要素包含:轉(zhuǎn)寫準確度與效率、產(chǎn)品豐富度、品牌影響力、價智能語音轉(zhuǎn)寫SaaS產(chǎn)品競爭要素品牌影響力價格優(yōu)勢L1LL1L2L3競爭競爭要素產(chǎn)品豐富度用戶體量與生態(tài)發(fā)展?jié)摿Υ_度與效率和產(chǎn)品豐富度為滿足各類用戶需求的核心要素來源:艾瑞研究院根據(jù)公開資料自主研究繪制。 轉(zhuǎn)寫準確度與效率 產(chǎn)品豐富度 品牌影響力價價格優(yōu)勢 用戶體量與生態(tài)發(fā)發(fā)展?jié)摿υu價產(chǎn)品功能水平的直接指標。除核心的語音識別準確率外,上下文糾正、語氣詞過濾、角色分離、等智能化功能可提高轉(zhuǎn)寫服務(wù)準確度指該產(chǎn)品支持應(yīng)用場景(會議、會展、同傳、字幕等)、行業(yè)領(lǐng)域(金融、教育、零售、客服等)、產(chǎn)品形態(tài)(網(wǎng)頁、APP、API/SDK調(diào)用、智能硬件等)的覆蓋情況核心評價維度來源于廠商端及用戶端對品牌的直接認可指不同收費模式下的產(chǎn)品單位價格;C端消費者相敏感度高指該品牌產(chǎn)品的內(nèi)/外部調(diào)用量和下游用戶類型廣度 (消費者、企業(yè)級、政府客戶等)指該品牌產(chǎn)品的未來市場空間?;谄浼夹g(shù)實力、能力、服務(wù)水平及發(fā)展戰(zhàn)略綜合評估?2022.12iResearchInc.26具有一定的品牌影響力,或深C推廣具有一定的品牌影響力,或深C推廣,或依托品牌自有用戶生態(tài),或依托下游開發(fā)者生態(tài)推廣相關(guān)業(yè)務(wù)。具備一定生態(tài)優(yōu)勢,但在多語種、方言等場景下的轉(zhuǎn)寫準確率可做進一步提升。,客戶市場份額較小。擁有一定價格優(yōu)也均積極在轉(zhuǎn)寫的各細分專業(yè)領(lǐng)域、云端及本地化服務(wù)形式、附加產(chǎn)品形態(tài)與產(chǎn)品生態(tài)多角度進行差異化深耕。根據(jù)六大競爭要素,艾瑞咨詢將市場上提供智能語音轉(zhuǎn)寫SaaS服務(wù)的廠商分為三個梯隊,其中語音技術(shù)廠商訊飛聽見和搜狗聽寫梯隊。訊飛聽見在轉(zhuǎn)寫準確度尤其是針對小語種和方言等、產(chǎn)品豐富度、品牌影響力、發(fā)展?jié)摿S度拔得頭籌。智能語音轉(zhuǎn)寫SaaS產(chǎn)品競爭格局爭維度優(yōu)勢明顯爭維度優(yōu)勢明顯一梯隊二梯隊二梯隊三梯隊來源:艾瑞研究院根據(jù)公開資料自主研究繪制。品牌影響力價格優(yōu)勢度與效率產(chǎn)品豐富度用戶體量與生態(tài)發(fā)展?jié)摿τ嵱嶏w聽見在轉(zhuǎn)寫準確度、產(chǎn)品豐富度、品牌影響力、發(fā)展?jié)摿S度拔得頭籌。?2022.12iResearchInc.27私有化部署形式固定會場的服務(wù)器部署辦公專網(wǎng)提供的私有云數(shù)據(jù)保密安全需求定制化語料訓(xùn)練線私有化部署形式固定會場的服務(wù)器部署辦公專網(wǎng)提供的私有云數(shù)據(jù)保密安全需求定制化語料訓(xùn)練線下軟硬一體產(chǎn)品架構(gòu)自主支持離線轉(zhuǎn)寫場景軟硬一體的一站式方案為滿足大型企業(yè)及政府客戶對安全性和定制化的需求,智能語音轉(zhuǎn)寫SaaS廠商升級產(chǎn)品和服務(wù),提供私有化部署形式和硬一體的產(chǎn)品解決方案。)本地部署的純軟件解決方案與SaaS產(chǎn)品的功能類似,但私有化部署的獨立服務(wù)器形式可保證客戶對數(shù)據(jù)保密的安全性2)為了滿足政企大客戶的會議室、展會、傳媒編輯等線下場景的智慧辦公需求,軟硬一體的語音轉(zhuǎn)寫解決方案可打包提智能語音轉(zhuǎn)寫本地部署解決方案特點會議系統(tǒng)智慧屏移動辦公的離線單機版產(chǎn)會議系統(tǒng)智慧屏來源:艾瑞研究院根據(jù)公開資料自主研究繪制。?規(guī)模效益與高毛利:SaaS產(chǎn)品利用率更高、單位成本降低。?規(guī)模效益與高毛利:SaaS產(chǎn)品利用率更高、單位成本降低。輕量化的輸出模式可以持續(xù)低成本、短賬期促進營收增長?平臺效應(yīng):聚合合作伙伴,擴大影響力并實現(xiàn)語音轉(zhuǎn)寫技術(shù)?保持活性:構(gòu)建動態(tài)更新的產(chǎn)品服務(wù)池,利用偏C端活性帶動B、G端需求,拓寬企業(yè)級客垂類解決方案API產(chǎn)業(yè)活力與不設(shè)限空間核心競爭力深度業(yè)務(wù)飛輪廣度API案共拓產(chǎn)業(yè)廣度與深度伸出了錄音筆等智能硬件、協(xié)同辦公會議應(yīng)用、提取長時語音信息有效內(nèi)容等多條增量建設(shè)與運營需求業(yè)務(wù)線。API經(jīng)濟智能語音轉(zhuǎn)寫產(chǎn)業(yè)的飛輪模型筆、智慧屏、智慧會議系統(tǒng)等入口級智能硬件可延伸出多條提供想象空間場景Know-How反哺技術(shù)研發(fā),形成良性閉環(huán)來源:艾瑞研究院根據(jù)公開資料自主研究繪制。?2022.12iResearchInc.29智能語音轉(zhuǎn)寫行智能語音轉(zhuǎn)寫行業(yè)——發(fā)展背景篇1智能語音轉(zhuǎn)寫行業(yè)——智能語音轉(zhuǎn)寫行業(yè)——市場分析篇2智能語音轉(zhuǎn)智能語音轉(zhuǎn)寫行業(yè)典型企業(yè)案例3智能語音轉(zhuǎn)寫行智能語音轉(zhuǎn)寫行業(yè)——發(fā)展趨勢篇45?2022.12iResearchInc.31智慧屏錄音筆訊飛聽見智能會議系統(tǒng)訊飛聽見翻譯訊飛聽見會議訊飛聽見媒體解決方案訊飛聽見同傳訊飛聽見(轉(zhuǎn)寫)訊飛聽見智慧屏錄音筆訊飛聽見智能會議系統(tǒng)訊飛聽見翻譯訊飛聽見會議訊飛聽見媒體解決方案訊飛聽見同傳訊飛聽見(轉(zhuǎn)寫)科大訊飛成立于1999年,是亞太地區(qū)知名的智能語音與人工智能上市企業(yè),訊飛聽見是科大訊飛旗下主打“AI+辦公”訊飛聽見轉(zhuǎn)寫產(chǎn)品線,在會議紀要整理、遠程視頻會議、。多終端服務(wù)(PC/Web/APP/小程序)AI智能處理軟硬件協(xié)同場景化服務(wù)多領(lǐng)域詞庫媒服務(wù)?提供“采編播審存”一整套流程的產(chǎn)品;為長短視頻剪輯工作者提供字幕轉(zhuǎn)寫產(chǎn)品;為會展行業(yè)提供線下一體機、線上SaaS服務(wù)的同傳服務(wù);基于轉(zhuǎn)寫服務(wù)為會展傳媒行業(yè)打造可持續(xù)的AI應(yīng)用生態(tài)圈。人機耦合時間碼自動匹配多語種字幕訊訊飛聽見字幕品智能硬件,無縫連接訊飛聽見網(wǎng)站、App、客戶端,公記錄效率。專業(yè)級錄音實時同步編輯免費轉(zhuǎn)寫服務(wù)麥克麥克風決方案?以語音識別、機器翻譯、語義理解、OCR識別等能力為基礎(chǔ),萃取“非結(jié)構(gòu)化數(shù)據(jù)”,拓展數(shù)據(jù)維度,構(gòu)建知識管理體系,輔助高效決策。為政府、企業(yè)用戶打造貫、會中、會后的智慧辦公解決方案。軟硬件一體化開發(fā)接口支持公有云和私有化部署軟硬件一體化開發(fā)接口訊訊飛聽見智慧辦公室解決方案來源:艾瑞研究院根據(jù)公開資料、公司官網(wǎng)自主研究繪制。行業(yè)生態(tài)伙伴私有化轉(zhuǎn)寫翻譯服務(wù)?公益行動??AI行業(yè)生態(tài)伙伴私有化轉(zhuǎn)寫翻譯服務(wù)?公益行動??AI。訊飛聽見轉(zhuǎn)寫業(yè)務(wù)優(yōu)勢例例轉(zhuǎn)寫精準語種豐富會議紀要轉(zhuǎn)寫精準語種豐富會議紀要智能化場景智能化場景化隱私安全全鏈路多終端產(chǎn)品,客戶類型多元蓋職場個人、政府企業(yè)、文化傳媒等。同時搭建語音全鏈路多終端產(chǎn)品,客戶類型多元來源:艾瑞研究院根據(jù)公開資料、公司官網(wǎng)自主研究繪制。?2022.12iResearchInc.33企業(yè)級穩(wěn)定服務(wù)保障,專有集群,大流量并發(fā),高效靈活,可快速返回識別結(jié)果確率抖音、飛書剪企業(yè)級穩(wěn)定服務(wù)保障,專有集群,大流量并發(fā),高效靈活,可快速返回識別結(jié)果確率抖音、飛書剪映、西瓜視頻等業(yè)務(wù)深度合作,具備實業(yè)務(wù)場景打磨的豐富經(jīng)驗,確保準確率、際廣泛應(yīng)用于泛娛樂、辦公、教育、客服場、景,火山引擎語音轉(zhuǎn)寫服務(wù)特點與主要客戶智定種豐富及地區(qū)方言的識別來源:艾瑞根據(jù)公開資料研究繪制。支持中、英靈云聽語支持中、英語音轉(zhuǎn)文字為核心的云服務(wù)平臺靈云聽語語音轉(zhuǎn)寫功能介紹多種音頻格式mpmp3/wav/m4a/amr/mp4/flv/mov/avi格式語音識別速度快實實時轉(zhuǎn)寫響應(yīng)速度快至500毫秒;非實時轉(zhuǎn)寫1小時音頻文件只需5-10分鐘、、方言識別和中、英、數(shù)字混合輸入超大容量 單條大小不超過5G,時長小于3小時轉(zhuǎn)寫服務(wù)覆蓋13種專業(yè)領(lǐng)域理天電話客服教育學習金融財經(jīng)理天哲學思想廣播電臺企業(yè)辦公旅游景點網(wǎng)課教學醫(yī)療健康國學歷史來源:艾瑞根據(jù)公開資料研究繪制。?2022.12iResearchInc.34?2022.12iResearchInc.35錄音轉(zhuǎn)文字助手要面向各行業(yè)C用戶。錄音轉(zhuǎn)文字助手業(yè)務(wù)布局與轉(zhuǎn)寫專業(yè)領(lǐng)域翻譯提供簡體中文、的互譯服務(wù),支持中英文實時對話翻譯文字轉(zhuǎn)語音高辨識度的語音合成功能,模擬真人發(fā)聲,讓文字信息變得繪“聲”繪色。如廣告叫賣、專題宣傳、課件培訓(xùn)、方言配音、英語配音等??梢宰远x主播參數(shù)的設(shè)置,如音量、語速、語調(diào),來調(diào)節(jié)達到更適合使用場景的發(fā)音錄音轉(zhuǎn)文字快速轉(zhuǎn)換文

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論