2022年5G行業(yè)之新通話技術與業(yè)務創(chuàng)新研究報告_第1頁
2022年5G行業(yè)之新通話技術與業(yè)務創(chuàng)新研究報告_第2頁
2022年5G行業(yè)之新通話技術與業(yè)務創(chuàng)新研究報告_第3頁
2022年5G行業(yè)之新通話技術與業(yè)務創(chuàng)新研究報告_第4頁
2022年5G行業(yè)之新通話技術與業(yè)務創(chuàng)新研究報告_第5頁
已閱讀5頁,還剩26頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

2022年5G行業(yè)之新通話技術與業(yè)務創(chuàng)新研究報告

一、5G創(chuàng)造話音新價值,從VoLTE到5G新通話

(一)用戶需求不斷升級,通話業(yè)務亟需革新

回顧實時通信業(yè)務發(fā)展的歷程,移動通信以用戶體驗為中心持續(xù)升級和演進,促使通信業(yè)務向著商業(yè)價值高、市場空間廣的方向革新,并不斷激發(fā)公眾用戶市場和行業(yè)用戶市場活力。語音通話業(yè)務作為運營商最具生命力的基礎性業(yè)務,滿足著全球70億人與人之間的溝通需求,極大的降低了社會總成本。圍繞語音業(yè)務前中后的能力提升,一直是運營商不斷創(chuàng)新的土壤,音視頻彩鈴、通話助手、短信提示等豐富的增值服務,持續(xù)為基礎業(yè)務提供創(chuàng)新發(fā)展空間,豐富了用戶通話體驗。

隨著“互聯(lián)網(wǎng)+”產(chǎn)業(yè)轉型升級熱潮席卷而來,互聯(lián)網(wǎng)行業(yè)發(fā)展速度迅速超過通信行業(yè)發(fā)展速度,借助互聯(lián)網(wǎng)思維方式開展通信能力創(chuàng)新成為行業(yè)共識。在傳統(tǒng)電信發(fā)展模式向互聯(lián)網(wǎng)思維方式學習的過程之中,短消息業(yè)務與互聯(lián)網(wǎng)思維催生出了5G消息這種新型電信業(yè)務,為多年以公眾所習慣的消息服務注入了新的發(fā)展動力,為運營企業(yè)與相關產(chǎn)業(yè)鏈企業(yè)提供了巨大的想象空間。

相對應的,原生的通話形態(tài)和業(yè)務能力二十余年一直未能有顯著變化,通話創(chuàng)新一直圍繞業(yè)務質(zhì)量與應用模式創(chuàng)新展開,通話基礎功能創(chuàng)新有所欠缺,公眾和企業(yè)用戶對語音通話業(yè)務能力的需求不能在通信網(wǎng)內(nèi)得以實現(xiàn),促使用戶使用互聯(lián)網(wǎng)與電信網(wǎng)融合的通信工具。但是,融合通信工具降低了電信業(yè)務的高安全、廣觸達能力,公眾和企業(yè)用戶對通話能力有著更高的需求。伴隨著5G時代的到來,打造通道更安全、能力更全面的通話工具,為廣大手機用戶帶來全新的業(yè)務體驗,為相關產(chǎn)業(yè)開拓寶貴發(fā)展空間的創(chuàng)新發(fā)展機遇已經(jīng)成熟。

(二)5G引領創(chuàng)新,為新實時通信業(yè)務打造升級空間

據(jù)工信部數(shù)據(jù)統(tǒng)計,截至目前,我國已建成了全球規(guī)模最大、技術最先進的5GSA網(wǎng)絡,全國所有地市一級、所有縣城城區(qū)以及92%的鄉(xiāng)鎮(zhèn)鎮(zhèn)區(qū)已實現(xiàn)5G網(wǎng)絡覆蓋。良好的網(wǎng)絡覆蓋、高速可靠的服務質(zhì)量,為5G時代業(yè)務創(chuàng)新提供了穩(wěn)固的基礎設施。隨著5G用戶終端的不斷普及和公眾使用通信互聯(lián)網(wǎng)融合業(yè)務習慣的形成,更高效、更快捷、更具互動性的通信創(chuàng)新發(fā)展障礙,已基本清除,開展業(yè)務能力創(chuàng)新正逢其時。

為了滿足用戶對安全和覆蓋的迫切需求,新通話業(yè)務仍需充分發(fā)揮運營商優(yōu)勢,在安全能力、溝通范圍上繼承傳統(tǒng)實時音視頻通信的內(nèi)涵,在用戶體驗、能力提升上借鑒互聯(lián)網(wǎng)應用的經(jīng)驗,在應用場景、服務品質(zhì)上開拓實時音視頻通信的外延,為行業(yè)客戶打造可靠、開放、普惠的新通話業(yè)務。

首先,語音通話業(yè)務作為運營商的基礎通信業(yè)務具備電信級99.999%的業(yè)務可靠性和安全保障機制。借助運營商網(wǎng)絡的全覆蓋和用戶全覆蓋,新通話業(yè)務將使能企業(yè)服務到達“最后一公里”,100%觸達用戶,致力于成為消除二元結構社會數(shù)字鴻溝的普適性通信基礎設施。其次,新通話業(yè)務將摒棄互聯(lián)網(wǎng)企業(yè)私域流量限制和歧視,構建真正開放、公正的流量平臺,任何體系的企業(yè)和商家都能夠以通話平臺為流量入口提供服務。

在用戶體驗層面,新通話業(yè)務將突破聽覺和視覺一維、二維的限制,致力于通過通話入口融合AR/VR、全息等5G應用,遠期將增加觸覺等交互式和三維沉浸式的新體驗。在溝通范圍層面,面向數(shù)字化轉型和萬物智聯(lián)時代,新通話業(yè)務將打破人與人之間的連接限制,延伸到更為廣闊的人與物、物與物之間的溝通。在業(yè)務層面,5G新通話業(yè)務將以ToB端作為突破口,瞄準的市場從個人市場發(fā)展為個人與企業(yè)市場并重,依托價值創(chuàng)造促進商業(yè)模式的創(chuàng)新,為垂直行業(yè)挖掘更大的市場和商業(yè)潛能。

(三)探索話音新價值,賦能數(shù)字新經(jīng)濟

新通話是運營商對基礎通信能力的重新賦能,通過在當前通話通道的基礎上疊加數(shù)據(jù)通道來增強現(xiàn)有通話的業(yè)務體驗,挖掘通話業(yè)務新的服務模式和應用價值,建立一個更加全面、智能的通話提供方案。與傳統(tǒng)的音視頻通話相比,5G新通話在產(chǎn)品設計、用戶體驗、服務模式方面進行了全面升級。在產(chǎn)品設計上,5G新通話基于手機碼號,(三)探索話音新價值,賦能數(shù)字新經(jīng)濟新通話是運營商對基礎通信能力的重新賦能,通過在當前通話通道的基礎上疊加數(shù)據(jù)通道來增強現(xiàn)有通話的業(yè)務體驗,挖掘通話業(yè)務新的服務模式和應用價值,建立一個更加全面、智能的通話提供方案。與傳統(tǒng)的音視頻通話相比,5G新通話在產(chǎn)品設計、用戶體驗、服務模式方面進行了全面升級。在產(chǎn)品設計上,5G新通話基于手機碼號,

5G新通話作為面向公眾用戶和行業(yè)用戶的5G特色應用,將圍繞“科技向善”的目標,為全球數(shù)十億用戶帶來平等享受5G技術和數(shù)字服務的紅利。讓用戶充分享受智能化服務帶來的便利的同時,也為行業(yè)數(shù)字化轉型帶來新模式,為數(shù)字經(jīng)濟發(fā)展注入新動能,賦能“安全、普惠”數(shù)字新經(jīng)濟。

對于普通消費者而言,5G新通話業(yè)務支持原生應用的音視頻、定位、文件等多媒體信息交互,開啟全新的溝通樂趣,不斷拉近人與人之間的距離,使用戶能夠切實感受到5G的獨特價值。同時,消費者無需下載APP也可享受企業(yè)服務、獲得富媒體體驗,滿足當下人們對應用輕量化的需求。

對于垂直行業(yè)而言,當前社交網(wǎng)絡、電子商店和娛樂等領域的主流APP應用已經(jīng)占據(jù)了用戶的手機和入口,形成了一定程度的壟斷,大幅提高了行業(yè)門檻及獲客成本。然而5G新通話將為垂直行業(yè)開拓全新機遇,提供一個開放、安全的新渠道以更加便捷地開展自身業(yè)務,成為用戶認可的高流量服務入口。無需用戶關注、訂閱或下載,企業(yè)便可根據(jù)手機號碼對用戶主動觸達、提供在線服務場景、提高產(chǎn)業(yè)效率及快速的商業(yè)閉環(huán),完成業(yè)務的數(shù)字化升級。

業(yè)務能力和用戶體驗的升級對實時音視頻網(wǎng)絡的能力提出了全新的要求。端到端QoS策略控制需要針對不同數(shù)據(jù)業(yè)務定制差異化方案;同時,由于增加了新的接入方式和數(shù)據(jù)交互,則需要針對整個通信流程提供包括接入安全、傳輸安全、信令安全在內(nèi)的端到端安全機制。值得一提的是,對于帶寬、時延、可靠性、服務質(zhì)量等能力的升級只有基于能夠提供確定性體驗保障的載體才能實現(xiàn),因而相對于盡力而為的互聯(lián)網(wǎng)應用服務(OverTheTop,OTT),運營商可充分發(fā)揮基礎通信業(yè)務安全可達和互聯(lián)互通優(yōu)勢,重塑自身生態(tài)價值鏈,為行業(yè)客戶和相關產(chǎn)業(yè)創(chuàng)造新的戰(zhàn)略價值和業(yè)務增長點,構筑產(chǎn)業(yè)互惠、多方共贏的5G時代通話新生態(tài)。

二、5G新通話技術方案

(一)5G新通話網(wǎng)絡架構

5G新通話的網(wǎng)絡架構,基于現(xiàn)有IMS架構進行升級,旨在支撐交互式多媒體業(yè)務的規(guī)模發(fā)展、支持行業(yè)/企業(yè)高效快捷安全地接入IMS網(wǎng)絡、并實現(xiàn)IMS網(wǎng)絡架構向服務化演進。應遵循如下原則:(1)兼容現(xiàn)有的IMS架構,基于IMS架構進行升級演進;(2)具備可擴展性,面向新技術的演進,可以方便地引入AR、AI等新技術和功能。

5G新通話網(wǎng)絡架構在3GPPTS26.114定義的IMS網(wǎng)絡架構的基礎上進行增強,引入了如下新網(wǎng)元功能,并通過服務化接口(ServiceBasedInterface,SBI)對外提供服務。(1)新通話平臺(NewCallingPlatform,簡稱NCP),提供數(shù)據(jù)通道、實時音視頻、實時AI、第三方認證等控制能力,并面向北向應用提供開放接口;(2)數(shù)據(jù)通道應用倉庫(DataChannelApplicationRepository,簡稱DCAR),存儲數(shù)據(jù)通道應用;(3)企業(yè)數(shù)據(jù)服務器(EnterpriseDataServer,簡稱EDS),用于支持企業(yè)及其企業(yè)所屬員工的實名認證及數(shù)據(jù)緩存;(4)統(tǒng)一媒體功能(UnifiedMediaFunction,簡稱UMF),將媒體面功能歸一并統(tǒng)一采用服務化接口,既支持傳統(tǒng)的音視頻媒體處理功能,也具有靈活的可擴展性,能夠支持未來新的媒體處理功能,例如沉浸式場景下的AR模型處理和媒體渲染功能。

除了新引入的網(wǎng)元功能,IMS網(wǎng)絡現(xiàn)有的網(wǎng)元也需要升級,以支持數(shù)據(jù)通道、第三方ID接入等新功能,實現(xiàn)5G新通話的各種新業(yè)務。

(二)5G新通話的網(wǎng)元和接口

5G新通話對IMS網(wǎng)絡現(xiàn)有網(wǎng)元和新引入網(wǎng)元的要求如下:

1.對傳統(tǒng)網(wǎng)元的要求

(1)MMTelAS:提供媒體事件訂閱/通知服務和IMS媒體控制服務;提供數(shù)據(jù)通道資源的生命周期管理服務,包括Bootstrap數(shù)據(jù)通道和Application數(shù)據(jù)通道的創(chuàng)建和釋放;支持3GPPTS26.114規(guī)定的攜帶終端IMS數(shù)據(jù)信道能力的第三方注冊,并記錄終端數(shù)據(jù)通道能力;支持根據(jù)NCP的請求進行音視頻及數(shù)據(jù)通道的媒體協(xié)商;支持第三方ID的第三方注冊、用戶簽約數(shù)據(jù)獲取。

(2)其他AS:支持轉發(fā)SDP中的數(shù)據(jù)通道媒體描述;主動發(fā)起媒體變更時,支持對數(shù)據(jù)通道媒體描述的處理(遵守RFC3264的規(guī)范要求)。

(3)I/S-CSCF:支持3GPPTS26.114規(guī)定的終端IMS數(shù)據(jù)通道能力注冊,并在響應中返回網(wǎng)絡側的數(shù)據(jù)通道能力;支持轉發(fā)SDP中的數(shù)據(jù)通道媒體描述;支持第三方ID的注冊和鑒權認證。

(4)P-CSCF/IM-AGW:

支持IMSCore和PSCore之間的數(shù)據(jù)通道QoS處理;

信令面:支持轉發(fā)SDP中的數(shù)據(jù)通道媒體描述;

媒體面:支持轉發(fā)數(shù)據(jù)通道中傳輸?shù)臄?shù)據(jù);

支持企業(yè)應用/企業(yè)PBX以第三方ID接入時的證書認證。

(5)IBCF/TrGW:

信令面:支持轉發(fā)SDP中的數(shù)據(jù)通道媒體描述。支持企業(yè)應用/企業(yè)PBX以第三方ID或以中繼接入時的證書認證;

媒體面:支持轉發(fā)數(shù)據(jù)通道中傳輸?shù)臄?shù)據(jù)。(6)PCRF/PCF:

支持IMSCore和PSCore之間的數(shù)據(jù)通道QoS處理。

2.對新增網(wǎng)元的要求

(1)NCP:支持Bootstrap數(shù)據(jù)通道的數(shù)據(jù)處理(H5應用發(fā)現(xiàn)/下載);支持Application數(shù)據(jù)通道的數(shù)據(jù)處理,提供A2P業(yè)務功能;支持控制MMTelAS完成呼叫流程處理,包括但不限于交互式相關的DC業(yè)務流程、音視頻業(yè)務流程、AR業(yè)務流程;支持提供北向業(yè)務能力接口,提供業(yè)務能力給第三方/OTT行業(yè)應用。

(2)DCAR:支持H5應用程序資源存儲/下載。

(3)EDS:支持第三方ID的token驗證、用戶信息獲取和企業(yè)證書管理;支持與企業(yè)服務器對接、運營商與企業(yè)的安全聯(lián)盟建立。

(4)UMF:數(shù)據(jù)通道中的數(shù)據(jù)傳輸、處理;傳統(tǒng)音視頻媒體處理;視頻合成、AR渲染等增強媒體功能處理。

(三)5G新通話關鍵技術

1.VoNR技術

語音業(yè)務作為滿足用戶溝通需求的電信基本業(yè)務,是5G不可或缺的一部分。正如VoLTE(VoiceoverLTE)是4G網(wǎng)絡的主流話音解決方案,VoNR(VoiceoverNR)是5G網(wǎng)絡的主流話音解決方案。

VoNR是指直接由5G網(wǎng)絡端到端承載語音業(yè)務。5G網(wǎng)絡提供了更高的帶寬、更多的連接數(shù)及更低的時延,使得VoNR通話不僅可以提供高清音頻、高清視頻通話,還可以讓通話雙方進行實時交互,在大幅提升用戶體驗的同時,在ToB場景下還可以實現(xiàn)更多的功能。

5GC基于云原生設計,控制面采用了服務化架構(ServiceBasedArchitecture,SBA)。SBA=NF(網(wǎng)絡功能)服務+SBI(服務化接口),NF通過SBI由模塊化的微服務組成,可靈活擴展、重用,從而可彈性高效、靈活敏捷的通過網(wǎng)絡切片等技術使能千行百業(yè)的多樣化應用,完整支持eMBB、uRLLC和mMTC三大場景,賦能各行各業(yè)數(shù)字化轉型。也正因如此,打通VoNR的關鍵在于5GC能力,以及5GC與IMS網(wǎng)絡的融合能力。

隨著5G網(wǎng)絡的逐步普及,5G新通話解決方案將逐步從VoLTE向著VoNR路線演進。基于目前成熟的IMS技術和IMS網(wǎng)絡,運營商能為用戶提供豐富的多媒體通信業(yè)務。然而,5G網(wǎng)絡帶來的高帶寬、低時延新業(yè)務對IMS網(wǎng)絡的性能和容量都提出了更高要求,傳統(tǒng)架構的IMS已無法滿足,需要進行簡化和重構。目前3GPP對IMS向SBA架構演進的研究已經(jīng)在展開,在R17完成了IMS網(wǎng)絡Diameter接口服務化的標準制定,并在R18進行IMS媒體面接口服務化的研究。面向未來業(yè)務發(fā)展,IMS網(wǎng)絡將持續(xù)向著架構革新、靈活部署、多場景適配等方向演進,并通過能力開放,深度介入到第三方業(yè)務,開拓新的行業(yè)市場應用,為用戶帶來更加豐富的業(yè)務體驗。

2.交互式數(shù)據(jù)通道

為了實現(xiàn)5G時代通話場景的業(yè)務創(chuàng)新,5G新通話在IMS網(wǎng)絡原有的音頻、視頻通道外新引入了數(shù)據(jù)通道(DataChannel,DC),實現(xiàn)通話前、通話中及通話后的文本、圖片、視頻等多媒體信息的傳遞,打造可視化、可交互、沉浸式的全新通話體驗。實時交互式通話應用對網(wǎng)絡帶寬、時延、可靠性及服務質(zhì)量具有很高的要求,需要確定性保障承載的支持。

3GPP制定的IMSDataChannel標準,借鑒WebRTCDataChannel技術,可靈活支持可靠傳輸模式、部分可靠傳輸模式及不可靠傳輸模式等多種數(shù)據(jù)通道,兼顧各種應用對底層通道的多樣化訴求。同時,IMS數(shù)據(jù)通道不關注通道中傳遞的內(nèi)容及其格式,僅需要通信雙方對通信格式達成一致,通過Web頁面+JavaScript腳本的互聯(lián)網(wǎng)成熟技術在數(shù)據(jù)通道中傳遞多樣化的應用內(nèi)容,支撐5G新通話業(yè)務的快速創(chuàng)新、快速部署、快速上線。

IMS數(shù)據(jù)通道的建立基于IMS信令模型,在會話初始協(xié)議(SessionInitiationProtocol,SIP)信令中增加了對數(shù)據(jù)通道能力的指示,并在會話描述協(xié)議(SessionDescriptionProtocol,SDP)中引入了數(shù)據(jù)通道相關的媒體描述。如圖5所示,信令流的第一部分即在5G網(wǎng)絡建立IMS基本語音會話,其中SIP信令中額外包含“數(shù)據(jù)通道”媒體特征標簽,以通知網(wǎng)絡和終結設備:始發(fā)設備支持建立IMS數(shù)據(jù)通道。信令流的第二部分顯示了當一方希望建立IMS數(shù)據(jù)通道時,通過在SDP中添加數(shù)據(jù)通道媒體描述重新生成會話INVITE請求,網(wǎng)絡和終結設備的響應方式與初始INVITE請求相同。

數(shù)據(jù)通道的工作流程:首先,運營商授權的第三方應用提供商會創(chuàng)建數(shù)據(jù)通道應用(DataChannelApplication),并上傳至網(wǎng)絡,存儲在數(shù)據(jù)通道應用倉庫(DataChannelApplicationRepository,DCAR)中。當DCMTSI(支持DataChannel的IMS多媒體電話服務)終端在通話過程中觸發(fā)該應用時,網(wǎng)絡從DCAR中取出該應用,并通過Bootstrap數(shù)據(jù)通道發(fā)送給通信雙方UEA和UEB。與該應用相關的業(yè)務數(shù)據(jù)均通過UEA和UEB之間的Application數(shù)據(jù)信道傳輸。

為了支持數(shù)據(jù)通道應用,終端需要升級改造。首先,終端應支持3GPPTS26.114規(guī)范定義的DCMTSI客戶端能力,通過升級音視頻通信協(xié)議棧來支持IMS數(shù)據(jù)通道的建立和協(xié)商,通過內(nèi)置的原生系統(tǒng)服務實現(xiàn)對數(shù)據(jù)通道的連接和管理,并支持通過Web引擎實時處理數(shù)據(jù)通道的業(yè)務數(shù)據(jù)并實時呈現(xiàn)在用戶UI,減少了對終端的定制訴求。同時,終端應支持將IMS數(shù)據(jù)通道向應用層開放調(diào)用接口,使能IMS數(shù)據(jù)通道作為新的行業(yè)應用入口,壯大基于運營商音視頻的行業(yè)應用生態(tài)。此外,終端應支持根據(jù)交互式業(yè)務的可靠性要求,協(xié)商業(yè)務帶寬、時延及丟包率等QoS指標。

3.統(tǒng)一媒體面

IMS網(wǎng)絡媒體面的傳統(tǒng)功能主要包括音頻轉發(fā)、音頻轉碼、視頻轉發(fā)、視頻播放、音頻播放、音頻錄制、音頻會議、媒體加解密等媒體處理能力。這些媒體處理能力部署在多個不同媒體功能網(wǎng)元時存在高耦合,而且采用的協(xié)議H.248在多媒體會話提供能力和業(yè)務擴展能力方面比較弱,阻礙了未來新的多媒體業(yè)務的推廣甚至規(guī)模發(fā)展。

隨著交互式通信需求的增多,IMS媒體面的功能也要具有靈活性和可擴展性,以應對未來多媒體業(yè)務發(fā)展提出的多樣化媒體能力要求。首先,IMS媒體面需要支持音視頻媒體處理能力及對外接口的靈活擴展。例如,為聾啞人等特殊群體提供的輔助通話應用,初期可以通過提供語音識別(AutomaticSpeechRecognition,ASR)/語音合成(TextToSpeech,TTS)能力進行語音和文字的互轉,輔助特殊人群完成語音通話;后期更進一步借助AI能力進行語音和手語動作的互轉,直接通過視頻呈現(xiàn),使特殊人群可以進行溝通交流。其次,媒體面需要支持沉浸式場景下的模型處理和媒體渲染,以便在實時通話過程中引入AR體驗。

為了支持上述應用,通過引入統(tǒng)一媒體功能(UnifiedMediaFunction,UMF),盡可能地融合傳統(tǒng)的媒體網(wǎng)元功能,形成統(tǒng)一的媒體面架構,充分利用媒體資源,減少路徑迂回;同時支持數(shù)據(jù)通道、AR模型處理和媒體渲染、ASR/TTS等新的媒體處理能力,并對外通過服務化接口提供可擴展的多媒體處理接口,支撐多媒體業(yè)務的快速構建。

作為統(tǒng)一的媒體功能網(wǎng)元,UMF提供服務化接口Numf,繼承了傳統(tǒng)的IMS-AGW、TrGW的接入和互通功能,以及媒體資源功能(MultimediaResourceFunction,MRF)的放音、收號等媒體處理功能,并實現(xiàn)了數(shù)據(jù)通道、ASR/TTS、AR媒體處理等新的媒體處理功能。該技術有如下特點:

(1)媒體處理從集中式演進為分布式、服務化;(2)媒體處理就近完成,減少不必要的媒體迂回與E2E媒體O/A重協(xié)商;(3)媒體處理能力可由運營商定義及擴展,現(xiàn)網(wǎng)的媒體處理網(wǎng)元可以逐步演進為軟件定義的實時分布式媒體網(wǎng)絡;(4)通過網(wǎng)絡存儲功能(NetworkRepositoryFunction,NRF)負責所有媒體處理服務的自動化管理,包括注冊、發(fā)現(xiàn)、狀態(tài)檢測等。媒體控制網(wǎng)元,如AS、P-CSCF等,使用某個媒體能力時,需要到NRF查詢獲取特定的NF實例。

4.音視頻編解碼增強技術

(1)實時語音編解碼技術

從2G、3G、4G到現(xiàn)在的5G時代,為了增強實時語音通信的清晰度,語音編碼技術從自適應多速率(AdaptiveMulti-Rate,AMR)、自適應多速率寬帶(AdaptiveMulti-Rate-Wideband,AMR-WB)演進到增強語音服務編碼(EnhancedVoiceService,EVS)。

EVS增強語音服務是繼AMR-WB高清語音編碼技術后對語音編碼技術的又一次改進,提高了編碼的靈活性和效率。它面向LTE開發(fā)和優(yōu)化,主要應用于VoLTE高清語音。EVS頻率范圍已經(jīng)擴展到14~17KHz,逼近人耳可感知的20KHz極限,聲音清晰度已接近自然聲。但由于當前的語音服務通常僅限于單聲道音頻的傳輸與回放,導致聲音空間方向維度數(shù)據(jù)丟失,這使得在通話中很難區(qū)分多個說話者,并在與視頻結合時導致說話者定位出現(xiàn)差異,導致經(jīng)常產(chǎn)生聽眾疲勞。為此3GPP啟動了新的項目IVAS_Codec,研究對EVS編碼的擴展,用于沉浸式語音及音頻服務(ImmersiveVoiceandAudioService,IVAS),旨在提供實現(xiàn)身臨其境的逼真空間聲學體驗。

IVAS是基于EVS的下一代通信編解碼器,支持真正沉浸格式的立體編碼和渲染,例如音頻對象、Ambisonics和多聲道音頻。它可以處理不同對話場景下各種麥克風配置捕獲的信號,更輕松地在視頻通話和其他虛擬會議期間跟蹤多個參與者的對話,并區(qū)分人聲與背景聲,具有更好的用戶體驗和更好的抗丟包能力。隨著沉浸式體驗變得越來越普遍,通信行業(yè)同樣面臨著用戶對于逼真體驗的需求。IVAS除了能夠滿足用戶日益增長的對實時多媒體業(yè)務的需求外,也將為實時語音會話、電話會議、AR通話等應用場景打造栩栩如生的溝通體驗。

(2)實時視頻編解碼技術

4G時代,基于IMS網(wǎng)絡的ViLTE(VideooverLTE)將視頻通話變?yōu)楝F(xiàn)實;而隨著5G網(wǎng)絡的規(guī)模部署,視頻通話真正成為運營商的基本業(yè)務。用戶對通話體驗的要求不斷提高,也推動著視頻編解碼技術朝著高清、低時延、低碼率方向不斷演進發(fā)展。

ITU-T/ISO-IEC聯(lián)合推出的H.264/AVC(AdvancedVideoCoding),是當前通信網(wǎng)絡廣泛使用的視頻編解碼國際標準。這是一種面向塊、基于運動補償?shù)囊曨l編碼標準,它相比以前的編碼標準,引入了多參考幀的運動補償、可變分塊運動補償、幀內(nèi)預測編碼等新特性。利用這些新特性,H.264/AVC實現(xiàn)了比其他編碼標準更高的視頻質(zhì)量和更低的碼率。在同等圖像質(zhì)量的條件下,H.264/AVC的壓縮比是MPEG-2的2倍以上,是MPEG-4的1.5~2倍。H.264/AVC還提供了解決不穩(wěn)定網(wǎng)絡環(huán)境下丟包問題的必要工具;并具有很強的網(wǎng)絡適應性,能夠在互聯(lián)網(wǎng)、各種制式的無線網(wǎng)絡(如CDMA、GPRS、WCDMA、CDMA2000等)上傳輸。

隨著視頻業(yè)務的發(fā)展,視頻分辨率和幀率的不斷提升給網(wǎng)絡帶寬和存儲帶來巨大挑戰(zhàn),H.264/AVC編解碼技術已不能滿足超高清視頻時代的需求。于是在2013年,ITU-T/ISO-IEC基于H.264/AVC,聯(lián)合推出了新的視頻編解碼國際標準H.265/HEVC(HighEfficiencyVideoCoding)。H.265/HEVC的目標是在有限帶寬下傳輸更高質(zhì)量的網(wǎng)絡視頻,僅需H.264的一半帶寬即可播放相同質(zhì)量的視頻。相比H.264/AVC,H.265/HEVC在提高壓縮效率、提高魯棒性和錯誤恢復能力、減少實時的時延、減少信道獲取時間和隨機接入時延、降低復雜度等方面進入深入研究,提供了更多不同的工具來降低碼率,極大推動了4K超高清視頻的普及。

2020年ITU-T/ISO-IEC又聯(lián)合推出了H.266/VVC(VersatileVideoCoding)視頻編解碼國際標準。它的視頻壓縮方式與H.265/HEVC相似,但是在分區(qū)、預測和熵編碼等方面都有所改進。與H.265/HEVC相比,H.266/VVC進一步優(yōu)化了壓縮性能,在保證視頻清晰度不變的情況下,H.266/VCC存儲體積減小一半、寬帶流量節(jié)省一半,畫質(zhì)更細膩;它對8K超高清、屏幕、高動態(tài)和360度全景視頻等新的視頻類型,以及自適應帶寬和分辨率的流媒體和實時通信等應用有了更好的支持。

(3)媒體自適應調(diào)整

大屏智能終端的普及、網(wǎng)絡資源的廣覆蓋以及AR技術的融入,不斷驅(qū)動視頻通話業(yè)務量的持續(xù)增長,同時衍生出視頻客服等5G新通話業(yè)務創(chuàng)新場景。普通視頻通話,根據(jù)分辨率的不同,流量消耗存在差異,一分鐘大約產(chǎn)生750KB~12MB流量。然而融入AR技術的視頻電話(AR通話),流量需求將會變得更大,并且與單眼分辨率、視場角和幀率有強關聯(lián)。面對當前的無線資源部署特點,針對網(wǎng)絡資源的動態(tài)變化,3GPPTS26.114中定義了多種自適應機制:比特率、數(shù)據(jù)包速率以及容錯自適應機制,以減少上行資源緊張對視頻通話和AR通話的影響,優(yōu)化視頻質(zhì)量。為了對抗無線網(wǎng)絡的各種弱網(wǎng)環(huán)境,各種視頻超碼率、超分辨率和超幀率技術也在終端和網(wǎng)絡側得到了應用。

5.第三方ID接入技術

在行業(yè)數(shù)字化轉型的浪潮下,企業(yè)迫切希望能夠以簡單、便捷、安全的方式接入運營商網(wǎng)絡,使得企業(yè)員工可以在生產(chǎn)環(huán)境使用自己的員工賬號,即第三方ID,接入IMS網(wǎng)絡發(fā)起呼叫并開展業(yè)務。第三方ID接入技術使得5G新通話面向ToB行業(yè)拓展成為可能。它包括如下關鍵技術:

(1)企業(yè)與IMS網(wǎng)絡雙向認證:企業(yè)與IMS網(wǎng)絡利用各自的CA證書和服務器證書,借助一系列安全協(xié)議如TLS、OAuth2.0等實現(xiàn)雙向認證;(2)企業(yè)對企業(yè)員工認證:企業(yè)員工使用其員工賬號接入IMS網(wǎng)絡前,首先與企業(yè)認證服務器交互完成身份認證并獲取用戶token,該token將進一步用作企業(yè)員工被IMS網(wǎng)絡認證的依據(jù);

(3)企業(yè)員工接入IMS網(wǎng)絡:包括兩種接入方式,一種是SIP終端接入,員工使用員工賬號登錄SIP終端發(fā)起注冊/呼叫;另一種是SIP中繼接入,員工使用員工賬號登錄企業(yè)網(wǎng)關,企業(yè)網(wǎng)關代理企業(yè)員工發(fā)起SIP注冊/呼叫流程。兩種接入方式均需攜帶從企業(yè)認證服務器獲取的用戶token并傳遞給IMS網(wǎng)絡用于認證企業(yè)員工并獲取其身份信息;(4)企業(yè)員工信息獲?。浩髽I(yè)員工信息的所有權歸屬企業(yè),IMS網(wǎng)絡不發(fā)放企業(yè)員工數(shù)據(jù),而是按需動態(tài)獲取并緩存企業(yè)員工信息,以保護企業(yè)數(shù)據(jù)隱私;(5)企業(yè)員工信息的跨網(wǎng)傳遞:企業(yè)外呼場景中作為主叫的企業(yè)員工的身份信息可能跨不同運營商網(wǎng)絡傳遞并最終在被叫終端上呈現(xiàn),為避免主叫身份信息被篡改,需要在主叫網(wǎng)絡對主叫身份信息進行簽名和在被叫網(wǎng)絡對主叫的簽名進行驗證。

6.AR實時通信技術

AR廣泛運用了多媒體、三維建模、實時跟蹤及注冊、智能交互、傳感等多種技術手段,將計算機生成的文字、圖像、三維模型、音視頻等虛擬信息模擬仿真后,應用到真實世界中,使用戶獲得超越現(xiàn)實的感官體驗。為了支持傳統(tǒng)音視頻通話到AR實時通話的全新升級,CCSATC3WG1《下一代實時通信網(wǎng)絡技術研究》中提出,IMS網(wǎng)絡需要引入如下邏輯功能。

(1)AR設備端側(ARClient)支持數(shù)據(jù)采集、視覺引擎分析、低時延編碼、輕量級圖像渲染、以及從云端獲取虛擬對象等;(2)AR媒體功能(AR-M)支持對真實環(huán)境進行三維構建、對象識別跟蹤定位、對虛景的渲染以及虛擬對象與真實對象的融合;(3)AR控制功能(AR-C)支持參與AR會話的端側設備,以及端與AR應用提供者建立會話關聯(lián)和控制;(4)AR應用提供者(ApplicationProvider)提供一系列的虛擬對象或現(xiàn)實背景用于AR用戶在端側操作或作為媒體處理的一部分輸入;

在IMS架構引入AR會話管理和媒體處理的能力,實現(xiàn)AR實時通話業(yè)務。

其中,UMF集成AR-M,與終端一起負責AR的媒體處理;AS(ApplicationServer,應用服務器)集成AR-C,用于AR會話管理;UCP存儲AR通話應用,用于端側根據(jù)需求建立數(shù)據(jù)通道并下載AR通話應用;UE按需請求并下載AR通話應用。終端采集的數(shù)據(jù)即AR-specificdata,基于終端的實際處理能力,可以借助終端與網(wǎng)絡之間建立的數(shù)據(jù)通道傳遞到網(wǎng)絡側,由網(wǎng)絡側的媒體網(wǎng)元UMF進行預渲染處理,然后再轉發(fā)該媒體流給相應的接收端,接收端根據(jù)本地最新傳感器采集數(shù)據(jù)做最終的媒體渲染。AR媒體處理由AR端與IMS媒體網(wǎng)元UMF共同完成,所有的會話處理和語音媒體都需要經(jīng)過IMS網(wǎng)絡。用戶可根據(jù)需要實現(xiàn)2D視頻電話與AR通話間的升級或回落。

7.基于AI的語音交互技術

關注“數(shù)字弱勢群體”,消除“數(shù)字鴻溝”,實現(xiàn)“數(shù)字包容”,服務各個社會群體,是通信網(wǎng)絡的社會責任,也是5G新通話的發(fā)力方向。將基于AI的語音交互技術,包括ASR、TTS等技術,應用到VoNR通話過程中實現(xiàn)語音與其他媒體類型的實時轉換,可以為殘障人士、老年人等“數(shù)字弱勢群體”提供便捷、溫暖的通信服務,也可以有效解決不同母語的人群無法直接通話的問題。

為了實現(xiàn)這些5G新通話業(yè)務,需要引入ASR/TTS功能節(jié)點,CCSATC3WG1《下一代實時通信網(wǎng)絡技術研究》中提出具體實現(xiàn)上的兩種方案:一種是IMS網(wǎng)絡自建ASR/TTS功能節(jié)點,提供ASR/TTS處理能力;另一種是IMS網(wǎng)絡與語音交互服務提供商對接,調(diào)用其提供的ASR/TTS服務。圖11展示了這兩種不同的實現(xiàn)方案。

在方案一中,IMS網(wǎng)絡中的UMF集成了ASR/TTS-M、DCS-M等媒體處理功能,IMSAS集成ASR/TTS業(yè)務觸發(fā)邏輯。UE與UMF建立語音、視頻通道,用于傳遞語音、視頻媒體,并建立數(shù)據(jù)通道,用于傳遞文本和(或)UE的UI指令。當IMSAS識別需要語音轉文本時,調(diào)用UMF中的ASR/TTS-M服務將其從發(fā)送方UE接收的語音媒體流轉換文本,再通過數(shù)據(jù)通道發(fā)給接收方UE;當IMSAS識別需要文本轉語音時,調(diào)用UMF中的ASR/TTS-M服務將其通過數(shù)據(jù)通道從發(fā)送方UE接收的文本轉換為語音并進行混音處理后,再通過語音通道發(fā)給接收方UE。

在方案二中,IMS網(wǎng)絡與第三方提供的ASR/TTS服務對接。IMSAS事先預置第三方ASR/TTS服務的地址,在業(yè)務觸發(fā)時,IMSAS利用現(xiàn)有接口將第三方ASR/TTS服務的地址通知給UMF。當IMSAS識別需要語音轉文本時,UMF從發(fā)送方UE接收語音媒體流后復制給第三方ASR/TTS服務;第三方ASR/TTS服務收到語音包后將其轉換成文本,再返回給UMF;UMF整合分片包并借助數(shù)據(jù)通道發(fā)給接收方UE。當IMSAS識別需要文本轉語音,UMF將其通過數(shù)據(jù)通道從發(fā)送方UE接收的文本發(fā)送給第三方ASR/TTS服務;第三方ASR/TTS服務收到文本包后轉換為語音再返回給UMF;UMF整合語音包并進行混音處理后發(fā)給接收方UE。

方案一的優(yōu)勢是,終端產(chǎn)生的媒體流是在IMS網(wǎng)絡內(nèi)完成媒體類型轉換,可以有效保證媒體流的安全,同時轉換時延也相對較低;方案二中,ASR/TTS功能擴展和升級對IMS網(wǎng)絡的影響較小,具有維護成本低、擴展性好的優(yōu)勢。

三、5G新通話業(yè)務創(chuàng)新場景探索

(一)ToC場景探索

到目前為止,中國已建成了全球規(guī)模最大、用戶最多、質(zhì)量最高的5G網(wǎng)絡,運營商、終端廠商、互聯(lián)網(wǎng)公司5G大規(guī)模適配進展飛速,面向個人消費者的應用數(shù)量、體驗質(zhì)量、創(chuàng)新幅度也已完成了顯著升級,5GToC的規(guī)模效應已經(jīng)達到全新水準。

5GToC通信的基礎邏輯是溝通更便捷、體驗更豐富、娛樂更極致。顯然,隨著移動終端智能化和大屏化,用戶實時通信的訴求早已不再局限于通話雙方聲音和影像的交流。觸、摸、拖、拽等操作的互動,針對同一事務共同協(xié)作,這些更加復雜交互需求逐漸涌現(xiàn)出來,成為網(wǎng)絡代際業(yè)務創(chuàng)新的發(fā)展動力。移動產(chǎn)業(yè)具有極高的創(chuàng)新慣性和機遇捕捉能力,當下5G網(wǎng)絡快速發(fā)展,其大帶寬、低時延等特性賦予了ToC實時通信業(yè)務新的生命與活力,能更加豐富的應用場景。

1.屏幕共享+遠程協(xié)作

在親朋好友、合作伙伴等多種溝通場景中,通話中主被叫雙方可以互相共享屏幕,基于桌面同屏高效溝通,可廣泛應用于親子教育輔導、操作指引、“同屏”觀看直播視頻、同步云購物等場景。說明:通話中如果只有一方的終端支持“新通話”功能,另一方為普通終端(不支持“新通話”功能),在“新通話用戶”側,同樣可以向普通用戶發(fā)起屏幕共享、發(fā)起攝像頭共享、在共享的內(nèi)容上作標記;在普通用戶一側,可以實時觀看“新通話用戶”側共享的內(nèi)容和標記信息。

2.趣味通話

趣味通話秉承年輕群體對于多元化社交的理念,通過實時計算攝影機位置及角度并疊加相應的圖片、三維模型等虛擬仿真信息。在視頻通話中,支持主被叫雙方創(chuàng)建數(shù)智人形象,以及表情包、任務道具、實時涂鴉等AR互動,滿足年輕人追求時尚、彰顯自我的需求。

3.語音文字互轉

協(xié)同ASR、TTS等技術,新通話可發(fā)揚科技向善,針對老年人群、弱聽弱視人群,在視頻通話過程中將語音實時轉換成文字,以字幕形式呈現(xiàn)于手機屏幕,為“數(shù)字弱勢群體”提供更加便捷、溫暖的通信服務。

4.跨語種實時翻譯

在國際旅游、跨國會議等場合,人們需要咨詢、購票、租車、訂房、訂餐等操作,常常涉及不同語種間的通話。針對跨語種場景,協(xié)同ASR、TTS、AI翻譯等技術,在視頻通話過程中將不同語種按業(yè)務方選擇進行實時翻譯,并以字幕形式呈現(xiàn)在手機屏幕,幫助用戶跨越語言鴻溝、實現(xiàn)無障礙高效溝通、開創(chuàng)跨屏翻譯新時代。

5.主叫名片

針對廣大希望主動標識自己身份,并主動向被叫表明去電意圖的用戶需求,可通過主叫名片業(yè)務在通話前向被叫推送主叫名片、呼叫意圖,以消除陌電恐慌、提升電話接通率。主叫名片業(yè)務可廣泛應用于防控場景,如社區(qū)聯(lián)絡員、社區(qū)民警、流調(diào)人員使用個人電話號碼向用戶發(fā)起呼叫時,主動向被叫表明來意,提升防控工作效率。

(二)ToB場景探索

5G的歷史使命是賦能千行百業(yè),促進各行各業(yè)的數(shù)字化轉型,成為社會經(jīng)濟生活的新型基礎設施。然而,5GToB的成功是實現(xiàn)這個歷史使命的基本條件,是真正的重頭戲和主戰(zhàn)場。據(jù)KeystoneStrategy&HuaweiSPOLab預測,預計2025年全球與ICT相關的行業(yè)數(shù)字化收入將達到4.7萬億美元,其中5G相關的市場總空間超過1.6萬億美元,而運營商可參與的部分占比將超過50%,其中5GToB市場高達6020億美金。

5G新通話作為企業(yè)級通信服務的重要載體,通過業(yè)務升級的形式為企業(yè)提供多種通話業(yè)務模式的價值方案與思路,進一步實現(xiàn)“通話即服務”的目標。企業(yè)可基于終端原生通話入口通過音視頻、圖文等富媒體方式向用戶輸出個性化服務,真正實現(xiàn)開機即用、按需服務、用完即走的超輕量級應用,使能企業(yè)信息服務更加精準和高效觸達用戶群體。5G新通話ToB業(yè)務將構建可信、公平、開放的通話服務平臺,賦能金融、政務、電商等千行百業(yè),創(chuàng)造出產(chǎn)業(yè)互惠、多方共贏的新生態(tài)。

1.服務熱線可視化菜單

針對有面向最終用戶服務熱線的企業(yè)/行業(yè)客戶,可升級傳統(tǒng)“IVR語音+數(shù)字鍵盤交互”為“可視導航+點屏交互”,提供“可聽可看”的“可視化菜單”式服務熱線,方便用戶一目了然獲取服務內(nèi)容,并通過點擊菜單按鈕進入相應的業(yè)務表單完成業(yè)務辦理。用戶不再等待冗長的語音提示、不必擔心記錯或點錯菜單編號,通過

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論