信息技術 三維聲技術 編碼、分發(fā)與呈現(xiàn) 編制說明_第1頁
信息技術 三維聲技術 編碼、分發(fā)與呈現(xiàn) 編制說明_第2頁
信息技術 三維聲技術 編碼、分發(fā)與呈現(xiàn) 編制說明_第3頁
信息技術 三維聲技術 編碼、分發(fā)與呈現(xiàn) 編制說明_第4頁
信息技術 三維聲技術 編碼、分發(fā)與呈現(xiàn) 編制說明_第5頁
已閱讀5頁,還剩13頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

《信息技術三維聲技術編碼、分發(fā)與呈現(xiàn)》(征求意見稿)編制說明根據(jù)國家標準化管理委員會2024年標準制修訂計劃的安排,由中國電子技該標準的制定工作起始于2021年,由世界超高清產(chǎn)業(yè)聯(lián)盟聯(lián)合中關村視聽產(chǎn)業(yè)技術創(chuàng)新聯(lián)盟共同制定自主三維聲技術方案,2022年4月,世界超高清產(chǎn)業(yè)聯(lián)盟發(fā)布了T/UWA009.1-2022《三維聲音技術規(guī)范第1部分:編碼分發(fā)和呈現(xiàn)》標準第一版;2023年,中關村視聽產(chǎn)業(yè)技術創(chuàng)新聯(lián)盟發(fā)布了T/AI109.3《信息技術智能媒體編碼第3部分:音頻》標準。兩個聯(lián)盟標準的差異在于T/AI109.3中包含了通用高碼率編碼工具和通用全碼率編碼工具兩部分,而T/UWA009.1只包含通用全碼率編碼工具。T/UWA009.1-2022標準在產(chǎn)業(yè)實際應用落地中,對標準的技術內(nèi)容提出了一些新的需求,因此為了更好適應產(chǎn)業(yè)應用需求,提出對T/UWA009.1-2022標準的修訂計劃,完善元數(shù)據(jù)編碼工具、增加比特分配方案和低復雜度方案,于2023年發(fā)布T/UWA009.1-2022024年由中國電子技術標準化研究院牽頭組織提交了國家標準立項工作,標準立項后成立標準起草組共同起草編制,旨在整合前期國內(nèi)相關自主三維聲技術標準,形成統(tǒng)一的三維聲技術方案,為產(chǎn)業(yè)應用提供便利,促進我國三維征求意見稿主要起草單位:中國電子技術標準化研究院、清華大學、華為技術有限公司、北京理工大學、中關村視聽產(chǎn)業(yè)技術創(chuàng)新聯(lián)盟、國家廣播電視總局廣播電視規(guī)劃院、中央廣播電視總臺、北京字跳網(wǎng)絡技術有限公司、賽因有限公司、小米通訊技術有限公司、北京大學、博華超高清創(chuàng)新中心、杭州當虹科技股份有限公司、咪咕文化科技有限公司、中國移動集團有限公司、中國聯(lián)合網(wǎng)絡通信集團有限公司、中國電信集團有限公司、中移動(杭州)信息有項目碼率版本置信區(qū)間得分(有效均值)單聲道音頻測試32kbpsAVS2P3(73.239-80.036)76.638AVS3baseline(82.796-87.766)85.28144kbpsAVS2P3(84.074-88.964)86.519AVS3baseline(89.321-93.129)91.22572kbpsAVS2P3(91.228-94.010)92.619AVS3baseline(93.503-95.909)94.706雙聲道立體聲音頻測試48kbpsAVS2P3(77.984-82.840)80.412AVS3baseline(91.868-93.841)92.85464kbpsAVS2P3(84.581-88.219)86.400AVS3baseline(92.935-94.847)93.89196kbpsAVS2P3(94.044-95.725)94.884AVS3baseline(95.571-96.938)96.2257.1.4聲道音頻測試kbpsAVS2P3(85.759-88.863)87.311AVS3baseline(92.246-94.144)93.195kbpsAVS2P3(92.860-94.839)93.850AVS3baseline(92.450-94.350)93.400kbpsAVS2P3(93.327-94.869)94.098AVS3baseline(93.774-95.421)94.597表2總體主觀音質(zhì)測試結(jié)果打分均值95%置信區(qū)間參照渲染器85.25(86.78-83.71)揚聲器渲染系統(tǒng)86.28(87.74-84.82)T-TEST結(jié)果P值結(jié)論0.1769P>0.05不存在顯著性差異屬性評價場景深度平略平略深深12345環(huán)繞感略輕略強12345吞噬感略輕略強12345定位準確性不清楚稍微清楚大致準確精確12345亮度略輕略強12345略輕略強54321表5屬性評價主觀測試結(jié)果打分均值95%置信區(qū)間場景深度參照渲染器(3.58-3.90)揚聲器渲染系統(tǒng)(3.56-3.88)環(huán)繞感參照渲染器(3.53-3.87)揚聲器渲染系統(tǒng)(3.47-3.81)吞噬感參照渲染器(3.43-3.76)揚聲器渲染系統(tǒng)(3.41-3.74)定位準確性參照渲染器4.15(4.02-4.28)揚聲器渲染系統(tǒng)4.23(4.10-4.36)亮度參照渲染器(3.83-4.11)揚聲器渲染系統(tǒng)4.08(3.94-4.21)參照渲染器4.24(4.11-4.37)揚聲器渲染系統(tǒng)(4.24-4.29)表6屬性得分顯著性檢驗結(jié)果屬性T-TEST結(jié)果P值結(jié)論場景深度0.8348P>0.05不存在顯著性差異環(huán)繞感0.6321P>0.05不存在顯著性差異吞噬感0.8646P>0.05不存在顯著性差異定位準確性0.4111P>0.05不存在顯著性差異亮度0.2901P>0.05不存在顯著性差異0.1769P>0.05不存在顯著性差異測試序列得分均值置信區(qū)間隱藏參考93.25(91.91-94.59)3.5kHz47.13(42.00-52.25)7kHz65.26(60.54-69.99)hw_9692.49(90.82-94.15)hw_19292.86(91.67-94.06)avs_9683.04(79.08-87.00)avs_19290.64(89.09-92.19)測試序列得分均值置信區(qū)間隱藏參考93.03(91.35-94.70)3.5kHz50.38(45.40-55.35)7kHz69.97(65.29-74.68)hw_19291.24(89.39-93.08)hw_32092.00(90.31-93.69)avs_19278.13(73.16-83.09)avs_32090.08(88.02-92.15)測試序列得分均值置信區(qū)間隱藏參考92.91(91.78-94.03)3.5kHz43.18(39.04-47.32)7kHz66.90(62.74-71.06)hw_32087.14(84.40-89.87)hw_51289.23(87.25-91.21)avs_32065.50(60.95-70.45)avs_51287.14(84.75-89.52)ODGM6728AVS2P31階HOA(96kbps)-2.95-3.911階HOA(192kbps)-1.40-2.542階HOA(192kbps)-2.37-3.692階HOA(320kbps)-1.32-2.813階HOA(320kbps)-1.96-3.903階HOA(512kbps)-1.33-2.26觀測試中,編解碼前后元數(shù)據(jù)差異均小于量化步長主要目的為評估ILD碼書和量化公式計算兩種方法的一致性。測試結(jié)果見云聽、咪咕等音頻平臺已經(jīng)支持本標準規(guī)定的技術方案。為更好地滿足網(wǎng)絡媒體、數(shù)字電影、廣播電視、廣播流媒體、實時通信、虛擬現(xiàn)實和增強現(xiàn)實、視頻監(jiān)控、數(shù)字存儲媒體等應用需求,基于團體標準內(nèi)容,提出本次國標立項計本標準為為三維聲音全流程中音頻制作、元數(shù)據(jù)、渲染、控制、終端設備最為廣泛的三維沉浸式音效之一。其中,電影音效制作里面使用得最多,而且在電影制作之外,音樂制作、電子游戲以及電視廣播節(jié)目都開始使用Dolby來發(fā)展為藍光音頻標準的重要廠家,并在電影數(shù)字傳輸和互聯(lián)網(wǎng)消費電子平臺上獲得了廣泛的應用。2012年DTS公司收購了SRS公司,獲得了SRS公司的Multi解碼標準,同時也是基于聲音對象的多維空間音頻技術。與現(xiàn)有的環(huán)繞聲系統(tǒng)音頻體驗,使用者在水平和垂直平面上定位聲音對象,并感知聲音對象隨用戶在音頻對象周圍移動而發(fā)生的響度變化,感知真實空間中的聲音混響以及感知定了虛擬現(xiàn)實音頻應用場景涉及的制作、傳輸和渲染回放,但不涉及編碼和傳本標準引用了國際標準ISO/IEC14496-12:2020信息技術音視頻對象編碼第12部分:ISO基本媒

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論