![H.264解碼器中CABAC硬件加速器的實現(xiàn)_第1頁](http://file3.renrendoc.com/fileroot_temp3/2021-12/31/367c5287-89fe-48c0-847d-c1c743d4eb1d/367c5287-89fe-48c0-847d-c1c743d4eb1d1.gif)
下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、h.264解碼器中cabac硬件加速器的實現(xiàn)h.264是由國際電信聯(lián)盟(itu)和國際標(biāo)準(zhǔn)化組織(iso)共同制定的新一代視頻編碼標(biāo)準(zhǔn),該標(biāo)準(zhǔn)采納一系列先進的編碼技術(shù),在編碼效率、網(wǎng)絡(luò)適應(yīng)性等諸多方面都超越了以往的視頻標(biāo)準(zhǔn)。h.264有兩種熵編碼計劃:一種是從可變長編碼計劃進展而來的基于上下文的自適應(yīng)可變長編碼cavlc;另一種是從算術(shù)編碼進展而來的基于上下文的自適應(yīng)二進制算術(shù)編碼cabac。與cavlc相比,cabac可以節(jié)約約7的碼流,但增強了10的計算時光。在解高清碼流時,用軟件來做cabac這樣復(fù)雜的熵解碼,無法完成實時解碼的任務(wù),因此,設(shè)計硬件加速器是十分須要的。cabac解碼算法在
2、h.264的輸入碼流中,數(shù)據(jù)的基本單位是句法元素(syntax element),碼流是由一個個句法元素依次連接而成的。每個句法元素由若干比特組成,表示某個特定的物理意義。在h.264定義的碼流中,句法元素被組織成有層次的結(jié)構(gòu),分離描述序列(sequence)、圖像(picture)、片(slice)、宏塊(macroblock)、子宏塊(subblock)五個層次的信息,cabac主要負(fù)責(zé)對片層以下的句法元素舉行解碼。cabac解碼的總體過程可以分為三個步驟:初始化、二進制算術(shù)解碼歸一化、反二進制。初始化該過程在每一個片開頭時執(zhí)行,包括上下文模型變量(context variable)的初始
3、化和解碼引擎(decoding engine)的初始化。二進制算術(shù)解碼和歸一化二進制算術(shù)解碼是cabac解碼的核心部分,該過程實現(xiàn)1bit數(shù)據(jù)的解碼,對每個句法元素舉行解碼都需要調(diào)用該過程。h.264中二進制算術(shù)解碼有三種模式:規(guī)章解碼(decode decision)、旁路解碼(decode bypass)和結(jié)束解碼(decode terminate)。對不同句法元素舉行解碼時,分離調(diào)用這三種模式的一種或多種。反二進制化cabac定義了四種二進制化辦法:一元碼(unary)、截斷一元碼(truncated unary)、k階指數(shù)哥倫布碼(kth order exp-golomb)和定長碼(f
4、ixed-length)。一個句法元素可以對應(yīng)一種或兩種上述二進制化辦法,但特別的是,句法元素mb_type和sub_mb_type的反二進制化自立于上述四種辦法,它們通過查表來實現(xiàn)。cabac硬件加速器的架構(gòu)設(shè)計h.264解碼器的軟/硬件劃分h.264解碼過程采納軟/硬件聯(lián)合的解碼計劃,囫圇解碼器由32位cpu、結(jié)構(gòu)的運算單元和硬件加速器組成。cabac熵解碼部分,主要是一些推斷和分支操作,數(shù)據(jù)接口、吞吐量不大,這些任務(wù)由軟件和硬件加速器共同完成。本文設(shè)計的cabac解碼模塊就是一個cabac硬件加速器。cabac硬件加速器的總體構(gòu)架cabac硬件加速器的總體架構(gòu)1所示。其總體架構(gòu)分為兩層:
5、頂層是cabac_top;底層有7個模塊,包括cabac_center_ control_unit、context、 neighbor_mb_information, context_init、ac_next_ state_lps、 ac_next_state_mps和rangelps。cabac_center_control_unit模塊負(fù)責(zé)上下文模型變量的初始化,解句法元素,更新context,并將解出的殘差數(shù)據(jù)傳給iq&idct模塊;context模塊是雙口ram,存放459個上下文模型變量,可同時對一個地址的上下文模型變量舉行讀操作并對另外一個地址的上下文模型變量舉行寫操作;n
6、eighbor_mb_information模塊是sram,存放宏塊信息,cabac解碼器在解析當(dāng)前宏塊中的句法元素時,需要參考上面和左面宏塊的信息,因此,需要在該sram內(nèi)保存圖像中當(dāng)前宏塊的上一行宏塊和該行之前宏塊的信息,每解完一個宏塊更新該sram;context_init模塊是一塊片內(nèi)rom,用于初始化變量;3個查找表模塊ac_next_state_lps、ac_next_ state_mps和rangelps由組合規(guī)律實現(xiàn),用于二進制算術(shù)解碼過程中的查表運算。cabac的硬件化分析本設(shè)計的目標(biāo)是使囫圇h.264解碼器的芯片能夠?qū)Ω咔鍒D像(1920×1088)舉行實時解碼。假
7、設(shè)芯片工作在166mhz的頻率下,圖像播放速率是25fps,則平均解一個宏塊的時光是823個時鐘周期??紤]到h.264熵解碼部分的運算總體上是串行解碼,并行性較差,因此cabac硬件加速器需要在3個時鐘周期內(nèi)完成1bit數(shù)據(jù)的解碼。假設(shè)視頻圖像的壓縮比為20:1,yuv為4:2:0取樣,由于取樣值是8bit,則每個像素為8bit×1.5=12bit。cabac的解碼率約為1:1.2,所以cabac要解的碼流是(1920×1088×12bit/20)×1.2,約1.43mb。芯片工作頻率是166mhz,每3個時鐘解出1bit,則解碼數(shù)據(jù)率約為55.3mbp
8、s,本設(shè)計在解碼時cabac占用了90%,約為49.8mbps。因此解碼速度為49.8/1.43,約34.7fps,即1s可以解34.7幀,則解1幀(1920×1088)大約需要28.8ms。為了達(dá)到該目標(biāo),cabac硬件加速器的設(shè)計必需對核心的二進制算術(shù)解碼舉行優(yōu)化。按照歸一化算法的特點,即循環(huán)的次數(shù)可由輸入的codirange、codioffset和查表得到的codirangelps事先推斷出來,因此可以合并二進制化和歸一化這兩個步驟,使其在1個時鐘周期內(nèi)完成。因為篇幅有限,下面僅以三種模式中的規(guī)章解碼為例,解釋二進制算術(shù)解碼和歸一化的硬件化,旁路解碼和結(jié)束解碼可參考h.264協(xié)
9、議。規(guī)章解碼的二進制算術(shù)解碼和歸一化過程主要包括比較、減法、查表、移位操作。在h.264中,為了削減計算的復(fù)雜度,cabac首先建立一個64×4的二維表格rangetablps64,存放預(yù)先計算好的乘法結(jié)果。表格的入口參數(shù)是pstateidx和qcodirangeidx,其中qcodirangeidx由變量codirange量化而來,量化辦法是(codirange6)&3。其 hdl實現(xiàn)如下:assign qcodirangeidx= (codirange6)always(pstateidx or qcodirangeidx)begincasepstateidx, qcodi
10、rangeidx0: codirangelps="0" 255:codirangelps=63;endcaseend建立了概率模型和乘法模型后,在遞進計算過程中cabac必需保存一下變量:當(dāng)前區(qū)間的下限codioffset、當(dāng)前區(qū)間的大小codirange、當(dāng)前mps(也許率符號)字符valmps、lps(小概率符號)的概率編號pstateidx。transidxlpspstateidx和transidxmpspstateidx是兩個深度為64項的表格,其中pstateidx的取值為0"63。接下來是歸一化推斷,當(dāng)codirange小于0x0100時,需舉行歸一化
11、。這樣就能在1個時鐘周期內(nèi)完成二進制化和歸一化兩個步驟,其verilog hdl實現(xiàn)如下:always(posedge clk or negedge rst)if( !rst). .elsebeginif(codioffset= codirange-codirangelps)beginbinval="valmps;codioffset=codioffset-(codirange-codirangelps);codirange=codirangelps;if(pstateidx=0)valmps=1-valmps;pstateidx=transidxlpspstateidx;endel
12、sebeginbinval=valmps;pstateidx=transidxmpspstateidx; endwhile(codirange0x100) /注:此語句不行綜合begincodirange= (codirange-codirangelps)1;codioffset=(codioffset1) |read_bits(1);endendcabac的加速策略狀態(tài)機的設(shè)計二進制算術(shù)解碼的狀態(tài)機是本設(shè)計的核心,該部分效率的凹凸將挺直影響到cabac硬件加速器的解碼速度。在cabac模塊沒有被啟動時,狀態(tài)機將向來停歇在初始狀態(tài),當(dāng)一個新片開頭時,初始化解碼引擎;當(dāng)收到cp
13、u發(fā)出的解碼哀求時,首先進入預(yù)解碼狀態(tài),讀取上下文模型變量,然后在下一個時鐘進入二進制算術(shù)解碼狀態(tài),完成1bit數(shù)據(jù)的解碼。在cabac解碼過程中,系統(tǒng)會按照句法元素的種類和當(dāng)前數(shù)據(jù)的位置挑選解碼模式。流水線的設(shè)計cabac對1bit數(shù)據(jù)舉行解碼的過程可分為兩個步驟:讀取上下文模型變量、解碼并更新上下文模型變量。本設(shè)計采納兩級流水線結(jié)構(gòu),在對當(dāng)前數(shù)據(jù)舉行解碼的同時,可讀取下個數(shù)據(jù)的上下文模型變量,因此加快了解碼速度。碼流讀取的雙緩沖設(shè)計在舉行解碼的時候,為了提高傳輸效率,采納雙緩沖的形式。在給其中一個緩沖傳輸數(shù)據(jù)的時候,解碼器可從另外一個緩沖里讀取數(shù)據(jù)舉行解碼,從而使傳輸和解碼同時舉行,有效提高了傳輸效率。設(shè)計結(jié)果與性能在設(shè)計完成后,利用jvt提供的標(biāo)準(zhǔn)測試碼流舉行測試,通過了仿真驗證。結(jié)果顯示,本設(shè)計平均每2個時鐘周期可完成1bit數(shù)據(jù)的解碼。在smic 0.18mm 工藝標(biāo)準(zhǔn)單元庫的基礎(chǔ)上舉行dc(design compile)綜合,硬件加速器的面積為0.38mm2(不包括片外sram所占用的面積),工作頻率可達(dá)166mhz,達(dá)到了預(yù)期要求。為了顯示硬件加速器的優(yōu)勢,挑選參考軟件jm7.4的函數(shù)biari_decode_symbol完成二進制算術(shù)解碼和
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025-2030全球工業(yè)廢液處理行業(yè)調(diào)研及趨勢分析報告
- 2025年全球及中國電動式高壓無氣噴涂機行業(yè)頭部企業(yè)市場占有率及排名調(diào)研報告
- 土地承包合同解除協(xié)議
- 干洗店服務(wù)合同
- 金融科技風(fēng)險控制服務(wù)合同
- 鐵路建設(shè)工程總承包合同
- 文化內(nèi)容產(chǎn)品開發(fā)與運營合作合同
- 旅游線路開發(fā)委托代理合同
- 納米級稀土化合物可行性研究報告申請備案立項
- 線上金融投資服務(wù)合同協(xié)議
- 2025-2030年中國納米氧化鋁行業(yè)發(fā)展前景與投資戰(zhàn)略研究報告新版
- 2025年度正規(guī)離婚協(xié)議書電子版下載服務(wù)
- 2025年貴州蔬菜集團有限公司招聘筆試參考題庫含答案解析
- 煤礦安全生產(chǎn)方針及法律法規(guī)課件
- 2025年教科室工作計劃樣本(四篇)
- 2024年版古董古玩買賣合同:古玩交易稅費及支付規(guī)定
- 【7歷期末】安徽省宣城市2023-2024學(xué)年七年級上學(xué)期期末考試歷史試題
- 春節(jié)后安全生產(chǎn)開工第一課
- 2025光伏組件清洗合同
- 電力電纜工程施工組織設(shè)計
- 2024年網(wǎng)格員考試題庫完美版
評論
0/150
提交評論