




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
第三講語音信號數(shù)字化及壓縮編碼(2)
8/17/20241DPCM降低語音編碼速率的必要性模擬單邊帶多路載波電話的帶寬4K,而PCM的帶寬的理論值為32K在頻帶受限的應(yīng)用場合經(jīng)濟性太低,如衛(wèi)星通信、移動通信等PCM占用高帶寬的原因分析為滿足語音信號的高動態(tài)范圍而采用了多位的量化對每個采樣點都進行量化,沒有考慮語音信號的前后相關(guān)性8/17/20242預(yù)測編碼的概念相鄰樣點之間可能只有一個量化間隔或少數(shù)個量化間隔的差別,PCM傳送的信息存在冗余在編碼前就去掉相關(guān)性很強的冗余,然后再進行編碼傳送預(yù)測編碼,就是根據(jù)過去的信號樣值預(yù)測下一個樣值,并且把預(yù)測值與現(xiàn)實的采樣值之差進行量化加以編碼和傳送在接收端,經(jīng)過相同的預(yù)測和濾波,即可得到原始信號波形8/17/20243DPCM基本原理8/17/20244DPCM性能一般總是大于1,稱為DPCM處理增益,其值主要取決于預(yù)測的效果由于量化的是樣值與預(yù)測值的差值信號,因此動態(tài)范圍可以減小,同時也可有效減小量化誤差,從而使DPCM在較低的編碼率下獲得較高的信噪比質(zhì)量需要研究的問題是:如何設(shè)計預(yù)測器獲得更好的SNR零點預(yù)測器極點預(yù)測器最佳預(yù)測器8/17/20245極點預(yù)測器N階預(yù)測器的輸出是前N個本地重建值的線性組合由于H(Z)只有極點,稱這種預(yù)測器為全極點預(yù)測器8/17/20246零點預(yù)測器M階預(yù)測器的輸出是前M個量化值的線性組合8/17/20247零極點預(yù)測器把零點預(yù)測器和極點預(yù)測器組合在一起,即構(gòu)成零極點預(yù)測器8/17/20248最佳預(yù)測器確定一組最佳預(yù)測系數(shù),使得最小在全極點模型下,并忽略量化誤差最終輸出的信噪比與預(yù)測階數(shù)有關(guān)8/17/20249增量調(diào)制(,Delta-M)(1) 簡單增量調(diào)制 可以認(rèn)為是一位編碼時的特例,但編碼的是差值信號。編碼過程8/17/202410Q[]數(shù)碼形成Z-1C(n)S(n)e(n)-+Sl(n)解碼增量調(diào)制編碼器增量調(diào)制解碼器8/17/202411差值信號8/17/202412譯碼過程實際編碼譯碼器常用簡單RC積分器和比較器來實現(xiàn)和8/17/202413(2) 斜率過載和量化信噪比當(dāng)信號變化速率超出波形變化速率時,會出現(xiàn)斜率過載現(xiàn)象,以單頻信號為例8/17/2024148/17/202415
量化噪聲量化信噪比8/17/202416通常認(rèn)為在內(nèi)均勻分布,則低通濾波后8/17/202417臨界過載時信噪比與信號幅度有關(guān),信號幅度小,信噪比降低8/17/202418例:結(jié)論:①與三次方成正比,提高一倍,增大9②
與成反比,信號頻率提高一倍,下降68/17/202419簡單增量調(diào)制的性能改進簡單增量調(diào)制有兩個問題:①斜率過載
②動態(tài)范圍8/17/202420(1). 數(shù)字壓擴自適應(yīng)增量調(diào)制可同時解決動態(tài)范圍和斜率過載問題?;靖拍睿喝缤蔷鶆蛑心菢?,改變量化間隔△。如果連續(xù)出現(xiàn)多個“1”或者“0,即可認(rèn)為信號有出現(xiàn)過載的可能,從而增大△,使其本地譯碼信號跟上變化。 如果量階隨信號瞬時壓擴,則稱為瞬時壓擴,如果量 階隨語音音節(jié)時間間隔中信號的平均斜率變化而進行壓 擴,則稱為CVSD-連續(xù)可變斜率 {一音節(jié)=基音周期=(5~20)ms}8/17/202421(2). 增量總和調(diào)制可解決斜率過載問題其要點是:將信號先進行積分,改變其頻率響應(yīng)。使高頻分量幅度下降(與預(yù)加重相反),然后再進行編碼。為此,在接收端為了不失真恢復(fù)原信號,需要將解碼后信號進行微分。8/17/202422信道誤碼對的影響對簡單有8/17/202423例如:抗誤碼性能優(yōu)于概念上來看:個別誤碼不會引起信號嚴(yán)重惡化8/17/202424簡單增量調(diào)制與PCM的性能比較抽樣頻率PCM系統(tǒng)的抽樣頻率8K
系統(tǒng)的抽樣頻率不能根據(jù)抽樣定理來確定,而需要根據(jù)斜率過載條件以及信噪比來確定,一般情況下,為保證不發(fā)生斜率過載以及保證與PCM系統(tǒng)有相同的信噪比,的抽樣頻率將遠高于PCM系統(tǒng)帶寬PCM碼速率64Kbit/s,帶寬需求32K如要求與PCM有相同的傳輸質(zhì)量,則要求抽樣頻率100K以上,帶寬要求50K一般速率為32Kbit/s或16Kbit/s,但質(zhì)量不如PCM8/17/202425量化信噪比(比較單頻正弦情況)抗信道誤碼性能
優(yōu)于PCM設(shè)備復(fù)雜度單路簡單,多路PCM簡單8/17/202426ADPCM采用自適應(yīng)的必要性由于不同的講話人的語音信號的特性各不相同語音信號只能認(rèn)為是短時平穩(wěn)采用固定的預(yù)測系數(shù)不可能對所有的語音信號獲得最好的結(jié)果,因此有必要采取自適應(yīng)的算法ADPCM的設(shè)計思路盡可能消除語音信號中的冗余對消除冗余后的信號進行有效的比特分配,從自適應(yīng)角度進行最佳編碼自適應(yīng)的方法自適應(yīng)量化自適應(yīng)預(yù)測8/17/202427自適應(yīng)量化針對被量化信號的變化狀態(tài),隨時調(diào)節(jié)量化臺階大小以匹配輸入信號的時變方差前向估值的自適應(yīng)量化對輸入信號尚未量化的樣本計算出其前向估值大小需要緩存訓(xùn)練的樣本,并傳送相關(guān)的邊信息,因此引入了編碼延時和占用了一定的信道容量后向估值的自適應(yīng)量化利用量化器的輸出樣本計算輸出信號的方差估值并確定量化臺階沒有延時,但影響估值的追蹤速度8/17/202428自適應(yīng)預(yù)測前向估值的自適應(yīng)預(yù)測思路與前向估值量化一致,同樣有編碼延時及邊信息傳輸?shù)葐栴}后向估值的自適應(yīng)預(yù)測利用已量化的樣本或發(fā)送數(shù)據(jù)更新預(yù)測系數(shù)8/17/202429信源編碼信源編碼的目的減少信源輸出符號序列的冗余度,提高符號的平均信息量信源編碼的主要方法針對信源輸出的符號序列的統(tǒng)計特性,尋找一定的方法把信源輸出序列符號變換為最短的碼字序列,使每個碼元所攜帶的平均信息量為最大,同時又盡可能保證無失真的恢復(fù)出原來的符號序列信源編碼的核心就是研究壓縮編碼算法,用盡可能低的傳輸碼率獲得盡可能好的質(zhì)量8/17/202430匹配編碼根據(jù)編碼對象出現(xiàn)的概率分配不同長度的代碼,以保證總的代碼長度最短需要知道信號的概率分布,可采用數(shù)學(xué)模型建模的方式或根據(jù)大量樣本信號進行統(tǒng)計得到典型編碼算法:Huffman編碼預(yù)測編碼利用信號之間的相關(guān)性,預(yù)測未來的信號,對預(yù)測的殘差信號進行編碼變換編碼利用信號在不同的函數(shù)空間分布的不同,選擇合適的函數(shù)將信號從一種信號空間變換到另一種有利于壓縮編碼的信號空間,再進行編碼常用的函數(shù)變換:DFT、Walsh、DCT、Haar識別編碼分解文字、語音、圖象的基本特征,與匯集這些基本特征的樣本集進行對照識別,選擇失真最小的樣本編碼傳送可用于印刷、打印等標(biāo)準(zhǔn)形狀的文字、符號和數(shù)據(jù)的編碼8/17/202431信源編碼算法信源編碼定理一個熵為H的信源,當(dāng)信源速率為R時,只要R>H,則能夠以任意小的錯誤概率進行編碼;反之,如果R<H,則無論采用多么復(fù)雜的編碼器和譯碼器,錯誤概率都不可能達到任意小Shannon在1948年證明了該定理,但并沒有指出具體的編解碼算法信源編碼與失真度量編碼失真原始信號x經(jīng)過編碼以及解碼后恢復(fù)成x’,失真量即為x與x’之間的保真度或近似度的度量常用的失真度量:漢明失真、均方誤差等以一定的、可以接受的失真換取較高的信源壓縮效率8/17/202432語音與圖像壓縮編碼類型帶寬KHZ采樣率KHZ比特/樣點比特率kb/s電話語音0.3~3.481296寬帶語音0.05~71614224調(diào)頻廣播0.02~
153216512CD光盤0.01~
2044.116705.6DAB/DAT0.01~
2048167688/17/202433類型格式分辨率幀頻HZ比特/像素比特率Mb/s電視電話QCIF176×14429.97129.1會議電視CIF352×28829.971236.4常規(guī)電視ITU-R601720×5762516165.9HDTVITU-R7091920×11522516884.78/17/202434圖像壓縮編碼圖像壓縮編碼的必要性圖像的數(shù)據(jù)量巨大,一般必須進行壓縮編碼圖像壓縮編碼的依據(jù)圖像信號在結(jié)構(gòu)和統(tǒng)計上存在大量的冗余度結(jié)構(gòu)冗余度:空間和時間上的強相關(guān)性統(tǒng)計冗余度:被編碼信號概率分布的不均勻基于人眼的視覺特性人眼對某些失真較不敏感,察覺不到圖像的某些細(xì)微變化圖像壓縮編碼的評價壓縮效率:壓縮前后編碼速率的比值壓縮質(zhì)量:恢復(fù)圖像的質(zhì)量編碼算法的復(fù)雜度編解碼延時圖像編碼采取的主要技術(shù)措施利用離散余弦變換,去除各象素點在空間域的相關(guān)性通過幀間預(yù)測差分編碼,去除活動圖像的時間相關(guān)性采用熵編碼技術(shù),使編碼域信源的概率模型相匹配利用人眼的視覺特性,進行自適應(yīng)量化編碼通過緩沖存儲器實現(xiàn)變長碼輸入與定長碼輸出之間的匹配,,,8/17/202435圖像壓縮編碼方法8/17/202436圖像壓縮編碼舉例Huffman編碼基本思想對出現(xiàn)概率較大的信源符號編以較短的代碼,對出現(xiàn)概率較小的信源符號編以較長的代碼JPEG、H.261、MPEG-1、MPEG-2中對量化后的DCT系數(shù)進行Huffman編碼編碼算法
1.初始化,根據(jù)符號概率的大小按由大到小順序?qū)Ψ栠M行排序;
2. 把概率最小的兩個符號組成一個節(jié)點;
3. 重復(fù)步驟2,形成一棵“樹”;
4. 從根節(jié)點開始到相應(yīng)于每個符號的“樹葉”,從上到下標(biāo)上“0”(上枝)或者“1”(下枝),至于哪個為“1”哪個為“0”則無關(guān)緊要,最后的結(jié)果僅僅是分配的代碼不同,而代碼的平均長度是相同的。
5. 從根節(jié)點開始順著樹枝到每個葉子分別寫出每個符號的代碼8/17/202437編碼特點霍夫曼碼的碼長雖然是可變的,但卻不需要另外附加同步代碼。如果事先編寫出一本解釋各種代碼意義的“詞典”,即碼簿,那么就可以根據(jù)碼簿一個碼一個碼地依次進行譯碼。霍夫曼碼沒有錯誤保護功能,如果碼串中有錯誤,哪怕是1位出現(xiàn)錯誤,會出現(xiàn)錯誤傳播(errorpropagation)?;舴蚵a是可變長度碼,因此很難隨意查找或調(diào)用壓縮文件中間的內(nèi)容,然后再譯碼,這就需要在存儲代碼之前加以考慮8/17/202438預(yù)測變換編碼利用圖像信號的空間和時間冗余特性,用已知的相鄰象素或圖像塊預(yù)測當(dāng)前象素值,再對預(yù)測誤差進行量化、編碼和傳輸幀內(nèi)預(yù)測編碼,在一幀圖像內(nèi)進行預(yù)測,消除圖像在空間的相關(guān)性幀間預(yù)測編碼,在多幅圖像之間進行預(yù)測,消除圖像在時間域上的相關(guān)性關(guān)鍵在于預(yù)測算法的選取游程長度編碼編碼對象為信源符號在信息流中連續(xù)出現(xiàn)的長度,根據(jù)其出現(xiàn)概率的不同編成不同長度的碼字常用于文件傳真系統(tǒng)中8/17/202439StandardOrganizationVideoCodingStandardTypicalRangeofBitRatesTypicalApplicationsITU-TH.261P*64kbits/sISDNVideoConferencingITU-TH.263,H.263+,H.263++WiderangePSTNVideoPhoneITU-TH.26L<64kbits/sWiderangeISO11172-2MPEG-1Video1.5Mbits/sCD-ROMISO13818-2MPEG-2Video4-80Mbits/sSDTV,HDTVISO14496-2MPEG-4VideoWiderangeWiderangeJVT(ITU-T,ISO)H.264WiderangeWiderange中國標(biāo)準(zhǔn)AVSWiderangeWiderange8/17/202440語音壓縮編碼語音編碼的基本問題給定編碼速率的條件下,如何獲得更高質(zhì)量的重建語音給定重建語音質(zhì)量的條件下,如何降低編碼速率基本依據(jù)利用語音信號本身的冗余度以及人耳的聽覺特性主要指標(biāo)語音編碼質(zhì)量編碼速率編碼算法的復(fù)雜度編解碼的延時8/17/202441語音壓縮編碼算法語音編碼器波形編碼器參量編碼器頻域時域非差分子帶編碼自適應(yīng)變換域編碼差分PCMDPCM
M連續(xù)可變斜率MADPCMAPC線性預(yù)測編碼信道聲碼器共振峰聲碼器倒頻譜聲碼器語音激勵聲碼器多脈沖激勵LPC碼本激勵LPC矢量和激勵LPC混合編碼器8/17/202442波形編碼力圖使重建語音信號保持原始語音波形語音信號作為一般信號進行處理適應(yīng)能力強,重建語音質(zhì)量好編碼速率較高,一般應(yīng)用于64-16K速率參量編碼(聲碼器)通過對語音信號特征參數(shù)的提取及編碼,力圖使語音信號有盡可能高的可懂度,保持語音的語意重建語音信號的波形與原始語音信號的波形可能有相當(dāng)大的差別往往利用某種語音生成的模型,在幅度譜上逼近原始語音合成語音的自然度不好,抗背景噪聲的能力比較差混合編碼結(jié)合聲碼器的特點,同時又利用波形編碼器的特點提取語音參數(shù),優(yōu)化激勵信號使其達到與原始語音的波形匹配中速率語音編碼4.8-16K,應(yīng)用于蜂窩移動通信、衛(wèi)星通信、軍用通信低速率語音編碼100bit/s-4.8Kbit/s8/17/202443語音編碼的標(biāo)準(zhǔn)G.711PCM(64kbps)G.721ADPCM(32kbps)G.7227kHz帶寬64kbps速率內(nèi)的音頻編碼G.723.16.3k/5.6k雙速率多媒體語音編碼G.72816kbps語音編碼LD-CELPG.7298kbps多媒體語音編碼8/17/202444線形預(yù)測編碼LPC的原理原理:模型化人類語音信號產(chǎn)生的機制,提取模型參數(shù),并且只傳輸模型的參數(shù)。語音信號的產(chǎn)生模型:語音的產(chǎn)生,聲帶和聲道不同語音產(chǎn)生的原因:聲音激勵源和聲道不同聲音分類:濁音和清音發(fā)聲過程口腔和鼻腔形成時變?yōu)V波器8/17/202445LPC語音編碼語音信號相鄰樣點之間又很強的相關(guān)性,可以用過去的樣點的線性組合來預(yù)測未來的樣點預(yù)測的誤差因此上式可看成信號e(n)激勵一個全極點濾波器得到語音信號與人的發(fā)聲過程吻合,采用清音及濁音二元激勵模
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 健康社會課課件視頻下載
- 張家界市重點中學(xué)2025屆物理高二第二學(xué)期期末教學(xué)質(zhì)量檢測試題含解析
- 鼻窺鏡項目可行性研究報告
- 葛洲壩集團退休管理辦法
- 虹口區(qū)冷凍倉庫管理辦法
- 融資性擔(dān)保管理暫行辦法
- 街道志愿服務(wù)站管理辦法
- 裕安區(qū)健身設(shè)施管理辦法
- 西安市雨水泵站管理辦法
- 證券經(jīng)紀(jì)業(yè)務(wù)管理辦法
- 變速箱油培訓(xùn)
- DB41T 2500-2023 地下水監(jiān)測井洗井、修井技術(shù)規(guī)范
- 中國稅制學(xué)習(xí)通超星期末考試答案章節(jié)答案2024年
- 中國心力衰竭診斷和治療指南2024解讀(完整版)
- 中醫(yī)診所備案消防應(yīng)急預(yù)案
- 外賣平臺入駐高校合同模板
- 太平洋保險在線測評題
- 垃圾分類督導(dǎo)服務(wù)投標(biāo)方案(技術(shù)方案)
- 網(wǎng)絡(luò)安全產(chǎn)業(yè)學(xué)院建設(shè)規(guī)劃方案
- 2024年秋季新人教版八年級上冊物理全冊教案(2024年新教材)
- 內(nèi)河航道例行養(yǎng)護工程預(yù)算編制規(guī)定及定額編制說明
評論
0/150
提交評論