版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
信源編碼技術(shù)第一頁,共五十三頁,2022年,8月28日2023/1/181信源編碼技術(shù)信源編碼:將模擬信源信號(hào)轉(zhuǎn)換為二進(jìn)制數(shù)字信號(hào),在接收端再將收到的數(shù)字信號(hào)還原為模擬信號(hào)的方法這是由模擬網(wǎng)數(shù)字網(wǎng)至關(guān)重要的一步類別語音編解碼圖像編解碼目前在移動(dòng)通信系統(tǒng)中,語音信號(hào)還是主要業(yè)務(wù),在今后多媒體移動(dòng)系統(tǒng)中,圖像業(yè)務(wù)比重越來越大。第二頁,共五十三頁,2022年,8月28日2023/1/182語音編碼概念:把模擬語音信號(hào)變成數(shù)字語音信號(hào),以便在信道中傳輸意義提高通話質(zhì)量(數(shù)字化+糾錯(cuò)碼)提高頻譜利用率(低碼率編碼)提高系統(tǒng)容量(低碼率+話音激活技術(shù))移動(dòng)通信對(duì)語音編碼要求碼率低、語音質(zhì)量高抗噪聲和抗干擾能力強(qiáng)編譯碼延時(shí)小,總延時(shí)在65ms以內(nèi)編譯碼復(fù)雜度低,便于大規(guī)模集成化功耗小,便于應(yīng)用于手持臺(tái)第三頁,共五十三頁,2022年,8月28日2023/1/183語音編碼分類第四頁,共五十三頁,2022年,8月28日2023/1/184語音編碼方法波形編碼:將時(shí)間域信號(hào)直接變換成數(shù)字代碼,目的是盡可能精確再現(xiàn)原始語音波形?;驹硎窃跁r(shí)間軸上對(duì)模擬語音按一定速率抽樣,然后將幅度樣本分層量化,并用代碼表示。參量編碼:又稱聲源編碼,是將信源信號(hào)在頻域或其它正交變換域提取特征參量,并轉(zhuǎn)換成數(shù)字代碼進(jìn)行傳輸?;驹硎且园l(fā)音機(jī)制的模型為基礎(chǔ),用一套模擬聲帶頻譜特性的濾波器系數(shù)和若干聲源參數(shù)來描述這個(gè)模型,從模擬語音信號(hào)中提取這些特征參量并量化編碼混合編碼:將波形編碼和參量編碼結(jié)合起來第五頁,共五十三頁,2022年,8月28日2023/1/185幾種語音編碼優(yōu)缺點(diǎn)波形編碼優(yōu)點(diǎn):對(duì)于比特速率較高的編碼信號(hào)(16~64kbits/s),波形編碼技術(shù)能夠提供相當(dāng)好的話音質(zhì)量缺點(diǎn):對(duì)低速語音編碼(低于16kbits/s),波形編碼的語音質(zhì)量顯著下降,所以不適合頻譜資源緊張的移動(dòng)通信系統(tǒng)參量編碼優(yōu)點(diǎn):可實(shí)現(xiàn)低速語音編碼,速率可達(dá)2~4.8kbits/s缺點(diǎn):語音質(zhì)量只能達(dá)到中等混合編碼吸收了上述兩種編碼的優(yōu)點(diǎn),是優(yōu)選方向第六頁,共五十三頁,2022年,8月28日2023/1/186語音編碼與壓縮技術(shù)要實(shí)現(xiàn)低速、高質(zhì)量的語音編碼,必須采用壓縮技術(shù);波形技術(shù)處理:削減語音波形冗余度,包括線性預(yù)測(cè)分析、頻帶分割、正交變換和分析合成等;量化技術(shù):優(yōu)化幅度量化,包括自適應(yīng)量化、自適應(yīng)比特分配和矢量量化第七頁,共五十三頁,2022年,8月28日2023/1/187語音評(píng)價(jià)客觀評(píng)定方法:用客觀測(cè)量的手段來評(píng)價(jià)語音編碼的質(zhì)量,常用信噪比、加權(quán)信噪比、平均分段信噪比等方法;特點(diǎn)有建立在度量均方誤差基礎(chǔ)上;計(jì)算簡(jiǎn)單;對(duì)于低速語音編碼,不能完全反映人對(duì)語音質(zhì)量的感覺主觀評(píng)定方法:主觀評(píng)定等級(jí)或平均評(píng)定得分(MOS)--由數(shù)十名試聽者在相同信道環(huán)境中試聽并給予評(píng)分,然后對(duì)評(píng)分進(jìn)行統(tǒng)計(jì)處理,求出平均得分。要求試聽者人數(shù)足夠多;語音材料足夠豐富;試聽環(huán)境盡量相同MeanOpinionScore第八頁,共五十三頁,2022年,8月28日2023/1/188主觀評(píng)定等級(jí)試聽者對(duì)語音質(zhì)量的感覺往往是和注意力集中程度相聯(lián)系的,因此對(duì)于主觀評(píng)定等級(jí),還有一個(gè)收聽注意力等級(jí)。第九頁,共五十三頁,2022年,8月28日2023/1/189MOS分與語音質(zhì)量MOS分在4.0~4.5分為高質(zhì)量語音編碼,達(dá)到長(zhǎng)途電話網(wǎng)的質(zhì)量要求MOS分為3.5分左右稱作通信質(zhì)量,聽者能感覺到語音質(zhì)量有所下降,但不影響正常通話,可以滿足多數(shù)通信系統(tǒng)使用要求MOS分為3分以下常稱為合成語音質(zhì)量,只有足夠高的可懂度,但自然度較差,不容易識(shí)別講話者第十頁,共五十三頁,2022年,8月28日2023/1/1810語音編碼現(xiàn)狀標(biāo)準(zhǔn)制定情況第十一頁,共五十三頁,2022年,8月28日2023/1/1811第十二頁,共五十三頁,2022年,8月28日2023/1/1812語音質(zhì)量與比特速率第十三頁,共五十三頁,2022年,8月28日2023/1/1813語音波形編碼模擬語音信號(hào)數(shù)字語音信號(hào):時(shí)間和幅度離散化,即抽樣與量化抽樣定理:采樣率大于或等于信號(hào)帶寬的2倍,離散信號(hào)可以無失真恢復(fù)成原始模擬信號(hào)幅度量化:用有限個(gè)幅值表示樣值幅度,從而離散化信號(hào)幅度的過程量化階距:相鄰兩量化值之差均勻量化:量化階距為常量--小信號(hào)的“信號(hào)與量化噪聲比”小,因此對(duì)小信號(hào)不利非均勻量化:量化階距可變--壓縮量化,即在均勻量化前,對(duì)大信號(hào)進(jìn)行壓縮,對(duì)小信號(hào)進(jìn)行放大第十四頁,共五十三頁,2022年,8月28日2023/1/1814壓縮量化壓縮量化:對(duì)輸入信號(hào)的對(duì)數(shù)進(jìn)行量化,以使量化信噪比與量化電平無關(guān)律壓縮:A律壓縮:第十五頁,共五十三頁,2022年,8月28日2023/1/1815壓縮量化特性A與的物理意義:最大量化階距與最小量化階距之比第十六頁,共五十三頁,2022年,8月28日2023/1/1816PCM調(diào)制PCM(脈沖編碼調(diào)制):直接將樣值編碼為信號(hào),特點(diǎn)為64kbit/s:量化成128個(gè)正負(fù)各半的量值,用7位二進(jìn)制數(shù)表示,再加上一位符號(hào)共8比特;采樣率8kHz采用A律或律壓縮第十七頁,共五十三頁,2022年,8月28日2023/1/1817參量編碼原理原理:模型化人類語音產(chǎn)生機(jī)制,提取模型參數(shù),并且只傳送模型參數(shù)--低碼率編碼,導(dǎo)致合成的語音波形失去了自然度和音質(zhì)語音信號(hào)的產(chǎn)生模型語音的產(chǎn)生:聲帶與聲道不同語音產(chǎn)生原因:聲音激勵(lì)源和聲道不同聲音分類:清音和濁音濁音:聲帶振動(dòng)基音周期波形:三角形周期脈沖波,含豐富諧音清音:聲帶不振動(dòng),類似白噪聲發(fā)聲過程:口腔和鼻腔形成時(shí)變?yōu)V波器第十八頁,共五十三頁,2022年,8月28日2023/1/1818清音和濁音清濁音信號(hào)清濁音頻譜第十九頁,共五十三頁,2022年,8月28日2023/1/1819語音產(chǎn)生模型語音模型的建立:1、產(chǎn)生激勵(lì);2、響應(yīng)模型參數(shù):基音、共振峰頻率及強(qiáng)度、清濁音判決第二十頁,共五十三頁,2022年,8月28日2023/1/1820特征提取參數(shù)基于語音信號(hào)的短時(shí)準(zhǔn)平穩(wěn)特性-10~20ms提取技術(shù)自相關(guān)函數(shù)法平均幅度差函數(shù)法線性預(yù)測(cè)短時(shí)波形分析短時(shí)處理技術(shù)加窗技術(shù):方窗和哈明窗基音周期估計(jì):基于短時(shí)自相關(guān)函數(shù)基于短時(shí)平均幅度差函數(shù)第二十一頁,共五十三頁,2022年,8月28日2023/1/1821線性預(yù)測(cè)編碼(LPC)線性預(yù)測(cè):一個(gè)語音采樣的現(xiàn)在值可以用若干個(gè)語音采樣的過去值的加權(quán)線性組合來逼近。其中加權(quán)系數(shù)稱為預(yù)測(cè)器系數(shù)。線性預(yù)測(cè)語音編碼機(jī)理:語音信源是相關(guān)信源,即使經(jīng)過采樣與量化,相鄰樣點(diǎn)仍有很強(qiáng)相關(guān)性。線性預(yù)測(cè)編碼:把線性預(yù)測(cè)用于語音編碼。預(yù)測(cè)模型一般為一個(gè)全極點(diǎn)模型準(zhǔn)則:最小均方誤差傳輸:預(yù)測(cè)系數(shù)、基音周期和增益、清濁音判決第二十二頁,共五十三頁,2022年,8月28日2023/1/1822LPC數(shù)學(xué)描述第二十三頁,共五十三頁,2022年,8月28日2023/1/1823LPC實(shí)現(xiàn)結(jié)構(gòu)(a)編碼器(b)譯碼器第二十四頁,共五十三頁,2022年,8月28日2023/1/1824LPC編碼器缺陷缺點(diǎn):損失了語音的音質(zhì)抗噪聲能力差譜包絡(luò)估計(jì)可能產(chǎn)生較大失真原因:激勵(lì)信號(hào)在濁音段采用周期脈沖,在清音段采用白噪聲沒有將發(fā)端模型的誤差信號(hào)傳到收端第二十五頁,共五十三頁,2022年,8月28日2023/1/1825混合編碼為克服LPC的缺陷,采用混合編碼器,即在產(chǎn)生模型參數(shù)的同時(shí),激勵(lì)信號(hào)從語音波形信號(hào)獲得方法一條路徑產(chǎn)生線性預(yù)測(cè)參數(shù)并傳送出去一條路徑濾出信號(hào)的低頻成分,并通過波形編碼傳送出去接收端的激勵(lì)信號(hào)特點(diǎn)不需要進(jìn)行清濁音判決和基音周期提取編碼速率一般比LPC高音質(zhì)比LPC編碼器好第二十六頁,共五十三頁,2022年,8月28日2023/1/1826用于移動(dòng)通信的語音編碼移動(dòng)通信中實(shí)用的語音編碼均為混合編碼第二十七頁,共五十三頁,2022年,8月28日2023/1/1827混合編碼的共同特點(diǎn)先進(jìn)行線性預(yù)測(cè)分析去掉語音的短時(shí)相關(guān)性;再分析出最佳激勵(lì)信號(hào);對(duì)激勵(lì)信號(hào)和線性預(yù)測(cè)參數(shù)進(jìn)行編碼傳送;第二十八頁,共五十三頁,2022年,8月28日2023/1/1828GSM的語音編碼算法名稱:(RPE-LTP)規(guī)則脈沖激勵(lì)長(zhǎng)時(shí)預(yù)測(cè)編碼特點(diǎn):是一種混合編碼技術(shù)采用間隔相等、相位和幅度優(yōu)化的規(guī)則脈沖作為激勵(lì)源結(jié)合長(zhǎng)時(shí)預(yù)測(cè),消除信號(hào)冗余度,碼率低語音檢測(cè)--靜寂描述(SID)幀編碼率13kb/s計(jì)算簡(jiǎn)單、計(jì)算量適中、易于硬件化語音質(zhì)量MOS達(dá)4.0RegularPulseExcitation-LongTimePrediction第二十九頁,共五十三頁,2022年,8月28日2023/1/1829RPE-LTP算法方案20ms為一幀,分成4個(gè)子幀,每個(gè)子幀含40個(gè)樣點(diǎn)(采樣率8kHz)每個(gè)子幀預(yù)測(cè)誤差信號(hào)的樣點(diǎn)按3:1等間隔抽取,得到13個(gè)樣點(diǎn)(共有4種序列)在4種序列中選擇一種對(duì)語音波形貢獻(xiàn)最大的序列找到序列中的最大非零點(diǎn),用6比特編碼用最大非零點(diǎn)歸一化整個(gè)序列,用APCM編碼,每個(gè)樣值各用3個(gè)比特編碼第三十頁,共五十三頁,2022年,8月28日2023/1/1830GSM語音編碼框圖第三十一頁,共五十三頁,2022年,8月28日2023/1/1831GSM語音解碼框圖第三十二頁,共五十三頁,2022年,8月28日2023/1/1832IS-95語音編碼技術(shù)算法名稱:(QualcommCELP)Qualcomm公司碼激勵(lì)線性預(yù)測(cè)編碼特點(diǎn):是一種混合編碼技術(shù)采用矢量量化技術(shù)采用CELP技術(shù)采用話音激活技術(shù)(VAD),速率可變速率有四種:9.6kbps、4.8kbps、2.4kbps和1.2kbps第三十三頁,共五十三頁,2022年,8月28日2023/1/1833矢量量化技術(shù)矢量量化:將若干個(gè)標(biāo)量數(shù)據(jù)組成一個(gè)矢量,然后在矢量空間中給以整體量化,從而壓縮了數(shù)據(jù)而不損失很多信息--它是一種能接近率失真理論限的量化技術(shù);是一種延遲判決編碼技術(shù),把一個(gè)矢量映射為一個(gè)碼本索引并傳輸?shù)浇邮斩?,而碼本是一個(gè)由有限個(gè)矢量組成的集合,并且這些矢量能組合得到所有可能的矢量第三十四頁,共五十三頁,2022年,8月28日2023/1/1834矢量量化技術(shù)示意第三十五頁,共五十三頁,2022年,8月28日2023/1/1835碼激勵(lì)線性預(yù)測(cè)技術(shù)(CELP)特點(diǎn):基于線性預(yù)測(cè)編碼技術(shù)激勵(lì)源從碼本中搜索并乘上最佳增益,代替LP余量信號(hào)編碼過程:原始語音被分成幀,幀長(zhǎng)約為10~30ms,對(duì)每幀進(jìn)行LPC預(yù)測(cè),求出LP參數(shù)在殘留信號(hào)中進(jìn)行長(zhǎng)時(shí)預(yù)測(cè)兩次預(yù)測(cè)結(jié)束后,得到激勵(lì)信號(hào),并對(duì)激勵(lì)信號(hào)進(jìn)行矢量量化第三十六頁,共五十三頁,2022年,8月28日2023/1/1836QCELP框圖共15個(gè)參數(shù):濾波參數(shù)a1,a2,…,a12;音調(diào)參數(shù)L和b;增益參數(shù)G;碼表參數(shù)T第三十七頁,共五十三頁,2022年,8月28日2023/1/1837QCELP算法算法方案:把模擬語音按8kHz采樣按20ms一個(gè)語音幀,每幀160個(gè)樣本用這160個(gè)樣本產(chǎn)生3個(gè)參數(shù)子幀,這3個(gè)參數(shù)子幀不斷更新,并按一定幀結(jié)構(gòu)送至接收端濾波參數(shù)a1,a2,…,a12,對(duì)任何速率每20ms更新一次音調(diào)參數(shù),不同速率更新頻率不同碼表參數(shù),不同速率更新頻率不同第三十八頁,共五十三頁,2022年,8月28日2023/1/1838QCELP不同速率的參數(shù)變化注:1/8速率不是從碼表選擇,而是偽隨機(jī)激勵(lì)第三十九頁,共五十三頁,2022年,8月28日2023/1/1839QCELP速率選擇根據(jù)每一幀中的能量與3個(gè)門限值的比較3個(gè)門限值的選擇基于對(duì)背景噪聲的估計(jì)每一幀中的能量由自相關(guān)函數(shù)R(0)的值決定,與門限T1(Bi)、T2(Bi)和T3(Bi)(Bi為背景噪聲)的關(guān)系:若R(0)大于3個(gè)門限,則選擇速率‘1’若R(0)大于2個(gè)門限,則選擇速率‘1/2’若R(0)大于1個(gè)門限,則選擇速率‘1/4’若R(0)小于所有門限,則選擇速率‘1/8’每次只允許變化一級(jí)半速率時(shí),門限‘1’實(shí)際為門限‘1/2’第四十頁,共五十三頁,2022年,8月28日2023/1/1840IS54語音編碼算法名稱:矢量和激勵(lì)線性預(yù)測(cè)編碼(VSELP)特點(diǎn):采用CELP技術(shù)有三個(gè)碼本,一個(gè)為長(zhǎng)時(shí)預(yù)測(cè)增益,另兩個(gè)為矢量碼本。每一激勵(lì)為3個(gè)碼本的信號(hào)組合在搜索最佳激勵(lì)矢量方面有簡(jiǎn)化算法碼本為事先確定好的結(jié)構(gòu),不用全搜索第四十一頁,共五十三頁,2022年,8月28日2023/1/1841WCDMA語音編碼算法名稱:(AMR)自適應(yīng)多速率編碼AMR概念:以更智能的方式解決信源編碼和信道編碼的速率匹配問題,實(shí)際的語音編碼速率將取決于信道條件原因:WCDMA支持多媒體業(yè)務(wù),并支持分組交換與電路交換方式移動(dòng)信道是隨機(jī)變化的,固定速率編碼不能使系統(tǒng)工作在最佳的信源編碼和信道編碼速率上信道質(zhì)量差時(shí),信道編碼不足以糾正傳輸錯(cuò)誤,此時(shí)應(yīng)改進(jìn)信道編碼,減小信源編碼速率,提高語音質(zhì)量信道質(zhì)量好時(shí),增加信源編碼速率,提高語音質(zhì)量第四十二頁,共五十三頁,2022年,8月28日2023/1/1842AMR語音編碼原理AMR是一種集成語音編碼器,有8種確定的信源速率模式,從4.75kbps~12.2kbps第四十三頁,共五十三頁,2022年,8月28日2023/1/1843AMR編碼框圖第四十四頁,共五十三頁,2022年,8月28日2023/1/1844AMR解碼框圖第四十五頁,共五十三頁,2022年,8月28日2023/1/1845圖像壓縮編碼圖像信息量大,處理技術(shù)復(fù)雜圖像信息量遠(yuǎn)大于語音、文字、傳真,所占用的傳輸頻帶也更寬傳輸、處理、存儲(chǔ)圖像信息都比語音、文字等更復(fù)雜、更困難圖像包括:靜止圖像、可視電話、會(huì)議電視、廣播電視和高清晰度電視等不同等級(jí)為節(jié)約傳輸帶寬,根據(jù)圖像信息中有大量的冗余信息,需要且能夠?qū)D像信息進(jìn)行壓縮編碼第四十六頁,共五十三頁,2022年,8月28日2023/1/1846圖像壓縮編碼原理根據(jù)各類圖像的客觀統(tǒng)計(jì)特性、以及接收者人眼的生理與心理特征,來制定綜合匹配的壓縮編碼方式通過圖像的幀間預(yù)測(cè)來消除圖像的時(shí)域相關(guān)性通過圖像的幀內(nèi)離散余弦變換(DCT)來消除圖像的空間域相關(guān)性利用人眼視覺生理與心理特征進(jìn)行自適應(yīng)量化編碼通過熵編碼實(shí)現(xiàn)與信源的概率統(tǒng)計(jì)匹配采用緩沖存儲(chǔ)器實(shí)現(xiàn)輸入變長(zhǎng)與輸出定長(zhǎng)之間的匹配第四十七頁,共五十三頁,2022年,8月28日2023/1/1847圖像壓縮編碼標(biāo)準(zhǔn)第四十八頁,共五十三頁,2022年,8月28日2023/1/1848MPEG4綜述比前面的MPEGx更加全面
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 整形外科聘用合同范本診所
- 公路交通安全設(shè)施施工合同
- 電影院急救藥箱存放要求
- 休閑娛樂設(shè)施投標(biāo)文件范本
- 幼教科研人員聘用合同
- 住宅小區(qū)照明安裝協(xié)議
- 車輛停放管理規(guī)定
- 礦山開采顧問服務(wù)協(xié)議
- 電子票據(jù)交易安全手冊(cè)
- 2024混合動(dòng)力汽車賽道專題報(bào)告-2024-10-市場(chǎng)解讀
- 企業(yè)單位消防安全規(guī)范化管理指導(dǎo)手冊(cè)
- 廢舊物資回收投標(biāo)方案(技術(shù)方案)
- 宣傳視頻拍攝服務(wù)投標(biāo)方案(技術(shù)方案)
- 森林防火課件下載
- 2024糧改飼工作總結(jié)五篇
- 合作收款合同協(xié)議書
- 2024至2030年中國生物質(zhì)能發(fā)電行業(yè)市場(chǎng)深度調(diào)研及發(fā)展前景分析報(bào)告
- 2024–2025學(xué)年高二化學(xué)下學(xué)期期末考點(diǎn)大串講猜想01 原子結(jié)構(gòu)與性質(zhì)(8大題型)(解析版)
- 2024新滬教版英語初一上單詞表(英譯漢)
- 安徽省淮南市2023-2024學(xué)年高一上學(xué)期第二次月考數(shù)學(xué)試題2
評(píng)論
0/150
提交評(píng)論