




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、西安郵電大學(xué)畢業(yè)設(shè)計(論文題目:基于matlab的語音編碼技術(shù)的實現(xiàn)院(系:通信與信息工程學(xué)院專業(yè):電子信息科學(xué)與技術(shù)班級:電科0902學(xué)生姓名:趙荷導(dǎo)師姓名:單潔職稱:講師起止時間:2013年3月11日至2013年6月14日畢業(yè)設(shè)計(論文誠信聲明書本人聲明:本人所提交的畢業(yè)論文基于matlab的語音編碼技術(shù)的實現(xiàn)是由本人在指導(dǎo)教師指導(dǎo)下獨(dú)立研究,完成的成果,論文中所引用他人的文獻(xiàn)、數(shù)據(jù)、圖件、資料均已明確標(biāo)注;對于論文編寫的過程中給予我支持的指導(dǎo)老師以及其他個人,集體,在這里表示誠摯的感謝,均已在文中以明確方式注明并表示感謝。本人完全意識到本聲明的法律后果由本人承擔(dān)。論文作者:(簽字時間:2
2、013年6月14日指導(dǎo)教師已閱:(簽字時間:2013年6月14日西安郵電大學(xué)論文任務(wù)書畢業(yè)設(shè)計畢業(yè)設(shè)計(論文學(xué)生姓名趙荷指導(dǎo)教師單潔職稱講師學(xué)院通信與信息工程學(xué)院專業(yè)電子信息科學(xué)與技術(shù)題目基于matlab的語音編碼技術(shù)的實現(xiàn)任務(wù)與要求課題要求通過查閱大量資料熟悉、了解語音信號的基礎(chǔ)知識、語音編碼技術(shù)的設(shè)計思路,以及MATLAB軟件的基礎(chǔ)操作、并編程實現(xiàn)。第一階段:熟悉“語音信號”“語音編碼技術(shù)”的有關(guān)知識,查閱有關(guān)文獻(xiàn),了解基礎(chǔ)知識背景,初步理解語音識別技術(shù)的實現(xiàn)原理。開始撰寫開題報告。第二階段:認(rèn)真閱讀有關(guān)文獻(xiàn),熟練掌握MATLAB設(shè)計實現(xiàn)方案,確定實現(xiàn)算法。第三階段:編寫程序并調(diào)試、驗證,
3、初步完成論文框架、大綱和基礎(chǔ)部分內(nèi)容。第四階段:結(jié)合實際工作情況撰寫論文,修改論文,準(zhǔn)備答辯。開始日期2013年3月11日完成日期2013年6月14日院長(簽字2013年3月12日西安郵電大學(xué)論文工作計劃畢業(yè)設(shè)計(論文2013年3月14日學(xué)生姓名趙荷指導(dǎo)教師單潔職稱講師院(系_通信與信息工程學(xué)院_專業(yè)_電子信息科學(xué)與技術(shù)_題目基于matlab的語音編碼技術(shù)的實現(xiàn)_工作進(jìn)程起止時間工作內(nèi)容3月11日至3月30日熟悉“語音編碼技術(shù)”的有關(guān)知識,查閱有關(guān)文獻(xiàn)了解基礎(chǔ)知識背景,初步理解語音編碼技術(shù)的原理及算法。開始撰寫開題報告。4月1日至4月20日認(rèn)真閱讀有關(guān)文獻(xiàn),熟練掌握matlab設(shè)計實現(xiàn)方案,確
4、定實現(xiàn)算法。了解語音編碼的基礎(chǔ)知識,熟悉語音編碼的種類,初步形成知識體系結(jié)構(gòu)。4月21日至5月15日運(yùn)用matlab語言編寫程序并調(diào)試、驗證,初步完成論文框架、大綱和基礎(chǔ)部分內(nèi)容。5月16日至6月10日正式開始撰寫論文,修改論文,完成最終算法仿真。6月11日至6月14日打印論文,修改格式,微調(diào)內(nèi)容,制作ppt準(zhǔn)備答辯.。主要參考書目(資料主要參考書目(資料(1語音信號處理,趙力編著,機(jī)械工業(yè)出版社,2003(2語音信號處理,姚天任編著,華中理工大學(xué)出版社,1992(3數(shù)字語音編碼原理,鮑長春,西安電子科技大學(xué)出版社,2007(4數(shù)字語音處理及MATLAB 仿真,張雪英,電子工業(yè)出版社,2010
5、(5MATLAB 輔助現(xiàn)代工程數(shù)字信號處理,李勇、徐震,西安電子科技大學(xué)出版社,2002(6數(shù)字信號處理教程Matlab 釋義與實現(xiàn),陳懷琛,電子工業(yè)出版社,2004(7Matlab 寶典,陳杰,電子工業(yè)出版社,2007(8MATLAB 工具箱應(yīng)用,蘇金明、張蓮花、劉波,電子工業(yè)出版社,2003(9MATLAB 基礎(chǔ)與編程入門,張威,科技大學(xué)出版社,2004(10語音信號處理,韓紀(jì)慶、張磊,清華大學(xué)出版社,200411語音信號處理,胡航,哈爾濱工業(yè)大學(xué)出版社,2000主要儀器設(shè)備及材料計算機(jī)一臺Matlab 7.0軟件環(huán)境論文(設(shè)計過程中教師的指導(dǎo)安排每周一上午3、4節(jié)固定時間答疑。其他時間隨
6、時電話或Mail 討論對計劃的說明第一階段:熟悉“語音編碼技術(shù)”的有關(guān)知識,查閱有關(guān)文獻(xiàn)了解基礎(chǔ)知識背景,初步理解語音編碼技術(shù)的原理及算法。開始撰寫開題報告。第二階段:認(rèn)真閱讀有關(guān)文獻(xiàn),熟練掌握matlab 設(shè)計實現(xiàn)方案,確定實現(xiàn)算法。了解語音編碼的基礎(chǔ)知識,熟悉語音編碼的種類,初步形成知識體系結(jié)構(gòu)。第三階段:編寫程序并調(diào)試、驗證。第四階段:結(jié)合實際工作情況撰寫論文,修改論文。第五階段:制作PPT ,準(zhǔn)備答辯 西安郵電大學(xué)畢業(yè)設(shè)計(論文開題報告通信與信息工程學(xué)院院(系電子信息科學(xué)與技術(shù)專業(yè)2009級02班課題名稱:基于matlab的語音編碼技術(shù)的實現(xiàn)學(xué)生姓名:趙荷學(xué)號:04092034指導(dǎo)教師
7、:單潔報告日期:2013年3月15日1.本課題所涉及的問題及應(yīng)用現(xiàn)狀綜述本課題所涉及的問題:1.語音編碼的方式,思路,所用到的技術(shù)有哪些,matlab在語音編碼中的地位和優(yōu)勢有哪些,如何發(fā)揚(yáng)使用這些優(yōu)勢,設(shè)計自己的語音編碼。2.學(xué)習(xí)掌握用matlab實現(xiàn)語音編碼,并與其他軟件實現(xiàn)的語音編碼比較,歸納總結(jié)matlab實現(xiàn)語音編碼的優(yōu)缺點(diǎn)。3.matlab語言的深入學(xué)習(xí),了解matlab強(qiáng)大的功能,靈活運(yùn)用matlab進(jìn)行語音編碼。4.語音編碼的種類有哪些,各自有什么優(yōu)點(diǎn)和缺點(diǎn),應(yīng)用在哪些領(lǐng)域。應(yīng)用現(xiàn)狀綜述:Matlab是由美國mathworks公司發(fā)布的主要面對科學(xué)計算、可視化以及交互式程序設(shè)計
8、的高科技計算環(huán)境。它將數(shù)值分析、矩陣計算、科學(xué)數(shù)據(jù)可視化以及非線性動態(tài)系統(tǒng)的建模和仿真等諸多強(qiáng)大功能集成在一個易于使用的視窗環(huán)境中,為科學(xué)研究、工程設(shè)計以及必須進(jìn)行有效數(shù)值計算的眾多科學(xué)領(lǐng)域提供了一種全面的解決方案,并在很大程度上擺脫了傳統(tǒng)非交互式程序設(shè)計語言(如C、Fortran的編輯模式,代表了當(dāng)今國際科學(xué)計算軟件的先進(jìn)水平。在通信系統(tǒng)中,語音編碼是相當(dāng)重要的,因為在很大程度上,語音編碼決定了接收到的語音質(zhì)量和系統(tǒng)容量。語音編碼為信源編碼,是將模擬語音信號轉(zhuǎn)變?yōu)閿?shù)字信號以便在信道中傳輸。語音編碼的目的是在保持一定的復(fù)雜程度和通信時延的前提下,占用盡可能少的通信容量,傳送盡可能高質(zhì)量的語音。
9、語音編碼技術(shù)又可分為波形編碼、參量編碼和混合編碼三大類。Matlab語言是一種數(shù)據(jù)分析和處理功能十分強(qiáng)大的計算機(jī)應(yīng)用軟件,它可以將聲音文件變換為離散的數(shù)據(jù)文件,然后利用其強(qiáng)大的矩陣運(yùn)算能力處理數(shù)據(jù),如數(shù)字濾波、傅里葉變換、時域和頻域分析、聲音回放以及各種圖的呈現(xiàn)等,它的信號處理與分析工具箱為語音信號分析提供了十分豐富的功能函數(shù),利用這些功能函數(shù)可以快捷而又方便地完成語音信號的處理和分析以及信號的可視化,使人機(jī)交互更加便捷。信號處理是Matlab重要應(yīng)用的領(lǐng)域之一。語音編碼的目的,是尋求語音信號的某種緊縮表示方法,以便能夠在頻帶有限的有線信道的無線信道上有效傳輸,或再介質(zhì)中存儲這些信號時節(jié)約存儲
10、空間。說的更具體一點(diǎn),語音編碼的目的,就是用盡可能少的比特數(shù)以數(shù)字形式表示語音信號,同時保持要求的語音可懂度和語音質(zhì)量。因此,語音編碼又稱語音壓縮編碼或簡稱為語音壓縮。2.本課題需要重點(diǎn)研究的關(guān)鍵問題、解決的思路及實現(xiàn)預(yù)期目標(biāo)的可行性分析關(guān)鍵問題:本課題的設(shè)計重點(diǎn)是語音信號的編碼,本論文針對以上問題,查閱相關(guān)資料,了解語音信號編碼的基本方法,運(yùn)用數(shù)字信號學(xué)基本原理、語音編碼的基礎(chǔ)知識以及matlab的相關(guān)運(yùn)用實現(xiàn)語音編碼,任意選取一種語音編碼的方法,在matlab7.0環(huán)境下編寫程序,完成課題要求。解決思路:1了解語音信號的產(chǎn)生和感知模型查閱相關(guān)資料,了解語音信號的基礎(chǔ)知識。2熟悉語音編碼的性
11、能指標(biāo)了解哪些因素會影響語音編碼,以及在語音編碼中的重要性。3熟悉語音編碼的國際標(biāo)準(zhǔn)了解語音編碼的標(biāo)準(zhǔn)有哪些,選擇適合課題的標(biāo)準(zhǔn)進(jìn)行語音編碼。4了解語音編碼的基本方法熟悉各種語音編碼的優(yōu)缺點(diǎn),了解各自的應(yīng)用領(lǐng)域以及這些編碼方法的重要作用。5基于matlab的語音編碼的實現(xiàn)任選一種語音編碼的方法,借助matlab軟件編寫程序,完成課題要求。預(yù)期目標(biāo):在matlab7.0環(huán)境下綜合運(yùn)用語音信號的編碼及處理知識,實現(xiàn)G.721ADPCM語音編碼。我所做的工作就是了解語音信號的產(chǎn)生和感知模型,熟悉語音信號的性能指標(biāo),了解語音編碼的國際標(biāo)準(zhǔn),并且掌握各種語音編碼的方法,了解各自的優(yōu)缺點(diǎn)及應(yīng)用領(lǐng)域,借助m
12、atlab7.0軟件,編寫程序,最終實現(xiàn)G.721ADPCM的語音編碼。3.完成本課題的工作方案3月11日至3月30日:熟悉“語音編碼技術(shù)”的有關(guān)知識,查閱有關(guān)文獻(xiàn)了解基礎(chǔ)知識背景,初步理解語音編碼技術(shù)的原理及算法。開始撰寫開題報告。4月1日至4月20日:認(rèn)真閱讀有關(guān)文獻(xiàn),熟練掌握matlab設(shè)計實現(xiàn)方案,確定實現(xiàn)算法。了解語音編碼的基礎(chǔ)知識,熟悉語音編碼的種類,初步形成知識體系結(jié)構(gòu)。4月21日至5月15日:運(yùn)用matlab語言編寫程序并調(diào)試、驗證,初步完成論文框架、大綱和基礎(chǔ)部分內(nèi)容。5月16日至6月10日:正式開始撰寫論文,修改論文,完成最終算法仿真6月11日至6月14日:打印論文,修改格
13、式,微調(diào)內(nèi)容,制作ppt準(zhǔn)備答辯.。4.指導(dǎo)教師審閱意見指導(dǎo)教師(簽字:2013年3月24日說明:本報告必須由承擔(dān)畢業(yè)論文(設(shè)計課題任務(wù)的學(xué)生在畢業(yè)論文(設(shè)計正式開始的第1周周五之前獨(dú)立撰寫完成,并交指導(dǎo)教師審閱。西安郵電大學(xué)畢業(yè)設(shè)計(論文成績評定表學(xué)生姓名趙荷性別女學(xué)號04092034專業(yè)班級電科0902班課題名稱基于matlab的語音編碼技術(shù)的實現(xiàn)課題類型軟件工程類難度較難畢業(yè)設(shè)計(論文時間2013年3月11日6月14日指導(dǎo)教師單潔(職稱講師課題任務(wù)完成情況論文(千字;設(shè)計、計算說明書(千字;圖紙(張;其它(含附件:指導(dǎo)老師見分項得分:開題調(diào)研論證分;課題質(zhì)量(論文內(nèi)容分;創(chuàng)新分;論文撰寫
14、(規(guī)范分;學(xué)習(xí)態(tài)度分;外文翻譯分指導(dǎo)教師審閱成績:指導(dǎo)教師(簽字:2012年月日評閱教師意見分項得分:選題分;開題調(diào)研論證分;課題質(zhì)量(論文內(nèi)容分;創(chuàng)新分;論文撰寫(規(guī)范分;外文翻譯分評閱成績:評閱教師(簽字:2012年月日驗收小組意見分項得分:準(zhǔn)備情況分;畢業(yè)設(shè)計(論文質(zhì)量分;(操作回答問題分驗收成績:驗收教師(組長(簽字:2012年月日答辯小組意見分項得分:準(zhǔn)備情況分;陳述情況分;回答問題分;儀表分答辯成績:答辯小組組長(簽字:2012年月日成績計算方法指導(dǎo)教師成績20(%評閱成績30(%驗收成績30(%答辯成績20(% (填寫本系實用比例指導(dǎo)教師成績評閱成績驗收成績學(xué)生實得成績(百分制答
15、辯成績總評答辯委員會意見畢業(yè)論文(設(shè)計總評成績(等級:院(系答辯委員會主任(簽字:院(系(簽章2013年6月15日備注西安郵電大學(xué)畢業(yè)論文(設(shè)計成績評定表(續(xù)表摘要.I ABSTRACT.II 引言. (11緒論 (21.1語音編碼的發(fā)展趨勢 (21.1研究內(nèi)容 (31.2本文使用的軟件Matlab介紹 (31.3運(yùn)行的環(huán)境 (41.4本課題研究的意義 (42.語音信號概述 (52.1語音產(chǎn)生和感知模型 (52.2語音編碼的性能指標(biāo) (62.2.1語音質(zhì)量 (62.2.2比特率 (72.2.3延時 (72.2.4算法復(fù)雜度 (82.3語音編碼的國際標(biāo)準(zhǔn) (83.語音編碼的基本方法 (103.1
16、波形編碼 (103.2參數(shù)編碼 (113.3混合編碼 (124.基與matlab的語音信號波形編碼 (134.1均勻量化PCM (134.2自適應(yīng)量化PCM (144.2.1前饋?zhàn)赃m應(yīng) (144.2.2反饋?zhàn)赃m應(yīng) (154.2.3自適應(yīng)差分脈沖編碼調(diào)制ADPCM (165.G.721ADPCM語音編碼標(biāo)準(zhǔn)的MATLAB實現(xiàn) (216.總結(jié) (23致謝 (24參考文獻(xiàn) (25附錄 (26語音是人們交換信息最方便、最快捷的一種方式,在信息社會高速發(fā)展的今天,使用數(shù)字化的方法進(jìn)行語音的傳輸、儲存、識別、合成以及增強(qiáng)等是數(shù)字化通信網(wǎng)中最重要也是最基本的組成部分之一。隨著人類步入信息社會腳步的加快,越來
17、越多的地方都需要用到語音信號處理的知識。語音編碼的目的就是在保證語音質(zhì)量(不同的領(lǐng)域?qū)φZ音質(zhì)量有著不同的要求的前提下,用盡可能少的二進(jìn)制數(shù)碼對語音信號進(jìn)行正確有效的表示。語音編碼技術(shù)有著非常廣泛的應(yīng)用領(lǐng)域,它是現(xiàn)代通信和信息工程領(lǐng)域不可缺少的關(guān)鍵技術(shù),它已經(jīng)成為信息科學(xué)領(lǐng)域的研究熱點(diǎn)。編碼標(biāo)準(zhǔn)的制定和研究,越來越受重視,許多語音編碼標(biāo)準(zhǔn)正在不同的應(yīng)用領(lǐng)域發(fā)揮著舉足輕重的作用。語音編碼在數(shù)字通信網(wǎng)中占據(jù)著重要的位置,人們對移動電話和IP電話不斷增長的需求很明顯的證明了它活躍的的生命力。隨著通信技術(shù)和信息社會的飛速發(fā)展,頻率資源顯得越來越寶貴。因此,降低電話信道的傳輸碼率又或者是壓縮語音信號的傳輸
18、帶寬,一直以來都是人們所追求的目標(biāo),語音編碼在實現(xiàn)這個目標(biāo)的過程中肩負(fù)著異常重要的角色。數(shù)字語音通信是目前信息產(chǎn)業(yè)中發(fā)展最快也是普及面最廣的業(yè)務(wù)。IP電話的持續(xù)發(fā)展,使得國內(nèi)長途電話和國際長途電話大幅度降價,使廣大人民收益。移動通信的數(shù)字化發(fā)展趨勢,不但有利于擴(kuò)展信道容量,改善服務(wù)質(zhì)量,而且更加促進(jìn)了這一產(chǎn)業(yè)的飛速發(fā)展。語音信號的數(shù)字化和壓縮對軍事通信也有著極其重要的意義??偠灾?數(shù)字語音通信和模擬語音通信相比較,具有保密性好、抗干擾性強(qiáng)、易于開展增值業(yè)務(wù)、控制和管理方便、生產(chǎn)成本低等優(yōu)點(diǎn)。而語音的存儲技術(shù)和語音編碼又是密不可分的。語音應(yīng)答系統(tǒng)、語音信箱、數(shù)字錄音電話、語音查詢系統(tǒng)等,也都是
19、隨著語音壓縮編碼技術(shù)而發(fā)展起來的。關(guān)鍵字:語音編碼,壓縮,語音信號,二進(jìn)制,帶寬,頻率,語音質(zhì)量,傳輸ABSTRACTSpeech is the most convenient to exchange information,the fastest a way,in the high speed developed information society,the evaluated using the method of digital voice transmission,storage,identification,synthesis and enhancement is the most
20、 important in the digital communication network,one of the most basic part.along with the speed up the pace of human into the information society,More and more place need to use knowledge of speech signal processing.Aim is to ensure the quality of voice of speech coding,different areas have differen
21、t requirements for voice qualityunder the premise of as little as possible of the binary number of digital voice signal effectively,speech coding technology has a wide application field,it is indispensable to modern communication and information engineering and key technologies,and it has become a r
22、esearch hotspot in the field of information science.various speech coding standards(national or regional or internationalresearch and develop,has been widespread attention,many language coding standards are play an important role in different application fields.Speech coding occupies an important po
23、sition in the digital communication network, people demand for sustained growth of mobile phone and IP telephone powerful prove its vitality.with the high-speed development of information society and communication technology,Frequency resources become less valuable.therefore,compression of speech si
24、gnal transmission bandwidth or phone channel transmission code rate.Digital voice communication is the fastest development in information industry,the most widely popularization rate of business.The sustainable development of IP telephone, make domestic long distance calls and international long dis
25、tance phone call big price cuts, masses of people.digital mobile communication,expanded the channel capacity,improve the service quality and promote the rapid development of the industry.in the satellite channel.All in all,digital voice communication compared to analog voice communications, is featu
26、red by strong anti-interference,the secrecy good,easy to carry out value-added services,management,and convenient control,low production cost advantages.And voice storage technology and speech coding are inseparable.voice response system,digital recording telephone,voice mail,voice inquiry system,et
27、c.,are also developed with voice compression coding.Keywords:speech,coding;compress;speech,signal;binary,system;bandwidth;frequency;spe ech quality;transmission引言語音是人類相互之間交流時最常使用的信息載體。在信息化高度發(fā)展的今天,語音處理技術(shù)以及它的應(yīng)用已經(jīng)成為信息化社會不可缺少的重要組成部分。語音的產(chǎn)生是一個非常復(fù)雜的過程,包括心理和生理等方面的一系列動作。當(dāng)人們需要通過語言表達(dá)某種信息的時候,這種神經(jīng)信號就會作用于發(fā)生器官從而產(chǎn)生
28、攜帶信息的語音信號。語音信號處理的研究產(chǎn)生于對發(fā)生器官的模擬。1939年,美國人H.Duley展出了一個非常簡單的發(fā)聲過程模擬系統(tǒng),之后發(fā)展成為聲道的數(shù)字模型。利用這個模型就可以對語音信號進(jìn)行各種頻譜以及參數(shù)的分析,同時也可以根據(jù)分析獲得的頻譜特征或參數(shù)變化規(guī)律來合成語音信號,實現(xiàn)機(jī)器的語音合成。目前,對語音信號進(jìn)行研究,一般都是基于語音信號的數(shù)字表示。因此,語音信號數(shù)字處理的基礎(chǔ)就是語音信號的數(shù)字表示。我們熟知的采樣定理是語音信號數(shù)字化的理論依據(jù)。語音信號離散表示的方法可以分為兩類:波形表示和參數(shù)表示,通過采樣和量化的過程來保存模擬語音信號“波形”的方法即為波形表示,而參數(shù)表示是把語音信號表
29、示成為某種語音產(chǎn)生模型的輸出。為了得到參數(shù)表示,就必須對語音信號進(jìn)行采樣和量化,然后再進(jìn)一步處理以得到語音信號產(chǎn)生模型的參數(shù)。語音信號產(chǎn)生模型的參數(shù)一般可以分為了兩大類:一類是激勵參數(shù),另一類是聲道參數(shù)。一直以來,人們都很重視對語音信號和語音通信的研究。社會的進(jìn)步對于語音通信提出了更高的要求,需要更低的數(shù)碼率和更高的語音質(zhì)量,從而推動了語音編碼技術(shù)的發(fā)展。然而自動控制和計算機(jī)科學(xué)的發(fā)展又要求用語音溝通人與機(jī)器的信息交流,要求機(jī)器能聽懂人說話并且能對人說話,甚至還能辨別得出是誰在說話,這又推動了語音識別、說話人識別以及語音合成的研究,從而使語音處理的技術(shù)得到了迅速的發(fā)展。語音編碼、說話人識別、語
30、音信箱、語音合成等技術(shù)的基礎(chǔ),都是對語音信號特征的進(jìn)一步深入的認(rèn)識,都要利用數(shù)字信號處理的一些技術(shù)來處理和分析語音信號,而更深層次的發(fā)展則涉及到了人的聽覺機(jī)理和發(fā)音機(jī)理,與生理學(xué)、語言學(xué)甚至心理學(xué)都有關(guān)。1緒論1.1語音編碼的發(fā)展趨勢從1980年至今,在語音編碼的領(lǐng)域,已經(jīng)做出了特別多重要的進(jìn)展。這些進(jìn)展的取得主要有以下幾種原因:對語音信號的結(jié)構(gòu)和語音的產(chǎn)生機(jī)理有了更加深入的理解。對人類聽覺系統(tǒng)的深入理解,利用了人耳的掩蔽效應(yīng),提出了有利于實現(xiàn)的理解加權(quán)濾波器方案。更加優(yōu)良的量化技術(shù)被提出了,特別是合成-分析的技術(shù),使得重構(gòu)語言的質(zhì)量有了顯著的提高。數(shù)字信號處理芯片(DSP的大量使用,為語音編
31、碼器的商品化打下了堅實的基礎(chǔ)。這些發(fā)展趨勢一直在繼續(xù),至少目前的狀況就是這樣的。我們已經(jīng)看到,ITU-T語音編碼的專家組,研究的焦點(diǎn)有移動的傾向。大約在1992年以前,在語音編碼上的主要進(jìn)展,大都是基于線性預(yù)測的,是在使用合成-分析法的基礎(chǔ)上得到的。這些年以來,對于4.8kib/s到16kib/s間的比特率,這種方法近乎占據(jù)了統(tǒng)治地位。但是,現(xiàn)在有情況顯示,如果比特率降低到4.8kib/s以下,基于線性預(yù)測的合成分析方法,超過其他方法的優(yōu)點(diǎn)就會逐漸減少。語音編碼所需要的最低信息速率,是一個異常復(fù)雜的問題。它被多種因素所限制,但是,作為一個低限,臨界信息速率是人們理解信號所需要的速率。這個問題還
32、需要我們繼續(xù)深入的研究,因為有關(guān)于語音信號的某些信息,雖然人能夠感覺到有變化,但是編碼器卻找不到對應(yīng)的特征參量。相反的,有時候語音的特征參量和波形變化很大,但人依舊可以毫無障礙的理解。例如一個發(fā)音人,他將一段文章連續(xù)讀兩次,產(chǎn)生了兩段非常不同的波形,但是,這些差別并不會影響收聽者的理解。因此,要說語音編碼器具有多少比特率,才是最終的結(jié)果,目前還是很困難的。但是,要達(dá)到這個目標(biāo),對人腦感知信號的過程,必須有更加深入的研究,這是一項長期而艱巨的工作。語音通信是人類通信最基本也是最重要的方式之一。語音信號的數(shù)字化傳輸和存儲,在抗干擾能力、快速交換、可靠性等方面遠(yuǎn)遠(yuǎn)勝過模擬化,而且靈活方便,易于保密,
33、價格低廉,因此數(shù)字化語音在通信系統(tǒng)中所占的比重越來越大。語音編碼是數(shù)字語音通信中的一項極其重要的技術(shù),為了能夠使同樣的信道容量能傳輸更多路的語音信號并且能節(jié)省存儲空間,隨著通信技術(shù)的發(fā)展,語音編碼技術(shù)也取得了很大的進(jìn)展,并且在短波、超短波、地面微波和衛(wèi)星通信系統(tǒng)中得到了非常廣泛的應(yīng)用。1.1研究內(nèi)容本論文主要介紹的是的語音信號的編碼。本論文針對以上問題,運(yùn)用數(shù)字信號學(xué)基本原理實現(xiàn)語音信號的編碼,在matlab7.0環(huán)境下綜合運(yùn)用語音信號的編碼及處理知識,實現(xiàn)G.721ADPCM語音編碼。我所做的工作就是了解語音信號的產(chǎn)生和感知模型,熟悉語音信號的性能指標(biāo),了解語音編碼的國際標(biāo)準(zhǔn),并且掌握各種語
34、音編碼的方法,了解各自的優(yōu)缺點(diǎn)及應(yīng)用領(lǐng)域,借助matlab7.0軟件,編寫程序,最終實現(xiàn)G.721 ADPCM的語音編碼。1.2本文使用的軟件Matlab介紹Matlab是美國MathWorks公司出品的一款商業(yè)數(shù)學(xué)軟件,應(yīng)用于算法開發(fā)、數(shù)據(jù)可視化、數(shù)據(jù)分析及數(shù)值計算的高級技術(shù)計算語言和交互式環(huán)境,主要包括Matlab 和Simulink兩部分。Matlab在現(xiàn)實中應(yīng)用十分廣泛,隨處可見,在各個領(lǐng)域都有著廣泛的使用。Matlab是矩陣實驗室(Matrix Laboratory的簡稱,和Mathematica、Maple 并稱為三大數(shù)學(xué)軟件(7。它在數(shù)值計算方面以及數(shù)學(xué)類科技應(yīng)用軟件中都是占據(jù)著
35、重要的地位。Matlab的基本數(shù)據(jù)單位是矩陣,它的指令表達(dá)式與數(shù)學(xué)、工程中常用的形式很相似,所以用Matlab解算問題要比用C,FORTRAN等語言來做相同的事要簡單很多,而且mathwork也吸收了像Maple等軟件的諸多優(yōu)點(diǎn),使Matlab成為一種強(qiáng)大的數(shù)學(xué)軟件。此外,許多Matlab愛好者都編寫了一些經(jīng)典的程序,用戶可以直接下載就可以使用。Matlab語言具有開放的源程序,除了內(nèi)部函數(shù)以外Matlab核心文件和工具箱文件都是可讀可改的源文件,用戶可以通過對源文件的修改以及加入自己的函數(shù)文件而構(gòu)成自己的專用工具箱。Matlab語言靈活,方便易學(xué)。Matlab語言調(diào)試手段豐富,調(diào)試速度快,把
36、編輯、編譯、連接和執(zhí)行融為一體,不必要求用戶具有高深的數(shù)學(xué)和程序語言設(shè)計的知識,不必要求用戶深刻的了解算法和編程技巧。信號處理是Matlab 的重要應(yīng)用領(lǐng)域之一。1.3運(yùn)行的環(huán)境運(yùn)行環(huán)境主要介紹了硬件環(huán)境和軟件環(huán)境。硬件環(huán)境:(1處理器:AMD三核羿龍?zhí)幚砥鱊830(2內(nèi)存:2GB(3硬盤空間:500GB軟件環(huán)境:操作系統(tǒng):Window7開發(fā)環(huán)境主要介紹了本系統(tǒng)所采用的操作系統(tǒng)、開發(fā)語言。(1操作系統(tǒng):Windows7家庭版(2開發(fā)環(huán)境:Matlab7.01.4本課題研究的意義語音編碼的目的,就是為了尋求語音信號的某種緊縮表示方法,以便能夠在頻帶有限的有線信道和無線信道上有效傳輸,或在介質(zhì)中存
37、儲這些信號時節(jié)約了存儲空間。說的更具體一點(diǎn),語音編碼的目的,就是用盡可能少的比特數(shù)以數(shù)字形式表示語音信號,同時保持要求的語音可懂度和語音質(zhì)量(2。因此,語音編碼又稱語音壓縮編碼或簡稱為語音壓縮。推動語音編碼技術(shù)發(fā)展的最主要因素,是數(shù)字通信的發(fā)展,以及對降低比特率和節(jié)約帶寬的普遍需要。語音編碼就是在降低比特率和保持語音質(zhì)量之間進(jìn)行權(quán)衡的,在某些應(yīng)用中還必須要考慮編解碼的復(fù)雜度、編碼延時,以及與誤碼和丟包有關(guān)的性能等其他因素。語音編碼的對象是數(shù)字化的語音信號和音頻信號,語音信號編碼有特別廣泛的應(yīng)用領(lǐng)域,其中包括:通信,數(shù)字同步的聲音和數(shù)據(jù)及大量的基于PC的游戲和多媒體應(yīng)用等。2.語音信號概述2.1
38、語音產(chǎn)生和感知模型語音編碼是通過去除語音信號內(nèi)的冗余量來降低碼率的,因此,理解語音信號的產(chǎn)生和感知原理對于涉及語音編碼器是非常重要的。在理想的情況下,一個設(shè)計合理的編碼器只需要對感知相關(guān)的參數(shù)進(jìn)行編碼就可以獲得高質(zhì)量的重建語音。在語音產(chǎn)生時,肺部排出空氣形成氣流。當(dāng)空氣經(jīng)過聲帶時,如果聲帶是緊繃的,則聲帶將產(chǎn)生張弛振動,聲帶會形成周期性的打開和關(guān)閉1。聲帶開啟時,空氣流會從聲門噴射出來,形成一個脈沖;聲帶閉合時,相當(dāng)于間歇期的脈沖序列。因此,這種情況下會在聲門處產(chǎn)生一個準(zhǔn)周期性脈沖序列的空氣流,該空氣流經(jīng)過聲道后最終從嘴唇輻射出聲波,這便是“濁音”語音1。如果聲帶是完全舒展開的,則肺部發(fā)出的空
39、氣流將會毫無阻礙的的通過聲門??諝饬魍ㄟ^聲門后,會遇到兩種不同的情況。一種情況是,如果聲道的某個部位發(fā)生收縮從而形成一個狹窄的通道,當(dāng)空氣流到達(dá)此處時被迫以高速沖過收縮區(qū),并且在附近產(chǎn)生出空氣的湍流,這種湍流空氣通過聲道后便形成“摩擦音”或“清音”1;另一種情況是,假設(shè)聲道的某個部位完全閉合在了一起,則當(dāng)空氣流到達(dá)時便在此處形成空氣壓力,一旦閉合點(diǎn)突然開啟,氣壓便會快速釋放,“爆破音”就是這樣形成的。這樣看來,語音是由空氣流激勵聲道最后從嘴唇或鼻孔或同時從嘴唇和鼻孔輻射出來而產(chǎn)生的2。濁音、清音以及爆破音三種不同類型的語音的激勵源是不同的。濁音的激勵源是位于聲門處的準(zhǔn)周期脈沖序列,清音的激勵源
40、則是位于聲道的某個收縮區(qū)的空氣湍流(類似于噪音,而爆破音的激勵源是位于聲道某個閉合點(diǎn)處建立起來的氣壓及其突然釋放2。三種激勵方式將聲音產(chǎn)生出來之后,聲音便會順著聲道進(jìn)行傳播。聲道就猶如一個具有某種諧振特性的腔體,而聲音就是從這樣一個腔體中間通過。腔體的一組諧振點(diǎn)被稱之為共振峰,聲道的頻譜特性就是由這些共振峰的位置及各個峰的寬度所決定的,聲道的形狀和尺寸由共振峰以及其帶寬取定。聲道共振特性會影響輸出的氣流頻率。諧波成分蘊(yùn)含在聲門脈沖序列當(dāng)中,這些頻率成分與聲道的共振峰頻率之間相互作用,語音的音質(zhì)會受到其很大的影響。共振峰頻率與聲道傳輸函數(shù)相對應(yīng),當(dāng)鼻道關(guān)閉,并且聲門振動是唯一的激勵源時,聲道傳輸
41、函數(shù)就不會出現(xiàn)有限的零點(diǎn),這將很大程度上簡化了分析。為了精確的描述語音,必須采用盡可能多的共振峰,但是在實際應(yīng)用中,只有頭三個共振峰才是最重要的。語音信號的頻譜特征可以表現(xiàn)出語音產(chǎn)生的時域性質(zhì)。濁音信號的頻譜表現(xiàn)出了相當(dāng)明顯的諧振結(jié)構(gòu),諧振頻率就相當(dāng)于聲門開合的基音頻率,但諧振結(jié)構(gòu)在清音信號中不存在,白噪聲譜和其頻譜更為相似。除了在濁音時存在一定的譜傾斜之外,明顯的譜包絡(luò)在聲門激勵中是不存在的。語音信號的譜包絡(luò)是因為聲門激勵通過聲道的原因。聲道的頻率響應(yīng)不是很平坦導(dǎo)致了在相鄰的語音信號間需要引入一定的相關(guān)性,這種相關(guān)性一般稱之為短時相關(guān)性。此外,因為濁音時激勵信號所具有周期特征,因此,又會導(dǎo)致
42、相鄰基音脈沖中對應(yīng)樣點(diǎn)之間的相關(guān)性,區(qū)別于短時相關(guān)性的這種相關(guān)性稱之為長時相關(guān)性2。在頻域上,信號的包絡(luò)譜對應(yīng)短時相關(guān)性,而頻率的精細(xì)結(jié)構(gòu)則對應(yīng)長時相關(guān)性。信號間的冗余度就可以由這兩種相關(guān)性而引入,這就需要語音編碼技術(shù)采用合理的方法來解決,常采用的方法有LPC 分析、基音預(yù)測器等。圖 2.1語音信號產(chǎn)生的數(shù)字模型由上面分析可知,一個簡單的語音產(chǎn)生源濾波器模型在實際應(yīng)用時往往將聲門脈沖模型、聲道響應(yīng)和輻射效應(yīng)結(jié)合起來用一個時變?yōu)V波器來表示。語音的聽覺感知是一個復(fù)雜的人腦-心理過程。目前,我們對聽覺感知的研究還很不成熟,聽覺感知的實驗主要還在測試響度、音高和掩蔽效應(yīng)等階段。人耳聽覺界限的頻率范圍大
43、約為20Hz20kHz 。在頻率范圍低端,感覺聲音變成低頻脈沖串,在高端感覺聲音減小直至完全聽不到一點(diǎn)聲響。語音感知的強(qiáng)度范圍是0130dB 聲壓級(基準(zhǔn)聲壓級為10-10W/cm 2,聲音強(qiáng)度太高,就會讓人感到難以忍受,強(qiáng)度太低則會感到寂靜無聲。2.2語音編碼的性能指標(biāo)2.2.2.2.11語音質(zhì)量這里所說的語音質(zhì)量是指解碼器輸出語音的質(zhì)量。語音質(zhì)量包括了語音的可懂度、自然度,以及說話人辨識等多個方面。評估編碼語音質(zhì)量的理想條件是:輸入語音清晰(無背景噪聲,無傳輸誤碼,一次編碼。重要的是,在理想條件下解碼后的語音聽起來感覺到的質(zhì)量如何。但是實際上卻是很難滿足這些理想條件的,因為,大多數(shù)實際應(yīng)用
44、環(huán)境都存在著大量的背景噪聲;傳輸過程中有誤碼(個別比特誤碼,甚至整幀丟失;在會議電視等諸多應(yīng)用中常常需要橋接好幾個呼叫者,以便使每個呼叫者都能聽到其他呼叫者的談話,因此,就會要求語音編解碼器把每個呼叫者的碼流解碼后再進(jìn)行相加,并且將相加結(jié)果重新進(jìn)行編碼,這就會出現(xiàn)多次編碼和解碼的情況,甚至?xí)霈F(xiàn)不用編碼標(biāo)準(zhǔn)進(jìn)行級聯(lián)的情況。在評估語音質(zhì)量的時候,所有這周期脈沖發(fā)生器聲門脈沖模型G (Z 白噪聲發(fā)生器聲道模型V (Z 輻射模型R (Z 基音頻率聲道參數(shù)語音信號S (n 振幅A V 振幅A u些情況都應(yīng)該加以考慮。評估語音質(zhì)量有主觀和客觀兩類度量標(biāo)準(zhǔn)。大多數(shù)客觀度量標(biāo)準(zhǔn)是以分貝(dB數(shù)表示的信噪比(
45、SNR為基礎(chǔ)的3?;赟NR的度量主要用來說明重建語音與原始語音波形的近似程度,因此適合用于波形編碼,這種度量的計算過程簡單,而且可以根據(jù)它來確定重建語音的增益及延時。但是,它沒有考慮到人耳的聽覺感知特性,因此,在傳輸速度有限的應(yīng)用中,經(jīng)常會出現(xiàn)信噪比高的重建語音不一定對應(yīng)于聽覺感知好的語音質(zhì)量,即會出現(xiàn)客觀度量的語音質(zhì)量與主觀聽覺感知的語音質(zhì)量不一致的情況。所以在低比特率編碼的應(yīng)用中,常常不使用客觀度量的方法而主要使用主觀度量的方法。2.2.2比特率比特率又稱為碼率,是指對長為1s的語音信號進(jìn)行數(shù)字編碼所用的比特數(shù),度量單位是每秒比特(b/s3。比特率反映的是語音被壓縮的程度,比特率越低說明
46、語音壓縮程度越高。編碼語音具有較高的比特率,意味著它要求占用較寬的帶寬。編碼語音常常與其他數(shù)據(jù)公用一個信道,因此,總是希望在保證滿足解碼語音質(zhì)量要求的前提下,使編碼語音的最大比特率盡可能降低,以使占用的信道帶寬盡量的小。大多數(shù)語音編碼器工作在固定的比特率,但卻不管輸入語音信號的特性。在多媒體應(yīng)用的情況下,由于編碼語音與其他形式的信號共享同一信道,因此最好能使編碼器的比特率是可變的。在語音和數(shù)據(jù)同時在同一個信道上傳送的應(yīng)用中,可以在語音信號的時段(語音活動期使用一個固定的比特率,而在沒有語音信號的時段(只有背景噪音的靜默期使用一個較低的比特率,這就是所謂的靜默期壓縮方法。在采用靜默期壓縮方法時,
47、把靜默期的比特率降到零(不傳送任何比特的做法是不可取的,因為人們習(xí)慣于在靜默期聽到有低電平的背景噪聲而不習(xí)慣于死一般的寂靜。如果在靜默期沒有傳送任何比特,那么,在解碼時應(yīng)該人為地生成一種讓人聽了感到舒服的背景噪聲加入到靜默期中,這就是所謂的“舒適噪聲生成”方法3。為了使語音活動段與靜默期之間平滑過渡,要求編碼端和解碼端準(zhǔn)確同步;由于在靜默期沒有傳送任何比特,因此這種同步有時是很困難的。比特率與語音編碼有著密切的關(guān)系,一般的趨勢是比特率越高解碼語音質(zhì)量越好。具體來說,廣播質(zhì)量語音的比特率至少應(yīng)該大于64kb/s;長途電話質(zhì)量語音的比特率為864kb/s,取決于語音編碼器的復(fù)雜度;通信質(zhì)量語音的比
48、特率為4.8 12kb/s;合成語音質(zhì)量的比特率一般都低于4.8kb/s。2.2.3延時語音編碼系統(tǒng)的延時由運(yùn)算延時、處理延時和通信延時等3部分組成。許多低比特率語音編碼器對數(shù)據(jù)的處理和傳送是逐幀進(jìn)行的,此外,有時為了能夠?qū)π盘栠M(jìn)行更加充分的分析和處理,需要使用一幀數(shù)據(jù)之前的若干數(shù)據(jù)(稱為欲做準(zhǔn)備數(shù)據(jù),因此,需要首先把一幀數(shù)據(jù)和其前面的若干數(shù)據(jù)加以緩存,然后才能開始對這幀語音進(jìn)行編碼,由此產(chǎn)生的延時稱為運(yùn)算延時。但是無論怎么樣改變編碼和解碼的方案,運(yùn)算延時卻是無法減小的,但是其他兩種延時是能夠通過硬件的改進(jìn)來減小的。編碼器的編碼時間和解碼器重建語音的時間總和稱之為處理延時。處理延時取決于編碼和
49、解碼的算法,以及實現(xiàn)編碼器和解碼器的硬件速度。運(yùn)算延時與處理延時之和稱為單向編解碼延時。一幀數(shù)據(jù)從進(jìn)入編碼器輸入端算起,直到由解碼器輸出端輸出,中間不經(jīng)過信道,總共需要的時間,稱之為通信延時。上述的運(yùn)算延時、處理延時和通信延時的總和稱為編碼系統(tǒng)的單向系統(tǒng)延時。在通信系統(tǒng)中,如果存在著由阻抗不匹配而產(chǎn)生的回聲,那么,編碼延時將會增大回聲對聲音信號的影響,并使語音信號的質(zhì)量下降。所以,在沒有回聲的情況下,最大單向系統(tǒng)延時不大于200ms。在有回聲的情況下,要求最大單向系統(tǒng)延時不大于25ms。因此,通信系統(tǒng)中常常需要使用回聲消除器。2.2.4算法復(fù)雜度語音編碼的算法復(fù)雜度直接決定了硬件實現(xiàn)的復(fù)雜性、
50、體積、功率消耗以及價格等指標(biāo)。大多數(shù)實時語音編碼算法是在數(shù)字信號處理器DSP上實現(xiàn)的。因此,一個比較復(fù)雜的算法要求功能更加強(qiáng)大的DSP芯片。DSP芯片的運(yùn)算速度用單位時間(每秒執(zhí)行百萬條指令數(shù)(MIPS來表示。低復(fù)雜度語音編碼器需要的運(yùn)算速度低于15MIPS,高復(fù)雜度的語音編碼器需要的運(yùn)算速度高于30MIPS,中復(fù)雜度語音編碼器需要的運(yùn)算速度介于這兩個數(shù)值之間。算法復(fù)雜度是設(shè)計或選擇語音編碼算法時需要重點(diǎn)考慮的因素。增加編碼算法的復(fù)雜度意味著增加硬件實現(xiàn)的成本、增加硬件的功率消耗(對于便攜式設(shè)備來說,意味著電池充時間間隔縮短。另一個需要考慮的因素是語音編碼器的功率消耗和價格在整個系統(tǒng)中所占的比
51、例。為了達(dá)到給定的比特率,如果能夠把這個比重控制在10%左右,可以盡量選擇最好的編碼器算法,因為各種不同編碼器的功率消耗和價格之間的差別一般不足以改變這個比重。但是如果這個比重偏大,選擇最適合的編碼器就非常有必要了。2.3語音編碼的國際標(biāo)準(zhǔn)由于數(shù)字語音編碼技術(shù)具有廣闊的應(yīng)用范圍和良好的市場前景,從20世紀(jì)80年代開始,國際上著名的通信研究機(jī)構(gòu)和大學(xué)均大力開展高音質(zhì)低碼率的語音編碼技術(shù)的研究,并且取得了豐碩的成果,因此,語音編碼技術(shù)的標(biāo)準(zhǔn)化工作就顯得尤為重要。ITU在語音編碼技術(shù)的標(biāo)準(zhǔn)化方面做了大量的工作,制定了很多標(biāo)準(zhǔn),并且逐漸受到了業(yè)界的認(rèn)同。在其中,比較典型的有G.711、G.711、G.
52、721、G.728、G.729等標(biāo)準(zhǔn)。(1G.711標(biāo)準(zhǔn)最早的語音編碼方案是PCM編碼,PCM的碼率是64kbps。對語音信號按照8kHz 進(jìn)行采樣,再對每一個樣本做8bit的標(biāo)量量化。這種方案只能將語音由模擬信號變?yōu)閿?shù)字信號,但卻沒有做任何進(jìn)一步的數(shù)學(xué)處理。雖然它的碼率很高,但是處理程序卻很簡單,至今仍然在很多的場合中被采用。它被ITU定為G.711。(2G.721標(biāo)準(zhǔn)G.711標(biāo)準(zhǔn)產(chǎn)生之后,人們在語音壓縮編碼領(lǐng)域投入了大量的精力進(jìn)行研究。經(jīng)很長時間的研究,一種致力于消除語音信號樣本間相關(guān)性的線性預(yù)測編碼算法被科學(xué)家們提出了。它可以在基本保證音質(zhì)的條件下,使碼率有了較大程度的壓縮。利用當(dāng)時還
53、處于初級階段的線性預(yù)測方法,科學(xué)家們成功開發(fā)出了碼率為32kbps(相對于PCM碼,它被壓縮了一半的增量調(diào)制編碼ADPCM方案,但音質(zhì)略次于PCM編碼,可懂度和自然度都很不錯,立即就受到了人們的親睞。它被ITU定為G.721標(biāo)準(zhǔn)。(3G.728標(biāo)準(zhǔn)正當(dāng)人們對線性預(yù)測編碼技術(shù)進(jìn)行深入研究的時候,另外一種利用相關(guān)性壓縮量化編碼的方法即矢量量化方法被提出來。該技術(shù)在壓縮量化編碼上的效率很高,但其缺點(diǎn)是計算量太龐大,隨著IC技術(shù)的不斷發(fā)展,計算機(jī)和DSP的運(yùn)行處理速度加快,這種編碼方式的可行性就越加的明顯。不過現(xiàn)代的計算機(jī)和DSP芯片已經(jīng)能夠滿足它的計算要求。把矢量量化技術(shù)和線性預(yù)測編碼技術(shù)聯(lián)合起來使
54、用,就產(chǎn)生了許多比較成功的音質(zhì)較好的線性預(yù)測編碼方法3。例如:多脈沖激勵線性預(yù)測編碼算法。規(guī)則脈沖激勵線性預(yù)測編碼算法以及碼激勵線性預(yù)測編碼算法(即CELP算法等。其中由CELP算法衍生出的低延時碼激勵線性預(yù)測編碼算法更為成熟,1991年被ITU定為G.728標(biāo)準(zhǔn)。LD-CELP算法的語音質(zhì)量不低于ADPCM,但其碼率又比ADPCM降低了一倍,即為16kbps。(4G.729標(biāo)準(zhǔn)保持高音質(zhì)就是要使合成原始語音的均方誤差始終小到不易察覺。在這樣的前提下,通過改進(jìn)算法,達(dá)到進(jìn)一步壓縮碼率的目的CS-ACELP算法就是該思路的歷史產(chǎn),它實現(xiàn)了8kbps的碼率,比LD-CELP又降低了一倍,然而它所達(dá)
55、到的語音質(zhì)量卻一點(diǎn)也不亞于G.721標(biāo)準(zhǔn),但卻比G.721標(biāo)準(zhǔn)碼率壓縮了整整四倍。ITU在1996年將CS-ACELP算法制定為G.729標(biāo)準(zhǔn)。在實際選擇語音編碼標(biāo)準(zhǔn)時,要綜合考慮帶寬、時延、算法復(fù)雜度等各種因素。3.語音編碼的基本方法3.3.11波形編碼波形編碼是最簡單也是應(yīng)用最早的語音編碼方法。最基本的一種就是PCM編碼,如G.711建議中的A律或律。APCM、DPCM和ADPCM也屬于波形編碼的范疇,使用這些技術(shù)的標(biāo)準(zhǔn)有G.721、G.726、G.727等。波形編碼具有算法簡單,自適應(yīng)能力強(qiáng)和語音質(zhì)量高等特點(diǎn)。因此,在1664kb/s的碼率范圍已經(jīng)獲得了廣泛的應(yīng)用。由于波形編碼只著眼于信
56、號波形,而不管信號是如何產(chǎn)生的,因此,在需要對語音信號和非語音信號都進(jìn)行成功編碼的應(yīng)用中是最有用的。例如,在PSTN中需要同時成功傳輸調(diào)制解調(diào)器和傳真的信令音,信號的交換和語音的成功傳輸差不多同等重要。應(yīng)用最普遍的波形編碼有均勻16bPCM、壓擴(kuò)8bPCM和ADPCM。但是,波形編碼的碼率無法進(jìn)一步降低,因為如果把碼率降到16kb/s以下,那么將得不到令人聽覺滿意的語音質(zhì)量。抽樣量化編碼數(shù)字通信系統(tǒng)解碼低通濾波器模擬信號模擬信號P C M信 號P C M信號模/數(shù)變換數(shù)/模變換圖 3.1PCM原理圖其他重要的波形編碼方法還有變換編碼和子帶編碼,一般認(rèn)為變換編碼在語音信號中作用不是很大,但在音頻信號中它卻是主要的壓縮方法。變換編碼的原理是:首先把語音信號在時域內(nèi)分成相繼的幀(可以有部分重疊,典型情況下沒幀包含64 512個取樣值;然后對每幀信號進(jìn)行某種酋變換,得到一組變換系數(shù),然后對每組變換系數(shù)獨(dú)立的進(jìn)行量化和編碼。在接收端,對接收到的碼字解碼后得到變換系數(shù),然后對每組變化系數(shù)進(jìn)行相應(yīng)的逆變換,恢復(fù)出每幀語音信號,最后將所有幀信號連接起來(如有重疊則進(jìn)行疊接相加便得到重構(gòu)語音信號。設(shè)計得好的變換能夠把信息和能量集中于少數(shù)變換系數(shù),因此在對
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 旅游景區(qū)擴(kuò)建用地居間
- 新能源汽車充電樁上市公司
- 新能源技術(shù)發(fā)展及應(yīng)用練習(xí)題
- 三農(nóng)村電商三農(nóng)村電商與旅游融合方案
- 農(nóng)業(yè)綜合開發(fā)項目可行性研究報告
- 醫(yī)療器械可行性分析報告模板
- 磐安縣生活垃圾焚燒發(fā)電項目
- 電影娛樂產(chǎn)業(yè)制作與發(fā)行指南
- 品牌傳播策略實施方案
- 三農(nóng)創(chuàng)新驅(qū)動發(fā)展戰(zhàn)略作業(yè)指導(dǎo)書
- 傳染病習(xí)題庫與參考答案
- 四川省2024年普通高等學(xué)校高職教育單獨(dú)招生文化考試數(shù)學(xué)試題
- 3.1公民基本權(quán)利(課件 )-2024-2025學(xué)年八年級道德與法治下冊 (統(tǒng)編版)
- GB/T 44934-2024電力儲能用飛輪儲能單元技術(shù)規(guī)范
- 教師專業(yè)發(fā)展與教學(xué)質(zhì)量的關(guān)系-深度研究
- 地震資料解釋基礎(chǔ)
- 四川省綿陽市2025屆高三第二次診斷性考試思想政治試題(含答案)
- 兒童故事繪本愚公移山課件模板
- 人教版七年級下冊地理第一次月考試卷
- 體育產(chǎn)業(yè)園區(qū)規(guī)劃與運(yùn)營管理方案設(shè)計
- 護(hù)理查房百日咳
評論
0/150
提交評論