音頻技術(shù)基礎(chǔ)

上傳人：宿*** IP屬地：廣東上傳時(shí)間：2022-11-10 格式：PPT 頁數(shù)：98 大?。?.08MB 積分：30 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩93頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第二章音頻技術(shù)基礎(chǔ)

人類從外界獲得的信息大約有16%是從耳朵得到的。在多媒體技術(shù)中，音頻信息占有很重要的地位，比如在視頻會(huì)議系統(tǒng)中,音頻信息的優(yōu)先級(jí)最高。了解音頻信息的相關(guān)知識(shí)對(duì)更進(jìn)一步掌握多媒體技術(shù)是很重要的。一切能發(fā)出聲音的物體稱為聲源。聲音是由于聲源的振動(dòng)而產(chǎn)生的，由于聲源的振動(dòng)，借助于它們周圍的介質(zhì)，把這種振動(dòng)以機(jī)械波的形式由近及遠(yuǎn)地傳向遠(yuǎn)方，這就是聲波。聲波傳入人耳，致使耳膜也產(chǎn)生振動(dòng)，這種振動(dòng)被傳導(dǎo)到聽覺神經(jīng)，人們就產(chǎn)生了“聲音”的感覺。我們?nèi)粘Ｂ牭降穆曇羰且环N模擬信號(hào).聲學(xué)基礎(chǔ)知識(shí)●

聲音定義聲音是振動(dòng)波，具有振幅、周期和頻率.●

聲音的質(zhì)量簡(jiǎn)稱音質(zhì)。音質(zhì)與頻率范圍成正比，頻率范圍越寬音質(zhì)越好.聲音具有連續(xù)性和過程性，數(shù)據(jù)前后相關(guān)，數(shù)據(jù)量大，具有實(shí)時(shí)性.●

聲音的連續(xù)時(shí)基性●

聲音三要素(1)音調(diào)—(高低)(2)音強(qiáng)—(強(qiáng)弱)(3)音色—(特質(zhì))聲音的三要素音調(diào)：(高低)與聲音的頻率有關(guān)，頻率快則聲音高，頻率慢則聲音低。音強(qiáng)：(強(qiáng)弱)又稱響度，取決于聲音的振幅，也即振幅的大小和強(qiáng)弱。音色：(特質(zhì))由混入基音的諧音決定。每個(gè)基音都有其固定頻率,和不同音強(qiáng)的諧音混合，使得每個(gè)聲音具有特殊的音色效果。聲音的頻率范圍模擬波信號(hào)有三個(gè)要素：基線、周期和振幅。振幅即波形的最高點(diǎn)（或最低點(diǎn)）與基線間的距離，它表示了聲音音量的大小。周期是波形中兩個(gè)相鄰波峰之間的距離，它表示完成一次振動(dòng)過程所需的時(shí)間，其大小體現(xiàn)了振動(dòng)的速度。頻率是周期的倒數(shù)，周期越短，頻率越高。頻率的單位為赫茲(Hz)。人的耳朵只能感覺到振動(dòng)頻率在20Hz到20000Hz之間的聲波，超出此范圍的振動(dòng)波不能引起聽覺器官的感覺。其中，人耳對(duì)400-4000HZ的聲波最敏感。

次聲波人耳可聽域超聲波<20Hz20～20,000Hz>20,000Hz女性語音150Hz～10,000Hz電話語音200Hz～3,400Hz調(diào)幅廣播(AM)50Hz～7,000Hz調(diào)頻廣播(FM)20Hz～15,000Hz高級(jí)音響10Hz～40,000Hz男性語音100Hz～9,000Hz聲源種類頻帶寬度頻帶寬度

聲音質(zhì)量等級(jí)與信號(hào)帶寬的關(guān)系

電話AM廣播FM廣播CD－DA1020502003.4K7K15K22Kf(Hz)音頻信號(hào)特性分析●時(shí)域特性起始——穩(wěn)定——結(jié)束●頻域特性聲音信號(hào)由正弦分量組成——周期、非周期頻譜分析——線狀譜、連續(xù)譜聲音信號(hào)的描述——聲波頻率、聲壓、聲強(qiáng)人耳對(duì)聲音的感覺通過聲壓或聲壓級(jí)描述——非線性聽閾（1kHz）：2×10-5Pa——

0dB

痛閾：20Pa——

120dB聲音的強(qiáng)度在1kHz頻率的正弦波中，能被人耳察覺的最弱聲壓大約是2Х10-5Pa，這個(gè)最弱音已經(jīng)作為國際標(biāo)準(zhǔn)的參照聲。描述聲音強(qiáng)度的量值是采用分貝表示:分貝是指兩個(gè)相同的物理量（例A1和A0）之比，取以10為底的對(duì)數(shù)并乘以10（或20）。N=10*lg(A1/A0)分貝符號(hào)為“dB”。N是被量度量的“級(jí)”，也被稱為聲壓級(jí)。A1是被量度量。A0是基準(zhǔn)量，如果2Х10-5Pa被看作0dB(聲壓級(jí))那么在特別安靜的環(huán)境中，單獨(dú)檢測(cè)：動(dòng)物的呼吸聲大約20dB人們正常的談話聲約60dB汽車的喇叭聲約100dB飛機(jī)起飛的聲音約120dB120dB以上的強(qiáng)度可使人產(chǎn)生痛苦的感覺。人耳聽覺特性●人耳對(duì)聲音強(qiáng)弱的感覺特性人耳對(duì)聲音強(qiáng)弱的感覺不與聲壓成正比，而與聲壓級(jí)成正比。安靜的環(huán)境和嘈雜的環(huán)境中人耳可以分辨的聲音不同。掩蔽：一個(gè)頻率聲音的聽閾由于另一個(gè)聲音的存在而上升的現(xiàn)象。掩蔽效應(yīng)：復(fù)合聲音信號(hào)中，響度較低的聲音頻率分量被高者淹沒。響度是聽覺判斷聲音強(qiáng)弱的屬性——主觀，響度與聲壓級(jí)有一定關(guān)系：聲壓級(jí)每增加10dB，響度增加1倍?！耥懚群晚懚燃?jí)●人耳聽覺的掩蔽效應(yīng)●聲音質(zhì)量評(píng)價(jià)◆我們經(jīng)常會(huì)對(duì)某一位歌手的歌聲發(fā)表意見，并與其他歌手進(jìn)行比較，這其實(shí)是在對(duì)聲音的質(zhì)量進(jìn)行評(píng)價(jià)?！袈曇糍|(zhì)量的度量有兩種基本方法：客觀質(zhì)量度量、主觀質(zhì)量的度量。

聲波的測(cè)量與分析傳統(tǒng)的方法是先用機(jī)電換能器把聲波轉(zhuǎn)換為相應(yīng)的電信號(hào)，然后用電子儀表放大到一定的電壓級(jí)進(jìn)行測(cè)量與分析。由于計(jì)算技術(shù)的發(fā)展，使許多計(jì)算和測(cè)量工作都使用了計(jì)算機(jī)或程序?qū)崿F(xiàn)。這些帶計(jì)算機(jī)處理系統(tǒng)的高級(jí)聲學(xué)測(cè)量?jī)x器，能完成下列一些測(cè)量工作：●評(píng)價(jià)值的測(cè)量——響度和響度級(jí)，噪音級(jí)，清晰度指數(shù)，噪音評(píng)價(jià)數(shù)?！衤曉吹臏y(cè)量——頻譜的時(shí)間變化，聲功率，指向性，效率，頻譜特征，幅值分布等?！褚糍|(zhì)的測(cè)量——混響時(shí)間，隔音量，吸音量。

●聲音客觀質(zhì)量的度量方法聲測(cè)量的基本儀器是聲級(jí)計(jì)。聲級(jí)計(jì)是一種能對(duì)聲音作出類似人耳的反應(yīng)的儀器，同時(shí)，它能進(jìn)行客觀而可重復(fù)的聲壓和聲級(jí)測(cè)量。聲壓測(cè)量的好處很多：它能幫助音樂廳提高音響效果；能對(duì)煩擾聲音進(jìn)行精密的、科學(xué)的分析。聲級(jí)測(cè)量還能明確地告訴我們什么聲音會(huì)引起聽力損害，并提醒人們采用適當(dāng)?shù)穆犃ΡＷo(hù)措施。因此，聲測(cè)量是不可少的。度量聲音客觀質(zhì)量的一個(gè)主要指標(biāo)是信噪比SNR（SignaltoNoiseRation）。其單位是分貝(dB)。●聲音主觀質(zhì)量的度量

采用客觀標(biāo)準(zhǔn)方法很難真正評(píng)定某種編碼器的質(zhì)量，在實(shí)際評(píng)價(jià)中，主觀的質(zhì)量度量比客觀質(zhì)量的度量更為恰當(dāng)和合理。通常是對(duì)某編碼器的輸出的聲音質(zhì)量進(jìn)行評(píng)價(jià)，例如播放一段音樂，記錄一段話，然后重放給實(shí)驗(yàn)者聽，再由實(shí)驗(yàn)者進(jìn)行綜合評(píng)定?？梢哉f，人的感覺機(jī)理最具有決定意義。當(dāng)然，可靠的主觀度量值是較難獲得的。

平均判分（MeanOpinionScore-MOS）過程是召集一批實(shí)驗(yàn)者，請(qǐng)每個(gè)實(shí)驗(yàn)者對(duì)某個(gè)編解碼器的輸出進(jìn)行質(zhì)量判分，采用類似于考試的五級(jí)分制，不同的MOS分對(duì)應(yīng)的質(zhì)量級(jí)別和失真級(jí)別見下表。●聲音主觀質(zhì)量的度量方法MOS質(zhì)量級(jí)別失真級(jí)別5優(yōu)(Excellent)不察覺4良(Good)剛察覺但不可厭3中(Fair)察覺及稍微可厭2差(Poor)可厭(但不令人反感)1劣(Unacceptable)極可厭(令人反感)數(shù)字化聲音用聲音錄制軟件記錄的英文單詞“Hello”的語音實(shí)際波形模擬信號(hào)很容易受到電子干擾，因此隨著技術(shù)的發(fā)展，聲音信號(hào)就逐漸過渡到了數(shù)字存儲(chǔ)階段，A/D轉(zhuǎn)換和D/A轉(zhuǎn)換技術(shù)便應(yīng)運(yùn)而生。A：“Analog”（類比、模擬）D：“Digital”（數(shù)字、數(shù)碼）A/D轉(zhuǎn)換就是把模擬信號(hào)轉(zhuǎn)換成數(shù)字信號(hào)的過程，模擬電信號(hào)變?yōu)榱擞伞?”和“1”組成的Bit信號(hào)。這樣做的好處是顯而易見的，聲音存儲(chǔ)質(zhì)量得到了加強(qiáng)，數(shù)字化的聲音信息使計(jì)算機(jī)能夠進(jìn)行識(shí)別、處理和壓縮，這也就是為什么如今磁帶逐漸被淘汰，CD唱片卻趨于流行的原因。

A/D轉(zhuǎn)換的一個(gè)關(guān)鍵步驟是聲音的采樣和量化，得到數(shù)字音頻信號(hào)，它在時(shí)間上是不連續(xù)的離散信號(hào)。借助于A/D或D/A轉(zhuǎn)換器，模擬信號(hào)和數(shù)字信號(hào)可以互相轉(zhuǎn)換

8位可編程A/D轉(zhuǎn)換芯片●

聲音采樣——聲音數(shù)字化(模/數(shù)轉(zhuǎn)換)聲音采樣1101110011001101把聲音(模擬量)按照固定時(shí)間間隔，轉(zhuǎn)換成有限個(gè)數(shù)字表示的離散序列●

聲音重放——聲音模擬化(數(shù)/模轉(zhuǎn)換)聲音重放11011100把數(shù)字化聲音轉(zhuǎn)換成模擬量，經(jīng)過音響單元重放出來●

設(shè)備和軟件(1)聲音適配器(聲卡)8bit、16bit、…128bit￥80.00～3800.00(2)聲卡驅(qū)動(dòng)軟件以及各種聲音處理軟件人耳聽到的聲音是一種具有振幅、周期（頻率）的聲波，計(jì)算機(jī)要處理這種聲波，可以通過話筒把機(jī)械振動(dòng)轉(zhuǎn)變成相應(yīng)的電信號(hào)，這也是一種連續(xù)的模擬信號(hào)。模擬信號(hào)的幅度，表示聲音的強(qiáng)弱。計(jì)算機(jī)只能處理數(shù)字量，不能處理這種模擬量，只有把這種模擬量轉(zhuǎn)換成數(shù)字量，計(jì)算機(jī)才有可能處理聲音，這種轉(zhuǎn)換就是模/數(shù)轉(zhuǎn)換（A/D轉(zhuǎn)換），它是由模/數(shù)轉(zhuǎn)換電路實(shí)現(xiàn)的。聲音經(jīng)A/D轉(zhuǎn)換后得到的數(shù)字聲音信號(hào)交給計(jì)算機(jī)處理，處理后的數(shù)據(jù)需經(jīng)過數(shù)/模（D/A）轉(zhuǎn)換電路，還原成模擬信號(hào)，再進(jìn)行放大輸出到喇叭或耳機(jī)，變成人耳能夠聽到的聲音。從模擬到數(shù)字聲源聲波傳聲器模擬電信號(hào)數(shù)字聲音聲音的數(shù)字化原理

模擬聲音信號(hào)是個(gè)連續(xù)量，可能由許多具有不同振幅和頻率的正弦波組成。計(jì)算機(jī)獲取實(shí)際聲音信號(hào)的過程就是聲音的數(shù)字化的處理過程。右圖表示了模擬聲音數(shù)字化的三個(gè)步驟：采樣、量化和編碼。數(shù)字音頻的處理●采樣（Sampling）

、采樣頻率采樣是將連續(xù)變化的模擬音頻信號(hào)變成計(jì)算機(jī)能處理的離散化數(shù)字信號(hào)的第一步。每隔一定時(shí)間，對(duì)模擬音頻信號(hào)的幅值進(jìn)行采樣測(cè)試，得到離散的幅值，并用該值表示兩次采樣之間的模擬幅值。單位時(shí)間采樣的次數(shù)稱為采樣頻率。采樣頻率越高，所得到的離散幅值的數(shù)據(jù)點(diǎn)就越逼近于連續(xù)音頻信號(hào)，同時(shí)采樣所得到的數(shù)據(jù)量也越大。多媒體電腦中支持的采樣頻率通常為44.1kHz、22.05kHz及11.025kHz，8kHz。t模擬輸入t0t0采樣時(shí)鐘量化，編碼0tX(0)X(1)…X(n)…聲音的采樣聲音在數(shù)字化后的波形圖標(biāo)準(zhǔn)采樣頻率采樣頻率采樣次數(shù)/s聲音質(zhì)量8KHz8000電話音質(zhì)11.025KHz11025AM音質(zhì)22.05KHz22050FM音質(zhì)44.1KHz44100CD音質(zhì)48KHz48000DAT音質(zhì)說明：DAT指數(shù)字錄音帶格式（Digitalaudiotype）采樣定理：

奈奎斯特理論認(rèn)為：數(shù)字采樣頻率的大小由聲音信號(hào)本身的最高頻率決定。指出：進(jìn)行無損的數(shù)字化轉(zhuǎn)換，采樣頻率至少是所采信號(hào)所含最高頻率的2倍。fs>=2f聲音類型帶寬采樣頻率（kHz）電話語音200Hz－3.4kHz8調(diào)幅廣播50Hz－7kHz11.025調(diào)頻廣播20Hz－15kHz22.050CD20Hz－20kHz44.1●量化（Quantization）

采樣所得到的數(shù)據(jù)是一定的離散值，將這些離散值用若干二進(jìn)制的位來表示，這一過程稱為量化。用8位二進(jìn)制表示十進(jìn)制整數(shù)，只能表示出0～255之間的整數(shù)值。也就是256個(gè)量化級(jí)。量化級(jí)對(duì)應(yīng)的二進(jìn)制位數(shù)稱為量化位數(shù)。雖然量化位數(shù)越多，對(duì)原始波形的模擬越細(xì)膩，聲音的音質(zhì)就越好，但數(shù)據(jù)量也越大。量化即是將采樣所得到的信號(hào)振幅值用一組二進(jìn)制脈沖序列來表示。離散化的數(shù)據(jù)經(jīng)量化變成二進(jìn)制表示一般會(huì)損失一些精度，這主要是因?yàn)橛?jì)算機(jī)只能表示有限的數(shù)值。均勻量化如果采用相等的量化間隔對(duì)采樣得到的信號(hào)作量化，那么這種量化稱為均勻量化。均勻量化就是采用相同的“等分尺”來度量采樣得到的幅度，也稱為線性量化。非均勻量化--非線性量化的基本想法是，對(duì)輸入信號(hào)進(jìn)行量化時(shí)，大的輸入信號(hào)采用大的量化間隔，小的輸入信號(hào)采用小的量化間隔，如圖所示。這樣就可以在滿足精度要求的情況下用較少的位數(shù)來表示。聲音數(shù)據(jù)還原時(shí)，采用相同的規(guī)則。

在非線性量化中，采樣輸入信號(hào)幅度和量化輸出數(shù)據(jù)之間定義了兩種對(duì)應(yīng)關(guān)系，一種稱為m

律壓擴(kuò)(companding)算法，另一種稱為A律壓擴(kuò)算法。

律壓擴(kuò)

律(m-Law)壓擴(kuò)(G.711)主要用在北美和日本等地區(qū)的數(shù)字電話通信中

A律壓擴(kuò)

A律(A-Law)壓擴(kuò)(G.711)主要用在歐洲和中國大陸等地區(qū)的數(shù)字電話通信中

量化噪聲：量化誤差，隨階距變大而增加。量化位數(shù)/采樣精度（字長(zhǎng)）：

表示采樣值的二進(jìn)制位數(shù)（比特?cái)?shù)），決定了采樣值的精度。

例如：量化位數(shù)16bit，可以表示65536個(gè)不同量化值，精度（階距）1/65536。量化位數(shù)8bit，可以表示256個(gè)不同量化值，精度（階距）1/256。動(dòng)態(tài)范圍

(DynamicRange)20×lg（信號(hào)的最大強(qiáng)度/最小強(qiáng)度）（dB）信噪比(SignaltoNoiseRatio,SNR)-有用信號(hào)的能量和噪聲能量的比。-常用單位：dB

衡量信號(hào)質(zhì)量的標(biāo)準(zhǔn)：量化位數(shù)幅值動(dòng)態(tài)范圍(dB）效果825648數(shù)字電話1664K96CD-DA60FM廣播40AM廣播

量化位與動(dòng)態(tài)范圍根據(jù)抽樣理論可知，一個(gè)數(shù)字信源的信噪比大約等于采樣精度乘以6分貝。

8位的數(shù)字系統(tǒng)其信噪比只有48分貝，

16位的數(shù)字系統(tǒng)的信噪比可達(dá)96分貝，信噪比低會(huì)出現(xiàn)背景噪聲以及失真。因此，量化位數(shù)越多，保真度越好。

量化位與信噪比在多媒體電腦中，要對(duì)音頻進(jìn)行處理，必須在PC機(jī)上添加一塊聲卡。聲卡是多媒體升級(jí)套件中的核心部件之一，其外形與插在計(jì)算機(jī)主機(jī)箱內(nèi)的其他硬件插板相仿，也是一塊可以插在擴(kuò)展槽內(nèi)的電路板，但包含有完成音頻處理功能的電子元件。聲卡通過一秒內(nèi)對(duì)聲音進(jìn)行上千次的采樣、閱讀，把模擬聲波轉(zhuǎn)換成數(shù)字信息、數(shù)字化的聲音存儲(chǔ)在波形文件中。當(dāng)聲音被記錄時(shí)，聲卡中的模/數(shù)轉(zhuǎn)換器把模擬聲波轉(zhuǎn)換成數(shù)字?jǐn)?shù)據(jù)；當(dāng)聲音重放時(shí)，聲卡中的數(shù)/模轉(zhuǎn)換器把波形文件里的數(shù)字?jǐn)?shù)據(jù)變成模擬波形輸出。聲音的壓縮聲音文件數(shù)據(jù)量的計(jì)算影響數(shù)字化聲音質(zhì)量的因素主要有三個(gè)，即

采樣頻率，量化精度和聲道個(gè)數(shù)。聲道數(shù)：指一次采樣所記錄產(chǎn)生的聲音波形個(gè)數(shù)。單聲道只有一個(gè)數(shù)據(jù)流，立體聲的數(shù)據(jù)流至少在兩個(gè)以上。由于立體聲聲音具有多聲道、多方向的特征，因此，聲音的播放在時(shí)間和空間性能方面都能顯示更好的效果，但相應(yīng)數(shù)據(jù)量將成倍增加。

數(shù)字聲音相關(guān)的參數(shù)質(zhì)量采樣頻率（kHz）量化精度單道聲/立體聲數(shù)據(jù)率（kb/s）頻率范圍（kHz）電話88單道聲64200～3400AM11.0258單道聲8850～7000FM22.05016立體聲705.620～15000CD44.116立體聲1411.220～20000DAT4816立體聲153620～20000聲音文件所需的存儲(chǔ)空間可用下式來計(jì)算：采樣率越大，數(shù)字信號(hào)越接近模擬信號(hào)，但所要求的存儲(chǔ)空間也越大。

量化位數(shù)越多，所得的量化值越接近原始波形采樣值，但所要求的信息存儲(chǔ)量也越大。雙聲道立體聲比單聲道的聲音逼真豐富，但需要成倍于單聲道的信息容量。以16位、22.05kHz的頻率錄制1分鐘的立體聲，所需存儲(chǔ)空間為5.047MB。如果錄制1小時(shí)的立體聲。其所要求的存儲(chǔ)空間為60×5.047=302.81MB。計(jì)算：一張CD唱盤容量為640MB，問最多能存儲(chǔ)多長(zhǎng)時(shí)間的CD音質(zhì)，采樣字長(zhǎng)為16bit的雙聲道立體聲歌曲？每秒：(44.1K*16*2/8)=176400Byte(640*1024*1024)/176400=3804s=1h3min24s

聲音壓縮通常采用有損壓縮的方式進(jìn)行，主要用在重構(gòu)的信號(hào)不必要與原始信號(hào)完全相同的場(chǎng)合。這種壓縮采取在壓縮的過程中丟掉某些不致對(duì)原始數(shù)據(jù)產(chǎn)生誤解的信息，以大大提高壓縮比。

從第一個(gè)音頻編碼方法產(chǎn)生到現(xiàn)在，出現(xiàn)了很多的壓縮編碼方法?？梢詫⑺麄兎譃槿悾翰ㄐ尉幋a、參數(shù)編碼和混合編碼。波形編碼基于對(duì)語音信號(hào)波形的數(shù)字化處理，試圖使處理后重建的語音信號(hào)波形與原語音信號(hào)波形保持一致。優(yōu)點(diǎn)：實(shí)現(xiàn)簡(jiǎn)單（計(jì)算量不大）、語音質(zhì)量（保真度）好、適應(yīng)性強(qiáng)，有成熟的技術(shù)實(shí)現(xiàn)方法；缺點(diǎn)：壓縮程度不高、實(shí)現(xiàn)的碼速率較高，碼率低于32kbit/s時(shí)音質(zhì)降低明顯，16kbit/s時(shí)音質(zhì)就非常差了。常見方法：脈沖編碼調(diào)制（PCM）、增量調(diào)制（DM）、差值脈沖編碼調(diào)制（DPCM）、自適應(yīng)差分脈沖編碼調(diào)制（ADPCM）、子帶編碼（SBC）和矢量量化編碼（VQ）等。編碼信號(hào)的速率計(jì)算：編碼速率＝采樣頻率×編碼比特?cái)?shù)播放某音頻信號(hào)所需存儲(chǔ)量＝播放時(shí)間×速率÷8（字節(jié)）

參數(shù)編碼(聲源編碼)通過構(gòu)造發(fā)聲模型作為基礎(chǔ)，用一套模擬聲帶頻譜特性的濾波器系數(shù)和若干聲源參數(shù)來描述這個(gè)模型，在發(fā)送端從模擬語音信號(hào)中提取各個(gè)特征參量并進(jìn)行量化編碼，以實(shí)現(xiàn)語音信息的數(shù)字化。優(yōu)點(diǎn)：語音編碼速率較低（2～9.6kbit/s），壓縮比特率低；缺點(diǎn)：合成語音質(zhì)量較差（保真度欠佳），實(shí)現(xiàn)的復(fù)雜度高。典型代表：線性預(yù)測(cè)編碼器（LPC）語聲信號(hào)產(chǎn)生模型周期性信號(hào)隨機(jī)性信號(hào)基音周期Tp濁音清音線性時(shí)變?yōu)V波器合成語音信號(hào)輸出C(n)u(n)v(n)G增益控制時(shí)變參數(shù)ai混和編碼波形編碼：保真度好，計(jì)算量小，但編碼后速率高；參數(shù)編碼：碼速率較低，但保真度欠佳，計(jì)算復(fù)雜。波形編碼與參數(shù)編碼結(jié)合——混和編碼：克服弱點(diǎn)，結(jié)合優(yōu)點(diǎn)壓縮比特率：4～16kbit/s編碼器：多脈沖激勵(lì)線性預(yù)測(cè)編碼器（MPE-LPC）、規(guī)則脈沖激勵(lì)線性預(yù)測(cè)編碼器（RPE-LPC）、碼激勵(lì)線性預(yù)測(cè)編碼器（CELP）、矢量和激勵(lì)線性預(yù)測(cè)編碼器（VSELP）和多帶激勵(lì)線性預(yù)測(cè)編碼器。與參數(shù)編碼的差別：信號(hào)激勵(lì)源的選取更加精細(xì)——通過調(diào)整激勵(lì)信號(hào)使語音輸入信號(hào)與重構(gòu)的語音信號(hào)誤差最?。ê铣煞治龇ˋbS-analysisbysynthesis）。三種壓縮編碼的性能比較24616832kbit/s

主觀音質(zhì)評(píng)價(jià)

混和法

參數(shù)法

波形法54321差分脈沖編碼調(diào)制DPCM出發(fā)點(diǎn)：對(duì)相鄰樣值的差值進(jìn)行量化編碼實(shí)現(xiàn)：對(duì)樣值與其對(duì)應(yīng)的預(yù)測(cè)值的差值進(jìn)行量化編碼

預(yù)測(cè)表達(dá)式預(yù)測(cè)編碼

關(guān)鍵：預(yù)測(cè)系數(shù)的獲得——使預(yù)測(cè)估值的均方差為最小的預(yù)測(cè)系數(shù)自適應(yīng)差值脈沖編碼調(diào)制ADPCM

自適應(yīng)量化：使量化間隔的變化與輸入語聲信號(hào)的方差相匹配

自適應(yīng)預(yù)測(cè)預(yù)測(cè)系數(shù)隨輸入信號(hào)而變化2.線性預(yù)測(cè)編碼LPC語聲激勵(lì)信號(hào)：濁音信號(hào)(準(zhǔn)周期脈沖序列)+清音信號(hào)(白色隨機(jī)噪聲)雖然碼速率低，但在噪聲環(huán)境下語音質(zhì)量不好，現(xiàn)已被淘汰。常用壓縮編碼方法基本思想預(yù)測(cè)表達(dá)式預(yù)測(cè)系數(shù)的求取圖

DPCM系統(tǒng)原理框圖DPCM

預(yù)測(cè)器

量化器編碼器解碼器

預(yù)測(cè)器信道接收端輸出XN’＋＋＋XNe’NXNeNe’NXN’++輸入^XN^發(fā)送端+-預(yù)測(cè)值抽樣值eN=XN-XN^存在量化誤差3.矢量量化編碼：將輸入信號(hào)樣值按某種方式分組（矢量），并量化理論基礎(chǔ)：香農(nóng)率失真理論基本原理：用碼書中與輸入矢量最匹配的碼字的索引（下標(biāo)）代替輸入矢量進(jìn)行傳輸和存儲(chǔ)，解碼時(shí)只需簡(jiǎn)單的查表操作。關(guān)鍵技術(shù)：碼書設(shè)計(jì)、碼字搜索、碼字（下標(biāo)）索引分配。應(yīng)用：中速率和低速率語音編碼——G.723.1、G.728、G.729待續(xù)4.子帶編碼基本思想：將輸入信號(hào)分解為若干子頻帶，然后對(duì)各子帶分量根據(jù)其不同的統(tǒng)計(jì)特性采取不同的壓縮策略，以降低碼率。子帶劃分依據(jù)：話音信號(hào)自身特性優(yōu)點(diǎn)：不僅可以很好地控制各個(gè)子帶的量化電平數(shù)，還可以很好地控制在重建信號(hào)時(shí)的量化誤差方差值，進(jìn)而獲得更好的主觀聽音質(zhì)量。相對(duì)獨(dú)立的量化噪聲被束縛在各自子帶內(nèi)，互不影響。各個(gè)子帶的采樣頻率大大降低。矢量量化數(shù)據(jù)分組，每個(gè)組有K個(gè)數(shù)據(jù)，一組數(shù)據(jù)構(gòu)成一個(gè)K維矢量；每個(gè)矢量有對(duì)應(yīng)的下標(biāo)；每個(gè)矢量視為一個(gè)碼字；所有碼字排列形成一個(gè)表即為碼本或（碼書）；設(shè)計(jì)一個(gè)良好的碼本C（具有N個(gè)K維矢量的集合）C={yi}；

為碼字,下標(biāo)i=1，2，3，，N。

矢量量化編碼矢量量化編碼原理框圖矢量量化編碼中，不傳輸對(duì)應(yīng)的矢量；發(fā)送端和接收端都有相同的碼本，只需傳送每個(gè)矢量的下標(biāo)i。下標(biāo)數(shù)據(jù)比矢量本身數(shù)據(jù)小得多，實(shí)現(xiàn)了壓縮。5.感知編碼基本原理：以人類聽覺系統(tǒng)的心理聲學(xué)為基礎(chǔ)，只記錄能夠被人耳感覺到的聲音，從而達(dá)到壓縮數(shù)據(jù)量的目的。理論基礎(chǔ)：基于人耳的聞閾、臨界頻段和掩蔽效應(yīng)。人耳對(duì)不同頻段聲音的反應(yīng)靈敏度有差異，在編碼時(shí)，對(duì)被掩蔽的弱音不進(jìn)行編碼，從而達(dá)數(shù)據(jù)壓縮的目的。應(yīng)用：在音頻壓縮編碼中，感知編碼比較成功，如MPEG-1、MPEG-2、AC-3音頻信息壓縮編碼標(biāo)準(zhǔn)標(biāo)準(zhǔn)的描述對(duì)象：編碼速率、編碼的壓縮算法、編碼器結(jié)構(gòu)、話音質(zhì)量以及彼此的關(guān)系。目標(biāo)：用盡可能低的數(shù)碼率來獲得盡可能好的合成語音質(zhì)量。G.711、G.721、G.722●波形編碼標(biāo)準(zhǔn)G.711

針對(duì)50Hz到3.2kHz的語音信號(hào)進(jìn)行A律和律PCM編碼，屬于非均勻量化。式中：x為輸入信號(hào)幅度，規(guī)格化成-1x

律主要用在北美和日本等地區(qū)的數(shù)字電話通信中，按下面的式子確定量化輸入和輸出的關(guān)系：A律主要用在歐洲和中國大陸等地區(qū)的數(shù)字電話通信中，按下面的式子確定量化輸入和輸出的關(guān)系：0|x|1/A1/A|x|1式中：x為輸入信號(hào)幅度，規(guī)格化成-1x

G.721

一個(gè)代碼轉(zhuǎn)換系統(tǒng)。它使用ADPCM轉(zhuǎn)換技術(shù)，實(shí)現(xiàn)64kb/s（A律或μ律壓擴(kuò)技術(shù)）PCM速率和32kb/s速率的ADPCM之間的相互轉(zhuǎn)換。ADPCM編碼器G.722

一種高質(zhì)量語音信號(hào)的壓縮標(biāo)準(zhǔn)。取樣頻率為16kHz，每個(gè)樣值量化到14b，采用子帶編碼和ADPCM進(jìn)行壓縮編碼。7kHz音頻信號(hào)64kb/s數(shù)據(jù)率的編譯碼方塊圖G.728

該標(biāo)準(zhǔn)利用低延時(shí)碼本激勵(lì)線性預(yù)測(cè)LD-CELP方法將一般語音信號(hào)壓縮至16Kb/s。

CELP編碼綜合了波形編碼和參數(shù)編碼，還采用矢量量化的壓縮算法。CELP實(shí)際上是一個(gè)閉環(huán)LPC系統(tǒng)，由輸入語音信號(hào)確定最佳參數(shù)，再根據(jù)某種最小誤差準(zhǔn)則從碼本中找出最佳激勵(lì)碼本矢量。CELP具有較強(qiáng)的抗干擾能力，在4~16kbit/s傳輸速率下，即可獲得較高質(zhì)量的語音信號(hào)。G.728、G.729、G.723.1●混和編碼標(biāo)準(zhǔn)G.729

低碼率的語音壓縮標(biāo)準(zhǔn)，采用共軛結(jié)構(gòu)代數(shù)碼本激勵(lì)線性預(yù)測(cè)CS-ACELP，將語音信號(hào)壓縮至8Kb/s。G.723.1

采用ACELP(代數(shù)碼激勵(lì)線性預(yù)測(cè))算法，根據(jù)激勵(lì)碼本的不同可以將一般語音信號(hào)壓縮至5.3Kb/s和6.3Kb/s。

在6.3Kb/s編碼器內(nèi)采用了多脈沖激勵(lì)，可以得到較高的音質(zhì)。MPEG-1、MPEG-2BC●MPEG音頻編碼標(biāo)準(zhǔn)●MPEG-2AAC編碼標(biāo)準(zhǔn)●MPEG-4音頻標(biāo)準(zhǔn)MPEG1音頻壓縮標(biāo)準(zhǔn)

包括3種壓縮模式：層次1、2、3；向下兼容；壓縮算法主要由子帶劃分和變換編碼構(gòu)成，主要步驟為：(1)音頻信號(hào)通過濾波器組分成為32個(gè)子帶；

(2)用FFT將子帶變換到頻率域；

(3)利用生理聲學(xué)模型對(duì)能感知的噪聲閾值進(jìn)行估計(jì)；

(4)根據(jù)對(duì)噪聲閾值的估計(jì)進(jìn)行比特分配和量化。編碼器解碼器其音頻編碼分為3層：Layer-1、Layer-2和Layer-3。Layer-1的壓縮比為1:4，編碼速率為384kb/s；Layer-2的壓縮比為1:6～1:8之間，編碼速率為192～256kb/s；Layer-3的壓縮比為1:10～1:12，壓縮碼率可以達(dá)到64kb/s。Layer-1的編碼器最為簡(jiǎn)單，主要用于小型數(shù)字盒式磁帶；Layer-2編碼器的復(fù)雜程度是中等，主要用于數(shù)字廣播音頻、數(shù)字音樂、只讀光盤交互系統(tǒng)和視盤；Layer-3的編碼器最為復(fù)雜，主要用于ISDN上的聲音傳輸。表MPEG1Audio音頻文件壓縮比率和播放媒體最低位率Layer大約壓縮比率播放媒體最低位率11:4348Kbit/s21:6~1:8256Kbit/s~192Kbit/s31:10~1:12128Kbit/s~112Kbit/sMP3（Layer3）編碼是MPEG1Audio音頻壓縮標(biāo)準(zhǔn)之一。 MPEG-2BC聲音標(biāo)準(zhǔn)是在MPEG-1的基礎(chǔ)上發(fā)展來的，是MPEG為多聲道聲音開發(fā)的低碼率編碼方案，并與MPEG-1的聲音標(biāo)準(zhǔn)保持后向兼容。與MPEG-1相比主要增加了下面幾個(gè)方面的內(nèi)容：MPEG-2BC聲音壓縮標(biāo)準(zhǔn)支持5.1多路環(huán)繞立體聲：5個(gè)全帶寬聲道，分為左、右、中、和兩個(gè)環(huán)繞聲道，另加一個(gè)低頻效果增強(qiáng)聲道擴(kuò)展了編碼器的輸出范圍，從32～384kb/s擴(kuò)展到8～640kb/s。增加了更低的取樣頻率和低碼率：在保持MPEG-1原有的取樣頻率的基礎(chǔ)上，又增加了三種取樣頻率，新增的取樣頻率為16kHz、22.05kHz和24kHz，是將原有MPEG-1的取樣頻率降低了一半，以便提高碼率低于64kb/s時(shí)的每個(gè)聲道的聲音質(zhì)量。AC-3音頻壓縮標(biāo)準(zhǔn)DOLBY

5.1聲道音頻壓縮標(biāo)準(zhǔn)：左(L)、中(C)、右(R)、左環(huán)繞(LS)、右環(huán)繞(RS)和低頻增強(qiáng)。前5聲道帶寬20Hz~20kHz；0.1聲道，提供100Hz以下的超低音聲道，彌補(bǔ)低音的不足。AC－3將六個(gè)聲道進(jìn)行數(shù)字編碼，并將它們壓縮成一個(gè)通道，而比特率僅是320kb/s。美國HDTV的音頻標(biāo)準(zhǔn) MPEG-2AAC(AdvancedAudioCoding)是MPEG-2標(biāo)準(zhǔn)中一種非常靈活的編碼標(biāo)準(zhǔn)，采用感知編碼方法，主要是利用聽覺系統(tǒng)的掩蔽特性來減少聲音編碼的數(shù)據(jù)量；并且通過子帶編碼將量化噪聲分散到各個(gè)子帶中，用全局的聲音信號(hào)將噪聲掩蔽掉。MPEG-2AAC編碼標(biāo)準(zhǔn)AAC定義了3種配置：

基本配置在三種配置中提供最好的聲音質(zhì)量，除沒有使用增益控制模塊外，其余模塊都使用。

低復(fù)雜性配置沒有使用預(yù)測(cè)模塊和預(yù)處理模塊，使用的瞬時(shí)噪聲定形濾波器模塊的級(jí)數(shù)也有限，聲音質(zhì)量低于基本配置。

可變采用率配置使用增益控制作預(yù)處理，沒有使用預(yù)測(cè)模塊，對(duì)TNS（瞬時(shí)噪聲定性）濾波器的級(jí)數(shù)和帶寬也有限制，是最簡(jiǎn)單的一種配置。音頻編碼算法和標(biāo)準(zhǔn)算法名稱

數(shù)據(jù)率標(biāo)準(zhǔn)應(yīng)用波形編碼PCM脈沖編碼調(diào)制

公共網(wǎng)ISDN配音μ-law，A-lawμ-律，A-律

64kbpsG.711APCM自適應(yīng)脈沖編碼調(diào)制

DPCM差分脈沖編碼調(diào)制

ADPCM自適應(yīng)差分脈沖編碼調(diào)制

32kbpsG.721SB-ADPCM子帶-自適應(yīng)差分脈沖編碼調(diào)制

64kbpsG.7225.3kbps6.3kbpsG.723參數(shù)編碼LPC線性預(yù)測(cè)編碼

2.4kbps保密話聲混合編碼CELPC碼激勵(lì)LPC4.6kbps移動(dòng)通信VSELP矢量和激勵(lì)LPC8kbps語音郵件RPE-LTP規(guī)則碼激勵(lì)長(zhǎng)時(shí)預(yù)測(cè)

13.2kbpsISDNLD-CELP低延時(shí)碼激勵(lì)LPC16kbpsG.728G.729MPEG多子帶，感知編碼

128kbPsCDDolbyAC-3感知編碼

音響聲音的合成數(shù)字化的聲音首先要轉(zhuǎn)換成模擬信號(hào)，才能播放。對(duì)于存儲(chǔ)的采樣音頻，有兩種處理方法：

FM頻率調(diào)制合成波形表（Wavetable）合成

頻率調(diào)制（FM）合成法數(shù)字式頻率調(diào)制合成法，簡(jiǎn)稱為FM合成法。FM電子合成器先由震蕩器產(chǎn)生一個(gè)載波作為基音，然后再產(chǎn)生若干個(gè)調(diào)制波帶著許多泛音加在載波之上，可以對(duì)這個(gè)組合加以任意調(diào)整，然后加上典型的聲音包絡(luò)線（ADSR），再通過數(shù)控濾波器和數(shù)控放大器送往數(shù)字/模擬轉(zhuǎn)換器，從而形成最后的聲音。由于一個(gè)物體不可能總是一成不變的振動(dòng)，所以它的頻率和振幅都會(huì)隨著時(shí)間的改變而改變，并最終趨于靜止。我們把一聲音的發(fā)展過程分為四個(gè)階段，分別是觸發(fā)、衰減、保持和消失。這四個(gè)階段我們統(tǒng)稱為“包絡(luò)”。包絡(luò)的發(fā)生時(shí)間，也決定了一個(gè)樂音的時(shí)值。FM聲音合成器的工作原理由以下五部分組成：數(shù)字載波器調(diào)制器聲音包絡(luò)發(fā)生器數(shù)字運(yùn)算器數(shù)模轉(zhuǎn)換器

波形表合成（Wavetablesynthesis）也叫樂音樣本合成法，就是把各種真實(shí)樂器發(fā)出的聲音以數(shù)字的形式記錄下來，形成波形表，播放時(shí)調(diào)用相應(yīng)樂器的波形記錄，改變播放速度，從而改變音調(diào)周期，生成各種音階的音符。

專業(yè)聲卡采用此方式。波形表一般存儲(chǔ)在聲卡的ROM中。ROM存儲(chǔ)器的容量越大，合成的效果越好,開銷更大。產(chǎn)生豐富、逼真的音頻和音樂

CoolEditPro2.0

一款非常出色的音頻錄制、編輯、處理、混縮軟件CoolEditPro2.0的中文界面標(biāo)題欄菜單欄工具欄狀態(tài)欄多軌編輯模式CoolEditPro2.0的功能特點(diǎn)

CoolEditPro2.0軟件提供32-bit高精度音頻處理，支持視頻、CD、MIDI等設(shè)備。能方便地抓取CD音軌，也能抽取并編輯視頻文件中的音頻。

播放控制縮放控制當(dāng)前時(shí)間音節(jié)屬性所選部分和視圖中音頻屬性文件管理窗口調(diào)音窗口工具欄CoolEditPro2.0支持單軌或多軌編輯模式，編輯時(shí)可互相切換。同時(shí)具有強(qiáng)大的音頻編輯功能，支持可選的插件、崩潰恢復(fù)、自動(dòng)靜音檢測(cè)和刪除、自動(dòng)節(jié)拍查找、錄制等?？梢詣?chuàng)建音調(diào)、歌曲、聲音、弦樂、顫音、噪音。并在單軌和多軌編輯模式下，分別提供了不同的編輯功能。軟件還提供了音頻分析器和相位分析器。多媒體音頻信號(hào)文件格式.wav●

WAVE(WaveformAudio)波形音頻文件

多媒體系統(tǒng)、音樂光盤制作，記錄物理波形，數(shù)據(jù)量大WAV文件來源于對(duì)聲音模擬波形的采樣。用不同的采樣頻率對(duì)聲音的模擬波形進(jìn)行采樣，可以得到一系列離散的采樣點(diǎn)；以不同的精度（8位或16位）把這些采樣點(diǎn)的值轉(zhuǎn)換成二進(jìn)制碼，然后存磁盤，就產(chǎn)生了聲音的WAV文件，即波形文件。

●

WAV文件是由采樣數(shù)據(jù)組成的，所以它需要的存儲(chǔ)容量很大。一般情況下，WAV文件是不可能壓縮的。這是因?yàn)閃AV文件所記錄的音頻數(shù)字信息中很少有像圖像中存在的大量數(shù)據(jù)重復(fù)現(xiàn)象，一般數(shù)據(jù)壓縮算法很難有所作為，即使經(jīng)過壓縮，壓縮比也不高，壓縮結(jié)果也仍然需要很大的存儲(chǔ)空間。MIDI（MusicalInstrumentDigitalInterface）樂器數(shù)字化接口，是數(shù)字音樂的工業(yè)標(biāo)準(zhǔn)，是用于音樂合成器、樂器和計(jì)算機(jī)之間交換音樂信息的一種硬件和軟件國際標(biāo)準(zhǔn)。MIDI文件并沒有記錄任何聲音信息，而只是記載了用于描述樂曲演奏過程中的一系列指令，這些指令包含了音高、音長(zhǎng)、通道號(hào)等主要信息，并以擴(kuò)展名為.MID的文件格式存儲(chǔ)起來。MIDI文件只是將樂器彈奏的每個(gè)音符記錄為一連串?dāng)?shù)字，然后用聲卡上的合成器根據(jù)這個(gè)數(shù)字所代表的含義進(jìn)行合成，最后通過揚(yáng)聲器播放音樂。.mid●

MIDI(MusicalInstrument

Digital

Interface)樂器數(shù)字化接口。用于合成、游戲音樂，記錄音符時(shí)值、頻率、音色特征，數(shù)據(jù)量小。WAV文件的優(yōu)點(diǎn)是可以從任何聲源錄制聲音，且可以保證它仍在任意一臺(tái)計(jì)算機(jī)上播放的效果大致相同，而MIDI文件則要受合成器中樂器組合的限制，其聲音質(zhì)量很大程度上取決于聲卡重新合成樂器聲音功能的強(qiáng)弱。相比之下，MIDI文件的錄制較復(fù)雜，這需要掌握一些使用MIDI創(chuàng)作編輯作業(yè)的專業(yè)知識(shí)，并且還須有專門的工具。MIDI消息，是指樂譜的數(shù)字描述,包括電子樂器鍵盤的彈奏的鍵名、力度、時(shí)值長(zhǎng)短等參數(shù)。任何電子樂器，只要有處理MIDI消息的微處理器和合適的硬件接口，就構(gòu)成了一個(gè)MIDI設(shè)備。當(dāng)一組MIDI消息通過音樂合成芯片處理時(shí)，合成器能解釋這些符號(hào)并且產(chǎn)生音樂。計(jì)算機(jī)上處理MIDI音樂的基本過程計(jì)算機(jī)中的MIDI文件通常來自于音樂創(chuàng)作軟件或合成音樂設(shè)備。許多播放器都能播放MIDI音樂，播放時(shí)（如圖所示）需要從相應(yīng)的MIDI文件或設(shè)備中讀出MIDI指令，接著由MIDI文件系統(tǒng)解釋指令，然后通過MIDI播放器輸出和轉(zhuǎn)換信號(hào)，再經(jīng)過聲音合成器生成對(duì)應(yīng)的聲音波形，最后經(jīng)放大后由揚(yáng)聲器輸出。圖5-8計(jì)算機(jī)中MIDI音樂的處理

圖計(jì)算機(jī)中MIDI音樂的處理過程MIDI術(shù)語MIDI文件通道Channels音序器Sequencer合成器Synthesizer樂器Instrument通道映象ChannelMapping復(fù)音Polyphony音色Timbre音軌Track合成音色映射程序PatchMapperMIDI的通道單個(gè)物理MIDI通道分為16個(gè)邏輯通道，每個(gè)邏輯通道可指定一種樂器。在MIDI消息中，用4個(gè)二進(jìn)制位來表示這16個(gè)邏輯通道。MIDI鍵盤可設(shè)置在16個(gè)通道中任何一個(gè)，MIDI合成器可以被設(shè)置在指定的通道上接受。

MIDI的物理接口標(biāo)準(zhǔn)MIDIIn（輸入口）接收從其他MIDI設(shè)備傳來的消息。MIDIOut（輸出口）發(fā)送某設(shè)備生成的原始MIDI消息。向其他設(shè)備發(fā)送MIDI消息。MIDIThru（轉(zhuǎn)發(fā)口）傳送從輸入口接收的消息到其他MIDI

設(shè)備。在MIDI設(shè)備之間傳送消息。各個(gè)MIDI設(shè)備通過專用的串行電纜(MIDI線)連接，并以31.25kbps（每字節(jié)10位－1位開始位，8位數(shù)據(jù)位和1位停止位）的速度傳送著數(shù)字音樂信息。MIDIThruOutInMIDI1.0規(guī)范中，使用的MIDI接頭是一個(gè)5針DIN接頭。MIDI是樂器和計(jì)算機(jī)使用的標(biāo)準(zhǔn)語言，是一套指令（命令/消息）的約定，它指示合成器（MIDI設(shè)備）要做什么，怎么做，如演奏音符、加大音量、生成音響效果等。MIDI不是聲音信號(hào)，在MIDI電纜上傳送的不是聲音，而是動(dòng)作指令。MIDI設(shè)備的連接

不妨把MIDI理解成一種局域網(wǎng)，網(wǎng)絡(luò)的各個(gè)部分通過專用的串行電纜(MIDI線)連接，

并以31.25kbps的速度傳送著數(shù)字音樂信息。

Cakewalk

ProAudio

V9.03

最著名和老牌的MIDI工具軟件，功能強(qiáng)大，可編輯、創(chuàng)作、調(diào)試MIDI音樂。TT作曲大師TT作曲家1.2標(biāo)準(zhǔn)版是一個(gè)集簡(jiǎn)譜編曲、自動(dòng)伴奏和打印功能為一體的作曲軟件。

可以利用直觀的簡(jiǎn)譜方式進(jìn)行音樂編配，還可以選擇內(nèi)置的100種具有中國特色的伴奏風(fēng)格，迅速制作出音樂成品。通過導(dǎo)入和導(dǎo)出MIDI文件的功能，您可以方便的與其它音樂軟件相互配合，將樂曲進(jìn)行精細(xì)的再加工。智能的歌詞輸入功能，讓您輕松制作和打印中文歌曲。

MIDI文件實(shí)際上是一張表格，就好比是一張樂譜，它描述了各種音符以及這些音符的播放及延時(shí)，所以MIDI文件比WAV文件要小得多。例如，一段持續(xù)10余秒的立體聲音樂，若用MIDI格式只需2KB的存儲(chǔ)空間，而以WAV格式存放則需2MB左右。由于MIDI文件比WAV文件要小得多，所以預(yù)先裝入MIDI文件比裝入WAV文件容易，這為設(shè)計(jì)多媒體項(xiàng)目和指定何時(shí)播放音樂帶來很大的靈活性。MIDI文件的主要缺點(diǎn)是處理語音能力差，缺乏重現(xiàn)自然語言的能力，不能獨(dú)立合成，因此用戶可以在需要語言的地方，將WAV文件與MIDI文件配合使用。

WAVE與MIDI文件的比較MIDIWAVE

人人文庫> 全部分類> 辦公材料 > 對(duì)照材料

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

音頻技術(shù)基礎(chǔ)

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

音頻技術(shù)基礎(chǔ)

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔