




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第二章音頻技術(shù)基礎(chǔ)
人類從外界獲得的信息大約有16%是從耳朵得到的。在多媒體技術(shù)中,音頻信息占有很重要的地位,比如在視頻會(huì)議系統(tǒng)中,音頻信息的優(yōu)先級(jí)最高。了解音頻信息的相關(guān)知識(shí)對(duì)更進(jìn)一步掌握多媒體技術(shù)是很重要的。一切能發(fā)出聲音的物體稱為聲源。聲音是由于聲源的振動(dòng)而產(chǎn)生的,由于聲源的振動(dòng),借助于它們周圍的介質(zhì),把這種振動(dòng)以機(jī)械波的形式由近及遠(yuǎn)地傳向遠(yuǎn)方,這就是聲波。聲波傳入人耳,致使耳膜也產(chǎn)生振動(dòng),這種振動(dòng)被傳導(dǎo)到聽覺神經(jīng),人們就產(chǎn)生了“聲音”的感覺。我們?nèi)粘B牭降穆曇羰且环N模擬信號(hào).聲學(xué)基礎(chǔ)知識(shí)●
聲音定義聲音是振動(dòng)波,具有振幅、周期和頻率.●
聲音的質(zhì)量簡(jiǎn)稱音質(zhì)。音質(zhì)與頻率范圍成正比,頻率范圍越寬音質(zhì)越好.聲音具有連續(xù)性和過程性,數(shù)據(jù)前后相關(guān),數(shù)據(jù)量大,具有實(shí)時(shí)性.●
聲音的連續(xù)時(shí)基性●
聲音三要素(1)音調(diào)—(高低)(2)音強(qiáng)—(強(qiáng)弱)(3)音色—(特質(zhì))聲音的三要素音調(diào):(高低)與聲音的頻率有關(guān),頻率快則聲音高,頻率慢則聲音低。音強(qiáng):(強(qiáng)弱)又稱響度,取決于聲音的振幅,也即振幅的大小和強(qiáng)弱。音色:(特質(zhì))由混入基音的諧音決定。每個(gè)基音都有其固定頻率,和不同音強(qiáng)的諧音混合,使得每個(gè)聲音具有特殊的音色效果。聲音的頻率范圍模擬波信號(hào)有三個(gè)要素:基線、周期和振幅。振幅即波形的最高點(diǎn)(或最低點(diǎn))與基線間的距離,它表示了聲音音量的大小。周期是波形中兩個(gè)相鄰波峰之間的距離,它表示完成一次振動(dòng)過程所需的時(shí)間,其大小體現(xiàn)了振動(dòng)的速度。頻率是周期的倒數(shù),周期越短,頻率越高。頻率的單位為赫茲(Hz)。人的耳朵只能感覺到振動(dòng)頻率在20Hz到20000Hz之間的聲波,超出此范圍的振動(dòng)波不能引起聽覺器官的感覺。其中,人耳對(duì)400-4000HZ的聲波最敏感。
次聲波人耳可聽域超聲波<20Hz20~20,000Hz>20,000Hz女性語音150Hz~10,000Hz電話語音200Hz~3,400Hz調(diào)幅廣播(AM)50Hz~7,000Hz調(diào)頻廣播(FM)20Hz~15,000Hz高級(jí)音響10Hz~40,000Hz男性語音100Hz~9,000Hz聲源種類頻帶寬度頻帶寬度
聲音質(zhì)量等級(jí)與信號(hào)帶寬的關(guān)系
電話AM廣播FM廣播CD-DA1020502003.4K7K15K22Kf(Hz)音頻信號(hào)特性分析●時(shí)域特性起始——穩(wěn)定——結(jié)束●頻域特性聲音信號(hào)由正弦分量組成——周期、非周期頻譜分析——線狀譜、連續(xù)譜聲音信號(hào)的描述——聲波頻率、聲壓、聲強(qiáng)人耳對(duì)聲音的感覺通過聲壓或聲壓級(jí)描述——非線性聽閾(1kHz):2×10-5Pa——
0dB
痛閾:20Pa——
120dB聲音的強(qiáng)度在1kHz頻率的正弦波中,能被人耳察覺的最弱聲壓大約是2Х10-5Pa,這個(gè)最弱音已經(jīng)作為國際標(biāo)準(zhǔn)的參照聲。描述聲音強(qiáng)度的量值是采用分貝表示:分貝是指兩個(gè)相同的物理量(例A1和A0)之比,取以10為底的對(duì)數(shù)并乘以10(或20)。N=10*lg(A1/A0)分貝符號(hào)為“dB”。N是被量度量的“級(jí)”,也被稱為聲壓級(jí)。A1是被量度量。A0是基準(zhǔn)量,如果2Х10-5Pa被看作0dB(聲壓級(jí))那么在特別安靜的環(huán)境中,單獨(dú)檢測(cè):動(dòng)物的呼吸聲大約20dB人們正常的談話聲約60dB汽車的喇叭聲約100dB飛機(jī)起飛的聲音約120dB120dB以上的強(qiáng)度可使人產(chǎn)生痛苦的感覺。人耳聽覺特性●人耳對(duì)聲音強(qiáng)弱的感覺特性人耳對(duì)聲音強(qiáng)弱的感覺不與聲壓成正比,而與聲壓級(jí)成正比。安靜的環(huán)境和嘈雜的環(huán)境中人耳可以分辨的聲音不同。掩蔽:一個(gè)頻率聲音的聽閾由于另一個(gè)聲音的存在而上升的現(xiàn)象。掩蔽效應(yīng):復(fù)合聲音信號(hào)中,響度較低的聲音頻率分量被高者淹沒。響度是聽覺判斷聲音強(qiáng)弱的屬性——主觀,響度與聲壓級(jí)有一定關(guān)系:聲壓級(jí)每增加10dB,響度增加1倍?!耥懚群晚懚燃?jí)●人耳聽覺的掩蔽效應(yīng)●聲音質(zhì)量評(píng)價(jià)◆我們經(jīng)常會(huì)對(duì)某一位歌手的歌聲發(fā)表意見,并與其他歌手進(jìn)行比較,這其實(shí)是在對(duì)聲音的質(zhì)量進(jìn)行評(píng)價(jià)?!袈曇糍|(zhì)量的度量有兩種基本方法:客觀質(zhì)量度量、主觀質(zhì)量的度量。
聲波的測(cè)量與分析傳統(tǒng)的方法是先用機(jī)電換能器把聲波轉(zhuǎn)換為相應(yīng)的電信號(hào),然后用電子儀表放大到一定的電壓級(jí)進(jìn)行測(cè)量與分析。由于計(jì)算技術(shù)的發(fā)展,使許多計(jì)算和測(cè)量工作都使用了計(jì)算機(jī)或程序?qū)崿F(xiàn)。這些帶計(jì)算機(jī)處理系統(tǒng)的高級(jí)聲學(xué)測(cè)量?jī)x器,能完成下列一些測(cè)量工作:●評(píng)價(jià)值的測(cè)量——響度和響度級(jí),噪音級(jí),清晰度指數(shù),噪音評(píng)價(jià)數(shù)?!衤曉吹臏y(cè)量——頻譜的時(shí)間變化,聲功率,指向性,效率,頻譜特征,幅值分布等?!褚糍|(zhì)的測(cè)量——混響時(shí)間,隔音量,吸音量。
●聲音客觀質(zhì)量的度量方法聲測(cè)量的基本儀器是聲級(jí)計(jì)。聲級(jí)計(jì)是一種能對(duì)聲音作出類似人耳的反應(yīng)的儀器,同時(shí),它能進(jìn)行客觀而可重復(fù)的聲壓和聲級(jí)測(cè)量。聲壓測(cè)量的好處很多:它能幫助音樂廳提高音響效果;能對(duì)煩擾聲音進(jìn)行精密的、科學(xué)的分析。聲級(jí)測(cè)量還能明確地告訴我們什么聲音會(huì)引起聽力損害,并提醒人們采用適當(dāng)?shù)穆犃ΡWo(hù)措施。因此,聲測(cè)量是不可少的。度量聲音客觀質(zhì)量的一個(gè)主要指標(biāo)是信噪比SNR(SignaltoNoiseRation)。其單位是分貝(dB)。●聲音主觀質(zhì)量的度量
采用客觀標(biāo)準(zhǔn)方法很難真正評(píng)定某種編碼器的質(zhì)量,在實(shí)際評(píng)價(jià)中,主觀的質(zhì)量度量比客觀質(zhì)量的度量更為恰當(dāng)和合理。通常是對(duì)某編碼器的輸出的聲音質(zhì)量進(jìn)行評(píng)價(jià),例如播放一段音樂,記錄一段話,然后重放給實(shí)驗(yàn)者聽,再由實(shí)驗(yàn)者進(jìn)行綜合評(píng)定??梢哉f,人的感覺機(jī)理最具有決定意義。當(dāng)然,可靠的主觀度量值是較難獲得的。
平均判分(MeanOpinionScore-MOS)過程是召集一批實(shí)驗(yàn)者,請(qǐng)每個(gè)實(shí)驗(yàn)者對(duì)某個(gè)編解碼器的輸出進(jìn)行質(zhì)量判分,采用類似于考試的五級(jí)分制,不同的MOS分對(duì)應(yīng)的質(zhì)量級(jí)別和失真級(jí)別見下表。●聲音主觀質(zhì)量的度量方法MOS質(zhì)量級(jí)別失真級(jí)別5優(yōu)(Excellent)不察覺4良(Good)剛察覺但不可厭3中(Fair)察覺及稍微可厭2差(Poor)可厭(但不令人反感)1劣(Unacceptable)極可厭(令人反感)數(shù)字化聲音用聲音錄制軟件記錄的英文單詞“Hello”的語音實(shí)際波形模擬信號(hào)很容易受到電子干擾,因此隨著技術(shù)的發(fā)展,聲音信號(hào)就逐漸過渡到了數(shù)字存儲(chǔ)階段,A/D轉(zhuǎn)換和D/A轉(zhuǎn)換技術(shù)便應(yīng)運(yùn)而生。A:“Analog”(類比、模擬)D:“Digital”(數(shù)字、數(shù)碼)A/D轉(zhuǎn)換就是把模擬信號(hào)轉(zhuǎn)換成數(shù)字信號(hào)的過程,模擬電信號(hào)變?yōu)榱擞伞?”和“1”組成的Bit信號(hào)。這樣做的好處是顯而易見的,聲音存儲(chǔ)質(zhì)量得到了加強(qiáng),數(shù)字化的聲音信息使計(jì)算機(jī)能夠進(jìn)行識(shí)別、處理和壓縮,這也就是為什么如今磁帶逐漸被淘汰,CD唱片卻趨于流行的原因。
A/D轉(zhuǎn)換的一個(gè)關(guān)鍵步驟是聲音的采樣和量化,得到數(shù)字音頻信號(hào),它在時(shí)間上是不連續(xù)的離散信號(hào)。借助于A/D或D/A轉(zhuǎn)換器,模擬信號(hào)和數(shù)字信號(hào)可以互相轉(zhuǎn)換
8位可編程A/D轉(zhuǎn)換芯片●
聲音采樣——聲音數(shù)字化(模/數(shù)轉(zhuǎn)換)聲音采樣1101110011001101把聲音(模擬量)按照固定時(shí)間間隔,轉(zhuǎn)換成有限個(gè)數(shù)字表示的離散序列●
聲音重放——聲音模擬化(數(shù)/模轉(zhuǎn)換)聲音重放11011100把數(shù)字化聲音轉(zhuǎn)換成模擬量,經(jīng)過音響單元重放出來●
設(shè)備和軟件(1)聲音適配器(聲卡)8bit、16bit、…128bit¥80.00~3800.00(2)聲卡驅(qū)動(dòng)軟件以及各種聲音處理軟件人耳聽到的聲音是一種具有振幅、周期(頻率)的聲波,計(jì)算機(jī)要處理這種聲波,可以通過話筒把機(jī)械振動(dòng)轉(zhuǎn)變成相應(yīng)的電信號(hào),這也是一種連續(xù)的模擬信號(hào)。模擬信號(hào)的幅度,表示聲音的強(qiáng)弱。計(jì)算機(jī)只能處理數(shù)字量,不能處理這種模擬量,只有把這種模擬量轉(zhuǎn)換成數(shù)字量,計(jì)算機(jī)才有可能處理聲音,這種轉(zhuǎn)換就是模/數(shù)轉(zhuǎn)換(A/D轉(zhuǎn)換),它是由模/數(shù)轉(zhuǎn)換電路實(shí)現(xiàn)的。聲音經(jīng)A/D轉(zhuǎn)換后得到的數(shù)字聲音信號(hào)交給計(jì)算機(jī)處理,處理后的數(shù)據(jù)需經(jīng)過數(shù)/模(D/A)轉(zhuǎn)換電路,還原成模擬信號(hào),再進(jìn)行放大輸出到喇叭或耳機(jī),變成人耳能夠聽到的聲音。從模擬到數(shù)字聲源聲波傳聲器模擬電信號(hào)數(shù)字聲音聲音的數(shù)字化原理
模擬聲音信號(hào)是個(gè)連續(xù)量,可能由許多具有不同振幅和頻率的正弦波組成。計(jì)算機(jī)獲取實(shí)際聲音信號(hào)的過程就是聲音的數(shù)字化的處理過程。右圖表示了模擬聲音數(shù)字化的三個(gè)步驟:采樣、量化和編碼。數(shù)字音頻的處理●采樣(Sampling)
、采樣頻率采樣是將連續(xù)變化的模擬音頻信號(hào)變成計(jì)算機(jī)能處理的離散化數(shù)字信號(hào)的第一步。每隔一定時(shí)間,對(duì)模擬音頻信號(hào)的幅值進(jìn)行采樣測(cè)試,得到離散的幅值,并用該值表示兩次采樣之間的模擬幅值。單位時(shí)間采樣的次數(shù)稱為采樣頻率。采樣頻率越高,所得到的離散幅值的數(shù)據(jù)點(diǎn)就越逼近于連續(xù)音頻信號(hào),同時(shí)采樣所得到的數(shù)據(jù)量也越大。多媒體電腦中支持的采樣頻率通常為44.1kHz、22.05kHz及11.025kHz,8kHz。t模擬輸入t0t0采樣時(shí)鐘量化,編碼0tX(0)X(1)…X(n)…聲音的采樣聲音在數(shù)字化后的波形圖標(biāo)準(zhǔn)采樣頻率采樣頻率采樣次數(shù)/s聲音質(zhì)量8KHz8000電話音質(zhì)11.025KHz11025AM音質(zhì)22.05KHz22050FM音質(zhì)44.1KHz44100CD音質(zhì)48KHz48000DAT音質(zhì)說明:DAT指數(shù)字錄音帶格式(Digitalaudiotype)采樣定理:
奈奎斯特理論認(rèn)為:數(shù)字采樣頻率的大小由聲音信號(hào)本身的最高頻率決定。指出:進(jìn)行無損的數(shù)字化轉(zhuǎn)換,采樣頻率至少是所采信號(hào)所含最高頻率的2倍。fs>=2f聲音類型帶寬采樣頻率(kHz)電話語音200Hz-3.4kHz8調(diào)幅廣播50Hz-7kHz11.025調(diào)頻廣播20Hz-15kHz22.050CD20Hz-20kHz44.1●量化(Quantization)
采樣所得到的數(shù)據(jù)是一定的離散值,將這些離散值用若干二進(jìn)制的位來表示,這一過程稱為量化。用8位二進(jìn)制表示十進(jìn)制整數(shù),只能表示出0~255之間的整數(shù)值。也就是256個(gè)量化級(jí)。量化級(jí)對(duì)應(yīng)的二進(jìn)制位數(shù)稱為量化位數(shù)。雖然量化位數(shù)越多,對(duì)原始波形的模擬越細(xì)膩,聲音的音質(zhì)就越好,但數(shù)據(jù)量也越大。量化即是將采樣所得到的信號(hào)振幅值用一組二進(jìn)制脈沖序列來表示。離散化的數(shù)據(jù)經(jīng)量化變成二進(jìn)制表示一般會(huì)損失一些精度,這主要是因?yàn)橛?jì)算機(jī)只能表示有限的數(shù)值。均勻量化如果采用相等的量化間隔對(duì)采樣得到的信號(hào)作量化,那么這種量化稱為均勻量化。均勻量化就是采用相同的“等分尺”來度量采樣得到的幅度,也稱為線性量化。非均勻量化--非線性量化的基本想法是,對(duì)輸入信號(hào)進(jìn)行量化時(shí),大的輸入信號(hào)采用大的量化間隔,小的輸入信號(hào)采用小的量化間隔,如圖所示。這樣就可以在滿足精度要求的情況下用較少的位數(shù)來表示。聲音數(shù)據(jù)還原時(shí),采用相同的規(guī)則。
在非線性量化中,采樣輸入信號(hào)幅度和量化輸出數(shù)據(jù)之間定義了兩種對(duì)應(yīng)關(guān)系,一種稱為m
律壓擴(kuò)(companding)算法,另一種稱為A律壓擴(kuò)算法。
m
律壓擴(kuò)
m
律(m-Law)壓擴(kuò)(G.711)主要用在北美和日本等地區(qū)的數(shù)字電話通信中
A律壓擴(kuò)
A律(A-Law)壓擴(kuò)(G.711)主要用在歐洲和中國大陸等地區(qū)的數(shù)字電話通信中
量化噪聲:量化誤差,隨階距變大而增加。量化位數(shù)/采樣精度(字長(zhǎng)):
表示采樣值的二進(jìn)制位數(shù)(比特?cái)?shù)),決定了采樣值的精度。
例如:量化位數(shù)16bit,可以表示65536個(gè)不同量化值,精度(階距)1/65536。量化位數(shù)8bit,可以表示256個(gè)不同量化值,精度(階距)1/256。動(dòng)態(tài)范圍
(DynamicRange)20×lg(信號(hào)的最大強(qiáng)度/最小強(qiáng)度)(dB)信噪比(SignaltoNoiseRatio,SNR)-有用信號(hào)的能量和噪聲能量的比。-常用單位:dB
衡量信號(hào)質(zhì)量的標(biāo)準(zhǔn):量化位數(shù)幅值動(dòng)態(tài)范圍(dB)效果825648數(shù)字電話1664K96CD-DA60FM廣播40AM廣播
量化位與動(dòng)態(tài)范圍根據(jù)抽樣理論可知,一個(gè)數(shù)字信源的信噪比大約等于采樣精度乘以6分貝。
8位的數(shù)字系統(tǒng)其信噪比只有48分貝,
16位的數(shù)字系統(tǒng)的信噪比可達(dá)96分貝,信噪比低會(huì)出現(xiàn)背景噪聲以及失真。 因此,量化位數(shù)越多,保真度越好。
量化位與信噪比在多媒體電腦中,要對(duì)音頻進(jìn)行處理,必須在PC機(jī)上添加一塊聲卡。聲卡是多媒體升級(jí)套件中的核心部件之一,其外形與插在計(jì)算機(jī)主機(jī)箱內(nèi)的其他硬件插板相仿,也是一塊可以插在擴(kuò)展槽內(nèi)的電路板,但包含有完成音頻處理功能的電子元件。聲卡通過一秒內(nèi)對(duì)聲音進(jìn)行上千次的采樣、閱讀,把模擬聲波轉(zhuǎn)換成數(shù)字信息、數(shù)字化的聲音存儲(chǔ)在波形文件中。當(dāng)聲音被記錄時(shí),聲卡中的模/數(shù)轉(zhuǎn)換器把模擬聲波轉(zhuǎn)換成數(shù)字?jǐn)?shù)據(jù);當(dāng)聲音重放時(shí),聲卡中的數(shù)/模轉(zhuǎn)換器把波形文件里的數(shù)字?jǐn)?shù)據(jù)變成模擬波形輸出。聲音的壓縮聲音文件數(shù)據(jù)量的計(jì)算影響數(shù)字化聲音質(zhì)量的因素主要有三個(gè),即
采樣頻率,量化精度和聲道個(gè)數(shù)。聲道數(shù):指一次采樣所記錄產(chǎn)生的聲音波形個(gè)數(shù)。單聲道只有一個(gè)數(shù)據(jù)流,立體聲的數(shù)據(jù)流至少在兩個(gè)以上。由于立體聲聲音具有多聲道、多方向的特征,因此,聲音的播放在時(shí)間和空間性能方面都能顯示更好的效果,但相應(yīng)數(shù)據(jù)量將成倍增加。
數(shù)字聲音相關(guān)的參數(shù)質(zhì)量采樣頻率(kHz)量化精度單道聲/立體聲數(shù)據(jù)率(kb/s)頻率范圍(kHz)電話88單道聲64200~3400AM11.0258單道聲8850~7000FM22.05016立體聲705.620~15000CD44.116立體聲1411.220~20000DAT4816立體聲153620~20000聲音文件所需的存儲(chǔ)空間可用下式來計(jì)算:采樣率越大,數(shù)字信號(hào)越接近模擬信號(hào),但所要求的存儲(chǔ)空間也越大。
量化位數(shù)越多,所得的量化值越接近原始波形采樣值,但所要求的信息存儲(chǔ)量也越大。雙聲道立體聲比單聲道的聲音逼真豐富,但需要成倍于單聲道的信息容量。以16位、22.05kHz的頻率錄制1分鐘的立體聲,所需存儲(chǔ)空間為5.047MB。如果錄制1小時(shí)的立體聲。其所要求的存儲(chǔ)空間為60×5.047=302.81MB。計(jì)算:一張CD唱盤容量為640MB,問最多能存儲(chǔ)多長(zhǎng)時(shí)間的CD音質(zhì),采樣字長(zhǎng)為16bit的雙聲道立體聲歌曲?每秒:(44.1K*16*2/8)=176400Byte(640*1024*1024)/176400=3804s=1h3min24s
聲音壓縮通常采用有損壓縮的方式進(jìn)行,主要用在重構(gòu)的信號(hào)不必要與原始信號(hào)完全相同的場(chǎng)合。這種壓縮采取在壓縮的過程中丟掉某些不致對(duì)原始數(shù)據(jù)產(chǎn)生誤解的信息,以大大提高壓縮比。
從第一個(gè)音頻編碼方法產(chǎn)生到現(xiàn)在,出現(xiàn)了很多的壓縮編碼方法??梢詫⑺麄兎譃槿悾翰ㄐ尉幋a、參數(shù)編碼和混合編碼。波形編碼基于對(duì)語音信號(hào)波形的數(shù)字化處理,試圖使處理后重建的語音信號(hào)波形與原語音信號(hào)波形保持一致。優(yōu)點(diǎn):實(shí)現(xiàn)簡(jiǎn)單(計(jì)算量不大)、語音質(zhì)量(保真度)好、適應(yīng)性強(qiáng),有成熟的技術(shù)實(shí)現(xiàn)方法;缺點(diǎn):壓縮程度不高、實(shí)現(xiàn)的碼速率較高,碼率低于32kbit/s時(shí)音質(zhì)降低明顯,16kbit/s時(shí)音質(zhì)就非常差了。常見方法:脈沖編碼調(diào)制(PCM)、增量調(diào)制(DM)、差值脈沖編碼調(diào)制(DPCM)、自適應(yīng)差分脈沖編碼調(diào)制(ADPCM)、子帶編碼(SBC)和矢量量化編碼(VQ)等。編碼信號(hào)的速率計(jì)算:編碼速率=采樣頻率×編碼比特?cái)?shù)播放某音頻信號(hào)所需存儲(chǔ)量=播放時(shí)間×速率÷8(字節(jié))
參數(shù)編碼(聲源編碼)通過構(gòu)造發(fā)聲模型作為基礎(chǔ),用一套模擬聲帶頻譜特性的濾波器系數(shù)和若干聲源參數(shù)來描述這個(gè)模型,在發(fā)送端從模擬語音信號(hào)中提取各個(gè)特征參量并進(jìn)行量化編碼,以實(shí)現(xiàn)語音信息的數(shù)字化。優(yōu)點(diǎn):語音編碼速率較低(2~9.6kbit/s),壓縮比特率低;缺點(diǎn):合成語音質(zhì)量較差(保真度欠佳),實(shí)現(xiàn)的復(fù)雜度高。典型代表:線性預(yù)測(cè)編碼器(LPC)語聲信號(hào)產(chǎn)生模型周期性信號(hào)隨機(jī)性信號(hào)基音周期Tp濁音清音線性時(shí)變?yōu)V波器合成語音信號(hào)輸出C(n)u(n)v(n)G增益控制時(shí)變參數(shù)ai混和編碼波形編碼:保真度好,計(jì)算量小,但編碼后速率高;參數(shù)編碼:碼速率較低,但保真度欠佳,計(jì)算復(fù)雜。波形編碼與參數(shù)編碼結(jié)合——混和編碼:克服弱點(diǎn),結(jié)合優(yōu)點(diǎn)壓縮比特率:4~16kbit/s編碼器:多脈沖激勵(lì)線性預(yù)測(cè)編碼器(MPE-LPC)、規(guī)則脈沖激勵(lì)線性預(yù)測(cè)編碼器(RPE-LPC)、碼激勵(lì)線性預(yù)測(cè)編碼器(CELP)、矢量和激勵(lì)線性預(yù)測(cè)編碼器(VSELP)和多帶激勵(lì)線性預(yù)測(cè)編碼器。與參數(shù)編碼的差別:信號(hào)激勵(lì)源的選取更加精細(xì)——通過調(diào)整激勵(lì)信號(hào)使語音輸入信號(hào)與重構(gòu)的語音信號(hào)誤差最?。ê铣煞治龇ˋbS-analysisbysynthesis)。三種壓縮編碼的性能比較24616832kbit/s
主觀音質(zhì)評(píng)價(jià)
混和法
參數(shù)法
波形法54321差分脈沖編碼調(diào)制DPCM出發(fā)點(diǎn):對(duì)相鄰樣值的差值進(jìn)行量化編碼實(shí)現(xiàn):對(duì)樣值與其對(duì)應(yīng)的預(yù)測(cè)值的差值進(jìn)行量化編碼
預(yù)測(cè)表達(dá)式預(yù)測(cè)編碼
關(guān)鍵:預(yù)測(cè)系數(shù)的獲得——使預(yù)測(cè)估值的均方差為最小的預(yù)測(cè)系數(shù)自適應(yīng)差值脈沖編碼調(diào)制ADPCM
自適應(yīng)量化:使量化間隔的變化與輸入語聲信號(hào)的方差相匹配
自適應(yīng)預(yù)測(cè)預(yù)測(cè)系數(shù)隨輸入信號(hào)而變化2.線性預(yù)測(cè)編碼LPC語聲激勵(lì)信號(hào):濁音信號(hào)(準(zhǔn)周期脈沖序列)+清音信號(hào)(白色隨機(jī)噪聲)雖然碼速率低,但在噪聲環(huán)境下語音質(zhì)量不好,現(xiàn)已被淘汰。常用壓縮編碼方法基本思想預(yù)測(cè)表達(dá)式預(yù)測(cè)系數(shù)的求取圖
DPCM系統(tǒng)原理框圖DPCM
預(yù)測(cè)器
量化器編碼器解碼器
預(yù)測(cè)器信道接收端輸出XN’+++XNe’NXNeNe’NXN’++輸入^XN^發(fā)送端+-預(yù)測(cè)值抽樣值eN=XN-XN^存在量化誤差3.矢量量化編碼:將輸入信號(hào)樣值按某種方式分組(矢量),并量化理論基礎(chǔ):香農(nóng)率失真理論基本原理:用碼書中與輸入矢量最匹配的碼字的索引(下標(biāo))代替輸入矢量進(jìn)行傳輸和存儲(chǔ),解碼時(shí)只需簡(jiǎn)單的查表操作。關(guān)鍵技術(shù):碼書設(shè)計(jì)、碼字搜索、碼字(下標(biāo))索引分配。應(yīng)用:中速率和低速率語音編碼——G.723.1、G.728、G.729待續(xù)4.子帶編碼基本思想:將輸入信號(hào)分解為若干子頻帶,然后對(duì)各子帶分量根據(jù)其不同的統(tǒng)計(jì)特性采取不同的壓縮策略,以降低碼率。子帶劃分依據(jù):話音信號(hào)自身特性優(yōu)點(diǎn):不僅可以很好地控制各個(gè)子帶的量化電平數(shù),還可以很好地控制在重建信號(hào)時(shí)的量化誤差方差值,進(jìn)而獲得更好的主觀聽音質(zhì)量。相對(duì)獨(dú)立的量化噪聲被束縛在各自子帶內(nèi),互不影響。各個(gè)子帶的采樣頻率大大降低。矢量量化數(shù)據(jù)分組,每個(gè)組有K個(gè)數(shù)據(jù),一組數(shù)據(jù)構(gòu)成一個(gè)K維矢量;每個(gè)矢量有對(duì)應(yīng)的下標(biāo);每個(gè)矢量視為一個(gè)碼字;所有碼字排列形成一個(gè)表即為碼本或(碼書);設(shè)計(jì)一個(gè)良好的碼本C(具有N個(gè)K維矢量的集合)C={yi};
yi
為碼字,下標(biāo)i=1,2,3,,N。
矢量量化編碼矢量量化編碼原理框圖矢量量化編碼中,不傳輸對(duì)應(yīng)的矢量;發(fā)送端和接收端都有相同的碼本,只需傳送每個(gè)矢量的下標(biāo)i。下標(biāo)數(shù)據(jù)比矢量本身數(shù)據(jù)小得多,實(shí)現(xiàn)了壓縮。5.感知編碼基本原理:以人類聽覺系統(tǒng)的心理聲學(xué)為基礎(chǔ),只記錄能夠被人耳感覺到的聲音,從而達(dá)到壓縮數(shù)據(jù)量的目的。理論基礎(chǔ):基于人耳的聞閾、臨界頻段和掩蔽效應(yīng)。人耳對(duì)不同頻段聲音的反應(yīng)靈敏度有差異,在編碼時(shí),對(duì)被掩蔽的弱音不進(jìn)行編碼,從而達(dá)數(shù)據(jù)壓縮的目的。應(yīng)用:在音頻壓縮編碼中,感知編碼比較成功,如MPEG-1、MPEG-2、AC-3音頻信息壓縮編碼標(biāo)準(zhǔn)標(biāo)準(zhǔn)的描述對(duì)象:編碼速率、編碼的壓縮算法、編碼器結(jié)構(gòu)、話音質(zhì)量以及彼此的關(guān)系。目標(biāo):用盡可能低的數(shù)碼率來獲得盡可能好的合成語音質(zhì)量。G.711、G.721、G.722●波形編碼標(biāo)準(zhǔn)G.711
針對(duì)50Hz到3.2kHz的語音信號(hào)進(jìn)行A律和律PCM編碼,屬于非均勻量化。式中:x為輸入信號(hào)幅度,規(guī)格化成-1x
1;
律主要用在北美和日本等地區(qū)的數(shù)字電話通信中,按下面的式子確定量化輸入和輸出的關(guān)系:A律主要用在歐洲和中國大陸等地區(qū)的數(shù)字電話通信中,按下面的式子確定量化輸入和輸出的關(guān)系:0|x|1/A1/A|x|1式中:x為輸入信號(hào)幅度,規(guī)格化成-1x
1;
G.721
一個(gè)代碼轉(zhuǎn)換系統(tǒng)。它使用ADPCM轉(zhuǎn)換技術(shù),實(shí)現(xiàn)64kb/s(A律或μ律壓擴(kuò)技術(shù))PCM速率和32kb/s速率的ADPCM之間的相互轉(zhuǎn)換。ADPCM編碼器G.722
一種高質(zhì)量語音信號(hào)的壓縮標(biāo)準(zhǔn)。取樣頻率為16kHz,每個(gè)樣值量化到14b,采用子帶編碼和ADPCM進(jìn)行壓縮編碼。7kHz音頻信號(hào)64kb/s數(shù)據(jù)率的編譯碼方塊圖G.728
該標(biāo)準(zhǔn)利用低延時(shí)碼本激勵(lì)線性預(yù)測(cè)LD-CELP方法將一般語音信號(hào)壓縮至16Kb/s。
CELP編碼綜合了波形編碼和參數(shù)編碼,還采用矢量量化的壓縮算法。CELP實(shí)際上是一個(gè)閉環(huán)LPC系統(tǒng),由輸入語音信號(hào)確定最佳參數(shù),再根據(jù)某種最小誤差準(zhǔn)則從碼本中找出最佳激勵(lì)碼本矢量。CELP具有較強(qiáng)的抗干擾能力,在4~16kbit/s傳輸速率下,即可獲得較高質(zhì)量的語音信號(hào)。G.728、G.729、G.723.1●混和編碼標(biāo)準(zhǔn)G.729
低碼率的語音壓縮標(biāo)準(zhǔn),采用共軛結(jié)構(gòu)代數(shù)碼本激勵(lì)線性預(yù)測(cè)CS-ACELP,將語音信號(hào)壓縮至8Kb/s。G.723.1
采用ACELP(代數(shù)碼激勵(lì)線性預(yù)測(cè))算法,根據(jù)激勵(lì)碼本的不同可以將一般語音信號(hào)壓縮至5.3Kb/s和6.3Kb/s。
在6.3Kb/s編碼器內(nèi)采用了多脈沖激勵(lì),可以得到較高的音質(zhì)。MPEG-1、MPEG-2BC●MPEG音頻編碼標(biāo)準(zhǔn)●MPEG-2AAC編碼標(biāo)準(zhǔn)●MPEG-4音頻標(biāo)準(zhǔn)MPEG1音頻壓縮標(biāo)準(zhǔn)
包括3種壓縮模式:層次1、2、3;向下兼容;壓縮算法主要由子帶劃分和變換編碼構(gòu)成,主要步驟為:(1)音頻信號(hào)通過濾波器組分成為32個(gè)子帶;
(2)用FFT將子帶變換到頻率域;
(3)利用生理聲學(xué)模型對(duì)能感知的噪聲閾值進(jìn)行估計(jì);
(4)根據(jù)對(duì)噪聲閾值的估計(jì)進(jìn)行比特分配和量化。編碼器解碼器其音頻編碼分為3層:Layer-1、Layer-2和Layer-3。Layer-1的壓縮比為1:4,編碼速率為384kb/s;Layer-2的壓縮比為1:6~1:8之間,編碼速率為192~256kb/s;Layer-3的壓縮比為1:10~1:12,壓縮碼率可以達(dá)到64kb/s。Layer-1的編碼器最為簡(jiǎn)單,主要用于小型數(shù)字盒式磁帶;Layer-2編碼器的復(fù)雜程度是中等,主要用于數(shù)字廣播音頻、數(shù)字音樂、只讀光盤交互系統(tǒng)和視盤;Layer-3的編碼器最為復(fù)雜,主要用于ISDN上的聲音傳輸。表MPEG1Audio音頻文件壓縮比率和播放媒體最低位率Layer大約壓縮比率播放媒體最低位率11:4348Kbit/s21:6~1:8256Kbit/s~192Kbit/s31:10~1:12128Kbit/s~112Kbit/sMP3(Layer3)編碼是MPEG1Audio音頻壓縮標(biāo)準(zhǔn)之一。 MPEG-2BC聲音標(biāo)準(zhǔn)是在MPEG-1的基礎(chǔ)上發(fā)展來的,是MPEG為多聲道聲音開發(fā)的低碼率編碼方案,并與MPEG-1的聲音標(biāo)準(zhǔn)保持后向兼容。與MPEG-1相比主要增加了下面幾個(gè)方面的內(nèi)容:MPEG-2BC聲音壓縮標(biāo)準(zhǔn)支持5.1多路環(huán)繞立體聲:5個(gè)全帶寬聲道,分為左、右、中、和兩個(gè)環(huán)繞聲道,另加一個(gè)低頻效果增強(qiáng)聲道擴(kuò)展了編碼器的輸出范圍,從32~384kb/s擴(kuò)展到8~640kb/s。增加了更低的取樣頻率和低碼率:在保持MPEG-1原有的取樣頻率的基礎(chǔ)上,又增加了三種取樣頻率,新增的取樣頻率為16kHz、22.05kHz和24kHz,是將原有MPEG-1的取樣頻率降低了一半,以便提高碼率低于64kb/s時(shí)的每個(gè)聲道的聲音質(zhì)量。AC-3音頻壓縮標(biāo)準(zhǔn)DOLBY
5.1聲道音頻壓縮標(biāo)準(zhǔn):左(L)、中(C)、右(R)、左環(huán)繞(LS)、右環(huán)繞(RS)和低頻增強(qiáng)。前5聲道帶寬20Hz~20kHz;0.1聲道,提供100Hz以下的超低音聲道,彌補(bǔ)低音的不足。AC-3將六個(gè)聲道進(jìn)行數(shù)字編碼,并將它們壓縮成一個(gè)通道,而比特率僅是320kb/s。美國HDTV的音頻標(biāo)準(zhǔn) MPEG-2AAC(AdvancedAudioCoding)是MPEG-2標(biāo)準(zhǔn)中一種非常靈活的編碼標(biāo)準(zhǔn),采用感知編碼方法,主要是利用聽覺系統(tǒng)的掩蔽特性來減少聲音編碼的數(shù)據(jù)量;并且通過子帶編碼將量化噪聲分散到各個(gè)子帶中,用全局的聲音信號(hào)將噪聲掩蔽掉。MPEG-2AAC編碼標(biāo)準(zhǔn)AAC定義了3種配置:
基本配置在三種配置中提供最好的聲音質(zhì)量,除沒有使用增益控制模塊外,其余模塊都使用。
低復(fù)雜性配置沒有使用預(yù)測(cè)模塊和預(yù)處理模塊,使用的瞬時(shí)噪聲定形濾波器模塊的級(jí)數(shù)也有限,聲音質(zhì)量低于基本配置。
可變采用率配置使用增益控制作預(yù)處理,沒有使用預(yù)測(cè)模塊,對(duì)TNS(瞬時(shí)噪聲定性)濾波器的級(jí)數(shù)和帶寬也有限制,是最簡(jiǎn)單的一種配置。音頻編碼算法和標(biāo)準(zhǔn)算法名稱
數(shù)據(jù)率標(biāo)準(zhǔn)應(yīng)用波形編碼PCM脈沖編碼調(diào)制
公共網(wǎng)ISDN配音μ-law,A-lawμ-律,A-律
64kbpsG.711APCM自適應(yīng)脈沖編碼調(diào)制
DPCM差分脈沖編碼調(diào)制
ADPCM自適應(yīng)差分脈沖編碼調(diào)制
32kbpsG.721SB-ADPCM子帶-自適應(yīng)差分脈沖編碼調(diào)制
64kbpsG.7225.3kbps6.3kbpsG.723參數(shù)編碼LPC線性預(yù)測(cè)編碼
2.4kbps保密話聲混合編碼CELPC碼激勵(lì)LPC4.6kbps移動(dòng)通信VSELP矢量和激勵(lì)LPC8kbps語音郵件RPE-LTP規(guī)則碼激勵(lì)長(zhǎng)時(shí)預(yù)測(cè)
13.2kbpsISDNLD-CELP低延時(shí)碼激勵(lì)LPC16kbpsG.728G.729MPEG多子帶,感知編碼
128kbPsCDDolbyAC-3感知編碼
音響聲音的合成數(shù)字化的聲音首先要轉(zhuǎn)換成模擬信號(hào),才能播放。對(duì)于存儲(chǔ)的采樣音頻,有兩種處理方法:
FM頻率調(diào)制合成波形表(Wavetable)合成
頻率調(diào)制(FM)合成法數(shù)字式頻率調(diào)制合成法,簡(jiǎn)稱為FM合成法。FM電子合成器先由震蕩器產(chǎn)生一個(gè)載波作為基音,然后再產(chǎn)生若干個(gè)調(diào)制波帶著許多泛音加在載波之上,可以對(duì)這個(gè)組合加以任意調(diào)整,然后加上典型的聲音包絡(luò)線(ADSR),再通過數(shù)控濾波器和數(shù)控放大器送往數(shù)字/模擬轉(zhuǎn)換器,從而形成最后的聲音。由于一個(gè)物體不可能總是一成不變的振動(dòng),所以它的頻率和振幅都會(huì)隨著時(shí)間的改變而改變,并最終趨于靜止。我們把一聲音的發(fā)展過程分為四個(gè)階段,分別是觸發(fā)、衰減、保持和消失。這四個(gè)階段我們統(tǒng)稱為“包絡(luò)”。包絡(luò)的發(fā)生時(shí)間,也決定了一個(gè)樂音的時(shí)值。FM聲音合成器的工作原理由以下五部分組成:數(shù)字載波器調(diào)制器聲音包絡(luò)發(fā)生器數(shù)字運(yùn)算器數(shù)模轉(zhuǎn)換器
波形表合成(Wavetablesynthesis)也叫樂音樣本合成法,就是把各種真實(shí)樂器發(fā)出的聲音以數(shù)字的形式記錄下來,形成波形表,播放時(shí)調(diào)用相應(yīng)樂器的波形記錄,改變播放速度,從而改變音調(diào)周期,生成各種音階的音符。
專業(yè)聲卡采用此方式。波形表一般存儲(chǔ)在聲卡的ROM中。ROM存儲(chǔ)器的容量越大,合成的效果越好,開銷更大。產(chǎn)生豐富、逼真的音頻和音樂
CoolEditPro2.0
一款非常出色的音頻錄制、編輯、處理、混縮軟件CoolEditPro2.0的中文界面標(biāo)題欄菜單欄工具欄狀態(tài)欄多軌編輯模式CoolEditPro2.0的功能特點(diǎn)
CoolEditPro2.0軟件提供32-bit高精度音頻處理,支持視頻、CD、MIDI等設(shè)備。能方便地抓取CD音軌,也能抽取并編輯視頻文件中的音頻。
播放控制縮放控制當(dāng)前時(shí)間音節(jié)屬性所選部分和視圖中音頻屬性文件管理窗口調(diào)音窗口工具欄CoolEditPro2.0支持單軌或多軌編輯模式,編輯時(shí)可互相切換。同時(shí)具有強(qiáng)大的音頻編輯功能,支持可選的插件、崩潰恢復(fù)、自動(dòng)靜音檢測(cè)和刪除、自動(dòng)節(jié)拍查找、錄制等??梢詣?chuàng)建音調(diào)、歌曲、聲音、弦樂、顫音、噪音。并在單軌和多軌編輯模式下,分別提供了不同的編輯功能。軟件還提供了音頻分析器和相位分析器。多媒體音頻信號(hào)文件格式.wav●
WAVE(WaveformAudio)波形音頻文件
多媒體系統(tǒng)、音樂光盤制作,記錄物理波形,數(shù)據(jù)量大WAV文件來源于對(duì)聲音模擬波形的采樣。用不同的采樣頻率對(duì)聲音的模擬波形進(jìn)行采樣,可以得到一系列離散的采樣點(diǎn);以不同的精度(8位或16位)把這些采樣點(diǎn)的值轉(zhuǎn)換成二進(jìn)制碼,然后存磁盤,就產(chǎn)生了聲音的WAV文件,即波形文件。
●
WAV文件是由采樣數(shù)據(jù)組成的,所以它需要的存儲(chǔ)容量很大。一般情況下,WAV文件是不可能壓縮的。這是因?yàn)閃AV文件所記錄的音頻數(shù)字信息中很少有像圖像中存在的大量數(shù)據(jù)重復(fù)現(xiàn)象,一般數(shù)據(jù)壓縮算法很難有所作為,即使經(jīng)過壓縮,壓縮比也不高,壓縮結(jié)果也仍然需要很大的存儲(chǔ)空間。MIDI(MusicalInstrumentDigitalInterface)樂器數(shù)字化接口,是數(shù)字音樂的工業(yè)標(biāo)準(zhǔn),是用于音樂合成器、樂器和計(jì)算機(jī)之間交換音樂信息的一種硬件和軟件國際標(biāo)準(zhǔn)。MIDI文件并沒有記錄任何聲音信息,而只是記載了用于描述樂曲演奏過程中的一系列指令,這些指令包含了音高、音長(zhǎng)、通道號(hào)等主要信息,并以擴(kuò)展名為.MID的文件格式存儲(chǔ)起來。MIDI文件只是將樂器彈奏的每個(gè)音符記錄為一連串?dāng)?shù)字,然后用聲卡上的合成器根據(jù)這個(gè)數(shù)字所代表的含義進(jìn)行合成,最后通過揚(yáng)聲器播放音樂。.mid●
MIDI(MusicalInstrument
Digital
Interface)樂器數(shù)字化接口。用于合成、游戲音樂,記錄音符時(shí)值、頻率、音色特征,數(shù)據(jù)量小。WAV文件的優(yōu)點(diǎn)是可以從任何聲源錄制聲音,且可以保證它仍在任意一臺(tái)計(jì)算機(jī)上播放的效果大致相同,而MIDI文件則要受合成器中樂器組合的限制,其聲音質(zhì)量很大程度上取決于聲卡重新合成樂器聲音功能的強(qiáng)弱。相比之下,MIDI文件的錄制較復(fù)雜,這需要掌握一些使用MIDI創(chuàng)作編輯作業(yè)的專業(yè)知識(shí),并且還須有專門的工具。MIDI消息,是指樂譜的數(shù)字描述,包括電子樂器鍵盤的彈奏的鍵名、力度、時(shí)值長(zhǎng)短等參數(shù)。任何電子樂器,只要有處理MIDI消息的微處理器和合適的硬件接口,就構(gòu)成了一個(gè)MIDI設(shè)備。當(dāng)一組MIDI消息通過音樂合成芯片處理時(shí),合成器能解釋這些符號(hào)并且產(chǎn)生音樂。計(jì)算機(jī)上處理MIDI音樂的基本過程計(jì)算機(jī)中的MIDI文件通常來自于音樂創(chuàng)作軟件或合成音樂設(shè)備。許多播放器都能播放MIDI音樂,播放時(shí)(如圖所示)需要從相應(yīng)的MIDI文件或設(shè)備中讀出MIDI指令,接著由MIDI文件系統(tǒng)解釋指令,然后通過MIDI播放器輸出和轉(zhuǎn)換信號(hào),再經(jīng)過聲音合成器生成對(duì)應(yīng)的聲音波形,最后經(jīng)放大后由揚(yáng)聲器輸出。圖5-8計(jì)算機(jī)中MIDI音樂的處理
圖計(jì)算機(jī)中MIDI音樂的處理過程MIDI術(shù)語MIDI文件通道Channels音序器Sequencer合成器Synthesizer樂器Instrument通道映象ChannelMapping復(fù)音Polyphony音色Timbre音軌Track合成音色映射程序PatchMapperMIDI的通道單個(gè)物理MIDI通道分為16個(gè)邏輯通道,每個(gè)邏輯通道可指定一種樂器。在MIDI消息中,用4個(gè)二進(jìn)制位來表示這16個(gè)邏輯通道。MIDI鍵盤可設(shè)置在16個(gè)通道中任何一個(gè),MIDI合成器可以被設(shè)置在指定的通道上接受。
MIDI的物理接口標(biāo)準(zhǔn)MIDIIn(輸入口)接收從其他MIDI設(shè)備傳來的消息。MIDIOut(輸出口)發(fā)送某設(shè)備生成的原始MIDI消息。向其他設(shè)備發(fā)送MIDI消息。MIDIThru(轉(zhuǎn)發(fā)口)傳送從輸入口接收的消息到其他MIDI
設(shè)備。在MIDI設(shè)備之間傳送消息。各個(gè)MIDI設(shè)備通過專用的串行電纜(MIDI線)連接,并以31.25kbps(每字節(jié)10位-1位開始位,8位數(shù)據(jù)位和1位停止位)的速度傳送著數(shù)字音樂信息。MIDIThruOutInMIDI1.0規(guī)范中,使用的MIDI接頭是一個(gè)5針DIN接頭。MIDI是樂器和計(jì)算機(jī)使用的標(biāo)準(zhǔn)語言,是一套指令(命令/消息)的約定,它指示合成器(MIDI設(shè)備)要做什么,怎么做,如演奏音符、加大音量、生成音響效果等。MIDI不是聲音信號(hào),在MIDI電纜上傳送的不是聲音,而是動(dòng)作指令。MIDI設(shè)備的連接
不妨把MIDI理解成一種局域網(wǎng),網(wǎng)絡(luò)的各個(gè)部分通過專用的串行電纜(MIDI線)連接,
并以31.25kbps的速度傳送著數(shù)字音樂信息。
Cakewalk
ProAudio
V9.03
最著名和老牌的MIDI工具軟件,功能強(qiáng)大,可編輯、創(chuàng)作、調(diào)試MIDI音樂。TT作曲大師TT作曲家1.2標(biāo)準(zhǔn)版是一個(gè)集簡(jiǎn)譜編曲、自動(dòng)伴奏和打印功能為一體的作曲軟件。
可以利用直觀的簡(jiǎn)譜方式進(jìn)行音樂編配,還可以選擇內(nèi)置的100種具有中國特色的伴奏風(fēng)格,迅速制作出音樂成品。通過導(dǎo)入和導(dǎo)出MIDI文件的功能,您可以方便的與其它音樂軟件相互配合,將樂曲進(jìn)行精細(xì)的再加工。智能的歌詞輸入功能,讓您輕松制作和打印中文歌曲。
MIDI文件實(shí)際上是一張表格,就好比是一張樂譜,它描述了各種音符以及這些音符的播放及延時(shí),所以MIDI文件比WAV文件要小得多。例如,一段持續(xù)10余秒的立體聲音樂,若用MIDI格式只需2KB的存儲(chǔ)空間,而以WAV格式存放則需2MB左右。由于MIDI文件比WAV文件要小得多,所以預(yù)先裝入MIDI文件比裝入WAV文件容易,這為設(shè)計(jì)多媒體項(xiàng)目和指定何時(shí)播放音樂帶來很大的靈活性。MIDI文件的主要缺點(diǎn)是處理語音能力差,缺乏重現(xiàn)自然語言的能力,不能獨(dú)立合成,因此用戶可以在需要語言的地方,將WAV文件與MIDI文件配合使用。
WAVE與MIDI文件的比較MIDIWAVE
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 冷鏈物流溫控技術(shù)與冷鏈物流行業(yè)冷鏈倉儲(chǔ)管理研究報(bào)告
- 名班主任工作室班級(jí)文化建設(shè)職責(zé)
- 物業(yè)公司勞資專管員職責(zé)
- 2025貨物運(yùn)輸合同協(xié)議書
- 污水處理廠項(xiàng)目申請(qǐng)報(bào)告及可行性研究報(bào)告
- 食品安全售后服務(wù)及培訓(xùn)計(jì)劃
- 2020-2025年中國蒲公英種植行業(yè)發(fā)展前景預(yù)測(cè)及投資戰(zhàn)略研究報(bào)告
- 影視制作監(jiān)理巡視檢查計(jì)劃
- 2025學(xué)校教學(xué)內(nèi)容多元化計(jì)劃
- 2025版0號(hào)柴油居間業(yè)務(wù)委托合同示例
- 民法學(xué)全套精美課件
- 叉車安全駕駛技術(shù)(叉車基礎(chǔ)知識(shí)、安全駕駛、動(dòng)力裝置)課件
- 國內(nèi)高品質(zhì)膠原蛋白行業(yè)發(fā)展白皮書
- 《莊子》寓言對(duì)后世的影響
- 質(zhì)量過程報(bào)告記錄匯總表-scr與ncr表格報(bào)檢單
- 湖南省長(zhǎng)沙市2022-2023學(xué)年新高一英語入學(xué)分班考試試卷【含答案】
- k-bus產(chǎn)品手冊(cè)中文版ip interface使用手冊(cè)
- 第九講有機(jī)化學(xué)結(jié)構(gòu)理論
- 工程化學(xué)復(fù)習(xí)要點(diǎn)及習(xí)題解答童志平版本PPT課件
- 論中心蝶閥、單、雙、三、四偏心蝶閥
- 《中國語言文化》課程教學(xué)大綱
評(píng)論
0/150
提交評(píng)論