




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
高級(jí)音響師實(shí)用教程上部1-5章目錄\h第1章數(shù)字聲頻技術(shù)基礎(chǔ)\h1.1A/D轉(zhuǎn)換\h1.1.1采樣\h1.1.2濾波和混疊\h1.1.3量化\h1.1.4采樣分辨率的可聞效果\h1.1.5高頻顫動(dòng)的使用\h1.1.6高頻顫動(dòng)的種類\h1.1.7A/D轉(zhuǎn)換中的過采樣\h1.1.8A/D轉(zhuǎn)換中的噪聲整形\h1.2D/A轉(zhuǎn)換\h1.2.1基本的D/A轉(zhuǎn)換\h1.2.2D/A轉(zhuǎn)換中的過采樣\h1.3音質(zhì)與采樣頻率和分辨率之間的關(guān)系\h1.3.1心理聲學(xué)限制\h1.3.2采樣頻率\h1.3.3量化分辨率\h1.4數(shù)字化處理的相關(guān)問題\h1.4.1時(shí)基抖動(dòng)及對(duì)轉(zhuǎn)換器的影響\h1.4.2改變聲頻信號(hào)的分辨率(再量化)\h1.4.3動(dòng)態(tài)范圍擴(kuò)展\h1.4.4誤碼校正\h1.5數(shù)字聲頻信號(hào)處理\h1.5.1電平控制\h1.5.2交叉漸變\h1.5.3調(diào)音\h1.5.4數(shù)字濾波器和均衡\h1.5.5數(shù)字混響和其他效果\h1.5.6動(dòng)態(tài)處理\h1.5.7采樣頻率轉(zhuǎn)換\h第2章數(shù)字聲頻記錄技術(shù)\h2.1數(shù)字錄音帶(DAT)\h2.1.1DAT盒式磁帶的構(gòu)造\h2.1.2DAT模式的分類與特點(diǎn)\h2.1.3DAT硬件設(shè)計(jì)的基本方案\h2.1.4磁道上的記錄格式\h2.1.5DAT的方位記錄與自動(dòng)磁道跟蹤\h2.1.68-10調(diào)制碼記錄方式\h2.1.7DAT的糾錯(cuò)編碼\h2.1.8DAT的時(shí)間碼\h2.2DVD\h2.2.1概述\h2.2.2DVD-Video\h2.2.3DVD-Audio\h2.3MP3\h2.3.1MP3播放機(jī)的特點(diǎn)與主要性能\h2.3.2MP3播放機(jī)的工作原理\h2.3.3MP3播放機(jī)的使用\h第3章數(shù)字調(diào)音臺(tái)\h3.1數(shù)字調(diào)音臺(tái)的特點(diǎn)\h3.2VENUE數(shù)字調(diào)音臺(tái)的特點(diǎn)\h3.3調(diào)音臺(tái)的使用\h3.3.1調(diào)音臺(tái)背面板\h3.3.2調(diào)音臺(tái)前面板\h3.3.3操作控制屏幕與軟件\h3.4調(diào)音操作步驟\h第4章MIDI(樂器數(shù)字接口)\h4.1MIDI的硬件\h4.2MIDI信息的組成\h4.2.1通道信息\h4.2.2系統(tǒng)信息\h4.3MIDI制作系統(tǒng)中的設(shè)備\h4.3.1概述\h4.3.2MIDI鍵盤合成器\h4.3.3音源\h4.3.4鼓機(jī)\h4.3.5MIDI音序器\h4.3.6MIDI效果器\h4.4MIDI設(shè)備在錄音中的應(yīng)用\h4.5電腦音樂制作系統(tǒng)\h4.5.1電腦音樂制作系統(tǒng)的組成\h4.5.2電腦音樂制作系統(tǒng)在音樂節(jié)目制作中的應(yīng)用\h第5章數(shù)字聲頻工作站\h5.1數(shù)字聲頻工作站的構(gòu)成\h5.1.1專門的系統(tǒng)\h5.1.2以桌面計(jì)算機(jī)為基礎(chǔ)的系統(tǒng)\h5.2數(shù)字聲頻工作站的聲頻處理\h5.2.1大容量存儲(chǔ)媒體聲音的記錄原理\h5.2.2多聲道記錄和重放\h5.2.3聲頻編輯\h5.2.4時(shí)基和同步\h5.2.5變速操作\h5.2.6工作站中的DSP\h5.3文件格式及數(shù)據(jù)交換\h5.3.1聲頻文件格式\h5.3.2開放媒體構(gòu)架交換(OMFI)\h5.3.3CD預(yù)母版格式\h5.3.4數(shù)字聲頻接口\h5.3.5數(shù)字信號(hào)同步\h5.3.6網(wǎng)絡(luò)\h5.4數(shù)字聲頻工作站中的視頻技術(shù)\h5.4.1數(shù)字視頻基礎(chǔ)\h5.4.2視頻數(shù)據(jù)壓縮\h5.4.3MPEG和JPEG\h5.4.4桌面視頻系統(tǒng)\h5.4.5用于聲頻工作站的數(shù)字視頻選件\h5.4.6SMPTE/EBU時(shí)碼\h5.4.7丟幀時(shí)碼格式\h5.4.8時(shí)碼的處理第1章數(shù)字聲頻技術(shù)基礎(chǔ)本章將簡(jiǎn)要介紹有關(guān)數(shù)字聲頻技術(shù)的基礎(chǔ)知識(shí),主要闡述那些在數(shù)字聲頻中影響聲音質(zhì)量的有關(guān)問題,并對(duì)聲頻數(shù)字信號(hào)處理(DSP)作一個(gè)簡(jiǎn)要的介紹。數(shù)字聲頻系統(tǒng)的基本結(jié)構(gòu)如圖1-1所示。模擬聲頻信號(hào)在A/D轉(zhuǎn)換中被轉(zhuǎn)換成二進(jìn)制值。這些二進(jìn)制值經(jīng)各種方式的DSP后,被編碼并且存儲(chǔ)起來,或者被傳送出去。存儲(chǔ)或者傳送的信號(hào)仍可進(jìn)行進(jìn)一步的處理,然后轉(zhuǎn)換回模擬域。圖1-1數(shù)字聲頻系統(tǒng)基本結(jié)構(gòu)框圖1.1A/D轉(zhuǎn)換A/D轉(zhuǎn)換是決定數(shù)字聲頻信號(hào)最終質(zhì)量?jī)?yōu)劣的最重要的一環(huán)。事實(shí)上,一個(gè)聲頻信號(hào)在進(jìn)行了轉(zhuǎn)換處理之后,其聲音質(zhì)量只有變壞的可能,而絕無轉(zhuǎn)好的希望。許多聲頻處理純粹是在數(shù)字域中進(jìn)行的,在這種情況下,A/D轉(zhuǎn)換并非關(guān)鍵所在,但是大多數(shù)的操作仍然不時(shí)地需要從模擬域上獲得聲音素材。工作站的價(jià)格各不相同,因此這些數(shù)字聲頻工作站及其周邊轉(zhuǎn)換器的質(zhì)量也有優(yōu)劣之分。許多分立的專業(yè)轉(zhuǎn)換器的價(jià)格都相當(dāng)于一個(gè)臺(tái)式計(jì)算機(jī)的全部數(shù)字聲頻硬件和軟件的價(jià)格。如今,在許多多媒體臺(tái)式計(jì)算機(jī)中都能見到16bit的轉(zhuǎn)換器,然而與最有效的那些設(shè)備相比,這些設(shè)備的表現(xiàn)很不理想。正如在下面所要看到的,采樣率以及每個(gè)采樣的比特?cái)?shù)是決定一個(gè)數(shù)字聲頻信號(hào)質(zhì)量?jī)?yōu)劣的主要因素,而轉(zhuǎn)換器的質(zhì)量卻表明在這些限制之下,是否能更接近極限。除此之外,必須承認(rèn)的一點(diǎn)是:對(duì)于很多人來說,一個(gè)16bit的轉(zhuǎn)換器聽起來與別的并沒有什么不同,很多時(shí)候價(jià)格與質(zhì)量并不是成正比的。1.1.1采樣模擬的聲頻信號(hào)是在時(shí)間上連續(xù)的電信號(hào),而A/D轉(zhuǎn)換器的任務(wù)正是將這一信號(hào)轉(zhuǎn)換為在時(shí)間上離散的二進(jìn)制數(shù)序列。在轉(zhuǎn)換器中,采樣過程包括對(duì)聲頻波形的振幅在規(guī)定的間隔上及時(shí)進(jìn)行測(cè)量或采樣,如圖1-2所示。顯然,采樣脈沖準(zhǔn)確地表示出了信號(hào)在每一時(shí)刻的瞬間振幅。采樣可被看作是當(dāng)快速連續(xù)播放時(shí)組成連續(xù)動(dòng)感電影的一個(gè)個(gè)靜止幀。圖1-2任意聲頻信號(hào)以規(guī)律的時(shí)間間隔被采樣基于詳細(xì)地表征一個(gè)信號(hào)的需要,有必要在每秒鐘獲取大量的采樣值,同時(shí)香農(nóng)采樣定理指出:如果一個(gè)信號(hào)的必要信息能被恢復(fù),那么在每一個(gè)聲頻周期必須至少得有兩個(gè)采樣。從圖1-3中可以看到,如果在聲頻信號(hào)的每一個(gè)周期只獲得很少的采樣,那么采樣所描繪的可能會(huì)迥異于其采樣的原始波形,這也是有助于理解混疊這一現(xiàn)象的一種方法。通過D/A轉(zhuǎn)換來恢復(fù)出被采樣的信號(hào)時(shí),混疊會(huì)產(chǎn)生原始信號(hào)不需要的成分。圖1-3每一聲頻周期必須至少得到兩個(gè)采樣將采樣過程形象化的另一個(gè)方法是把它放在調(diào)制的情況下加以考慮,就像在圖1-4中表示的那樣。連續(xù)的聲頻波形被用來調(diào)制一個(gè)規(guī)則的脈沖序列,這些脈沖的頻率就是采樣頻率。在調(diào)制之前,所有這些脈沖都有同樣的振幅(高度),但是在調(diào)制之后,脈沖的振幅將根據(jù)聲頻信號(hào)在該點(diǎn)的瞬時(shí)振幅被加以修正。這一過程稱之為脈沖振幅調(diào)制(PAM),調(diào)制信號(hào)的頻譜如圖1-5所示??梢钥匆?,除了“基帶”聲頻信號(hào)(采樣前的原始頻譜)之外,現(xiàn)在又出現(xiàn)了許多額外的頻譜,并以采樣頻率的倍頻頻率為中心,呈對(duì)稱分布。作為振幅調(diào)制的一個(gè)結(jié)果,采樣頻率及其倍頻的每一邊都產(chǎn)生了邊帶,它將采樣頻率及其倍頻上下延伸基帶寬度。換言之,這樣的邊帶是聲頻頻帶的對(duì)稱鏡像。圖1-4放在脈沖振幅調(diào)制下的采樣圖1-5調(diào)制信號(hào)的頻譜1.1.2濾波和混疊從圖1-6中可以容易地看出,為什么采樣頻率必須至少兩倍于信號(hào)基帶所含的最高頻率。這是因?yàn)椋撼^奈奎斯特(Nyquist)采樣頻率的一個(gè)擴(kuò)展的基帶導(dǎo)致了第一個(gè)重復(fù)頻譜的較低的邊帶重疊在基帶的較后部分。這里舉出兩個(gè)例子來進(jìn)一步說明:在第一個(gè)例子中,一個(gè)基帶聲音有足夠低的頻率,其采樣了的邊帶頻率處在聲頻范圍之上;而在第二個(gè)例子中,一個(gè)較高的頻率產(chǎn)生了較低的采樣邊帶,正好落在基帶之內(nèi),形成對(duì)原始聲音的一個(gè)混疊。圖1-6在頻域內(nèi)觀察的混疊在大家所熟悉的電影“輪幅”效應(yīng)中,就能夠看到混疊這種現(xiàn)象,因?yàn)椴粩嘧儞Q的畫面也是信號(hào)采樣的一個(gè)例子。在影片中,靜止畫面(影像樣本)在正常情況下是以24幀每秒的速度獲取的。如果拍攝一個(gè)有著參考標(biāo)志的旋轉(zhuǎn)的車輪,當(dāng)靜止畫面的播放速度比旋轉(zhuǎn)的速度快得多的話,將會(huì)感到車輪向前轉(zhuǎn)動(dòng),但是隨著旋轉(zhuǎn)速度的增加,車輪將表現(xiàn)出減速、停止、開始向后運(yùn)動(dòng)的效果。當(dāng)車輪旋轉(zhuǎn)的速度變得更快時(shí),實(shí)際效果所表現(xiàn)出的向后運(yùn)動(dòng)速度也將變快,這個(gè)向后的動(dòng)作就是由于以一個(gè)很低的速度進(jìn)行采樣所產(chǎn)生的混疊。顯然,車輪其實(shí)并沒有向后,但其視覺效果卻是如此。在數(shù)字錄音中,如果允許一個(gè)聲頻信號(hào)產(chǎn)生混疊,重放時(shí)也將會(huì)聽到如同向后旋轉(zhuǎn)車輪般的聽覺效果——也就是說,在第一邊頻沒有可聞?lì)l譜中的聲音成分,隨著信號(hào)原始頻率的增加,其頻率下降。所以,在基本的轉(zhuǎn)換器中,必須在采樣之前就對(duì)基帶聲頻信號(hào)進(jìn)行濾波,如圖1-7中所示,從而除去一些超過1/2采樣頻率(即奈奎斯特頻率)的部分。圖1-7在轉(zhuǎn)換前使用模擬的抗混疊濾波器濾去輸入信號(hào)中超過奈奎斯特采樣頻率的成分在實(shí)際系統(tǒng)中,因?yàn)椴豢赡苡欣硐牖臑V波器,采樣頻率要稍微高于兩倍的記錄頻帶上限,允許通帶與阻帶的過渡特性不是非常陡峭。在D/A和A/D轉(zhuǎn)換器中采用的濾波器對(duì)聲音音色有明顯的影響,因?yàn)樗鼈儧Q定了在聲頻頻帶內(nèi)頻率響應(yīng)的線性,在高頻處傾斜衰減,以及系統(tǒng)具有線性相位響應(yīng)。在一個(gè)非過采樣轉(zhuǎn)換器中,濾波器必須濾掉所有高于1/2采樣頻率的信號(hào),至少也要衰減80dB。陡峭的濾波器很可能在高頻處有不確定的相位響應(yīng),同時(shí)由于濾波器的高Q值可能表現(xiàn)出“鈴響”,因此陡峭濾波器也有缺點(diǎn),其制作也非常復(fù)雜。盡管濾波器的影響在許多方面是不可避免的,但制作者已經(jīng)在抗混疊和平滑濾波器研究設(shè)計(jì)方面取得了長(zhǎng)足的進(jìn)展,許多目前采用的性能較差的濾波器,其性能已有所改進(jìn),一個(gè)積極的效果即反映在音質(zhì)的改善上。過采樣處理有助于減少模擬濾波產(chǎn)生的問題,因?yàn)樗鼘⒒鶐У牡谝粋€(gè)重復(fù)邊帶移至更高的頻率上,這樣便允許使用較緩衰減斜率的濾波器。1.1.3量化采樣之后,調(diào)制的脈沖序列被量化。在量化一個(gè)采樣信號(hào)時(shí),采樣的振幅被轉(zhuǎn)換成一些階梯狀變化的值,如圖1-8所示。量化器決定量化間距的固定數(shù)據(jù)(Q值的大?。?,每一個(gè)采樣都位于其中,然后分配給它一個(gè)值來表示這個(gè)值的中心點(diǎn)。這樣做的目的在于在脈沖編碼調(diào)制中,每一個(gè)采樣振幅都能由一個(gè)唯一的二進(jìn)制數(shù)來表示。在線性量化中,每一個(gè)量化階梯等同于信號(hào)電平的增量,在二進(jìn)制系統(tǒng)中,量化階梯數(shù)等于2n。這里n是指的二進(jìn)制中的比特?cái)?shù),它用來表征每一個(gè)采樣。因此,一個(gè)4bit轉(zhuǎn)換器僅僅提供了24(16)個(gè)量化步階,而一個(gè)16bit的量化器則可提供多達(dá)216(65536)個(gè)量化步階。圖1-8量化時(shí)采樣的振幅被轉(zhuǎn)換成一些階梯狀變化值能夠隨時(shí)有效表示信號(hào)振幅的離散步階的數(shù)目是有限的,所以在量化過程中會(huì)有誤差產(chǎn)生。誤差的最大值將為正負(fù)半個(gè)步階的幅度,并且假如所表示的模擬電平保持不變的話,那么每個(gè)采樣大量的比特?cái)?shù)也將產(chǎn)生一個(gè)較小的誤差。圖1-9所示的是在不同的分辨率下,數(shù)字聲頻信號(hào)所處的二進(jìn)制數(shù)范圍,通常使用2的補(bǔ)碼形式表示。由圖1-9可以看到,一個(gè)16bit信號(hào)最大的確定采樣值是7FFF,同時(shí)最大的負(fù)值為8000。在其通過0V點(diǎn)時(shí),采樣值從全零(0000)變化至全1(FFFF),最大數(shù)字信號(hào)電平通常稱為0dBFS(FS意為滿刻度)。超過這個(gè)電平的信號(hào)被削波,導(dǎo)致了嚴(yán)重的失真,如圖1-10所示。圖1-9不同的分辨率下數(shù)字聲頻信號(hào)所處的二進(jìn)制范圍圖1-10數(shù)字系統(tǒng)中超過峰值點(diǎn)電平的信號(hào)被削波情況1.1.4采樣分辨率的可聞效果量化誤差可以認(rèn)為是一個(gè)不想要的信號(hào)疊加在了想要的信號(hào)之上,如圖1-11所示。根據(jù)它們的特性,不想要的信號(hào)可劃分為失真或噪聲,相關(guān)的聲頻信號(hào)的性質(zhì)和電平很大程度上又決定了信號(hào)量化誤差的性質(zhì)。下面的幾個(gè)例子通過圖示的方法對(duì)16bit采樣分辨率時(shí)數(shù)字域的清晰度進(jìn)行了說明。圖1-11量化誤差被加在原始采樣值上首先讓我們考慮一個(gè)電平很低的正弦波信號(hào),它被采樣隨后又被量化,其電平僅僅夠讓它在峰值的時(shí)候,使得量化器的最低有效比特開啟或關(guān)閉,如圖1-12(a)所示。這樣一個(gè)信號(hào)會(huì)產(chǎn)生一個(gè)周期性的、與信號(hào)緊密相關(guān)的量化誤差,導(dǎo)致了諧波失真。圖1-12(b)所示為該信號(hào)的頻譜分析,它清楚地表明在原來的基礎(chǔ)之上所產(chǎn)生失真的成分(偶次諧波占主要地位)。一旦信號(hào)降至開啟LSB(最低有效位)的電平之下,也許就沒有調(diào)制了。因此,將一個(gè)信號(hào)衰減至無聲,反映在聽覺上的效果就是一個(gè)逐漸增加的失真信號(hào)突然消失。如正弦波信號(hào)電平較高則會(huì)越過更多的量化間隔,并產(chǎn)生更多的非零采樣值。隨著信號(hào)電平的增加,量化誤差最大值仍然是±0.5Q,但占整個(gè)信號(hào)電平的比例逐漸減小,同時(shí)誤差也逐漸與信號(hào)失去相關(guān)性。圖1-12電平很低的正弦信號(hào)被采樣隨后又被量化情況現(xiàn)在考慮一個(gè)有合理高電平的音樂信號(hào),它的振幅以及頻譜特征變化很大,因此其量化誤差有著隨機(jī)的特性。換句話說,這更像噪聲,而非失真,因此經(jīng)常用量化噪聲來描述由量化誤差所造成的聽覺上的效果。分析量化誤差的功率時(shí),假定它有類似于噪聲的特性,表明它有的均方根振幅,這里Q是用一個(gè)量化間隔來表示電壓增量。所以一個(gè)理想的n比特量化信號(hào)的信噪比(S/N)可以被表示為:6.02n+1.76dB這意味著理想的S/N大約稍稍超過6dB/bit。所以可以估算出一個(gè)16bit的轉(zhuǎn)換器的S/N大約是98dB,而一個(gè)8bit轉(zhuǎn)換器大約為50dB。這里所假設(shè)的是一個(gè)非顫動(dòng)的轉(zhuǎn)換器。如果一個(gè)轉(zhuǎn)換器是非顫動(dòng)的,那么當(dāng)有信號(hào)時(shí),將只有量化噪聲存在,但是當(dāng)信號(hào)不存在的時(shí)候則沒有靜態(tài)本底噪聲。1.1.5高頻顫動(dòng)的使用在A/D轉(zhuǎn)換以及在進(jìn)行不同的采樣分辨率間的轉(zhuǎn)換時(shí)使用高頻顫動(dòng)的做法,現(xiàn)在已經(jīng)被普遍接受。它具有對(duì)普通的轉(zhuǎn)換器實(shí)施線性化的作用(換言之,它可有效地將每一個(gè)量化間隔均勻化),同時(shí)它可將量化失真轉(zhuǎn)化為一種隨時(shí)都有的類似隨機(jī)噪聲的信號(hào)(即白噪聲)。這種方法之所以很受歡迎有幾種原因。首先,白噪聲在低電平的情況下不像失真那樣讓人感覺討厭;其次,它允許信號(hào)平緩地衰減至無聲,而不像前面提到的那樣突然消失;再者,即使在信號(hào)的電平降至系統(tǒng)的本底噪聲之下的時(shí)候,通常也可將信號(hào)重新恢復(fù)。在信號(hào)電平下降時(shí),沒有加入高頻顫動(dòng)的聲頻信號(hào)聽起來有“顆粒感”,同時(shí)覺得失真了。當(dāng)高頻顫動(dòng)打開時(shí),細(xì)微的“咝咝”聲將消失,使得系統(tǒng)聽起來更加安靜,但通常卻認(rèn)為少量的連續(xù)的“咝咝”聲與低電平失真相比,前者更加可取。對(duì)轉(zhuǎn)換器的高頻顫動(dòng)處理就是將一個(gè)很低電平的信號(hào)加入到聲頻信號(hào)上,其振幅取決于顫動(dòng)所使用的類型。高頻顫動(dòng)信號(hào)通常是噪聲,但也可能是一半采樣頻率的一個(gè)波形,或者是兩者的結(jié)合。一個(gè)在A/D轉(zhuǎn)換過程中沒有被正確加入顫動(dòng)的信號(hào),不可能在以后通過高頻顫動(dòng)達(dá)到同樣的效果,因?yàn)樾盘?hào)已經(jīng)產(chǎn)生了不可挽回的失真。高頻顫動(dòng)是怎樣完成除去量化失真這一任務(wù)呢?前面已經(jīng)說明,失真是信號(hào)與量化誤差之間存在相關(guān)性所造成的,從而導(dǎo)致了誤差的周期性,并產(chǎn)生了主觀上嘈雜不安的聽感。如圖1-13所示,將一個(gè)隨機(jī)的噪聲信號(hào)加在聲頻信號(hào)之上使量化誤差隨機(jī)化,并使其聽起來有點(diǎn)類似噪聲的效果,若一個(gè)噪聲的振幅與LSB的值相當(dāng)(換句話講,為一個(gè)量化階梯),那么一個(gè)準(zhǔn)確位于一個(gè)量化間距和下一個(gè)之間的關(guān)鍵點(diǎn)位置的信號(hào)會(huì)被量化到上面或下面去,這要取決于加在其上的高頻顫動(dòng)噪聲的瞬時(shí)電平。一段時(shí)間之后,這一隨機(jī)的效果將被平均化,產(chǎn)生一個(gè)類似于噪聲的量化誤差,并且系統(tǒng)有一個(gè)固定的本底噪聲。圖1-13量化誤差隨機(jī)化及類似噪聲效果圖1-13(a)與圖1-12所表示的是同樣的一個(gè)低電平正弦波,但它加入了高頻顫動(dòng)噪聲。被量化的信號(hào)保持著1kHz正弦波的振動(dòng)方式,但是現(xiàn)在它更頻繁地被調(diào)制,并且其中加入了隨機(jī)的成分。這一信號(hào)的頻譜如圖1-14(b)所示,它表明伴隨著單一正弦波成分的還有一個(gè)平穩(wěn)的本底噪聲。圖1-14(c)和(d)表明加入了高頻顫動(dòng)的正弦波的波形和頻譜,這個(gè)正弦波的電平在未加高頻顫動(dòng)處理的16bit系統(tǒng)中是無法表示的。但是如果仔細(xì)研究的話會(huì)發(fā)現(xiàn),原始1kHz周期性變化成分仍然可以在其調(diào)制型中看見。LSB調(diào)制占空比(時(shí)間開和關(guān)之間的比率)隨著原始信號(hào)的振幅而變化。當(dāng)它通過一個(gè)D/A轉(zhuǎn)換器和重建濾波器后,其結(jié)果為一個(gè)純粹的正弦波信號(hào)加上噪聲,這一切可從頻譜分析中看到。圖1-14信號(hào)頻譜及波形在諸如調(diào)音臺(tái)等一些數(shù)字處理設(shè)備中,也使用高頻顫動(dòng),不過在這些情況下,它是作為一個(gè)隨機(jī)數(shù)字序列被引入數(shù)字域的(數(shù)字域白噪聲)。從這一意義上講,它被用于去除由于信號(hào)增益改變而產(chǎn)生的低電平失真,以及在后期制作中進(jìn)行高分辨率到低分辨率的轉(zhuǎn)換的優(yōu)化處理。1.1.6高頻顫動(dòng)的種類主要由Vanderkooy和Lipshitz進(jìn)行的研究已經(jīng)揭示了在高質(zhì)量的聲頻制作中,某種類型的高頻顫動(dòng)要比別的類型有效得多。高頻顫動(dòng)噪聲常根據(jù)其概率分布進(jìn)行歸一化處理,以顯示特定的振幅信號(hào)的概率分布。類似圖1-15所示的一個(gè)簡(jiǎn)單的圖形可用來說明分布的形狀,其中概率是用豎軸表示,而以量化步階反映出的振幅用橫軸表示。圖1-15高頻顫動(dòng)的概率分布曲線只要考慮一下在投骰子時(shí)骰子墜落的方式,就可以理解邏輯概率分布,如圖1-16所示。投一個(gè)骰子存在一個(gè)矩形概率分布函數(shù)(RPDF),因?yàn)閿S出1點(diǎn)和6點(diǎn)之間任一點(diǎn)數(shù)的概率均等(除非骰子已被做了手腳?。?。另一方面,一對(duì)小骰子的點(diǎn)數(shù)之和,有一個(gè)近似三角形的概率分布函數(shù)(TPDF),其峰值集中在6~8之間,因?yàn)樾纬蛇@種和值的組合的可能性多于組合成2點(diǎn)或12點(diǎn)的可能性。在數(shù)字電信號(hào)中,我們可用一個(gè)類似于擲骰子的隨機(jī)數(shù)字發(fā)生器產(chǎn)生顫動(dòng),同時(shí)還發(fā)現(xiàn)使用一個(gè)隨機(jī)數(shù)字發(fā)生器可以產(chǎn)生RPDF顫動(dòng),將兩個(gè)RPDF發(fā)生器的輸出相加可以產(chǎn)生TPDF顫動(dòng)。圖1-16擲骰子的概率分布RPDF顫動(dòng)振幅處在零與最大值之間的概率相等,然而TPDF顫動(dòng)振幅為零的概率要大于為最大值的概率。模擬白噪聲具有高斯概率分布,其形狀與任一種邏輯產(chǎn)生的高頻顫動(dòng)相比都稍有不同。Lipshitz和Vanderkooy已經(jīng)證明,RPDF、TPDF以及高斯型高頻顫動(dòng)都具有使轉(zhuǎn)換線性化和去除失真的效果。RPDF顫動(dòng)傾向于在低電平信號(hào)下進(jìn)行噪聲調(diào)制,這就使得他們認(rèn)為最合適的顫動(dòng)噪聲是峰峰值為2Q的TPDF,如圖1-17所示。如果使用RPDF顫動(dòng),它應(yīng)有1Q的峰峰值。圖1-17聲頻信號(hào)最適合加數(shù)字高頻顫動(dòng)信號(hào)有時(shí)候在數(shù)字域可以輕易地產(chǎn)生理想的邏輯概率分布函數(shù),就好像存在于許多轉(zhuǎn)換器的噪聲源將是模擬的一樣,因此本質(zhì)上是高斯分布的。對(duì)于高斯噪聲,顫動(dòng)信號(hào)最合適的均方根振幅為0.5Q,在這種電平下,噪聲調(diào)制被最小化,但并不是沒有。在該電平下的高頻顫動(dòng)使動(dòng)態(tài)范圍較未加高頻顫動(dòng)時(shí)減小大約6dB,這使得一個(gè)理想的16bit轉(zhuǎn)換器加入高頻顫動(dòng)后的動(dòng)態(tài)范圍為92dB左右。1.1.7A/D轉(zhuǎn)換中的過采樣過采樣是指用高于奈奎斯特定理規(guī)定的頻率對(duì)聲頻信號(hào)進(jìn)行采樣。通常在隨后的數(shù)字濾波過程中,這一高比率被減至為一個(gè)正常比率,以使與通常的采樣信號(hào)相比,不占更多的存儲(chǔ)空間。它是采用采樣分辨率與采樣頻率之間折中的機(jī)制來工作的,也是建立在一個(gè)通道傳送信息的容量是由這兩個(gè)因素所決定這一理論的基礎(chǔ)之上的。以低分辨率高采樣頻率進(jìn)行采樣可以被轉(zhuǎn)變?yōu)橐暂^高的采樣分辨率較低采樣頻率的采樣,信息不存在任何方面的損失(聲音質(zhì)量)。過采樣現(xiàn)在已經(jīng)非常流行,廣泛地用于大多數(shù)高質(zhì)量的聲頻轉(zhuǎn)換器中。盡管過采樣A/D轉(zhuǎn)換器經(jīng)常使用高達(dá)基本頻率44.1kHz和48kHz128倍的采樣頻率進(jìn)行采樣,但轉(zhuǎn)換器數(shù)字輸出的實(shí)際速率并不超過基本速率。以高速度獲得的采樣被量化成僅僅幾比特的分辨率,隨后再用數(shù)字濾波來減少采樣頻率,如圖1-18所示。數(shù)字低通濾波器將信號(hào)帶寬限制在1/2基本采樣頻率之內(nèi),以便防止混疊的產(chǎn)生,這是一種抽取濾波器。抽取濾波器靠從過采樣流中抽取出采樣來降低采樣速度。低通濾波執(zhí)行的結(jié)果是明顯地增加了采樣的字長(zhǎng),但這種增加不是隨意進(jìn)行的,而是要根據(jù)周圍采樣值,準(zhǔn)確地計(jì)算出每一個(gè)采樣的正確值(見1.4節(jié))。雖然過采樣轉(zhuǎn)換器最初以低的分辨率對(duì)采樣進(jìn)行量化,但抽取濾波器的輸出卻是具有更高分辨率的,通常以奈奎斯特采樣頻率為采樣的樣本。如果必須的話,采樣分辨率可以減小,以產(chǎn)生所需的字長(zhǎng)。圖1-18過采樣A/D轉(zhuǎn)換處理的框圖過采樣帶來了一些好處,同時(shí)它也是系統(tǒng)在A/D和D/A環(huán)節(jié)能提高音質(zhì)的關(guān)鍵所在。因?yàn)樽畛醯牟蓸宇l率在聲頻范圍之上(通常十或百倍于正常的頻率),從PAM所產(chǎn)生的頻譜分布可以看出,所重復(fù)的頻譜成分已遠(yuǎn)離聲頻頻帶,如圖1-19所示。用在傳統(tǒng)轉(zhuǎn)換器中的模擬抗混疊濾波器被數(shù)字抽取濾波器所代替,如果在D/A轉(zhuǎn)換中過采樣,那么模擬重建濾波器的滾降就會(huì)更緩。這將改善聲頻頻帶內(nèi)的相位響應(yīng)的特性,從而改善聲音質(zhì)量。過采樣也使得將“噪聲整形”法引入轉(zhuǎn)換處理成為可能,它可以將量化噪聲的絕大部分轉(zhuǎn)移到頻譜的可聽范圍之外。圖1-19PAM產(chǎn)生的頻譜分布1.1.8A/D轉(zhuǎn)換中的噪聲整形噪聲整形是以增加其他頻帶上噪聲為代價(jià),降低聲頻范圍絕大多數(shù)可聽部分的噪聲的辦法,它使用將量化噪聲的頻譜能量“整形”的處理方式。因?yàn)椴蓸愚D(zhuǎn)換器中使用高的采樣頻率,而且高的采樣頻率將量化噪聲擴(kuò)散到整個(gè)頻率范圍之上,并且大部分處在聲頻范圍之外。量化噪聲能量分布在整個(gè)基帶上,直至奈奎斯特頻率。過采樣將量化噪聲分布于一個(gè)更寬的頻譜范圍中,因?yàn)樵谶^采樣的轉(zhuǎn)換器中,奈奎斯特頻率位于聲頻帶的上限之上。它減小了帶內(nèi)噪聲,減小的程度為3dB/oct。換而言之,以兩倍奈奎斯特速率進(jìn)行過采樣的系統(tǒng)將聲頻頻帶內(nèi)的噪聲能量降低大約3dB。在過采樣的噪聲整形轉(zhuǎn)換中,積分器(低通濾波器)插在量化器之前,并且在負(fù)反饋環(huán)路中接入一個(gè)D/A轉(zhuǎn)換器,如圖1-20所示,這種轉(zhuǎn)換器稱為“Δ-Σ轉(zhuǎn)換器”。在此不去深入研究這種轉(zhuǎn)換器的原理,我們只需知道其結(jié)果是量化噪聲(在積分器之后引入的)在輸入給抽取濾波器時(shí)對(duì)頻率響應(yīng)進(jìn)行了提升,同時(shí)輸入信號(hào)以平坦的頻響通過。很顯然,這樣一個(gè)電路和模擬負(fù)反饋電路之間是等效的。圖1-20一個(gè)噪聲整形Δ-ΣA/D轉(zhuǎn)換器的框圖如果沒有噪聲整形,量化噪聲的能量譜將平滑地延伸至奈奎斯特頻率處,但是有了第一級(jí)噪聲整形,這一能量譜將不再是平直的。如再加上第二級(jí)噪聲整形,帶內(nèi)的噪聲衰減將更加明顯,帶內(nèi)噪聲將明顯小于未經(jīng)噪聲整形處理時(shí)的情況。1.2D/A轉(zhuǎn)換1.2.1基本的D/A轉(zhuǎn)換圖1-21為一個(gè)基本的D/A轉(zhuǎn)換處理示意圖,聲頻樣本值被轉(zhuǎn)化為對(duì)應(yīng)其采樣值的階梯狀電平鏈。在簡(jiǎn)單的轉(zhuǎn)換器中,它通過比特的狀態(tài)轉(zhuǎn)變成電流源的開和關(guān),并通過結(jié)合這些電流源的每一個(gè)輸出來構(gòu)成所需的脈沖振幅。在通過低通重建濾波器之前,這個(gè)階梯波被“再采樣”以減小脈沖的寬度,濾波器的截止頻率為采樣頻率的1/2。重建濾波器的作用是將采樣點(diǎn)連接起來形成一個(gè)平滑的波形。再采樣是必須進(jìn)行的,不然的話濾波器的平均效應(yīng)將導(dǎo)致高頻聲音信號(hào)的振幅下降,稱之為“孔徑效應(yīng)”??讖叫?yīng)可以通過將樣本脈沖寬度限制到大約為采樣周期的1/8來減小,也可通過均衡來校正孔徑效應(yīng)。圖1-21D/A轉(zhuǎn)換中的處理(僅僅顯示了正的樣本值)示意圖1.2.2D/A轉(zhuǎn)換中的過采樣正如A/D轉(zhuǎn)換中那樣,在D/A轉(zhuǎn)換中也可以使用過采樣。在D/A轉(zhuǎn)換的情況下,插入的采樣必須處在奈奎斯特速率采樣中間,以使轉(zhuǎn)換可以在較高的采樣速度下進(jìn)行。這些是通過PCM數(shù)據(jù)的采樣頻率轉(zhuǎn)換來實(shí)現(xiàn)的。這些樣本隨后以較高的速率轉(zhuǎn)換到模擬狀態(tài),再次避免使用陡峭的模擬濾波器。噪聲整形也可以在D/A轉(zhuǎn)換階段引入,根據(jù)轉(zhuǎn)換器的設(shè)計(jì),來壓低噪聲的主觀電平?,F(xiàn)有的一些先進(jìn)D/A轉(zhuǎn)換器設(shè)計(jì)采用了高速率下的過采樣,產(chǎn)生僅有幾比特分辨率的樣本。這一方案的極端形式就是極高轉(zhuǎn)換率下的一比特技術(shù)(比特分辨率轉(zhuǎn)換),并采用噪聲整形處理來優(yōu)化信號(hào)的噪聲頻譜。1.3音質(zhì)與采樣頻率和分辨率之間的關(guān)系1.3.1心理聲學(xué)限制就音質(zhì)而言,數(shù)字聲頻可能已達(dá)到了人耳的聽音極限。然而,粗濫制造的數(shù)字聲頻產(chǎn)品聽起來也可能非常差,數(shù)字并不是高質(zhì)量的代名詞。采樣參數(shù)和噪聲整形方法的選擇影響著數(shù)字聲頻的頻率響應(yīng)、失真以及動(dòng)態(tài)范圍。人耳的聽覺能力應(yīng)該看作是對(duì)數(shù)字系統(tǒng)評(píng)價(jià)的標(biāo)準(zhǔn),因?yàn)橹挥挟?dāng)失真和噪聲能被聽見才有爭(zhēng)論的必要,所以將轉(zhuǎn)換器的本底噪聲設(shè)計(jì)成低于人耳所能感知的靈敏度應(yīng)該不失為一個(gè)明智之舉。例如,圖1-22顯示的是一個(gè)典型的低電平聽覺靈敏度曲線,它表明了一個(gè)聲音信號(hào)剛剛能被聽到所需要的最低聲壓級(jí)(SPL)??梢钥闯?,人耳在4kHz左右中頻范圍是最靈敏的,而在頻譜的低頻和高頻部分則不是那么靈敏。這條曲線通常稱之為“最低可聞閾”(MAF)或“聽閾”。在1kHz處,其聲壓級(jí)為0dB(基準(zhǔn)聲壓為20μPa)。應(yīng)記住的是,人耳的聞閾不是絕對(duì)的,而是帶概率特性。換句話說,在試圖判斷什么情況下能被聽見,什么情況下不能被聽見時(shí),實(shí)際上說的是一種統(tǒng)計(jì)概率。對(duì)于一些試圖建立聽覺標(biāo)準(zhǔn)的研究來說,這是很重要的,因?yàn)槟承╇m然低于聽閾10dB的聲音,在一些情況下存在統(tǒng)計(jì)上確實(shí)能聽到的可能性。圖1-22聽閾曲線動(dòng)態(tài)范圍可以被認(rèn)為是MAF和所能容忍的最響聲音之間的范圍??扇萑痰淖铐懧曇粢蛉硕?,但是“痛閾”通常被認(rèn)為是在130dB與140dB之間。為此,人耳聽覺的絕對(duì)最大動(dòng)態(tài)范圍在1kHz處大約是140dB,遠(yuǎn)大于在低頻或高頻時(shí)的動(dòng)態(tài)范圍,是否有必要錄制這樣寬的動(dòng)態(tài)范圍還有待討論。LouisFielder和ElizabethCohen所進(jìn)行的一些工作,試圖通過研究聲源發(fā)出的有效極端聲壓,并且將其與真實(shí)聲學(xué)環(huán)境下的可聞本底噪聲對(duì)比,得出高質(zhì)量數(shù)字聲頻系統(tǒng)所需要的動(dòng)態(tài)范圍。根據(jù)心理聲學(xué)理論,F(xiàn)ielder能夠表示出在不同的頻率下,根據(jù)噪聲與失真的情況可能聽見什么,以及在一個(gè)典型的錄音鏈中,限制的因素可能在哪兒。將動(dòng)態(tài)范圍定義為產(chǎn)生峰值等于一個(gè)特定峰值電平的均方根最大不失真正弦波電平與20kHz限帶白噪聲的均方根電平之比。它與特定聲頻鏈的設(shè)備在無信號(hào)時(shí)噪聲的響度是一樣的。他進(jìn)一步表明20kHz帶寬噪聲信號(hào)恰好能被聽見的聲壓級(jí)大約為4dB,在滿意的聽音位置上,一些音樂演奏所達(dá)到的聲壓級(jí)在120dB和129dB之間。根據(jù)這些,他確定了真實(shí)地重放所需要的動(dòng)態(tài)范圍為122dB??紤]到傳聲器的性能和民用揚(yáng)聲器的限制,對(duì)于民用系統(tǒng),所需要的動(dòng)態(tài)范圍降至115dB。1.3.2采樣頻率采樣頻率的選擇決定了最大有效聲頻帶寬。在選擇一個(gè)比必需的采樣頻率低的采樣頻率的問題上存在一些爭(zhēng)議。經(jīng)常爭(zhēng)論的是從有用的最高聲頻頻率為多少這個(gè)問題上開始的,同時(shí)這也是爭(zhēng)論的焦點(diǎn)所在。傳統(tǒng)的理論認(rèn)為聲頻頻帶伸展至20kHz,這意味著對(duì)高質(zhì)量的聲頻制作而言,采樣頻率只需超過40kHz即可。事實(shí)上,有兩個(gè)標(biāo)準(zhǔn)的采樣頻率位于40kHz和50kHz之間:CD的采樣頻率為44.1kHz,而稱之為“專業(yè)”的采樣頻率為48kHz。這兩者都滿足1984年制定的數(shù)字聲頻設(shè)備采樣頻率的AES5標(biāo)準(zhǔn)。表1-1列出了各種不同的采樣頻率以及它們的應(yīng)用范圍。在臺(tái)式PC和聲卡中使用的采樣頻率標(biāo)準(zhǔn)很多,這里只列出了其中最通用的。表1-1通常采用的采樣頻率首先是48kHz的采樣頻率,因?yàn)樗o磁帶錄音機(jī)向下變速處理留有大量余地。當(dāng)許多數(shù)字錄音機(jī)變換速度時(shí),它們的采樣頻率也相應(yīng)地改變,其結(jié)果為聲頻基帶第一個(gè)頻譜副本產(chǎn)生移動(dòng)。如果采樣頻率被降得太低,那么會(huì)聽到混疊成分。為此,大多數(shù)專業(yè)的數(shù)字磁帶錄音機(jī)僅允許有±12.5%的速度變化。然而,現(xiàn)在通過使用截止頻率隨采樣頻率變化的低通濾波器可以防止這個(gè)問題的產(chǎn)生。在民用CD機(jī)上,較早地采用了44.1kHz的采樣頻率,如今這一頻率已被廣泛使用。實(shí)際上,它也已經(jīng)成為大多數(shù)專業(yè)錄音設(shè)備中備選的采樣頻率之一。它允許20kHz聲頻頻帶的全部使用,并且過采樣轉(zhuǎn)換器允許使用可以防止在高頻出現(xiàn)相位問題的較緩的模擬抗混疊濾波器。與48kHz的采樣頻率相比,它每秒鐘所產(chǎn)生的數(shù)據(jù)要少10%,從存儲(chǔ)的觀點(diǎn)來看要經(jīng)濟(jì)一些。IMARP速率在國際多媒體協(xié)會(huì)推薦使用中被挑選來提高多媒體系統(tǒng)中的數(shù)字聲頻兼容性,用來在工作站中交換聲音文件。32kHz的采樣頻率使用在一些廣播應(yīng)用上,例如在NICAM728立體聲電視傳送以及用在一些無線電轉(zhuǎn)播系統(tǒng)中。電視和FM廣播聲音帶寬被限制在15kHz已經(jīng)好多年,并且靠使用這一較低的采樣頻率達(dá)到了節(jié)省傳送帶寬的目的。大多數(shù)重要的聲頻信息都位于15kHz以下,并且除去15kHz以上的頻率成分對(duì)聲音的影響也不太大。一些專業(yè)的聲頻設(shè)備將這一頻率作為備選。例如一些DAT使用這一頻率來進(jìn)行長(zhǎng)時(shí)間播放。更高的采樣頻率,如88.2kHz和96kHz作為標(biāo)準(zhǔn)存在的依據(jù)是要適合聲源的要求:即高于20kHz的信息對(duì)于聲音質(zhì)量也是重要的。一位日本教授已經(jīng)揭示出,高于20kHz的頻率能夠使人腦中X波興奮。這個(gè)X波與人的滿足和放松的狀態(tài)相對(duì)應(yīng)。人耳的聽覺響應(yīng)并不是截止于20kHz的觀點(diǎn)顯然是正確的,但是只有極少數(shù)聽音者可以屢次區(qū)分出一個(gè)信號(hào)是否含有較高的頻率成分。采樣頻率加倍將導(dǎo)致數(shù)字聲頻系統(tǒng)的數(shù)據(jù)率加倍,從而使可存儲(chǔ)的時(shí)間減半。這些較高的采樣頻率應(yīng)在仔細(xì)權(quán)衡過得失之后再選用。當(dāng)前還沒有支持這些頻率的民用重放媒體。那些低于30kHz的低采樣頻率經(jīng)常用于對(duì)音質(zhì)要求較低的PC工作站上,如存儲(chǔ)語言樣本、內(nèi)置音效源等。在早期的計(jì)算機(jī)中,這些是由于時(shí)鐘和運(yùn)算速度限制造成的。多媒體應(yīng)用可能需要支持這些頻率,因?yàn)樵谶@類應(yīng)用中,經(jīng)常用到各種不同質(zhì)量的聲音。1.3.3量化分辨率每個(gè)樣本的比特?cái)?shù)決定著數(shù)字聲頻系統(tǒng)的信噪比或動(dòng)態(tài)范圍。在此僅討論線性PCM系統(tǒng),因?yàn)閷?duì)于所介紹的非線性量化或數(shù)據(jù)壓縮,情況是不同的。表1-2簡(jiǎn)要地表述了不同采樣分辨率的應(yīng)用。表1-2線性量化分辨率多年來,16bit線性PCM已被認(rèn)為是高質(zhì)量聲頻應(yīng)用的規(guī)范。這是CD標(biāo)準(zhǔn)的音質(zhì),并且能夠提供超過90dB的動(dòng)態(tài)范圍。對(duì)于大多數(shù)的應(yīng)用而言,雖然已經(jīng)足夠,但是還不能達(dá)到Fielder的理想,即在專業(yè)系統(tǒng)中進(jìn)行122dB無噪聲重放的要求。要達(dá)到如此之大的動(dòng)態(tài)范圍需要轉(zhuǎn)換器的分辨率為21bit左右,根據(jù)對(duì)這一指標(biāo)的注釋,今天的轉(zhuǎn)換器技術(shù)可以達(dá)到這一要求。有些設(shè)計(jì)方案采用兩個(gè)轉(zhuǎn)換器,靠數(shù)字信號(hào)處理來將有重疊的兩個(gè)輸出混合起來,使可聞的動(dòng)態(tài)范圍明顯提高。而另一些則使用非相關(guān)高頻顫動(dòng)的兩個(gè)轉(zhuǎn)換器,將它們的輸出相加,而使信號(hào)增加6dB,而噪聲只增加3dB。在專業(yè)錄音中會(huì)常常遇到需要一定的“峰值儲(chǔ)備”的情況。換句話說,一些用于不可預(yù)見的情況下的超過標(biāo)稱峰值錄音電平的動(dòng)態(tài)范圍,如當(dāng)一個(gè)信號(hào)過沖,超出其預(yù)期的電平。尤其是現(xiàn)場(chǎng)錄音時(shí),不知道錄音電平會(huì)出現(xiàn)什么樣的情況時(shí)更是必需。這就是為什么許多專業(yè)人士認(rèn)為高于16bit的分辨率對(duì)于原始錄音很有必要的另一個(gè)原因。為此,20bit錄音格式迅速地流行起來,調(diào)音師也可以使用噪聲整形再量化處理來完善已制作完成的16bit媒質(zhì)的錄音(例如CD)。人們甚至已經(jīng)開始對(duì)24bit錄音感興趣了,但目前能全面開發(fā)這一動(dòng)態(tài)范圍的轉(zhuǎn)換技術(shù)尚不成熟。在較低質(zhì)量的終端產(chǎn)品中,一些PC的聲卡以及內(nèi)部聲源以低至4bit的分辨率進(jìn)行工作。在臺(tái)式計(jì)算機(jī)中,8bit的采樣重放輸出是最常見的,它通過PC的內(nèi)置揚(yáng)聲器重放出中等的音質(zhì),在未加高頻顫動(dòng)時(shí)的動(dòng)態(tài)范圍大約為50dB。有許多適用于PC的非線性量化方案,PC中采用了多種非線性量化方案,比如A律和μ律以及各種其他數(shù)據(jù)壓縮方案。這些方案能夠通過少量的比特?cái)?shù)來改善動(dòng)態(tài)范圍,但也存在著可聞的副作用。國際多媒體協(xié)會(huì)已經(jīng)制定并推薦了便于簡(jiǎn)單交換的一系列采樣頻率和數(shù)據(jù)類型,如表1-3所示。當(dāng)今的多媒體PC和聲卡通常以16bit分辨率作為標(biāo)準(zhǔn)。一些早期的MIDI采樣器以8bit分辨率進(jìn)行工作,近期多為12bit,而現(xiàn)在的MIDI采樣器則普遍具備真正16bit的分辨率。表1-3國際多媒體協(xié)會(huì)為計(jì)算機(jī)之間基本聲頻數(shù)據(jù)互換推薦的采樣頻率和量化1.4數(shù)字化處理的相關(guān)問題1.4.1時(shí)基抖動(dòng)及對(duì)轉(zhuǎn)換器的影響時(shí)基抖動(dòng)是聲頻樣本時(shí)基位置的短時(shí)間變化。理想情況下它們應(yīng)該是非常穩(wěn)定的,如果時(shí)基不穩(wěn),各種有害的影響將在聲音質(zhì)量上反映出來,包括附加的噪聲和失真,它由樣本瞬間時(shí)基偏移的方式而定。抖動(dòng)被認(rèn)為與量化誤差非常類似,只不過時(shí)間軸在這里替代了振幅軸,但它們的結(jié)果是類似的。它是由多種原因造成的,其中包括低質(zhì)量的時(shí)鐘信號(hào)、電子噪聲、電子干擾,也經(jīng)常是由于通過數(shù)字接口傳遞聲頻信號(hào)造成的。注意到抖動(dòng)并非必定是一個(gè)問題是很重要的。只有影響進(jìn)行A/D和D/A轉(zhuǎn)換中的時(shí)鐘時(shí)才對(duì)聲音質(zhì)量有所影響,在很多情況下可以通過使用合適的穩(wěn)定的鎖相環(huán)路進(jìn)行重復(fù)再生時(shí)鐘而將抖動(dòng)去除。A/D轉(zhuǎn)換器時(shí)鐘上的抖動(dòng)如不能隨后被去除的話,會(huì)產(chǎn)生信號(hào)的永久失真。而在數(shù)字域后面的階段引入的抖動(dòng)可以被減少或去除。抖動(dòng)的重要特征表現(xiàn)在峰值振幅和其速率上,這兩個(gè)因素相結(jié)合將會(huì)影響聲音質(zhì)量。Shelton通過計(jì)算隨機(jī)抖動(dòng)的均方根信噪比得出結(jié)論:低于5ns的時(shí)基不規(guī)則變化,對(duì)于整個(gè)信號(hào)頻率范圍上的16bit數(shù)字聲頻系統(tǒng)可能是非同小可的。這一要求在更高的分辨率以及在高頻情況下將更加苛刻。圖1-23簡(jiǎn)要地表示了這些影響。圖1-23不同頻率下采樣時(shí)鐘抖動(dòng)對(duì)信噪比的影響如果抖動(dòng)是周期性的而非隨機(jī)產(chǎn)生的,其結(jié)果將相當(dāng)于“抖動(dòng)”,如果在一個(gè)正弦聲頻信號(hào)轉(zhuǎn)化的采樣時(shí)鐘中發(fā)生這種情況,那么由于相位調(diào)制會(huì)在原始聲頻信號(hào)兩邊產(chǎn)生邊帶,其頻率間隔等同于抖動(dòng)頻率。JulianDum已經(jīng)得出抖動(dòng)邊帶(Rj)的電平與信號(hào)的關(guān)系,可以表示為:Rj(dB)=20lg(Jωi/4)這里J是指抖動(dòng)的峰峰值振幅,ωi是指聲頻信號(hào)頻率。根據(jù)這個(gè)公式,他提出對(duì)于一個(gè)振幅為500ps的抖動(dòng),一個(gè)最高電平的20kHz的聲頻信號(hào)將產(chǎn)生一個(gè)相對(duì)主音振幅的96.1dB邊帶。然而,最重要的是“抖動(dòng)引發(fā)的”產(chǎn)物的聽覺效果。Dum試圖在利用心理聲學(xué)理論對(duì)最終頻譜分析的基礎(chǔ)上進(jìn)行計(jì)算。假定聲頻信號(hào)是在一個(gè)高聲壓級(jí)的情況下進(jìn)行重放(120dB聲壓級(jí)),則圖1-24繪出了抖動(dòng)振幅相對(duì)于抖動(dòng)頻率的變化情況(不是聲頻頻率),以便在最壞聲頻信號(hào)情況下,剛剛能聽見調(diào)制噪聲。圖1-24抖動(dòng)振幅相對(duì)于抖動(dòng)頻率的變化情況1.4.2改變聲頻信號(hào)的分辨率(再量化)當(dāng)需要改變信號(hào)的分辨率時(shí),在聲頻制作中可能會(huì)有一些關(guān)鍵的問題出現(xiàn)。在高質(zhì)量的聲頻中,這一情況最普通的例子是從20bit錄音中制作CD母版,因?yàn)镃D只有16bit的分辨率。此情況也發(fā)生在所有形式的信號(hào)處理器中,因?yàn)闃颖镜淖珠L(zhǎng)在不同的階段有所不同。在多媒體應(yīng)用中,需要將聲音文件從16bit轉(zhuǎn)換成8bit分辨率的情況是常有的,這一操作執(zhí)行的正確與否也是非常重要的。如果聲頻樣本的長(zhǎng)度需要減少,那么簡(jiǎn)單地舍去不想要的LSB可能是最差的解決方法。例如將20bit的信號(hào)減少為16bit,不能簡(jiǎn)單地舍去4位LSB就認(rèn)為萬事大吉了。舍去LSB可能會(huì)產(chǎn)生與在A/D轉(zhuǎn)換中不使用高頻顫動(dòng)相似的結(jié)果,即有可能引入低電平的失真成分。低電平的信號(hào)聽起來會(huì)有顆粒感,同時(shí)也無法平滑地衰減成噪聲。對(duì)這一問題正確的解決方式是靠在數(shù)字域增加顫動(dòng)噪聲來對(duì)信號(hào)進(jìn)行再次顫動(dòng),以達(dá)到既定的分辨率。為這一新的分辨率而進(jìn)行的數(shù)字抖動(dòng)應(yīng)該控制在合適的電平上,并且新樣本的LSB增加或減少應(yīng)該由該拋棄的LSB總值來決定。應(yīng)該注意到,許多廉價(jià)的數(shù)字聲頻設(shè)備都無法圓滿地進(jìn)行這一操作(尤其在16bit至8bit的再量化中),導(dǎo)致了音質(zhì)下降。許多專業(yè)級(jí)的數(shù)字聲頻工作站都允許以各種不同的分辨率對(duì)聲音進(jìn)行存儲(chǔ)和輸出,也可以讓用戶來選擇是否加高頻顫動(dòng)。例如,將20bit錄音的聲音制作成CD母版,要確保原始錄音中最高電平的信號(hào)在制作母版時(shí)被調(diào)整,以便在16bit分辨率情況下進(jìn)行再量化與再顫動(dòng)之前,可以使其峰值盡可能地接近最高電平。以這種方式,可以盡可能最大限度地將原始信號(hào)的低電平信息保存下來,同時(shí)使量化噪聲最小。不僅在CD母版制作上,在許多再量化處理時(shí),都運(yùn)用這一方法。許多應(yīng)用使用了自動(dòng)度量聲頻信號(hào)的方法,因?yàn)檫@樣可以對(duì)電平進(jìn)行最佳的調(diào)整,允許用戶將峰值電平值設(shè)置在樣本最高電平處。由于數(shù)字儀表和CD母版制作系統(tǒng)上的許多過載檢測(cè)器可以找到最高電平重復(fù)的樣本并檢測(cè)是否過載,設(shè)置峰值電平是一個(gè)明智的做法,這樣可以使信號(hào)恰好處于滿調(diào)制工作之下。這將確保原版磁帶不會(huì)因?yàn)閺?fù)制工廠懷疑錄制錯(cuò)誤而拒絕生產(chǎn),同樣用戶也不會(huì)因電平過載而抱怨。1.4.3動(dòng)態(tài)范圍擴(kuò)展如上所述,在再量化的過程中,最大限度地提高數(shù)字聲頻信號(hào)的主觀動(dòng)態(tài)范圍是可以實(shí)現(xiàn)的。這在將高分辨率的錄音制作成CD母版時(shí)尤其有用,因?yàn)闇p少為16bit的字長(zhǎng)通常會(huì)引起量化噪聲增加。盡管它被轉(zhuǎn)移至一個(gè)16bit的媒體中,但保留高分辨率錄音絕大部分的動(dòng)態(tài)范圍實(shí)際上還是可以實(shí)現(xiàn)的。在再量化中,使用數(shù)字濾波來對(duì)量化噪聲的頻譜進(jìn)行整形,以便將盡可能多的量化噪聲轉(zhuǎn)移到最難以聽到的頻譜中。通常,它將噪聲從人耳最靈敏的4kHz區(qū)域移開,將移開的噪聲加到頻譜的高端。結(jié)果,通常是高電平的噪聲分布在高頻區(qū),但仍然位于聽閾之下。使用這種方法,CD聽起來幾乎可以達(dá)到與20bit錄音相同的動(dòng)態(tài)范圍。1.4.4誤碼校正盡管專門的數(shù)字錄音格式需要專門設(shè)計(jì)的系統(tǒng)來糾正數(shù)據(jù)錯(cuò)誤帶來的影響,但是,那些使用計(jì)算大容量主存儲(chǔ)媒質(zhì)的系統(tǒng)就并非如此了。原因在于這些大容量存儲(chǔ)媒介被格式化了,這種格式化可以保證基本不會(huì)出現(xiàn)誤碼。比如說,當(dāng)一個(gè)計(jì)算機(jī)磁盤驅(qū)動(dòng)器在一個(gè)較低的水平下被格式化,格式化的目的就是將數(shù)據(jù)寫進(jìn)每一個(gè)地址并且可讀取出來。如果一個(gè)地址被認(rèn)為是被損壞了,或者產(chǎn)生了錯(cuò)誤的重放,那么它就被認(rèn)為是“壞區(qū)”,這樣它就不再用來進(jìn)行數(shù)據(jù)存儲(chǔ)。此外,磁盤和磁帶驅(qū)動(dòng)器進(jìn)行誤碼行自檢,并且通過使用那些通常對(duì)數(shù)字聲頻系統(tǒng)透明的方法來糾錯(cuò)。在讀取數(shù)據(jù)時(shí)如果檢測(cè)到一個(gè)數(shù)據(jù)錯(cuò)誤,那么此后該數(shù)據(jù)塊通常被數(shù)次地重讀,以判斷數(shù)據(jù)能否被恢復(fù)。這樣唯一的影響就是交換的速度降低了一些。這與專門的聲頻格式,如DAT的情況截然不同。在專門的聲頻格式中,有許多層誤碼保護(hù),其中一些可將誤碼徹底糾正(對(duì)音質(zhì)毫無影響),而另一些則使得嚴(yán)重的誤碼在聽感上造成的影響降至最低,這一處理稱之為內(nèi)插。例如,可根據(jù)周圍樣本的電平來判斷丟失的樣本值為多少,如圖1-25所示。另一方面,計(jì)算機(jī)系統(tǒng)不允許采用這種誤碼校正,因?yàn)樗俣〝?shù)據(jù)要么是正確的,要么就是無用的。例如,在讀財(cái)務(wù)報(bào)表時(shí),僅憑觀察一個(gè)未知點(diǎn)兩邊的值而對(duì)其進(jìn)行猜測(cè)是不允許的。圖1-25插入可將丟失樣本所產(chǎn)生的可聞?dòng)绊戨[蔽掉因此,計(jì)算機(jī)大容量存儲(chǔ)媒質(zhì)上的數(shù)據(jù)被認(rèn)為是原始數(shù)據(jù)。無誤碼數(shù)據(jù)存儲(chǔ)一旦被格式化,就沒有再增加糾錯(cuò)數(shù)據(jù)的必要。這并不是說這種媒質(zhì)絕不出錯(cuò),因?yàn)樗鼈儠r(shí)常會(huì)有錯(cuò)誤發(fā)生,但是數(shù)字聲頻工作站通常并不在那些已經(jīng)存儲(chǔ)的數(shù)字上再采取任何額外的誤碼。這樣的結(jié)果就是,如果無法避免的錯(cuò)誤在數(shù)字聲頻工作站重放聲音文件時(shí)出現(xiàn)的話,那么它通常會(huì)導(dǎo)致整個(gè)文件無法播放。這一文件將被認(rèn)為是損壞的,計(jì)算機(jī)將無法讀取它。用戶沒有能夠決定錯(cuò)誤是否可聞的權(quán)利,他必須借助某種計(jì)算機(jī)文件“急救包”幫助——“急救包”使用各種專門的技術(shù)來試圖恢復(fù)被破壞的信息。1.5數(shù)字聲頻信號(hào)處理在模擬域?qū)β曨l信號(hào)進(jìn)行的諸如均衡、推拉衰減和壓縮等處理工作,在數(shù)字域同樣可以進(jìn)行,而且,在數(shù)字域進(jìn)行某些操作時(shí)其副作用更?。ㄈ缦辔皇д妫绕涫窃谀M域?qū)崿F(xiàn)非常困難或者根本就不可能實(shí)現(xiàn)的一些功能在數(shù)字域則是可以實(shí)現(xiàn)的。這里,僅就數(shù)字聲頻信號(hào)處理的相關(guān)問題簡(jiǎn)介如下。1.5.1電平控制在數(shù)字域中,改變聲音信號(hào)的電平相對(duì)要容易一些。將增益改變6dB是最容易的,因?yàn)檫@意味著只需將整個(gè)樣本字節(jié)向左或向右移動(dòng)一步,如圖1-26所示。實(shí)際上,這個(gè)操作是將初始值乘以2或除以2。更精確的增益控制則是用一些其他表示增益增減的因子,乘以聲頻樣本值來實(shí)現(xiàn)的。乘數(shù)中的比特?cái)?shù)決定了增益調(diào)節(jié)的精度。將兩個(gè)二進(jìn)制數(shù)相乘可以產(chǎn)生一個(gè)比初始值有更多比特位的新樣本值,并且數(shù)字調(diào)音臺(tái)內(nèi)部結(jié)構(gòu)具備處理32bit字長(zhǎng)的能力已經(jīng)是非常普遍的,盡管在它們的輸入和輸出部分只能處理20bit。正因?yàn)槿绱?,在調(diào)音臺(tái)采樣分辨率已被降低的地方,普遍使用再顫動(dòng)處理,例如在所有數(shù)字輸出或轉(zhuǎn)換階段,以便保持如上所述的音質(zhì)。圖1-26通過將所有比特向左或向右移一步樣本增益可改變6dB在數(shù)字增益控制中用作乘數(shù)的數(shù)值可以由用戶控制產(chǎn)生,如推拉衰減器、旋轉(zhuǎn)電位器或屏幕指示等,或者也可以由自動(dòng)化系統(tǒng)中存儲(chǔ)的值得來。從一個(gè)“模擬”推拉衰減器得到一個(gè)數(shù)字值的“經(jīng)典”方式是將推拉衰減器與一個(gè)固定的電壓源接起來,將衰減器滑動(dòng)點(diǎn)接到A/D轉(zhuǎn)換器上,以提供一個(gè)與它們的位置有關(guān)的直接二進(jìn)制位置輸出的控制能力。衰減器的“規(guī)則”(其增益與其本身的物理位置相關(guān))可以由在存儲(chǔ)器中建立的一個(gè)合適的檢查表的值來決定,它將被作為對(duì)應(yīng)衰減器自身位置的乘數(shù)來使用。1.5.2交叉漸變?cè)谑褂脭?shù)字聲頻工作站時(shí),一部分的聲音要與另一部分(編輯點(diǎn))連接的地方廣泛地使用交叉漸變技術(shù)。它可以避免因波形突變而產(chǎn)生的“咔嗒”聲,同時(shí)也使一個(gè)聲音平滑地過渡到另一個(gè)聲音上。在圖1-27中給出了這一處理的原理框圖。它是指兩個(gè)分別受其自動(dòng)推拉衰減器控制的信號(hào)(二進(jìn)制相乘),一個(gè)衰減一個(gè)提升,繼而將兩個(gè)信號(hào)相加,以控制衰減器的速率和系數(shù),產(chǎn)生各種不同形式的交叉漸變。圖1-27交叉漸變?cè)砜驁D1.5.3調(diào)音調(diào)音是指將代表不同聲道的獨(dú)立的數(shù)據(jù)流合成在一起,將來自每個(gè)輸入聲道的同一時(shí)刻的樣本相加產(chǎn)生一個(gè)單獨(dú)輸出聲道的樣本。通過將不同輸入相加而獲得大量的不同輸出通道,便可以有許多條混合“母線”。信號(hào)相加的結(jié)果是明顯增加了總體的電平。由于存在這種可能性,所以調(diào)音臺(tái)的結(jié)構(gòu)必須允許更大的峰值儲(chǔ)備,才能達(dá)到和模擬混音臺(tái)相同的效果。1.5.4數(shù)字濾波器和均衡數(shù)字濾波器可以看成是一個(gè)“百寶箱”,它經(jīng)常用來描述并非首次出現(xiàn)于濾波中的數(shù)字信號(hào)處理工作。數(shù)字濾波器實(shí)質(zhì)上是一個(gè)處理過程,它包括各種形式,從最簡(jiǎn)單到最復(fù)雜的時(shí)間延遲,相乘或聲頻樣本重組的過程。利用數(shù)字濾波器可以構(gòu)成低通和高通濾波器,峰值和擱架形濾波器,回聲和混響效果,甚至用可調(diào)整特征的自適應(yīng)濾波器對(duì)信號(hào)的不同部分產(chǎn)生作用。理解數(shù)字濾波器的基本原理有利于掌握為什么可以用數(shù)字形式來模擬某種模擬濾波處理。濾波器響應(yīng)可以以兩種主要的方式模型化,一是根據(jù)它們的頻率域響應(yīng),二是看它們的時(shí)間域響應(yīng)(也有其他方法,稱為Z平面轉(zhuǎn)換,這里不再提及)。頻率域響應(yīng)顯示了濾波器的輸出振幅如何隨著頻率變化而改變,而時(shí)間域則通常以一個(gè)脈沖響應(yīng)的形式來表示,如圖1-28所示。因?yàn)閮烧唛g直接相關(guān),所以每個(gè)頻率響應(yīng)都對(duì)應(yīng)一個(gè)脈沖響應(yīng)。如果改變了濾波器在時(shí)間域上的響應(yīng),那么它在頻率域上的響應(yīng)也隨之改變。將時(shí)間域上的響應(yīng)轉(zhuǎn)換成對(duì)應(yīng)的頻率域響應(yīng)的方法,就是我們常用的傅里葉變換。時(shí)間域和頻率域上的響應(yīng)是我們考查同一事物的兩種方法。數(shù)字聲頻信號(hào)是采樣得來的,故在時(shí)間上是離散的,每個(gè)樣本代表著聲波在某一時(shí)刻的幅度值,所以要借助時(shí)間域上聲頻樣本的運(yùn)算來獲得數(shù)字濾波的某種特性。事實(shí)上,如果想用數(shù)字形式來模擬某一模擬濾波器的特性,那么必須要分析其脈沖響應(yīng),并且在數(shù)字域?qū)⑵淠P突?shù)字形式的濾波器應(yīng)該與模擬形式的濾波器有同樣的頻率響應(yīng),并且人們甚至能預(yù)測(cè)出用于數(shù)字聲頻工作站中實(shí)用的模擬濾波器的可能性,但問題是如何生成數(shù)字化的特定脈沖響應(yīng)特性,并且如何將其與聲頻數(shù)據(jù)結(jié)合在一起。圖1-28簡(jiǎn)單濾波器的頻率響應(yīng)及對(duì)應(yīng)的時(shí)間域脈沖響應(yīng)上面已提到,所有的數(shù)字濾波器都可以實(shí)現(xiàn)聲頻樣本的延時(shí)、相乘和重組,并且可以將這些元素有機(jī)地安排,以取得濾波器的脈沖響應(yīng)。一種簡(jiǎn)單的濾波器模型就是有限脈沖響應(yīng)(FIR)濾波器或橫向?yàn)V波器,如圖1-29所示。由圖中看到,這種濾波器是由帶抽頭的延時(shí)線組成的,其中每個(gè)抽頭的輸出在與其他抽頭的輸出相加之前,要乘上一個(gè)確定的系數(shù)。當(dāng)輸入的脈沖到來時(shí),將會(huì)產(chǎn)生一系列獨(dú)立的脈沖,它們?cè)谳敵龆讼嗉虞敵?。之所以將它稱為FIR濾波器,是因?yàn)檩斎攵说囊粋€(gè)脈沖導(dǎo)致了有限的輸出序列,這些輸出序列是由抽頭的數(shù)目決定的。抽頭數(shù)目越多,則濾波器的響應(yīng)就越復(fù)雜,但簡(jiǎn)單的低通濾波器僅需幾個(gè)抽頭。圖1-29簡(jiǎn)單的FIR濾波器(橫向?yàn)V波器)另外一種主要的類型是無限脈沖響應(yīng)(IIR)濾波器,也稱為遞歸濾波器,在輸出和輸入之間存在一級(jí)反饋,如圖1-30所示。因?yàn)榇嬖谥答?,所以這種濾波器對(duì)單一脈沖的響應(yīng)是無限長(zhǎng)的輸出序列。由于對(duì)于大多數(shù)可變的均衡器,IIR濾波器比相應(yīng)的FIR濾波器所用的單元要少得多,所以聲頻設(shè)備常常采用IIR濾波器,效果設(shè)備也使用IIR濾波器。但不幸的是,IIR濾波器的相位響應(yīng)是非線性的,而FIR濾波器具有線性的相位響應(yīng)。圖1-30簡(jiǎn)單的IIR濾波器(遞歸濾波器)1.5.5數(shù)字混響和其他效果一個(gè)典型反射房間的脈沖響應(yīng)如圖1-31所示。首先是由聲源而來的直達(dá)聲,隨后是一些早期反射聲,然后是一些擴(kuò)散的高密度反射聲,它逐漸衰減至無聲。使用一些IIR濾波器,或許再加上一些FIR濾波器,可以產(chǎn)生合適的延時(shí)型和初始脈沖的衰減型,模仿出一個(gè)房間的衰減模型。通過修正早期反射設(shè)計(jì)的延遲與振幅,以及擴(kuò)散分布特性,可以模仿出各種不同的房間。圖1-31一個(gè)典型反射房間的脈沖響應(yīng)設(shè)計(jì)一個(gè)使人信服的混響算法是一個(gè)需要技巧的工作,未經(jīng)雕琢的方案和一個(gè)優(yōu)秀的方案之間的差別是非常明顯的。一些聲頻工作站通過基本的軟件包提供有限的混響效果,但是聽起來這些效果很差,因?yàn)閿?shù)字信號(hào)處理(DSP)能力有限,算法也不先進(jìn)。一些設(shè)備或插卡可供工作站使用,它們具有強(qiáng)大的DSP能力和分立的處理軟件。還有一些簡(jiǎn)單的效果也可以在不占用太多DSP能力的情況下引入,例如跟蹤加倍和相位/鑲邊效果。這些效果通常僅采用非常簡(jiǎn)單的延遲和再結(jié)合處理。音調(diào)轉(zhuǎn)換也可以由數(shù)字完成,它采用的處理類似于下面所說的采樣頻率轉(zhuǎn)換。由于需要大量的計(jì)算,所以高質(zhì)量的音調(diào)轉(zhuǎn)換需要相當(dāng)強(qiáng)的處理能力。1.5.6動(dòng)態(tài)處理數(shù)字動(dòng)態(tài)處理包括聲頻信號(hào)瞬時(shí)電平所進(jìn)行的增益控制,其框圖如圖1-32所示。旁鏈產(chǎn)生對(duì)應(yīng)瞬時(shí)增益改變所需要的系數(shù),它隨后用來與延遲的聲頻樣本相乘。首先必須產(chǎn)生信號(hào)的均方根電平,隨后它需要轉(zhuǎn)換成一個(gè)對(duì)數(shù)值,以便以分貝來表示電平的改變。因只有超過某一特定閾值的電平將受影響,所以所得到的值必須加上一個(gè)常數(shù)因子,之后它們乘上一個(gè)表示壓縮斜率的系數(shù)表示壓縮。系數(shù)值隨后經(jīng)反對(duì)數(shù)運(yùn)算變成線性系數(shù),用它與聲頻樣本相乘。圖1-32一個(gè)簡(jiǎn)單的數(shù)字動(dòng)態(tài)處理操作1.5.7采樣頻率轉(zhuǎn)換聲音在以不同采樣頻率進(jìn)行操作的系統(tǒng)之間交換時(shí),采樣頻率轉(zhuǎn)換是必需的。其目標(biāo)是在不改變音調(diào)或增加失真與噪聲的前提下將聲音轉(zhuǎn)化成新的采樣頻率。如今采樣頻率轉(zhuǎn)換可以是非常高質(zhì)量的處理,盡管它從來就不是一個(gè)透明的處理,因?yàn)樗ㄖ鴮?duì)樣本值和時(shí)基的修正。由于有再量化算法,所以在價(jià)格較低的數(shù)字聲頻工作站中遇到質(zhì)量較差的采樣頻率轉(zhuǎn)換的情況是常有的事,通常這更取決于專門的應(yīng)用軟件,而非所用的硬件。從一個(gè)速率轉(zhuǎn)換至另一個(gè)速率最簡(jiǎn)單的方法是先變成模擬域,然后以新的采樣頻率進(jìn)行再采樣,但這有可能會(huì)引入少量額外的噪聲。數(shù)字采樣頻率轉(zhuǎn)換最基本的形式是指由一個(gè)固定的采樣頻率轉(zhuǎn)換至另一個(gè)固定的采樣頻率,兩個(gè)采樣頻率之間有簡(jiǎn)單的分?jǐn)?shù)比率關(guān)系。這就是為什么建議50.4kHz應(yīng)該是新的專業(yè)采樣頻率的原因所在,因?yàn)樗c44.1kHz有8/7的比例關(guān)系。后來,48kHz被選為廣播使用的專業(yè)錄音采樣頻率,是因?yàn)樗c32kHz有一個(gè)簡(jiǎn)單的比例關(guān)系。分?jǐn)?shù)比例轉(zhuǎn)換是指使原采樣頻率下的采樣值通過數(shù)學(xué)計(jì)算得出新采樣頻率下的樣本值。數(shù)字濾波器被用來計(jì)算出新的樣本的幅度,以便能根據(jù)原始樣本的脈沖響應(yīng),在采用低通濾除原來采樣頻率的奈奎斯特頻率上限成分之后,在原來兩個(gè)采樣頻率共用一個(gè)時(shí)鐘頻率來進(jìn)行內(nèi)插的控制。使用這一方法,有些輸出樣本將與輸入樣本發(fā)生重復(fù),但是只有少量的可能插在輸入和輸出樣本間。如果輸入與輸出采樣頻率之間有個(gè)可變的或非單一的關(guān)系,那么上面的結(jié)論將不成立,因?yàn)樵谳斎霕颖局g的任何間隔處可能需要輸出樣本。這需要內(nèi)插器有比分?jǐn)?shù)比轉(zhuǎn)換更多的時(shí)鐘相位,目的是選擇一個(gè)與所需要的瞬時(shí)輸出樣本關(guān)系最近的時(shí)鐘相位,以此計(jì)算出必要的系數(shù)。這顯然是一個(gè)誤差。不過,它可用增加內(nèi)插器相位的數(shù)目來減少。時(shí)基誤差反映在聽感上的效果等同于在聲頻信號(hào)抖動(dòng)的效果,所以應(yīng)該在設(shè)計(jì)上使其最小化,這樣可以使采樣頻率轉(zhuǎn)換不會(huì)影響信號(hào)分辨率的本底噪聲。如果輸入采樣頻率在不時(shí)變化(比如在變速搜尋或選聽中),與初始樣本有關(guān)的插入樣本的位置也將改變,這便需要對(duì)濾波器相位進(jìn)行實(shí)時(shí)計(jì)算?,F(xiàn)在許多工作站都把采樣頻率轉(zhuǎn)換作為一個(gè)標(biāo)準(zhǔn)或備選的功能。這樣,在一種采樣頻率下錄制或編輯的素材可以在另一采樣頻率下輸出(如48kHzDAT錄音,以44.1kHz被編輯或轉(zhuǎn)成CD母版;或者44.1kHz素材轉(zhuǎn)換為22kHz,以便在多媒體中使用),可保證采樣頻率轉(zhuǎn)換是高質(zhì)量的,不會(huì)影響錄音的音質(zhì)。通常,只有在非用不可的情況下,才進(jìn)行采樣頻率轉(zhuǎn)換。簡(jiǎn)陋的設(shè)備經(jīng)常忽略了使用正確的防止混疊的低通濾波器,或者只使用非?;镜臄?shù)字濾波器,這會(huì)導(dǎo)致采樣頻率轉(zhuǎn)換后音質(zhì)的劣化。當(dāng)外部設(shè)備超出了工作站所能接受的范圍時(shí),采樣頻率轉(zhuǎn)換也作為將外部數(shù)字信號(hào)源與標(biāo)準(zhǔn)采樣頻率基準(zhǔn)同步的有效方法。第2章數(shù)字聲頻記錄技術(shù)2.1數(shù)字錄音帶(DAT)數(shù)字錄音帶(DAT)是一種可以大規(guī)模生產(chǎn)的數(shù)字聲頻記錄介質(zhì)。在DAT格式中,利用螺旋掃描帶存儲(chǔ)器來記錄和重放聲頻信號(hào),其支持3種采樣頻率,即32kHz、44.1kHz和48kHz,在某些模式下,也支持96kHz的采樣頻率。因?yàn)镈AT記錄器具有數(shù)字信號(hào)輸入和輸出端口,所以可以將兩臺(tái)記錄器互連,實(shí)現(xiàn)高質(zhì)量的磁帶復(fù)制,且子碼信息也跟隨數(shù)字聲頻數(shù)據(jù)傳輸。數(shù)字聲頻磁帶易于獲得很寬的信號(hào)動(dòng)態(tài)范圍、很小的畸變和很高的信噪比,特別是數(shù)字信號(hào)具有靈活的變換與處理特性和極高的復(fù)制特性,使其明顯地優(yōu)于模擬記錄方式。2.1.1DAT盒式磁帶的構(gòu)造對(duì)于DAT記錄格式,專門設(shè)計(jì)有DAT盒式磁帶,并對(duì)其進(jìn)行了標(biāo)準(zhǔn)化。盒式磁帶的尺寸為73mm×54mm×10.5mm,如圖2-1所示,比半個(gè)模擬錄音帶稍大一點(diǎn)。磁帶寬度為3.82mm(經(jīng)常稱為4mm磁帶),與模擬磁帶中所用的1/8英寸(1英寸=2.54cm)的帶子相同;典型厚度為13μm(其中氧化層約3μm),與模擬C-90磁帶厚度相等。在一個(gè)大約60m的長(zhǎng)度上,DAT可錄制2h的聲音。通過減緩磁帶速度、降低采樣頻率、減小輪盤直徑或者使用更薄的磁帶,記錄時(shí)間可長(zhǎng)達(dá)4~6h。磁帶介質(zhì)是一種具有高矯頑力的金屬氧化物微粒。圖2-1DAT盒式磁帶的外部和內(nèi)部結(jié)構(gòu)DAT磁帶盒用以保護(hù)內(nèi)部磁帶。只有當(dāng)一盒磁帶被放入DAT錄音機(jī)后,滑板才收縮,露出磁帶的輪轂,保護(hù)罩才打開,允許對(duì)磁帶進(jìn)行操作。如圖2-2所示,磁帶導(dǎo)架牽引出磁帶,并將磁帶卷繞在旋轉(zhuǎn)磁鼓上。一個(gè)磁帶盒內(nèi)部的輪閘機(jī)構(gòu)保證磁帶的松弛度最小。另外,還提供光學(xué)檢測(cè)的措施,利用透射光或反射光來確定磁帶的末端(或始端)。前者的方法是使光折射通過磁帶盒的頂角,后者是利用放置在磁帶盒中透明窗口上的棱鏡體來實(shí)現(xiàn)。圖2-2DAT和旋轉(zhuǎn)磁頭視圖在DAT的標(biāo)準(zhǔn)位置上都有4個(gè)識(shí)別孔,用來幫助錄音機(jī)確認(rèn)磁帶類型。前面的3個(gè)孔組成一個(gè)編碼,標(biāo)志不同厚度和磁道間距的4種狀態(tài)???、2、3構(gòu)成下列編碼:000(標(biāo)準(zhǔn)磁道間距,13μm磁帶)、010(標(biāo)準(zhǔn)磁道間距,薄磁帶)、001(寬磁道間距,13μm磁帶)、011(寬磁道間距,薄磁帶)。這里0表示孔打開,1表示孔關(guān)閉。第四個(gè)孔標(biāo)識(shí)預(yù)錄帶(1)或者非預(yù)錄帶(0)。DAT盒式磁帶的一端有一個(gè)安全翼片。當(dāng)禁止錄制或者是防止誤擦除時(shí),翼片可以滑向磁帶中部,以打開磁帶下端的一個(gè)防復(fù)制孔(1)。當(dāng)要錄制時(shí),翼片必須滑出(0)到磁帶盒的邊緣。另外兩個(gè)朝向磁帶中心的基準(zhǔn)孔用于磁帶位置的校準(zhǔn)。磁帶頂部的一個(gè)槽口用來作為裝載夾使用。2.1.2DAT模式的分類與特點(diǎn)表2-1中總結(jié)了DAT的4種記錄/重放(REC/PB)模式和2種單放模式的標(biāo)準(zhǔn)。在任何DAT錄音機(jī)上均可實(shí)現(xiàn)符合標(biāo)準(zhǔn)的記錄/重放模式和2種單放模式(分別稱為寬模式和正常模式)。標(biāo)準(zhǔn)模式可提供16bit的線性數(shù)字轉(zhuǎn)換和44.1kHz或48kHz的采樣頻率。絕大多數(shù)客戶的DAT錄音機(jī)同時(shí)有模擬和數(shù)字輸入和輸出。錄音機(jī)中包含一個(gè)SCMS電路,當(dāng)任何數(shù)字源的比特流中的禁止復(fù)制標(biāo)識(shí)處于工作狀態(tài)時(shí),它可以防止復(fù)制磁帶。表2-1DAT空白磁帶和預(yù)錄制磁帶不同記錄/重放模式的技術(shù)規(guī)格其他3種記錄/重放模式使用32kHz的采樣頻率,分別稱為選項(xiàng)1、選項(xiàng)2、選項(xiàng)3。選項(xiàng)1提供16bit的線性數(shù)字轉(zhuǎn)換下的2h記錄時(shí)間;選項(xiàng)2提供12bit非線性數(shù)字轉(zhuǎn)換下的4h記錄時(shí)間,磁帶的線速度和磁鼓的轉(zhuǎn)速減半;選項(xiàng)3同樣使用12bit的非線性數(shù)字轉(zhuǎn)換,提供四通道的記錄和重放功能。某些廠商的DAT錄音機(jī)工作在96kHz的采樣頻率下,使磁帶速度加倍,記錄時(shí)間減半;另一種改進(jìn)型錄音機(jī)的采樣頻率為48kHz,可進(jìn)行24bit記錄。這兩種錄音機(jī)與傳統(tǒng)的DAT錄音機(jī)都不兼容。2.1.3DAT硬件設(shè)計(jì)的基本方案DAT技術(shù)同樣借鑒了旋轉(zhuǎn)磁頭視頻技術(shù)和CD技術(shù)。要在磁帶上記錄大量的數(shù)據(jù),必須應(yīng)用大量精密的記錄技術(shù)來提高記錄性能。另外,子碼覆蓋等用戶特性要求數(shù)據(jù)記錄具有靈活性。在任何數(shù)字聲頻系統(tǒng)中,調(diào)制碼和糾錯(cuò)在決定系統(tǒng)性能中均具有重要地位。在DAT錄音機(jī)中使用的許多硬件與CD機(jī)一樣,但增加了一些編碼電路。其主要硬件單元如圖2-3所示,包括A/D和D/A轉(zhuǎn)換器、調(diào)制解調(diào)器、糾錯(cuò)編碼器和解碼器。聲頻信號(hào)以數(shù)字形式輸入,模擬聲頻信號(hào)通過A/D轉(zhuǎn)換器轉(zhuǎn)換為數(shù)字形式,同時(shí)還實(shí)現(xiàn)了糾錯(cuò)編碼和交織功能。如同任何一個(gè)螺旋掃描系統(tǒng)一樣,在記錄之前,必須通過時(shí)域壓縮把輸入的聲頻信號(hào)分割成離散的段:重放時(shí),再用時(shí)域擴(kuò)展把這些離散段結(jié)合起來,形成連續(xù)聲頻輸出信號(hào)。記錄用的輸出緩存時(shí)鐘頻率高于數(shù)據(jù)輸入的時(shí)鐘頻率,以滿足時(shí)域壓縮的需要。比特流中加入了子碼信息,并將數(shù)據(jù)從并行形式轉(zhuǎn)換為串行形式。數(shù)字信號(hào)經(jīng)過8-10調(diào)制編碼后,通過記錄放大器、旋轉(zhuǎn)變壓器和旋轉(zhuǎn)磁頭等記錄到磁帶上。圖2-3DAT錄音機(jī)/播放器的框圖在重放時(shí),通過磁頭和磁帶的移動(dòng),將信號(hào)導(dǎo)入磁頭,激勵(lì)出所記錄的波形。磁道尋跡信號(hào)從磁帶上被讀出,用來自動(dòng)調(diào)整磁道。8-10調(diào)制編碼將數(shù)據(jù)重新轉(zhuǎn)成并行的比特流形式。子碼數(shù)據(jù)分離出來以后,用于操作系統(tǒng)和伺服控制。寄存器允許執(zhí)行和解交織時(shí)域擴(kuò)展,并用來消除速度不均勻性。解交織在糾錯(cuò)操
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025至2030中國古玩行業(yè)發(fā)展趨勢(shì)與投資前景研究報(bào)告
- 2025至2030中國醫(yī)用級(jí)硅膠市場(chǎng)前景展望及營(yíng)銷創(chuàng)新現(xiàn)狀調(diào)研報(bào)告
- 工業(yè)互聯(lián)網(wǎng)平臺(tái)下2025年異構(gòu)數(shù)據(jù)庫融合與智慧城市數(shù)據(jù)安全風(fēng)險(xiǎn)評(píng)估報(bào)告
- 基于云計(jì)算的政務(wù)服務(wù)平臺(tái)建設(shè)
- 2025年制造業(yè)數(shù)字化轉(zhuǎn)型數(shù)據(jù)治理與智能設(shè)備維護(hù)成本控制研究報(bào)告
- 在高一年級(jí)學(xué)生會(huì)上發(fā)言稿模版
- 以數(shù)字化促進(jìn)高效分析數(shù)字化轉(zhuǎn)型下辦公中應(yīng)用的機(jī)頂盒實(shí)例
- 幼兒園中班科學(xué)活動(dòng)《冬天的取暖用具》課件
- 從傳統(tǒng)到現(xiàn)代基于數(shù)宇璃技術(shù)的創(chuàng)新方法在各個(gè)行業(yè)的應(yīng)用及挑戰(zhàn)
- 2025年城市防洪工程建設(shè)對(duì)社會(huì)穩(wěn)定性的影響分析與對(duì)策報(bào)告
- 砂石料車輛運(yùn)輸協(xié)議書(3篇)
- 乳品評(píng)鑒師技能競(jìng)賽理論考試題庫500題(含答案)
- 四年級(jí)語文下冊(cè)第六單元【集體備課】(教材解讀+教學(xué)設(shè)計(jì))
- 醫(yī)院醫(yī)療質(zhì)量管理考評(píng)制度和管理制度
- 裝修施工項(xiàng)目投標(biāo)書模板
- 抗凝劑皮下注射護(hù)理共識(shí)
- 法務(wù)停息掛賬協(xié)議書模板
- 2022年四川省南充市中考數(shù)學(xué)真題(解析版)
- 百融云創(chuàng)風(fēng)險(xiǎn)決策引擎V5產(chǎn)品操作手冊(cè)
- 高考監(jiān)考員培訓(xùn)考試題庫(含參考答案)
- 【企業(yè)員工流失問題研究的文獻(xiàn)綜述4800字】
評(píng)論
0/150
提交評(píng)論