




版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
音頻信息的獲取與處理第1頁(yè),共125頁(yè),2023年,2月20日,星期日2.1音頻信號(hào)及其概念2.1.1聲音處理技術(shù)歷史回顧
語(yǔ)言、音樂(lè)和各種自然聲是以聲波為載體傳遞信息的基本形式
。人類(lèi)很早就開(kāi)始研究聲音,并利用當(dāng)時(shí)已掌握了的聲音的某些規(guī)律來(lái)制造樂(lè)器、進(jìn)行建筑設(shè)計(jì)或傳聲裝置設(shè)計(jì),使發(fā)出的聲音傳得更遠(yuǎn)??墒菐浊陙?lái),人類(lèi)只能憑耳朵來(lái)辨別聲音的高低、強(qiáng)弱,而不能把聲音記錄和儲(chǔ)存起來(lái)。所以與其他研究領(lǐng)域相比,聲學(xué)的研究相對(duì)滯后。直到19世紀(jì)愛(ài)迪生發(fā)明了留聲機(jī),人們才能用機(jī)械的方法把各種聲音記錄在唱片上??墒锹曇?、機(jī)械振動(dòng)不容易傳遞,也不容易放大,機(jī)械方法很不方便。隨著電學(xué)、電子學(xué)的發(fā)展,人們開(kāi)始嘗試記錄下這些真實(shí)的聲音,利用把聲的振動(dòng)轉(zhuǎn)換成電信號(hào)的原理,使聲音的記錄成為可能。最終電聲技術(shù)獲得了迅速發(fā)展。
第2頁(yè),共125頁(yè),2023年,2月20日,星期日電聲技術(shù)是研究可聽(tīng)聲頻率范圍內(nèi)聲音的產(chǎn)生、傳播、存儲(chǔ)、重放和接收的技術(shù)。顧名思義,電聲技術(shù)是依靠“電”來(lái)記錄并播放聲音的,其基本原理是通過(guò)電壓來(lái)產(chǎn)生模擬聲波變化的電流信號(hào),并記錄下來(lái),灌錄成早期的唱片或磁帶,這種電流信號(hào)便被稱(chēng)之為“模擬信號(hào)”。傳統(tǒng)的聲音記錄方式就是將模擬信號(hào)直接記錄下來(lái),例如磁帶錄音和密紋唱片就是將聲音拾取處理后以磁記錄或機(jī)械刻度的方式記錄下來(lái),此時(shí)磁帶上磁極的變化或密紋唱片音槽內(nèi)的紋路起伏變化都是與聲音信號(hào)的變化相對(duì)應(yīng)、成正比的。這里,密紋唱片、盒式磁帶等是記錄儲(chǔ)存這種模擬聲音信號(hào)的載體,而能夠播放和(或)記錄這些軟件的信號(hào)處理設(shè)備,諸如電唱機(jī)、磁帶錄音機(jī)等,則稱(chēng)為模擬音響設(shè)備。
第3頁(yè),共125頁(yè),2023年,2月20日,星期日
電聲技術(shù)把聲信號(hào)轉(zhuǎn)換成電信號(hào),經(jīng)擴(kuò)聲系統(tǒng)直接進(jìn)行擴(kuò)聲;或者將其信號(hào)利用磁帶、CD或其他存儲(chǔ)形式,使聲音可超越時(shí)間和空間,通過(guò)重放系統(tǒng)將其信號(hào)(數(shù)字的或模擬的)經(jīng)過(guò)放大,由揚(yáng)聲器或耳機(jī)轉(zhuǎn)換成聲信號(hào),進(jìn)入最后的終端---人耳,以實(shí)現(xiàn)任何時(shí)間和地點(diǎn)的聲音重現(xiàn)。電聲轉(zhuǎn)換、音頻信號(hào)的存儲(chǔ)、重放技術(shù)、加工處理技術(shù)以及數(shù)字化音頻信號(hào)的編碼、壓縮、傳輸、存取、糾錯(cuò)等技術(shù),是音頻技術(shù)的主要對(duì)象。
第4頁(yè),共125頁(yè),2023年,2月20日,星期日隨著計(jì)算機(jī)技術(shù)的發(fā)展,特別是海量存儲(chǔ)設(shè)備和大容量?jī)?nèi)存在計(jì)算機(jī)上的實(shí)現(xiàn),對(duì)音頻媒體進(jìn)行數(shù)字化處理便成為可能。數(shù)字化處理的核心是對(duì)音頻信息的采樣,通過(guò)對(duì)采集到的樣本進(jìn)行加工,生成各種效果。音頻信息在多媒體中的應(yīng)用是極為廣泛的,當(dāng)計(jì)算機(jī)配有聲卡和音箱后,就能夠發(fā)出各種悅耳的聲音,尤其是視頻圖像配以娓娓動(dòng)聽(tīng)的音樂(lè)和語(yǔ)音,使計(jì)算機(jī)的操作得以藉由視覺(jué)以外的聽(tīng)覺(jué)加以輔助而成為一種愉快的過(guò)程。靜態(tài)或動(dòng)態(tài)圖像配以解說(shuō)和背景音樂(lè),可使圖像充滿(mǎn)生氣;立體聲音樂(lè)可增加空間感,使人身臨其境;語(yǔ)音電子郵件,聽(tīng)聲如見(jiàn)其人,游戲中的音響效果對(duì)于渲染氣氛則為顯得更為重要;此外,在多媒體通信中,可視電話(huà)、電視會(huì)議、這些都離不開(kāi)數(shù)字化音頻處理技術(shù)。
第5頁(yè),共125頁(yè),2023年,2月20日,星期日2.1.2音頻信號(hào)的形式
在日常生活中,音頻(Audio)信號(hào)可分為兩類(lèi):語(yǔ)音信號(hào)和非語(yǔ)音信號(hào)。語(yǔ)音是語(yǔ)言的物質(zhì)載體,是社會(huì)交際工具的符號(hào),
它包含了豐富的語(yǔ)言?xún)?nèi)涵,是人類(lèi)進(jìn)行信息交流所特有的形式。非語(yǔ)音信號(hào)主要包括音樂(lè)和自然界存在的其他聲音形式。非語(yǔ)音信號(hào)的特點(diǎn)是不具有復(fù)雜的語(yǔ)義和語(yǔ)法信息,信息量低、識(shí)別簡(jiǎn)單。
我們之所以能聽(tīng)到日常生活中的各種聲音信息,其實(shí)就是不同頻率的聲波通過(guò)空氣產(chǎn)生震動(dòng),刺激人耳的結(jié)果。在物理上,聲音可用一條連續(xù)的曲線(xiàn)來(lái)表示。這條連續(xù)的曲線(xiàn)無(wú)論多復(fù)雜,都可分解成一系列正弦波的線(xiàn)性疊加。規(guī)則音頻是一種連續(xù)變化的模擬信號(hào),可用一條連續(xù)的曲線(xiàn)來(lái)表示,稱(chēng)為聲波。因聲波是在時(shí)間和幅度上都連續(xù)變化的量,我們稱(chēng)之為模擬量。
第6頁(yè),共125頁(yè),2023年,2月20日,星期日
用聲音錄制軟件記錄的英文單詞“Hello”的語(yǔ)音實(shí)際波形
第7頁(yè),共125頁(yè),2023年,2月20日,星期日2.1.3模擬音頻信號(hào)的物理特征
模擬音頻信號(hào)有兩個(gè)重要參數(shù):頻率和幅度。聲音的頻率體現(xiàn)音調(diào)的高低,聲波幅度的大小體現(xiàn)聲音的強(qiáng)弱。
一個(gè)聲源每秒鐘可產(chǎn)生成百上千個(gè)波,我們把每秒鐘波峰所發(fā)生的數(shù)目稱(chēng)之為信號(hào)的頻率,單位用赫茲(Hz)或千赫茲(kHz)表示。例如一個(gè)聲波信號(hào)在一秒鐘內(nèi)有5000個(gè)波峰,則可將它的頻率表示為5000Hz或5kHz。人們?cè)谌粘Uf(shuō)話(huà)時(shí)的語(yǔ)音信號(hào)頻率范圍在300Hz~3000Hz之間。頻率小于20Hz的信號(hào)稱(chēng)為亞音(Subsonic);頻率范圍為20Hz~20kHz的信號(hào)稱(chēng)為音頻(Audio),高于20kHz的信號(hào)稱(chēng)為超音頻(Ultrasonic)。
第8頁(yè),共125頁(yè),2023年,2月20日,星期日
與頻率相關(guān)的另一個(gè)參數(shù)是信號(hào)的周期。它是指信號(hào)在兩個(gè)峰點(diǎn)或谷底之間的相對(duì)時(shí)間。周期和頻率之間的關(guān)系是互為倒數(shù)。
信號(hào)的幅度是從信號(hào)的基線(xiàn)到當(dāng)前波峰的距離。幅度決定了信號(hào)音量的強(qiáng)弱程度。幅度越大,聲音越強(qiáng)。對(duì)音頻信號(hào),聲音的強(qiáng)度用分貝(dB)表示,分貝的幅度就是音量。
幅度限周期基線(xiàn)第9頁(yè),共125頁(yè),2023年,2月20日,星期日2.1.4聲音的A/D與D/A轉(zhuǎn)換
模擬信號(hào)很容易受到電子干擾,因此隨著技術(shù)的發(fā)展,聲音信號(hào)就逐漸過(guò)渡到了數(shù)字存儲(chǔ)階段,A/D轉(zhuǎn)換和D/A轉(zhuǎn)換技術(shù)便應(yīng)運(yùn)而生。這里,A代表Analog”(類(lèi)比、模擬),D代表“Digital”(數(shù)字、數(shù)碼),A/D轉(zhuǎn)換就是把模擬信號(hào)轉(zhuǎn)換成數(shù)字信號(hào)的過(guò)程,模擬電信號(hào)變?yōu)榱擞伞?”和“1”組成的Bit信號(hào)。這樣做的好處是顯而易見(jiàn)的,聲音存儲(chǔ)質(zhì)量得到了加強(qiáng),數(shù)字化的聲音信息使計(jì)算機(jī)能夠進(jìn)行識(shí)別、處理和壓縮,這也就是為什么如今磁帶逐漸被淘汰,CD唱片卻趨于流行的原因。
A/D轉(zhuǎn)換的一個(gè)關(guān)鍵步驟是聲音的采樣和量化,得到數(shù)字音頻信號(hào),它在時(shí)間上是不連續(xù)的離散信號(hào)。
第10頁(yè),共125頁(yè),2023年,2月20日,星期日借助于A/D或D/A轉(zhuǎn)換器,模擬信號(hào)和數(shù)字信號(hào)可以互相轉(zhuǎn)換第11頁(yè),共125頁(yè),2023年,2月20日,星期日2.1.5與聲音有關(guān)的幾個(gè)術(shù)語(yǔ)
音高是人對(duì)聲波頻率的主觀屬性,它首先與聲波的頻率有關(guān)。聲波的振動(dòng)頻率高,我們聽(tīng)到的聲音就高,反之亦然,但它們之間并非線(xiàn)性關(guān)系。
音色是聲波波形的主觀屬性。不同的發(fā)音體所發(fā)出的音波都有自己的特異性。聲波的類(lèi)型是多種多樣的,一般可分為純音和復(fù)合音兩大類(lèi)。
語(yǔ)音是特殊的復(fù)合音。語(yǔ)音由元音和輔音所構(gòu)成。元音是一種能連續(xù)發(fā)出的樂(lè)音,輔音主要是不能連續(xù)發(fā)出的短促的噪音,元音與輔音合成漢語(yǔ)音節(jié)。
響度是聲波振幅的主觀屬性,它是由聲波的振幅引起的。振幅越大則響度越大,但它們之間也不是線(xiàn)性關(guān)系。
第12頁(yè),共125頁(yè),2023年,2月20日,星期日2.1.6聲音質(zhì)量的評(píng)價(jià)
我們經(jīng)常會(huì)對(duì)某一位歌手的歌聲發(fā)表意見(jiàn),并與其他歌手進(jìn)行比較,這其實(shí)是在對(duì)聲音的質(zhì)量進(jìn)行評(píng)價(jià)。聲音質(zhì)量的評(píng)價(jià)是一個(gè)很困難的問(wèn)題,也是一個(gè)值得研究的課題。目前來(lái)看,聲音質(zhì)量的度量有兩種基本方法,一種是客觀質(zhì)量度量,另一種是主觀質(zhì)量的度量。聲音客觀質(zhì)量的度量方法
聲波的測(cè)量與分析傳統(tǒng)的方法是先用機(jī)電換能器把聲波轉(zhuǎn)換為相應(yīng)的電信號(hào),然后用電子儀表放大到一定的電壓級(jí)進(jìn)行測(cè)量與分析。由于計(jì)算技術(shù)的發(fā)展,使許多計(jì)算和測(cè)量工作都使用了計(jì)算機(jī)或程序?qū)崿F(xiàn)。這些帶計(jì)算機(jī)處理系統(tǒng)的高級(jí)聲學(xué)測(cè)量?jī)x器,能完成下列一些測(cè)量工作:
第13頁(yè),共125頁(yè),2023年,2月20日,星期日評(píng)價(jià)值的測(cè)量
響度和響度級(jí),噪音級(jí),清晰度指數(shù),噪音評(píng)價(jià)數(shù)。聲源的測(cè)量頻譜的時(shí)間變化,聲功率,指向性,效率,頻譜特征,幅值分布等。音質(zhì)的測(cè)量混響時(shí)間,隔音量,吸音量。聲測(cè)量的基本儀器是聲級(jí)計(jì)。聲級(jí)計(jì)是一種能對(duì)聲音作出類(lèi)似人耳的反應(yīng)的儀器,同時(shí),它能進(jìn)行客觀而可重復(fù)的聲壓和聲級(jí)測(cè)量。聲壓測(cè)量的好處很多:它能幫助音樂(lè)廳提高音響效果;能對(duì)煩擾聲音進(jìn)行精密的、科學(xué)的分析。聲級(jí)測(cè)量還能明確地告訴我們什么聲音會(huì)引起聽(tīng)力損害,并提醒人們采用適當(dāng)?shù)穆?tīng)力保護(hù)措施。因此,聲測(cè)量是不可少的。
第14頁(yè),共125頁(yè),2023年,2月20日,星期日
度量聲音客觀質(zhì)量的一個(gè)主要指標(biāo)是信噪比SNR(SignaltoNoiseRation),信噪比是有用信號(hào)與噪聲之比的簡(jiǎn)稱(chēng)。其單位是分貝(dB)。聲音主觀質(zhì)量的度量
采用客觀標(biāo)準(zhǔn)方法很難真正評(píng)定某種編碼器的質(zhì)量,在實(shí)際評(píng)價(jià)中,主觀的質(zhì)量度量比客觀質(zhì)量的度量更為恰當(dāng)和合理。通常是對(duì)某編碼器的輸出的聲音質(zhì)量進(jìn)行評(píng)價(jià),例如播放一段音樂(lè),記錄一段話(huà),然后重放給實(shí)驗(yàn)者聽(tīng),再由實(shí)驗(yàn)者進(jìn)行綜合評(píng)定。可以說(shuō),人的感覺(jué)機(jī)理最具有決定意義。當(dāng)然,可靠的主觀度量值是較難獲得的。
第15頁(yè),共125頁(yè),2023年,2月20日,星期日
平均判分(MeanOpnionScose-MOS)過(guò)程是召集一批實(shí)驗(yàn)者,請(qǐng)每個(gè)實(shí)驗(yàn)者對(duì)某個(gè)編解碼器的輸出進(jìn)行質(zhì)量判分,采用類(lèi)似于考試的五級(jí)分制,不同的MOS分對(duì)應(yīng)的質(zhì)量級(jí)別和失真級(jí)別見(jiàn)表2-1。
MOS質(zhì)量級(jí)別失真級(jí)別5優(yōu)(Excellent)不察覺(jué)4良(Good)剛察覺(jué)但不可厭3中(Fair)察覺(jué)及稍微可厭2差(Poor)可厭(但不令人反感)1劣(Unacceptable)極可厭(令人反感)第16頁(yè),共125頁(yè),2023年,2月20日,星期日
聲音質(zhì)量分級(jí)與帶寬
聲音的質(zhì)量與它所占用的頻帶寬度有關(guān),頻帶越寬,信號(hào)強(qiáng)度的相對(duì)變化范圍就越大大,音響效果也就越好。按照帶寬可將聲音質(zhì)量分為4級(jí):
數(shù)字激光唱盤(pán)質(zhì)量,通常又CD-DA質(zhì)量,這種質(zhì)量也就是我們常說(shuō)的超高保真,即SuperHiFi(HighFidelity)。
調(diào)頻無(wú)線(xiàn)電廣播,簡(jiǎn)稱(chēng)FM(FrequencyModulation)質(zhì)量。
調(diào)幅無(wú)線(xiàn)電廣播,簡(jiǎn)稱(chēng)AM(AmplitudeModulation)質(zhì)量。
電話(huà)(Telephone)質(zhì)量。在這4級(jí)質(zhì)量中,以CD-DA的聲音質(zhì)量等級(jí)最高,其余次之。
第17頁(yè),共125頁(yè),2023年,2月20日,星期日4級(jí)聲音質(zhì)量的頻率范圍第18頁(yè),共125頁(yè),2023年,2月20日,星期日2.2模擬音頻的數(shù)字化過(guò)程
如果要用計(jì)算機(jī)對(duì)音頻信息進(jìn)行處理,則首先要將模擬音頻信號(hào)(如語(yǔ)音、音樂(lè)等)轉(zhuǎn)變成數(shù)字信號(hào)。數(shù)字化的聲音易于用計(jì)算機(jī)軟件處理,現(xiàn)在幾乎所有的專(zhuān)業(yè)化聲音錄制、編輯器都是數(shù)字方式。對(duì)模擬音頻數(shù)字化過(guò)程涉及到音頻的采樣、量化和編碼。
采樣和量化的過(guò)程可由A/D轉(zhuǎn)換器實(shí)現(xiàn)。A/D轉(zhuǎn)換器以固定的頻率去采樣,即每個(gè)周期測(cè)量和量化信號(hào)一次。經(jīng)采樣和量化后聲音信號(hào)經(jīng)編碼后就成為數(shù)字音頻信號(hào),可以將其以文件形式保存在計(jì)算機(jī)的存儲(chǔ)介質(zhì)中,這樣的文件一般稱(chēng)為數(shù)字聲波文件。
第19頁(yè),共125頁(yè),2023年,2月20日,星期日2.2.1采樣
早在40年代,信息論的奠基者香農(nóng)(Shannon)指出:在一定條件下,用離散的序列可以完全代表一個(gè)連續(xù)函數(shù),這是采樣定理的基本內(nèi)容。采樣定理看來(lái)象是一個(gè)數(shù)學(xué)問(wèn)題,而實(shí)質(zhì)上它為數(shù)字化技術(shù)奠定了一個(gè)基礎(chǔ)。
為實(shí)現(xiàn)A/D轉(zhuǎn)換,需要把模擬音頻信號(hào)波形進(jìn)行分割,以轉(zhuǎn)變成數(shù)字信號(hào),這種方法稱(chēng)為采樣(Sampling)。采樣的過(guò)程是每隔一個(gè)時(shí)間間隔在模擬聲音的波形上取一個(gè)幅度值,把時(shí)間上的連續(xù)信號(hào),變成時(shí)間上的離散信號(hào)。該時(shí)間間隔稱(chēng)為采樣周期,其倒數(shù)為采樣頻率。采樣頻率是指計(jì)算機(jī)每秒鐘采集多少個(gè)聲音樣本。采樣頻率越高,即采樣的間隔時(shí)間越短,則在單位時(shí)間內(nèi)計(jì)算機(jī)得到的聲音樣本數(shù)據(jù)就越多,對(duì)聲音波形的表示也越精確。這和測(cè)定每天24小時(shí)氣溫變化是一樣的,每小時(shí)測(cè)定1次氣溫比每?jī)尚r(shí)測(cè)定1次氣溫的精度要高一倍。
第20頁(yè),共125頁(yè),2023年,2月20日,星期日
采樣頻率與聲音頻率之間有一定的關(guān)系,根據(jù)奈奎斯特(Nyquist)理論,只有采樣頻率高于聲音信號(hào)最高頻率的兩倍時(shí),才能把數(shù)字信號(hào)表示的聲音還原成為原來(lái)的聲音。用公式表示如下:
T≤1/2fc
或fc≤1/2T
采樣的著名實(shí)例就在我們的日常生活中,例如電話(huà)和CD唱片。在數(shù)字電話(huà)系統(tǒng)中,為將人的聲音變?yōu)閿?shù)字信號(hào),采用脈沖編碼調(diào)制PCM方法,每秒鐘可進(jìn)行8000次的采樣。PCM提供的數(shù)據(jù)傳輸率是56kb/s(b/s表示b/s)或64kb/s。CD唱片存儲(chǔ)的是數(shù)字信息,要想獲得CD音質(zhì)的效果,則要保證采樣頻率為44.1kHz,也就是能夠捕獲頻率高達(dá)22050Hz的信號(hào)。
第21頁(yè),共125頁(yè),2023年,2月20日,星期日2.2.2量化
采樣只解決了音頻波形信號(hào)在時(shí)間坐標(biāo)(即橫軸)上把一個(gè)波形切成若干個(gè)等分的數(shù)字化問(wèn)題,但是每一等分的長(zhǎng)方形的高是多少呢?即需要用某種數(shù)字化的方法來(lái)反映某一瞬間聲波幅度的電壓值的大小。該值的大小影響音量的高低。我們把對(duì)聲波波形幅度的數(shù)字化表示稱(chēng)之為“量化”。
量化的過(guò)程是先將采樣后的信號(hào)按整個(gè)聲波的幅度劃分成有限個(gè)區(qū)段的集合,把落入某個(gè)區(qū)段內(nèi)的樣值歸為一類(lèi),并賦于相同的量化值。如何分割采樣信號(hào)的幅度呢?我們還是采取二進(jìn)制的方式,以8位(bit)或16位(bit)的方式來(lái)劃分縱軸。也就是說(shuō)在一個(gè)以8位為記錄模式的音效中,其縱軸將會(huì)被劃分為個(gè)量化等級(jí)(quantizationlevels),用以記錄其幅度大小。而一個(gè)以16位為采樣模式的音效中,它在每一個(gè)固定采樣的區(qū)間內(nèi)所被采集的聲音幅度,將以個(gè)不同的量化等級(jí)加以記錄。
第22頁(yè),共125頁(yè),2023年,2月20日,星期日
在相同的采樣頻率之下,量化位數(shù)愈高,聲音的質(zhì)量越好。同理,在相同量化位數(shù)的情況下,采樣頻率越高,聲音效果也就越好。這就好比是量一個(gè)人的身高,若是以毫米為單位來(lái)測(cè)量,會(huì)比用厘米為單位量更加準(zhǔn)確。
下表給出了不同信號(hào)類(lèi)型的采樣率和量化精度。
信號(hào)類(lèi)型頻率范圍(Hz)采樣率(kHz)量化精度(位)電話(huà)話(huà)音200-340088寬帶音頻50-70001616調(diào)頻廣播20-15k37816高質(zhì)量音頻20-22k44116第23頁(yè),共125頁(yè),2023年,2月20日,星期日2.2.3采樣與量化過(guò)程示例
以圖2-1所示的原始模擬波形為例進(jìn)行采樣和量化。假設(shè)采樣頻率為1000次/秒,即每1/1000秒A/D轉(zhuǎn)換器采樣一次,其幅度被劃分成09共10個(gè)量化等級(jí),并將其采樣的幅度值取最接近09之間的一個(gè)數(shù)來(lái)表示,如圖2-2所示。圖中每個(gè)正方形表示一次采樣。
第24頁(yè),共125頁(yè),2023年,2月20日,星期日
當(dāng)D/A轉(zhuǎn)換器從圖2-2得到的數(shù)值中重構(gòu)原來(lái)信號(hào)時(shí),得到圖2-3中藍(lán)色(直線(xiàn)段)線(xiàn)段所示的波形。從圖中可以看出,藍(lán)色線(xiàn)與原波形(紅色線(xiàn))相比,其波形的細(xì)節(jié)部分丟失了很多。這意味著重構(gòu)后的信號(hào)波形有較大的失真。
第25頁(yè),共125頁(yè),2023年,2月20日,星期日
失真在采樣過(guò)程中是不可避免的,如何減少失真呢?可以直觀地看出,我們可以把圖2-2中的波形劃分成更為細(xì)小的區(qū)間,即采用更高的采樣頻率。同時(shí),增加量化精度,以得到更高的量化等級(jí),即可減少失真的程度。在圖2-4中,采樣率和量化等級(jí)均提高了一倍,分別為2000次/秒和20個(gè)量化等級(jí)。在圖2-5中,采樣率和量化等級(jí)再提高了一倍,分別達(dá)到4000次/秒和40個(gè)量化等級(jí)。從圖中可以看出,當(dāng)用D/A轉(zhuǎn)換器重構(gòu)原來(lái)信號(hào)時(shí)(圖中的輪廓線(xiàn)),信號(hào)的失真明顯減少,信號(hào)質(zhì)量得到了提高。
第26頁(yè),共125頁(yè),2023年,2月20日,星期日
圖2-4采樣率為2000Hz,量化等級(jí)為20的采樣量化過(guò)程
圖2-5采樣率為4000Hz,量化等級(jí)為40的采樣量化過(guò)程
第27頁(yè),共125頁(yè),2023年,2月20日,星期日2.2.4編碼
模擬信號(hào)量經(jīng)過(guò)采樣和量化以后,形成一系列的離散信號(hào)——脈沖數(shù)字信號(hào)。這種脈沖數(shù)字信號(hào)可以一定的方式進(jìn)行編碼,形成計(jì)算機(jī)內(nèi)部運(yùn)行的數(shù)據(jù)。所謂編碼,就是按照一定的格式把經(jīng)過(guò)采樣和量化得到的離散數(shù)據(jù)記錄下來(lái),并在有用的數(shù)據(jù)中加入一些用于糾錯(cuò)、同步和控制的數(shù)據(jù)。在數(shù)據(jù)回放時(shí),可以根據(jù)所記錄的糾錯(cuò)數(shù)據(jù)判別讀出的聲音數(shù)據(jù)是否有錯(cuò),如在一定范圍內(nèi)有錯(cuò),可加以糾正。
編碼的形式比較多,常用的編碼方式是PCM——脈沖調(diào)制。脈沖編碼調(diào)制(PCM)是把模擬信號(hào)變換為數(shù)字信號(hào)的一種調(diào)制方式,既把連續(xù)輸入的模擬信號(hào)變換為在時(shí)域和振幅上都離散的量,然后將其轉(zhuǎn)化為代碼形式傳輸或存儲(chǔ)。PCM的主要優(yōu)點(diǎn)是:抗干擾能力強(qiáng);失真?。粋鬏斕匦苑€(wěn)定,尤其是遠(yuǎn)距離信號(hào)再生中繼時(shí)噪聲不累積,而且可以采用壓縮編碼、糾錯(cuò)編碼和保密編碼等來(lái)提高系統(tǒng)的有效性、可靠性和保密性。
第28頁(yè),共125頁(yè),2023年,2月20日,星期日
模擬信號(hào)經(jīng)過(guò)采樣再經(jīng)量化,然后用有限個(gè)二進(jìn)制碼去代表量化后的幅度,在編碼器中引入的量化誤差在解碼時(shí)無(wú)法消除,這一誤差等效于引入了噪聲、降低了信噪比。在比特率較高的波形編碼中可以用客觀指標(biāo)如信噪比來(lái)衡量編碼的質(zhì)量,例如現(xiàn)在電話(huà)中普遍使用的A律標(biāo)準(zhǔn)(ITUG.711標(biāo)準(zhǔn)),要求信噪比優(yōu)于35dB。除此之外,還可以規(guī)定動(dòng)態(tài)范圍和頻率響應(yīng),在有關(guān)的國(guó)際標(biāo)準(zhǔn)中都有具體規(guī)定。在低比特率情況下,采用了語(yǔ)音特征參數(shù)分析和合成語(yǔ)音的編碼方法,每個(gè)樣值僅1或0.5比特。在ISO的紅皮書(shū)(RedBook)標(biāo)準(zhǔn)中,規(guī)定CD-DA每24字節(jié)雙聲道音頻數(shù)據(jù)為一幀,對(duì)每一幀數(shù)據(jù)編碼后要形成幀同步碼、子碼(用于控制和顯示)及糾錯(cuò)碼,采用差錯(cuò)校驗(yàn)碼CIRC,用來(lái)檢測(cè)和糾正因CD表面的劃傷或灰塵產(chǎn)生的差錯(cuò)。其格式如表2-3所示。第29頁(yè),共125頁(yè),2023年,2月20日,星期日
在CD-DA中,數(shù)據(jù)、控制碼和糾錯(cuò)碼分別記錄在不同的光道上。定義98個(gè)音頻數(shù)據(jù)幀為一個(gè)扇區(qū)。因此每個(gè)扇區(qū)所含音頻數(shù)據(jù)量為98×24=2352(Byte),它使得一張CD唱盤(pán)上可容納約74分鐘的立體聲音樂(lè)信號(hào)。幀同步子碼音頻數(shù)據(jù)(左聲道)Q校驗(yàn)音頻數(shù)據(jù)(右聲道)P校驗(yàn)41124124第30頁(yè),共125頁(yè),2023年,2月20日,星期日2.3音頻信號(hào)的壓縮編碼與標(biāo)準(zhǔn)
將量化后的數(shù)字聲音信息直接存入計(jì)算機(jī)將會(huì)占用大量的存儲(chǔ)空間。在多媒體系統(tǒng)中,一般是對(duì)數(shù)字化聲音信息進(jìn)行壓縮和編碼后再存入計(jì)算機(jī),以減少音頻的數(shù)據(jù)量。2.3.1音頻信號(hào)壓縮編碼概述
在多媒體音頻信號(hào)處理中,一般需要對(duì)數(shù)字化后的聲音信號(hào)進(jìn)行壓縮編碼,使其成為具有一定字長(zhǎng)的二進(jìn)制數(shù)字序列,并以這種形式在計(jì)算機(jī)內(nèi)傳輸和存儲(chǔ)。在播放這些聲音時(shí),需要經(jīng)解碼器將二進(jìn)制編碼恢復(fù)成原來(lái)的聲音信號(hào)播放。第31頁(yè),共125頁(yè),2023年,2月20日,星期日音頻信號(hào)處理過(guò)程
聲音信號(hào)能進(jìn)行壓縮編碼的基本依據(jù)是:
聲音信號(hào)中存在著很大的冗余度,通過(guò)識(shí)別和去除這些冗余度,便能達(dá)到壓縮的目的;音頻信息的最終接收者是人,人的聽(tīng)覺(jué)器官(包括視覺(jué)器器官)都具有某種不敏感性,舍去人的感官所不敏感的信息對(duì)聲音質(zhì)量的影響很小,在有些情況下,甚至可以忽略不計(jì)。例如,人耳聽(tīng)覺(jué)中有一個(gè)重要的特點(diǎn),即聽(tīng)覺(jué)的“掩蔽”。它是指一個(gè)強(qiáng)音能抑制一個(gè)同時(shí)存在的弱音的聽(tīng)覺(jué)現(xiàn)象。利用該性質(zhì),可以抑制與信號(hào)同時(shí)存在的量化噪音。
第32頁(yè),共125頁(yè),2023年,2月20日,星期日.對(duì)聲音波形取樣后,相鄰樣值之間存在著很強(qiáng)的相關(guān)性。
音頻數(shù)據(jù)壓縮和編碼與圖像壓縮編碼有著很大的不同。圖像數(shù)據(jù)表達(dá)的是二維空間,很難找出固定的模型來(lái)形式化地表征它。音頻數(shù)據(jù)表達(dá)的是一維隨時(shí)間變化的函數(shù),因而聲音數(shù)據(jù)的壓縮比圖像數(shù)據(jù)壓縮要容易得多。從方法上看,聲音信號(hào)的編碼方式大致可分為三類(lèi),即波形編碼、參數(shù)編碼和混合編碼。
波形編碼的編碼信息是聲音的波形。這種方法要求重構(gòu)的聲音信號(hào)的各個(gè)樣本盡可能地接近于原始聲音的采樣值,復(fù)原的聲音質(zhì)量較高。波形編碼技術(shù)有PCM(脈沖編碼調(diào)制)、ADPCM(自適應(yīng)差分脈沖編碼調(diào)制)和ATC(自適應(yīng)變換編碼)等。
第33頁(yè),共125頁(yè),2023年,2月20日,星期日
參數(shù)編碼是一種對(duì)語(yǔ)音參數(shù)進(jìn)行分析合成的方法。語(yǔ)音的基本參數(shù)是基音周期、共振峰、語(yǔ)音譜、聲強(qiáng)等,如能得到這些語(yǔ)音基本參數(shù),就可以不對(duì)語(yǔ)音的波形進(jìn)行編碼,而只要記錄和傳輸這些參數(shù)就能實(shí)現(xiàn)聲音數(shù)據(jù)的壓縮。這些語(yǔ)音基本參數(shù)可以由語(yǔ)音生成機(jī)構(gòu)模型通過(guò)實(shí)驗(yàn)獲得。得到語(yǔ)音參數(shù)后,就可以對(duì)其進(jìn)行線(xiàn)性預(yù)測(cè)編碼(LPC-LinearPredictiveCoding)?;旌闲途幋a方法是一種在保留參數(shù)編碼技術(shù)的基礎(chǔ)上,引用波型編碼準(zhǔn)則去優(yōu)化激勵(lì)源信號(hào)的方案?;旌暇幋a充分利用了線(xiàn)性預(yù)測(cè)技術(shù)和綜合分析技術(shù),其典型算法有:碼本激勵(lì)線(xiàn)性預(yù)測(cè)(CELP)、多脈沖線(xiàn)性預(yù)測(cè)(MP-LPC)及矢量和激勵(lì)線(xiàn)性預(yù)測(cè)(VSELP)等??偟膩?lái)說(shuō),波形編碼在聲音編碼方案中應(yīng)用較廣,可以獲得很高的聲音質(zhì)量。下面我們介紹波形編碼方案中常用的PCM編碼。
第34頁(yè),共125頁(yè),2023年,2月20日,星期日2.3.2PCM編碼
1939年法國(guó)工程師AlecReeves發(fā)明了將連續(xù)的模擬信號(hào)變換成時(shí)間和幅度都離散的二進(jìn)制碼代表的脈沖編碼調(diào)制信號(hào)(PulseCodeModulation-PCM),并申請(qǐng)了專(zhuān)利。PCM首先開(kāi)始應(yīng)用于電話(huà)系統(tǒng),但一直到1962年美國(guó)Bell實(shí)驗(yàn)室才為AT&T制成了國(guó)際上第一套商用PCM電話(huà)系統(tǒng)(T1系統(tǒng)),這標(biāo)志了通信開(kāi)始步入數(shù)字化。以后的計(jì)算機(jī)發(fā)展更促進(jìn)了通信的數(shù)字化,并逐步與通信相結(jié)合。
PCM編碼是對(duì)連續(xù)語(yǔ)音信號(hào)進(jìn)行空間采樣、幅度值量化及用適當(dāng)碼字將其編碼的總稱(chēng)。PCM方法可以按量化方式的不同,分為均勻量化PCM、非均勻量化PCM和自適應(yīng)量化PCM等幾種。
第35頁(yè),共125頁(yè),2023年,2月20日,星期日
如果采用相等的量化間隔對(duì)采樣得到的信號(hào)作量化,那么這種量化稱(chēng)為均勻量化。均勻量化就是采用相同的“等分尺”來(lái)度量采樣得到的幅度,也稱(chēng)為線(xiàn)性量化,如圖2-6所示。均勻量化PCM就是直接對(duì)聲音信號(hào)作A/D轉(zhuǎn)換,在處理過(guò)程中沒(méi)有利用聲音信號(hào)的任何特性,也沒(méi)有進(jìn)行壓縮。該方法將輸入的聲音信號(hào)的振幅范圍分成個(gè)等份(B為量化位數(shù)),所以落入同一等份數(shù)的采樣值都編碼成相同的B位二進(jìn)制碼。只要采樣頻率足夠大,量化位數(shù)也適當(dāng),便能獲得較高的聲音信號(hào)數(shù)字化效果。為了滿(mǎn)足聽(tīng)覺(jué)上的效果,均勻量化PCM必須使用較多的量化位數(shù)。這樣所記錄和產(chǎn)生的音樂(lè),可以達(dá)到最接近原聲的效果。當(dāng)然提高采樣率及分辨率后,將引起儲(chǔ)存數(shù)據(jù)空間的增大。
第36頁(yè),共125頁(yè),2023年,2月20日,星期日第37頁(yè),共125頁(yè),2023年,2月20日,星期日
改進(jìn)PCM編碼技術(shù)的一個(gè)方法是采用非均勻量化,即讓量化級(jí)高度隨信號(hào)振幅而變化。信號(hào)振幅小則縮小量化級(jí)高度,信號(hào)振幅大時(shí)則增大量化級(jí)高度。這樣就可以在滿(mǎn)足精度要求的情況下用較少的位數(shù)實(shí)現(xiàn)編碼。在聲音數(shù)據(jù)還原時(shí),采用相同的規(guī)則。在非均勻量化中,采樣輸入信號(hào)幅度和量化輸出數(shù)據(jù)之間定義了兩種對(duì)應(yīng)關(guān)系,一種稱(chēng)為律(-Law)壓(縮)擴(kuò)(展)算法,另一種稱(chēng)為A律(A-Law)壓(縮)擴(kuò)(展)算法。這兩種算法主要用于數(shù)字電話(huà)通信中。律的計(jì)算公式如下:第38頁(yè),共125頁(yè),2023年,2月20日,星期日
其中是信號(hào)x(n)的最大幅度,u是控制壓縮程序的參數(shù),u越大壓縮就越厲害圖2-7給出了按律壓擴(kuò)算法的輸入輸出特性曲線(xiàn),為確定壓縮量的參數(shù),它反映最大量化間隔和最小量化間隔之比。由圖可見(jiàn),值越大,壓縮量越大。由于律壓擴(kuò)的輸入和輸出關(guān)系是對(duì)數(shù)函數(shù)關(guān)系,所以這種編碼又稱(chēng)為對(duì)數(shù)PCM。
A律壓擴(kuò)與律壓擴(kuò)相比,則壓縮的動(dòng)態(tài)范圍略小些,小信號(hào)振幅時(shí)質(zhì)量要比律稍差。無(wú)論是A律還是律算法,它們的特性在輸入信號(hào)振幅小時(shí)都呈線(xiàn)性,在輸入信號(hào)振幅大時(shí)呈對(duì)數(shù)壓縮特性。對(duì)于采樣頻率為8kHz,樣本精度為16位的輸入信號(hào),使用A律壓擴(kuò)或律壓擴(kuò)編碼,經(jīng)過(guò)PCM編碼器之后每個(gè)樣本的精度為8位,輸出的數(shù)據(jù)率為64kb/s。這個(gè)數(shù)據(jù)就是CCITT,(國(guó)際電話(huà)與電報(bào)顧問(wèn)委員會(huì))推薦的G.711標(biāo)準(zhǔn):話(huà)音頻率脈沖編碼調(diào)制。
第39頁(yè),共125頁(yè),2023年,2月20日,星期日2.3.3音頻壓縮編碼的標(biāo)準(zhǔn)
隨著多媒體計(jì)算機(jī)系統(tǒng)及數(shù)字通信系統(tǒng)的發(fā)展,數(shù)字音頻編碼技術(shù)正日益受到重視。為了提高信號(hào)傳輸和存儲(chǔ)的效率,人們多方致力于信源編碼的研究,力圖在保證聲音質(zhì)量的前提下,降低信源編碼的數(shù)據(jù)速率,并由此產(chǎn)生了一系列的國(guó)際的區(qū)域的標(biāo)準(zhǔn)。
國(guó)際電報(bào)電話(huà)咨詢(xún)委員會(huì)(CCITT)先后提出了一系列有關(guān)語(yǔ)音壓縮編碼的建議。在1972年制定了G.711,采用的是律或A律的PCM編碼技術(shù),數(shù)據(jù)速率為64kb/s。1984年,公布了G.721標(biāo)準(zhǔn),它采用的是ADPCM編碼技術(shù),數(shù)據(jù)率為32kb/s。以上兩個(gè)標(biāo)準(zhǔn)均適用于3003400Hz窄帶語(yǔ)音信號(hào),也可用于公用電話(huà)網(wǎng)。針對(duì)寬帶語(yǔ)音信號(hào)(50Hz7kHz),CCITT制定了G.722編碼標(biāo)準(zhǔn),它的數(shù)據(jù)速率為64kb/s。用此標(biāo)準(zhǔn)編碼,可在ISDN(綜合業(yè)務(wù)數(shù)據(jù)網(wǎng))的B通道上傳輸音頻數(shù)據(jù)。
第40頁(yè),共125頁(yè),2023年,2月20日,星期日
為了進(jìn)一步降低數(shù)據(jù)速率,CCITT從1989年開(kāi)始研究16kb/s的短延時(shí)、高質(zhì)量的音頻編碼標(biāo)準(zhǔn)。在AT&TBell實(shí)驗(yàn)室16kb/s短延時(shí)碼激勵(lì)(LD-CELP)編碼方案的基礎(chǔ)上,又公布適合于進(jìn)入長(zhǎng)途電話(huà)網(wǎng)采用的新標(biāo)準(zhǔn)。另外,還有歐洲數(shù)字移動(dòng)通信(GSM)制定了數(shù)字移動(dòng)通信網(wǎng)的13kb/s長(zhǎng)時(shí)預(yù)測(cè)規(guī)則碼激勵(lì)(RPE-LTP)語(yǔ)音編碼標(biāo)準(zhǔn)。美國(guó)1989年也公布了CTIA標(biāo)準(zhǔn)。它采用長(zhǎng)時(shí)延自適應(yīng)CELP方案,適應(yīng)于更低速率的語(yǔ)音壓縮,主要應(yīng)用在保密話(huà)音通信。
ISO(國(guó)際標(biāo)準(zhǔn)化組織)也制定了一系列的相應(yīng)的標(biāo)準(zhǔn),其運(yùn)動(dòng)圖象專(zhuān)業(yè)組(MPEG)在制定運(yùn)動(dòng)圖象編碼標(biāo)準(zhǔn)的同時(shí),制定了高保真立體聲音頻壓縮標(biāo)準(zhǔn)“MPEG音頻”。雖然MPEG聲音標(biāo)準(zhǔn)是MPEG標(biāo)準(zhǔn)的一部分,但它同時(shí)也完全可以獨(dú)立應(yīng)用。MPEG聲音壓縮算法是第一個(gè)高保真聲音數(shù)據(jù)壓縮的國(guó)際標(biāo)準(zhǔn)。
第41頁(yè),共125頁(yè),2023年,2月20日,星期日MPEG音頻根據(jù)不同的算法分為三個(gè)層次。層次1與層次2具有大致相同的算法,如表2-3所示。輸入音頻信號(hào)的采樣頻率為48kHz、44.1kHz或32kHz,經(jīng)過(guò)濾波器組分成32個(gè)子帶。同時(shí)編碼器利用人耳的屏蔽效應(yīng),根據(jù)音頻信號(hào)的性質(zhì)計(jì)算各個(gè)頻率分量的屏蔽門(mén)限,以控制每一個(gè)子帶的量化參數(shù),達(dá)到數(shù)據(jù)壓縮的目的。MPEG音頻的層次3進(jìn)一步引入了輔助子帶、非均勻量化和熵編碼等技術(shù),可以進(jìn)一步壓縮率。立體聲信號(hào)的編碼也可以在MPEG音頻中作為附加功能實(shí)現(xiàn)。MPEG音頻壓縮技術(shù)的傳輸速率為每聲道32kb/s448kb/s。
第42頁(yè),共125頁(yè),2023年,2月20日,星期日MPEG聲音的質(zhì)量
表中,MUSICAM(MaskingpatternadaptedUniversalSubbandIntegratedCodingAndMultiplexing)為自適應(yīng)聲音掩蔽特性的通用子帶綜合編碼和復(fù)合技術(shù)。ASPEC(AdaptiveSpectralPerceptualEntropyCodingofhighqualitymusicalsignal)表示高質(zhì)量音樂(lè)信號(hào)自適應(yīng)譜感知熵編碼。
層次算法壓縮率立體聲信號(hào)所對(duì)應(yīng)的比特率(kbits/sec)1
MUSICAM1:43842MUSICAM1:61:82561923ASPEC1:101:12128112第43頁(yè),共125頁(yè),2023年,2月20日,星期日2.3.4數(shù)字音頻的文件格式
在多媒體技術(shù)中,存儲(chǔ)音頻信息的文件格式主要有:WAV文件、VOC文件和MP3文件等。
WAV文件
WAV文件又稱(chēng)波形文件,是Microsoft公司的音頻文件格式。自從Windows視窗操作系統(tǒng)面世以來(lái),Microsoft就將WAV文件作為其標(biāo)準(zhǔn)格式的文件使用。用于保存Windows平臺(tái)的音頻信息資源,被Windows平臺(tái)及其應(yīng)用程序所廣泛支持。WAV文件來(lái)源于對(duì)聲音模擬波形的采樣,并以不同的量化位數(shù)把這些采樣點(diǎn)的值輪換成二進(jìn)制數(shù),然后存入磁盤(pán),這就產(chǎn)生了波形文件。
第44頁(yè),共125頁(yè),2023年,2月20日,星期日WAV聲音文件是使用RIFF(ResourceInterchangeFileFormat資源交換文件)的格式描述的,RIFF格式文件是一種帶有標(biāo)記的文件結(jié)構(gòu),它由文件頭和波形音頻文件數(shù)據(jù)塊組成。文件頭包括標(biāo)志符、語(yǔ)音特征值、聲道特征以及PCM格式類(lèi)型標(biāo)志等。WAV數(shù)據(jù)塊是由數(shù)據(jù)子塊標(biāo)記、數(shù)據(jù)子塊長(zhǎng)度和波形音頻數(shù)據(jù)3個(gè)數(shù)據(jù)子塊組成。
Wave格式支持MSADPCM、CCITTALaw、CCITTμLaw和其他壓縮算法,支持多種音頻位數(shù)、采樣頻率和聲道,是PC機(jī)上最為流行的聲音文件格式,但其文件尺寸較大,多用于存儲(chǔ)簡(jiǎn)短的聲音片斷。
第45頁(yè),共125頁(yè),2023年,2月20日,星期日VOC文件
VOC文件是Creative公司所使用的標(biāo)準(zhǔn)音頻文件格式,也是聲霸卡(SoundBlaster)所使用的音頻文件格式。Voice文件是CreativeLabs(創(chuàng)新公司)開(kāi)發(fā)的聲音文件格式,多用于保存CreativeSoundBlaster(創(chuàng)新聲霸)系列聲卡所采集的聲音數(shù)據(jù),被Windows平臺(tái)和DOS平臺(tái)所支持,支持CCITTALaw和CCITTμLaw等壓縮算法。與WAV格式類(lèi)似,VOC文件由文件頭塊和音頻數(shù)據(jù)塊組成。文件頭包含一個(gè)標(biāo)識(shí)、版本號(hào)和一個(gè)指向數(shù)據(jù)塊起始地址的指針,這個(gè)指針幫助數(shù)據(jù)塊定位以便順利找到第一個(gè)數(shù)據(jù)塊。數(shù)據(jù)塊分成各種類(lèi)型的子塊,如聲音數(shù)據(jù)、靜音、標(biāo)記、ASCII碼文件、重復(fù)、重復(fù)的結(jié)束及終止標(biāo)記等。
第46頁(yè),共125頁(yè),2023年,2月20日,星期日MPEG音頻文件——.MP1/.MP2/.MP3
這里的音頻文件格式指的是MPEG標(biāo)準(zhǔn)中的音頻部分,即MPEG音頻層(MPEGAudioLayer)。MPEG音頻文件的壓縮是一種有損壓縮,根據(jù)壓縮質(zhì)量和編碼復(fù)雜程度的不同可分為三層(MPEGAudioLayer1/2/3),分別對(duì)應(yīng)MP1、MP2和MP3這三種聲音文件;
MPEG音頻編碼具有很高的壓縮率,MP1和MP2的壓縮率分別為4∶1和6∶1~8∶1,而MP3的壓縮率則高達(dá)10∶1~12∶1,也就是說(shuō)一分鐘CD音質(zhì)的音樂(lè),未經(jīng)壓縮需要10MB存儲(chǔ)空間,而經(jīng)過(guò)MP3壓縮編碼后只有1MB左右,同時(shí)其音質(zhì)基本保持不失真。
MP3的流行得益于Internet的推波助瀾,它用網(wǎng)絡(luò)代替了傳統(tǒng)唱片的傳播途徑,擴(kuò)大了數(shù)字音樂(lè)的流傳范圍,加速了數(shù)字音樂(lè)的傳播速度,MP3憑借其優(yōu)美的音質(zhì)和高壓縮比而成為最為流行的音樂(lè)格式。
第47頁(yè),共125頁(yè),2023年,2月20日,星期日MP3播放器WinampMP3是Internet上流行的音樂(lè)格式
第48頁(yè),共125頁(yè),2023年,2月20日,星期日
RealAudio文件——.RA/.RM/.RAM
RealAudio文件是RealNetworks公司開(kāi)發(fā)的一種新型流式音頻(StreamingAudio)文件格式;它包含在RealNetworks所制定的音頻、視頻壓縮規(guī)范RealMedia中,主要用于在低速率的廣域網(wǎng)上實(shí)時(shí)傳輸音頻信息;網(wǎng)絡(luò)連接速率不同,客戶(hù)端所獲得的聲音質(zhì)量也不盡相同:對(duì)于28.8kb/s的連接,可以達(dá)到廣播級(jí)的聲音質(zhì)量;如果擁有ISDN或更快的線(xiàn)路連接,則可獲得CD音質(zhì)的聲音。
第49頁(yè),共125頁(yè),2023年,2月20日,星期日AIFF文件——.AIF/.AIFF
AIFF是音頻交換文件格式(AudioInterchangeFileFormat)的英文縮寫(xiě),是蘋(píng)果計(jì)算機(jī)公司開(kāi)發(fā)的一種聲音文件格式;被Macintosh平臺(tái)及其應(yīng)用程序所支持,其他專(zhuān)業(yè)音頻軟件包也同樣支持這種格式。第50頁(yè),共125頁(yè),2023年,2月20日,星期日2.4.1音頻卡(聲卡)發(fā)展的歷史ADLIB-最早的聲卡
雖然PC聲卡是在90年代才得以普及,但它的問(wèn)世卻早在1984年。英國(guó)的ADLIB公司是目前公認(rèn)的“聲卡之父”,雖然他們最初開(kāi)發(fā)的產(chǎn)品只能提供簡(jiǎn)單的音樂(lè)效果,并且無(wú)法處理音頻信號(hào),但在當(dāng)時(shí)無(wú)疑已經(jīng)是一個(gè)很大的突破。由于技術(shù)不夠成熟、成本又非常高昂,因此這類(lèi)帶有試驗(yàn)品性質(zhì)的早期ADLIB音樂(lè)卡,當(dāng)時(shí)計(jì)算機(jī)的運(yùn)算速度也不足以應(yīng)付大規(guī)模的多媒體處理,所以并未能普及。2.4音頻卡的工作原理第51頁(yè),共125頁(yè),2023年,2月20日,星期日Creative聲卡系列
把聲卡真正帶入個(gè)人電腦領(lǐng)域的,是CREATIVE-創(chuàng)新公司。創(chuàng)新科技有限公司是世界上規(guī)模最大的多媒體硬件生產(chǎn)商和制造商之一,其“聲霸卡”和“視霸卡”系列產(chǎn)品在全球占有很高的市場(chǎng)份額。自1989年,Creative在美國(guó)Comdex展覽會(huì)上首次推出自己研制開(kāi)發(fā)的適用于PC機(jī)的SoundBlaster而引起轟動(dòng)至今,使SB聲霸卡產(chǎn)品形成系列而風(fēng)靡全球。
第一代SoundBlaster聲卡基于ISA總線(xiàn),具有一個(gè)8位的D/A轉(zhuǎn)換器,只支持單聲道錄放音模式。它一次為電腦同時(shí)加上了音樂(lè)處理和音頻信號(hào)處理的功能。此后推出的SoundBlasterPro加入了對(duì)立體聲信號(hào)的支持。第一個(gè)多媒體電腦技術(shù)標(biāo)準(zhǔn)——MPC1,就把SoundBlasterPro作為聲卡設(shè)備的標(biāo)準(zhǔn)配置。
第52頁(yè),共125頁(yè),2023年,2月20日,星期日Creative在成功推出第一塊適用于PC機(jī)的聲音卡SoundBlasterPro后,又推出了具有16bit、44KHz采樣率并支持立體聲的SoundBlaster16系列。它的推出使多媒體聲卡的錄音和放音第一次在技術(shù)規(guī)格上達(dá)到了CD唱片的品質(zhì)。在20世紀(jì)90年代中期,16bit、44KHz、立體聲D/A轉(zhuǎn)換代表了聲卡的最高技術(shù)水平。
Creative在1995年的推出了具有波表合成功能的SoundBlasterAwe32聲卡。SBAwe32具有一個(gè)32復(fù)音的波表引擎,并集成了1MB容量的音色庫(kù),使其MIDI合成效果大大超越了以前所有的產(chǎn)品(其以前的產(chǎn)品在MIDI“電子合成器”方面采用都是YAMAHA公司研發(fā)的FM合成技術(shù))。
第53頁(yè),共125頁(yè),2023年,2月20日,星期日
在SoundBlaster32的基礎(chǔ)上,SoundBlasterAWE64在技術(shù)上取得了巨大的飛躍。這里的32和64不再表示數(shù)字音頻的位數(shù),而是表示32和64種復(fù)音的波表合成技術(shù),它們?nèi)允?6位聲卡。
SBAWE64采用著名音源公司E-mu的專(zhuān)業(yè)級(jí)的波表,采用了多點(diǎn)插值算法專(zhuān)利技術(shù)的WaveEffect合成器,提供平滑的音頻復(fù)制和最小的失真,可升級(jí)到28MB音色采樣子系統(tǒng)能更好地支持SoundFont音色庫(kù)。它提供了高質(zhì)真實(shí)樂(lè)器感的64復(fù)音的MIDI合成器,使得游戲和多媒體應(yīng)用程序的音響效果比以前更為逼真。3D增強(qiáng)定位音響(3DPositionalAudio)技術(shù)和空間響應(yīng),使每一種聲音變得比以前更加令人陶醉。高級(jí)的音色庫(kù)定制和編輯,使用戶(hù)可以在計(jì)算機(jī)上制作音樂(lè),進(jìn)行作曲。
第54頁(yè),共125頁(yè),2023年,2月20日,星期日2.4.2音頻卡的功能和分類(lèi)(一)、音頻卡的主要功能1、音頻的錄制與播放2、編輯與合成3、MIDI和音樂(lè)合成4、文語(yǔ)轉(zhuǎn)換與語(yǔ)音識(shí)別5、CD-ROM接口即游戲接口第55頁(yè),共125頁(yè),2023年,2月20日,星期日音頻錄放采用:采樣頻率范圍:8~44.1kHz
量化位:8位,16位,32位單聲道:立體聲/單聲道編碼與采樣:基本編碼方法:PCM
壓縮編碼方法:ADPCM(8:4,8:3,8:2,16:4)CCITTA律(13:8)
CCITTμ律(14:8)實(shí)時(shí)硬件壓縮/軟件壓縮音頻錄放的自動(dòng)動(dòng)態(tài)濾波錄音聲源:麥克風(fēng)、立體聲線(xiàn)路輸入、CD輸出功率放大器,直接驅(qū)動(dòng)揚(yáng)聲器,音量可調(diào)。1.錄制與播放第56頁(yè),共125頁(yè),2023年,2月20日,星期日2.編輯與合成它是對(duì)聲音文件進(jìn)行多種特殊效果處理,包括以下內(nèi)容:倒播增加回音靜噪淡入和淡出往返放聲交換聲道聲音移位第57頁(yè),共125頁(yè),2023年,2月20日,星期日3、MIDI和音樂(lè)合成
MIDI是樂(lè)器數(shù)字接口的標(biāo)準(zhǔn),它規(guī)定了電子樂(lè)器與計(jì)算機(jī)之間相互數(shù)據(jù)通信的協(xié)議。音樂(lè)合成的功能和性能依賴(lài)于合成芯片。波形表音樂(lè)合成(詳見(jiàn)后續(xù)章節(jié))第58頁(yè),共125頁(yè),2023年,2月20日,星期日4、文語(yǔ)轉(zhuǎn)換和語(yǔ)音識(shí)別文語(yǔ)轉(zhuǎn)換就是把計(jì)算機(jī)內(nèi)的文本轉(zhuǎn)換成聲音語(yǔ)音識(shí)別將語(yǔ)音識(shí)別為計(jì)算機(jī)能理解的文字或命令第59頁(yè),共125頁(yè),2023年,2月20日,星期日(二)音頻卡的分類(lèi)(1)音頻卡的分類(lèi)主要是根據(jù)采樣量化的位數(shù)來(lái)分類(lèi)的。通常分為8位,16位,32位等。位數(shù)越高,量化精度越高,音質(zhì)越好。同時(shí)形成聲音文件所需的容量越大。計(jì)算聲音文件公式如下:
S=DxRx(r/8)x聲道數(shù)
D代表采樣頻率,R代表采樣時(shí)間以秒計(jì)算,
r代表量化位第60頁(yè),共125頁(yè),2023年,2月20日,星期日(二)、音頻卡的分類(lèi)(2)一、獨(dú)立音頻卡,插在主板的ISA或PCI槽中。二、主板集成。目前市場(chǎng)上90%以上的主板都集成AC‘97聲卡。現(xiàn)在廣泛在整合主板上集成的板載聲卡采用的音效芯片:創(chuàng)新ES1370/CT5880、C-Media8738、YAMAHAYMF744、傲銳AU8820,一些獨(dú)立聲卡采用的芯片和上面的完全一樣。現(xiàn)在已經(jīng)出現(xiàn)了6聲道的板載聲卡,板載5.1輸出也變?yōu)楝F(xiàn)實(shí)。三、USB聲卡。普通的性能,過(guò)大的體型,還有居高不下的價(jià)格,但也有一些產(chǎn)品的價(jià)格較低。第61頁(yè),共125頁(yè),2023年,2月20日,星期日(一)、音頻卡的特性(1)強(qiáng)勁的音頻處理引擎(2)環(huán)境音效增加現(xiàn)有音頻的內(nèi)容(3)SoundBlasterTMPCI標(biāo)準(zhǔn)(4)多音箱輸出(5)256復(fù)音音樂(lè)合成器(6)環(huán)境音效功能擴(kuò)展集/廣泛的軟件支持2.4.3音頻卡的工作原理第62頁(yè),共125頁(yè),2023年,2月20日,星期日(二)工作原理主要組成部分:1、聲音的合成與處理:數(shù)字音頻處理器(DSP)、FM合成器以及MIDI控制器,其任務(wù)是完成聲波信號(hào)的模/數(shù)(A/D)、數(shù)/模(D/A)轉(zhuǎn)換,調(diào)頻技術(shù)控制聲音的音調(diào)、音色和幅度,F(xiàn)M音樂(lè)合成器具有多種復(fù)音操作的功能;2、混合信號(hào)處理器:內(nèi)置數(shù)字/模擬混音器、混音器的聲源可以是MIDI信號(hào)、CD音頻、話(huà)筒和PC的揚(yáng)聲器等,可以選擇不同音源進(jìn)行混合錄音;3、功率放大器:使輸出的音頻信號(hào)有足夠的輸出功率;4、計(jì)算機(jī)總線(xiàn)接口和控制器:ISA總線(xiàn),PCI總線(xiàn),總線(xiàn)接口和控制器有數(shù)據(jù)總線(xiàn)雙向驅(qū)動(dòng)器、總線(xiàn)接口控制邏輯、總線(xiàn)中斷邏輯及DMA邏輯組成。第63頁(yè),共125頁(yè),2023年,2月20日,星期日PC總線(xiàn)數(shù)據(jù)總線(xiàn)驅(qū)動(dòng)器總線(xiàn)接口和控制器游戲接口MIDI接口混合信號(hào)處理器數(shù)字聲音處理器MIC放大器功率放大器音樂(lè)合成器音樂(lè)合成器地址總線(xiàn)控制總線(xiàn)MIC揚(yáng)聲器CDline音頻卡的工作原理圖第64頁(yè),共125頁(yè),2023年,2月20日,星期日音頻卡的工作原理音頻卡簡(jiǎn)稱(chēng)聲卡,它將模擬音頻進(jìn)行模數(shù)轉(zhuǎn)換送入計(jì)算機(jī),進(jìn)行處理后再經(jīng)過(guò)數(shù)模轉(zhuǎn)換,輸出加工后的合成音頻。DSP:它完成8位或16位單聲道/立體聲數(shù)字聲音的記錄和播放;完成4:1,3:1和2:1的ADPCM壓縮/解壓縮,控制取樣頻率,翻譯與聲卡兼容的MIDI指令,提供揚(yáng)聲器控制,控制各種直接存取DMA方式??偩€(xiàn)接口負(fù)責(zé)為總線(xiàn)和聲卡各部分提供握手信號(hào)和數(shù)據(jù)傳輸。第65頁(yè),共125頁(yè),2023年,2月20日,星期日(三)衡量聲卡質(zhì)量的關(guān)鍵技術(shù)總線(xiàn)類(lèi)型:ISA6Mbit/s,PCI133Mbit/s標(biāo)準(zhǔn)支持即插即用取樣能力芯片類(lèi)型:CODEC芯片合成器:FM和波表合成MIDI音樂(lè)音效第66頁(yè),共125頁(yè),2023年,2月20日,星期日2.4.4音頻編碼基礎(chǔ)和標(biāo)準(zhǔn)1、時(shí)域信息的冗余度(1)幅度的非均勻分布(2)樣本間的相關(guān)(3)周期之間的相關(guān)(4)基音之間的相關(guān)濁音清音(5)靜止系數(shù)(6)長(zhǎng)時(shí)相關(guān)函數(shù)第67頁(yè),共125頁(yè),2023年,2月20日,星期日2、頻域信息的冗余度(1)非均勻的長(zhǎng)時(shí)功率譜密度(2)語(yǔ)音特有的短時(shí)功率譜密度3、人的聽(tīng)覺(jué)感知機(jī)理第一、人的聽(tīng)覺(jué)具有掩蔽效應(yīng)第二、人耳對(duì)不同頻段的聲音的敏感程度不同,通常對(duì)低頻端較之對(duì)高頻段更敏感。第三、人而對(duì)語(yǔ)音信號(hào)的相位變化不敏感。第68頁(yè),共125頁(yè),2023年,2月20日,星期日音頻編碼的分類(lèi)(1)基于音頻數(shù)據(jù)的統(tǒng)計(jì)特性進(jìn)行編碼,其典型的技術(shù)是波形編碼。如PCM,DPCM,ADPCM。(2)基于音頻的聲學(xué)參數(shù),進(jìn)行參數(shù)編碼,可進(jìn)一步降低數(shù)據(jù)率;參數(shù)有共振峰、線(xiàn)性預(yù)測(cè)系數(shù)、濾波器組等,如CELP、MPLPC。(3)基于人的聽(tīng)覺(jué)特性進(jìn)行編碼,利用掩蔽效應(yīng),設(shè)計(jì)心理學(xué)模型,從而實(shí)現(xiàn)高效率的數(shù)字音頻的壓縮。如MPEG的高頻編碼和DolbyAC-3。第69頁(yè),共125頁(yè),2023年,2月20日,星期日常用三種波形編碼的方法:(1)PCM:直接對(duì)語(yǔ)音信號(hào)進(jìn)行模數(shù)轉(zhuǎn)換。只要采樣頻率足夠高,量化尾數(shù)足夠多,就能使編碼后恢復(fù)的語(yǔ)音信號(hào)有較高的質(zhì)量。(2)DPCM:即只傳輸語(yǔ)音預(yù)測(cè)值和樣本值的差值,以此降低音頻數(shù)據(jù)的編碼率。(3)ADPCM:它是DPCM方法的改進(jìn),通過(guò)調(diào)整量化步長(zhǎng),對(duì)不同數(shù)模設(shè)置不同的量化步長(zhǎng),使數(shù)據(jù)得到進(jìn)一步的壓縮。第70頁(yè),共125頁(yè),2023年,2月20日,星期日2.4.5音頻編碼標(biāo)準(zhǔn)國(guó)際電報(bào)電話(huà)咨詢(xún)委員會(huì)(CCITT)和國(guó)際標(biāo)準(zhǔn)化組織(ISO)先后提出了一系列有關(guān)音頻編碼的標(biāo)準(zhǔn)。具體如下:G.711G.721G.722G.728MPEG中的音頻編碼AC-3的編碼和解碼第71頁(yè),共125頁(yè),2023年,2月20日,星期日音頻編碼的算法和標(biāo)準(zhǔn)算法名稱(chēng)數(shù)據(jù)率標(biāo)準(zhǔn)應(yīng)用質(zhì)量波形編碼PCM均勻量化公共網(wǎng)ISDN配音4.0~4.5μ(A)μ(A)64kb/sG.711APCM自適應(yīng)量化DPCM差值量化ADPCM自適應(yīng)差值量化32kb/sG.721SB-ADPCM子帶-自適應(yīng)差值量化64kb/sG.7225.3kb/sG.7236.3kb/s參數(shù)編碼LPC線(xiàn)性預(yù)測(cè)編碼2.4kb/s保密電話(huà)2.5`3.5混合編碼CELPC碼激勵(lì)LPC4.6kb/s移動(dòng)通信4.0~3.7VSELP矢量和激勵(lì)LPC8kb/s語(yǔ)音郵件RPE-LTP長(zhǎng)時(shí)預(yù)測(cè)規(guī)則碼激勵(lì)13.2kb/sISDNLD-CELP低延時(shí)碼激勵(lì)16kb/sG.728G.729MPEG多子帶感知編碼128kb/sCD5.0AC-3感知編碼音響5.0第72頁(yè),共125頁(yè),2023年,2月20日,星期日ADPCM編碼器結(jié)構(gòu)圖轉(zhuǎn)化為標(biāo)準(zhǔn)PCM自適應(yīng)量化器逆自適應(yīng)量化器自適應(yīng)預(yù)測(cè)器S(k)64kb/sA律或μ律PCMSl(k)d(k)I(k)Se(k)dq(k)St(k)32kb/s輸出第73頁(yè),共125頁(yè),2023年,2月20日,星期日ADPCM解碼器結(jié)構(gòu)圖轉(zhuǎn)化為PCM同步編碼調(diào)節(jié)逆自適應(yīng)預(yù)測(cè)器32kb/s輸入64kb/s輸出A律或μ律PCM逆自適應(yīng)量化器第74頁(yè),共125頁(yè),2023年,2月20日,星期日CELP(碼激勵(lì)線(xiàn)性預(yù)測(cè))編碼圖矢量緩沖激勵(lì)VQ碼本VQ索引通道增益后向增益自適應(yīng)最小MSE50階LPC預(yù)測(cè)器后向LPC分析感知加權(quán)濾波器編碼誤差輸入語(yǔ)音合成語(yǔ)音第75頁(yè),共125頁(yè),2023年,2月20日,星期日CELP(碼激勵(lì)線(xiàn)性預(yù)測(cè))解碼圖已編碼語(yǔ)音激勵(lì)VQ碼本從通道來(lái)的VQ索引增益后向增益自適應(yīng)50階LPC預(yù)測(cè)器后向LPC分析自適應(yīng)后濾波器后濾波的語(yǔ)音信號(hào)輸出第76頁(yè),共125頁(yè),2023年,2月20日,星期日MPEG中的音頻編碼
MPEG是運(yùn)動(dòng)圖像專(zhuān)家組的簡(jiǎn)稱(chēng),國(guó)際標(biāo)準(zhǔn)化組織(ISO)和國(guó)際電工委員會(huì)(IEC)所屬的W11工作組,制定推薦了MPEG的標(biāo)準(zhǔn)。MPEG標(biāo)準(zhǔn)有MPEG-I,MPEG-II,MPEG-IV,MPEGVII等,MPEG-I中一部分對(duì)應(yīng)于ISO/IEC11172-3及MPE音頻。它規(guī)定了高質(zhì)量音頻編碼方法,存儲(chǔ)表示和解碼方法。編碼器的輸入和解碼器的輸出與現(xiàn)存的PCM標(biāo)準(zhǔn)兼容。第77頁(yè),共125頁(yè),2023年,2月20日,星期日MPEG音頻編碼主要參數(shù)(1)編碼器
編碼器處理數(shù)字音頻信號(hào),并生成存儲(chǔ)所需的數(shù)據(jù)流。(見(jiàn)結(jié)構(gòu)圖)(2)編碼層次層I包括將數(shù)字音頻變成32個(gè)子帶的基本映射;層II提供了位分配,縮放因子和抽樣的附加編碼;層III采用混合帶通濾波器來(lái)提高頻率分辨率。(3)存儲(chǔ)(4)解碼解碼器按編碼器的定義的語(yǔ)法接受壓縮的音頻數(shù)據(jù)流按解碼部分的方法解出數(shù)據(jù)元素,按濾波器的規(guī)定,用這些信息產(chǎn)生數(shù)字音頻的輸出(見(jiàn)解碼結(jié)構(gòu)圖)第78頁(yè),共125頁(yè),2023年,2月20日,星期日MPEG音頻編碼器結(jié)構(gòu)框圖映射量化器和編碼幀封裝心理聲學(xué)模型輔助數(shù)據(jù)PCM音頻抽樣已編碼數(shù)據(jù)流第79頁(yè),共125頁(yè),2023年,2月20日,星期日MPEG音頻解碼器結(jié)構(gòu)框圖幀擴(kuò)展重構(gòu)逆映射已編碼數(shù)據(jù)流PCM音頻抽樣輔助數(shù)據(jù)第80頁(yè),共125頁(yè),2023年,2月20日,星期日AC-3編碼和解碼AC-3是在1992年DOLBY實(shí)驗(yàn)室在AC-2(立體聲編碼標(biāo)準(zhǔn))的基礎(chǔ)上推出的。AC-3提供了5個(gè)聲道從20HZ到20KHZ的全通帶頻,即正前方的左(L)中(C)右(R),后邊兩個(gè)獨(dú)立的環(huán)繞立體聲通道左后(LS)和右后(RS)。同時(shí)還提供了一個(gè)100HZ以下的超低音聲供用戶(hù)選擇,以彌補(bǔ)低音之不足。也被稱(chēng)為5.1聲道。第81頁(yè),共125頁(yè),2023年,2月20日,星期日AC-35.1聲道圖示LCRLSRS100Hz第82頁(yè),共125頁(yè),2023年,2月20日,星期日AC-3可編程解碼器4聲道混合環(huán)繞立體聲5.1聲道AC-3數(shù)據(jù)流解碼器A解碼器B解碼器C解碼器DLCRLSRSSubLTRT邏輯環(huán)繞聲解碼器LCRS5.1聲道環(huán)繞立體聲2聲道立體聲單聲道第83頁(yè),共125頁(yè),2023年,2月20日,星期日AC-3編碼器框圖分析濾波器組頻率包絡(luò)線(xiàn)分析比特分配位數(shù)量化AC-3成幀PCM時(shí)間采樣指數(shù)尾數(shù)比特分配信息量化尾數(shù)編碼的AC-3位流編碼的頻譜包絡(luò)線(xiàn)第84頁(yè),共125頁(yè),2023年,2月20日,星期日AC-3編碼流程圖耦合策略PCM輸入瞬時(shí)測(cè)試TDAC變換形成耦合聲道模型重建確定指數(shù)指數(shù)策略抖動(dòng)策略指數(shù)編碼尾數(shù)規(guī)格化比特分配成幀尾數(shù)量化塊開(kāi)關(guān)標(biāo)志耦合策略重建標(biāo)志指數(shù)策略抖動(dòng)指針比特分配參數(shù)指示信息編碼的譜包絡(luò)線(xiàn)尾數(shù)比特分配指針主信息第85頁(yè),共125頁(yè),2023年,2月20日,星期日AC-3同步幀結(jié)構(gòu)圖音頻數(shù)據(jù)塊AUXCRCSIBSIAB0AB2AB3AB4AB5AB1同步幀SIBSI第86頁(yè),共125頁(yè),2023年,2月20日,星期日2.5音樂(lè)合成與MIDI規(guī)范音樂(lè)合成的兩種技術(shù):調(diào)頻(FM)音樂(lè)合成技術(shù):是使高頻振蕩的頻率按調(diào)制信號(hào)規(guī)律變化的一種調(diào)制方式,合成不同頻譜分布的波形,再現(xiàn)某些樂(lè)器的音色。波形表合成(wavetable)樂(lè)音必備的三要素:音高:指聲波的基頻,基頻越低給人感覺(jué)越低沉。音色:具有固定音高和相同諧波的樂(lè)音。響度:對(duì)聲音強(qiáng)度的衡量第87頁(yè),共125頁(yè),2023年,2月20日,星期日YM3812音樂(lè)系統(tǒng)框圖微機(jī)或微處理器地址數(shù)據(jù)總線(xiàn)總線(xiàn)控制YM3812DAC音頻放大系統(tǒng)時(shí)鐘第88頁(yè),共125頁(yè),2023年,2月20日,星期日MIDI規(guī)范(術(shù)語(yǔ))MIDI文件通道(channels)音序器(sequencer)合成器(synthesizer)樂(lè)器(instrument)復(fù)音(puyphone)音色(tmbre)音軌(tack)合成音色映射器(patchapper)通道映射(channelmapping)第89頁(yè),共125頁(yè),2023年,2月20日,星期日2.6樂(lè)器數(shù)字接口——MIDI
在音樂(lè)創(chuàng)作領(lǐng)域,由于MIDI、電子樂(lè)器和多媒體計(jì)算機(jī)的結(jié)合,給人們提供了一種快捷、獨(dú)特的制作方式,它更加強(qiáng)調(diào)音色的非常規(guī)化、電子化、空間感和對(duì)比等,并且日益形成一種嶄新的音樂(lè)風(fēng)格。
第90頁(yè),共125頁(yè),2023年,2月20日,星期日2.6.1什么是MIDI
MIDI是數(shù)字音樂(lè)接口(MusicalInstrumentDigitalInterface)的縮寫(xiě)?;蛘哒f(shuō),MIDI是用來(lái)將電子樂(lè)器相互連接,或?qū)IDI設(shè)備與電腦連接成系統(tǒng)的一種通信協(xié)議。通過(guò)它,各種MIDI設(shè)備都可以準(zhǔn)確傳送MIDI信息。
MIDI是由軟件部分和硬件部分共同組成的系統(tǒng)規(guī)范,這個(gè)規(guī)范定義了MIDI設(shè)備間數(shù)字傳送時(shí)電纜硬件接口和協(xié)議。規(guī)范的制定的目的是希望各家生產(chǎn)的樂(lè)器之間通過(guò)統(tǒng)一的MIDI交換信息及控制信號(hào),從而完成音樂(lè)的合成。這樣,任何電子樂(lè)器,只要有處理MIDI信息的處理器和適當(dāng)?shù)挠布涌诙寄茏兂蒑IDI裝置。
第91頁(yè),共125頁(yè),2023年,2月20日,星期日
盡管MIDI是多媒體音響制作的一個(gè)重要部分,但它不屬于數(shù)字音響技術(shù)的范疇。打個(gè)比方,如果數(shù)字音響是一盤(pán)錄了某個(gè)人小提琴獨(dú)奏的磁帶,則MIDI就是該獨(dú)奏的樂(lè)譜,盡管樂(lè)譜本身并不產(chǎn)生任何實(shí)際聲音,但它確實(shí)定義了演奏的速度、音符及演奏聲音的大小。你也許有演奏過(guò)某種樂(lè)器的經(jīng)歷,只要按照樂(lè)譜所標(biāo)注的要求進(jìn)行演奏,一段美妙的音樂(lè)就在你的指尖流出,而記錄這段音樂(lè)的樂(lè)譜也許只需一兩頁(yè)紙。按照這種思路,MIDI使電腦能夠利用“記譜”的方法進(jìn)行音樂(lè)的數(shù)字化錄音及放音。它把各種樂(lè)器的音色記錄在聲卡的存儲(chǔ)器之中,當(dāng)演奏時(shí),聲卡根據(jù)被演奏的音符及樂(lè)器,合成出音樂(lè),這樣就產(chǎn)生了某種音色的器樂(lè)聲。從一個(gè)MIDI設(shè)備轉(zhuǎn)送到另一個(gè)MIDI設(shè)備上去的數(shù)據(jù)就是MIDI信息。MIDI數(shù)據(jù)不是數(shù)字的音頻波形,而是音樂(lè)代碼或稱(chēng)電子樂(lè)譜。
第92頁(yè),共125頁(yè),2023年,2月20日,星期日2.6.2MIDI系統(tǒng)的組成
MIDI系統(tǒng)實(shí)際就是一個(gè)作曲、配器、電子模擬的演奏系統(tǒng)。
基于計(jì)算機(jī)的MIDI音樂(lè)系統(tǒng)有多種構(gòu)筑方案,但基本上都由以下幾部分組成:多媒體計(jì)算機(jī)、合成器、音序器、音源、MIDI鍵盤(pán)、錄音設(shè)備和監(jiān)聽(tīng)設(shè)備等。這些設(shè)備可以是獨(dú)立的,也可以是集成的。
如果在計(jì)算機(jī)上安裝了MIDI軟件,可將音樂(lè)的創(chuàng)作、樂(lè)譜的打印、節(jié)目編排、音樂(lè)的調(diào)整、音響的幅度、節(jié)奏的速度、各聲部之間的協(xié)調(diào)、混響都可由MIDI軟件控制完成。第93頁(yè),共125頁(yè),2023年,2月20日,星期日
利用MIDI技術(shù)將電子合成器、電子音源與音序器連接在一起即可演奏模擬出音色變化萬(wàn)千的音響效果,又可將演奏中的多種按鍵數(shù)據(jù)存儲(chǔ)起來(lái),極大的改善了音樂(lè)演奏的能力和條件。
基于計(jì)算機(jī)的MIDI音樂(lè)創(chuàng)作系統(tǒng)
第94頁(yè),共125頁(yè),2023年,2月20日,星期日合成器
MIDI合成器是能夠產(chǎn)生特定聲音的電子裝置,其數(shù)據(jù)傳送符合MIDI通信約定。合成器自誕生以來(lái),其概念已發(fā)生了很多變化。早期的合成器是真正意義上的硬件合成器,它通過(guò)人為地調(diào)制各種波的參數(shù)(如鋸齒波,方型波,濾波器,截止頻率)等來(lái)合成音色。
合成器是通過(guò)控制面板上的按鈕產(chǎn)生數(shù)字信號(hào)來(lái)控制的。這些數(shù)字信號(hào)用于“告訴”合成器內(nèi)部的微處理器鍵盤(pán)上哪個(gè)鍵被擊,哪個(gè)旋鈕被轉(zhuǎn)動(dòng)。這些數(shù)字控制信號(hào)還可以同時(shí)被記錄在合成器內(nèi)部被稱(chēng)作“音序器”的裝置中。第95頁(yè),共125頁(yè),2023年,2月20日,星期日具有USB接口的MIDI鍵盤(pán)人工通過(guò)控制面板來(lái)調(diào)制音色的硬件合成器
集音源、音序器、MIDI鍵盤(pán)于一身的合成器第96頁(yè),共125頁(yè),2023年,2月20日,星期日
現(xiàn)在,合成器的概念已經(jīng)不是人為合成音色的設(shè)備。它擁有大量真實(shí)的采樣音色可供演奏使用,它擁有自己的音序器可以錄制編輯音樂(lè),它擁有MIDI接口可以與其他設(shè)備交換信息。我們可以認(rèn)為現(xiàn)代的合成器是這樣意義上的“合成”,即集音源,音序器,MIDI鍵盤(pán)于一身的設(shè)備。
隨著軟件音序器的普及,合成器的硬件音序器由于它的繁瑣而魅力大減,音源,音序器,鍵盤(pán)三位一體的方式受到挑戰(zhàn)。人們認(rèn)識(shí)到用電腦制作MIDI是將來(lái)的趨勢(shì),于是出現(xiàn)了一系列適合為電腦配套的合成器,它們省去了音序器,音序任務(wù)由軟件完成,合成器只提供鍵盤(pán)和音色,這就降低了合成器的成本。又由于獨(dú)立的硬件音源和采樣技術(shù)的普及,人們覺(jué)得合成器的音色也是多余的,因?yàn)楠?dú)立音源可以提供更好的音色,于是不帶音序器和音色的MIDI控制鍵盤(pán)也隨即產(chǎn)生,這類(lèi)鍵盤(pán)有較強(qiáng)的控制功能,音色用音源的,音序器用軟件的,可謂是專(zhuān)物專(zhuān)用,而且只要添加音源或采樣器就可以得到更多的音色,更換音序軟件就可以使用更強(qiáng)的功能。
第97頁(yè),共125頁(yè),2023年,2月20日,星期日音源
由于音樂(lè)最終要以聲音的形式表現(xiàn)出來(lái),所以做為電腦音樂(lè)系統(tǒng)中產(chǎn)生聲音的設(shè)備,音源音色的數(shù)量、品種和質(zhì)量都將對(duì)最終音樂(lè)作品的效果產(chǎn)生重要的影響。音源內(nèi)部有很多不同音色的樣本波形,譬如鋼琴就有鋼琴的音色的真實(shí)樣本,吉它就有吉它的音色真實(shí)樣本(即波表)。但是音源只是一個(gè)資源庫(kù),因?yàn)樗恢涝谑裁磿r(shí)候該用什么音色發(fā)怎樣的聲音。至于何時(shí)調(diào)用資源(使用哪種音色)不是音源的工作,這項(xiàng)任務(wù)是由音序器來(lái)完成的。
音源也分硬件和軟件兩種。硬件音源是現(xiàn)在專(zhuān)業(yè)MIDI制作不可缺少的設(shè)備,因?yàn)樗鼈兛梢蕴峁┍热魏我粔K聲卡上的波表都要好很多的音色,這些獨(dú)立音源基本上是專(zhuān)業(yè)人士使用的,常見(jiàn)的型號(hào)有RolandJV1080和YamahaMU100R等。
第98頁(yè),共125頁(yè),2023年,2月20日,星期日
作為一般用戶(hù),可以不需要添置硬件音源設(shè)備,因?yàn)楝F(xiàn)在任何一塊多媒體聲卡上都有一個(gè)128種音色的GM音色庫(kù),即MIDI音源,只不過(guò)質(zhì)量比專(zhuān)用音源設(shè)備差一些。但有些聲卡(如SoundBlasterLive)的音源質(zhì)量較好,可達(dá)到準(zhǔn)專(zhuān)業(yè)級(jí)。
另外,還可以使用軟件音源來(lái)代替。軟件音源也是隨著電腦的高速發(fā)展而產(chǎn)生的,它們也必須安裝在電腦上才能使用。大家熟悉的軟音源有:YamahaS-YXG100,RolandVSC88等,大家平時(shí)俗稱(chēng)它們?yōu)镸IDI播放器,其實(shí)它們就是音源,因?yàn)樗鼈兪翘峁┮羯?。軟音源的產(chǎn)生為MIDI的大眾化作出了很大的貢獻(xiàn),它使人們不需購(gòu)買(mǎi)專(zhuān)門(mén)設(shè)備就可以進(jìn)行MIDI的創(chuàng)作和演奏。
第99頁(yè),共125頁(yè),2023年,2月20日,星期日音序器(Sequencer)
音序器是用來(lái)記錄、編輯和播放MIDI文件的設(shè)備。音序器分硬件和軟件的兩種。最早的是硬件音序器,我們也常稱(chēng)它為“編曲機(jī)”。它可以是一個(gè)獨(dú)立的設(shè)備,也可以?xún)?nèi)置于合成器里。這類(lèi)音序器的編輯和修改必須在它的面板上進(jìn)行,使用是很不方便的。常見(jiàn)的型號(hào)有YamahaQY700等。軟件音序器是安裝在計(jì)算機(jī)中的多功能音樂(lè)創(chuàng)作、編輯軟件,如我們常用的Cakewalk就是一個(gè)軟件音序器。軟件音序器因?yàn)槠滹@示界面擴(kuò)大(使用電腦顯示器),功能增強(qiáng),特別是操作方便獲得了絕大多數(shù)音樂(lè)制作者的認(rèn)可,大有淘汰硬件音序器之勢(shì)。其實(shí)正是由于軟件加入音樂(lè)制作的領(lǐng)域才使MIDI音樂(lè)和電腦聯(lián)系起來(lái),不然制作MIDI音樂(lè)完全用不著電腦。
第100頁(yè),共125頁(yè),2023年,2月20日,星期日
YAMAHAQY700音序器
硬件音源ROLANDJV1080第101頁(yè),共125頁(yè),2023年,2月20日,星期日采樣器
音樂(lè)的表現(xiàn)力是無(wú)限的,因此人們對(duì)于音色的要求也是無(wú)限的。一般的音源均是一種封閉的結(jié)構(gòu),它們的音色都是固定的,提供的數(shù)量和品種都有限,不能滿(mǎn)足制作者對(duì)新的音色的要求。而采樣器則是一種開(kāi)放式的音源,它可以對(duì)任何聲音進(jìn)行取樣,并把它們編輯成音色來(lái)供電腦音樂(lè)系統(tǒng)使用。
使用采樣器可以對(duì)各種音樂(lè)、其他電子樂(lè)器和各種自然界聲響進(jìn)行取樣,或是通過(guò)讀取現(xiàn)成磁盤(pán)來(lái)獲取各種音色。到目前為止,使用采樣器仍然是滿(mǎn)足其對(duì)新增音色的最佳手段。其他設(shè)備
如錄音設(shè)備、監(jiān)聽(tīng)設(shè)備、音箱功放等,這里不加贅述。
第102頁(yè),共125頁(yè),2023年,2月20日,星期日2.6.3MIDI的工作過(guò)程
MIDI電子樂(lè)器通過(guò)MIDI接口與計(jì)算機(jī)相連,MIDI靠這個(gè)接口來(lái)傳遞消息而進(jìn)行彼此通信。這樣,計(jì)算機(jī)可通過(guò)音序器軟件來(lái)采集MIDI電子樂(lè)器發(fā)出的一系列消息或指令。這一系列消息可記錄以.MID為擴(kuò)展名的MIDI文件中。在計(jì)算機(jī)上音序器可對(duì)MIDI文件進(jìn)行編輯和修改。最后,將MIDI消息送往音樂(lè)合成器,由合成器將MIDI消息進(jìn)行解釋并產(chǎn)生波形,然后通過(guò)聲音發(fā)生器送往揚(yáng)聲器播放出來(lái)。其過(guò)程如圖4-11所示。第103頁(yè),共125頁(yè),2023年,2月20日,星期日MIDI的工作過(guò)程
理解MIDI工作方式的最直接的方法就是看看MIDI消息是什么。MIDI消息實(shí)際上是對(duì)一段音樂(lè)的描述,或理解成是樂(lè)譜的數(shù)字描述。它包括音符、節(jié)拍、樂(lè)器種類(lèi)等。MIDI消息包括兩個(gè)大的部分:狀態(tài)信息和數(shù)據(jù)信息。狀態(tài)信息用于描述音符被演奏還是聲音被加強(qiáng)這樣的信息,而數(shù)據(jù)信息則重點(diǎn)描述哪個(gè)音符被演奏了,或被加強(qiáng)的聲音的強(qiáng)度如何等可以用量來(lái)表示的信息。例如,你在一個(gè)具有MIDI功能的電子琴上按下了一個(gè)鍵時(shí),電子琴便產(chǎn)生了一個(gè)MIDI信息,通過(guò)MIDI接口傳送出去。這個(gè)信息就包含了狀態(tài)信息及數(shù)據(jù)信息兩部分。信息的前一部分用于描述你做了什么,這里你按了一個(gè)鍵,產(chǎn)生了一個(gè)音符。信息的后一部分描述哪一個(gè)鍵被按下了。
第104頁(yè),共125頁(yè),2023年,2月20日,星期日2.6.4FM與波表合成方式
合成器是利用數(shù)字信號(hào)處理器DSP或其他芯片來(lái)產(chǎn)生音樂(lè)或聲音的電子裝置。利用合成器產(chǎn)生MIDI樂(lè)音的主要方法是FM合成法和波表合成法。FM合成法
FM合成法是80年代初由美國(guó)斯坦福大學(xué)的JohnChowning發(fā)明的,稱(chēng)為“數(shù)字式頻率調(diào)制合成法”,簡(jiǎn)稱(chēng)FM合成法。FM合成法生成樂(lè)音的基本原理是,用數(shù)字信號(hào)來(lái)表示不同樂(lè)音的波形,然后把它們組合起來(lái),再通過(guò)數(shù)模轉(zhuǎn)換器(DAC)生成樂(lè)音播放。第105頁(yè),共125頁(yè),2023年,2月20日,星期日波表合成法
使用FM合成法來(lái)產(chǎn)生各種逼真的樂(lè)音是相當(dāng)困難的,有些樂(lè)音幾乎不能產(chǎn)生。為子能真實(shí)地再現(xiàn)樂(lè)音,目前的聲卡一般采用樂(lè)音樣
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 運(yùn)球急起急停 教學(xué)設(shè)計(jì)-2023-2024學(xué)年初中體育與健康實(shí)踐課教學(xué)設(shè)計(jì)001
- 加強(qiáng)區(qū)域市場(chǎng)拓展的工作計(jì)劃
- 班級(jí)結(jié)合時(shí)代發(fā)展的新思考計(jì)劃
- 專(zhuān)題探究與實(shí)踐活動(dòng)安排計(jì)劃
- 《生物技術(shù)制藥》課程教學(xué)大綱
- 《光電高分子材料》課程教學(xué)大綱
- 項(xiàng)目匯報(bào)模板計(jì)劃
- 中國(guó)銀行保險(xiǎn)綜合金融服務(wù)創(chuàng)新
- 以宇航員的視角深入講解天文事件事故解析案例
- 第5課時(shí) 倍數(shù)問(wèn)題 (教學(xué)設(shè)計(jì))-2024-2025學(xué)年五年級(jí)上冊(cè)數(shù)學(xué)冀教版
- 2022年江西科技職業(yè)學(xué)院?jiǎn)握芯C合素質(zhì)考試筆試試題及答案解析
- 季節(jié)性施工專(zhuān)項(xiàng)施工方案(常用)
- 傷口(壓瘡)的評(píng)估與記錄
- 煤礦機(jī)電運(yùn)輸類(lèi)臺(tái)賬(各種記錄匯編)
- 風(fēng)電場(chǎng)道路及平臺(tái)施工組織方案
- 風(fēng)險(xiǎn)分級(jí)管控74411ppt課件(PPT 146頁(yè))
- 《道德與法治》五年級(jí)下冊(cè)全冊(cè)教案
- 三八女神節(jié)活動(dòng)策劃PPT課件
- 畢業(yè)設(shè)計(jì)(論文)3000t自由鍛液壓機(jī)本體設(shè)計(jì)
- 風(fēng)力發(fā)電機(jī)組PLC系統(tǒng)
- Q∕GDW 12131-2021 干擾源用戶(hù)接入電網(wǎng)電能質(zhì)量評(píng)估技術(shù)規(guī)范
評(píng)論
0/150
提交評(píng)論