多媒體技術(shù)及應(yīng)用數(shù)字音頻技術(shù)_第1頁(yè)
多媒體技術(shù)及應(yīng)用數(shù)字音頻技術(shù)_第2頁(yè)
多媒體技術(shù)及應(yīng)用數(shù)字音頻技術(shù)_第3頁(yè)
多媒體技術(shù)及應(yīng)用數(shù)字音頻技術(shù)_第4頁(yè)
多媒體技術(shù)及應(yīng)用數(shù)字音頻技術(shù)_第5頁(yè)
已閱讀5頁(yè),還剩56頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第二章數(shù)字音頻技術(shù)第二章數(shù)字音頻技術(shù)2.1數(shù)字音頻基礎(chǔ)2.2數(shù)字音頻壓縮標(biāo)準(zhǔn)2.3聲卡與電聲設(shè)備2.4MIDI與音樂(lè)合成2.5音頻編輯軟件2.6語(yǔ)音識(shí)別技術(shù)本章小結(jié)2-3一、聲音的基本概念

聲音是通過(guò)一定介質(zhì)傳播的連續(xù)的波。t振幅周期A聲波振幅:音量的大小周期:重復(fù)出現(xiàn)的時(shí)間間隔頻率:指信號(hào)每秒鐘變化的次數(shù)重要指標(biāo)2.1數(shù)字音頻基礎(chǔ)2-4聲音按頻率分類(lèi):次聲波可聽(tīng)聲波超聲波20Hz20kHzf(Hz)語(yǔ)音信號(hào)頻率范圍:300Hz-3kHz2.1數(shù)字音頻基礎(chǔ)1020502003.4k7k15k20kCD-DAFM廣播AM廣播電話f(Hz)頻帶聲音質(zhì)量的頻率范圍:2-5聲音的傳播攜帶了信息,它是人類(lèi)傳播信息的一種主要媒體。

聲音的三種類(lèi)型:

波形聲音:包含了所有聲音形式

語(yǔ)音:不僅是波形聲音,而且還有豐富的語(yǔ)言內(nèi)涵(抽象→提取特征→意義理解)

音樂(lè):與語(yǔ)音相比,形式更規(guī)范。音樂(lè)是符號(hào)化的聲音。2.1數(shù)字音頻基礎(chǔ)2-6二、聲音的數(shù)字化

1.聲音信號(hào)的類(lèi)型模擬信號(hào)(自然界、物理)數(shù)字信號(hào)(計(jì)算機(jī))

2.聲音數(shù)字化過(guò)程采樣量化編碼模擬信號(hào)數(shù)字信號(hào)模擬信號(hào)數(shù)字信號(hào)A/DADCD/ADAC2.1數(shù)字音頻基礎(chǔ)2-73.聲音數(shù)字化過(guò)程連續(xù)的模擬聲音信號(hào)聲音信號(hào)的采樣離散的音頻信號(hào)示意2.1數(shù)字音頻基礎(chǔ)2-84.聲音數(shù)字化三要素采樣頻率量化位數(shù)聲道數(shù)每秒鐘抽取聲波幅度樣本的次數(shù)每個(gè)采樣點(diǎn)用多少二進(jìn)制位表示數(shù)據(jù)范圍使用聲音通道的個(gè)數(shù)采樣頻率越高聲音質(zhì)量越好數(shù)據(jù)量也越大量化位數(shù)越多音質(zhì)越好數(shù)據(jù)量也越大立體聲比單聲道的表現(xiàn)力豐富,但數(shù)據(jù)量翻倍11.025kHz22.05kHz44.1kHz8位=25616位=65536單聲道立體聲2.1數(shù)字音頻基礎(chǔ)2-9

5.聲音數(shù)字化的數(shù)據(jù)量音頻數(shù)據(jù)量=采樣頻率×量化位數(shù)

×聲道數(shù)/8(字節(jié)/秒)采樣頻率(kHz)量化位數(shù)(bit)數(shù)據(jù)量(KB/s)單聲道立體聲11.025810.7721.531621.5343.0722.05821.5343.071643.0786.1344.1843.0786.131686.13172.272.1數(shù)字音頻基礎(chǔ)2-10三、、音音頻頻的的文文件件格格式式1.WAV文件件WAV是Microsoft/IBM共同同開(kāi)開(kāi)發(fā)發(fā)的的PC波形形文文件件。。因因未未經(jīng)經(jīng)壓壓縮縮,,文文件件數(shù)數(shù)據(jù)據(jù)量量很很大大。。特點(diǎn)點(diǎn):聲聲音音層層次次豐豐富富,,還還原原音音質(zhì)質(zhì)好好2.1數(shù)數(shù)字字音音頻頻基基礎(chǔ)礎(chǔ)2.MP3文件件MP3(MPEGAudiolayer3)是一一種種按按MPEG標(biāo)準(zhǔn)準(zhǔn)的的音音頻頻壓壓縮縮技技術(shù)術(shù)制制作作的的音音頻頻文文件件。。特點(diǎn)點(diǎn):高高壓壓縮縮比比(11:1),,優(yōu)優(yōu)美美音音質(zhì)質(zhì)2-113.RA文件件RA(RealAudio,即即時(shí)時(shí)播播音音系系統(tǒng)統(tǒng)))新新型型流流式式音音頻頻,,RA、RM、RMX。特點(diǎn)點(diǎn):在在低低速速的的廣廣域域網(wǎng)網(wǎng)上上實(shí)實(shí)時(shí)時(shí)傳傳輸輸音音頻頻4.WMA文件件WMA(WindowsMediaAudio)是WindowsMedia格式式中中的的一一個(gè)個(gè)子子集集(音音頻頻格格式式)。。特點(diǎn)點(diǎn):壓壓縮縮到到MP3一半半2.1數(shù)數(shù)字字音音頻頻基基礎(chǔ)礎(chǔ)2-125.MIDI和RMI文件件MIDI(樂(lè)器器數(shù)數(shù)字字接接口口)是是由由一一組組音音樂(lè)樂(lè)、、樂(lè)樂(lè)譜譜或或樂(lè)樂(lè)器器符符號(hào)號(hào)的的數(shù)數(shù)字字集集合合。。特點(diǎn):播放放效果果與硬硬件相相關(guān),,數(shù)據(jù)據(jù)量很很小,,音質(zhì)質(zhì)不高高、音音色單單調(diào)等等6.VOC文件創(chuàng)新公公司開(kāi)開(kāi)發(fā)的的聲音音文件件格式式,由由文件件頭塊塊和音音頻數(shù)數(shù)據(jù)塊塊組成成。2.1數(shù)數(shù)字音音頻基基礎(chǔ)2-13四、音音頻的的采集集與處處理1.聲聲音的的采集集錄音軟軟件專業(yè)錄錄音棚棚唱盤(pán)活活錄音音帶轉(zhuǎn)轉(zhuǎn)錄數(shù)字音音頻庫(kù)庫(kù)2.1數(shù)數(shù)字音頻基基礎(chǔ)2.聲音的的處理剪接、降噪噪、均衡、、效果、動(dòng)動(dòng)態(tài)處理、、格式轉(zhuǎn)換換。2-142.2數(shù)數(shù)字音頻壓壓縮標(biāo)準(zhǔn)一、音頻壓壓縮方法概概述編碼器傳輸/存儲(chǔ)解碼器輸入音頻信號(hào)輸出音頻信號(hào)壓縮編碼技技術(shù)是指用用某種方法法使數(shù)字化化信息的編編碼率降低低的技術(shù)音頻信號(hào)能能壓縮的基基本依據(jù):聲音信號(hào)中中存在大量量的冗余度度;人的聽(tīng)覺(jué)具具有強(qiáng)音抑抑制弱音的的現(xiàn)象;低頻段敏感感、高頻段段不敏感。。2-15音頻信號(hào)壓壓縮編碼的的分類(lèi):①無(wú)損壓縮縮(熵編碼)霍夫曼編碼碼、算術(shù)編編碼、行程程編碼②有損壓縮縮波形編碼--PCM、DPCM、ADPCM子帶編碼、、矢量量化化參數(shù)編碼--LPC混合編碼--MPLPC、CELP2.2數(shù)數(shù)字音頻壓壓縮標(biāo)準(zhǔn)2-162.2數(shù)數(shù)字音頻壓壓縮標(biāo)準(zhǔn)二、音頻壓壓縮技術(shù)標(biāo)標(biāo)準(zhǔn)分類(lèi)標(biāo)準(zhǔn)說(shuō)明電話語(yǔ)音質(zhì)量G.711采樣8kHz,量化8bit,碼率64kbpsG.721采用ADPCM編碼,碼率32kbpsG.723采用ADPCM有損壓縮,碼率24kbpsG.728采用LD-CELP壓縮技術(shù),碼率16kbps調(diào)幅廣播質(zhì)量G.722采樣16kHz,量化14bit,碼率224(64)kbps高保真立體聲MPEG音頻采樣44.1kHz,量化16bit,碼率705kbps(MPEG三個(gè)壓縮層次,384-64kbps)2-172.2數(shù)數(shù)字音音頻壓縮縮標(biāo)準(zhǔn)三、音頻頻壓縮工工具音頻文件件轉(zhuǎn)換::AudioConverter、另存為為MP3壓縮工具具:MP3Resizer2-182.3聲聲卡與與音箱一、聲卡卡(聲音音卡、音音頻卡)1.聲卡卡的主要要功能聲卡是負(fù)負(fù)責(zé)錄音音、播音音和聲音音合成的的一種多多媒體板板卡。其其功能包包括:錄制、編輯和和回放數(shù)字音音頻文件控制和混合各各聲源的音量量記錄和回放時(shí)時(shí)進(jìn)行壓縮和和解壓縮語(yǔ)音合成技術(shù)術(shù)(朗讀文本本)語(yǔ)音識(shí)別技術(shù)術(shù)具有MIDI接口(樂(lè)器數(shù)數(shù)字接口)2-192.聲卡的組組成原理線性輸出總線接口芯片數(shù)字音頻處理芯片音樂(lè)合成器A/D和D/AMIDI接口混音器CD接口計(jì)算機(jī)總線話筒輸入線性輸入揚(yáng)聲器輸出A/D數(shù)據(jù)處理D/A聲波喇叭2.3聲卡卡與音箱2-203.聲卡的性性能指標(biāo)⑴采樣和量化化能力衡量音響器材材音質(zhì)好壞。。采樣頻率:11.025kHz(語(yǔ)音效果)22.05kHz(音樂(lè)效果)44.1kHz(高保真效果)量化等級(jí):8位/256級(jí)(語(yǔ)音質(zhì)量量)16位/65536級(jí)(高保真真質(zhì)量)2.3聲卡卡與音箱2-21⑵芯片類(lèi)型CODEC芯片(依賴CPU,價(jià)格便宜)數(shù)字信號(hào)處理理器DSP(不依賴CPU)⑶總線類(lèi)型ISA總線、PCI總線、USB接口⑷輸出聲道數(shù)數(shù)2聲道(立體體聲)、2.1/4.1/5.1聲聲道多通道聲卡(營(yíng)造杜比環(huán)環(huán)繞立體聲)2.3聲卡卡與音箱2-224.聲卡的外外部接口2.3聲卡卡與音箱2-232.3聲卡卡與音箱線性輸入接口LineIn用來(lái)連接外部音頻設(shè)備以便進(jìn)行錄音,如錄音機(jī)、CD唱機(jī)和音響等話筒輸入接口MicIn用來(lái)連接話筒,直接輸入現(xiàn)場(chǎng)的聲音信號(hào)線性輸出接口LineOut用來(lái)連接外部音頻設(shè)備的輸入口,也可連接大功率有源音響等揚(yáng)聲器輸入接口/SpkOut用來(lái)連接揚(yáng)聲器,從聲卡的內(nèi)置功率放大器向揚(yáng)聲器輸出聲音游戲桿MIDI接口用來(lái)連接游戲桿或MIDI設(shè)備。CD音頻連接器用來(lái)連接CD-ROM驅(qū)動(dòng)器,可以直接播放CD音樂(lè),而不占用CPU時(shí)間2-24二、電聲設(shè)備備1.傳聲器傳聲器是一種種將聲信號(hào)轉(zhuǎn)轉(zhuǎn)換成相應(yīng)電電信號(hào)的能量量轉(zhuǎn)換器件((話筒、麥克克風(fēng))。傳聲器的分類(lèi)類(lèi):換能原理、聲聲學(xué)原理、指指向性、用途途、使用方式式、有線無(wú)線線2.3聲卡卡與音箱2.3聲卡卡與音箱傳聲器的工作作原理:聲能能(1)電動(dòng)式傳傳聲器,包包括動(dòng)圈式式傳聲器和和帶式傳聲聲器兩種,,電磁換能能原理。優(yōu)點(diǎn):簡(jiǎn)單方便便、無(wú)需放放大器、性性能穩(wěn)定、、價(jià)格低廉廉(2)電容式傳傳聲器,振振膜震動(dòng)引引起電容量量變化實(shí)現(xiàn)現(xiàn)換能。優(yōu)點(diǎn):靈敏度高高、動(dòng)態(tài)范范圍大、瞬瞬態(tài)特性好好、失真度度低缺點(diǎn):振膜受潮潮會(huì)導(dǎo)致變變形2.3聲聲卡與音箱箱(3)駐極體式式傳聲器,,利用駐極極體材料制制作的電容容傳聲器。。優(yōu)點(diǎn):簡(jiǎn)單、體體積小、耐耐振動(dòng)、價(jià)價(jià)格低(4)無(wú)線傳聲聲器,聲音音信號(hào)轉(zhuǎn)變變?yōu)殡娦盘?hào)號(hào),形成超超高頻信號(hào)號(hào)。無(wú)線傳聲器器不是指?jìng)鱾髀暺鞯慕Y(jié)結(jié)構(gòu)原理,,而是指信信號(hào)的傳輸輸方法。優(yōu)點(diǎn):可隨身攜攜帶、無(wú)需需電纜缺點(diǎn):時(shí)遠(yuǎn)時(shí)近近,影響拾拾音效果2.3聲聲卡與音箱箱傳聲器的性性能指標(biāo):(1)靈敏度,,傳聲器的的聲電轉(zhuǎn)換換效率。動(dòng)圈式:-60~-70dB;電容式::-40~-50dB(2)頻率響應(yīng)應(yīng),輸出電電平與頻率率的關(guān)系。。(3)指向性,,某頻率下下聲波入射射方向?qū)?yīng)應(yīng)靈敏度的的變化特性性。(4)輸出阻抗抗,兩根輸輸出線之間間在1kHZ時(shí)的阻抗。。(5)動(dòng)態(tài)閾,,規(guī)定諧波波失真條件件下,傳聲聲器承受最最大壓級(jí)與與安靜時(shí)等等效噪聲級(jí)級(jí)之差。2-282.揚(yáng)聲器將電信號(hào)轉(zhuǎn)轉(zhuǎn)換成聲音音信號(hào)的電電聲器件。。(1)磁路系統(tǒng)統(tǒng),磁鐵、、導(dǎo)磁板、、心柱(2)振動(dòng)系統(tǒng)統(tǒng),紙盆、、音圈(3)輔助系統(tǒng)統(tǒng),紙架、、鐵架、防防塵蓋電流→音圈→磁力振動(dòng)→紙盆振動(dòng)→聲音2.3聲聲卡與音箱箱2.3聲聲卡與音箱箱揚(yáng)聲器的分分類(lèi):(1)按工作原原理分類(lèi),,電動(dòng)式、、電磁式、、靜電式、、壓電式等等。(2)按放聲頻頻率分類(lèi),,低音、中中音、高音音、全頻帶帶等。性能指標(biāo):輸出功率、、頻率特性性、信噪比比、諧波失失真、靈敏敏度和額定定阻抗。2-303.音箱音箱是一種種電聲轉(zhuǎn)換換的發(fā)音設(shè)設(shè)備。將高、中、、低音揚(yáng)聲聲器組裝在在專門(mén)設(shè)計(jì)計(jì)的箱體內(nèi)內(nèi),經(jīng)過(guò)分分頻網(wǎng)絡(luò)將將高、中、、低頻信號(hào)號(hào)分別送至至相應(yīng)的揚(yáng)揚(yáng)聲器進(jìn)行行重放。2.3聲聲卡與音箱箱音箱是揚(yáng)聲聲器系統(tǒng)2-31音箱的分類(lèi)類(lèi):使用場(chǎng)合::家用音箱箱、專用音音箱功率放大器器:有源音音箱、無(wú)源源音箱聲道:2.0→雙聲聲道立體聲聲2.1→雙雙聲道+超超重低音聲聲道4.1/5.1/7.15.1→五五聲道+超超重低音聲聲道2.3聲聲卡與音箱箱2-32音箱的性能能指標(biāo):(1)輸出功率率:額定、、最大峰值值。(2)頻率范圍圍:指音箱箱最低有效效回放頻率率和最高有有效回放頻頻率之間的的范圍。(3)信噪比::音箱回放放的有效信信號(hào)與噪聲聲信號(hào)的比比值。信噪噪比較低時(shí)時(shí),噪聲嚴(yán)嚴(yán)重。信噪比=70-80dB→普通音箱信噪比=80-90dB→高檔音箱信噪比>95dB→專業(yè)音箱箱2.3聲聲卡與音箱箱2.3聲聲卡與音箱箱(4)失真度::諧波失真真、互調(diào)失失真、瞬態(tài)態(tài)失真。其中,瞬態(tài)態(tài)失真直接接影響到音音質(zhì)音色還還原程度。。(5)靈敏度::指音箱產(chǎn)產(chǎn)生全功率率輸出時(shí)的的輸入信號(hào)號(hào)。輸入信號(hào)越越低,靈敏敏度越高,,性能越好好(6)阻抗:揚(yáng)揚(yáng)聲器輸入入信號(hào)的電電壓與電流流比值。高高阻抗、低低阻抗。2-342.4MIDI與音音樂(lè)樂(lè)合合成成一、、MIDI技術(shù)術(shù)概概述述1.什什么么是是MIDIMIDI(MusicalInstrumentDigitalInterface,樂(lè)樂(lè)器器數(shù)數(shù)字字接接口口)是一一種種利利用用合合成成器器產(chǎn)產(chǎn)生生的的音音樂(lè)樂(lè)技技術(shù)術(shù)。。采用用數(shù)數(shù)字字信信號(hào)號(hào)處處理理技技術(shù)術(shù)合合成成的的音音效效:①模仿仿鋼琴琴、小小提琴琴、吉吉他等等音色色②超越越時(shí)空空的太太空音音樂(lè)2-352.MIDI標(biāo)準(zhǔn)MIDI是各種種電子子音樂(lè)樂(lè)設(shè)備備之間間以及及與計(jì)計(jì)算機(jī)機(jī)之間間交換換信息息的國(guó)國(guó)際標(biāo)標(biāo)準(zhǔn)。。MIDI硬件規(guī)規(guī)范:硬件件接口口標(biāo)準(zhǔn)準(zhǔn)和信信號(hào)傳傳輸機(jī)機(jī)制(I/O通道、、連接接電纜纜和插插座形形式)。MIDI軟件規(guī)規(guī)范:音樂(lè)樂(lè)信息息數(shù)字字化編編碼方方式(音符符、音音符長(zhǎng)長(zhǎng)短、、音調(diào)調(diào)和音音量等等)。。原聲鋼琴8分音符的C3音:000060音色Piano編號(hào)音符C3編號(hào)8分音符編號(hào)2.4MIDI與音樂(lè)樂(lè)合成成2-36二、MIDI合成方方式1.調(diào)調(diào)頻合合成法法--FM原理:MIDI合成器器接收收到MIDI音樂(lè)信信息后后,利利用傅立葉葉級(jí)數(shù)數(shù)原理將將其分分解為為若干干個(gè)不不同頻頻率的的正弦弦波,,然后后生成成MIDI音樂(lè)信信息中中指定定樂(lè)器器的各各個(gè)正正弦波波分量量,最最后將將這些些分量量合成成起來(lái)來(lái)送至至揚(yáng)聲聲器播播放。。特點(diǎn):①系系統(tǒng)開(kāi)開(kāi)銷(xiāo)小小,聲聲音清清脆②聲音音音色色少,,音質(zhì)質(zhì)較差差2.4MIDI與音樂(lè)樂(lè)合成成2-372.波波形表表合成成法--WT原理:在MIDI合成器器的ROM中預(yù)先先存放放各種種實(shí)際際樂(lè)器器的聲音樣樣本,在進(jìn)進(jìn)行音音樂(lè)合合成時(shí)時(shí)以查查表的的方式式調(diào)用用這些些樣本本,使使其與與MIDI音樂(lè)信信息的的要求求完全全相配配,然然后合合成器器將這這些分分段合合成的的樣本本送至至揚(yáng)聲聲器播播放。。特點(diǎn):①音音樂(lè)真真實(shí)感感強(qiáng),,音色色自然然②硬波波形表表,軟軟波形形表。。2.4MIDI與音樂(lè)樂(lè)合成成2-38三、MIDI的工作作過(guò)程程MIDI輸入設(shè)備MIDI接口MIDI文件音序器合成器揚(yáng)聲器音頻卡PC機(jī)音序器器是MIDI音樂(lè)創(chuàng)作的的核心心控制制部件件。2.4MIDI與音樂(lè)樂(lè)合成成2-39四、音音樂(lè)制制作系系統(tǒng)1.基基本設(shè)設(shè)備音源:聲卡卡(模模擬樂(lè)樂(lè)器發(fā)發(fā)聲的的設(shè)備備)音序器器:硬件件音序序器、、軟件件音序序器Cakewalk,LogicAudio輸入設(shè)設(shè)備:電子子琴(MIDIIn,MIDIOut)MIDI鍵盤(pán)(省去去音源源)Cakewalk虛擬鍵鍵盤(pán)2.4MIDI與音樂(lè)樂(lè)合成成2-402.音音樂(lè)軟軟件分分類(lèi)音序軟軟件:Cakewalk、MusicatorWin3、LogicAudio、CubaseVST樂(lè)譜打打印軟軟件:MIDIScan、Encore音樂(lè)教教育軟軟件:Earnaster、Tonica音頻編輯軟軟件:CoolEdit、Audition、SoundForge、wavelab效果器軟件件:TCNative、VST2.4MIDI與音樂(lè)合成成2-412.6語(yǔ)語(yǔ)音識(shí)別技技術(shù)語(yǔ)音識(shí)別:利用計(jì)算算機(jī)自動(dòng)識(shí)識(shí)別語(yǔ)音的的技術(shù)。如如①將語(yǔ)音音轉(zhuǎn)換成其其所對(duì)應(yīng)的的文字,②②利用語(yǔ)音音信號(hào)中所所包含的特特定人的信信息進(jìn)行說(shuō)說(shuō)話人身份份辨認(rèn)的說(shuō)說(shuō)話人識(shí)別別技術(shù)。一、語(yǔ)音識(shí)識(shí)別的發(fā)展展歷史1952:Bell實(shí)驗(yàn)室研制制出可識(shí)別別10個(gè)英文數(shù)字字的語(yǔ)音識(shí)識(shí)別器(Audry系統(tǒng))。1988:卡內(nèi)基·梅隆大學(xué)研研制SPHINX識(shí)別系統(tǒng)(非特定人、、大詞匯量量、連續(xù)語(yǔ)語(yǔ)音)。2-42二、語(yǔ)音識(shí)識(shí)別基本原原理語(yǔ)音識(shí)別本本質(zhì)上是一一種模式識(shí)識(shí)別過(guò)程,,主要包括括語(yǔ)音信號(hào)號(hào)預(yù)處理、、特征提取取、特征建建模(建立參考模模式庫(kù))、相似性度度量(模式匹配)和后處理等等幾個(gè)功能能模塊。2.6語(yǔ)語(yǔ)音識(shí)別技技術(shù)2-43三、語(yǔ)音識(shí)識(shí)別系統(tǒng)的的分類(lèi)1.根據(jù)詞詞匯量大小小小詞匯量:<100詞中詞匯量:100-1000詞大詞匯量:1000詞以上2.根據(jù)對(duì)對(duì)說(shuō)話人依依賴程度特定人:針對(duì)某個(gè)個(gè)用戶進(jìn)行行識(shí)別工作作非特定人:針對(duì)任何何人進(jìn)行識(shí)識(shí)別工作限定人:針對(duì)特定定一組人進(jìn)進(jìn)行識(shí)別工工作2.6語(yǔ)語(yǔ)音識(shí)別技技術(shù)2-443.根據(jù)對(duì)對(duì)說(shuō)話人說(shuō)說(shuō)話方式孤立詞識(shí)別別:每次只含含詞匯表中中的一個(gè)詞詞條,如一一個(gè)詞、一一個(gè)詞組或或一條命令令。連接詞識(shí)別別:每次說(shuō)詞詞匯表中若若干個(gè)詞條條來(lái)進(jìn)行識(shí)識(shí)別,該若若干詞條以以慢速連續(xù)續(xù)的方式連連續(xù)說(shuō)出,,一般指十十個(gè)數(shù)字連連接而成的的多位數(shù)字字的識(shí)別。。連續(xù)語(yǔ)音識(shí)識(shí)別:指說(shuō)話人人以日常自自然的方式式講述并進(jìn)進(jìn)行識(shí)別。。2.6語(yǔ)語(yǔ)音識(shí)別技技術(shù)2-45四、語(yǔ)音識(shí)識(shí)別軟件中文聽(tīng)寫(xiě)語(yǔ)音識(shí)別軟軟件語(yǔ)語(yǔ)音命令語(yǔ)音合成IBMViaVoice8.0中文語(yǔ)音識(shí)識(shí)別系統(tǒng)2.6語(yǔ)語(yǔ)音音識(shí)識(shí)別別技技術(shù)術(shù)2-46五、、文文本本-語(yǔ)音音轉(zhuǎn)轉(zhuǎn)換換技技術(shù)術(shù)基于于聲聲音音合合成成技技術(shù)術(shù)的的聲聲音音產(chǎn)產(chǎn)生生技技術(shù)術(shù)。。能能將將計(jì)計(jì)算算機(jī)機(jī)內(nèi)內(nèi)的的文文本本轉(zhuǎn)轉(zhuǎn)換換成成連連續(xù)續(xù)自自然然的的語(yǔ)語(yǔ)言言流流。。包含含兩兩種種類(lèi)類(lèi)型型::(1)有有效效詞詞匯匯的的計(jì)計(jì)算算機(jī)機(jī)語(yǔ)語(yǔ)音音輸輸出出。。用于于語(yǔ)語(yǔ)音音報(bào)報(bào)時(shí)時(shí)、、汽汽車(chē)車(chē)報(bào)報(bào)站站(2)基基于于語(yǔ)語(yǔ)音音合合成成技技術(shù)術(shù)的的文文本本-語(yǔ)音音轉(zhuǎn)轉(zhuǎn)換換器器TTS。包括括對(duì)對(duì)語(yǔ)語(yǔ)言言的的理理解解和和語(yǔ)語(yǔ)音音的的聲聲韻韻處處理理2.6語(yǔ)語(yǔ)音音識(shí)識(shí)別別技技術(shù)術(shù)2-472.5音頻頻處處理理軟軟件件專業(yè)業(yè)音音樂(lè)樂(lè)軟軟件件音樂(lè)編曲軟件

(音序器)

合成器軟件Cakewalk1.0-9.0→Sonar1.0-4.xCubaseVSI5.x→CubaseSX2.1LogicAudio(PC版、Apple版)(MIDI/音頻/合成器一體化)錄音、混音、

音頻編輯軟件CoolEdit(Syntrillium)Audition(Adobe)GoldWare(GoldWareInc.)效果器軟件效果器插件WavesNativeGoldBundle(20以上)TCNativeBundle(4)UltrafunkSonltusfx(7)2-48一、、Audition概述述1.Audition的發(fā)發(fā)展展歷歷史史1997年syntrillium公司司CoolEditpro1.0、1999年(1.2)、2002年((2.0)2003年Adobe公司司Audition1.0、2004年(1.5)、2006年(2.0)、2007(3.0)2.Audition的主主要要功功能能AdobeAudition3.0是集集聲聲音音錄錄制制、、音音頻頻混混合合和和編編輯輯于于一一體體的的數(shù)數(shù)字字音音頻頻處處理理軟軟件件。。2.5音頻頻處處理理軟軟件件主要要功功能能:錄錄音音、、混混音音、、音音頻頻編編輯輯、、效效果果處處理理、、降降噪噪、、音音頻頻壓壓縮縮、、刻刻錄錄音音樂(lè)樂(lè)CD等2-493.Audition的啟動(dòng)和退出出開(kāi)始/程序/AdobeAudition、圖標(biāo)、啟動(dòng)動(dòng)欄4.Audition的窗口組成2.5音頻處理軟件件2.5音頻處理軟件件(1)標(biāo)題欄:顯顯示應(yīng)用程序序名稱和正在在處理的音頻頻文件名;(2)菜單欄:完完成對(duì)音頻文文件的讀取、、修改、存儲(chǔ)儲(chǔ)和軟件設(shè)置置等;(3)工具欄:編輯視圖:多軌視圖:CD視圖:工作區(qū):2.5音頻處理軟件件(4)“文件”和“效果”列表框:(5)波形顯示區(qū)區(qū):顯示音頻頻文件的波形形(6)控制面板::2.5音頻處理軟件件(7)“電平”指示條:當(dāng)前前音頻電平大大小(8)狀態(tài)欄:狀狀態(tài)信息。5.編輯視圖和多多軌視圖編輯視圖:編編輯獨(dú)立的音音頻文件。多軌視圖:混混合多軌文件件或混合MIDI音樂(lè)及視頻。。采用破壞性編編輯方法采用非破壞性性編輯方法2-53二、音頻的基基本操作1.導(dǎo)入、錄錄音與播放(1)導(dǎo)入:文件/打開(kāi);文件/打開(kāi)視頻中的的音頻2.5音頻處理軟件件2-54(2)錄音:a.文件/新建→新建波形b.錄音按鈕c.錄制→停止2.后期音頻頻剪輯一方面包括復(fù)復(fù)制、剪切和和粘貼,另一一方面能夠選選擇編輯對(duì)象象或范圍。還還包括內(nèi)部剪剪貼板、聲音音混合、刪除除靜音等功能能2.5音頻處理軟件件2-553.后期音效效處理施加效果是音音頻后期處理理的重要環(huán)節(jié)節(jié)。(1)振幅類(lèi)效果果a.增大或減小音量b.實(shí)現(xiàn)音頻淡入、淡出效果果2.5音頻處理軟件件2.5音頻處理軟件件(2)修復(fù)類(lèi)效果果語(yǔ)音停頓的地地方有一種振幅變化化不大的聲音,若貫貫穿于錄制的整個(gè)過(guò)過(guò)程即為環(huán)境噪聲。。(3)延遲類(lèi)效果模擬房間、空空中回聲、隧隧道及立體聲聲遠(yuǎn)處延時(shí)。。2-57三、多軌音頻頻的制作1.多軌音頻頻波形處理多軌視圖可進(jìn)進(jìn)行MIDI音軌、音頻軌軌和視頻軌等等多軌操作。。其中包括導(dǎo)導(dǎo)入、剪輯和和擴(kuò)展、鎖定定、多音頻處處理、合并等等。2.多軌混縮工程程可利用混音器器面板進(jìn)行調(diào)調(diào)節(jié)及效果添添加。包括編輯:通通過(guò)時(shí)間線對(duì)對(duì)音頻片段的的某個(gè)屬性進(jìn)進(jìn)行動(dòng)態(tài)編輯輯,使其在播播放時(shí)隨著時(shí)時(shí)間變化2.5音頻處理軟件件2-58四、環(huán)繞聲場(chǎng)場(chǎng)的制作5.1環(huán)繞聲場(chǎng)包括括前中置、左左前、右前、、左后、右后后和一個(gè)低音音單元。1.設(shè)置環(huán)繞繞聲場(chǎng)導(dǎo)入→環(huán)繞編碼器→設(shè)置正確輸出出通道2.制作環(huán)繞聲場(chǎng)場(chǎng)導(dǎo)入六段音頻頻→環(huán)繞編碼器→選擇音軌→位置定位3.導(dǎo)出環(huán)繞聲場(chǎng)場(chǎng)導(dǎo)出為:獨(dú)立立、復(fù)合型、、格式2.5音頻處理軟件件2-59五、CD音樂(lè)刻錄CD視圖可以整合合CD軌道、設(shè)置軌軌道屬性及刻刻錄CD。2.5音頻處理軟件件2-60本章小結(jié)☆聲音數(shù)字化化,音樂(lè)符號(hào)號(hào)化☆數(shù)字音頻三三要素,聲音音文件格式☆數(shù)字音頻壓壓縮標(biāo)準(zhǔn)音頻壓縮工具具的使用☆聲卡、電聲聲設(shè)備工作原原理及性能指指標(biāo)☆音頻處理軟件件,Audition的使用☆電子音樂(lè)合合成技術(shù)及其其規(guī)范☆語(yǔ)音識(shí)別技技術(shù)9、靜夜四無(wú)鄰鄰,荒居舊業(yè)業(yè)貧。。1月-231月-23Thursday,January5,202310、雨雨中中黃黃葉葉樹(shù)樹(shù),,燈燈下下白白頭頭人人。。。。20:38:0020:38:0020:381/5/20238:38:00PM11、以我獨(dú)沈沈久,愧君君相見(jiàn)頻。。。1月-2320:38:0020:38Jan-2305-Jan-2312、故人江江海別,,幾度隔隔山川。。。20:38:0020:38:0020:38Thursday,January5,202313、乍乍見(jiàn)見(jiàn)翻翻疑疑夢(mèng)夢(mèng),,相相悲悲各各問(wèn)問(wèn)年年。。。。1月月-231月月-2320:38:0020:38:00January5,202314、他鄉(xiāng)生白發(fā)發(fā),舊國(guó)見(jiàn)青青山。。05一月20238:38:00下午20:38:001月-2315、比比不不了了得得就就不不比比,,得得不不到到的的就就不不要要。。。。。一月月238:38下下午午1月月-2320:38January5,202316、行動(dòng)出成果果,工作出財(cái)財(cái)富。。2023/1/520:38:0020:38:0005January202317、做前,能能夠環(huán)視四四周;做時(shí)時(shí),你只能能或者最好好沿著以腳腳為起點(diǎn)的的射線向前前。。8:38:00下下午8:38下下午20:38:001月-239、沒(méi)有失失敗,只只有暫時(shí)時(shí)停止成成功!。。1月-231月-23Thursday,January5,202310、很多事情情努力了未未必有結(jié)果果,但是不不努力卻什什么改變也也沒(méi)有。。。20:38:0020:38:0020:381/5/20238:38:00PM11、成成功功就就是是日日復(fù)復(fù)一一日日那那一一點(diǎn)點(diǎn)點(diǎn)點(diǎn)小小小小努努力力的的積積累累。。。。1月月-2320:38:0020:38Jan-2305-Jan-2312、世間成成事,不不求其絕絕對(duì)圓滿滿,留一一份不足足,可得得無(wú)限完完美。。。20:38:0020:38:0020:3

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論