版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、1 音頻信號處理技術(shù) 1 . 音頻的數(shù)字化處理 2 . 音頻處理技術(shù) 3 . 語音合成與識別技術(shù) 4 . MATLAB 與 音頻處理2音頻的數(shù)字化*3波形音頻的數(shù)字化過程麥克風(fēng)麥克風(fēng)/錄音機(jī)錄音機(jī)/CD激光唱盤激光唱盤聲卡聲卡A/D轉(zhuǎn)換轉(zhuǎn)換(采樣、量化采樣、量化)聲卡聲卡D/A轉(zhuǎn)換轉(zhuǎn)換混音器混合后由混音器混合后由揚(yáng)聲器輸出揚(yáng)聲器輸出計(jì)算機(jī)存儲計(jì)算機(jī)存儲*4 采樣頻率:每秒從模擬聲波中采集聲音樣本的個(gè)數(shù)。 頻率越高,采集的樣本數(shù)越多,聲音質(zhì)量越好,占用存儲空間越大。 人耳感受范圍:020kHz 一般采用:11.025kHz、22.05kHz、44.1kHz n對原始聲波采樣對原始聲波采樣n采樣后
2、得到的數(shù)據(jù)采樣后得到的數(shù)據(jù)*5 量化位數(shù):將采樣數(shù)據(jù)按大小存儲的過程。 一般有8、16、32位等,量化位數(shù)越大,聲音的幅度分辨率越高,還原時(shí)聲音的品質(zhì)越好,聲音數(shù)據(jù)占用的存儲空間越大*6 聲道數(shù):數(shù)字音頻聲音質(zhì)量的另一個(gè)因素。 一般有單聲道 、雙聲道、多聲道 存儲量計(jì)算:采樣頻率量化位數(shù)聲道數(shù)時(shí)間8 (字節(jié))舉例:采樣頻率44.1kHz,16位量化,雙聲道,一分鐘的音頻所需要的存儲量為:44.1100016260/8=10584000(字節(jié))*7音頻的格式1. WAV格式:Windows標(biāo)準(zhǔn)波形文件,多數(shù)音頻編輯軟件支持,文件較大。2. MP3格式:高壓縮比,文件較小,音質(zhì)接近CD。3. MI
3、DI文件:存儲指令,文件短小,播放效果因軟硬件而異。4. CD格式:音質(zhì)最好的數(shù)字音頻格式,CDA文件只含索引信息。5. RealAudio格式:適用網(wǎng)上在線音樂欣賞,可隨帶寬不同改變音質(zhì)。6. WMA格式:音質(zhì)強(qiáng)于MP3,內(nèi)置版權(quán)保護(hù)技術(shù),支持音頻流技術(shù)。8音頻處理技術(shù)9錄音n錄制從麥克風(fēng)輸入的聲音n錄制計(jì)算機(jī)中其他播放器通過聲卡播放的聲音聲音的編輯n剪裁波形n刪除波形n復(fù)制、粘貼波形n混音聲音的特效處理n調(diào)整音量n調(diào)整播放時(shí)間和播放速度n添加回聲n音樂淡入淡出效果n消除音樂中的靜音段*10語音合成與識別 *11語音合成與識別 一、語音合成技術(shù)n方法:語音合成方法、參數(shù)合成方法 n目標(biāo):可懂
4、、清晰、自然、具有表現(xiàn)力 n應(yīng)用:文語轉(zhuǎn)換(TTS)二、語音識別技術(shù) nViaVoice中文連續(xù)語音識別系統(tǒng)輸入速度:150漢字/分 識別率:95%n發(fā)展方向:n自然話語識別與理解n解決語音識別中的一系列難題應(yīng)用MATLAB 處理音頻信號的流程 音量標(biāo)準(zhǔn)化 :錄制聲音過程中需對聲音電平進(jìn)行量化處理 最理想的量化是最大電平對應(yīng)最高量化比特 但實(shí)際卻很難做到 常有音輕問題 利用 MATLAB 很容易實(shí)現(xiàn)音量標(biāo)準(zhǔn)化 即最大電平對應(yīng)最高量化比特 基本步驟是 先用 wavread 函數(shù)將 WAV 文件轉(zhuǎn)換成列數(shù)組變量 再求出數(shù)組變量的極值并對所有元素作歸一化處理 最后用 wavwrite 函數(shù)還原成音量
5、標(biāo)準(zhǔn)化的 WAV 文件聲道分離合并與組合:立體聲或雙聲道音頻信號有左右兩個(gè)聲道 利用 MATLAB 實(shí)現(xiàn)雙聲道分離 兩路聲道合并和兩個(gè)單聲道組合成一個(gè)雙聲道等效果 實(shí)際上是利用了MATLAB 的矩陣抽取 矩陣相加和矩陣重組運(yùn)算數(shù)字濾波 數(shù)字濾波是常用的音頻處理技術(shù) 可根據(jù)技術(shù)指標(biāo) 先利用 FDATool 工具 設(shè)計(jì)一個(gè)數(shù)字濾波器2 再用 Filter 或 Filter2 函數(shù)即可實(shí)現(xiàn)濾波處理 調(diào)用的 Filter 函數(shù)格式是 Y = filte (B,A,X) 其中 B 和 A 是濾波器傳輸函數(shù)的分子和分母系數(shù) X 是輸入變量 Y是實(shí)現(xiàn)濾波后的輸出變量 如果處理立體聲音頻信號 可分開處理 但用 FIR 濾波器時(shí)調(diào)用 Filter2 函數(shù)更方便數(shù)據(jù)轉(zhuǎn)換 數(shù)據(jù)轉(zhuǎn)換是指改變音頻格式中的采樣頻率或量化位數(shù) 轉(zhuǎn)換原理是 先用矩陣插值或抽取技術(shù)實(shí)現(xiàn)變量變換 如果是抽取數(shù)據(jù)還需在變換前作濾波處理使之滿足采樣定理 變量變換完成后再用 Wavwrite 函數(shù)重新定義量化位數(shù)和采樣頻率即可實(shí)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年婚禮化妝造型合同
- 2024大數(shù)據(jù)中心存儲設(shè)備采購合同
- 2024年度分包合作協(xié)議書
- 中考狀語課件教學(xué)課件
- 2024年度版權(quán)返租及授權(quán)使用協(xié)議
- 2024年國際皮毛市場交易合同
- 鄉(xiāng)鎮(zhèn)防汛抗旱救災(zāi)的應(yīng)急預(yù)案(5篇)
- (2024版)灑水車團(tuán)隊(duì)租賃合同(2024版)
- 2024年度軟件許可及技術(shù)支持服務(wù)合同
- 2024年度互聯(lián)網(wǎng)金融服務(wù)平臺合作協(xié)議
- 第十三章醫(yī)療服務(wù)管理課件
- 工程質(zhì)保期滿驗(yàn)收報(bào)告模板
- 高考地理復(fù)習(xí):過程類推理綜合題解析-以地貌景觀題為例
- 初中語文閱讀專題教學(xué)課件
- 膠質(zhì)瘤的綜合治療課件
- 孟子三章課件
- 關(guān)于鋼結(jié)構(gòu)高強(qiáng)度螺栓連接技術(shù)(PPT,2022)
- 互聯(lián)網(wǎng)發(fā)展歷程課件
- 教育科研征文
- CT增強(qiáng)檢查及風(fēng)險(xiǎn)知情同意書
- 環(huán)境保護(hù)與水土保持檢查表
評論
0/150
提交評論