版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
PPT書籍導(dǎo)讀最新版本讀書筆記模板《智能語音處理》最新版讀書筆記,下載可以直接修改語音模型小結(jié)深度智能參考文獻(xiàn)技術(shù)分析方法神經(jīng)網(wǎng)絡(luò)處理實驗性能矩陣基本概念典型信號網(wǎng)絡(luò)算法本書關(guān)鍵字分析思維導(dǎo)圖01內(nèi)容簡介第1章智能語音處理導(dǎo)論第3章隱變量模型本書編寫組第2章稀疏和壓縮感知第4章組合模型目錄030502040607第5章人工神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)第7章語音增強第6章語音壓縮編碼第8章語音轉(zhuǎn)換目錄0908010011第9章說話人識別第11章智能語音處理展望第10章骨導(dǎo)語音增強縮略語目錄013012014內(nèi)容摘要本書從智能化社會對語音處理提出的新要求出發(fā),按照導(dǎo)論—基礎(chǔ)理論—應(yīng)用實踐的順序,系統(tǒng)地介紹了智能語音處理涉及的基礎(chǔ)理論、基本技術(shù)、主要方法以及典型的智能語音處理應(yīng)用。首先概述了智能語音處理的相關(guān)背景;接著介紹了智能語音處理涉及的基礎(chǔ)理論和相關(guān)技術(shù),包括稀疏和壓縮感知、隱變量模型、組合模型、人工神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí);然后結(jié)合具體算法,介紹了智能語音處理的典型應(yīng)用,包括語音壓縮編碼、語音增強、語音轉(zhuǎn)換、說話人識別、骨導(dǎo)語音增強;最后對智能語音處理的未來發(fā)展進(jìn)行了展望。本書內(nèi)容廣泛,重點突出,既有深入淺出的原理闡述,又有創(chuàng)新科研成果的總結(jié)凝練,理論與實際結(jié)合緊密,可讀性強。本書可以作為高等院校人工智能、電子信息工程、物聯(lián)網(wǎng)工程、數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)、通信工程等專業(yè)高年級本科生以及智能科學(xué)與技術(shù)、信號與信息處理、網(wǎng)絡(luò)空間安全、通信與信息系統(tǒng)等學(xué)科研究生的參考教材,也可供從事語音處理技術(shù)研究與應(yīng)用的科研及工程技術(shù)人員參考。內(nèi)容簡介本書編寫組第1章智能語音處理導(dǎo)論1.1概述1.2經(jīng)典語音處理1.3智能語音處理1.4語音處理的應(yīng)用1.5小結(jié)參考文獻(xiàn)010302040506第1章智能語音處理導(dǎo)論1.2.1語音處理的發(fā)展1.2.2語音基本表示方法1.2.3語音處理基本方法1.2.4經(jīng)典語音處理方法的不足1.2經(jīng)典語音處理1.3.1智能語音處理的基本概念1.3.3智能語音處理的基本模型1.3.2智能語音處理的基本框架1.3智能語音處理1.4.2語音處理的新應(yīng)用領(lǐng)域1.4.1語音處理的傳統(tǒng)應(yīng)用領(lǐng)域1.4語音處理的應(yīng)用第2章稀疏和壓縮感知2.1引言2.2稀疏和稀疏表示2.3冗余字典2.4壓縮感知2.5小結(jié)參考文獻(xiàn)010302040506第2章稀疏和壓縮感知2.2.2稀疏表示2.2.1稀疏2.2稀疏和稀疏表示2.3.1基本概念2.3.2字典學(xué)習(xí)2.3.3字典學(xué)習(xí)算法2.3.4原子選擇算法2.3冗余字典2.4.1基本概念2.4.2壓縮感知模型2.4.3觀測矩陣2.4.4信號重構(gòu)2.4壓縮感知第3章隱變量模型3.1引言3.2高斯混合模型3.3隱馬爾可夫模型3.4高斯過程隱變量模型3.5小結(jié)參考文獻(xiàn)010302040506第3章隱變量模型3.2.2GMM參數(shù)估計3.2.1基本概念3.2高斯混合模型3.3.2HMM關(guān)鍵問題3.3.1基本概念3.3隱馬爾可夫模型3.4.1基本模型3.4.3GPLVM模型訓(xùn)練3.4.2GPLVM的理論來源3.4高斯過程隱變量模型第4章組合模型4.1引言4.2主成分分析4.3非負(fù)矩陣分解4.4魯棒組合模型4.5小結(jié)參考文獻(xiàn)010302040506第4章組合模型4.2.2求解算法4.2.1基本模型4.2主成分分析4.3.1基本模型4.3.3NMF與其他數(shù)據(jù)表示模型的關(guān)...4.3.2求解算法4.3非負(fù)矩陣分解4.4.1組合模型的魯棒性分析4.4.3魯棒非負(fù)矩陣分解4.4.2魯棒主成分分析4.4魯棒組合模型第5章人工神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)5.1引言5.2神經(jīng)網(wǎng)絡(luò)基礎(chǔ)5.3深度學(xué)習(xí)5.4深度神經(jīng)網(wǎng)絡(luò)的典型結(jié)構(gòu)5.5小結(jié)參考文獻(xiàn)010302040506第5章人工神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)5.2.1神經(jīng)元模型5.2.3深度神經(jīng)網(wǎng)絡(luò)5.2.2淺層神經(jīng)網(wǎng)絡(luò)5.2神經(jīng)網(wǎng)絡(luò)基礎(chǔ)5.3.2深度網(wǎng)絡(luò)的學(xué)習(xí)方法5.3.1基本概念和形式5.3深度學(xué)習(xí)5.4.1深度置信網(wǎng)絡(luò)5.4.2自動編碼器與棧式自動編碼器5.4.3卷積神經(jīng)網(wǎng)絡(luò)5.4.4循環(huán)神經(jīng)網(wǎng)絡(luò)5.4.5生成式對抗網(wǎng)絡(luò)123455.4深度神經(jīng)網(wǎng)絡(luò)的典型結(jié)構(gòu)第6章語音壓縮編碼6.1引言6.2基于字典學(xué)習(xí)的語音信號壓縮感知6.3基于梅爾倒譜系數(shù)重構(gòu)的語音壓縮編...6.4基于深度學(xué)習(xí)的語音壓縮編碼6.5小結(jié)參考文獻(xiàn)010302040506第6章語音壓縮編碼6.2.1語音信號的稀疏性6.2.2語音在常見變換域的稀疏化6.2.3基于K-L展開的語音非相干字...6.2.4基于K-L非相干字典的語音壓...6.2.5實驗仿真與性能分析123456.2基于字典學(xué)習(xí)的語音信號壓縮感知6.3.1基于梅爾倒譜分析的抗噪語音編...6.3.2基于稀疏約束的梅爾倒譜合成6.3.3梅爾倒譜系數(shù)的量化算法6.3.4實驗仿真與性能分析6.3基于梅爾倒譜系數(shù)重構(gòu)的語音壓縮編...6.4.1基于DAE的幅度譜編碼和量化6.4.3實驗仿真與性能分析6.4.2基于DAE的低速率語音編碼6.4基于深度學(xué)習(xí)的語音壓縮編碼第7章語音增強7.1引言7.2語音增強技術(shù)基礎(chǔ)7.3基于非負(fù)矩陣分解的語音增強7.4基于深度學(xué)習(xí)的語音增強7.5小結(jié)參考文獻(xiàn)010302040506第7章語音增強7.2.1語音增強的估計參數(shù)7.2.3性能評價7.2.2智能語音增強的語音特征7.2語音增強技術(shù)基礎(chǔ)7.3.1基本模型7.3.3基于CNMF字典學(xué)習(xí)的語音增...7.3.2基于不相交約束非負(fù)矩陣分解的...7.3基于非負(fù)矩陣分解的語音增強7.4.2基于聽覺感知掩蔽的深度神經(jīng)網(wǎng)...7.4.1基于聽覺感知加權(quán)的深度神經(jīng)網(wǎng)...7.4基于深度學(xué)習(xí)的語音增強第8章語音轉(zhuǎn)換8.1引言8.2語音轉(zhuǎn)換基本原理8.3語音轉(zhuǎn)換模型與評價8.4基于非負(fù)矩陣分解的譜轉(zhuǎn)換第8章語音轉(zhuǎn)換8.5基于深度神經(jīng)網(wǎng)絡(luò)的譜轉(zhuǎn)換參考文獻(xiàn)8.6小結(jié)第8章語音轉(zhuǎn)換8.3.1語音分析/合成模型8.3.2語音參數(shù)的選擇8.3.3時間對齊8.3.4轉(zhuǎn)換模型和規(guī)則8.3.5轉(zhuǎn)換性能評價123458.3語音轉(zhuǎn)換模型與評價8.4.1概述8.4.3聲道譜轉(zhuǎn)換效果8.4.2基于卷積非負(fù)矩陣分解的譜轉(zhuǎn)換8.4基于非負(fù)矩陣分解的譜轉(zhuǎn)換8.5.1深度學(xué)習(xí)驅(qū)動下的語音轉(zhuǎn)換8.5.3基于BLSTM和神經(jīng)網(wǎng)絡(luò)聲碼...8.5.2面向譜轉(zhuǎn)換的神經(jīng)網(wǎng)絡(luò)模型選擇8.5基于深度神經(jīng)網(wǎng)絡(luò)的譜轉(zhuǎn)換第9章說話人識別9.1引言9.2說話人識別基礎(chǔ)9.3基于i-vector的說話人識別...9.4基于深度神經(jīng)網(wǎng)絡(luò)的說話人識別第9章說話人識別9.5說話人識別系統(tǒng)的攻擊與防御參考文獻(xiàn)9.6小結(jié)第9章說話人識別9.2.2典型的說話人識別模型9.2.1說話人識別系統(tǒng)框架9.2說話人識別基礎(chǔ)9.3.1基于i-vector的說話人...9.3.3實驗結(jié)果與分析9.3.2用于提高i-vector魯棒...9.3基于i-vector的說話人識別...9.4.1基于深度神經(jīng)網(wǎng)絡(luò)的說話人識別...9.4.3實驗結(jié)果與分析9.4.2基于對比度損失函數(shù)優(yōu)化說話人...9.4基于深度神經(jīng)網(wǎng)絡(luò)的說話人識別9.5.1攻擊和防御的背景9.5.2說話人識別系統(tǒng)的攻擊方法9.5.3說話人識別攻擊的檢測方法9.5.4實驗結(jié)果與分析9.5說話人識別系統(tǒng)的攻擊與防御第10章骨導(dǎo)語音增強10.1引言10.2骨導(dǎo)語音增強基礎(chǔ)10.3基于長短時記憶網(wǎng)絡(luò)的骨導(dǎo)語音盲...10.4基于均衡-生成組合譜映射的骨導(dǎo)...10.5小結(jié)參考文獻(xiàn)010302040506第10章骨導(dǎo)語音增強10.2.1骨導(dǎo)語音的產(chǎn)生與特性10.2.3骨導(dǎo)語音盲增強的典型方法10.2.2骨導(dǎo)語音盲增強的特點10.2骨導(dǎo)語音增強基礎(chǔ)10.3.1骨導(dǎo)/氣導(dǎo)語音的譜映射10.3.3實驗仿真及性能分析10.3.2基于深度殘差BLSTM的骨...10.3基于長短時記憶網(wǎng)絡(luò)的骨導(dǎo)語音盲...10.4.1均衡法10.4.3實驗仿真及性能分析10.4.2
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度個人法律服務(wù)委托合同4篇
- 二零二五年度路佳與配偶離婚協(xié)議:財產(chǎn)分配與子女撫養(yǎng)責(zé)任書3篇
- 2025版宿舍管理員職責(zé)聘用合同6篇
- 2025版團(tuán)購民宿項目合同3篇
- 二零二五年度茅臺酒經(jīng)銷商年度銷售目標(biāo)責(zé)任書3篇
- 二零二五年度寵物救助與領(lǐng)養(yǎng)支持基金合同4篇
- 二零二五年度商業(yè)地產(chǎn)項目購置合同書3篇
- 2025年度門窗行業(yè)綠色供應(yīng)鏈管理服務(wù)合同8篇
- 2025年度彩鋼幕墻設(shè)計與施工總承包合同3篇
- 二零二五年度寵物寵物托運服務(wù)合同規(guī)范范本4篇
- 《天潤乳業(yè)營運能力及風(fēng)險管理問題及完善對策(7900字論文)》
- xx單位政務(wù)云商用密碼應(yīng)用方案V2.0
- 農(nóng)民專業(yè)合作社財務(wù)報表(三張報表)
- 安宮牛黃丸的培訓(xùn)
- 婦科腫瘤護(hù)理新進(jìn)展Ppt
- 動土作業(yè)專項安全培訓(xùn)考試試題(帶答案)
- 大學(xué)生就業(yè)指導(dǎo)(高職就業(yè)指導(dǎo)課程 )全套教學(xué)課件
- 死亡病例討論總結(jié)分析
- 第二章 會展的產(chǎn)生與發(fā)展
- 空域規(guī)劃與管理V2.0
- JGT266-2011 泡沫混凝土標(biāo)準(zhǔn)規(guī)范
評論
0/150
提交評論