




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
情感語音識(shí)別研究綜述
導(dǎo)師:陶智肖仲喆研究生:沈燕內(nèi)容概要課題背景及意義情感語音研究綜述研究方向選擇課題背景及意義語音是人類最有效、最自然的交流溝通手段,除了包含語義信息外,還攜帶有豐富的情感信息。人們的情感包括生理上的感覺,認(rèn)知以及人們的行為舉止。情感語音識(shí)別可應(yīng)用于聾啞人學(xué)說話;電視調(diào)臺(tái);熱線電話。研究綜述——涉及的問題語音情感分類學(xué)語音庫聲學(xué)參量分類方法研究綜述-語音情感分類學(xué)情感語音并沒有統(tǒng)一的模型空間情感模型
情感輪等離散情感模型
高興,憤怒,悲傷,平靜,害怕,厭惡每類模型內(nèi)部無定論模型的選取依賴于應(yīng)用[1]林奕琳,韋崗,楊康才,語音情感識(shí)別的研究進(jìn)展.電路與系統(tǒng)學(xué)報(bào),2007.12(1):第90-98頁.研究綜述-語音庫的選擇現(xiàn)有的情感語言庫有很多公開庫,私有庫,商用庫[2]I.S.EngbergandA.V.Hansen,“DocumentationoftheDanishEmo-tionalSpeechDatabase(DES),”InternalAAUreport,CenterforPersonKommunikation,Denmark,1996.[3]F.Burkhardt,A.Paeschke,M.Rolfes,W.Sendlmeier,B.Weiss,AdatabaseofGermanemotionalspeech,in:ProceedingsoftheInterspeech2005,Lissabon,Portugal,2005,pp.1517–1520.名稱性質(zhì)語言Berlinemotionaldatabase[2]公開庫德語Danishemotionaldatabase[3]公開庫丹麥語Natural私有庫普通話BabyEars私有庫英語研究綜述-聲學(xué)參量情感語音的最佳特征:全局統(tǒng)計(jì)特征&局部特征
特征參數(shù)優(yōu)化多類特征組合[4]M.E.Ayadi,M.S.Kamel,andF.Karray,“SurveyonSpeechEmotionRecognition:Features,ClassificationSchemes,andDatabases,”PatternRecognition,vol.44,no.3,pp.572-587,Mar.2011.研究綜述-情感語音的最佳特征SpeechFeaturesContinuousQualitativeSpectralTEO-BasedPitchDurationFormantsVoicequality:happy,tense,angryLPCCMFCC[5]Kim,E.H.,Hyun,K.H.,“ImprovedEmotionRecognitionWithaNovelSpeaker-IndependentFeature,”IEEETransactionsonMechatronics,2009,14(3):317-325.[6]H.Teager,Someobservationsonoralairflowduringphonation,IEEETrans.Acoust.SpeechSignalProcess.1990,28(5):599–601.研究綜述-特征參數(shù)優(yōu)化
浮動(dòng)前向選擇(SFFS)主成分分析(PCA)線性判別分析(LDA)[7]D.VerveridisandC.Kotropoulos,“AutomaticSpeechClassificationtofiveemotionalstatesbasedongenderinformation,”inProc.12thEuropeanSignalProcessingConf.,pp.341-344,Vienna,September,2004.[8]Z.Chuang,C.Wu,Emotionrecognitionusingacousticfeaturesandtextualcontent,MultimediaandExpo,2004.IEEEInternationalConferenceonICME’04,vol.1,2004,pp.53–56.[9]M.You,C.Chen,J.Bu,J.Liu,J.Tao,Emotionrecognitionfromnoisyspeech,in:IEEEInternationalConferenceonMultimediaandExpo,2006,2006,pp.1653–1656l.研究綜述-多類特征組合
結(jié)合韻律特征與語意信息結(jié)合韻律特征、語意信息以及語言結(jié)構(gòu)結(jié)合韻律特征以及視頻信息(人臉識(shí)別)[10]Chung-HsienWu,Wei-BinLiang,“EmotionRecognitionofAffectiveSpeechBasedonMultipleClassifiersUsingAcoustic-ProsodicInformationandSemanticLabels,”IEEETransactionsonAffectiveComputing,2011,2(1):10-21.[11]T.Otsuka,J.Ohya,Recognizingmultiplepersons’facialexpressionsusinghmmbasedonautomaticextractionofsignificantframesfromimagesequences,in:ProceedingsoftheInternationalConferenceonImageProcessing(ICIP-97),1997,pp.546–549.研究綜述-分類方法
GMM,SV
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 民工衣服庫存管理辦法
- 晚會(huì)捐贈(zèng)收入管理辦法
- 冬季水管防護(hù)管理辦法
- 國債承銷工作管理辦法
- 口服制劑溶出曲線比對-洞察及研究
- 噴施KH2PO4對小麥灌漿期高溫脅迫抑制作用的研究
- 多元種植模式下玉米大豆協(xié)同增產(chǎn)技術(shù)研究
- 互聯(lián)網(wǎng)時(shí)代企業(yè)工商管理模式轉(zhuǎn)型與創(chuàng)新策略
- 班組長安全工作總結(jié)
- 廣東省紅火蟻防控應(yīng)急預(yù)案
- 護(hù)理警示教育培訓(xùn)課件
- 2025年低壓電工證考試試題及答案
- 2025至2030中國風(fēng)電設(shè)備及零部件行業(yè)發(fā)展趨勢分析與未來投資戰(zhàn)略咨詢研究報(bào)告
- 實(shí)踐制作“龍骨水車”模型課件-滬科版八年級(jí)全一冊物理
- 供應(yīng)鏈計(jì)劃員考試題庫
- 2025年湖北省中考語文試卷真題(含標(biāo)準(zhǔn)答案)
- 兒童舞蹈課件模板
- 2025新疆新型儲(chǔ)能發(fā)展概述與展望報(bào)告-國網(wǎng)新疆經(jīng)研院
- 2025年高考四川卷物理高考真題+解析(參考版)
- 鐵路換枕合同協(xié)議書
- 我國生命教育二十年的發(fā)展回顧與未來展望
評(píng)論
0/150
提交評(píng)論