版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、 語(yǔ)音信號(hào)處理語(yǔ)音信號(hào)處理Speech Signal Processing主講:莫秉戈主講:莫秉戈 學(xué)時(shí):學(xué)時(shí):32學(xué)時(shí)(理論學(xué)時(shí)(理論26+實(shí)驗(yàn)實(shí)驗(yàn)6) 學(xué)分:學(xué)分:2學(xué)分學(xué)分廣東海洋大學(xué)廣東海洋大學(xué) 信息學(xué)院信息學(xué)院語(yǔ)音信號(hào)處理語(yǔ)音信號(hào)處理聯(lián)系方式o姓名:莫秉戈姓名:莫秉戈o電話電話Email:bingge_ 教科書(shū)教科書(shū)語(yǔ)音信號(hào)處理語(yǔ)音信號(hào)處理趙力編著,語(yǔ)音信號(hào)處理趙力編著,語(yǔ)音信號(hào)處理M,機(jī)械工業(yè)出版社機(jī)械工業(yè)出版社,2009課程情況及要求:課程情況及要求:o 地位:是電子、通信工程專業(yè)的方向模塊課地位:是電子、通信工程專業(yè)的方向模塊課n 基本要求:基本要求:
2、1) 掌握語(yǔ)音信號(hào)處理的基本理論、基本分析方法;掌握語(yǔ)音信號(hào)處理的基本理論、基本分析方法;2) 了解在語(yǔ)音信號(hào)處理領(lǐng)域中相關(guān)研究熱點(diǎn);了解在語(yǔ)音信號(hào)處理領(lǐng)域中相關(guān)研究熱點(diǎn);3) 激發(fā)對(duì)語(yǔ)音處理相關(guān)研究方向中的有關(guān)興趣;激發(fā)對(duì)語(yǔ)音處理相關(guān)研究方向中的有關(guān)興趣;4) 結(jié)合結(jié)合MATLAB,實(shí)踐性掌握相關(guān)分析方法。,實(shí)踐性掌握相關(guān)分析方法。n 學(xué)習(xí)方法:學(xué)習(xí)方法:1)理論學(xué)習(xí):還包括多種形式的自主學(xué)習(xí),如網(wǎng)上學(xué)習(xí)、理論學(xué)習(xí):還包括多種形式的自主學(xué)習(xí),如網(wǎng)上學(xué)習(xí)、課外閱讀、主題調(diào)查、讀書(shū)報(bào)告、分組討論等。課外閱讀、主題調(diào)查、讀書(shū)報(bào)告、分組討論等。2)實(shí)驗(yàn)學(xué)習(xí):結(jié)合理論學(xué)習(xí),開(kāi)展自主學(xué)習(xí)和自主研究實(shí)驗(yàn)學(xué)
3、習(xí):結(jié)合理論學(xué)習(xí),開(kāi)展自主學(xué)習(xí)和自主研究設(shè)計(jì)型實(shí)驗(yàn)。設(shè)計(jì)型實(shí)驗(yàn)。主要內(nèi)容與學(xué)時(shí)主要內(nèi)容與學(xué)時(shí)o4學(xué)時(shí)學(xué)時(shí)o第一篇:語(yǔ)音信號(hào)處理基礎(chǔ)第一篇:語(yǔ)音信號(hào)處理基礎(chǔ)o共共10學(xué)時(shí)學(xué)時(shí)o第二篇:語(yǔ)音信號(hào)分析第二篇:語(yǔ)音信號(hào)分析o共共12學(xué)時(shí)學(xué)時(shí)o第三篇:語(yǔ)音信號(hào)處理技術(shù)與應(yīng)用第三篇:語(yǔ)音信號(hào)處理技術(shù)與應(yīng)用o 先修課程先修課程o 數(shù)字信號(hào)處理、概率論與數(shù)理統(tǒng)計(jì)和隨數(shù)字信號(hào)處理、概率論與數(shù)理統(tǒng)計(jì)和隨機(jī)過(guò)程、信號(hào)與系統(tǒng)、機(jī)過(guò)程、信號(hào)與系統(tǒng)、Matlab等,本課等,本課程主要是介紹語(yǔ)音信號(hào)處理的基礎(chǔ)理論程主要是介紹語(yǔ)音信號(hào)處理的基礎(chǔ)理論和基本算法,另外,本課程與實(shí)踐聯(lián)系和基本算法,另外,本課程與實(shí)踐聯(lián)系緊密,要掌
4、握一定的編程方法和能力。緊密,要掌握一定的編程方法和能力。能夠獨(dú)立完成相應(yīng)的算法程序。能夠獨(dú)立完成相應(yīng)的算法程序。1. 1.胡航胡航 編著編著,語(yǔ)音信號(hào)處理語(yǔ)音信號(hào)處理,哈爾濱工業(yè)大哈爾濱工業(yè)大學(xué)出版社學(xué)出版社 2000年年3月月2.王炳錫王炳錫 編著編著,語(yǔ)音編碼語(yǔ)音編碼,西安電子科技西安電子科技大學(xué)出版社大學(xué)出版社 2002年年6月月3.楊行峻楊行峻 等編著等編著,語(yǔ)音信號(hào)數(shù)字處理語(yǔ)音信號(hào)數(shù)字處理 電子電子工業(yè)出版社工業(yè)出版社,1995年年8月月4.易克初易克初 田斌等田斌等 編著編著,語(yǔ)音信號(hào)處理語(yǔ)音信號(hào)處理, 國(guó)防工業(yè)出版社國(guó)防工業(yè)出版社 2000年年6月月參考網(wǎng)站參考網(wǎng)站o 1 ht
5、tp:/ 百思論壇百思論壇南大學(xué)生劉靖康破解周鴻煒手機(jī)號(hào)碼,李開(kāi)復(fù)發(fā)求賢邀請(qǐng)南大學(xué)生劉靖康破解周鴻煒手機(jī)號(hào)碼,李開(kāi)復(fù)發(fā)求賢邀請(qǐng)李開(kāi)復(fù)簡(jiǎn)介李開(kāi)復(fù)簡(jiǎn)介 李開(kāi)復(fù)(李開(kāi)復(fù)(1961年年12月月3日)是一日)是一位信息產(chǎn)業(yè)公司的執(zhí)行官和計(jì)算機(jī)科學(xué)位信息產(chǎn)業(yè)公司的執(zhí)行官和計(jì)算機(jī)科學(xué)的研究學(xué)者。的研究學(xué)者。1998年,李開(kāi)復(fù)加盟微年,李開(kāi)復(fù)加盟微軟公司,并隨后創(chuàng)立了微軟中國(guó)研究院軟公司,并隨后創(chuàng)立了微軟中國(guó)研究院(現(xiàn)微軟亞洲研究院)。(現(xiàn)微軟亞洲研究院)。2005年年7月加月加入入Google(谷歌)公司,并擔(dān)任(谷歌)公司,并擔(dān)任Google(谷歌)全球副總裁兼中國(guó)區(qū)(谷歌)全球副總裁兼中國(guó)區(qū)總裁一職???/p>
6、裁一職。2009年年9月宣布離職并創(chuàng)辦月宣布離職并創(chuàng)辦創(chuàng)新工場(chǎng)任董事長(zhǎng)兼首席執(zhí)行官。創(chuàng)新工場(chǎng)任董事長(zhǎng)兼首席執(zhí)行官。創(chuàng)新工廠創(chuàng)新工廠 創(chuàng)新工場(chǎng)(英文創(chuàng)新工場(chǎng)(英文Innovation Works)由李開(kāi))由李開(kāi)復(fù)博士創(chuàng)辦于復(fù)博士創(chuàng)辦于2009年年9月,是一家致力于早期階段投月,是一家致力于早期階段投資,并提供全方位創(chuàng)業(yè)培育的投資機(jī)構(gòu)。創(chuàng)新工場(chǎng)是資,并提供全方位創(chuàng)業(yè)培育的投資機(jī)構(gòu)。創(chuàng)新工場(chǎng)是一個(gè)全方位的創(chuàng)業(yè)平臺(tái),旨在培育創(chuàng)新人才和新一代一個(gè)全方位的創(chuàng)業(yè)平臺(tái),旨在培育創(chuàng)新人才和新一代高科技企業(yè)。創(chuàng)新工場(chǎng)通過(guò)針對(duì)早期創(chuàng)業(yè)者需求的資高科技企業(yè)。創(chuàng)新工場(chǎng)通過(guò)針對(duì)早期創(chuàng)業(yè)者需求的資金、商業(yè)、技術(shù)、市場(chǎng)、人力
7、、法律、培訓(xùn)等提供一金、商業(yè)、技術(shù)、市場(chǎng)、人力、法律、培訓(xùn)等提供一攬子服務(wù),攬子服務(wù), 幫助早期階段的創(chuàng)業(yè)公司順利啟動(dòng)和快速幫助早期階段的創(chuàng)業(yè)公司順利啟動(dòng)和快速成長(zhǎng)。同時(shí)幫助創(chuàng)業(yè)者開(kāi)創(chuàng)出一批最有市場(chǎng)價(jià)值和商成長(zhǎng)。同時(shí)幫助創(chuàng)業(yè)者開(kāi)創(chuàng)出一批最有市場(chǎng)價(jià)值和商業(yè)潛力的產(chǎn)品。創(chuàng)新工場(chǎng)的投資方向?qū)⒘⒆阈畔a(chǎn)業(yè)業(yè)潛力的產(chǎn)品。創(chuàng)新工場(chǎng)的投資方向?qū)⒘⒆阈畔a(chǎn)業(yè)最熱門(mén)領(lǐng)域:移動(dòng)互聯(lián)網(wǎng)、消費(fèi)互聯(lián)網(wǎng)、電子商務(wù)和最熱門(mén)領(lǐng)域:移動(dòng)互聯(lián)網(wǎng)、消費(fèi)互聯(lián)網(wǎng)、電子商務(wù)和云計(jì)算云計(jì)算Siri系統(tǒng)系統(tǒng)o Siri是蘋(píng)果公司在其產(chǎn)品是蘋(píng)果公司在其產(chǎn)品iphone 4S上應(yīng)用的上應(yīng)用的一項(xiàng)語(yǔ)音控制功能。一項(xiàng)語(yǔ)音控制功能。Siri可以令可以
8、令iPhone4S變身變身為一臺(tái)智能化機(jī)器人,利用為一臺(tái)智能化機(jī)器人,利用Siri用戶可以通過(guò)手用戶可以通過(guò)手機(jī)讀短信、介紹餐廳、詢問(wèn)天氣、語(yǔ)音設(shè)置鬧鐘機(jī)讀短信、介紹餐廳、詢問(wèn)天氣、語(yǔ)音設(shè)置鬧鐘等。等。Siri可以支持自然語(yǔ)言輸入,并且可以調(diào)用可以支持自然語(yǔ)言輸入,并且可以調(diào)用系統(tǒng)自帶的天氣預(yù)報(bào)、日程安排、搜索資料等應(yīng)系統(tǒng)自帶的天氣預(yù)報(bào)、日程安排、搜索資料等應(yīng)用。還能夠不斷學(xué)習(xí)新的聲音和語(yǔ)調(diào),提供對(duì)話用。還能夠不斷學(xué)習(xí)新的聲音和語(yǔ)調(diào),提供對(duì)話式的應(yīng)答。式的應(yīng)答。Siri十大功用十大功用o 1.Siri 變身鬧鐘變身鬧鐘o 2.用用 Siri 尋找咖啡廳尋找咖啡廳o 3.想去哪,想去哪,Siri
9、 告訴你告訴你o 4.用用 Siri 播放隨機(jī)音樂(lè)播放隨機(jī)音樂(lè)o 5.發(fā)送短信,發(fā)送短信,Siri 代勞代勞o 6.天氣預(yù)報(bào),天氣預(yù)報(bào),Siri 知道知道o 7.用用Siri提醒日程安排提醒日程安排o 8.用用 Siri 提醒地點(diǎn)提醒地點(diǎn)o 9.Siri 為你答疑解惑為你答疑解惑o 10.用用 Siri 發(fā)推特發(fā)推特緒論緒論前言前言1) 聽(tīng)說(shuō)讀寫(xiě)聽(tīng)說(shuō)讀寫(xiě);耳聰目明耳聰目明;2)語(yǔ)音和圖像語(yǔ)音和圖像重要的感知媒體重要的感知媒體3)對(duì)語(yǔ)音和圖像的分析處理對(duì)語(yǔ)音和圖像的分析處理媒體計(jì)算的主要研究對(duì)象和內(nèi)容媒體計(jì)算的主要研究對(duì)象和內(nèi)容4)語(yǔ)音:新一代自然人機(jī)交互的關(guān)鍵之一語(yǔ)音:新一代自然人機(jī)交互的關(guān)鍵
10、之一5)信號(hào)處理信號(hào)處理模式識(shí)別模式識(shí)別人工智能人工智能1.語(yǔ)音與語(yǔ)言語(yǔ)音與語(yǔ)言1)語(yǔ)言(語(yǔ)言(Language)人與人間的溝通工具人與人間的溝通工具組成組成PhonemeWord formationGrammarText2)語(yǔ)音語(yǔ)音o語(yǔ)音是帶有語(yǔ)言信息的聲音,是語(yǔ)音是帶有語(yǔ)言信息的聲音,是Acoustic(聲音聲音)和)和Language(語(yǔ)言語(yǔ)言)的組合體。)的組合體。o語(yǔ)音的功能是區(qū)別不同的語(yǔ)言符號(hào)。語(yǔ)音的功能是區(qū)別不同的語(yǔ)言符號(hào)。我國(guó)的語(yǔ)音我國(guó)的語(yǔ)音我國(guó)普通話以北京語(yǔ)音為標(biāo)準(zhǔn)音,以北方話為基礎(chǔ)方言,以典范我國(guó)普通話以北京語(yǔ)音為標(biāo)準(zhǔn)音,以北方話為基礎(chǔ)方言,以典范的白話文著作為語(yǔ)法規(guī)范的現(xiàn)
11、代漢民族共同語(yǔ)言。八大方言的白話文著作為語(yǔ)法規(guī)范的現(xiàn)代漢民族共同語(yǔ)言。八大方言:1)北方方言(以黃河流域?yàn)橹行模植荚跂|北、長(zhǎng)江流域中部、北方方言(以黃河流域?yàn)橹行模植荚跂|北、長(zhǎng)江流域中部、西南);西南);2)吳方言(上海地區(qū)、江蘇省東南部、浙江省大部分地區(qū));吳方言(上海地區(qū)、江蘇省東南部、浙江省大部分地區(qū));3)湘方言(湖南?。?;湘方言(湖南?。?;4)客家方言(福建、廣東、廣西);客家方言(福建、廣東、廣西);5)閩北方言(福建北部、臺(tái)灣);閩北方言(福建北部、臺(tái)灣);6)閩南方言(福建南部、廣東、潮汕、海南島);閩南方言(福建南部、廣東、潮汕、海南島);7)粵方言(廣東中部、廣西中南部
12、)。粵方言(廣東中部、廣西中南部)。8)贛方言(江西?。?;贛方言(江西?。粏?wèn)題問(wèn)題什么樣的聲什么樣的聲音是語(yǔ)音?音是語(yǔ)音?2.語(yǔ)音與聲音(一)語(yǔ)音與聲音(一)語(yǔ)音是人類(lèi)發(fā)音器官發(fā)出的、具有一定意義的、能起社語(yǔ)音是人類(lèi)發(fā)音器官發(fā)出的、具有一定意義的、能起社會(huì)交際作用的聲音。會(huì)交際作用的聲音。能夠代表一定的意義,這是語(yǔ)能夠代表一定的意義,這是語(yǔ)言的聲音同自然界其他一切聲音的本質(zhì)區(qū)別言的聲音同自然界其他一切聲音的本質(zhì)區(qū)別。1)1)鐘聲、風(fēng)聲、動(dòng)物叫聲、機(jī)器聲鐘聲、風(fēng)聲、動(dòng)物叫聲、機(jī)器聲? ?2)2)打噴嚏、打嗝兒、打哈欠、咳嗽打噴嚏、打嗝兒、打哈欠、咳嗽? ?3)3)吹口哨、口技演員的表演、哭、笑
13、吹口哨、口技演員的表演、哭、笑? ?雖然也傳遞出了雖然也傳遞出了某種信息某種信息病了,病了,飽了,困了或是飽了,困了或是醒了,但聲音的醒了,但聲音的發(fā)出不是為了交發(fā)出不是為了交際,而是人體本際,而是人體本能的生理反映;能的生理反映;這些聲音的發(fā)出是有目的的,是一這些聲音的發(fā)出是有目的的,是一定的心理活動(dòng)的表現(xiàn),但聲音同意定的心理活動(dòng)的表現(xiàn),但聲音同意義之間沒(méi)有固定的結(jié)合關(guān)系,不能義之間沒(méi)有固定的結(jié)合關(guān)系,不能成為代表意義的聲音符號(hào),只能表成為代表意義的聲音符號(hào),只能表示情緒,展示技巧。以上這些聲音示情緒,展示技巧。以上這些聲音都不是語(yǔ)言。都不是語(yǔ)言。語(yǔ)音與聲音(二)語(yǔ)音與聲音(二)o語(yǔ)言的聲音
14、同它所代表的意義是相互依存的語(yǔ)言的聲音同它所代表的意義是相互依存的統(tǒng)一體,統(tǒng)一體,一方面,發(fā)音器官發(fā)出的聲音必須一方面,發(fā)音器官發(fā)出的聲音必須同意義緊密結(jié)合、成為一定意義的代表,才同意義緊密結(jié)合、成為一定意義的代表,才能成為語(yǔ)音;另一方面,意義必須借助聲音能成為語(yǔ)音;另一方面,意義必須借助聲音才能成為可被人感知、被人接受的東西,沒(méi)才能成為可被人感知、被人接受的東西,沒(méi)有聲音,意義便無(wú)法表達(dá)出來(lái)。有聲音,意義便無(wú)法表達(dá)出來(lái)。o語(yǔ)音是一種具有多重屬性的聲音。語(yǔ)音是一種具有多重屬性的聲音。1)1)自然屬性自然屬性; ;2)2)生理屬性生理屬性;3);3)社會(huì)屬性社會(huì)屬性3.語(yǔ)音頻率范圍語(yǔ)音頻率范圍1
15、)頻率小于頻率小于20Hz 一般稱為次聲波(一般稱為次聲波(subsonic)2)人的聽(tīng)覺(jué)器官能感知的聲音頻率范圍約為人的聽(tīng)覺(jué)器官能感知的聲音頻率范圍約為20Hz20kHz的信號(hào)稱為音頻的信號(hào)稱為音頻(Audio)信號(hào)信號(hào)n 人發(fā)音器官發(fā)聲頻率約是人發(fā)音器官發(fā)聲頻率約是803400Hz,但,但人說(shuō)話的信號(hào)頻率約為人說(shuō)話的信號(hào)頻率約為3003000Hz,即,即話音話音(speech)信號(hào)信號(hào)3)高于高于20kHz的信號(hào)稱為超聲波的信號(hào)稱為超聲波 (ultrasonic)超聲波及次聲波一般不能引起人聽(tīng)覺(jué)器官的感超聲波及次聲波一般不能引起人聽(tīng)覺(jué)器官的感覺(jué),但可借助一些儀器設(shè)備進(jìn)行觀察和測(cè)量覺(jué),但可借
16、助一些儀器設(shè)備進(jìn)行觀察和測(cè)量4.語(yǔ)音信號(hào)處理語(yǔ)音信號(hào)處理o 語(yǔ)音信號(hào)處理:語(yǔ)音信號(hào)處理:簡(jiǎn)稱語(yǔ)音處理,是與數(shù)字信簡(jiǎn)稱語(yǔ)音處理,是與數(shù)字信號(hào)處理、語(yǔ)言學(xué)、心理學(xué)、計(jì)算機(jī)科學(xué)、模號(hào)處理、語(yǔ)言學(xué)、心理學(xué)、計(jì)算機(jī)科學(xué)、模式識(shí)別和人工智能等相結(jié)合的交叉學(xué)科。式識(shí)別和人工智能等相結(jié)合的交叉學(xué)科。o 處理的目的:處理的目的:是要得到一些語(yǔ)音參數(shù)以便高是要得到一些語(yǔ)音參數(shù)以便高效的傳輸或存儲(chǔ),或者通過(guò)處理的某種運(yùn)算效的傳輸或存儲(chǔ),或者通過(guò)處理的某種運(yùn)算以達(dá)到某種用途的要求,例如人工合成出語(yǔ)以達(dá)到某種用途的要求,例如人工合成出語(yǔ)音,辨識(shí)出說(shuō)話者,識(shí)別講話的內(nèi)容等。音,辨識(shí)出說(shuō)話者,識(shí)別講話的內(nèi)容等。它包括語(yǔ)音編
17、碼、語(yǔ)音合成、語(yǔ)音識(shí)別和說(shuō)話它包括語(yǔ)音編碼、語(yǔ)音合成、語(yǔ)音識(shí)別和說(shuō)話人識(shí)別四大分支。人識(shí)別四大分支。o 說(shuō)的是什么內(nèi)容?說(shuō)的是什么內(nèi)容?o 是誰(shuí)在說(shuō)話?是誰(shuí)在說(shuō)話?o 計(jì)算機(jī)去說(shuō)話?計(jì)算機(jī)去說(shuō)話?o 怎么把話說(shuō)好?怎么把話說(shuō)好?語(yǔ)音識(shí)別語(yǔ)音識(shí)別聲紋識(shí)別聲紋識(shí)別語(yǔ)音合成語(yǔ)音合成說(shuō)話水平評(píng)估說(shuō)話水平評(píng)估o 說(shuō)的是什么語(yǔ)言?說(shuō)的是什么語(yǔ)言?語(yǔ)種識(shí)別語(yǔ)種識(shí)別語(yǔ)音處理研究的基本內(nèi)容語(yǔ)音處理研究的基本內(nèi)容4.1 語(yǔ)音編譯碼器語(yǔ)音編譯碼器A/D語(yǔ)音編碼信道編碼信道信道譯碼語(yǔ)音譯碼D/A4.2 語(yǔ)音合成語(yǔ)音合成(Speech synthesis)o 定義:語(yǔ)音合成技術(shù)是指將文本信息轉(zhuǎn)定義:語(yǔ)音合成技術(shù)是指將文
18、本信息轉(zhuǎn)換為語(yǔ)音數(shù)據(jù),然后以語(yǔ)音的方式播放換為語(yǔ)音數(shù)據(jù),然后以語(yǔ)音的方式播放出來(lái)。出來(lái)。o 文字轉(zhuǎn)語(yǔ)音文字轉(zhuǎn)語(yǔ)音(Text-to-speech)將任將任意文字轉(zhuǎn)換成語(yǔ)音的系統(tǒng),意文字轉(zhuǎn)換成語(yǔ)音的系統(tǒng),即讓機(jī)器說(shuō)即讓機(jī)器說(shuō)話話語(yǔ)音合成的應(yīng)用:電話查詢業(yè)務(wù)、語(yǔ)音信箱、語(yǔ)音合成的應(yīng)用:電話查詢業(yè)務(wù)、語(yǔ)音信箱、銀行報(bào)號(hào)器、語(yǔ)音聊天室,公共汽車(chē)或電車(chē)的銀行報(bào)號(hào)器、語(yǔ)音聊天室,公共汽車(chē)或電車(chē)的自動(dòng)報(bào)站等自動(dòng)報(bào)站等4.3 語(yǔ)音識(shí)別語(yǔ)音識(shí)別( Speech Recognition)o 定義:計(jì)算機(jī)語(yǔ)音識(shí)別的目的是讓計(jì)算機(jī)能夠定義:計(jì)算機(jī)語(yǔ)音識(shí)別的目的是讓計(jì)算機(jī)能夠聽(tīng)懂人的話。聽(tīng)懂人的話。o 語(yǔ)音識(shí)別實(shí)際上是一
19、個(gè)語(yǔ)音識(shí)別實(shí)際上是一個(gè)模式識(shí)別匹配模式識(shí)別匹配的過(guò)程。的過(guò)程。首先根據(jù)人的語(yǔ)言特征建立語(yǔ)音模型,對(duì)輸入首先根據(jù)人的語(yǔ)言特征建立語(yǔ)音模型,對(duì)輸入的語(yǔ)音信號(hào)進(jìn)行分析,抽取相應(yīng)的特征,建立的語(yǔ)音信號(hào)進(jìn)行分析,抽取相應(yīng)的特征,建立模板,在識(shí)別過(guò)程中,將計(jì)算機(jī)中存放的語(yǔ)音模板,在識(shí)別過(guò)程中,將計(jì)算機(jī)中存放的語(yǔ)音模板與輸入的語(yǔ)音信號(hào)特征進(jìn)行比較。從而識(shí)模板與輸入的語(yǔ)音信號(hào)特征進(jìn)行比較。從而識(shí)別說(shuō)話人的語(yǔ)音指令以及文字內(nèi)容別說(shuō)話人的語(yǔ)音指令以及文字內(nèi)容如:英國(guó)的如:英國(guó)的WebfloristsWebflorists網(wǎng)上花站利用互聯(lián)網(wǎng)和語(yǔ)音識(shí)別網(wǎng)上花站利用互聯(lián)網(wǎng)和語(yǔ)音識(shí)別技術(shù)接收和處理鮮花訂單。技術(shù)接收和處理
20、鮮花訂單。北京中科院研究一種將語(yǔ)音識(shí)別技術(shù)應(yīng)用于電視,控制電北京中科院研究一種將語(yǔ)音識(shí)別技術(shù)應(yīng)用于電視,控制電視的開(kāi)關(guān)和轉(zhuǎn)換頻道。視的開(kāi)關(guān)和轉(zhuǎn)換頻道。4.4 說(shuō)話人識(shí)別技術(shù)說(shuō)話人識(shí)別技術(shù)(Speaker Recognition)o 定義:說(shuō)話人識(shí)別技術(shù)是以話音對(duì)說(shuō)話人進(jìn)行定義:說(shuō)話人識(shí)別技術(shù)是以話音對(duì)說(shuō)話人進(jìn)行區(qū)分,從而進(jìn)行身份鑒別與認(rèn)證的技術(shù),通過(guò)區(qū)分,從而進(jìn)行身份鑒別與認(rèn)證的技術(shù),通過(guò)說(shuō)話人識(shí)別可以利用人本身的生物特征進(jìn)行身說(shuō)話人識(shí)別可以利用人本身的生物特征進(jìn)行身份鑒別。份鑒別。o 通過(guò)分析人的發(fā)聲和聽(tīng)覺(jué),為每個(gè)人建立一個(gè)通過(guò)分析人的發(fā)聲和聽(tīng)覺(jué),為每個(gè)人建立一個(gè)數(shù)學(xué)模型,然后由計(jì)算機(jī)對(duì)模型
21、和實(shí)際輸入的數(shù)學(xué)模型,然后由計(jì)算機(jī)對(duì)模型和實(shí)際輸入的語(yǔ)音進(jìn)行精確的匹配,根據(jù)匹配的結(jié)果便人說(shuō)語(yǔ)音進(jìn)行精確的匹配,根據(jù)匹配的結(jié)果便人說(shuō)話人是誰(shuí)。話人是誰(shuí)。應(yīng)用:公安部門(mén)進(jìn)行語(yǔ)音驗(yàn)證,為一般的用戶提供應(yīng)用:公安部門(mén)進(jìn)行語(yǔ)音驗(yàn)證,為一般的用戶提供防盜門(mén)開(kāi)啟功能,語(yǔ)音撥號(hào),電話銀行,電話購(gòu)物,防盜門(mén)開(kāi)啟功能,語(yǔ)音撥號(hào),電話銀行,電話購(gòu)物,語(yǔ)音語(yǔ)音E-mail,信息服務(wù)等,信息服務(wù)等.語(yǔ)音分析工具: MATLAB, PRAAT, SFSSFS:Speech Filing System 5.語(yǔ)音信號(hào)處理技術(shù)的發(fā)展(一)語(yǔ)音信號(hào)處理技術(shù)的發(fā)展(一) 語(yǔ)音信號(hào)處理是許多信息領(lǐng)域應(yīng)用語(yǔ)音信號(hào)處理是許多信息領(lǐng)域應(yīng)
22、用的核心技術(shù)之一,是目前發(fā)展最為迅速的核心技術(shù)之一,是目前發(fā)展最為迅速的信息科學(xué)研究領(lǐng)域中的一個(gè)。語(yǔ)音信的信息科學(xué)研究領(lǐng)域中的一個(gè)。語(yǔ)音信號(hào)處理是目前極為活躍和熱門(mén)的研究領(lǐng)號(hào)處理是目前極為活躍和熱門(mén)的研究領(lǐng)域,其研究涉及一系列前沿科研課題,域,其研究涉及一系列前沿科研課題,且處于迅速發(fā)展之中;其研究成果具有且處于迅速發(fā)展之中;其研究成果具有重要的學(xué)術(shù)及應(yīng)用價(jià)值。重要的學(xué)術(shù)及應(yīng)用價(jià)值。5.語(yǔ)音信號(hào)處理技術(shù)的發(fā)展(二)語(yǔ)音信號(hào)處理技術(shù)的發(fā)展(二)o 1940年前后年前后Duley的聲碼器和的聲碼器和Potter等人的可見(jiàn)等人的可見(jiàn)語(yǔ)音開(kāi)始;語(yǔ)音開(kāi)始;o 1952貝爾實(shí)驗(yàn)室首次研制成功能識(shí)別是個(gè)英語(yǔ)
23、數(shù)字貝爾實(shí)驗(yàn)室首次研制成功能識(shí)別是個(gè)英語(yǔ)數(shù)字的實(shí)驗(yàn)裝置;的實(shí)驗(yàn)裝置;o 1956年年Olson等采用等采用8個(gè)帶通濾波器組提取頻譜參個(gè)帶通濾波器組提取頻譜參數(shù)作為語(yǔ)音的特征,研制成一臺(tái)簡(jiǎn)單的語(yǔ)音打字機(jī);數(shù)作為語(yǔ)音的特征,研制成一臺(tái)簡(jiǎn)單的語(yǔ)音打字機(jī);o 20世紀(jì)世紀(jì)60年代,年代,F(xiàn)aut等奠定了語(yǔ)音生成的理論基等奠定了語(yǔ)音生成的理論基礎(chǔ),在此基礎(chǔ)上語(yǔ)音合成的研究得到了扎實(shí)的進(jìn)展;礎(chǔ),在此基礎(chǔ)上語(yǔ)音合成的研究得到了扎實(shí)的進(jìn)展;o 20世紀(jì)世紀(jì)60年代數(shù)字信號(hào)處理技術(shù)的發(fā)展成為語(yǔ)音信年代數(shù)字信號(hào)處理技術(shù)的發(fā)展成為語(yǔ)音信號(hào)處理理論和技術(shù)基礎(chǔ);號(hào)處理理論和技術(shù)基礎(chǔ);語(yǔ)音信號(hào)處理技術(shù)的發(fā)展(二)語(yǔ)音信號(hào)
24、處理技術(shù)的發(fā)展(二)o 1970年單詞識(shí)別機(jī)裝置開(kāi)始實(shí)用化;聲紋年單詞識(shí)別機(jī)裝置開(kāi)始實(shí)用化;聲紋識(shí)別及說(shuō)話人識(shí)別的研究開(kāi)展起來(lái);識(shí)別及說(shuō)話人識(shí)別的研究開(kāi)展起來(lái);o 1971年美國(guó)年美國(guó)ARPR主導(dǎo)的主導(dǎo)的“語(yǔ)音理解系統(tǒng)語(yǔ)音理解系統(tǒng)”的研究計(jì)劃開(kāi)始起步;的研究計(jì)劃開(kāi)始起步;o 20世紀(jì)世紀(jì)70年代中期年代中期LPC(線性預(yù)測(cè)技術(shù))(線性預(yù)測(cè)技術(shù))和和HMM(隱馬爾可夫法)應(yīng)用于語(yǔ)音信號(hào)(隱馬爾可夫法)應(yīng)用于語(yǔ)音信號(hào)處理;處理;o 20世紀(jì)世紀(jì)70年代末矢量量化技術(shù)用于語(yǔ)音編年代末矢量量化技術(shù)用于語(yǔ)音編碼獲得了成功;碼獲得了成功;語(yǔ)音信號(hào)處理技術(shù)的發(fā)展(三)語(yǔ)音信號(hào)處理技術(shù)的發(fā)展(三)o 20世紀(jì)
25、世紀(jì)80年代,矢量量化、隱馬爾可夫模型、人年代,矢量量化、隱馬爾可夫模型、人工神經(jīng)網(wǎng)絡(luò)等相繼被用于語(yǔ)音信號(hào)處理,使得語(yǔ)音工神經(jīng)網(wǎng)絡(luò)等相繼被用于語(yǔ)音信號(hào)處理,使得語(yǔ)音信號(hào)處理技術(shù)產(chǎn)生了突破性的進(jìn)展;信號(hào)處理技術(shù)產(chǎn)生了突破性的進(jìn)展;o 20世紀(jì)世紀(jì)90年代,語(yǔ)音識(shí)別逐漸由實(shí)驗(yàn)室走向?qū)嵱媚甏?,語(yǔ)音識(shí)別逐漸由實(shí)驗(yàn)室走向?qū)嵱没徽Z(yǔ)音合成已在自動(dòng)報(bào)時(shí)、報(bào)警、報(bào)站、電話查化;語(yǔ)音合成已在自動(dòng)報(bào)時(shí)、報(bào)警、報(bào)站、電話查詢服務(wù)等方面得到了廣泛應(yīng)用;語(yǔ)音編碼取得了迅詢服務(wù)等方面得到了廣泛應(yīng)用;語(yǔ)音編碼取得了迅速發(fā)展;說(shuō)話人識(shí)別和語(yǔ)種辨識(shí)研究的重點(diǎn)裝箱參速發(fā)展;說(shuō)話人識(shí)別和語(yǔ)種辨識(shí)研究的重點(diǎn)裝箱參數(shù)處理和新的模式匹配
26、方法上;語(yǔ)音信號(hào)的情感信數(shù)處理和新的模式匹配方法上;語(yǔ)音信號(hào)的情感信息的計(jì)算機(jī)處理,是息的計(jì)算機(jī)處理,是90年代興起的一個(gè)新的語(yǔ)音年代興起的一個(gè)新的語(yǔ)音信號(hào)處理研究領(lǐng)域;抗噪聲技術(shù)取得了新的進(jìn)展;信號(hào)處理研究領(lǐng)域;抗噪聲技術(shù)取得了新的進(jìn)展;6. 語(yǔ)音信號(hào)處理的應(yīng)用及新方向語(yǔ)音信號(hào)處理的應(yīng)用及新方向1 1)語(yǔ)音識(shí)別(傳統(tǒng)方向)語(yǔ)音識(shí)別(傳統(tǒng)方向)基本任務(wù):語(yǔ)音基本任務(wù):語(yǔ)音文本或命令文本或命令應(yīng)用前景:應(yīng)用前景:A A、聲控應(yīng)用,計(jì)算機(jī)識(shí)別語(yǔ)音內(nèi)容,并實(shí)施相應(yīng)的動(dòng)作。典型、聲控應(yīng)用,計(jì)算機(jī)識(shí)別語(yǔ)音內(nèi)容,并實(shí)施相應(yīng)的動(dòng)作。典型系統(tǒng):聲控電話轉(zhuǎn)換、聲控語(yǔ)音撥號(hào)、聲控智能玩具、信息系統(tǒng):聲控電話轉(zhuǎn)換、
27、聲控語(yǔ)音撥號(hào)、聲控智能玩具、信息網(wǎng)絡(luò)查詢、銀行、家庭服務(wù)等;網(wǎng)絡(luò)查詢、銀行、家庭服務(wù)等;B B、聽(tīng)寫(xiě)系統(tǒng),以口授方式將文字輸入計(jì)算機(jī);、聽(tīng)寫(xiě)系統(tǒng),以口授方式將文字輸入計(jì)算機(jī);C C、自動(dòng)口語(yǔ)翻譯,將一種語(yǔ)言翻譯成另一種語(yǔ)言,如中科院開(kāi)、自動(dòng)口語(yǔ)翻譯,將一種語(yǔ)言翻譯成另一種語(yǔ)言,如中科院開(kāi)展的展的CSTARCSTAR計(jì)劃;計(jì)劃;D D、人機(jī)交互;、人機(jī)交互;E E、移動(dòng)計(jì)算設(shè)備語(yǔ)音輸入;、移動(dòng)計(jì)算設(shè)備語(yǔ)音輸入;F F、說(shuō)話人識(shí)別,安全加密、法庭取證、銀行信息電話查詢、公、說(shuō)話人識(shí)別,安全加密、法庭取證、銀行信息電話查詢、公安機(jī)關(guān)破案等。安機(jī)關(guān)破案等。語(yǔ)音信號(hào)處理的應(yīng)用及新方向(續(xù))語(yǔ)音信號(hào)處理的
28、應(yīng)用及新方向(續(xù))2)語(yǔ)音合成(傳統(tǒng)方向)語(yǔ)音合成(傳統(tǒng)方向)應(yīng)用:公共交通自動(dòng)報(bào)站,各種場(chǎng)合的自動(dòng)報(bào)時(shí)、自應(yīng)用:公共交通自動(dòng)報(bào)站,各種場(chǎng)合的自動(dòng)報(bào)時(shí)、自動(dòng)告警等,文本校對(duì)中的語(yǔ)音提示,電話查詢服務(wù);動(dòng)告警等,文本校對(duì)中的語(yǔ)音提示,電話查詢服務(wù);應(yīng)用新領(lǐng)域:與應(yīng)用新領(lǐng)域:與Internet結(jié)合,有聲結(jié)合,有聲EMAIL,網(wǎng)上,網(wǎng)上信息的有聲獲取、語(yǔ)音聊天等;與機(jī)器翻譯技術(shù)結(jié)信息的有聲獲取、語(yǔ)音聊天等;與機(jī)器翻譯技術(shù)結(jié)合的語(yǔ)音翻譯;與圖象、視頻技術(shù)結(jié)合的視覺(jué)合的語(yǔ)音翻譯;與圖象、視頻技術(shù)結(jié)合的視覺(jué)(visual speech) 語(yǔ)音。語(yǔ)音。研究方向:高質(zhì)量、高清晰度自然語(yǔ)音合成,以及表研究方向:高質(zhì)量、高清晰度自然語(yǔ)音合成,以及表達(dá)人類(lèi)的情感語(yǔ)音。達(dá)人類(lèi)的情感
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年農(nóng)民專業(yè)合作社股權(quán)轉(zhuǎn)讓及品牌授權(quán)合作協(xié)議2篇
- 2024年版:股東之間股權(quán)轉(zhuǎn)讓協(xié)議書(shū)
- 采購(gòu)工作總結(jié)與計(jì)劃9篇
- 一年級(jí)上冊(cè)音樂(lè)教學(xué)計(jì)劃三篇
- 高三教學(xué)工作計(jì)劃4篇
- 樣品買(mǎi)賣(mài)合同
- 將優(yōu) 質(zhì) 服務(wù)進(jìn)行到底
- 2025年專用級(jí)次磷酸鈉項(xiàng)目發(fā)展計(jì)劃
- 全國(guó)獨(dú)家分銷(xiāo)合同(2篇)
- 商業(yè)租房協(xié)議范本
- 《企業(yè)采購(gòu)成本控制現(xiàn)狀、問(wèn)題及對(duì)策研究-以伊利乳業(yè)集團(tuán)為例(論文)10000字》
- 中華醫(yī)學(xué)會(huì)雜志社作者貢獻(xiàn)聲明
- 市場(chǎng)營(yíng)銷(xiāo)學(xué)吳健安七套期末考試試題卷及的答案
- 《物理學(xué)之美 插圖珍藏版 》讀書(shū)筆記思維導(dǎo)圖PPT模板下載
- 7人英語(yǔ)短劇劇本(5篇)
- 學(xué)生假期安全承諾書(shū)200字(5篇)
- 員工滿意度中英文對(duì)照外文翻譯文獻(xiàn)
- 國(guó)有企業(yè)(投資類(lèi))戰(zhàn)略規(guī)劃管理暫行辦法模版
- 德欽小學(xué)教師招聘2022年考試真題及答案解析
- GB/T 14211-2019機(jī)械密封試驗(yàn)方法
- 拱壩講義(河海大學(xué)水工建筑物課件)
評(píng)論
0/150
提交評(píng)論