語(yǔ)音識(shí)別開(kāi)題報(bào)告_第1頁(yè)
語(yǔ)音識(shí)別開(kāi)題報(bào)告_第2頁(yè)
語(yǔ)音識(shí)別開(kāi)題報(bào)告_第3頁(yè)
已閱讀5頁(yè),還剩3頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、青島大學(xué)畢業(yè)論文(設(shè)計(jì))開(kāi)題報(bào)告題學(xué)目:孤立詞語(yǔ)音識(shí)別的并行編程實(shí)現(xiàn)院:自動(dòng)化工程學(xué)院電子工程系專業(yè):通信工程姓名:李洪超指導(dǎo)教師:莊曉東2010年3月22日一、文獻(xiàn)綜述語(yǔ)音識(shí)別是解決機(jī)器“聽(tīng)懂”人類語(yǔ)言的一項(xiàng)技術(shù)。作為智能計(jì)算機(jī)研究的主導(dǎo)方向 和人機(jī)語(yǔ)音通信的關(guān)鍵技術(shù),語(yǔ)音識(shí)別技術(shù)一直受到各國(guó)科學(xué)界的廣泛關(guān)注。如今,隨著 語(yǔ)音識(shí)別技術(shù)研究的突破,其對(duì)計(jì)算機(jī)發(fā)展和社會(huì)生活的重要性日益凸現(xiàn)出來(lái)。以語(yǔ)音識(shí) 別技術(shù)開(kāi)發(fā)出的產(chǎn)品應(yīng)用領(lǐng)域非常廣泛,如聲控電話交換、信息網(wǎng)絡(luò)查詢、家庭服務(wù)、賓 館服務(wù)、醫(yī)療服務(wù)、銀行服務(wù)、工業(yè)控制、語(yǔ)音通信系統(tǒng)等,幾乎深入到社會(huì)的每個(gè)行業(yè) 和每個(gè)方面。廣泛意義上的語(yǔ)音識(shí)別按

2、照任務(wù)的不同可以分為4個(gè)方向:說(shuō)話人識(shí)別、關(guān)鍵詞檢出、語(yǔ)言辨識(shí)和語(yǔ)音識(shí)別1。說(shuō)話人識(shí)別技術(shù)是以話音對(duì)說(shuō)話人進(jìn)行區(qū)別,從而進(jìn)行身份鑒 別和認(rèn)證的技術(shù)。關(guān)鍵詞檢出技術(shù)應(yīng)用于一些具有特定要求的場(chǎng)合,只關(guān)注那些包含特定 詞的句子。語(yǔ)言辨識(shí)技術(shù)是通過(guò)分析處理一個(gè)語(yǔ)音片斷以判別其所屬語(yǔ)言種類的技術(shù),本 質(zhì)上也是語(yǔ)音識(shí)別技術(shù)的一個(gè)方面。語(yǔ)音識(shí)別就是通常人們所說(shuō)的以說(shuō)話的內(nèi)容作為識(shí)別 對(duì)象的技術(shù),它是4個(gè)方面中最重要和研究最廣泛的一個(gè)方向, 也是本文討論的主要內(nèi)容。1.1 語(yǔ)音識(shí)別技術(shù)現(xiàn)狀1.1.1 語(yǔ)音識(shí)別獲得應(yīng)用伴隨著語(yǔ)音識(shí)別技術(shù)的不斷發(fā)展,誕生了全球首套多語(yǔ)種交談式語(yǔ)音識(shí)別系統(tǒng) E-talk。這是全球惟

3、一擁有中英混合語(yǔ)言的識(shí)別系統(tǒng),能聽(tīng)能講普通話、廣東話和英語(yǔ), 還可以高度適應(yīng)不同的口音,因而可以廣泛適用于不同文化背景的使用者,尤其是中國(guó)地 區(qū)語(yǔ)言差別較大的廣大用戶。由于E-talk可以大大提高工作效率,降低運(yùn)營(yíng)成本,并為用戶提供更便捷的增值服務(wù),我們相信它必將成為電信、證券、金融、旅游等重視客戶服 務(wù)的行業(yè)爭(zhēng)相引用的電子商務(wù)應(yīng)用系統(tǒng),并成為電子商務(wù)發(fā)展的新趨勢(shì),為整個(gè)信息產(chǎn)業(yè) 帶來(lái)無(wú)限商機(jī)。目前,飛利浦推出的語(yǔ)音識(shí)別自然會(huì)話平臺(tái) SpeechPearl和SpeechMania已成功地應(yīng) 用于國(guó)內(nèi)呼叫中心,SpeechPearl中的每個(gè)識(shí)別引擎可提供高達(dá) 20萬(wàn)字的超大容量詞庫(kù), 尤其在具有

4、大詞匯量、識(shí)別準(zhǔn)確性和靈活性等要求的各種電信增值服務(wù)中有著廣泛的應(yīng) 用。1.1.2 語(yǔ)音合成信息服務(wù)被用戶接受語(yǔ)音合成技術(shù)把可視的文本信息轉(zhuǎn)化為可聽(tīng)的聲音信息,其應(yīng)用的經(jīng)濟(jì)效益和社會(huì)效 益前景良好。尤其對(duì)漢語(yǔ)語(yǔ)音合成技術(shù)的應(yīng)用而言,全球有十幾億人使用中文,其市場(chǎng)需 求、應(yīng)用前景和經(jīng)濟(jì)效益等可見(jiàn)一斑。語(yǔ)音技術(shù)已逐漸在電信聲訊信息服務(wù)領(lǐng)域智能電話查詢系統(tǒng)中展開(kāi)應(yīng)用,并迅速推 廣。在電話高度普及的今天,如果打電話就能查詢到所需信息,無(wú)疑將給人們的日常生活 帶來(lái)極大方便。漢語(yǔ)語(yǔ)音合成技術(shù)應(yīng)用到聲訊服務(wù)領(lǐng)域內(nèi),對(duì)現(xiàn)有的電話查詢系統(tǒng)將產(chǎn)生 革命性的影響。語(yǔ)音技術(shù)與互聯(lián)網(wǎng)已成功地結(jié)合。電話In ternet

5、 網(wǎng)關(guān)是一種用于實(shí)現(xiàn)電話網(wǎng)和In ternet網(wǎng)之間信息互訪的系統(tǒng)。簡(jiǎn)而言之,就是讓電話用戶能夠輕松地通過(guò)電話網(wǎng)訪問(wèn) In ternet網(wǎng)。利用語(yǔ)音合成技術(shù)的信息服務(wù)得到了用戶的廣泛接納,給用戶生活提供了極大的方便。1.1.3 面向?qū)ο蟮恼Z(yǔ)音編碼長(zhǎng)期以來(lái),在通信網(wǎng)的發(fā)展中,解決信息傳輸效率是一個(gè)關(guān)鍵問(wèn)題,極其重要。目前 科研人員已通過(guò)兩個(gè)途徑研究這一課題,其一是研究新的調(diào)制方法與技術(shù),來(lái)提高信道傳 輸信息的比特率,指標(biāo)是每赫茲帶寬所傳送的比特?cái)?shù);其二是壓縮信源編碼的比特率,例 如標(biāo)準(zhǔn)PCB編碼,對(duì)3.4KHZ頻帶信號(hào)需用64KHZ編碼比特率傳送,而壓縮這一比特率, 顯然可以提高信道傳送的話路數(shù)

6、。這對(duì)任何頻率資源有限的傳輸環(huán)境來(lái)說(shuō),無(wú)疑是極為重 要的,尤其是在無(wú)線通信技術(shù)決定今后通信發(fā)展命運(yùn)的今天更顯得重要。實(shí)際上,壓縮語(yǔ) 音編碼比特率與話音存儲(chǔ)、語(yǔ)音識(shí)別及語(yǔ)音合成等技術(shù)都直接相關(guān)。語(yǔ)音編碼技術(shù)的進(jìn)展對(duì)通信新業(yè)務(wù)的發(fā)展有極為明顯的影響,例如IP電話業(yè)務(wù)、實(shí)時(shí)長(zhǎng)途翻譯業(yè)務(wù)、交換機(jī)的人工智能接口等。因此,國(guó)際電報(bào)電話咨詢委員會(huì)(CCITT第15組提出了許多急需制訂的話音編碼標(biāo)準(zhǔn)建議,以推動(dòng)通信網(wǎng)的發(fā)展。由于VLDSI的發(fā)展,實(shí)現(xiàn)這一技術(shù)的代價(jià)已從在昂貴的信道中采用,發(fā)展到一般信道中都可接受的水平,因此,編碼技術(shù)日益受到重視。當(dāng)前,數(shù)字移動(dòng)通信和個(gè)人通信(PCN是深受人們重視的通信手段,其

7、重要問(wèn)題之一是壓縮語(yǔ)音編碼速率,形成面向?qū)ο蟮恼Z(yǔ)音編碼技術(shù)。數(shù)字語(yǔ)音編碼技術(shù)從1938年提出PCM開(kāi)始,其編碼方法已有了很大的發(fā)展,如 1968 年提出的線性預(yù)測(cè)編碼技術(shù)(LPC、20世紀(jì)70年代末出現(xiàn)的隱馬爾科夫技術(shù)(HMM以 及矢量量化(VQ等。1.1.4 口語(yǔ)機(jī)器翻譯受到重視口語(yǔ)翻譯的一個(gè)重要目的就是幫助聾啞人與正常人交流,近來(lái)越來(lái)越受到人們的重 視。首先,聾啞人要戴上一副特制的手套,計(jì)算機(jī)根據(jù)他打出的手語(yǔ)進(jìn)行識(shí)別,然后,通 過(guò)語(yǔ)音合成系統(tǒng)就可以把圖像信息翻譯成語(yǔ)言信息。同時(shí),系統(tǒng)還能夠完成將正常人的語(yǔ) 言翻譯成聾啞人的手語(yǔ),只要將正常人說(shuō)的話鍵入計(jì)算機(jī),經(jīng)程序分析處理之后,翻譯成有表

8、情、有動(dòng)作的三維圖像,從而最終達(dá)到聾啞人與正常人之間通過(guò)翻譯機(jī)進(jìn)行交流的目的。 口語(yǔ)翻譯的研究在其他很多方面都有重要價(jià)值,如用手勢(shì)控制計(jì)算機(jī),甚至用手勢(shì)導(dǎo)航等。1.2語(yǔ)音識(shí)別技術(shù)的發(fā)展1.2.1 神經(jīng)網(wǎng)絡(luò)用于訓(xùn)練韻律模型由于人工神經(jīng)網(wǎng)絡(luò)具備良好的自學(xué)習(xí)和自適應(yīng)能力,將其應(yīng)用于語(yǔ)音合成系統(tǒng)中的韻 律模型研究具有很重要的意義。將神經(jīng)網(wǎng)絡(luò)模型與已有的文語(yǔ)轉(zhuǎn)換系統(tǒng)有機(jī)結(jié)合,可以改 變傳統(tǒng)的文語(yǔ)轉(zhuǎn)換系統(tǒng)的韻律模型,具有更強(qiáng)的適應(yīng)性和可訓(xùn)練性,使合成語(yǔ)音的自然度 得到顯著提高,增加了系統(tǒng)的靈活性和風(fēng)格的多樣性。122 數(shù)據(jù)挖掘用于發(fā)現(xiàn)語(yǔ)音知識(shí)數(shù)據(jù)挖掘作為一種在大量數(shù)據(jù)庫(kù)中發(fā)現(xiàn)隱藏新知識(shí)的計(jì)算技術(shù)方法,通過(guò)

9、語(yǔ)音定性模 型的建立,將數(shù)據(jù)分析和挖掘結(jié)果轉(zhuǎn)化為邏輯規(guī)則或用可視化的形式進(jìn)行表達(dá)。因此,將 數(shù)據(jù)挖掘和人機(jī)交互接口緊密地聯(lián)系在一起,將對(duì)計(jì)算機(jī)語(yǔ)音信號(hào)處理的研究工作產(chǎn)生巨 大的推動(dòng)力,為語(yǔ)音信號(hào)處理提供了一條嶄新的研究途徑。1.2.3 文本-可視語(yǔ)音轉(zhuǎn)換系統(tǒng)研制成功文本-可視語(yǔ)音轉(zhuǎn)換技術(shù)的出現(xiàn)是多媒體技術(shù)迅速發(fā)展的產(chǎn)物也迎合了社會(huì)發(fā)展的需求。它給人們的生活增添了新的色彩,使計(jì)算機(jī)更加人性化,人們與計(jì)算機(jī)的交流變得 更為簡(jiǎn)單。相信在不久的將來(lái),它會(huì)在眾多的技術(shù)、商業(yè)和娛樂(lè)領(lǐng)域得到廣泛的應(yīng)用,并 逐步進(jìn)入我們每個(gè)人的生活。1.3語(yǔ)音識(shí)別技術(shù)的研究方向1.3.1 連續(xù)自然語(yǔ)音的識(shí)別與理解自然語(yǔ)音識(shí)別

10、與理解研究的是計(jì)算機(jī)如何理解人類的語(yǔ)言其目的就是讓計(jì)算機(jī)能夠理解人說(shuō)的話,當(dāng)我們使用計(jì)算機(jī)時(shí),要告訴它應(yīng)該做什么,它就能按照所理解的去執(zhí)行。 雖然現(xiàn)在自然語(yǔ)音識(shí)別與理解的理論研究得到了進(jìn)一步完善,同時(shí),計(jì)算機(jī)的功能、容量 和速度都有了很大的提高,但研究仍局限在對(duì)孤立音節(jié)的識(shí)別與理解上。人類流暢的自然 發(fā)音不是孤立音節(jié)發(fā)音的簡(jiǎn)單組合,它是在一定時(shí)間范圍內(nèi)輸出的一種連續(xù)語(yǔ)流,因此, 需要對(duì)連續(xù)語(yǔ)音進(jìn)行處理。連續(xù)語(yǔ)音識(shí)別與理解技術(shù)中需要解決的難點(diǎn)很多,對(duì)它的研究 是語(yǔ)音技術(shù)今后的目標(biāo)之一。1.3.2 高自然度、具有表現(xiàn)力的合成語(yǔ)音提高合成語(yǔ)音的自然度仍然是高性能文語(yǔ)轉(zhuǎn)換的當(dāng)務(wù)之急。就漢語(yǔ)語(yǔ)音合成來(lái)說(shuō)

11、,目前在單字和詞組級(jí)上,合成語(yǔ)音的可懂度和自然度已基本解決, 但是對(duì)于句子乃至篇章級(jí), 其自然度問(wèn)題就比較大。未來(lái)的文語(yǔ)轉(zhuǎn)換系統(tǒng)的發(fā)展趨勢(shì)是采用基于語(yǔ)境相關(guān)的合成思想 進(jìn)行設(shè)計(jì),能夠?qū)l(fā)音人的原始發(fā)音特征最大限度地保留下來(lái),輔助以先進(jìn)的層次化語(yǔ)言 韻律模型,通過(guò)分散統(tǒng)計(jì)的模型方法來(lái)涵蓋語(yǔ)義語(yǔ)音之間的內(nèi)在聯(lián)系,使系統(tǒng)能夠輸出具 有高自然度和表現(xiàn)力的合成語(yǔ)音。但是,在目前的合成系統(tǒng)中,普遍存在合成輸出語(yǔ)音的 機(jī)器味比較濃、語(yǔ)境的知識(shí)層次模型研究不完善等問(wèn)題。因此獲得高自然度、具有表現(xiàn)力的合成語(yǔ)音,也是今后語(yǔ)音技術(shù)的研究目標(biāo)之一。133語(yǔ)音技術(shù)與多媒體技術(shù)的結(jié)合伴隨著現(xiàn)代語(yǔ)音技術(shù)的不斷發(fā)展,人類對(duì)語(yǔ)

12、音信號(hào)的需要已經(jīng)不僅僅停留在可懂性和 正確性上,語(yǔ)音合成技術(shù)的研究方向已是合成語(yǔ)音的美感并同時(shí)輸出輔助的視頻特征,實(shí) 現(xiàn)虛擬主持人的效果,通過(guò)將視覺(jué)效果包括人的頭部建模、唇形同步技術(shù)和表情因素等視 頻信息的加入,可以更好地體現(xiàn)語(yǔ)音合成系統(tǒng)的表現(xiàn)力和感染力。因此,我們完全有理由 相信,語(yǔ)音技術(shù)和多媒體技術(shù)的有機(jī)結(jié)合將使合成系統(tǒng)展現(xiàn)出廣闊的應(yīng)用前景。1.3.4 語(yǔ)音技術(shù)與網(wǎng)絡(luò)技術(shù)的結(jié)合目前,語(yǔ)音技術(shù)已逐漸應(yīng)用于電信的聲訊信息服務(wù)領(lǐng)域和互聯(lián)網(wǎng)消息收發(fā)方面。隨 著電話網(wǎng)與互聯(lián)網(wǎng)的融合、網(wǎng)絡(luò)信息項(xiàng)目的增多和時(shí)效性要求逐步提高,建立適合于股票 交易、航班動(dòng)態(tài)查詢、電話自動(dòng)報(bào)稅等業(yè)務(wù)的語(yǔ)音系統(tǒng)成為可能,電話

13、用戶可以通過(guò)傳統(tǒng) 的語(yǔ)音、傳真獲取互聯(lián)網(wǎng)上無(wú)窮無(wú)盡的信息。這些業(yè)務(wù)將徹底解決傳統(tǒng)數(shù)字錄音回放技術(shù) 所無(wú)法解決的海量信息庫(kù)和動(dòng)態(tài)變化信息的實(shí)時(shí)生成與存儲(chǔ)的難題。因此,將語(yǔ)音技術(shù)與 網(wǎng)絡(luò)進(jìn)行完美的結(jié)合具有強(qiáng)大的生命力 。1.3.5 多語(yǔ)種語(yǔ)言是人們交流的工具,不同民族有自己不同的語(yǔ)言,不同語(yǔ)言之間的交流在今天開(kāi) 放的信息社會(huì)和網(wǎng)絡(luò)時(shí)代顯得十分重要,因此,多語(yǔ)種的文語(yǔ)合成有著獨(dú)特的應(yīng)用價(jià)值。 例如,在自動(dòng)電話翻譯、有聲電子郵件等應(yīng)用中都提出了多語(yǔ)種語(yǔ)音合成的需求,即使是 對(duì)漢語(yǔ)合成也有多方言文語(yǔ)轉(zhuǎn)換問(wèn)題。理想的多語(yǔ)種合成系統(tǒng)最好是各種語(yǔ)言共用一種合 成算法或語(yǔ)音合成器,但現(xiàn)有的語(yǔ)音合成系統(tǒng)大多是針對(duì)

14、某一種語(yǔ)言或若干種語(yǔ)言開(kāi)發(fā)出 來(lái)的,所采用的算法及規(guī)則都是與某種語(yǔ)言密切相關(guān)的,因此很難推廣到其他語(yǔ)種。如漢 語(yǔ)和西方語(yǔ)言之間存在著很大的差異,而目前國(guó)內(nèi)的系統(tǒng)都是做漢語(yǔ)英語(yǔ)轉(zhuǎn)換的,其韻律 控制規(guī)則完全不適合于英語(yǔ),而且它們主要是合成漢語(yǔ)普通話的,即使推廣到廣東話和上 海話都有相當(dāng)?shù)碾y度??梢?jiàn)要真正解決多語(yǔ)種的文語(yǔ)合成,從文本處理到語(yǔ)音合成都必須有新的思路,因此,研制多語(yǔ)種語(yǔ)音合成轉(zhuǎn)換系統(tǒng)具有重要的理論和現(xiàn)實(shí)意義。二 主要研究?jī)?nèi)容和方法語(yǔ)音識(shí)別技術(shù)是利用計(jì)算機(jī)對(duì)語(yǔ)音進(jìn)行特征提取,獲取最能表征語(yǔ)音特征的有用信 息,根據(jù)這些信息來(lái)對(duì)語(yǔ)音所代表的內(nèi)容或說(shuō)話人身份判斷的技術(shù)。因此需要對(duì)語(yǔ)音波形 的幅值

15、、頻率等特點(diǎn)進(jìn)行研究,我們把語(yǔ)音識(shí)別的研究?jī)?nèi)容大致可以分為語(yǔ)音提取,特征提取,語(yǔ)音識(shí)別,內(nèi)容分析,內(nèi)容匹配。在特征提取之前,一個(gè)重要的問(wèn)題是消除噪音、空白音及音長(zhǎng)不同的影響。根據(jù)語(yǔ)音 識(shí)別技術(shù)的發(fā)展歷史,語(yǔ)音識(shí)別方法大致可分為基于說(shuō)話人的語(yǔ)音識(shí)別方法、基于說(shuō)話內(nèi) 容的語(yǔ)音識(shí)別方法、基于統(tǒng)計(jì)的語(yǔ)音識(shí)別方法和基于網(wǎng)絡(luò)的語(yǔ)音識(shí)別方法。三基本設(shè)計(jì)要求及設(shè)計(jì)思路3.1 語(yǔ)音識(shí)別系統(tǒng)原理使用C語(yǔ)言編程,實(shí)現(xiàn)基于馬爾科夫模型的數(shù)據(jù)特征提取,在此基礎(chǔ)上編程實(shí)現(xiàn)特定 語(yǔ)音實(shí)例的語(yǔ)音識(shí)別;將語(yǔ)音識(shí)別功能編寫(xiě)成可供其他模塊調(diào)用的函數(shù),為進(jìn)一步實(shí)現(xiàn)語(yǔ) 音識(shí)別系統(tǒng)提供基礎(chǔ);并且從中培養(yǎng)、提高查閱文獻(xiàn)和綜合運(yùn)用知識(shí)的編程

16、開(kāi)發(fā)能力。語(yǔ)音識(shí)別本質(zhì)上是一種模式識(shí)別的過(guò)程,未知語(yǔ)音的模式與已知語(yǔ)音的參考模式逐一 進(jìn)行比較,最佳匹配的參考模式被作為識(shí)別結(jié)果。圖 1是基于模式匹配原理的自動(dòng)語(yǔ)音識(shí) 別系統(tǒng)原理框圖。語(yǔ)音信號(hào)輸丁預(yù)處理特征 q提取訓(xùn)練°1 J”參考模式判別識(shí)別 結(jié)果庫(kù)模式1匹配 *規(guī)則K圖1語(yǔ)音識(shí)別系統(tǒng)原理框圖(1)預(yù)處理模塊:對(duì)輸入的原始語(yǔ)音信號(hào)進(jìn)行處理,濾除掉其中的不重要的信息以及 背景噪聲,并進(jìn)行語(yǔ)音信號(hào)的端點(diǎn)檢測(cè)、語(yǔ)音分幀以及預(yù)加重等處理。(2)特征提取模塊:負(fù)責(zé)計(jì)算語(yǔ)音的聲學(xué)參數(shù),并進(jìn)行特征的計(jì)算,以便提取出反 映信號(hào)特征的關(guān)鍵特征參數(shù)用于后續(xù)處理。 現(xiàn)在較常用的特征參數(shù)有線性預(yù)測(cè)(LPC

17、)參數(shù)、 線譜對(duì)(LSP)參數(shù)、LPCC MFCC ASCC感覺(jué)加權(quán)的線性預(yù)測(cè)(PLP)參數(shù)、動(dòng)態(tài)差分參數(shù) 和高階信號(hào)譜類特征等1。其中,Mel頻率倒譜系數(shù)(MFCC參數(shù)因其良好的抗噪性和魯 棒性而應(yīng)用廣泛。(3) 訓(xùn)練階段:用戶輸入若干次訓(xùn)練語(yǔ)音,經(jīng)過(guò)預(yù)處理和特征提取后得到特征矢量參 數(shù),建立或修改訓(xùn)練語(yǔ)音的參考模式庫(kù)。(4) 識(shí)別階段:將輸入的語(yǔ)音提取特征矢量參數(shù)后與參考模式庫(kù)中的模式進(jìn)行相似性度量比較,并結(jié)合一定的判別規(guī)則和專家知識(shí)(如構(gòu)詞規(guī)則,語(yǔ)法規(guī)則等)得出最終的識(shí)別結(jié)果。3.2 語(yǔ)音識(shí)別的幾種基本方法當(dāng)今語(yǔ)音識(shí)別技術(shù)的主流算法,主要有基于動(dòng)態(tài)時(shí)間規(guī)整 (DTW)算法、基于非參數(shù)模

18、型的矢量量化(VQ)方法、基于參數(shù)模型的隱馬爾可夫模型 (HMM的方法、基于人工神經(jīng)網(wǎng) 絡(luò)(ANN)和支持向量機(jī)等語(yǔ)音。按照該過(guò)程,首先實(shí)現(xiàn)用 MATLAB®程的過(guò)程,然后將具體MATLAB勺程序用C語(yǔ)言改寫(xiě), 以便于在系統(tǒng)間進(jìn)行移植等。四預(yù)期的課題進(jìn)度計(jì)劃第1周-第2周:查閱、學(xué)習(xí)相關(guān)文獻(xiàn)資料,完成文獻(xiàn)綜述。第3周-第6周:了解基于馬爾科夫模型語(yǔ)音數(shù)據(jù)特征提取及語(yǔ)音數(shù)據(jù)特征識(shí)別的 基 本原理;學(xué)習(xí)所需的C語(yǔ)言編程技術(shù);進(jìn)行初步的實(shí)驗(yàn)編程。第7周-第9周:在初步的原理實(shí)驗(yàn)通過(guò)后,根據(jù)具體的應(yīng)用要求,編寫(xiě)、調(diào)試功 能較為全面的語(yǔ)音識(shí)別程序;實(shí)現(xiàn)基本的特征提取、識(shí)別功能。第10周-第12周:進(jìn)一步優(yōu)化程序,實(shí)現(xiàn)具有實(shí)用功能的應(yīng)用程序,完成外文文 獻(xiàn)譯稿。第13周-第14周:系統(tǒng)及程序測(cè)試,進(jìn)行系統(tǒng)的輸入,處理,輸出全面測(cè)試。進(jìn)行 實(shí)驗(yàn)報(bào)告總結(jié),撰寫(xiě)論文,完成畢業(yè)設(shè)計(jì)初稿。第15周:整理完成程序設(shè)計(jì)說(shuō)明書(shū),完善所有設(shè)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論