軟件工程-需求分析文檔_第1頁(yè)
軟件工程-需求分析文檔_第2頁(yè)
軟件工程-需求分析文檔_第3頁(yè)
軟件工程-需求分析文檔_第4頁(yè)
軟件工程-需求分析文檔_第5頁(yè)
已閱讀5頁(yè),還剩5頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、手機(jī)語(yǔ)音識(shí)別系統(tǒng)需求分析文檔摘要 伴隨著科技進(jìn)步和全球信息交流的日益擴(kuò)大,嵌入式設(shè)備產(chǎn)品的市場(chǎng)規(guī)模在迅猛發(fā)展。追求小體積多功能嵌入式設(shè)備的必然趨勢(shì),使語(yǔ)音合成、語(yǔ)音識(shí)別、手寫輸入技術(shù)在嵌入式中的應(yīng)用成了最具吸引力的功能,因此今后嵌入式產(chǎn)品交互應(yīng)用的競(jìng)爭(zhēng)已演化成以此三項(xiàng)關(guān)鍵技術(shù)為核心的競(jìng)爭(zhēng)。語(yǔ)音識(shí)別是通過(guò)識(shí)別和理解過(guò)程把人類的語(yǔ)音信號(hào)轉(zhuǎn)變?yōu)槲谋净蛎畹募夹g(shù)。其根本目的就是研究出一種具有聽(tīng)覺(jué)功能的機(jī)器,這種機(jī)器能直接接受人的語(yǔ)音,理解人的意圖,并做出相應(yīng)的反應(yīng)。從技術(shù)看,它屬于多維模式識(shí)別和智能接口的范疇。語(yǔ)音識(shí)別技術(shù)是一項(xiàng)集聲學(xué)、語(yǔ)音學(xué)、計(jì)算機(jī)、信息處理、人工智能等于一體的綜合技術(shù),可廣泛應(yīng)用于

2、信息處理、通信與電子系統(tǒng)、自動(dòng)控制等領(lǐng)域。2010目 錄1.引言31.1編寫目的31.2項(xiàng)目背景31.3參考資料42數(shù)據(jù)描述42.1數(shù)據(jù)詞典43功能需求43.1功能劃分43.2功能描述53.2.1模塊名稱:語(yǔ)音信號(hào)的預(yù)處理63.2.2模塊名稱:特征提取模塊73.2.3參考模式庫(kù)模塊(詞條模塊)83.2.4 語(yǔ)音庫(kù)識(shí)別(匹配計(jì)算模塊)84性能需求94.1數(shù)據(jù)精確度94.2時(shí)間特性94.3適應(yīng)性91.引言1.1編寫目的伴隨著科技進(jìn)步和全球信息交流的日益擴(kuò)大,嵌入式設(shè)備產(chǎn)品的市場(chǎng)規(guī)模在迅猛發(fā)展。追求小體積多功能嵌入式設(shè)備的必然趨勢(shì),使語(yǔ)音合成、語(yǔ)音識(shí)別、手寫輸入技術(shù)在嵌入式中的應(yīng)用成了最具吸引力的功

3、能,因此今后嵌入式產(chǎn)品交互應(yīng)用的競(jìng)爭(zhēng)已演化成以此三項(xiàng)關(guān)鍵技術(shù)為核心的競(jìng)爭(zhēng)。語(yǔ)音識(shí)別是通過(guò)識(shí)別和理解過(guò)程把人類的語(yǔ)音信號(hào)轉(zhuǎn)變?yōu)槲谋净蛎畹募夹g(shù)。其根本目的就是研究出一種具有聽(tīng)覺(jué)功能的機(jī)器,這種機(jī)器能直接接受人的語(yǔ)音,理解人的意圖,并做出相應(yīng)的反應(yīng)。從技術(shù)看,它屬于多維模式識(shí)別和智能接口的范疇。語(yǔ)音識(shí)別技術(shù)是一項(xiàng)集聲學(xué)、語(yǔ)音學(xué)、計(jì)算機(jī)、信息處理、人工智能等于一體的綜合技術(shù),可廣泛應(yīng)用于信息處理、通信與電子系統(tǒng)、自動(dòng)控制等領(lǐng)域。本文檔為手機(jī)語(yǔ)音識(shí)別系統(tǒng)的設(shè)計(jì)、實(shí)現(xiàn)、測(cè)試以及驗(yàn)收提供重要依據(jù),也為評(píng)價(jià)系統(tǒng)功能和性能提供標(biāo)準(zhǔn)。本文檔可供用戶、項(xiàng)目管理人員、系統(tǒng)分析人員、程序設(shè)計(jì)人員以及系統(tǒng)測(cè)試人員閱讀和

4、參考。1.2項(xiàng)目背景嵌入式語(yǔ)音識(shí)別技術(shù)15J是指應(yīng)用各種先進(jìn)的微處理器在板級(jí)或芯片級(jí)用軟件或硬件實(shí)現(xiàn)語(yǔ)音識(shí)別。語(yǔ)音識(shí)別系統(tǒng)的嵌入式實(shí)現(xiàn),要求算法在保證識(shí)別效果的前提下盡可能優(yōu)化,以適應(yīng)嵌入式平臺(tái)存儲(chǔ)資源少,實(shí)時(shí)性要求高的特點(diǎn)。實(shí)驗(yàn)室中高性能的大詞匯量連續(xù)語(yǔ)音識(shí)別系統(tǒng)代表當(dāng)今語(yǔ)音識(shí)別技術(shù)的先進(jìn)水平。但是由于嵌入式平臺(tái)資源和速度方面的限制,嵌入式實(shí)現(xiàn)尚不成熟。而中小詞匯量的命令詞語(yǔ)音識(shí)別系統(tǒng)算法相對(duì)簡(jiǎn)單,對(duì)資源的需求較小,且系統(tǒng)識(shí)別率較高,能滿足大多數(shù)應(yīng)用的要求,成為嵌入式應(yīng)用的主選。當(dāng)前,語(yǔ)音識(shí)別技術(shù)得到了廣泛應(yīng)用。有些電話機(jī)、手機(jī)已經(jīng)包含了語(yǔ)音識(shí)別撥號(hào)功能,還有語(yǔ)音記事本、語(yǔ)音智能玩具等產(chǎn)品也

5、包括語(yǔ)音識(shí)別與語(yǔ)音合成功能。人們可以通過(guò)電話網(wǎng)絡(luò)用語(yǔ)音識(shí)別口語(yǔ)對(duì)話系統(tǒng)查詢機(jī)票、旅游、銀行信息,并且取得很好的結(jié)果。但是可隨身攜帶的嵌入式語(yǔ)音識(shí)別產(chǎn)品在人們的日常生活中尚不多見(jiàn),該領(lǐng)域具有廣闊的市場(chǎng)前景。在這種背景下,論文旨在根據(jù)現(xiàn)實(shí)生活需要,在對(duì)語(yǔ)音識(shí)別的嵌入式實(shí)現(xiàn)進(jìn)行研究和了解的基礎(chǔ)上,進(jìn)行了基于模板匹配法的特定人、小詞匯量語(yǔ)音識(shí)別系統(tǒng)研究,應(yīng)!用于日常生活中,以方便人們的日常生活、提高人們的生活質(zhì)量。從人機(jī)接口的角度看,就是使人們甩掉鍵盤,通過(guò)語(yǔ)音命令操作。項(xiàng)目委托單位:軟件工程課程項(xiàng)目項(xiàng)目開(kāi)發(fā)單位: 長(zhǎng)春工業(yè)大學(xué)軟件職業(yè)技術(shù)學(xué)院項(xiàng)目主管部門: 長(zhǎng)春工業(yè)大學(xué)軟件職業(yè)技術(shù)學(xué)院1.3參考資料

6、1. 軟件工程文檔模版2. Data Base System Concepts (4th edition) Abraham Silberschatz et al.3. Software Engineering: A Practitioners Approach (6th edition) Roger S. Pressman2數(shù)據(jù)描述主程序使能音頻模塊,從音頻模塊的緩沖區(qū)內(nèi)讀取語(yǔ)音數(shù)據(jù)到DDR SDRAM 存儲(chǔ)器中。當(dāng)音頻模塊緩沖區(qū)全部為空時(shí),主程序?qū)DR 內(nèi)的數(shù)據(jù)進(jìn)行預(yù)處理、端點(diǎn)檢測(cè)、線性預(yù)測(cè)倒譜系數(shù)(L PCC) 的提取。如果在訓(xùn)練階段, 此時(shí)的L PCC 系數(shù)被當(dāng)作模板存入到FLASH

7、中。如果在識(shí)別階段,L PCC 系數(shù)則會(huì)被調(diào)入DDR 存儲(chǔ)器中與測(cè)試模板進(jìn)行模式匹配,并給出識(shí)別結(jié)果。模式匹配算法采用動(dòng)態(tài)時(shí)間規(guī)整(DTW)算法 2 2.1數(shù)據(jù)詞典數(shù)據(jù)從程序內(nèi)部分離出來(lái),形成獨(dú)立的外部數(shù)據(jù)文件。靜態(tài)數(shù)據(jù)文件與動(dòng)態(tài)數(shù)據(jù)文件相互獨(dú)立,依靠特定程序分別進(jìn)行參照或存取。 靜態(tài)數(shù)據(jù)由外部數(shù)據(jù)文件存放方式轉(zhuǎn)為數(shù)據(jù)庫(kù)存放方式,將以前程序中靜態(tài)數(shù)據(jù)對(duì)動(dòng)態(tài)數(shù)據(jù)加工的某些控制關(guān)系抽象為靜態(tài)表與動(dòng)態(tài)表間關(guān)系名字:語(yǔ)音信號(hào)信息描述:用戶語(yǔ)音輸入定義:語(yǔ)音信號(hào)=模擬信號(hào)+數(shù)字信號(hào)+語(yǔ)音幀+語(yǔ)音特片+語(yǔ)音特征名字:參考模式庫(kù)描述:標(biāo)準(zhǔn)語(yǔ)音特征定義:參考模式庫(kù)=語(yǔ)音特征+語(yǔ)音串內(nèi)容名字:聲學(xué)模型描述:標(biāo)準(zhǔn)

8、語(yǔ)音特征定義:聲學(xué)模型=語(yǔ)音狀態(tài)+語(yǔ)音矢量3功能需求3.1功能劃分本軟件具有如下主要模塊:l 預(yù)處理模塊l 特征提取模塊l 訓(xùn)練模塊l 參考模式庫(kù)模塊l 相似性度量即識(shí)別模塊頂層(第0層)數(shù)據(jù)流圖(DFD):用戶手機(jī)語(yǔ)音短信識(shí)別系統(tǒng)手機(jī)短信編輯語(yǔ)音信號(hào)識(shí)別出的文字3.2功能描述詳見(jiàn)第一層數(shù)據(jù)流圖2.特征提取5.匹配計(jì)算語(yǔ)音庫(kù)處理后的語(yǔ)音信號(hào)特征語(yǔ)音特征4.詞條模型處理語(yǔ)音識(shí)別詞條信息語(yǔ)音信息1.語(yǔ)音信號(hào)預(yù)處理語(yǔ)音信號(hào)3訓(xùn)練語(yǔ)音特征特征模式3.2.1模塊名稱:語(yǔ)音信號(hào)的預(yù)處理預(yù)處理模塊,對(duì)輸入的原始語(yǔ)音信號(hào)進(jìn)行處理,濾除其中的不重要的信息及背景噪音等,進(jìn)行語(yǔ)音信號(hào)的端點(diǎn)檢測(cè),即判定語(yǔ)音有效范圍的

9、始點(diǎn)和終點(diǎn)位置,并進(jìn)行語(yǔ)音分幀以及預(yù)加重等處理工作。 1.1語(yǔ)音的采樣1.2 A/D變換1.3 分幀語(yǔ)音信號(hào)1.4特片提取1.5端點(diǎn)檢測(cè)語(yǔ)音模擬信號(hào)語(yǔ)音數(shù)字信號(hào)語(yǔ)音幀語(yǔ)音特片處理后的語(yǔ)音信息3.2.2模塊名稱:特征提取模塊特征提取模塊,負(fù)責(zé)計(jì)算語(yǔ)音的聲學(xué)參數(shù),進(jìn)行特征的計(jì)算,取出反映信號(hào)特征的關(guān)鍵特征參數(shù),以降低維數(shù),便于后續(xù)處理。語(yǔ)音識(shí)別系統(tǒng)常用的特征參數(shù)有幅度,能量,過(guò)零率,線性預(yù)測(cè)系數(shù)(LPC)、LPC倒譜系數(shù)(LPCC)、線譜對(duì)參數(shù)(LSP)、短時(shí)頻譜、共振峰頻率、反映聽(tīng)覺(jué)特征的Mel頻譜倒譜系數(shù)(MFCC)等。特征選擇和提取是構(gòu)建系統(tǒng)的關(guān)鍵。 2.1計(jì)算語(yǔ)音聲學(xué)參數(shù)2.2特征計(jì)算處理

10、后的語(yǔ)音信號(hào)聲學(xué)參數(shù)信號(hào)特征值模塊名稱:訓(xùn)練模塊功能概述 在訓(xùn)練階段,用戶輸入若干次訓(xùn)練語(yǔ)音,系統(tǒng)經(jīng)過(guò)預(yù)處理和特征提取得到特征矢量參數(shù)(序列),然后通過(guò)特征建模模塊建立訓(xùn)練語(yǔ)音的參考模式庫(kù)。在識(shí)別階段,將輸入語(yǔ)音的特征矢量參數(shù)和參考模板庫(kù)中的模式進(jìn)行相似性度量比較,將相似度最高的模式所屬的類別作為識(shí)別中間候選結(jié)果輸出。后處理模塊,是對(duì)上述得到的候選識(shí)別結(jié)果繼續(xù)處理,通過(guò)更多的識(shí)別約束,得到最終結(jié)果。3.1預(yù)處理得到特征矢量參數(shù)3.2建立特征參數(shù)模型語(yǔ)音特征值特征模型特征矢量3.2.3參考模式庫(kù)模塊(詞條模塊)功能概述接受用戶輸入的語(yǔ)音信息,經(jīng)提取的語(yǔ)音特征并同時(shí)從語(yǔ)音庫(kù)中獲取特征值,形成詞條模

11、型,選取匹配提條,并輸出。4.1詞條模型形成語(yǔ)音特征語(yǔ)音庫(kù)獲取特征值4.2選取匹配詞條詞條信息詞條信息3.2.4 語(yǔ)音庫(kù)識(shí)別(匹配計(jì)算模塊)功能概述在語(yǔ)音庫(kù)識(shí)別階段,將輸入語(yǔ)音的特征矢量參數(shù)和參考模板庫(kù)中的模式進(jìn)行相似性度量比較,將相似度最高的模式所屬的類別作為識(shí)別中間候選結(jié)果輸出。匹配計(jì)算模塊,是對(duì)上述得到的候選識(shí)別結(jié)果繼續(xù)處理,通過(guò)更多的識(shí)別約束,得到最終結(jié)果。5.1比較相似性5.2篩選相似性高的輸出提取的語(yǔ)音特征詞庫(kù)中特征相似值語(yǔ)音信息到手機(jī)4接口需求4.1用戶接口需求用戶需用麥克風(fēng)輸入數(shù)據(jù)。4.2硬件接口需求本識(shí)別系統(tǒng)是在與Infineon公司合作開(kāi)發(fā)的芯片UniSpeech上實(shí)現(xiàn)的。UniSpeech芯片是為語(yǔ)音信號(hào)處理開(kāi)發(fā)的專用芯片,采用0.18m工藝生產(chǎn)。它將雙核(DSP MCU)、存儲(chǔ)器、模擬處理單元(ADC與DAC)集成在一個(gè)芯片中,構(gòu)成了一種語(yǔ)音處理SoC芯片。這種芯片的設(shè)計(jì)思想主要是為語(yǔ)音識(shí)別和語(yǔ)音壓縮編碼領(lǐng)域提供一個(gè)低成本、高可靠性的硬件平臺(tái)4.3軟件接口需求聲學(xué)模型的建立,語(yǔ)音庫(kù)的建立,手機(jī)輸出平臺(tái)4.3通信接口需求需要用麥克風(fēng)進(jìn)行輸入,輸出時(shí)候用手機(jī)短信編輯狀態(tài)輸出5性能需求5.1數(shù)據(jù)精確度

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論