一種嵌入式語(yǔ)音識(shí)別控制模塊的設(shè)計(jì)與實(shí)現(xiàn)-圖文_第1頁(yè)
一種嵌入式語(yǔ)音識(shí)別控制模塊的設(shè)計(jì)與實(shí)現(xiàn)-圖文_第2頁(yè)
一種嵌入式語(yǔ)音識(shí)別控制模塊的設(shè)計(jì)與實(shí)現(xiàn)-圖文_第3頁(yè)
一種嵌入式語(yǔ)音識(shí)別控制模塊的設(shè)計(jì)與實(shí)現(xiàn)-圖文_第4頁(yè)
一種嵌入式語(yǔ)音識(shí)別控制模塊的設(shè)計(jì)與實(shí)現(xiàn)-圖文_第5頁(yè)
已閱讀5頁(yè),還剩6頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第16卷第4期廈門理工學(xué)院學(xué)報(bào)Vo.l16No.42008年12月JournalofXiamenUniversityofTechnologyDec.2008[收稿日期]2008-10-04[修回日期]2008-11-19[基金項(xiàng)目]福建省教育廳科技項(xiàng)目(JA08219[(,男,,,.一種嵌入式語(yǔ)音識(shí)別控制模塊的設(shè)計(jì)與實(shí)現(xiàn)徐敏1,鄒瑩2,魏洪興2(1.廈門理工學(xué)院電子與電氣工程系,福建廈門361024;2.北京航空航天大學(xué)機(jī)器人研究所,北京100191[摘要]在分析語(yǔ)音識(shí)別原理的基礎(chǔ)上,結(jié)合機(jī)器人系統(tǒng)人機(jī)交互需求,提出了一種基于Linux應(yīng)用平臺(tái)、S3C2410X為處理器的低功耗、高性能的嵌入式語(yǔ)音識(shí)別控制模塊,并分別從模塊的硬件結(jié)構(gòu)、軟件流程進(jìn)行分析和設(shè)計(jì),通過(guò)硬件平臺(tái)的搭建和軟件程序的實(shí)現(xiàn),達(dá)到了硬件設(shè)計(jì)簡(jiǎn)單、控制靈活、人機(jī)交互便捷的目的.[關(guān)鍵詞]機(jī)器人;語(yǔ)音識(shí)別;嵌入式系統(tǒng);隱式馬爾可夫模式[中圖分類號(hào)]TP391[文獻(xiàn)標(biāo)志碼]A[文章編號(hào)]1008-3804(200804-0043-040引言隨著計(jì)算機(jī)技術(shù)、模式識(shí)別等技術(shù)的發(fā)展,適應(yīng)不同場(chǎng)合的語(yǔ)音識(shí)別系統(tǒng)相繼被開發(fā)出來(lái),語(yǔ)音識(shí)別及處理技術(shù)在計(jì)算機(jī)、信息處理、通信與電子系統(tǒng)、自動(dòng)控制等領(lǐng)域的應(yīng)用也越來(lái)越廣泛.嵌入式語(yǔ)音識(shí)別技術(shù)已經(jīng)發(fā)展到第二代,即以隱式馬爾可夫模式識(shí)別方法為主要技術(shù)來(lái)實(shí)現(xiàn)對(duì)非特定語(yǔ)音的識(shí)別,這種技術(shù)的發(fā)展降低了識(shí)別計(jì)算復(fù)雜度,并提高了識(shí)別準(zhǔn)確率[1].同時(shí)在語(yǔ)音識(shí)別技術(shù)的革新中,也帶來(lái)了語(yǔ)音識(shí)別在機(jī)器人交互技術(shù)下一代的應(yīng)用革新.在智能機(jī)器人功能中,語(yǔ)音識(shí)別是人機(jī)交互的重要組成部分之一,而在語(yǔ)音采樣基礎(chǔ)上的識(shí)別,是機(jī)器人傳感器融合中的重要環(huán)節(jié),它用以接收人聲的控制命令和信息交互.在傳統(tǒng)的語(yǔ)音識(shí)別應(yīng)用中,多采用PC或DSP來(lái)實(shí)現(xiàn),前者的目的是利用PC較強(qiáng)的處理速度來(lái)實(shí)現(xiàn)模擬定點(diǎn)運(yùn)算,后者則是直接利用DSP的定點(diǎn)運(yùn)算能力完成,但二者的功耗均較大,不適合應(yīng)用于對(duì)功耗敏感的嵌入式計(jì)算場(chǎng)合.DSP處理器發(fā)展多年到今天已經(jīng)品種繁多,如TI公司和ADI公司等幾大陣營(yíng)有多款優(yōu)秀的DSP處理器芯片,但它們?nèi)匀粵]有能夠有效降低功耗到消費(fèi)電子的水平,使得使用高性能嵌入式處理器來(lái)模擬定點(diǎn)運(yùn)算,成為了這類低功耗需求的主要實(shí)現(xiàn)策略.語(yǔ)音識(shí)別除要求高識(shí)別率外,還應(yīng)考慮軟硬件設(shè)計(jì)簡(jiǎn)單、價(jià)格低廉、可移植性好、外圍控制靈活、人機(jī)交互便捷等特點(diǎn).為此,本文利用高性能ARM處理器S3C2410X來(lái)運(yùn)行語(yǔ)音識(shí)別引擎,設(shè)計(jì)了一種低功耗的嵌入式語(yǔ)音識(shí)別控制模塊,并已在娛樂機(jī)器人、教育機(jī)器人中得到成功應(yīng)用.1語(yǔ)音識(shí)別原理與功能分析11語(yǔ)音識(shí)別原理語(yǔ)音識(shí)別根據(jù)實(shí)際需要和應(yīng)用場(chǎng)合的不同,可以分為孤立詞識(shí)別和連續(xù)語(yǔ)音識(shí)別、特定人識(shí)別和非特定人識(shí)別.語(yǔ)音識(shí)別方法很多,如動(dòng)態(tài)時(shí)間歸整法(DynamicTimeWarping、隱式馬爾可夫法(HiddenMarkovModels、人工神經(jīng)網(wǎng)絡(luò)法(ArtificialNervalNetwork等,隱式馬爾可夫法對(duì)非特定人連續(xù)語(yǔ)音有很高的識(shí)別率,目前一般都采用基于隱式馬爾可夫法的識(shí)別方法作為基本算法,采用模廈門理工學(xué)院學(xué)報(bào)2008年式匹配的原理來(lái)實(shí)現(xiàn)語(yǔ)音識(shí)別功能.語(yǔ)音識(shí)別原理如圖1所示.預(yù)處理模塊,對(duì)輸入的原始語(yǔ)音信號(hào)進(jìn)行處理,濾除掉其中不重要的信息以及背景噪聲,并進(jìn)行語(yǔ)音信號(hào)的端點(diǎn)檢測(cè)、語(yǔ)音分幀以及預(yù)加重等處理.特征提取模塊,負(fù)責(zé)計(jì)算語(yǔ)音的聲學(xué)參數(shù),并進(jìn)行特征的計(jì)算,以便提取出反映信號(hào)特征的關(guān)鍵特征參數(shù),以降低維數(shù)并便于后續(xù)處理.在訓(xùn)練階段,用戶輸入若干次訓(xùn)練語(yǔ)音,系統(tǒng)經(jīng)預(yù)處理和特征提取后得到特征矢量參數(shù),建立或修改訓(xùn)練語(yǔ)音的參考模型庫(kù).在識(shí)別階段,將輸入的語(yǔ)音的特征矢量參數(shù)和參考模型庫(kù)中的模型進(jìn)行相似性度量比較,將相似度最高的模型所屬的類別作為識(shí)別的中間候選結(jié)果輸出.后處理模塊,對(duì)候選識(shí)別結(jié)果繼續(xù)處理,通過(guò)語(yǔ)言模型、詞法、句法、和語(yǔ)義信息的約束,得到最終的識(shí)別結(jié)果[2-3].12功能分析機(jī)器人的語(yǔ)音識(shí)別功能模塊作為一個(gè)可替換的獨(dú)立單元,其功能較為靜態(tài)、單一,人機(jī)交互的約束和邏輯確定,主要完成人與機(jī)器人模塊之間的音頻輸入處理,音頻數(shù)據(jù)采樣,音頻PCM數(shù)據(jù)處理,模式識(shí)別,進(jìn)而推理出有限詞條庫(kù)中對(duì)應(yīng)詞條文本的過(guò)程.其中數(shù)據(jù)采樣可以由專門的音頻A/D來(lái)實(shí)現(xiàn),音頻PCM數(shù)據(jù)處理和模式識(shí)別及推理可以由高性能ARM處理器實(shí)現(xiàn).另外,音頻的播放則也可以使用音頻D/A實(shí)現(xiàn)聲音輸出.為了實(shí)現(xiàn)上述處理和運(yùn)算,這里使用了ARM處理器.S3C2410X是Samsung公司推出的一款低價(jià)位、低功耗、高性能的32位RISC嵌入式處理器,外圍接口豐富,易于系統(tǒng)平臺(tái)構(gòu)建,具有內(nèi)置4KSRAM,內(nèi)置Flash控制器,LCD控制器,SD控制器,兩個(gè)USBHOST,一個(gè)USBDEVICE,4個(gè)PWM定時(shí)器和一個(gè)內(nèi)部定時(shí)器,看門狗定時(shí)器,117個(gè)通用I/O,56個(gè)中斷源,24個(gè)外部中斷,8通道10位ADC和觸摸屏接口,4個(gè)帶外部請(qǐng)求線的DMA等等,處理頻率可以達(dá)到200MHz,而功耗極低,不需要散熱片,適合低功耗的嵌入式語(yǔ)音識(shí)別控制[4].2模塊硬件結(jié)構(gòu)設(shè)計(jì)語(yǔ)音識(shí)別模塊的硬件結(jié)構(gòu)包括3個(gè)主要部分:核心系統(tǒng)部分,人機(jī)接口部分和調(diào)試接口部分如圖2所示.4421核心系統(tǒng)部分這部分主要是實(shí)現(xiàn)了基本的系統(tǒng)核心功能,即ARM處理器所需要的最小系統(tǒng).ARM系統(tǒng)的最小系統(tǒng)包括電源部分、處理器部分、復(fù)位電路、存儲(chǔ)器部分等.由于S3C2410支持NandFlashBoo,t因此在核心系統(tǒng)設(shè)計(jì)中,模塊采用了簡(jiǎn)潔的設(shè)計(jì),使用32MSDRAM和64MNandFlash,利用NandFlash既充當(dāng)啟動(dòng)存儲(chǔ)介質(zhì)又充當(dāng)系統(tǒng)存儲(chǔ)介質(zhì),其中SDRAM提供系統(tǒng)及應(yīng)用程序運(yùn)行的內(nèi)存空間,NandFlash主要存放系統(tǒng)內(nèi)核映像、系統(tǒng)庫(kù)、文件系統(tǒng)和應(yīng)用程序等.核心系統(tǒng)部分除了包含最小系統(tǒng)之外,還包含了音頻編解碼和放大部分.這里使用了集成芯片WM8731L和音頻運(yùn)算放大LMV358.其中WM8731L是Wolfson半導(dǎo)體公司生產(chǎn)的一款極高性價(jià)比的音頻DA芯片,其音頻接口使用標(biāo)準(zhǔn)IIS,并使用標(biāo)準(zhǔn)TTL的IIC接口進(jìn)行采樣控制,且?guī)в蠥D輸入采樣保持和增益開關(guān)等,與各種處理器的接口非常方便.在設(shè)計(jì)中使用S3C2410的IIS接口和IIC接口直接連接WM8731L,保持了整個(gè)設(shè)計(jì)的簡(jiǎn)潔.另外,還使用了穩(wěn)壓芯片進(jìn)行外部電源轉(zhuǎn)換,以提供整個(gè)模塊33V和18V電源的需要.22人機(jī)接口部分人機(jī)接口部分主要是與語(yǔ)音識(shí)別和基本交互密切相關(guān)的人機(jī)接口部分的電路和接插件等,如復(fù)位按鈕,電源接口,電源開關(guān)等,是實(shí)現(xiàn)人機(jī)交互的必要部分.23調(diào)試接口部分調(diào)試接口部分主要是實(shí)現(xiàn)對(duì)系統(tǒng)進(jìn)行調(diào)試的基本接口,該接口主要是對(duì)ARM系統(tǒng)的軟件運(yùn)行進(jìn)行監(jiān)視和交互,特別是在系統(tǒng)啟動(dòng)階段,調(diào)試接口的使用較多.ARM系統(tǒng)運(yùn)行的調(diào)試接口主要包含兩部分,一部分是下載接口,用來(lái)下載系統(tǒng)Bootloader和內(nèi)核映像,如JTAG、網(wǎng)絡(luò)接口等,另一部分是監(jiān)控接口,用于系統(tǒng)或應(yīng)用程序運(yùn)行加載的觀測(cè).調(diào)試接口部分只提供調(diào)試使用,而不保留在最終模塊上.3模塊實(shí)現(xiàn)與軟件設(shè)計(jì)模塊核心系統(tǒng)部分設(shè)計(jì)應(yīng)用了Linux系統(tǒng).在上述硬件系統(tǒng)上運(yùn)行Linux2613系統(tǒng)內(nèi)核,Linux2613包含了Alsa(AdvancedLinuxSoundArchitecture驅(qū)動(dòng)工程,提供了音頻AD/DAWM8731L的驅(qū)動(dòng)程序.在音頻數(shù)據(jù)輸入輸出采樣的基礎(chǔ)上編寫應(yīng)用程序,實(shí)現(xiàn)語(yǔ)音識(shí)別的實(shí)例:人與模塊之間簡(jiǎn)單對(duì)話應(yīng)答或命令操作.實(shí)現(xiàn)應(yīng)答首先需要指定可選的答復(fù)詞條以提供模式識(shí)別.在此基礎(chǔ)上,應(yīng)用包括3個(gè)部分:聲卡初始化,語(yǔ)音識(shí)別引擎操作和識(shí)別結(jié)果功能處理.如圖3所示.31聲卡初始化調(diào)用voice_init(函數(shù),初始化WM8731L并打開聲音采集和增益,進(jìn)行聲卡初始化配置,之32語(yǔ)音引擎操作第二代語(yǔ)音識(shí)別技術(shù)可以實(shí)現(xiàn)非特定人無(wú)訓(xùn)練的識(shí)別,只需要提前預(yù)置要識(shí)別的詞條,就可以得到模式識(shí)別匹配的結(jié)果,其識(shí)別準(zhǔn)確率在90%以上.非特定人的連續(xù)語(yǔ)音識(shí)別引擎的工作流程如下:初始化引擎設(shè)置詞條(開始識(shí)別返回識(shí)別結(jié)果停止,其中括號(hào)中內(nèi)容為循環(huán)執(zhí)行部分.程序的狀態(tài)轉(zhuǎn)換圖如圖3(a所示.初始化引擎:調(diào)用MSR_Init(void對(duì)語(yǔ)音識(shí)別引擎進(jìn)行基本的初始化工作.設(shè)置詞條:即向引擎狀態(tài)機(jī)中加入詞條組成的字符串,調(diào)用MSR_AddActiveWord(MSR_VOCABULARYHANDLEhVoc,char*word_inpu,tchar*word_name;其中參數(shù)hVoc為被識(shí)別詞條對(duì)應(yīng)的句柄,參數(shù)word_input注入預(yù)先需要識(shí)別的詞條,word_name參數(shù)一般使用NULL.識(shí)別:在配置好上述詞條后可以調(diào)用函數(shù)MSR_SetVocabularyToDecoder(MSR_VOCABULARYHANDLEhVoc使用該詞條,運(yùn)行MSR_Start(void啟動(dòng)識(shí)別引擎,在1s之內(nèi)即可輸出識(shí)別結(jié)果顯示相應(yīng)狀態(tài).停止:如需要停止運(yùn)行識(shí)別引擎,調(diào)用MSR_Stop(void執(zhí)行停止.按照上述流程把相應(yīng)步驟封裝為函數(shù),其函數(shù)接口如表1所示.應(yīng)用程序與識(shí)別引擎之間交互如圖3(b.表1語(yǔ)音識(shí)別函數(shù)接口Tab1Functioninterfaceofthespeechrecognition接口功能通信模式intinitialize(初始化引擎請(qǐng)求/應(yīng)答模式intsetItem(intid,Stringitem設(shè)置詞條請(qǐng)求/應(yīng)答模式voidstart(啟動(dòng)識(shí)別命令模式voidstop(停止識(shí)別命令模式SREvent返回識(shí)別結(jié)果id事件模式33識(shí)別結(jié)果功能處理在得到識(shí)別結(jié)果id后,執(zhí)行相應(yīng)的語(yǔ)音指令.若語(yǔ)音指令的行為效果為語(yǔ)音應(yīng)答,則調(diào)用mplayer播放預(yù)先存儲(chǔ)的wav文件,對(duì)應(yīng)產(chǎn)生音頻輸出,實(shí)現(xiàn)人機(jī)對(duì)話.若語(yǔ)音指令為操作行為,則執(zhí)行相應(yīng)的控制命令.4結(jié)語(yǔ)通過(guò)對(duì)一種基于ARM處理器的高性能低功耗嵌入式語(yǔ)音識(shí)別控制模塊的組成結(jié)構(gòu)、硬件系統(tǒng)和軟件流程進(jìn)行分析和設(shè)計(jì),達(dá)到了硬件設(shè)計(jì)簡(jiǎn)單、控制靈活、人機(jī)交互便捷的目的,而基于linux系統(tǒng)嵌入式應(yīng)用平臺(tái)和隱式馬爾可夫模式識(shí)別方法,識(shí)別率高、可移植性好、擴(kuò)展性強(qiáng).控制模塊在智能玩具、智能機(jī)器人等多個(gè)系統(tǒng)中得到應(yīng)用(如圖4所示,既可以單獨(dú)使用,亦可作為模塊嵌入到其它語(yǔ)音識(shí)別系統(tǒng)中應(yīng)用.[參考文獻(xiàn)][1]劉斌,杜利民.基于MPC5200的嵌入式非特定人連續(xù)語(yǔ)音識(shí)別系統(tǒng)[J].中國(guó)科學(xué)院研究生院學(xué)報(bào),2006(3:174177.[2]邢東洋,楊明極.非特定人語(yǔ)音指令識(shí)別系統(tǒng)的研究與實(shí)現(xiàn)[J].哈爾濱理工大學(xué)學(xué)報(bào),2008(4:7577.[3]趙力.語(yǔ)音信號(hào)處理[M].北京:機(jī)械工業(yè)出版社,2003.[4]王田苗,魏洪興.嵌入式系統(tǒng)設(shè)計(jì)與實(shí)例開發(fā)[M].北京:清華大學(xué)出版社,2008.(第4期趙晶,等:基于DSP的光伏并網(wǎng)系統(tǒng)的設(shè)計(jì)33(6:6769.[7]華建軍,沈艷霞,紀(jì)志成.基于PSIM斷續(xù)導(dǎo)通模式的DC-DC變換器的建模和仿真研究[J].電機(jī)與控制學(xué)報(bào),2007,11(5:522528.DesignofaGridconnectedPVSystemBasedonDSPZHAOJing1,LINGZhiqiang2(1.DepartmentofElectronicandElectricalEngineering,XiamenUniversityofTechnology,Xiamen361024,China;2.MywayLabsCo.Ltd.,Shanghai201203,ChinaAbstract:AphotovoltaicsystemintheplatformofDSPisintroducedinthispaperinwhichanewwayisappliedtotracethemaximumpowerpointbasedontheimprovedacceleratingsimplexmethodwithavoltagecontrolledfullbridgeinverter.Theonlinevariablestepcanalsoregulatethevoltageconvergencerate,andthephaselockedcontrolcircuitisdesignedtosynchronouslytracefrequencyandphaseofpowergridautomatically.TestdatashowthatthevariablestepMPPTalgorithmscombinedwiththeoptimizationtechnologycanquicklyandaccuratelytrackthemaximumpowerpointandthesmallerfluctuationsandthehigherstabilitycanthusbeachieved.Furthermore,theinvertercurrentandthepowervoltagefeedbacktothepowergridwiththesamefrequencyandthesamephasecaneffectivelyimprovetheefficiencyandreliabilityofinvertersystem.Keywords:DSP;gridconnectedPVsystem;modifiedacceleratingsimplexmethod;variablestep;phaselockedcontrol(上接第46頁(yè)DesignandImplementationofanEmbeddedSpeechRecognitionControlModuleXUMin1,ZOUYing2,WEIHongxing2(1.DepartmentofElectronicandElectricalEngineering,XiamenUniversityofTechnology,Xiamen361024,China;2.R

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論