語音小車論文(打印版)_第1頁
語音小車論文(打印版)_第2頁
語音小車論文(打印版)_第3頁
語音小車論文(打印版)_第4頁
語音小車論文(打印版)_第5頁
已閱讀5頁,還剩60頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、編號: 畢業(yè)設計說明書題 目: 基于單片機的語音控制 小車系統(tǒng)設計與實現(xiàn) 學 院: 機電工程學院 專 業(yè):機械設計制造及其自動化學生姓名: 徐海棟 學 號: 1101111030 指導教師: 廖宏誼 職 稱: 教授 題目類型: 理論研究 實驗研究 ü 工程設計 工程技術(shù)研究 軟件開發(fā)2015年5月26日摘 要在科技革命日新月異的創(chuàng)新發(fā)展過程中,人們越來越離不開智能化的科技時代;就此,機器的語音智能化扮演著越來越重要的角色,人類所追求的機器人性化,就是讓機器能夠聽懂我們?nèi)祟惖恼Z言,并以此為目的使機器為我們?nèi)祟惙?,在這個探尋的過程中,語音識別成為人與機器溝通的核心。本課題為語音小車的設

2、計,設計難點也主要在于語音的識別技術(shù),通過多方面的學習參考文獻,最終確定語音小車的設計方案,讓小車能夠聽懂人的話語命令動作起來。小車主體硬件結(jié)構(gòu)主要采用ICRoute 公司生產(chǎn)的高性能語音識別芯片LD3320作為語音識別模塊,專門負責接收、識別外界的語音信號,在內(nèi)部通過處理,轉(zhuǎn)換成數(shù)字信號;使用STC11L08XE單片機作為主控模塊,專門負責處理接受的語音信號,把處理后的語音信號轉(zhuǎn)換成小車的控制信號;使用L298N作為小車電機的驅(qū)動模塊,該芯片是ST公司生產(chǎn)的一種高電壓大電流的電機驅(qū)動芯片,當接收到單片機發(fā)出的控制信號時,用于控制小車的啟動、停止和轉(zhuǎn)向;在軟件上,通過單片機向LD芯片寫入需要識

3、別的關(guān)鍵字,由LD內(nèi)部非特定人識別的算法得出匹配結(jié)果,再由單片機獲取結(jié)果執(zhí)行操作,其次,使用單片機內(nèi)部定時計數(shù)器T0通過計數(shù)的方式產(chǎn)生PWM方波調(diào)壓,控制小車輸出電壓,實現(xiàn)非特定人語音控制小車前進、后退、左轉(zhuǎn)、右轉(zhuǎn)、加速、減速、停止等運動狀態(tài),由于所選語音芯片工作性能穩(wěn)定,在反復的實驗調(diào)試中,小車都能夠有效的識別聲音,最終,穩(wěn)定的實現(xiàn)各個運動要求,完成課題設計要求。關(guān)鍵詞:單片機;語音識別;LD3320;L298N;語音控制 AbstractIn the process of innovation and development of science and technology change

4、 rapidly in revolution, people are increasingly inseparable from the intelligent era of science and technology; and thus, voice intelligent machines playing more and more important role, the pursuit of human nature of robot, is to allow the machine to be able to understand our language and for this

5、purpose to make the machine for our human services, in the search process, speech recognition has become the core of human and machine communication. The topic to speech car design, design difficulties mainly in that the speech recognition technology, through a wide range to learn References , ultim

6、ately determine the design of the voice car, let the car able to understand human speech a command action to work effectively. The car body structure of the hardware consists of ICRoute's high performance speech recognition LD3320 chip as a voice recognition module, be responsible for receiving,

7、 identifying external voice signal and converted into digital signal by processing; Using STC11L08XE microcontroller as the main control module, responsible for processing voice signals, converts the processed voice signal into a control signal car; A kind of motor driver chip L298N with high voltag

8、e and large current produced by ST company as the motor vehicle driver module, upon receiving the single chip microcomputer control signal, used to control the car start, stop, and turn; On the software, through the single chip microcomputer to write need keywords into LD3320 chip , the matching res

9、ults are obtained by the algorithm of the non-specific person identification in the chip, perform an operation by single chip microcomputer to obtain results , second, the use of single chip microcomputer internal timing counter T0 by way of counting PWM square wave voltage regulation , the car outp

10、ut voltage control ,to achieve non-specific voice control car forward, backward, turn left turn right, speed up, slow down, stop and other sports status, because the selected the voice chip performance and stability, in repeated the experiment in debugging, the car are able to recognize the voice ef

11、fectively, to implement various requirements of movement Stability ,complete the task design requirements.Keywords: single chip microcomputer; speech recognition; LD3320; L298N; voice control目 錄引言11 緒論21.1 國內(nèi)外語音識別技術(shù)的發(fā)展現(xiàn)狀21.2 課題設計意義31.3 課題設計方案32 語音小車硬件設計62.1 語音小車原理框圖62.2 語音識別模塊72.2.1語音接收識別模塊92.2.2語音芯

12、片部分邏輯電路112.2.3單片機模塊142.3 電源模塊162.4 電機驅(qū)動模塊173 語音小車軟件設計193.1 系統(tǒng)軟件流程圖193.2 語音識別流程圖203.3 LD語音模塊設計213.4 PWM模塊設計233.5 軟件開發(fā)平臺253.5.1系統(tǒng)編程軟件keil uvision4253.5.2 USB轉(zhuǎn)串口下載器工具254 系統(tǒng)調(diào)試264.1 軟件調(diào)試264.2 硬件調(diào)試294.2.1電路焊接測試294.2.2 LM2940穩(wěn)壓輸出測試304.2.3 LM2940穩(wěn)壓輸出測試314.2.4小車PWM電壓輸出測試314.3 語音小車整體調(diào)試335 設計總結(jié)34謝 辭35參考文獻36附 錄

13、.37第 61 頁 共 58頁桂林電子科技大學畢業(yè)設計(論文)報告用紙引言自動語音識別技術(shù)在很久以前就為科學家們所想到?;谌祟愓Z音是現(xiàn)如今普遍的通信基礎(chǔ),所以在人與機器人的交互當中,語音識別技術(shù)是關(guān)鍵。隨著計算機和語音處理技術(shù)的發(fā)展,語音識別系統(tǒng)的實用性將進一步提高1 何燕玲. 中文特定人孤立詞語音識別系統(tǒng)的開發(fā)與研究D.四川:西南科技大學,2007.。國外已有多種基于語音識別產(chǎn)品的應用,這預示著語音識別技術(shù)有著非常廣泛的應用領(lǐng)域和市場前景。語音智能語音小車現(xiàn)在不僅作為一種新型的玩具,備受廣大的群眾喜歡,它也成為我們大學里面學習內(nèi)容的一部分,在設計制作小車的方面,我們能夠了解學習到關(guān)于語音識

14、別系統(tǒng)的知識,隨著科技的發(fā)展,現(xiàn)在的語音智能化很普遍了。語音識別是通過讓機器人“知道、讀懂”人類發(fā)出的語言,并通過內(nèi)部處理,產(chǎn)生相應的命令指令來操作動作。隨著微電子技術(shù)的發(fā)展,現(xiàn)如今聲控技術(shù)為人們提供著各種便利,就聲控玩具車而言,提高系統(tǒng)的濾噪性能,能準確的識別語音,并進行良好的控制,還有一些是作為看門狗的語音系統(tǒng)及現(xiàn)在應用在汽車當中的語音智能系統(tǒng),但是聲控的技術(shù)由于噪聲的原因控制不理想,所以現(xiàn)在的狀況是如何提高語音技術(shù)的時效性和對環(huán)境的適應性,以及能夠識別多人語音。隨著科技的發(fā)展,我們的生活中越來越離不開智能化的機器, 智能化產(chǎn)品已經(jīng)成為我們?nèi)祟惿鐣钪胁豢煞指畹囊徊糠?;由于日常生活的要?/p>

15、以及人類消遣娛樂的要求不一樣,科技的市場為我們創(chuàng)造出許多智能機器,有一些是手動智能化的產(chǎn)品,當然也有語音智能化的機器,語音智能機器的到來大大的為人類做出了許多貢獻?,F(xiàn)如今,機器人的發(fā)展越來越多樣化,也越來越受到廣大人們的喜愛,幾乎滲透在我們生活的所有鄰域,在人與機器的溝通方面,語音識別技術(shù)的發(fā)展成為不可或缺的關(guān)鍵,在語音識別技術(shù)里,首先是要提取語音的特征參量,在人說話產(chǎn)生的語音信號里面提取有用的信息進行語音的識別,當然人們所說的話語中,由于人的發(fā)聲結(jié)構(gòu)的差異性,導致每個人說的話都有一定的區(qū)別,在語音特征參量的提取中,會考慮到這些音普、基音以及元音輔音和擦音等要素。語音識別技術(shù)有兩類,即特定和非

16、特定識別,特定人識別就是只識別出聲音特定的人,該聲音頻譜唯一,繼而不適用多人語音識別;而非特定人識別技術(shù)恰恰相反,不分男女老少年齡大小,都可以識別出來,所以比較適用于廣泛人群。1 緒論1.1 國內(nèi)外語音識別技術(shù)的發(fā)展現(xiàn)狀與機器交流一直是人們的夢想,人們也在一直不斷的探索研究著,如今語音識別技術(shù)的發(fā)展也已經(jīng)逐步成熟2 禹琳琳. 語音識別技術(shù)及應用綜述J. 現(xiàn)代電子技術(shù),2013,13:43-45.,它在高新信息產(chǎn)業(yè)的人機交互中起著關(guān)鍵性作用,語音識別技術(shù)是今后和未來智能化發(fā)展的一個重要突破口。國外語音識別技術(shù)的快速發(fā)展是在上個世紀的九十年代3 佘利忠. 基于神經(jīng)網(wǎng)絡的漢語數(shù)碼語音識別技術(shù)研究D.

17、湖南師范大學,2008.;早在五十年代初期,外國人研發(fā)了一臺能識別10個數(shù)字英文發(fā)音的系統(tǒng),現(xiàn)如今的語音識別技術(shù)又有了新的發(fā)展方向,即分為特定與非特定連續(xù)語音識別,還分有大詞匯量的語音識別和孤立詞識別以及多人語音識別等,在該技術(shù)的鄰域里面,還運用了神經(jīng)網(wǎng)絡技術(shù)。由于前期許多大公司對語音識別技術(shù)的投入很大的資本,使其發(fā)展非常迅速;九十年代后,語音識別技術(shù)的評估機制不斷提高,在語音識別的準確率上也顯著提升4 郭恒飛. 基于非特定人車載電器語音集成控制系統(tǒng)的設計與實現(xiàn)D.合肥工業(yè)大學,2011.;如今,語音產(chǎn)品非常的多元化,國外非常著名的語音系統(tǒng)有Siri、Google Now以及微軟Cortana

18、,這些技術(shù)都基本應用在手機,Siri衍生于美國國防部的研究產(chǎn)品,它原是主要使用在為軍方處理一些復雜的事情,如今成為民用軟件,成為人們學習生活的個人助理,Siri成立于2007年,通過與Nuance合作,發(fā)展成為真正的語音識別工具,Siri能夠在如今的手機當中成為一個使用的機器人,人類通過自然的語音輸入,使它能夠搜索資料、播報實況、安排行程、提問對答等;除了SIri 外其他的語音識別軟件的使用在生活當中也都是大同小異,都是為人們提供快速便捷的服務。在五十年代,我國開始研究語音識別技術(shù),由于科技的發(fā)展相當快速,語音識別的研究進展也很快。以前只是在實驗室里探索研究,現(xiàn)如今已發(fā)展到面向生活實際。在80

19、年代后期,由于我國對語音識別技術(shù)發(fā)展執(zhí)行相關(guān)計劃,我們的語音識別技術(shù)的發(fā)展進入到一個全新的發(fā)展階段,大部分權(quán)威的科研機構(gòu)都曾經(jīng)在實驗室進行過語音識別技術(shù)方面的研究5 彭輝,魏瑋,陸建華. 特定人孤立詞的語音識別系統(tǒng)研究J. 控制工程,2011,03:397-400+404.。據(jù)報道,在07年某月北京的自然博物館中,新開展館展出了一只具有語音對話功能的智能熊貓,其外形逼真,當人和它說話的時候,它能夠在人多嘈雜的展館中識別出人說的話,識別成功率也很高;之后了解到它是在非特定人連續(xù)語音識別系統(tǒng)上開發(fā)制作的,基于該系統(tǒng)特性,這只機器熊貓識別人們說話的成功率在98%左右,所以在展館中非常有趣。隨著對語音

20、識別技術(shù)的著重發(fā)展,特別是人們生活中,小詞匯量的非特定人語音識別使用廣泛,受日常人們的生活需要,且識別率很高,因而這也足以證明:人們在平常生活中,中小詞匯量的非特定人識別技術(shù)是即實用又受歡迎的。在2009年前后,由于語音識別解碼器的高度集成發(fā)展為我國的語音識別實時應用提供了殷實的基礎(chǔ);隨著互聯(lián)網(wǎng)的發(fā)展,我國著名的語音識別系統(tǒng)有百度語音,它不僅提供一般的語音服務,在手機及導航中,為用戶定制了特色的搜索服務。到現(xiàn)在,我國語音識別技術(shù)也相對成熟,國內(nèi)該方向上的研究水平也與國外差不多,除此外,在漢語識別的技術(shù)上,我們擁有技術(shù)上特點與優(yōu)勢,該技術(shù)加有我們中國獨有的特色元素。1.2 課題設計意義 在大多數(shù)

21、的小車設計中,小車的控制都是基于手動遙控控制小車的運動狀態(tài),需要操作人員通過用手操控遙控裝置來實現(xiàn),對此,本次課題設計主要是通過語音來控制小車,從而解放我們的雙手,做到更加智能化的控制小車,打破傳統(tǒng)的小車控制操作,讓小車明白你說了什么,并根據(jù)說出的口令命令進行相應動作,開創(chuàng)新的小車控制方式,;語音小車在現(xiàn)代的玩具制造業(yè)中也占據(jù)著重要的地位,小車以語音控制的這一新穎控制方式,受到很多小孩子的喜歡,他們可以像動畫片中的主人公一樣,擁有一個屬于自己的機器人,能夠?qū)λM行語音控制,提高了玩具的趣味性;就此,我們的課題以非特定人語音識別展開設計,語音識別的研究在語音識別系統(tǒng)穩(wěn)定實用化中成為一個非常重要的

22、方向6 張利平. 漢語連續(xù)語音識別系統(tǒng)的研究與實現(xiàn)D.西北大學,2010.。語音識別技術(shù)的研究取得了顯著的進步,從以前的假想實現(xiàn)成為現(xiàn)實;如現(xiàn)在的智能玩具市場中,智能小車作為微電子智能玩具是面向廣大群眾需求的主流,這區(qū)別于傳統(tǒng)式的手遙控小車運動方式,大大的帶給人們一種前所未有的新鮮感,在這些設計系統(tǒng)當中,語音識別技術(shù)是關(guān)鍵,讓人們體驗到不用動手只用開口的真正智能化。通過課題設計,我自己也能了解學到一些有關(guān)語音識別技術(shù)方面的知識,這些知識區(qū)別于我所在學校學到的傳統(tǒng)基礎(chǔ)知識,它能讓自己大開眼界,了解到現(xiàn)在的語音識別科技的發(fā)展趨勢,設計中,也讓自己把在學校中學到的知識重新的復習了一遍,讓自己受益匪淺

23、。語音識別技術(shù)的應用也很廣,不僅僅局限于玩具小車的設計中,在現(xiàn)在的高端產(chǎn)品中都擔任著重要的角色,如家具電器、智能手機、智能導航儀等中都發(fā)揮著不可估量的作用。因此,展開語音小車的設計是非常有意義的。1.3 課題設計方案經(jīng)過多方的學習參考文獻資料,由此得出了三種最初的設計方案,并加以認真考慮那種方法最為適于課題的設計。方案一:采用STC11L08XE單片機作為主控芯片,語音識別模塊使用LD3320語音芯片,在該模塊上也集成有REG1117-3.3V的穩(wěn)壓芯片,由于LD3320芯片集成了語音接收識別處理器和外部電路,其系統(tǒng)也精簡,由于LD3320芯片集成了語音識別處理器和外部電路,包括AD 和DA

24、轉(zhuǎn)換器、麥克風、聲音輸出等接口,且不需要外接任何的輔助芯片如Flash、RAM7 金鑫,田犇,闕大順. 基于LD3320的語音控制系統(tǒng)設計實現(xiàn)J. 電腦與信息技術(shù),2011,06:22-25.;由于電路的精簡,讓各個芯片之間按原理設計的要求焊接在一起,使用起來非常的實用方便,該語音模塊能夠直接集成在現(xiàn)有的產(chǎn)品中,并且可以直接實現(xiàn)語音識別、聲控、人機對話等功能,此語音模塊的市場價格相對比較便宜,它采用的非特定人連續(xù)語音識別的技術(shù),使得該模塊的語音識別率相當高;通過使用LM2596和LM2940芯片作電源模塊,分別為兩個直流電機、L298N、語音模塊提供電源,采用定時/計數(shù)器T0產(chǎn)生的PWM方波來

25、控制電機的正反轉(zhuǎn)等運動狀態(tài)8 張戟,楊騰飛. 車載自動語音識別系統(tǒng)設計J. 佳木斯大學學報(自然科學版),2011,02:201-205.,實現(xiàn)該方案結(jié)構(gòu)如圖1-1所示:圖1-1 STC單片機方案框圖方案二:使用凌陽SPCE061A單片機來設計語音小車,這款芯片非常的強大,其內(nèi)部集成了語音的識別模塊并且具有語音的播報和錄放功能的模塊9 馮平,張治中. 多功能語音控制小車的設計與實現(xiàn)J. 數(shù)字通信,2009,01:87-89.,只需要焊接好麥克風(MIC)和拓展語音的功放就可以了,在本設計當中,只要一塊SPCE061A就能實現(xiàn)基本的功能模塊的功能,極其的精簡,在設計過程中節(jié)約了大量的時間,非常的

26、便于使用,但是價格比較昂貴,這個方案的基本結(jié)構(gòu)圖如圖1-2所示:圖1-2 凌陽61核心方案框圖方案三:這個方案是基于TMS320vc5420這款芯片的語音處理板的設計,整個設計都是圍繞著TMS320vc5420為主要核心電路進行設計,該系統(tǒng)以語音CODEC芯片與DSP芯片作為最主要核心,并且具有強大的數(shù)據(jù)處理的能力和較靈活的與外部通信的接口電路,其預算處理的速度非常的高效,能夠快速的分析處理大量的語音信號的數(shù)據(jù),實時性也不錯,基于其性價比比較昂貴,一般用的不是太多,這個方案的設計如圖1-3所示:圖1-3 DSP核心方案框圖由以上方案對比,方案一其性價比也相對比較便宜,基于該核心芯片是能夠識別非

27、特定人語音的,并且該芯片的識別正確率也很高,有95%這樣的識別正確率,區(qū)別于一些需要進行事先錄制聲音的語音識別芯片,在芯片外圍電路也比較簡單,芯片外圍設有喇叭、麥克風等拓展口,在語音識別方面上有較大的優(yōu)勢;方案二運用的比較的廣泛,看起來也比較簡易,但是考慮到其在軟件上的設計比較困難并且整個設計價格較高;方案三雖然對語音信號的數(shù)據(jù)處理非常的強大,但是也考慮到其昂貴的價格,不宜選擇;所以經(jīng)過這三種方案的探討與仔細的分析思考后,決定選擇方案一為此次設計方案。2 語音小車硬件設計2.1 語音小車原理框圖基于硬件平臺的設計,構(gòu)建小車硬件原理框如圖2-1所示。語音信號輸入LD3320語音芯片小車兩個直流電

28、機L298N電機驅(qū)動模塊STC11L08XE單片機REG1117穩(wěn)壓芯片電源模塊電池盒圖2-1 語音小車原理框圖此次的設計有三個大模塊,即為語音識別模塊LD3320(與單片機STC11L08XE集合在一塊板子上)、電源模塊(由LM2596和LM2940組成)、電機驅(qū)動模塊L298N;在小車的設計上,使用兩節(jié)3.7v電池為整個系統(tǒng)供電,在驅(qū)動小車上,電池輸出電壓由電壓可調(diào)LM2596芯片穩(wěn)壓后輸出,為小車的兩個直流電機提供驅(qū)動電源;一部分由LM2940芯片把電池輸出電壓穩(wěn)定在5V,測試輸出穩(wěn)定后,專門為整個語音芯片工作;由于這個語音模塊中的LD3320和單片機的工作電壓都是3.3V的,所以還要經(jīng)

29、過一個穩(wěn)壓芯片REG1117-3.3把電源模塊里穩(wěn)壓輸出的5V降低為3.3V,這樣才能夠使整個語音模塊正常的工作;當接收語音的信號時候,該信號會經(jīng)過語音芯片的邏輯處理,通過芯片內(nèi)部的AD/DA轉(zhuǎn)換,變換成單片機能夠讀取的數(shù)字信號,通過I/O口,由單片機內(nèi)部的邏輯處理,再通過軟件的編程,使用定時器中斷T0產(chǎn)生脈沖寬度調(diào)制波(PWM)信號,然后再通過控制輸出I/O口的操作,對L298N發(fā)出相對應的控制信號,實現(xiàn)對小車電機運動狀態(tài)的操作。2.2 語音識別模塊語音模塊電路原理如圖2-1所示。圖2-1 語音模塊電路原理圖在語音模塊中,里面含有3塊芯片,一塊是語音信號接收識別模塊(LD3320),一塊是語

30、音處理模塊(STC11L08XE)以及REG1117穩(wěn)壓模塊10 黃仿元. 利用語音識別技術(shù)實現(xiàn)的室內(nèi)照明電路控制系統(tǒng)J. 電子制作,2013,14:39-40.,在這個原理圖當中,STC11L08XE單片機與LD3320是以并行方式連接的;在單片機芯片外部,設計有芯片復位電路,同時外接一個22.1184Mhz的晶振作為外部時鐘電路,為單片機工作提供工作時鐘頻率;在語音芯片外圍,該語音芯片與單片機共用同一個時鐘輸入,并設計有喇叭音量外部控制電路,在本次設計中未使用到該電路,除此,還設計有麥克風增益的輔助電路,在調(diào)節(jié)麥克風的靈敏度時,會使用到該電路,還有一些外圍電源處理電路,目的是為了讓電源信號

31、穩(wěn)定,不影響芯片工作;除了外圍電路,同時還要為P0P7口、讀寫信號口、片選信號口、復位口及MD、A0口接上上拉電阻,保證這些端口信號穩(wěn)定。在整個硬件的語音模塊中,該模塊對外部語音信號進行識別處理的過程如圖2-2所示。LD3320語音識別芯片單片機拼音字符串識別結(jié)果關(guān)鍵詞列表MIC輸入特征的提取語音識別器頻譜分析圖2-2 語音模塊處理過程框圖在芯片中語音識別功能是通過在內(nèi)部關(guān)鍵詞列表中的詞語與語音相匹配出結(jié)果的過程;在對語音進行識別時候,在芯片內(nèi)部把聲音的頻譜轉(zhuǎn)換成相應特征的語音,根據(jù)這個語音特征,語音再從關(guān)鍵詞列表中,逐個對列表詞語進行匹配,在匹配出最好最優(yōu)的關(guān)鍵詞后,將其作為語音識別的結(jié)果1

32、1 武劍虹,黃石磊,匡鏡明. 語音識別系統(tǒng)測試平臺設計J. 電訊技術(shù),2003,04:102-105.。例如:在我們?nèi)粘5氖謾C的應用里面,關(guān)鍵詞語的內(nèi)容就包括了電話本里面的聯(lián)系人或者手機里面存儲短信的人的名字、手機應用功能的設置菜單命令、存儲卡里面的存儲的歌曲的曲名,地圖地址等。根據(jù)需要,設置相應的寄存器,通過改變里面的數(shù)據(jù),就能夠把列表中相對應的待識別條目內(nèi)容以字符竄的形式寫入到語音識別芯片,修改一些需要設定關(guān)鍵詞;從算法角度來看,每一條關(guān)鍵詞語最多能夠容納的字數(shù)是限制在30個字以內(nèi),但是從大多數(shù)的實際情況來看,用戶在說出條目時,如果一下子說超過8個字以上的關(guān)鍵詞,這樣肯定會有說錯字、說漏字

33、、說多字、停頓等情況,這些情況都會嚴重影響語音的識別,從而造成語音識別的錯誤,大大的提高了誤識別率。因此,一般來說,如果想要獲得較為準確的語音識別結(jié)果,條目中的關(guān)鍵詞語字數(shù)不要太長,盡量短一些,這樣識別的準確率也相對提高了很多。2.2.1語音接收識別模塊LD3320芯片原理圖如圖2-3所示。圖2-3 語音芯片原理圖LD3320語音芯片的誕生,是在人們生活中非特定人語音識別的要求下,由設計開發(fā)人員特別研發(fā)設計出來的,并作出了相關(guān)技術(shù)的解決辦法?;诳紤]設計的實用性和便捷,開發(fā)設計時在LD3320語音芯片周圍集成了高精度的A/D和D/A的轉(zhuǎn)換接口,內(nèi)部有放大處理,因此不再需要外接任何的Flash

34、和RAM等輔助芯片,高度的集成就能夠?qū)崿F(xiàn)語音識別、聲控、人機對話等功能。并且,在識別的關(guān)鍵詞語列表里面,關(guān)鍵詞是可以進行動態(tài)編輯的?;贚D3320語音芯片的強大功能,它能夠在幾乎任何的電子產(chǎn)品中,包括以最簡單且普遍的51單片機作為主要控制芯片的系統(tǒng)里面,也可以輕松的實現(xiàn)各種語音人機交流等功能。同時也為市面上基本所有的電子產(chǎn)品,添加了VUI(Voice User Interface)語音用戶操作的界面,增加了電子語音功能特色。該款芯片的主要功能有:非特定人語音識別技術(shù):在進行語音識別的時候,不需要使用者事先進行錄音練習;可以直接進行語音識別,語音識別的準確率高達95%;真正獨立芯片解決方案:由

35、于其內(nèi)部存儲空間容量比較大,不需擴展外接RAM和Flash,從而不用外擴而降低該芯片的使用成本;在芯片內(nèi)置有高精度的D/A與A/D通道:由于芯片本身的設計開發(fā),它可以在內(nèi)部自動完成AD轉(zhuǎn)換,除此,在AD的輸入上面只需接好MIC,就可以完成模擬量的輸入,在DA輸出上能夠播放聲音的文件,不用外接放大器,在內(nèi)部集成有550mw的放大器;高準確度和實用的語音識別效果:可容納50條關(guān)鍵詞,隨意自由編輯詞條內(nèi)容,但是,對外界語音也只能從這50條關(guān)鍵字中進行識別匹配;因此在不同的場合可以根據(jù)需要編輯不同的關(guān)鍵詞,這樣顯得關(guān)鍵詞的編輯很靈活;只要自己有需要或是工作場合有需要都可以進行更新關(guān)鍵詞。LD3320提

36、供的語音識別技術(shù),是基于“關(guān)鍵詞語列表”的識別技術(shù)12 于正坤. 智能雙足機器人設計D.煙臺大學,2014.。在程序設計中,關(guān)鍵詞語的列表生成,是通過單片機寫入到芯片的寄存器中,經(jīng)過聲音的掃描后,在內(nèi)部識別匹配成功后,將結(jié)果送給單片機,然后根據(jù)結(jié)果進行下一步控制;可動態(tài)編輯關(guān)鍵詞語列表:在識別的程序當中,把關(guān)鍵詞用字符竄的編寫方式編寫進核心芯片當中,這樣子的話,就能夠在下次識別的時候立即生效。舉例如:使用者在使用51系列的單片機作為主控芯片編程的時候,只需要簡單的編寫芯片的寄存器操作,就能夠把一些“北京”、“桂林”等簡單內(nèi)容的關(guān)鍵字動態(tài)的傳送到芯片當中,同樣在下一次識別操作的時候,芯片就可以識

37、別出這些已存入的關(guān)鍵詞了;芯片的工作電壓為3.3V,內(nèi)部消耗能力小,所以比較節(jié)能,用AA電池就可直接為芯片供電;自動語音識別ASR現(xiàn)實意義:使用者可以脫離外設的依賴,只需要語音操作即可完成想要做的事情,解放了傳統(tǒng)的手控指令的操作,做到了真正的智能識別操作。2.2.2語音芯片部分邏輯電路LD3320語音芯片的內(nèi)部部分電路邏輯圖如圖2-4所示。圖2-4 LD內(nèi)部邏輯電路圖該芯片的電源輸入使用3.3v基本都可以滿足正常工作,該芯片的管腳輸出高電平時,對應引腳電壓為電源電壓的0.7倍,如果相應的管腳為低電平時,其管腳輸出的電壓為0.3倍電源電壓,在該語音模塊上,單片機和語音芯片共用穩(wěn)壓輸出的3.3V。

38、VDD的數(shù)字電路使用電源輸入:3.0V-3.3V;VDDIO數(shù)字I/O電路使用電源輸入:1.65V-VDD; VDDA模擬電路使用電源輸入:3.0V-4.0V;時鐘(Clock)芯片必須連接外部時鐘晶振,在該芯片外部有外接晶振端口,其內(nèi)部有一個頻率合成器,能產(chǎn)生一定特定頻率供給芯片內(nèi)部器件工作。復位必須在電源信號都穩(wěn)定后,才能讓復位信號(RSTB*)對芯片進行復位;不管芯片在做任何的事情,復位信號都能使芯片回到最初的狀態(tài),同時讓各個寄存器復位,如果不進行對寄存器的操作的話,復位后的芯片將進入不工作的狀態(tài)。在這以后,只要有一個CSB*信號,就能夠激活芯片,讓它處于工作的狀態(tài)。并行接口該芯片可以通

39、過并行方式和外部CPU連接;使用P0口作數(shù)據(jù)線,一個中斷返回信號(INTB*),控制讀寫信號WRB*,RDB*,片選信號CS* 及A0口。串行接口串行接口通過SPI協(xié)議,再與外部主CPU進行連接通信;首先要將MD接上高電平,將(SPIS*)接地。串行時候只使用到4個管腳:SPI輸出(SDO)、SPI輸入(SDI) 、SPI時鐘(SDCK)、片選信號(SCS*)。寄存器通過對寄存器的操作來完成芯片的設置,以及處理一些命令還有傳送接收數(shù)據(jù)等。貼片的語音芯片相應管腳圖和封裝圖如圖2-5和2-6所示。圖2-5 LD芯片管腳圖圖2-6 LD芯片封裝圖其對應圖2-5所示管腳編號定義如表5-1所示。表5-1

40、 芯片管腳說明管腳編號管腳說明管腳編號管腳說明1,32數(shù)字IO電路電源輸入31時鐘輸入(448Mhz)26根據(jù)原理圖接上拉電阻3438第37位并行口接上拉電阻7數(shù)字邏輯電路電源39第2位并行口,共用SPI時鐘8,33IO和數(shù)字電路接地40第1位并行口,共用SPI輸出,接上拉電阻9,10麥克風輸入(正負)41第0位并行口,共用SPI輸入,接上拉電阻11單聲道輸入42寫允許,共用SPI允許(低電平有效),接上拉電阻12麥克風偏置43并行方式和共用SPI片選信號,接上拉電阻13,14立體聲輸入(左右端)44地址或數(shù)據(jù)選擇,在WRB*有效時,高電平表示P0P7是地址,而低電平表示P0P7是數(shù)據(jù)。 連接

41、上拉電阻 15,16耳機輸出45讀允許(低電平有效,接上拉電阻)17,24模擬電路接地460:并行工作方式1:串行工作方式18聲音信號參考電壓47復位信號,低電平有效,接上拉電阻19,23模擬信號電源48中斷輸出信號,低電平有效,接上拉電阻27,28LineOut輸出2022喇叭音量外部控制29,30可懸空25,26喇叭輸出2.2.3單片機模塊單片機原理圖如圖2-7所示。圖2-7 單片機模塊原理圖 語音小車的主要控制芯片是STC11L08XE單片機,它是一款單時鐘或者單機器周期的單片機,具有高速運行、功耗低、抗干擾極強的特點,屬于新一代的8051單片機,擁有8k字節(jié)的Flash程序存儲空間,1

42、280字節(jié)的SRAM,有32K空間的EPROM,其指令編碼完全兼容傳統(tǒng)的8051單片機,除此外它的內(nèi)部集成有高可靠度的復位電路,專門針對強干擾、高速通信等場合;其次它是一款低功耗的單片機,工作電壓只需要3.3v,通用I/O口在復位之后為:準雙向口,每個I/O的驅(qū)動能力很強,基本可以達到20mA,對于整塊芯片內(nèi)部結(jié)構(gòu)來說,全部口不能承受超過100mA電流,基于其設計的特性,它能夠在ISP/IAP模式下,無需專門的編程器和專門的仿真軟件就可以通過串口(RxD/P3.0,TxD/P3.1)直接下載用戶事先編寫好的程序,下載速度極快,用戶在下載程序時候,可以選擇是使用振蕩器還是使用外部的晶振時鐘;其具

43、有EPROM和看門狗的功能;該單片機內(nèi)部擁有2個16位的定時器/計數(shù)器,它的時鐘信號有3個輸出口,在P3.4/T0口處,可以由T0定時器溢出輸出時鐘信號,也在P3.5/T1口處,由T1定時器溢出輸出時鐘信號,由于芯片內(nèi)部獨特結(jié)構(gòu),擁有12個獨立的波特率發(fā)生器,在使用要求低的時候,即使用的時鐘頻率為4MHz8MHz這樣時,可以使用它內(nèi)部的R/C振蕩器提供時鐘頻率,因此,在它的P1.0口處,能夠輸出相應的時鐘信號;它的外部中斷的I/O口有5路,有兩個中斷優(yōu)先級別,與傳統(tǒng)的單片機一樣,也支持低電平觸發(fā)中斷或者下降沿的中斷,其掉電模式可以由外部的5個中斷喚醒,這5個中斷分別為:INT/RxD/P3.0

44、口(INT/RxD/P1.6口)、INT0/P3.2口、INT1/P3.3口、INT/T0/P3.4口、INT/T1/P3.5口;主控芯片主要用來處理語音芯片的輸入信號和輸出控制信號使電機工作。該主控芯片外接有22.1118MHZ的晶振時鐘,通過XTAL2口與LD3320的CLK口相連,共同使用同一個外部時鐘源;它與語音芯片工作的方式是并行方式,通過單片機的P4.3口向MD口輸出一個低電平;在并行的工作方式下單片機P0口與語音芯片的P0口相連接,通過單片機的P2.1口發(fā)出一個低電平到語音芯片的CSB*端口,作為并行方式下的片選信號,從而實現(xiàn)真正的與語音芯片通信工作;在處理數(shù)據(jù)的時候,LD332

45、0芯片在處理語音信號后會輸出一個低電平的信號給單片機的INT0口,使得單片機的外部中斷請求的觸發(fā)方式為電平觸發(fā);選擇好工作方式后,在P3.6和P3.7輸出控制信號到語音芯片的WRB*和RDB*(輸出為低電平的時候有效),再由單片機的P2.0口控制輸出一個信號給語音芯片的A0引腳,當輸出的是低電平(“0”)的時候,并行口P0P0.7的通信是以地址的形式進行的,當輸出的是高電平(“1”)的時候,并行口的通信是以數(shù)據(jù)的形式進行的,單片機的P3.5口輸出控制信號控制語音芯片的復位(輸出為低電平的時候有效)。2.3電源模塊在這次的設計當中所使用的電源模塊由兩個部分組成,即由LM2940芯片和LM2596

46、芯片組成,該模塊的電路原理如圖2-8。圖2-8 電源模塊原理圖Jo為電源的輸入端口,由外部的電池供電; LM1部分就是LM2940芯片,它是一個輸出電壓固定的低壓差三端穩(wěn)壓器,能夠穩(wěn)壓輸出5v,同時能夠輸出1A的電流;該芯片的理論上,承受最大輸入電壓是26v,如果芯片輸出1A時,它最小的輸入輸出電壓差應該是小于0.8v的;在芯片的內(nèi)部含有一個靜態(tài)的電流降低電路,如果輸入給芯片的電壓與輸出電壓的差壓超過3v的話,就能夠減少地電流;在輸出的電流為1A,其靜態(tài)電流為30mA,或者輸出輸入的電壓差為5V的時候,它的靜態(tài)電流也為30mA,除此外,其內(nèi)部還有防止電池反接、反插的保護電路,以防輸入錯誤的電壓

47、對電路造成嚴重的損壞;這個模塊上,它主要是為語音模塊提供輸出穩(wěn)壓5v。在穩(wěn)壓5V輸出的性能上,也可以選擇7805,在此不多介紹。PCB圖下部分是LM2596穩(wěn)壓模塊,此芯片中,有一個1.23V穩(wěn)壓器,根據(jù)需要不同,選擇不同的元器件參數(shù),作為外圍輔助電路;在芯片里面,還有一個振蕩器,這個振蕩器特點是:它所產(chǎn)生的頻率是固定的。在此,我使用的是可調(diào)的輸出電壓;由于開發(fā)人員的設計,對該芯片里面設計有保護模塊,能夠在過熱、過流是保護芯片本身;這塊芯片的運用只需要非常少的外圍電子元器件就能夠構(gòu)造成高效穩(wěn)壓電路,除此外,芯片本身還提供了工作狀態(tài)的外部控制引腳,這個穩(wěn)壓集成電路有以下幾個特性:3.3v、5v、

48、12v固定輸出型和可調(diào)輸出型可調(diào)型的輸出范圍為1.2v32v,輸入電壓最高可以達到40v,只需要7個外圍的簡單元器件,可以提供3A負載電流;這塊芯片在模塊中主要是為小車電機提供電源。2.4電機驅(qū)動模塊整個設計的核心動力部分就在這個模塊上,電機驅(qū)動模塊電路原理如圖2-9所示。圖1.0電機驅(qū)動模塊原理圖此電源模塊有以下性能特點:能夠?qū)崿F(xiàn)電機的正轉(zhuǎn)和反轉(zhuǎn)并調(diào)節(jié)電機轉(zhuǎn)速;啟動轉(zhuǎn)矩大;工作電壓可以達到46V,能輸出2A電流;可以驅(qū)動一臺或者兩臺直流電機,也可以驅(qū)動個一個兩相的步進電機13 朱嶸濤,徐愛鈞,葉傳濤. 基于STC15單片機的無線遙控智能小車的設計J. 電腦知識與技術(shù),2014,14:3445

49、-3447.14 胡漢才編,單片機原理及其接口技術(shù)M,北京:清華大學出版社,1996.15 沈德金編著,MCS-51系列單片機接口電路與應用程序?qū)嵗齅,北京:北京航空航天大學出版社,1990.16 Lawrence Rabiner, Biing Hwang Juang, Fundamental of Speech Recognition, Copyright 1999by AT&T.17 Dannis Norris, “Merging Information in Speech Recognition” feedback is never Necessary workshop.1995

50、18 Bo Hu, Anthony N. Michel .Stability analysis of digital feedback control systems with time-varying sampling periodsJ. Automatica/The interational federation of automatic control (IFAC).-2000.36(6).-897 905附 錄/相關(guān)程序如下:/#ifndef _CONFIG_H#define _CONFIG_H/*相關(guān)宏定義*/* exact-width signed integer types */

51、typedef signed char int8_t;typedef signed short int int16_t;typedef signed int int32_t;typedef signed long int int64_t;/* exact-width unsigned integer types */typedef unsigned char uint8_t;typedef unsigned short int uint16_t;typedef unsigned int uint32_t;typedef unsigned long int uint64_t;#define EN

52、ABLE 1#define DISABLE 0/*頭文件包含*/#include <intrins.h>#include "STC11XX.H"#include "LDChip.h"#include "Reg_RW.h"#include "move.h"/*條件編譯定義*/#define TEST0 /測試命令#endif/主程序:/#include "config.h"#include "stdio.h"/nAsrStatus 用來在main主程序中表示程序運行

53、的狀態(tài),不是LD3320芯片內(nèi)部的狀態(tài)寄存器/LD_ASR_NONE:表示沒有在作ASR識別/LD_ASR_RUNING:表示LD3320正在作ASR識別中/LD_ASR_FOUNDOK:表示一次識別流程結(jié)束后,有一個識別結(jié)果/LD_ASR_FOUNDZERO:表示一次識別流程結(jié)束后,沒有識別結(jié)果/LD_ASR_ERROR:表示一次識別流程中LD3320芯片內(nèi)部出現(xiàn)不正確的狀態(tài)/*/uint8_t idata nAsrStatus=0;void MCU_init(); void ProcessInt0(); /識別處理函數(shù)void delay(unsigned long uldata);void User_handle(uint8 dat);/用戶執(zhí)行操作函數(shù)void Delay200ms();void Led_test

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論