電子信息工程基于智能語音識別控制技術(shù)的垃圾分類系統(tǒng)設(shè)計與實現(xiàn)_第1頁
電子信息工程基于智能語音識別控制技術(shù)的垃圾分類系統(tǒng)設(shè)計與實現(xiàn)_第2頁
電子信息工程基于智能語音識別控制技術(shù)的垃圾分類系統(tǒng)設(shè)計與實現(xiàn)_第3頁
電子信息工程基于智能語音識別控制技術(shù)的垃圾分類系統(tǒng)設(shè)計與實現(xiàn)_第4頁
電子信息工程基于智能語音識別控制技術(shù)的垃圾分類系統(tǒng)設(shè)計與實現(xiàn)_第5頁
已閱讀5頁,還剩32頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、廣東東軟學(xué)院本科畢業(yè)設(shè)計(論文) 基于智能語音識別控制技術(shù)的垃圾分類系統(tǒng)設(shè)計與實現(xiàn)Design and implementation of garbage classification system based on intelligent speech recognition control technology 摘 要隨著中國社會的不斷發(fā)展,中國環(huán)境污染問題日益嚴(yán)重,生活垃圾隨著人口的增長越發(fā)增加。如今人們對生活環(huán)境逐漸重視起來,國家也開始深度倡導(dǎo)垃圾分類,進(jìn)行垃圾的回收利用,但由于群眾對于垃圾分類的認(rèn)識度普遍不高,難以實現(xiàn)大范圍垃圾分類規(guī)范化的目標(biāo);本設(shè)計主要分為硬件設(shè)計和軟件設(shè)計。硬件

2、部分將用到STM32F103微處理器模塊、LD3320語音識別模塊、JQ8900語音輸出模塊、舵機(jī)。主要是采用語音識別技術(shù),通過對聲音信號的處理,控制垃圾桶的運作。用戶說出垃圾名稱,LD3320中根據(jù)語音的信息進(jìn)行預(yù)加重、加窗分幀、端點檢測的方法來處理語音信號,再進(jìn)行語音轉(zhuǎn)文本和比對關(guān)鍵詞的操作進(jìn)行識別用戶所提供的垃圾名稱屬于哪一類垃圾。軟件部分主要是控制對垃圾桶開關(guān)的驅(qū)動、語音的匹配處理、音頻的交互式輸出,由此完成人機(jī)交互式的智能語音垃圾桶的語音控制功能,呼叫可應(yīng)答。此次設(shè)計可以廣泛運用于大城市的家庭當(dāng)中,能有效緩解大城市中垃圾分類處理能力和人們垃圾分類知識不相匹配的矛盾,日常家庭使用十分便

3、利,還可以有垃圾分類的教育學(xué)習(xí)效果。這對提升國民垃圾常識有極大的幫助,更能為國家文明衛(wèi)生城市的建設(shè)出一份力,同時在市場上有較好的前景。關(guān)鍵詞: LD3320模塊 STM32F103 垃圾分類AbstractWith the continuous development of Chinese society, the problem of environmental pollution in China is becoming more and more serious. Nowadays, people pay more and more attention to the living env

4、ironment, and the country has started to advocate garbage classification and recycling. However, because the general public has a low awareness of garbage classification, it is difficult to achieve the goal of standardizing large-scale garbage classification. Designed for hardware and software. The

5、hardware part will use STM32F103 microprocessor module, LD3320 speech recognition module, JQ8900 speech output module, and steering gear.It mainly USES speech recognition technology to control the operation of garbage cans by processing sound signals. The user speaks the name of the junk. In the LD3

6、320, pre-emphasis, windowing, and endpoint detection are used to process the voice signal based on the information of the voice. Then the operation of voice-to-text and keyword comparison is used to identify the junk name provided by the user. What kind of garbage it belongs to. The software part ma

7、inly controls the driving of the trash can switch, voice matching processing, and interactive audio output, thereby completing the voice control function of the intelligent voice trash can with human-computer interaction, and the call can be answered.The design can be widely applied to families in b

8、ig cities and effectively alleviate the contradiction between the garbage classification and disposal ability of residents in big cities and their garbage classification knowledge. The daily household use is very convenient, and it can also have the effect of education and learning of garbage classi

9、fication. It is of great help to raise the awareness of national waste and build a civilized and healthy city, with a good market prospectKeywords:LD3320 module STM32F103 garbage classification;目 錄第1章 緒 論11.1 課題研究背景及意義11.2 國內(nèi)外語音識別技術(shù)研究現(xiàn)狀21.2.1 國外語音識別技術(shù)研究現(xiàn)狀21.2.2 國內(nèi)語音識別技術(shù)研究現(xiàn)狀31.3 選題背景和研究內(nèi)容31.4 論文主要工作和

10、結(jié)構(gòu)安排3第2章 語音識別技術(shù)52.1 語音識別技術(shù)概述52.2 語音信號的預(yù)處理62.2.1 語音信號的預(yù)加重62.2.2 語音信號加窗分幀62.2.3 語音信號端點檢測62.3 語音信號的特征值提取72.4 語音識別模型9第3章 系統(tǒng)硬件設(shè)計103.1 系統(tǒng)整體設(shè)計框圖103.2 微處理器模塊103.3 LD3320型號語音識別模塊設(shè)計123.1.1 LD3320語音識別芯片簡介123.3.2 LD3320語音識別芯片運行過程133.3.4 關(guān)于提高識別準(zhǔn)確度的方法133.4 JQ8900語音芯片模塊143.4.1 JQ8900語音芯片模塊介紹14第4章 系統(tǒng)軟件設(shè)計154.1 軟件設(shè)計思

11、路154.2 語音識別程序設(shè)計154.3 STM32主程序設(shè)計17第5章 系統(tǒng)測試205.1 測試用具205.2 硬件測試205.3 軟件測試22第6章 總結(jié)與展望266.1 總結(jié)266.2 展望26參 考 文 獻(xiàn)28致 謝29附 錄30第1章 緒 論1.1 課題研究背景及意義中國的發(fā)展如覺醒的雄獅,越發(fā)迅速,而產(chǎn)生的垃圾越發(fā)增多,同時大量垃圾所產(chǎn)生的污染問題和處理難題也隨之而來。不一樣的垃圾只有采用不一樣的方法處理,才能最大化地?zé)o污染處理垃圾。如果可以得當(dāng)?shù)靥幚砩顝U物,就可以增加土地利用率。一些塑料類制品在土地中難以被分解,這就會土壤收到污染。對垃圾有效分類處理之后,這些污染問題就可以極大

12、程度地得到解決。對于垃圾的處理方式,我們過國家大多是使用土壤掩埋的方式,這樣就使得土地被占用。并且會吸引蟲害,污染空氣。如果想要對這些垃圾進(jìn)行更加充分合理地處理,就需要用到垃圾分類,這可以使土壤得到解放,提高土地利用率。有些生活上被遺棄的物品例如廢紙、塑料瓶、廢舊金屬等,都可以變廢為寶,再生再利用。伴隨著國民生活水平的提高,豐富的日產(chǎn)生活也伴隨這更高的垃圾廢物產(chǎn)出。根據(jù)統(tǒng)計的數(shù)據(jù)顯示,2019年上海平均每人每天生產(chǎn)1.05公斤的垃圾。面對日益增加的垃圾生產(chǎn)速度,需要對這龐大的垃圾進(jìn)行處理,而垃圾的處理,正確且環(huán)保的最佳方式是根據(jù)垃圾種類的不同,使用垃圾分類的方法進(jìn)行回收,后期再針對不同的垃圾進(jìn)

13、行不同的方式處理,如垃圾再生法、垃圾堆肥法、垃圾生物降解法,這樣才能更好地保護(hù)土地不被污染和促進(jìn)資源的再生使用。但是垃圾處理的難度不在于技術(shù)上的缺失,而是在于人們普遍缺乏垃圾分類的意識和知識。為了進(jìn)一步響應(yīng)國家號召,需要極大程度上地提高人們對于垃圾分類方面的知識。對于垃圾分類來說,家庭應(yīng)該是垃圾分類的第一大的接觸群體,如果家庭中的垃圾可以分類打包,再扔進(jìn)小區(qū)或垃圾站中,將可以極大程度得增加垃圾分類處理的處理效率。對此,人們需要一個時刻幫助他們在丟垃圾時對垃圾進(jìn)行分類的智能產(chǎn)品。針對這一現(xiàn)象,本文提出了一個人性化、智能化的設(shè)計智能語音控制垃圾分類垃圾桶。語音控制技術(shù)當(dāng)中最重要的一個環(huán)節(jié)就是語音的

14、識別,需要較為快速精準(zhǔn)地從當(dāng)前使用環(huán)節(jié)中識別出使用者所提供的的語音資料進(jìn)行分析處理,再做出應(yīng)答。近年來,語音控制技術(shù)在產(chǎn)品和生活中的應(yīng)用越來越成熟,但是還是有很多尚未解決的問題,比如中長距離識別問題、識別效率問題、抗干擾問題等等。在今天看來,語音識別技術(shù)再當(dāng)今社會中,有著重要的研究發(fā)展地位,其技術(shù)之下的產(chǎn)品也有著較高的實用價值。圖1-1 城市垃圾產(chǎn)量排行及處理方式1.2 國內(nèi)外語音識別技術(shù)研究現(xiàn)狀1.2.1 國外語音識別技術(shù)研究現(xiàn)狀對于語音識別技術(shù)的發(fā)展來說,國外在較早期的時候,就有人對語音識別技術(shù)做出了研究。20世紀(jì)60年代中期,出現(xiàn)了一批專門研究語音識別技術(shù)的科學(xué)家,并且他們發(fā)現(xiàn)了很多有關(guān)

15、于數(shù)字信號處理的有關(guān)處理方法,比如快速傅立葉變換(FFT)、時頻分析、數(shù)字模擬濾波器等,這對后續(xù)的語音識別技術(shù)的發(fā)展提供了堅實有力的技術(shù)基礎(chǔ)。20世紀(jì)70年代以后,線性預(yù)測技術(shù)(LPC)的概念逐漸提出。這項對于數(shù)字信號處理有著重要的作用,成為當(dāng)時研究人員處理信號特征信息時的重要方法,且衍射到了其他更多的技術(shù)領(lǐng)域。在20世紀(jì)的末期,有一種新的技術(shù)開始被使用,就是矢量量化(VQ),其慢慢地被人們應(yīng)用于語音信號處理當(dāng)中。此項技術(shù)主要是基于聚類分析的新型高效數(shù)據(jù)壓縮技術(shù)。與此同時,科學(xué)家們也發(fā)現(xiàn)了另一個用于描述語音信號的技術(shù)模型隱馬爾代夫模型。這項技術(shù)的出現(xiàn)不僅是的后期語音信號處理技術(shù)的更迅速地發(fā)展起

16、來,更時慢慢成為了絕大部分的研究基石。再到后來,越來越多的公司加入到語言識別技術(shù)的研究當(dāng)中來,并研究出了部分實用性較高的產(chǎn)品。在語音識別產(chǎn)品中要求其需要有較高的準(zhǔn)確度,后來慢慢將準(zhǔn)確率作為識別技術(shù)中重要的評價標(biāo)準(zhǔn)之一,同時這一標(biāo)準(zhǔn)也在后來的探索實踐中慢慢地更新升級。1.2.2 國內(nèi)語音識別技術(shù)研究現(xiàn)狀早在二十世紀(jì)中期,我國就開始了對于語言識別技術(shù)的研究,并且完成了的從研究室到生產(chǎn)應(yīng)用整個過程。之后,國家為了鼓勵此技術(shù)的發(fā)展研究,專門設(shè)立了兩年滾動一次的語言識別技術(shù)研究項目。迄今為止,中國和其他國家對于語音識別技術(shù)的掌握已經(jīng)沒有太大的差距。對于我國來說,中國話的語音識別技術(shù)非常具有獨特的優(yōu)勢和水

17、平,而且在各國的相同技術(shù)中也屬于高科技含量的技術(shù)。我國在許多高等院校都有設(shè)立科研單位去深入開發(fā)語言識別技術(shù),其中多所院校的成果得到了國家的肯定,且被列入了國家級的重點項目。在眾多的語言識別技術(shù)研究所當(dāng)中,清華大學(xué)的一個小組獲得了較大的突破,其研發(fā)的一項語言識別產(chǎn)品有著非常之高的準(zhǔn)確度,對于各種數(shù)字串的識別都有著高達(dá)百分之九十五的準(zhǔn)確率,在世界各國所研究的語言識別產(chǎn)品中,這已經(jīng)成為最優(yōu)秀的設(shè)計之一。一直到了2002年,中科院方面協(xié)同其附屬公司在語言識別產(chǎn)品方面的研發(fā)初見完工,且發(fā)布了一款名叫PattasrD 產(chǎn)品,它可以在多種平臺和應(yīng)用中使用。這款產(chǎn)品的發(fā)布,結(jié)束了1998年以來中國語音識別產(chǎn)品

18、被外國公司壟斷的困境。1.3 選題背景和研究內(nèi)容自我國研究和開發(fā)語音識別技術(shù)以來,這項現(xiàn)在也已經(jīng)成為較為成熟的領(lǐng)域,隨著社會的發(fā)展,語音識別技術(shù)下開發(fā)的產(chǎn)品也漸漸走進(jìn)了社會生活 當(dāng)中。交互式的語音交流對服務(wù)類的智能產(chǎn)品來說是較為必要的。而對于語音的運用中,卻極少有專門用來解決垃圾分類處理的產(chǎn)品,此次研究的內(nèi)容和選題正是根據(jù)當(dāng)今中國所存在的問題和發(fā)布的政策的基礎(chǔ)上,對語音識別技術(shù)的實際運用。此次研究主要針對單片機(jī)的操作和語音識別技術(shù)的整個工作流程進(jìn)行探討,利用軟件和硬件相搭配的方式操作整個系統(tǒng)的運行,以提高交互性和實用性,達(dá)到較高的實用水平。1.4 論文主要工作和結(jié)構(gòu)安排本文主要圍繞搭建的垃圾分

19、類系統(tǒng),探討和研究語音識別的主要處理過程,總的流程圖如下所示,文章主要分為6個章節(jié)第一章:主要為緒論部分,主題內(nèi)容為講述了本次系統(tǒng)設(shè)計中主要技術(shù)的語音識別技術(shù)的研究過程,以及世界當(dāng)中對音樂識別技術(shù)的發(fā)現(xiàn)與研究,同時闡述了本次論文編寫工作的工作安排等。第二章:從整體的角度上面較為詳細(xì)地闡述了語音識別技術(shù)的主要部分。還講述了語音信號的特征值提取以及識別模型,最后實現(xiàn)信息匹配。為后續(xù)硬件和軟件設(shè)計部分打下基礎(chǔ)。第三章:主要為系統(tǒng)硬件設(shè)計的內(nèi)容,主要包括框圖的設(shè)計和各個模塊的選擇以及介紹。圍繞著LD3320、STM32F103、JQ8900來講述整個系統(tǒng)的設(shè)計過程。第四章:主要為系統(tǒng)的軟件設(shè)計,分為S

20、TM32的響應(yīng)執(zhí)行、LD3320的識別交互、JQ8900的語音輸出部分,講述整個系統(tǒng)的內(nèi)部程序具體實現(xiàn)過程。第五章:為系統(tǒng)測試環(huán)節(jié)。測試本次設(shè)計的系統(tǒng)識別率以及是否有異常反應(yīng)的問題,得出較為準(zhǔn)確的結(jié)論來總結(jié)此次設(shè)計的系統(tǒng)是否可靠。第六章:再次討論此次論文撰寫和系統(tǒng)設(shè)計的整體情況以及不足之處,根據(jù)情況提出進(jìn)一步的改進(jìn)意見,希望未來能在此研究上有所完善。 第2章 語音識別技術(shù)2.1 語音識別技術(shù)概述對于日常生活來說,語言是人與人之間的一種重要的溝通方式,在人與機(jī)器之中如果想要通過語言交流,那么就要用到語音識別技術(shù)。此技術(shù)是以交流用語為研究和處理的對象,通過對語音信號多重處理,轉(zhuǎn)化為機(jī)器用語,再做出

21、對應(yīng)的相應(yīng),以達(dá)到讓機(jī)器人“聽人話”的目的。語音識別技術(shù)可以讓人擺脫鍵盤和操作裝置的束縛,使用更加自然的、人性化的溝通語言進(jìn)行輸入操作。在這樣的優(yōu)勢之下,語言控制技術(shù)也逐漸變成了信息技術(shù)中的一項關(guān)鍵技術(shù)。現(xiàn)如今語音識別技術(shù)的系統(tǒng)分類大致可以分為如下幾類。(1) 按語音提供者與系統(tǒng)的關(guān)系上看:a. 單體特定語音識別系統(tǒng)。即僅考慮專門用戶提供的語音進(jìn)行識別。b. 非單體特定語音識別系統(tǒng)。即語音提供者可以是任意用戶。c. 多人語音識別系統(tǒng)。即可以識別多人同時提供的語音信息。(2) 按語音提供者的說話方式考慮:a. 孤立詞語音識別系統(tǒng)。即每個詞語的識別需要孤立輸出,輸入時每個詞需有所停頓。b. 連續(xù)詞

22、語語音識別系統(tǒng)。即在詞語發(fā)音清晰的情況下可以較為連貫地輸入。c. 通用語音識別系統(tǒng)。即可以識別更加自然的用戶語言數(shù)據(jù),可以不被方言、連音所干擾而使識別率下降。(3) 從系統(tǒng)識別的單詞量上看:a. 小型詞匯量語音識別系統(tǒng)。可識別的詞語數(shù)大概在數(shù)十個至數(shù)百個之間。b. 中型詞匯量語音識別系統(tǒng)。可識別的詞語數(shù)大概在數(shù)百個至數(shù)千個之間。c. 大型詞匯量語音識別系統(tǒng)。可識別的詞語數(shù)大概在數(shù)萬個以上,此系統(tǒng)對于計算機(jī)的配置和運算能力有較高的要求。 語音識別的分類也會隨著時代的進(jìn)步不斷更新和增加。本次的設(shè)計的系統(tǒng)主要為非個人特定的、連續(xù)詞語的、中型詞匯量的語音識別系統(tǒng)。系統(tǒng)總體性能較為接近實用型。2.2 語

23、音信號的預(yù)處理對于語音識別技術(shù)最開始的部分,需要接受雜質(zhì)較多的原始語音流進(jìn)行最初的處理操作,而預(yù)處理的目的就是減少語音信號中其他干擾語音流,如:噪音干擾和呼吸所產(chǎn)生的氣流聲等對信號整體質(zhì)量的影響。其中包括信號的預(yù)加重、加窗分幀和端點檢測等過程。2.2.1 語音信號的預(yù)加重在一般自然情況下,對于語音流來說,信號的能量在高頻的地方較為不穩(wěn)定,容易產(chǎn)生信號衰弱的情況,而低頻的部分是處在比較平穩(wěn)的狀態(tài)。而此項操作主要就是為了增強語音流信號當(dāng)中高頻的頻段,讓整體的信號可以更加趨于穩(wěn)定,進(jìn)而可以減少噪聲影響,提高識別的信噪比。預(yù)處理可以使得有用的高頻段的頻譜質(zhì)量得到提升,彌補因信號發(fā)出后一段時間內(nèi)隨時的頻

24、譜信號,以便后續(xù)進(jìn)行頻譜分析和相關(guān)特征參數(shù)提取時的準(zhǔn)確度。以數(shù)字濾波器為例,對語言信號進(jìn)行預(yù)加重處理。則R(n)經(jīng)過濾波器后的信號與S(n)預(yù)加重前語音信號的關(guān)系式(2-1)為:R(n) = S(n) - 0.9375 S(n-1) (2-1)2.2.2 語音信號加窗分幀一般條件下,時間也會對信號產(chǎn)生一定的影響,但在正常情況中,語音信號在10ms到30ms時 間長度內(nèi)是相對穩(wěn)定的。而分幀處理則是根據(jù)語音信號具有這樣的特性,我們將語音信號分成一段段來分析,這樣可以得到更加穩(wěn)定的語言信號。一般來說,加窗函數(shù)是可以用來處理幀內(nèi)語音信號。具體操作是將語音信號與加窗函數(shù)進(jìn)行相乘,形成加窗語音信號。窗函數(shù)

25、可以有多種選擇,比如三角窗、漢明窗、矩形窗等。對于常用的處理方法,我們一般來說會采用漢明窗與矩形窗的形式,其所需的表達(dá)式為:漢明窗表達(dá)式(2-2): (2-2)矩形窗表達(dá)式(2-3): (2-3)2.2.3 語音信號端點檢測系統(tǒng)在獲取語音信號的時通常會夾雜著一些不需要的信號,此項檢測過程主要就是針對這種現(xiàn)象,通過找到語音信號中開始和結(jié)束的兩個端點。然后根據(jù)這兩個端點,進(jìn)行適當(dāng)?shù)奶崛》蛛x操作,得出我們真正需要的語音信號。這個操作可以為后續(xù)的識別做基礎(chǔ),有效地提高了識別時的準(zhǔn)確度。這里可以用語音信號的短時能量和過零率來進(jìn)行判斷。語音信號的短時能量定義式(2-4)為: (2-4)其中N代表窗長,(n

26、-m)為窗函數(shù),則語音信號的短時過零率定義式(2-5)為: (2-5)其中,關(guān)于漢明窗函數(shù)(n)和符號函數(shù)sgn 的相關(guān)定義式(2-6)為: (2-6)2.3 語音信號的特征值提取對于進(jìn)行預(yù)處理完成后的信號,還需要對其進(jìn)行特征值的提取,在提取時需要滿足以下條件:需要可以明確表現(xiàn)出語音信號的特性。需要盡量包含較少的特征量。提取方法盡可能簡便,減少提取的復(fù)雜度和時間。我們常用的提取特征值的方法中,一般為線性預(yù)測倒譜系數(shù)(LPCC),線性預(yù)測系數(shù)(LPC)、梅爾頻率倒譜系數(shù)(MFCC)。在此就以梅爾頻率倒譜系數(shù)方法為基礎(chǔ),對信號進(jìn)行特征值提前操作。MFCC提取特征值的基本原理是利用人耳的聽覺感知和倒

27、譜的解的相關(guān)性,這樣做可以有較為良好的抗噪和識別能力。他的的轉(zhuǎn)換如下(2-7)所示: (2-7)MFCC的提取過程如下圖2-1所示:圖2-1 MFCC的提取過程具體過程如下:(1) 信號在預(yù)處理完成之后,將信號進(jìn)行傅里葉變換(FFT),公式(2-8)如下: (2-8)(2) 求頻線能量,公式(2-9)如下: (2-9)(3) 計算出每幀譜線能量經(jīng)過M個梅爾濾波器后的能量值,公式(2-10)如下: (2-10)其中,關(guān)于梅爾濾波器頻率響應(yīng)Hm(k)的相關(guān)表達(dá)式(2-11)如下所示: (2-11)其中,(m)為中心頻率,m=0,1,2,L,M-1。(4) 信號在通過了梅爾濾波器之后再進(jìn)行離散余弦變

28、換(DCT),就可以求得MFCC的相關(guān)參數(shù),計算公式(2-12)如下所示 (2-12)其中,l為第l階段參數(shù)。在一般情況下,他的階數(shù)越高,所得到的性能就越高,但是計算量隨之逐漸增加。2.4 語音識別模型語音識別模型的發(fā)展至今為止以及多種多樣,其在語音識別的應(yīng)用上,大多數(shù)都是基于特定識別模型的。我們現(xiàn)如今常用的識別模型主要有:隱馬爾科夫模型(HMM)、矢量量化方法(VQ)、動態(tài)時間規(guī)程模型(DTW)、支持向量機(jī)分類模型(SVM)、ANN模型等。 第3章 系統(tǒng)硬件設(shè)計3.1 系統(tǒng)整體設(shè)計框圖對于系統(tǒng)的整體設(shè)計而言,需要考慮系統(tǒng)如何對人聲進(jìn)行識別,對此,本次設(shè)計通過語音識別技術(shù),對人產(chǎn)生的語音流進(jìn)行

29、識別,從而發(fā)出對應(yīng)指令控制想用的舵機(jī)開合垃圾桶。其中主要的硬件設(shè)備有STM32F103C8T6核心板、LD3320語音識別模塊、JQ8900語音播報模塊、SG90舵機(jī)、揚聲器。主要工作流程為用戶提供關(guān)鍵詞喚醒系統(tǒng)后,系統(tǒng)做出啟動應(yīng)答,即可輸入所需丟棄的垃圾名稱。系統(tǒng)將接收到的語音收入LD3320模塊,經(jīng)過一系列的處理過后發(fā)送信息給STM32F103C8T6核心板單片機(jī),單片機(jī)根據(jù)LD3320提供的關(guān)鍵詞信息控制14號舵機(jī)運作,從而完成開合垃圾桶操作。與此同時,單片機(jī)驅(qū)動JQ8900語音播報模塊合成輸出的語音信息到揚聲器,做出反饋播報,表示一次正常操作的結(jié)束。具體流程見結(jié)構(gòu)圖3-1。圖3-1 系

30、統(tǒng)操作流程3.2 微處理器模塊在微處理器的選擇上面,為了流暢且有效率地完成整個系統(tǒng)的所有操作,此次設(shè)計采用的是STM32F103C8T6核心板。這一世款STM公司生產(chǎn)新一代的低功耗、高效率的單片機(jī),下面將會圍繞這個芯片做詳細(xì)的介紹。(1) 本單片機(jī)采用的是知名的ARM內(nèi)核,這就使得其MCU可以同時兼容ARM工具和軟件。除此之外他還有一個功耗和成本都相對較低平臺,這不僅僅使其了優(yōu)秀的中斷響應(yīng),還未其帶來了更高的計算效率。其內(nèi)核使用的是32位的處理器,可以高效的識別處理代碼,增加了運行效率。其內(nèi)置的靜態(tài)隨機(jī)存取存儲器可以使得CPU幾乎可以以極快的速度進(jìn)行讀取操作,非常便利。(2) 本單片機(jī)中有著四

31、十余個中斷通道和十多個高優(yōu)先級的中斷控制器,這就可以使得其的中斷處理非常迅速。同時在外部設(shè)置的近二十個邊緣檢測器,可以處理各種收到的中斷請求。其出觸發(fā)條件多種多樣,可以自由設(shè)置由上升、下降、雙邊沿觸發(fā),可以獨立觸發(fā)也可以屏蔽,非常靈活可變通。對于過多的中斷同時請求的情況,可以被一個單獨的寄存器掛起,根據(jù)優(yōu)先程度排序處理。(3) 看門狗是可以進(jìn)行獨立設(shè)置,內(nèi)部設(shè)置了時鐘振蕩器,由主時鐘驅(qū)動運作,可獨立工作,所以即使在關(guān)機(jī)的情況下也能保持正常工作。如果在運行過程中出現(xiàn)某些故障,看門狗可以對系統(tǒng)進(jìn)行重啟,具有監(jiān)控報警的作用。(4) 可控制的I2C總線有兩條,支持雙向?qū)ぶ?,這樣可以搞笑運行代碼。也可以

32、切換模式,一般來說是標(biāo)準(zhǔn)模式,在需要更快地運行時也可以設(shè)置成快速模式。(5) 該處理器上安裝了兩個數(shù)模轉(zhuǎn)換器,一般來說可以使用十六個通道進(jìn)行工作。 在運行,其可以機(jī)器精準(zhǔn)地觀察者通道內(nèi)的情況,自動對信號進(jìn)行轉(zhuǎn)換,如果發(fā)生超出設(shè)定上限的情況時,也會進(jìn)行沖斷請求來終止錯誤運行。 總的來說,本單片機(jī)非常適合本次系統(tǒng)設(shè)計,無論是從性能還是從開發(fā)效率以及先進(jìn)程度來說,都是非常優(yōu)秀的一款單片機(jī)。使用這款單片機(jī),可以非常順暢地完成庚哥系統(tǒng)的運行。STM32F103C8T6的主要原理圖如下圖3-2所示:圖3-2 STM32F103C8T6主要原理圖3.3 LD3320型號語音識別模塊設(shè)計3.1.1 LD332

33、0語音識別芯片簡介本設(shè)計當(dāng)中,需要用到語音識別技術(shù),而在整體系統(tǒng)中,選擇了LD3320語音識別模塊,由此模塊對人聲進(jìn)行識別操作。 這是一款低功耗和高效能的芯片,同時具有出色識別效率和準(zhǔn)確性的芯片。在使用上,他完全可以單獨使用完成程序的執(zhí)行,也可以鏈接其他的系統(tǒng),實現(xiàn)通訊運行和其他的控制功能。識別流程圖如下圖3-3所示:圖3-3LD3320語音識別主要流程圖語言識別芯片簡單邏輯電路圖如下圖3-4所示:圖3-4 LD3320簡單邏輯電路圖3.3.2 LD3320語音識別芯片運行過程由于LD3320芯片有可離線操作的特性,其可以識別的指令會收到內(nèi)存的影響而變得有所限制。但是對于本次系統(tǒng)來說,用戶想要

34、實現(xiàn)迅速、流暢、較全面得交互式體驗式完全最夠的。在芯片內(nèi)部,需要先設(shè)置好與所需識別的語音關(guān)鍵詞相應(yīng)的拼音排列。在用戶發(fā)出提前設(shè)置好的喚醒信號時,系統(tǒng)才會被喚醒,芯片會根據(jù)用戶輸入的語音信號,對收集到的語音信息進(jìn)行一系列的語音分析操作,最終得出的識別結(jié)果會根據(jù)此前輸入拼音字符串進(jìn)行逐一比對,最后得出匹配度最高的關(guān)鍵詞,再將信息轉(zhuǎn)換成對應(yīng)的識別碼反饋給單片機(jī),由單片機(jī)做出后續(xù)操作。同時LD3320會繼續(xù)回到起始狀態(tài),繼續(xù)準(zhǔn)備接收下一條語音指令信號。具體流程圖如下圖3-5所示:圖3-5 LD3320運行過程圖3.3.4 關(guān)于提高識別準(zhǔn)確度的方法(1) 使用二級或多級口令。使用多級口令可以在平時環(huán)境下

35、減少誤觸發(fā)的可能,同時在一級口令被識別之后,系統(tǒng)會有更好的準(zhǔn)備識別所需語音信息。(2) 在噪聲相對較低的地方運行。周圍的噪聲干擾對系統(tǒng)識別語音信息有著非常大的影響。這會直接影響到最終識別結(jié)果的準(zhǔn)確性,所以在安靜環(huán)境下更有利于系統(tǒng)的運行。(3) 增加意思相近的關(guān)鍵字。對于本次同來說,識別的語音信息較為固定。為了提高系統(tǒng)的實用性,可以增加更多的詞來表示同一種物品,這樣可以使系統(tǒng)的識別更加全面和準(zhǔn)確。(4) 保證系統(tǒng)有充足的工作電源。電源對于整個語音識別系統(tǒng)來說是至關(guān)重要的一個部分,沒有正常的電源提供則無法啟動相應(yīng)的功能模塊正常工作。3.4 JQ8900語音芯片模塊3.4.1 JQ8900語音芯片模

36、塊介紹這是一款非常優(yōu)秀的處理模塊,自身安裝了優(yōu)質(zhì)的內(nèi)核,可以非常穩(wěn)定、高效、低功耗地實現(xiàn)各種功能。其可以有多種控制方式,比如開關(guān)、播放器、單片機(jī)等。在一定情況下可以智能生成控制命令,不需要太多的精力去調(diào)整測試,對于新手可以非??焖俚貙W(xué)習(xí)、掌握和使用。他的使用范圍也是非常廣泛,幾乎可以適用于各種條件不是非常惡劣的場所,對于一般的系統(tǒng)設(shè)計都可以應(yīng)用。對于語言識別來說,聲音的播放質(zhì)量也是至關(guān)重要的一項指標(biāo)。JQ8900對于語言質(zhì)量的要求較為嚴(yán)格,可以支持6000HZ以上22000HZ以下的聲音文件的播放,播放效果與源文件幾乎沒有差別。對于JQ8900的使用,可以將其當(dāng)作U盤操作,不需要其他的操作去執(zhí)

37、行內(nèi)容的變更。 JQ8900主要原理圖如圖3-6所示:圖3-6 JQ8900主要原理圖第4章 系統(tǒng)軟件設(shè)計4.1 軟件設(shè)計思路對于此次系統(tǒng)設(shè)計而言,需要用到部分軟件編程設(shè)計,主要是運用C語言控制單片機(jī),這也是最為常見的一種變成語言,它的好處是在于現(xiàn)如今C語言的應(yīng)用較為廣泛,目前的開發(fā)程度也較高,可以有更多的參考資料可供開發(fā)者使用,而且其自身對于單片機(jī)的要求并不高。所以本詞系統(tǒng)的軟件部分主要使C語言編程。本次系統(tǒng)中需要運用到軟件編程驅(qū)動的模塊主要有STM32F103C8T6單片機(jī)、LD3320語言識別模塊、JQ8900語音播報模塊、SG90舵機(jī)。按照模塊化簡單分類,主要程序、語音識別程序、語音播

38、放程序、舵機(jī)驅(qū)動程序。4.2 語音識別程序設(shè)計在系統(tǒng)中,語言識別部分是最為主要的部分之一,其程序編程也是最為主要的一環(huán)。它直接控制的是LD3320語音識別芯片,同時也有部分與單片機(jī)的數(shù)據(jù)交互。首先,需將系統(tǒng)進(jìn)行初始化,對于一些寄存器和變量需要賦予無關(guān)后續(xù)判斷的初值,保證程序無干擾運行。寄存器設(shè)置如下圖4-1所示:圖4-1 寄存器設(shè)置在完成了初始化寄存器后,在進(jìn)行串口和中斷方面的相關(guān)設(shè)定。隨后就是ASR識別部分程序。首先需要啟動ASR識別程序,對ASR進(jìn)行初始化,然后把一些垃圾類型寫入到LD3320芯片內(nèi),完成之后開啟ASR識別功能。在這當(dāng)中每次進(jìn)行一個環(huán)節(jié)都會設(shè)定一個函數(shù)LD_Reset( )

39、去檢測芯片內(nèi)部是否出現(xiàn)異常,如果出現(xiàn)異常,則會重新啟動LD3320芯片,在系統(tǒng)重啟五次之后則會反饋0說明啟動是吧,出現(xiàn)內(nèi)部故障無法啟動。這樣可以保證芯片的芯片如果出現(xiàn)問題可以及時發(fā)現(xiàn)改正。相關(guān)開啟程序與流程圖如下圖4-2、圖4-3所示: 圖4-2 ASR啟動程序 圖4-3啟動程序流程圖如果LD3320模塊感應(yīng)到語音流信息時,則其將發(fā)送中斷到相關(guān)函數(shù)中,功能是再次驗證此次識別程序有無正常得出相關(guān)信息。當(dāng)未得到有用信息時,則須重新配置相關(guān)變量,等待再次接收信號。最后根據(jù)識別的結(jié)果返回對應(yīng)的識別碼,完成識別模塊的一系列操作。主程序如圖4-4所示:圖4-4 main函數(shù)主要程序4.3 STM32主程序

40、設(shè)計STM32主程序主要是根據(jù)LD3320識別語音流數(shù)據(jù)后得到的識別碼,控制相對應(yīng)的舵機(jī)和語音播報。主程序運行流程圖如圖4-5所示圖4-5主程序運行流程圖SG90舵機(jī)的主要用途是用于控制垃圾桶的開合,總共有四個,分別控制濕垃圾、干垃圾、有害垃圾、可回收垃圾。在舵機(jī)的控制上,主要采用的是PWM信號,通過調(diào)節(jié)占空比來調(diào)節(jié)舵機(jī)轉(zhuǎn)動。JQ8900語音播報模塊主要是用于播放互動性的語音信息。驅(qū)動時需要先對端口設(shè)置一個低電平,然后進(jìn)行一段時間的延時再設(shè)置為高電平,就可以完成對應(yīng)的語音播放。在主程序,需要有對應(yīng)的延時函數(shù),PWM信號定義和初始化,舵機(jī)的復(fù)位等,作為系統(tǒng)開始正式運作之前的準(zhǔn)備。然后根據(jù)傳入的識

41、別碼,分別選擇不同的垃圾桶,對應(yīng)不同的操作。首先是將JQ8900模塊進(jìn)行喚醒,然后根據(jù)識別碼向?qū)?yīng)語音播報端口發(fā)送低電平信號,同時使用PWM信號啟動舵機(jī)轉(zhuǎn)動。完成之后將識別碼歸零操作以便下次識別,防止死循環(huán)。舵機(jī)標(biāo)志為1,進(jìn)入舵機(jī)復(fù)位函數(shù)使舵機(jī)控制的垃圾桶打開數(shù)秒后自動關(guān)閉,增加自動化程度。最后延時一點時間,發(fā)送高電平到先前操作的語音播報端口。整個環(huán)節(jié)結(jié)束。 STM32主函數(shù)主要程序框圖如圖4-6所示: 圖4-6 STM32主函數(shù)主要程序框圖 第5章 系統(tǒng)測試5.1測試用具硬件測試儀器:萬用表、電源軟件測試儀器:無被測相關(guān)對象:濕垃圾菜葉、餅干、蛋殼、玉米、面包干垃圾舊浴缸、貓砂、橡皮泥、尿不

42、濕、貝殼有害垃圾電池、打火機(jī)、創(chuàng)可貼、酒精、油漆可回收垃圾易拉罐、報紙、舊書包、舊鞋子、牛奶盒5.2硬件測試硬件方面的測試主要檢查電路中的通電和各個元器件是否正常。由于模塊與模塊之間的電路焊接主要是運用手工焊接,可能會有部分焊接點出現(xiàn)空焊或虛焊的問題,也有可能在一些引腳密集處出現(xiàn)連焊的問題。所以需要檢測系統(tǒng)在電路上面的順暢鏈接程度。測試方法為將萬用表調(diào)節(jié)為通斷檢測檔,雙手持用黑紅兩色表筆,分別架在對兩個模塊之間手工焊接的兩端,如果萬用表發(fā)出“滴”的聲音,則說明兩端焊接正常。如果聲音斷斷續(xù)續(xù),則可能有接觸不良的現(xiàn)象,需要進(jìn)行加錫或重新焊接的工作。如果沒有聲音,則需要根據(jù)現(xiàn)場情況判斷短路電路的修復(fù)

43、方法。系統(tǒng)焊接圖如圖5-1所示圖5-1 實物焊接圖整個系統(tǒng)正面圖如圖5-2所示:圖5-2 系統(tǒng)正面圖LD3320語音識別模塊有其自身專門的檢測流程。其在正常供電情況下時通過使用者通過串口測試工具內(nèi)的功能信息,面向模塊說一句“小杰”,當(dāng)模塊中的D1燈發(fā)光之后,再說出下一級指令,重復(fù)多次操作,如識別無誤,則模塊可正常使用。如果有誤,則需要聯(lián)系賣家進(jìn)行更換。JQ8900的測試需要調(diào)用串口調(diào)試工具,將JQ8900根據(jù)相關(guān)接線要求連接好TTL模塊,再將通過USB接口連接電腦,即可進(jìn)行相關(guān)測試。在窗口界面可以使用指令通過串口發(fā)送調(diào)試,也可以直接通過點擊窗口的控制鍵進(jìn)行調(diào)試,如果功能正常,則可以正常播放音樂

44、文件。如下圖4-6所示圖4-6 JQ8900串口調(diào)試窗口界面圖本次硬件測試一切正常模塊皆可以正常運行,在焊接和硬件的功能上沒有發(fā)現(xiàn)較大的故障問題。5.3軟件測試軟件測試主要測試系統(tǒng)識別和交互是否正常及其識別的準(zhǔn)確率是否達(dá)到官方數(shù)據(jù)結(jié)果。首先需要對系統(tǒng)通電,然后說出“我要扔垃圾”,待系統(tǒng)回復(fù)“請說出垃圾名”時,即可說出需要扔的垃圾名稱,如系統(tǒng)回復(fù)的垃圾名稱和打開的舵機(jī)都正確,則記為成果識別,若不正確,則記為識別失敗。下面對已錄入的4組共20個垃圾數(shù)據(jù)進(jìn)行測試。 測試結(jié)果如下表5-1所示:垃圾類型垃圾名識別成功(單位/次)識別失?。▎挝?次)濕垃圾菜葉82餅干73蛋殼82玉米73/次面包91干垃圾

45、舊浴缸73貓砂82橡皮泥82尿不濕100貝殼100有害垃圾電池91打火機(jī)91創(chuàng)可貼82酒精73油漆100可回收物易拉罐91報紙91舊書包82舊鞋子100牛奶盒73指令我要扔垃圾17822總計34654表5-1 垃圾分類系統(tǒng)識別測試表系統(tǒng)測試時各種類型垃圾測試相關(guān)圖如所示濕垃圾語音測試圖5-3:圖5-3 濕垃圾語音測試干垃圾語音測試圖5-4:圖5-4 干垃圾語音測試有害垃圾語音測試圖5-5:圖5-5 有害垃圾語音測試可回收物語音測試圖5-6:圖5-6 可回收物語音測試由上述統(tǒng)計結(jié)果,根據(jù)公式(5-1):識別準(zhǔn)確率= (5-1)對此,可以得出本次系統(tǒng)的識別正確率為86.5%。所以本系統(tǒng)在語音識別的

46、準(zhǔn)確度上到達(dá)標(biāo)準(zhǔn)水平,且有著較高的識別正確率。 第6章 總結(jié)與展望6.1 總結(jié)本次系統(tǒng)設(shè)計和論文主要是根據(jù)當(dāng)下國家內(nèi)的環(huán)境問題作為背景,運用智能化的語音識別技術(shù)對垃圾分類問題進(jìn)行研究和解決。本文設(shè)計的基于智能語音識別控制技術(shù)的垃圾分類系統(tǒng),可以幫助大城市中家庭垃圾進(jìn)行分類,從而提升城市垃圾處理效率。經(jīng)總結(jié),本文的主要工作和成果如下:(1) 對語音識別技術(shù)進(jìn)行了較為完整詳細(xì)地探究。對于語音識別技術(shù)的各個環(huán)節(jié)進(jìn)行分別探討。首先要做的時將接收到的語言數(shù)據(jù)流進(jìn)行預(yù)處理操作,其中包括對高頻語音信號的加重處理,減少噪聲對信號的干擾程度。然再把通過處理后的結(jié)果進(jìn)行加窗和分幀,得到更加平穩(wěn)的信號,提高識別準(zhǔn)確

47、度。再完成端點檢測,判斷語音流正確的七點和重點,這個操作可以大大增加語音信號的正確率。將處理好的語音數(shù)據(jù)流進(jìn)行特征值提取,再根據(jù)語音識別模型進(jìn)行計算,最終轉(zhuǎn)成文本。整個過程完成全部語音數(shù)據(jù)到文本數(shù)據(jù)的操作。(2) 對設(shè)備整體工作流程進(jìn)行了完整的闡述。從設(shè)備接收到語音信號開始,LD3320芯片開始對語音數(shù)據(jù)流進(jìn)行加工處理,以便更好地進(jìn)行識別操作。然后根據(jù)STM32F103C8T6內(nèi)部的拼音文本進(jìn)行匹配打分,得出相似度最高的結(jié)構(gòu),再將比對后的結(jié)果變成識別碼反饋到單片機(jī),交由單片機(jī)控制其余模塊進(jìn)行交互音頻播放和開合垃圾桶控制的工作。(3) 分別從軟件設(shè)計和硬件設(shè)計方面清晰地介紹了本次系統(tǒng)的主要性能。

48、其中的STM32F103C8T6單片機(jī)有著非常流暢的配置基礎(chǔ),可以使得整體幾乎零等待地進(jìn)行運作;LD3320語音識別芯片較高的識別率和準(zhǔn)確性使得系統(tǒng)更加可靠和實用;JQ8900語音播報功能可以給用戶帶來更友好的交互式體驗;6.2 展望總的來說本次系統(tǒng)設(shè)計比較順利,功能也較為完善。但也有不夠好的地方,對此,還需要慢慢做出改進(jìn)和更新,才能更好的應(yīng)用實際當(dāng)中。(1) 對于整個系統(tǒng)來說功能還是比較局限,想要真正運用起來,還需要增加更多功能、減少材料成本、提升識別效率和準(zhǔn)確率。比如增加顯示屏功能和按鍵功能,增加用戶的選擇性。(2) 本次系統(tǒng)的使用環(huán)境也較為局限,主要是在安靜的家庭中使用。對于測試也只測試

49、了安靜的家庭環(huán)境的數(shù)據(jù),對于其他情況考慮較少,需要后續(xù)增加抗噪的識別算法和噪聲環(huán)節(jié)下的使用測試。本次系統(tǒng)還有待高,語音識別技術(shù)作為當(dāng)今世界上較為主流的技術(shù)之一,可以讓用戶體驗到交互式控制的樂趣和便利。期待此技術(shù)在未來有著更高水平的發(fā)展,同時也希望更多優(yōu)秀的語音識別產(chǎn)品也能投入運用,更加豐富我們的生活。 參 考 文 獻(xiàn)1 王科舉,廉小親,安颯,陳彥銘,龔永罡.基于樹莓派和Arduino的智能垃圾桶J.信息技術(shù)與信息化,2019(10):104-108.2 蘇珍,康學(xué)亮,馬飛虎.基于STM32系統(tǒng)的智能語音控制的垃圾桶設(shè)計J.機(jī)電信息,2019(18):142-143.3 劉曉蒙,趙立強,李偉.一

50、種新型智能垃圾桶的設(shè)計J.物聯(lián)網(wǎng)技術(shù),2019,9(09):79-81.4 周飛宇,王磊,朱恩旭,唐政坤,張磊,唐珊.智能垃圾桶控制系統(tǒng)設(shè)計J.信息記錄材料,2019,20(05):148-149.5 張園,江民歡,闞輝昂,冒書梅,王學(xué)剛.基于Arduino控制器的校園智能垃圾桶設(shè)計J.智能城市,2019,5(06):15-16.6 胡傲,謝婭婭.基于Arduino的智能垃圾桶設(shè)計J.信息通信,2019(01):164-165.7 于曉明.語音識別技術(shù)的發(fā)展及應(yīng)用J.計算機(jī)時代,2019(11):28-31.8 陳心靈,錢寧博,胡佳輝,王戰(zhàn)中.基于STM32單片機(jī)的嵌入式語音識別系統(tǒng)設(shè)計J.機(jī)電工程技術(shù),2019,48(06):135-137.9 鄭斯琦.基于Arduino的語音識別系統(tǒng)設(shè)計J.科技風(fēng),2018(11):3-4.10 趙璐,吳蒙.基于Arduino的語音識別與控制系統(tǒng)實現(xiàn)J.微型機(jī)與應(yīng)用,2015,34(21):55-57+60.11 馮瑤. 基于語音識別的遠(yuǎn)程控制系統(tǒng)的研究與實現(xiàn)D.哈爾濱理工大學(xué),2016.12 肖愛民. 基于語音識別技術(shù)的智能家居控制系統(tǒng)的設(shè)計D.南昌大學(xué),2018.13 蘇敏

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論