智能語音控制系統(tǒng)_第1頁
智能語音控制系統(tǒng)_第2頁
智能語音控制系統(tǒng)_第3頁
智能語音控制系統(tǒng)_第4頁
智能語音控制系統(tǒng)_第5頁
已閱讀5頁,還剩3頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、精選優(yōu)質(zhì)文檔-傾情為你奉上作品說明書題目:智能語音控制系統(tǒng) 目錄 6.理論分析與算法.51. 開發(fā)背景20世紀(jì)80年代初,隨著大量采用電子技術(shù)的家用電器面市,家居系統(tǒng)電子化(HE,Homen Electronics),智能化越來越多。然而當(dāng)今人們對日常設(shè)備的智能化控制要求越來越高,從原來的復(fù)雜化到簡單話,在由簡單化到傻瓜化,但是現(xiàn)在人們還是不滿足,他們還想要更簡單的更方便的更智能的方法來控制自己擁有的設(shè)備,這就是語音控制系統(tǒng)為什么會在現(xiàn)代社會如此流行,如此受到大家的歡迎,讓語音控制系統(tǒng)成為當(dāng)今最前沿的民用控制技術(shù)。2. 原理本系統(tǒng)采用r8c瑞薩單片機(jī)采集語音信號,再把語音信號通過通信傳到電腦上

2、去,通過電腦的高述的CPU對你說的話就是語音進(jìn)行分析與計(jì)算,最終達(dá)到對語音識別的目的,當(dāng)上位機(jī)識別到你說發(fā)出的語音后把信號通過通信傳回單片機(jī),通過單片機(jī)在來控制所有你想控制的設(shè)備,如電視、空調(diào)、冰箱、電飯鍋、洗衣機(jī)等家用電器的工作。本系統(tǒng)運(yùn)用了很多前沿性的技術(shù),通信,單片機(jī)控制,對語音的分析,是本系統(tǒng)的三大主要內(nèi)容,特別是對語音的分析才是本系統(tǒng)的靈魂。3. 設(shè)計(jì)方案單片機(jī)經(jīng)過一個音頻接收電路把音頻(聲音)信號采集進(jìn)單片機(jī)機(jī)系統(tǒng)中,在通過選用TL064CN語音芯片把音頻信號轉(zhuǎn)換成對應(yīng)的電壓值,再通過瑞薩單片機(jī)(16位)的AD采樣把電壓采集進(jìn)來,同時為了提高采樣頻率,就采用直接把未處理的數(shù)據(jù)通過R

3、S232接口上傳到上位機(jī)軟件中;在上位機(jī)程序中通過一定的算法處理采集到的數(shù)據(jù)流,然后把這些數(shù)據(jù)對應(yīng)的“寫”到窗體顯示程序中(既分析儀界面),以實(shí)現(xiàn)音頻信號的采集工作進(jìn)行分析。最后得出結(jié)果,再由上位機(jī)傳送控制信號回單片機(jī),讓單片機(jī)進(jìn)行控制.4. 硬件電路設(shè)計(jì)硬件電路由R8C瑞莎單片機(jī)最小系統(tǒng)和RS232串口通訊,語音接收電路以及電源和設(shè)備控制電路組成。其中瑞薩單片機(jī)最小系統(tǒng)版電路包括電器設(shè)備指示燈等。圖2.單片機(jī)最小系統(tǒng)原理圖因?yàn)殡娔X用以RS232通訊的高電平-12V,低電平+12V,所以采用MAX232芯片進(jìn)行電壓轉(zhuǎn)換。MAX232采用+5V供電,其電路原理圖如下圖3所示。圖3.串口通訊原理圖

4、瑞薩單片機(jī)采用5V電源供電,其原理圖如下圖4所示,220V交流電經(jīng)過變壓器之后,輸出9V交流電壓,再經(jīng)過四個1N4007全波整流后,經(jīng)過電容濾波后進(jìn)入三端集成穩(wěn)壓管LM780輸出直流5V電壓。其中C1為濾波電容,C2的作用是防止旁路高頻干擾信號,C3的作用是改善負(fù)載瞬態(tài)響應(yīng)。圖4.單片機(jī)電源原理圖為實(shí)現(xiàn)控制額定電壓220V家用電器,采用小繼電器實(shí)施隔離控制。繼電器采用三極管S9014驅(qū)動,其控制線號由單片機(jī)供給。其電路如下圖5所示。圖5.繼電器控制電路為了實(shí)現(xiàn)對語音信號的接收,我們還需要把語音信號轉(zhuǎn)換為電信號的設(shè)備,其電路如下圖6所示。5.軟件程序設(shè)計(jì)開始音頻信號采集循環(huán)把采集到的信號上傳到上

5、位機(jī)控制 圖3:下位機(jī)軟件流程圖6.理論分析與算法 本系統(tǒng)最主要的工作就在于對語音的分析,這是本系統(tǒng)的難點(diǎn),也是本系統(tǒng)的重點(diǎn)所在,在對語音的采集與計(jì)算中也提到了很多算法,也是其中的精髓所在. 首先對語音幸好數(shù)據(jù)進(jìn)行加窗處理,由于發(fā)音器官的慣性運(yùn)動,可以認(rèn)為在一小段時間里(一般為10ms30ms)語音信號近似不變,即語音信號具有短時平穩(wěn)性。這樣,可以把語音信號分為一些短段(稱為分析幀)來進(jìn)行處理。語音信號的分幀實(shí)現(xiàn)方法: 采用可移動的有限長度窗口進(jìn)行加權(quán)的方法來實(shí)現(xiàn)的。一般每秒的幀數(shù)約為33100幀。分幀一般采用交疊分段的方法,這是為了使幀與幀之間平滑過渡,保持其連續(xù)性。前一幀和后一幀的交疊部分稱為幀移,幀移與幀長的比值一般取為01/2。 圖3.3給出了幀移與幀長示意圖 加窗常用的兩種方法:矩形窗,窗函數(shù)如下:漢明(Hamming)窗,窗函數(shù)如下 加窗方法示意圖:窗長的選擇 一般選取100200。原因如下: 當(dāng)窗較寬時,平滑作用大,能量變化不大,故反映不出能量的變化。 當(dāng)窗較窄時,沒有平滑作用,反映了能量的快變細(xì)節(jié),而看不出包絡(luò)的變化。 語音信號的分幀處理,實(shí)際上就是對各幀進(jìn)行某種變換或運(yùn)算。設(shè)這種變換或運(yùn)算用T 表示,x(n)為輸入語音信號,w(n)為窗序列,h(n)是與w(n)有關(guān)的濾波器,則各幀經(jīng)處理后的輸出可以表示為: 1短時平均能量定義定義n時刻某語音信號

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論