智能語音控制系統(tǒng)_第1頁
智能語音控制系統(tǒng)_第2頁
智能語音控制系統(tǒng)_第3頁
智能語音控制系統(tǒng)_第4頁
智能語音控制系統(tǒng)_第5頁
免費預(yù)覽已結(jié)束,剩余4頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、作品說明書題目:智能語音控制系統(tǒng)目錄1. 開發(fā)背景 22. 原理 23. 設(shè)計方案 24. 硬件電路設(shè)計 35. 軟件程序設(shè)計 56. 理 論 分 析 與 算 法 51 . 開發(fā)背景20 世紀(jì) 80 年代初,隨著大量采用電子技術(shù)的家用電器面市,家居系統(tǒng)電子化( HE,Homen Electronics) ,智能化越來越多。然而當(dāng)今人們對日常設(shè)備的智能 化控制要求越來越高,從原來的復(fù)雜化到簡單話,在由簡單化到傻瓜化,但是現(xiàn)在人們還是不滿足,他們還想要更簡單的更方便的更智能的方法來控制自己擁有 的設(shè)備,這就是語音控制系統(tǒng)為什么會在現(xiàn)代社會如此流行,如此受到大家的歡 迎,讓語音控制系統(tǒng)成為當(dāng)今最前沿

2、的民用控制技術(shù)。2 . 原理本系統(tǒng)采用r8c 瑞薩單片機(jī)采集語音信號,再把語音信號通過通信傳到電腦上去, 通過電腦的高述的CPU 對你說的話就是語音進(jìn)行分析與計算,最終達(dá)到對語音識別的目的,當(dāng)上位機(jī)識別到你說發(fā)出的語音后把信號通過通信傳回單片機(jī),通過單片機(jī)在來控制所有你想控制的設(shè)備,如電視、空調(diào)、冰箱、電飯鍋、洗衣機(jī)等家用電器的工作。本系統(tǒng)運用了很多前沿性的技術(shù),通信, 單片機(jī)控制,對語音的分析,是本系統(tǒng)的三大主要內(nèi)容,特別是對語音的分析才是本系統(tǒng)的靈魂。3 . 設(shè)計方案單片機(jī)經(jīng)過一個音頻接收電路把音頻(聲音)信號采集進(jìn)單片機(jī)機(jī)系統(tǒng)中,在通過選用TL064cM音芯片把音頻信號轉(zhuǎn)換成對應(yīng)的電壓值

3、,再通過瑞薩單片機(jī)(16位)的ADI樣把電壓采集進(jìn)來,同時為了提高采樣頻率,就采用直接把未處理的數(shù)據(jù)通過RS23漏口上傳到上位機(jī)軟件中;在上位機(jī)程序中通過一定的算法處理采集到的數(shù)據(jù)流,然后把這些數(shù)據(jù)對應(yīng) 的“寫”到窗體顯示程序中(既分析儀界面),以實現(xiàn)音頻信號的采集工作進(jìn)行分析。最后 得出結(jié)果, 再由上位機(jī)傳送控制信號回單片機(jī), 讓單片機(jī)進(jìn)行控制.4 .硬件電路設(shè)計硬件電路由R8c瑞莎單片機(jī)最小系統(tǒng)和 RS232串口通訊,語音接收電路以 及電源和設(shè)備控制電路組成。其中瑞薩單片機(jī)最小系統(tǒng)版電路包括電器設(shè)備指示燈等。圖2.單片機(jī)最小系統(tǒng)原理圖因為電腦用以RS232通訊的高電平-12V,低電平+12

4、V,所以采用MAX232 芯片進(jìn)行電壓轉(zhuǎn)換。MAX232采用+5V供電,其電路原理圖如下圖3所示。VCCDB9圖3.串口通訊原理圖瑞薩單片機(jī)采用5V電源供電,其原理圖如下圖4所示,220V交流電經(jīng)過變 壓器之后,輸出9V交流電壓,再經(jīng)過四個1N4007全波整流后,經(jīng)過電容濾波后 進(jìn)入三端集成穩(wěn)壓管LM780輸出直流5V電壓。其中Ci為濾波電容,C2的作用 是防止旁路高頻干擾信號,C3的作用是改善負(fù)載瞬態(tài)響應(yīng)。圖4.單片機(jī)電源原理圖為實現(xiàn)控制額定電壓220V家用電器,采用小繼電器實施隔離控制。繼電器5所示。采用三極管S9014驅(qū)動,其控制線號由單片機(jī)供給。具電路如下圖圖5.繼電器控制電路為了實現(xiàn)

5、對語音信號的接收,我們還需要把語音信號轉(zhuǎn)換為電信號的設(shè)備,其電路如下圖6所示。5 .軟件程序設(shè)計圖3:下位機(jī)軟件流程圖6 .理論分析與算法本系統(tǒng)最主要的工作就在于對語音的分析,這是本系統(tǒng)的難點,也是本系統(tǒng)的重點所在在對語音的采集與計算中也提到了很多算法,也是其中的精髓所在.首先對語音幸好數(shù)據(jù)進(jìn)行加窗處理,由于發(fā)音器官的慣性運動, 可以認(rèn)為在一小段時間里(一般為10ms30ms)語音信號近似不變,即語音信號具有短時平穩(wěn)性。這樣,可以把語 音信號分為一些短段(稱為分析幀)來進(jìn)行處理。語音信號的分幀實現(xiàn)方法:采用可移動的有限長度窗口進(jìn)行加權(quán)的方法來實現(xiàn)的。一般每秒的幀數(shù)約為33100幀。分幀一般采用

6、交疊分段的方法,這是為了使幀與幀之間平滑過渡,保持其連續(xù)性。前一01/2。圖3.3給出了幀移與幀長示意圖加窗常用的兩種方法:矩形窗,窗函數(shù)如下:漢明(Hamming)窗,窗函數(shù)如下1w ( n )00 n N 1其它幀和后一幀的交疊部分稱為幀移,幀移與幀長的比值一般取為加窗方法示意圖:0.54 0.46 cos 2狗/ N 1, 0 nw(n)0其它窗長的選擇一般選取100200。原因如下:當(dāng)窗較寬時,平滑作用大,能量變化不大,故反映不出能量的變化。當(dāng)窗較窄時,沒有平滑作用,反映了能量的快變細(xì)節(jié),而看不出包絡(luò)的變化。語音信號的分幀處理,實際上就是對各幀進(jìn)行某種變換或運算。設(shè)這種變換或運算用T表示,x(n)為輸入語音信號,w(n)為窗序列,h(n)是與w(n)有關(guān)的濾波器,則各幀經(jīng)處理 后的輸出可以表示為:Qn Tx(m)h(n m )m1.短時平均能量定義定義n時刻某語音信號的短時平均能量 En為:nEnx(m)w(n m)2x(m)w(n m)2mm n (N 1)當(dāng)窗函數(shù)為矩形窗時,有nE nx2(m )m n ( N 1 )若令2h ( n ) w ( n

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論