電視機(jī)智能聲控選臺系統(tǒng)設(shè)計與實現(xiàn)_第1頁
電視機(jī)智能聲控選臺系統(tǒng)設(shè)計與實現(xiàn)_第2頁
電視機(jī)智能聲控選臺系統(tǒng)設(shè)計與實現(xiàn)_第3頁
電視機(jī)智能聲控選臺系統(tǒng)設(shè)計與實現(xiàn)_第4頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

電視機(jī)智能聲控選臺系統(tǒng)設(shè)計與實現(xiàn)

胡延平陳強(qiáng)谷鴻林時間:2009年05月14日

字體:大中小

關(guān)鍵詞:

摘?要:關(guān)鍵詞:語音識別?彩電遙控?智能聲控選臺?隨著電視頻道數(shù)目的日益增多,傳統(tǒng)的電視遙控方法弊端越來越明顯。它需要觀眾記憶大量電視臺對應(yīng)頻道,這是件很令人頭疼的事情。我們利用專用語音識別芯片TSG410設(shè)計了一個彩電智能聲控選臺系統(tǒng),可以較好地解決記憶頻道這個難題。尤其對殘疾朋友來講,更具有特殊的意義。該系統(tǒng)不對彩電做任何改動。在保留原有遙控功能的基礎(chǔ)上,實現(xiàn)語音控制選臺,主要功能有:·開關(guān)電視:電視接通電源處于待命狀態(tài),操作者發(fā)出“開機(jī)”命令,則打開電視機(jī);操作者發(fā)出“關(guān)機(jī)”命令,則關(guān)掉電視機(jī);·選臺功能:操作者想看XX電視臺的節(jié)目,只要發(fā)出“XX臺”的命令,電視機(jī)自動跳轉(zhuǎn)到該臺?!ぷR別主人功能:為防止誤操作,該系統(tǒng)只對事先錄入命令樣本的操作者語音敏感,其他人發(fā)出的命令包括電視伴音均無效。·其它功能:具有電視音量、畫面亮度調(diào)節(jié)等適合語音控制的功能。1系統(tǒng)設(shè)計方案我們最初考慮了兩種設(shè)計方案(見圖1和圖2),它們各有優(yōu)缺點。第一種電路不足之處是:電路稍復(fù)雜一點,而且要對電視機(jī)的選臺控制電路做必要的改動(當(dāng)然這對電視機(jī)生產(chǎn)廠家是不成問題的);其優(yōu)點是:只需一個無線話筒便可聲控選臺,且不必對準(zhǔn)電視機(jī),甚至在另一個房間也可實現(xiàn)遙控。第二種電路的優(yōu)點是:不必對電視機(jī)的選臺控制電路做任何的改動;缺點是:所有電路只能靠電池供電,芯片選擇要考慮耗電和工作電壓問題。由于采用紅外遙控發(fā)射來控制電視,該系統(tǒng)須對準(zhǔn)電視機(jī)才能正常工作。綜合考慮各方面因素,我們認(rèn)為第二種設(shè)計方案較切實可行。??2各個功能模塊簡介2.1語音命令提取單元語音命令提取該單元(如圖2)在電視話音和其它噪音背景下,完成提取出操作者語音命令功能,其示意圖如圖3所示。2.2語音識別單元語音識別單元主要由TSG410和非易失性SRAM組成,大體構(gòu)成如下圖4所示。?語音識別功能由專用語音芯片TSG410完成,TSG410是一種新穎功能齊全的語音識別集成電路。它采用CMOS大規(guī)模集成電路制作工藝制造,內(nèi)含除SRAM以外語音識別所需的全部電路,如CPU、A/D轉(zhuǎn)換器、ROM、語音放大器、壓縮器、濾波器、振蕩器及接口電路等。TSG410具有雙列直插和貼片兩種封裝方式,可工作在CPU控制和人工控制兩種模式下。語音識別的響應(yīng)時間典型值為300ms,最長不超過600ms。識別容量大,最多可識別40個字段,且分段方式靈活。為了CPU管理方便,將40個字段分成四組,編號為1~4,每組10個字段。這樣,第一個字段編號為10,第二個為11,第三個為12…依次類推,第40個字段編號為49。在操作顯示時,十位數(shù)顯示組號,個位數(shù)顯示序號。因此,建立語音樣本時,應(yīng)注意顯示數(shù)字和電視機(jī)選擇頻率之間的換算關(guān)系,以免語音命令和控制結(jié)果對應(yīng)不起來。各段功能分配如表1所示。?一般情況下,留有30個預(yù)選頻道是足夠用的。實際上,既可以采用多片TSG410進(jìn)行頻道數(shù)和允許操作者人數(shù)擴(kuò)展方式滿足各種需要,也可以采用讓TSG410工作在CPU控制方式的辦法。此時識別容量不受40字段限制,但需增加單片機(jī)(如8031)作控制用。2.3控制面板為了能輸入字段號,以便建立語音樣本,TSG410配置了外接鍵盤掃描電路。行、列信號的輸入、輸出口由芯片的S1~S3、K1~K3擔(dān)當(dāng)。這樣一個三列、四行的鍵盤共有12個按鍵,其中十個定義為:0~9數(shù)字鍵,一個定義為:語音樣本建立鍵(TRN),一個定義為:語音樣本清除鍵(CLR)。由于控制面板只在建立語音樣本時使用,為防止誤操作,應(yīng)將12個按鍵用塑料外殼封起來。2.4操作指示電路2.5邏輯控制電路整個邏輯控制電路如圖5所示。TSG410通過D0~D7輸出識別結(jié)果,必須進(jìn)行必要的譯碼后,才能用來控制后面的紅外發(fā)射裝置。在電視機(jī)的遙控系統(tǒng)中,遙控發(fā)射器通過按鍵,以紅外線方式發(fā)出各種不同的脈沖編碼信息。尤其需要注意其發(fā)射編碼必須與原來一致,以便兼容。采用電子開關(guān)電路模擬手工按鍵時,必須考慮開關(guān)接通時間和兩個按鍵之間的時間間隔問題,以防止信號丟失和“串鍵”、“并鍵”現(xiàn)象的發(fā)生。通常情況下,全部鍵位掃描一次的時間小于10~20ms,而人手觸及按鍵的時間最短也在100ms以上,因此在任一按鍵被按下后,會有多次掃描信號通過,不存在信號丟失問題。所謂“串鍵”是指在一個鍵按下之后,又接著按下另一鍵;而“并鍵”則是同時按下兩鍵。這兩種錯誤操作發(fā)生的根本原因是:每個按鍵的遙控指令編碼需要一定時間才能發(fā)射完畢(一般在100ms左右),所以應(yīng)設(shè)法消除。這是我們設(shè)計邏輯控制電路時的一個難點,采用脈沖展寬(>40ms)和脈沖延遲電路(>120ms)解決。?2.6遙控發(fā)射電路需要

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論