![(電路與系統(tǒng)專業(yè)論文)基于說話人識別的無線門禁系統(tǒng)的應(yīng)用研究.pdf_第1頁](http://file.renrendoc.com/FileRoot1/2019-12/13/bf574adf-204c-4da6-aa37-2ede06d1f737/bf574adf-204c-4da6-aa37-2ede06d1f7371.gif)
![(電路與系統(tǒng)專業(yè)論文)基于說話人識別的無線門禁系統(tǒng)的應(yīng)用研究.pdf_第2頁](http://file.renrendoc.com/FileRoot1/2019-12/13/bf574adf-204c-4da6-aa37-2ede06d1f737/bf574adf-204c-4da6-aa37-2ede06d1f7372.gif)
![(電路與系統(tǒng)專業(yè)論文)基于說話人識別的無線門禁系統(tǒng)的應(yīng)用研究.pdf_第3頁](http://file.renrendoc.com/FileRoot1/2019-12/13/bf574adf-204c-4da6-aa37-2ede06d1f737/bf574adf-204c-4da6-aa37-2ede06d1f7373.gif)
![(電路與系統(tǒng)專業(yè)論文)基于說話人識別的無線門禁系統(tǒng)的應(yīng)用研究.pdf_第4頁](http://file.renrendoc.com/FileRoot1/2019-12/13/bf574adf-204c-4da6-aa37-2ede06d1f737/bf574adf-204c-4da6-aa37-2ede06d1f7374.gif)
![(電路與系統(tǒng)專業(yè)論文)基于說話人識別的無線門禁系統(tǒng)的應(yīng)用研究.pdf_第5頁](http://file.renrendoc.com/FileRoot1/2019-12/13/bf574adf-204c-4da6-aa37-2ede06d1f737/bf574adf-204c-4da6-aa37-2ede06d1f7375.gif)
已閱讀5頁,還剩82頁未讀, 繼續(xù)免費閱讀
(電路與系統(tǒng)專業(yè)論文)基于說話人識別的無線門禁系統(tǒng)的應(yīng)用研究.pdf.pdf 免費下載
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
h uj i np i n g o fw i r e l e s sa c c e s sc o n t r o l b e l a n z h o uu n i v e r s i t yo ft e c h n o l o g y 2 0 0 8 at h e s i ss u b m i a e di np a r t i a ls a t i s f a c t i o no ft h e r e q u i r e m e n t sf o rt h ed e g r e eo f m a s t e ro f e n g i n e e r i n g c i r c u i t sa n ds y s t e m s i nt h e g r a d u a t es c h o o l o f l a n z h o uu n i v e r s i t yo f t e c h n o l o g y s u p e r v i s o r e n g i n e e rc h e n r u o z h u m a y 2 0 1 1 蘭州理工大學(xué)學(xué)位論文原創(chuàng)性聲明和使用授權(quán)說明 原創(chuàng)性聲明 本人鄭重聲明 所呈交的論文是本人在導(dǎo)師的指導(dǎo)下獨立進行研究所 取得的研究成果 除了文中特別加以標(biāo)注引用的內(nèi)容外 本論文不包含任 何其他個人或集體已經(jīng)發(fā)表或撰寫的成果作品 對本文的研究做出重要貢 獻的個人和集體 均已在文中以明確方式標(biāo)明 本人完全意識到本聲明的 法律后果由本人承擔(dān) 作者簽名 易 童彳日期 矽 7 年彥月7 日 學(xué)位論文版權(quán)使用授權(quán)書 本學(xué)位論文作者完全了解學(xué)校有關(guān)保留 使用學(xué)位論文的規(guī)定 即 學(xué)校有權(quán)保留并向國家有關(guān)部門或機構(gòu)送交論文的復(fù)印件和電子版 允許 論文被查閱和借閱 本人授權(quán)蘭州理工大學(xué)可以將本學(xué)位論文的全部或部 分內(nèi)容編入有關(guān)數(shù)據(jù)庫進行檢索 可以采用影印 縮印或掃描等復(fù)制手段 保存和匯編本學(xué)位論文 同時授權(quán)中國科學(xué)技術(shù)信息研究所將本學(xué)位論文 收錄到 中國學(xué)位論文全文數(shù)據(jù)庫 并通過網(wǎng)絡(luò)向社會公眾提供信息服 務(wù) 篡釹 導(dǎo)師簽名 伢痧影節(jié) 日期 知 7 年多月7 日 日期 沙 年莎月7 日 1 2 國內(nèi)外研究現(xiàn)狀 1 1 3 研究的主要內(nèi)容及論文結(jié)構(gòu) 6 1 4 本章小結(jié) 6 第2 章門禁系統(tǒng)的設(shè)計方案與相關(guān)理論研究 7 2 1 說話人識別原理 7 2 2 語音信號的預(yù)處理 8 2 2 1 預(yù)加重 8 2 2 2 分幀與加窗 8 2 3 語音信號的端點檢測 一9 2 4 語音信號的特征提取 1 1 2 4 1 線性預(yù)測系數(shù) 1 1 2 4 2 美爾倒譜系數(shù)m f c c 1 2 2 5 語音信號的模式匹配 1 4 2 6 本章小結(jié) 1 7 第3 章基于說話人識別的門禁系統(tǒng)的硬件設(shè)計 1 8 3 1 系統(tǒng)的硬件結(jié)構(gòu) 1 8 3 2t m s 3 2 0 v c 5 5 xd s p 的基本結(jié)構(gòu) 18 3 2 1c 5 5 x 的c p u 結(jié)構(gòu) 2 0 3 2 2 存儲器映射 2 l 3 2 3d s p 的片內(nèi)外設(shè) 2 2 3 2 4c 5 5 x 的指令流水線和并行性 2 2 3 3 各主要單元電路 2 3 3 3 1 電源電路 2 3 3 3 2 時鐘電路 一2 4 3 3 3 音頻編解碼模塊 2 6 3 3 4 外擴存儲電路 2 9 3 3 5 上電自舉模式與語音處理模式的設(shè)定 3 3 基于說話人識別的無線門禁系統(tǒng)的應(yīng)用研究 3 3 6j t a g 接口電路 3 5 3 3 7 無線傳輸電路 3 5 3 4 硬件電路板的抗干擾設(shè)計 3 8 3 5 本章小結(jié) 3 8 第4 章基于說話人識別門禁系統(tǒng)的軟件設(shè)計 3 9 4 1 說話人識別的結(jié)構(gòu)框圖 3 9 4 2 說話人識別的軟件設(shè)計 4 0 4 2 1 系統(tǒng)的初始化 4 0 4 2 2a i c 2 3 語音信號采集 4 3 4 2 3 數(shù)據(jù)處理 4 3 4 2 4b o o tl o a d e r 程序設(shè)計 一4 4 4 2 5 非易失存儲器f l a s h 在線編程 4 5 4 3 無線通信的軟件設(shè)計 4 8 4 4 本章小結(jié) 5 l 第5 章系統(tǒng)聯(lián)調(diào)測試與結(jié)果分析 5 2 5 1 系統(tǒng)的硬件調(diào)試 5 2 5 2 系統(tǒng)的軟件調(diào)試 5 2 5 3 系統(tǒng)的測試設(shè)備 5 4 5 4 測試結(jié)果與分析 5 5 5 5 本章小結(jié) 5 7 結(jié)論與展望 5 8 參考文獻 6 0 致謝 6 4 附錄攻讀學(xué)位期間所發(fā)表的學(xué)術(shù)論文目錄 6 5 介紹了說話人識別的基本原理 包括語音信號的預(yù)處理 端點檢測 在研究傳統(tǒng) 端點檢測的基礎(chǔ)上提出雙門限的比較方法 特征提取 重點分析了l p c 倒譜和m f c c 倒譜 模式匹配采用改進的動態(tài)時間規(guī)整算法并進行詳細的分析 對算法的各個 部分進行了m a t l a b 仿真驗證 本文以t m s 3 2 0 v c 5 5 0 9 ad s p 芯片為核心 以高保真語音編解碼芯片 t l v 3 2 0 a i c 2 3 同步動態(tài)隨機存儲器s d r a m 和異步存儲器f l a s h 為主要外設(shè) 完成了系統(tǒng)的硬件設(shè)計 具體硬件設(shè)計電路包括 電源模塊 時鐘模塊 外擴存 儲器模塊 音頻編解碼器模塊 j t a g 接口 s i 4 4 3 2 模塊 根據(jù)系統(tǒng)實現(xiàn)的功能 要求 軟件基于c c s 開發(fā)環(huán)境 采用并行e m i f 引導(dǎo)方式 實現(xiàn)了 t m s 3 2 0 v c 5 5 0 9 ad s p 擴展f l a s h 的在線燒寫 采用了模塊化的程序設(shè)計方法 程序整體采用c 語言和匯編語言混合方式編程 完成了語音識別工程及無線數(shù) 據(jù)收發(fā)工程 本文基于實驗室環(huán)境 實現(xiàn)了說話人識別的無線門禁系統(tǒng)的軟硬件設(shè)計 基 本實現(xiàn)了預(yù)期的目標(biāo) 充分體現(xiàn)系統(tǒng)的可行性 具有較強的實用價值 關(guān)鍵詞 說話人識別 d s p 動態(tài)時間規(guī)整 s i 4 4 3 2 門禁系統(tǒng) i l l s p e a k e rr e c o g n i t i o n i sak i n do fb i o l o g i c a lc e r t i f i c a t i o n t e c h n o l o g y i nt h e b i o l o g i c a lc e r t i f i c a t i o na r e a s p e a k e rr e c o g n i t i o nw i d e l yd r a w st h ea t t e n t i o nb e c a u s eo f i t sc o n v e n i e n c e e f f i c i e n c ya n da c c u r a c y a tp r e s e n t t h es p e a k e rr e c o g n i t i o ns y s t e m a r ew o r kd e p e n do nc o m p u t e rm o s t l y s ot h es y s t e mi se x p e n s i v ea n ds e r v e j u s tf o ra s i n g l eu s e r t oac e r t a i ne x t e n t i th i n d e r e dt h es p e a k e rr e c o g n i t i o na c c e s sc o n t r o l s y s t e md e v e l o p m e n t t h i sa r t i c l er e v i e wt h ec o u r s e so fs p e e c hr e c o g n i t i o nt e c h n o l o g y o nt h eb a s i so f t h ea b o v e t h eb a s i ct h e o r yo fs p e a k e rr e c o g n i t i o ni si n t r o d u c e da c c o r d i n gt ot h em o d e l o fs p e a k e rr e c o g n i t i o ns y s t e m w h i c hi n c l u d e st h ev o i c e s i g n a l s p r e t r e a t m e n ta n dt h e d e t e c t i o no fe n d p o i n t c o m p a r i n gt h et r a d i t i o n a lm e t h o do fd e t e c t i o n t h i s p a p e r p r o p o s e sad o u b l et h r e s h o l dc o m p a r a t i v em e t h o d t h ef e a t u r ei se x t r a c t e da n di ti s f o c u so nt h ei n v e r t e d p e d i g r e eo fl p ca n dm e ls c a l ef r e q u e n c y t h es p e a k e r r e c o g n i t i o na l g o r i t h md t w i si n t r o d u c e da n da n a l y z e di nt h ep a p e r e a c hp a r to ft h e a l g o r i t h mi sv e r i f i e do nt h em a t l a bs i m u l a t i o n i nt h eh a r d w a r e d e s i g n t h es y s t e m u s e st h ed i g i t a l s i g n a lp r o c e s s o ro f t m s 3 2 0 v c 5 5 0 9 aa st h e c o r e h i g h f i d e l i t yv o i c ec o d e cc h i pt l v 3 2 0 a i c 2 3 s y n c h r o n o u sd y n a m i cr a n d o ma c c e s sm e m o r ys d r a ma n da s y n c h r o n o u sm e m o r y f l a s ha st h em a i np e r i p h e r a l s t h ep a r to fh a r d w a r ec i r c u i td e s i g n s p e c i f i c a l l y i n c l u d e sp o w e rm o d u l e s c l o c km o d u l e s e x t e r n a le x p a n s i o nm e m o r ym o d u l e s a u d i o c o d e cm o d u l e s j t a gi n t e r f a c ea n ds i 4 4 3 2m o d e b a s e do nc c sd e v e l o p m e n t e n v i r o n m e n t t h i sp i e c eo fp a p e rh a sp a r a l l e le m i f b o o tm o d et oa c h i e v et h eo n c h i p b o o t l o a d e ro ft h e d i g i t a ls i g n a lp r o c e s s o ro ft m s 3 2 0 v c 5 5 0 9 aa f t e ro n l i n e s i m u l a t i o n u s i n gm o d u l a rp r o g r a m m i n gm e t h o d s p r o c e d u r e su s i n gcl a n g u a g ea n d a s s e m b l yl a n g u a g eh y b r i d s i tf i n i s h e dt h e i p r o g r a m m i n g i t s p e e c hr e c o g n i t i o n e n g i n e e r i n ga n dw i r e l e s sd a t at r a n s c e i v e re n g i n e e r i n g i ti sp r o v e dt h a tt h ed e s i g n s c h e m eo ft h es y s t e mi se f f e c t i v e k e yw o r d s s p e a k e ri d e n t i f i c a t i o n d s p d t w s i 4 4 3 2 w i r e l e s sa c c e s sc o n t r o ls y s t e m i v 圖2 6m f c c 計算流程圖 1 4 圖2 7d t w 算法搜索路徑 15 圖2 8 匹配路徑約束示意圖 1 6 圖3 1 系統(tǒng)硬件結(jié)構(gòu)圖 18 圖3 2c 5 5 x 的c p u 結(jié)構(gòu)圖 2 0 圖3 3t m s 3 2 0 v c 5 5 0 9 a 封裝存儲器映射圖 2 l 圖3 4c 5 5 x 流水線示意圖 2 3 圖3 5 電源電路 2 4 圖3 6 時鐘電路 2 5 圖3 7t 3 2 0 a i c 2 3 芯片引腳圖 2 6 圖3 8t m s 3 2 0 v c 5 5 0 9 a 與a i c 2 3 接口示意圖 2 8 圖3 91 2 c 模塊數(shù)據(jù)傳輸圖 2 9 圖3 1 0a i c 2 3 在d s p 模式下的串口時序圖 2 9 圖3 1 1t m s 3 2 0 v c 5 5 0 9 a 與s d r a m 接口示意圖 3l 圖3 1 2t m s 3 2 0 v c 5 5 0 9 a 與f l a s h 接口示意圖 3 2 圖3 1 3l v c l 6 2 4 5 連接圖 一3 4 圖3 1 4 上電自舉模式示意圖 3 4 圖3 15j t a g 接口電路 3 5 圖3 1 6s i 4 4 3 2 硬件連接圖 3 7 圖4 1 說話人識別的軟件流程圖 3 9 圖4 2 擦除和編程命令示意圖 4 6 圖4 3 觸發(fā)位檢測算法流程圖 4 7 圖4 4f l a s h 擦除圖 4 8 圖4 5f l a s h 燒寫圖 4 8 圖4 6d s p 與s 1 4 4 3 2 連接圖 4 9 圖4 7s p c r l 控制寄存器圖 4 9 圖4 8s p c i l 2 控制寄存器圖 j 4 9 圖4 9s p i 操作模式3 時序圖 5 0 圖4 10s i 4 4 3 2 發(fā)送軟件流程圖 5 0 圖5 1 語音工程y u y i n s h i b i e p j t 界面 5 3 v 5 3 5 4 5 4 5 4 5 5 5 6 5 6 5 6 表3 8l v c l6 2 4 5 功能表 3 4 表3 9s 1 4 4 3 2 的引腳定義與描述 3 7 表4 1 引導(dǎo)構(gòu) 4 4 表4 2a m 2 9 l v 8 0 0 b 操作命令說明 一4 5 表4 3 寫操作各時間參數(shù) 4 7 表5 1 說話人識別實驗結(jié)果 5 5 v l i 禁系 容易 的要 求 而在生物技術(shù)和信息科學(xué)迅速發(fā)展的今天 生物認(rèn)證技術(shù)是一種方便 先進 的信息安全技術(shù)在現(xiàn)實生活中已經(jīng)得到廣泛的應(yīng)用 人的語音信號是自然界生物 信號的一種 每個人的聲音都與環(huán)境 情緒 聲道模型 健康狀況等有關(guān) 都有 自己獨特的特性 所以可以通過分析語音信號來識別說話人成為可能n 2 1 特別 是進入j u 2 1 世紀(jì)以來 科研人員對說話人識別進行了很廣泛的研究 在生物識別 領(lǐng)域中 利用說話人的語音信號來進行說話人識別有許多獨特的優(yōu)點 如語音信 號相對于其它的生物信號 成本比較低廉 采集相對簡單 沒有嚴(yán)格的方向性 可以在黑暗中傳播等 說話人識別技術(shù)被廣泛的應(yīng)用于醫(yī)學(xué)應(yīng)用 聲控電子鎖 搜索罪犯等領(lǐng)域 而綜合集成了大型計算機 無線通訊 自動識別 機械工程和安全管理等相 關(guān)技術(shù)的門禁系統(tǒng)有效地解決了重要部門和場合的安全控制問題 已經(jīng)被應(yīng)用的 越來越廣泛 并產(chǎn)生了深遠的影響 目前市場上的門禁系統(tǒng)大多是采用有線的通 信方式 小區(qū)單元通過有線的方式與各個用戶端相連 與這類有線網(wǎng)絡(luò)通信的樓 宇控制產(chǎn)品相比 無線門禁的解決方案安裝布置更加靈活 費用低廉 樓宇間的 設(shè)備重組更加方便 可移動性強等方面的優(yōu)勢 因此 無線門禁系統(tǒng)受到相關(guān)公 司 研究團隊的重視 其將在門禁市場中占據(jù)越來越重要的地位 本課題針對人們對智能安防系統(tǒng)日益增長的需求 提出了基于說話人識別的 無線門禁系統(tǒng)的應(yīng)用研究 該系統(tǒng)可應(yīng)用于小區(qū)單元及用戶控制鎖的工程實踐 中 充分體現(xiàn)了生物信號中說話人識別的便利性 無線通信的實時性 為現(xiàn)代化 的門禁系統(tǒng)提供一種可靠的方案 1 2 國內(nèi)外研究現(xiàn)狀 對說話人識別的研究d 4 開始于上世紀(jì)六十年代 主要研究內(nèi)容是人工的說 話人識別 1 9 6 6 年 美國法院第一次采用語譜圖進行了取證 5 蚓 7 0 年代中期 b s a t a l 研究了線性預(yù)測l p c l i n e a rp r e d i c t i v ec o d i n g 系數(shù) 倒譜系數(shù)等不同 的特征參數(shù) 并論證了倒譜系數(shù)在進行說話人識別中是比較理想的特征參數(shù) 許 多學(xué)者和研究人將對矢量量化模型v q v e c t o rq u a n t i z a t i o n 隱馬爾科夫模型 h m m h i d d e nm a r k o vm o d e l 1 7 j 和人工神經(jīng)網(wǎng)絡(luò)a n n a r t i f i c i a l n e u r a l n e t w o r k 8 1 0 1 弓i 入到說話人識別研究中 大大地推動了說話人識別技術(shù)的發(fā)展 綦丁 說i 再人識別的無線門禁系統(tǒng)的麻用研究 我國說話人識別的研究工作開始于五十年代 伴隨著計算機技術(shù)的快速發(fā)展 根 據(jù)我國的具體實際情況 特別是在漢語識別技術(shù)上 創(chuàng)造出適合漢語識別的技術(shù) 說話人識別要求從語音信號中提取個體差異 提取出能反映說話人是誰的信息 從而進行說話人識別 其基本原理是為每一個說話人建立一個能夠描述這一說話 人個性特征的模型 作為此說話人個性特征的描述 說話人識別可以分為兩個范 疇 即說話人辨認(rèn)和說話人確認(rèn) 前者是把要檢測的語句判為n 個訓(xùn)練說話人之 一所說 是一個多擇一的問題 后者則是把帶檢測人的語句與其參考說話人的相 比較 相符的即得到確認(rèn) 不相符的則得到否定 是二擇一的問題 說話人辨識 時取與測試語音匹配距離最小的說話人模型所對應(yīng)的說話人作為說話人辨識的 結(jié)果 說話人確認(rèn)時與所聲稱的說話人模型進行匹配 若匹配距離小于規(guī)定的閥 值 則該說話人得到證實 否則該說話人不是他所聲稱的說話人 要實現(xiàn)說話人 識別系統(tǒng)需要解決三個問題 1 首先對說話人的語音信號進行預(yù)處理 端點檢 測和特征提取 2 說話人模板的建立和模板參數(shù)的訓(xùn)練 3 測試的語音模板與 說話人模板的匹配距離計算 針對當(dāng)前的說話人識別 大致可歸為三類 第一類 模板匹配法 以前的說話人識別是根據(jù)簡單的模板匹配的原理構(gòu)造 的特定人 小詞匯量 孤立詞識別系統(tǒng) 叫引 在訓(xùn)練和識別的時候 必須保證兩 個模板采用相同的幀數(shù) 相同的預(yù)處理與窗函數(shù) 但是在實際的應(yīng)用中 說話人 的語音具有很大的似然性 所以要把兩幀延長到相同的長度 于是 日本學(xué)者板 倉 i t a k u r a 將動態(tài)規(guī)劃算法 d y n a m i cp r o g r a m m i n g d p 的概念用于解決孤立詞 識別時的說話速度不均勻的難題 提出了著名的動態(tài)時間規(guī)整算法 d y n a m i c t i m ew a r p i n g 簡稱d t w 它是最近被廣泛研究和應(yīng)用的一種模式識別的方法 在說話人識別中獲得了比較廣泛的應(yīng)用 h o 引 d t w 是一個典型的求解最優(yōu)化問題 將說話人的語音信號在時間軸上進行不均勻的彎曲 使其測試模板與參考模板 對齊 并計算最小的幀匹配距離 從而獲得累計距離最小的規(guī)整函數(shù) 這就保證 了參考模板的特征和測試模板特征之問最大的聲學(xué)相似性和最小的誤差失真 但 是對于非特定人 大詞匯量 連續(xù)語音識別系統(tǒng)來講 這種模板匹配就顯得力不 從心 就必須尋求模板匹配以外的其它識別方法一隨機模型法及概率語法分析 法 第二類 概率模型法 突出的代表是 1 隱馬爾可夫模型h m m 方法i l 昏博j 可以 使用h 刪的概率參數(shù)來對似然函數(shù)進行估計與判決 從而得到識別結(jié)果 在用于 語音建模時 它是雙重的隨機過程 2 高斯混合模型 g a u s s i a nm i x t u r e m o d e l g m m 1 9 2 1 因為每一個說話人的個性特征都可由形式一致的高斯混合概率 密度函數(shù)中的參數(shù)來表示 故為每一個說話人建立一個g m m 混合模型來訓(xùn)練 從 而獲得模型中的參數(shù) 第三類 概率語法分析法 對于大詞匯量 連續(xù)非特定人的語音識別具有較 2 大的優(yōu)勢 專家學(xué)者通過采集分析語音信號 并建立不同的約束規(guī)則來描述不 同人的語音信號 從而達到識別說話人的目的 而說話人的語音具有較大的隨機 性和時變性 此方法的重點是如何選取這些約束規(guī)則以及它們之間相互轉(zhuǎn)化的條 件等 雖然說話人識別的正確率大大提高 但是算法計算的復(fù)雜度要遠遠的高于 前兩種方法 并且占用較大的存儲空間 移植起來具有很大的難度 在介紹了常用的說話人識別的方法外 還有很多像神經(jīng)網(wǎng)絡(luò)方法 2 2 2 3 算法 的識別方法 人工神經(jīng)網(wǎng)絡(luò)可采用物理可實現(xiàn)的器件或利用現(xiàn)有的計算機來模 擬生物神經(jīng)網(wǎng)絡(luò)的某些結(jié)構(gòu)與功能 包括神經(jīng)元 網(wǎng)絡(luò)拓撲和網(wǎng)絡(luò)的訓(xùn)練算法 三個部分 神經(jīng)網(wǎng)絡(luò)對復(fù)雜不確定性的問題具有自適應(yīng)和自學(xué)習(xí)能力 快速優(yōu) 化能力 對大量定性或定量信息的分布存儲能力 并行處理與合成能力 神經(jīng) 網(wǎng)絡(luò)還具有較強的魯棒性 若局部或部分神經(jīng)元損壞后 不會影響全局的活動 最近采用不同方法的融合技術(shù) 2 4 2 6 有了廣泛的應(yīng)用 1 維數(shù)約簡與識別方 式相結(jié)合 局部p c a p r i n c i p a lc o m p o n e n t a n a l y s i s 2 7 j 和g m m 結(jié)合的說話人識別系統(tǒng) 2 聚類與識別方法的結(jié)合 3 識別方式的結(jié)合 主要是采用了s v m s u p p o r tv e c t o r m a c h i n e 2 8 2 9 分類器 充分利用了s v m 適合不同樣本之間的分類 對于異類樣本 具有很強的分類能力 可以與其它很多模式識別的算法相結(jié)合 利用不同分類器 的特點 實現(xiàn)識別結(jié)果的最優(yōu)化 近年來雖然說話人識別的研究已經(jīng)取得很大的進展 但應(yīng)用于實際情況還需 要解決很多問題1 3 問題一 高維說話人特征的缺陷 為了提高說話人識別系統(tǒng)的識別率 往往 采用更高維的特征 然而 高維的特征矢量會增加計算量與存儲空間 不利于實 時的對語音信號進行處理 問題二 說話人分類方法的局限性 目前雖然有很多說話人識別的方法 在 說話人識別的領(lǐng)域中也取得了很好的識別效果 如矢量量化模型 隱馬爾科夫模 型 神經(jīng)網(wǎng)絡(luò)模型 支持向量機模型等 但是選用這些高維向量 需要不斷的迭 代計算 使得說話人識別的時間相對較長 因此 高復(fù)雜度的精確的模式匹配方 法并不適合于實時的說話人識別應(yīng)用 這需要強大的計算處理能力與數(shù)據(jù)存儲設(shè) 備 現(xiàn)有的低復(fù)雜度低計算量的模式識別方法 雖然所需的訓(xùn)練時間和測試時間 都比較短 但對說話人識別的準(zhǔn)確率有所下降 只適用于識別人數(shù)相對較少的情 況 一旦說話人的數(shù)量增多 識別性能就會急劇下降 隨著說話人識別中對于語音信號處理技術(shù)和計算機硬件 d s p 的高速發(fā)展 語音信號處理的硬件方式發(fā)生著質(zhì)的飛躍 隨著c 5 5 x 系y u d s p 的推出和應(yīng)用開發(fā) 的逐步深入 在實時性和低功耗方面體現(xiàn)出其優(yōu)良的性能 c 5 5 x 正成為通信和個 人消費領(lǐng)域的主流d s p 產(chǎn)品1 3 作為t i 公司低功耗系列的d s p 芯片 2 0 0 0 系列主要 用于工程電機等的自動控制中 5 0 0 0 系列主要用于語音信號處理 算法的實現(xiàn) 6 0 0 0 系列主要用于圖像的壓縮 增強等 對于市場上的c 8 0 5 1 單片機 a r m 及f p g a 3 藎 j 說i 再人識j j l j 的無線門禁系統(tǒng)的啦用研究 曼曼曼曼曼曼曼皇曼皇 蔓曼曼曼曼曼魯曼量皇曼曼曼曼黑笪曼曼曼曼曼量量曼曼曼曼曼曼曼曼曼曼曼曼曼曼曼曼曼曼量皇曼皇呂曼曼曼皇曼曼蔓曼蘭曼鼉蔓量 等 它在功耗 信號算法的處理等方面具有顯著的優(yōu)勢 3 2 d s p 主要發(fā)展現(xiàn)狀如 下 1 制造工藝與存儲容量 目前的d s p 芯片都采用c m o s i 藝 芯片的引腳 越來越多 集成的功能也越來越強 需要設(shè)計的外圍電路越來越少 t i 公司在 2 0 0 5 年1 2 月發(fā)布的達芬奇系統(tǒng)已經(jīng)把音視頻部件集成在d s p 內(nèi)部 內(nèi)部集成的 數(shù)據(jù)和程序存儲器也不斷增大 成本 體積和功耗不斷下降 2 內(nèi)存結(jié)構(gòu)和運算速度 目前的d s p 模塊基本上都采用數(shù)據(jù)總線和程序總 線分離的哈佛結(jié)構(gòu)或改進的哈佛結(jié)構(gòu) 多級流水線指令 內(nèi)部集成了鎖相環(huán) 可 以相應(yīng)的進行倍頻或者分頻 在一定范圍內(nèi)實現(xiàn)任意的時鐘頻率 使c u p 在一 個指令周期內(nèi)可多次對程序空間和數(shù)據(jù)空間進行訪問 大大提高了d s p 的運行 速度 3 開發(fā)工具 具有完善的軟件仿真工具和硬件開發(fā)工具 如 軟件開發(fā)環(huán) 境c c s 軟件仿真器s i m u l a t o r 在線仿真器e m u l a t o r c 編譯器 在線分析器 p r o f i l e 等 給開發(fā)帶來了極大的便利 其中c c s 軟件開發(fā)環(huán)境是t i 公司針對本 公司的d s p 產(chǎn)品開發(fā)的集成開發(fā)環(huán)境 它集成了代碼的編譯 鏈接和調(diào)試等諸 多功能 而且支持c c 和匯編的混合編程 開放式的結(jié)構(gòu)允許用戶外擴自身的 模塊 隨著芯片工藝的不斷發(fā)展 d s p 性能的進一步增強 為說話人識別技術(shù)走向 實踐應(yīng)用奠定了基礎(chǔ) 3 3 3 4 1 基于說話人識別的無線門禁系統(tǒng) 作為新型的現(xiàn)代 化智能化安全管理系統(tǒng) 它包括電子信息技術(shù) 計算機技術(shù) 無線通訊技術(shù) 生 物識別技術(shù)等諸多新技術(shù) 如何設(shè)置參考模板和測試模板 何時打開門鎖 遇到 特殊情況是否要發(fā)出警報等 以達到安全快捷的目的 是門禁系統(tǒng)最基本的功 能 在六十年代 計算機的應(yīng)用推動了說話人識別的發(fā)展 日本的東京無線電研 究實驗室 京都大學(xué)和n e c 實驗室都制作了能夠進行說話人識別的專用硬件 對 說話人識別領(lǐng)域進行了開拓性的研究工作 近年來 高性能數(shù)字信號處理芯片 d s p d g i t i a l s i n g a l p o r e c s s 技術(shù)的迅速發(fā)展 為說話人識別的實時實現(xiàn)提供了 可能 說話人識別的研究人員也一直致力于語音識別專用芯片和系統(tǒng)的研究 但 是 大多數(shù)的語音識別專用芯片識別性能差 不具備實用的要求 直到近十年以 來 隨著說話人識別算法的深入研究和集成電路技術(shù)的發(fā)展 才出現(xiàn)了一些具有 實用價值和市場前景的說話人識別專用芯片 其中 較為成功的兩個芯片詳細介 紹如下 1 r s c 一3 6 4 由美國的公司開發(fā) 2 0 0 0 年開始生產(chǎn) 是一顆為消費類電子產(chǎn)品應(yīng)用的低 價位的語音識別專用芯片 即r s 3 6 4 它使用預(yù)先學(xué)習(xí)好的人工神經(jīng)網(wǎng)絡(luò)進行 4 碩f j 學(xué)位論文 非特定人語音識別 不需要經(jīng)過訓(xùn)練就可以識別 y e s o 0 k 等簡單語 句 其說明書上介紹其識別率為9 7 此外 r s c 3 6 4 可以識別特定人 孤立詞 命令語句 約6 0 條左右 其說明書上稱其識別率為9 9 以上 r s c 3 6 4 還具有 5 1 5 k b s 的語音合成 其語音合成由s n e s o r y 專門設(shè)計 其音質(zhì)較好 它還具 有改進的a d p c m 自適應(yīng)差分脈沖調(diào)制 語音編解碼功能 用作語音回放 2 u n i s p e e c h s d a 8 0 d 5 1 德國i n f i n e o n 公司2 0 0 0 年開始生產(chǎn)的產(chǎn)品 它是一顆高性能的語音專用芯 片 這樣的設(shè)計能夠滿足立體聲處理或者消除外界干擾等功能要求 u n i s p e e c h s d a 8 0 d 5 l 的語音處理軟件包括 利用d t w 算法的特定人語音識別 能 夠識別1 0 0 條語句 利用h m m 算法的非特定人語音識別 詞匯量可以達到1 0 0 條 語句 高質(zhì)量 低碼率 2 4 1 3 k b s 的語音編解碼 用作語音提示和語音降低外 界的噪聲干擾 說話人識別功能等等 國內(nèi)在語音識別專用芯片的開發(fā)與研究方面起步較晚 比如清華大學(xué) 語音 識別專用芯片研究開發(fā) 課題 研究開發(fā)了國內(nèi)第一個具有自主知識產(chǎn)權(quán)的語音 識別專用芯片的軟件部分 該實驗室是國內(nèi)最早專門從事語音技術(shù)與專用芯片設(shè) 計研究單位之一 芯片能夠識別約2 0 3 0 條特定人語音命令 同時具有語音合成 提示 與語音編解碼 回放 功能 語音識別率達到9 8 以上 隨著現(xiàn)代社會的發(fā)展 人們對門禁系統(tǒng)的要求越來越嚴(yán)格和現(xiàn)代化 智能化 門禁系統(tǒng)的應(yīng)用范圍也越來越廣泛 近年來 國內(nèi)的門禁市場增長比較快速 門禁管理系統(tǒng)應(yīng)用于現(xiàn)代化智能大廈的出入控制 公司考勤 安防報警等許多場 合 也出現(xiàn)了許多生產(chǎn)門禁管理系統(tǒng)的公司 也研發(fā)出許多新型的門禁控制系 統(tǒng) 國內(nèi)外研發(fā)和使用的門禁控制系統(tǒng)主要都使用r f i d 門禁系統(tǒng)和生物識別門 禁系統(tǒng) 從1 9 9 4 年r f i d 射頻卡 進入中國 就帶動了中國r f i d 卡的技術(shù)快速 革新 在國內(nèi)r j c l d 的應(yīng)用領(lǐng)域越來越廣 它的應(yīng)用也促進了門禁管理系統(tǒng)的發(fā) 展 近年來我國經(jīng)濟總體水平明顯提高 各行各業(yè)對于現(xiàn)代化 智能化安防設(shè)備 的需求也會越來越多 安防產(chǎn)品也隨之迅速發(fā)展 目前在歐美的發(fā)達國家 它們的門禁系統(tǒng)市場已經(jīng)進入到細化的階段 其產(chǎn) 業(yè)的分工越來越細化 生產(chǎn)卡的公司單獨生產(chǎn)卡 生產(chǎn)控制器的公司獨立生產(chǎn)控 制器和配套的軟件 都集中生產(chǎn)某一種產(chǎn)品 而不是生產(chǎn)所有的設(shè)備 最近幾年 歐美各大公司也開始投入到無線門禁系統(tǒng)的研究設(shè)計 生產(chǎn)中來 正是由于d s p 計算機數(shù)字化的大量普及 高性能的模擬數(shù)字電路的不斷完善 各種保護電路 的不斷成熟改進 各種芯片的大幅降價 使得全世界的工程師才有機會設(shè)計出 性能良好 結(jié)構(gòu)完善 性價比極高的優(yōu)秀產(chǎn)品 表現(xiàn)出門禁系統(tǒng)對安防工作以及 對日常管理工作的真實貢獻 由于磁卡 接觸式i c 卡對操作環(huán)境的要求相對較高 磁卡及i c 卡容易磨損 本身的工作時間也是一定的 再加上識別過程中使用者的動作和所需時間明顯的 5 鋤 耔 基丁說 五人識別的無線門禁系統(tǒng)的戍用研究 要多于非接觸式卡 所以 i c 卡和生物識別的門禁系統(tǒng)相比 有很多缺點 從 科學(xué)技術(shù)長遠的發(fā)展角度上看 基于說話人識別的無線門禁系統(tǒng)或與以上技術(shù)相 結(jié)合的新型門禁產(chǎn)品將成為未來門禁系統(tǒng)發(fā)展的重要方向 本文針對說話人識別門禁系統(tǒng)的現(xiàn)狀 從研究與使用的角度出發(fā) 提出了基 于說話人識別的無線門禁系統(tǒng)并進行相關(guān)的研究設(shè)計 主要研究設(shè)計是針對小區(qū) 的單元門禁 包括每個小區(qū)單元的主機與用戶端的分機 整個系統(tǒng)由一臺主機和 多個用戶端共同完成 本文針對用戶端進行了設(shè)計研究 音頻編解碼模塊實現(xiàn)對 語音信號的采集 f l a s h 模塊實現(xiàn)說話人模板的存儲 主控模塊實現(xiàn)說話人識 別 無線模塊實現(xiàn)用戶端與主機之間的通信 用l e d 的狀態(tài)來實現(xiàn)說話人識別 的結(jié)果與電磁鎖的狀態(tài) 1 3 研究的主要內(nèi)容及論文結(jié)構(gòu) 論文共分五章 第一章為緒論 介紹選題的目的和意義 國內(nèi)外研究說話人識別的主要方法 d s p 的發(fā)展和主要特點 門禁系統(tǒng)的研究現(xiàn)狀以及論文的主要內(nèi)容 第二章詳細闡述了門禁系統(tǒng)的設(shè)計方案 說話人識別的基本原理 說話人識 別系統(tǒng)的構(gòu)成 對說話人語音信號處理的流程 詳細研究了動態(tài)時問規(guī)整及改進 算法的原理 采用雙門限檢測法 通過對過零率和短時能量參數(shù)的檢測來判斷起 始點和結(jié)束點 提取出語音信號數(shù)據(jù) 采用m e l i n 譜m f c c 提取語音信號的特征參 數(shù) 這些特征參數(shù)組成特征矢量 從而構(gòu)成參考的語音模板 在模式匹配中 采 用了改進的動態(tài)時間歸整d t w 方法 將測試模板與參考模板進行匹配計算 比較 兩者之間的失真 最后計算出最小的匹配距離作為規(guī)整函數(shù)的路徑 從而得出說 話人識別判決的結(jié)果 第三章為基于說話人識別門禁系統(tǒng)的硬件電路設(shè)計 以要單元中各個用戶為 對象 詳細設(shè)計了整個系統(tǒng)的硬件結(jié)構(gòu)與元器件的選型標(biāo)準(zhǔn) 各個主要模塊電路 的構(gòu)成與p c b 制圖 電路的抗干擾設(shè)計等 第四章為系統(tǒng)的軟件設(shè)計 基于c c s 開發(fā)環(huán)境 采用并行e m i f 引導(dǎo)方式 實現(xiàn)了t m s 3 2 0 v c 5 5 0 9 ad s p 擴展f l a s h 的在線燒寫 完成各個主要模塊的初 始化過程 采用c 語言完成語音識別工程及無線數(shù)據(jù)收發(fā)工程 第五章介紹了系統(tǒng)軟硬件調(diào)試過程 m a t l a b 仿真結(jié)果與移植的實現(xiàn)結(jié)果 最后為結(jié)論與展望 論述了論文的主要貢獻以及在研究中所遇到的主要不足 之處 指出接下來研究的主要方向 1 4 本章小結(jié) 本章介紹了論文選題的目的和意義 課題的國內(nèi)外研究現(xiàn)狀以及論文研究的 主要內(nèi)容 論文結(jié)構(gòu)等等 6 碩i j 學(xué)位論文 第2 章門禁系統(tǒng)的設(shè)計方案與相關(guān)理論研究 本文根據(jù)實際應(yīng)用 提出了基于說話人識別的無線門禁系統(tǒng) 主要目標(biāo)是基 于各個小區(qū)單元 以各個用戶為單位 實現(xiàn)用戶與樓宇單元門之間的無線通信并 且實現(xiàn)用戶端的說話人識別 以開啟用戶端自家的門鎖 達到便捷性 降低成本 等的目的 門禁系統(tǒng)的設(shè)計框圖如圖2 1 所示 在用戶端 通過采集說話人的語 音信號 經(jīng)過預(yù)處理 端點檢測 特征提取與參考模板相比較 輸出比較結(jié)果 如果匹配成功 則打開用戶端的門鎖 當(dāng)在小區(qū)單元門口來訪人員按下用戶門鈴 時 主機會通過無線收發(fā)模塊尋找用戶端的i d 號 進而建立主機與用戶端的無 線連接 如果用戶允許來訪人員進入 則用戶端給主機發(fā)個開鎖的信號 主機接 收到這個信號后 打開單元門 要實現(xiàn)這些要求 要解決的主要理論問題是說話 人識別的原理 語音采集 上 語音處理 上 模式匹配 l j r 結(jié)果輸出 無線通信 無線收發(fā)模塊 無線收發(fā)模塊 單元主機用戶端 2 1 說話人識別原理 圖2 1 門禁系統(tǒng)框圖 無論是小詞匯 特定人 文本有關(guān)的說話人識別 還是連續(xù)詞匯 非特定人 文本無關(guān)的說話人識別 其基本原理都是先要建立說話人語音信號特征參數(shù)的 參考模板 在進行說話人識別時 先計算參考模板與測試模板兩幀之間的幀匹 配距離矩陣 再計算出最小的累積距離 作為規(guī)整函數(shù)的路徑 因此 若要實現(xiàn) 對說話人的識別 需解決以下幾個基本問題 1 對語音信號的加重 分幀 加窗 端點檢測和特征提取 2 建立說話人的參考模板和測試模板 3 計算測試模板與參考模板的最小累計距離 其中關(guān)鍵問題是建立說話人識別的參考模板 為了保證測試模板與參考模 7 幕于說話人識別的無線門禁系統(tǒng)的應(yīng)用研究 板的特征參數(shù)一致 常將每一說話人語音信號進行預(yù)加重 分幀 加窗等 它 們的模型結(jié)構(gòu)取得相同 不同的只是模型中的參數(shù)l l l 伴隨著計算機和語音信號 處理 高速的d s p 芯片等外圍電路的不斷發(fā)展 說話人模型已經(jīng)從單一的d t w v q h m m a n n 等模型向著多模型方向發(fā)展 同時也從實驗室無噪聲的背景 下向著復(fù)雜噪聲的應(yīng)用場合發(fā)展 說話人識別從實驗環(huán)境走向?qū)嵱糜辛藞詫嵉睦?論基礎(chǔ) 從本質(zhì)上講 說話人識別是一個語音信號的模式識別問題 它由訓(xùn)練和識別 兩個過程來完成 說話人識別的基本原理框圖如圖2 2 示 2 2 語音信號的預(yù)處理 圖2 2 說話人識別原理圖 在對語音信號進行時域或頻域分析前 理 預(yù)處理主要包括對語音信號的預(yù)加重 2 2 1 預(yù)加重 首先要對語音信號進行一定的預(yù)處 分幀和加窗 說話人的語音信號經(jīng)過a d 將模擬信號變?yōu)閿?shù)字信號后 依次存入一個數(shù) 據(jù)區(qū) 在語音信號處理中一般用循環(huán)隊列的方式來存儲這些數(shù)據(jù) 根據(jù)語音信號 產(chǎn)生的機制 高頻端大約在8 0 0 h z 以上按6 d b 倍頻程跌落 這就需要進行預(yù)加 重來提升高頻部分 使信號的頻譜變得平坦 l 預(yù)加重一般是一階的數(shù)字濾波器 h z l z z 1u 值接近為1 2 1 u 決定截止頻率 此濾波器為單零點濾波器 呈高通特性 u 0 9 5 2 2 2 分幀與加窗 在完成預(yù)加重之后 要對語音信號要進行分幀與加窗處理 根據(jù)語音信號的 短時平穩(wěn)性 語音信號以幀為單位進行處理 一般每秒的幀數(shù)為3 3 1 0 0 幀 要 根據(jù)實際情況而定 分幀應(yīng)該采用部分互相交錯的形式 目的是為了使語音信息 損失最小 幀與幀之間平滑的過渡 保持其連續(xù)性 前一幀與后一幀的重合部分 稱為幀移 幀移與幀長的比值一般取為0 1 2 幀與幀之間重合太多 會增大計 算量 重合太少會漏掉部分信息 分幀是通過一個有限長度窗口進行加權(quán)的方法 來實現(xiàn) 用窗函數(shù)國 z 乘語音信號j 療 得到s 文功 s 功木奴功 本文采樣頻率 為8 k h z 每幀長2 4 0 點 3 0 m s 幀移8 0 點 采集3 秒的數(shù)據(jù) 約為1 2 0 幀 窗函數(shù)緲 長度與形狀的選擇 影響到短時參數(shù)的分析 因此在對說話人 8 從表2 1 可以看出 漢明窗的帶寬增加一倍 能減小時間窗兩端的坡度 使 得語音信號能夠很平滑的過渡 語音信號變化的幅度不是很大 減小語音幀的截 斷效應(yīng) 所以本文選擇漢明窗 2 3 語音信號的端點檢測 從背景的噪聲環(huán)境中提取出說話人語音信號的特征信息不是一件容易的事 情 一個比較好的端點檢測算法可以精確的檢測到語音信號的開始點與結(jié)束點 在一定程度上能夠有效提高說話人識別系統(tǒng)的識別率 信號的幅度用短時能量 來表示 過零率定義為一幀語音信號穿越零電平的次數(shù) 兩者的結(jié)合可以有效的 檢測到語音信號的起始點和終止點 故本文采用短時能量和過零率的雙門限檢測 殿 法來進行端點檢測 并把可容忍的靜音區(qū)問延長為1 5 幀 設(shè)語音波形的時域信號為x t 加窗分幀處理后得得的第n 幀語音信號為 勘 朋 則勛 聊 滿足 洳 聊 w 冊 x z 歷 0 m n l 2 4 其中 w 腳 為漢明窗 n 0 lt 2 t 并且n 為幀移長度 設(shè)第n 幀語音信號渤 聊 的短時能量用e 甩表示 則 v e n l 渤 圳 2 5 n 1 e 玎 y x 2 肌 2 6 一 n 1 v e n l o g x 2 m 2 7 n l 表達式分別為絕對值的累加 平方累加和平方的對數(shù)的累加 只是表達方 式的不同 實質(zhì)上是一致的 選擇其中的一種就可以 根據(jù)人的發(fā)音機理和聲道 模型 人的語音信號分清音和濁音兩種 濁音的幅度相對高 相對的能量也比較 9 藎于說話人識別的無線門禁系統(tǒng)的麻用研究 大 而清音的幅度比較小 所以可以用短時能量來區(qū)分清音段與濁音段 根據(jù) 實驗及前人的工作總結(jié) 短時能量高門限的值為t 氐f j 限的5 倍 通過觀察比較能夠發(fā)現(xiàn) 在靜音段語音信號的短時能量低門限很容易被超 過 能量比較低 波形的變化相對平緩 而在語音段 語音信號的能量已經(jīng)超 過了雙門限中的高門限 幅度變化比較劇烈 通常用一幀信號中波形穿越零電平 的次數(shù)來表達這種變化的程度 稱為過零率 它的公式是 z n l s g n x m 一s g n x m 1 w 刀一肌 i 聊5 一 2 8 n n l i s g n 工 朋 卜s g n x 一1 w 刀一朋 l 式中 s g n 是符號函數(shù) 即 唧瞰糾 鼉蒜 9 而w n 為窗口序列 設(shè) 以班j 專 刀 旺 10 其它 在實際的應(yīng)用中 靜音段的隨機噪聲有可能會產(chǎn)生過高的過零率 往往先 設(shè)定一個低門限 在靜音段 如果短時能量或過零率超過低門限 就認(rèn)為是起 始點 進入到過渡段 在語音段 一些突發(fā)性的噪聲也可能引起短時能量或過零 率的數(shù)值較高 但是往往不能維持很長時間 如果兩個參數(shù)的數(shù)值降低到低門限 以下 且一直持續(xù)1 5 幀 則認(rèn)為是一段噪音而放荊3 4 語音進入停止 如果說 話人的語音信號中包含2 個字的時間間隔很長 雙門限端點檢測法有可能只檢 測到第一個字 從而導(dǎo)致語音信號端點檢測的錯誤 漏掉需要檢測的語音信息 使得語音信號的識別率下降 如圖2 3 所示 檢測到語音信號中 你好 的第一 個字 為了避免這種情況 這需要把雙門限端點檢測可容忍的靜音區(qū)間適當(dāng)?shù)?延長 本文把靜音區(qū)間設(shè)置為1 5 幀 假設(shè)1 5 幀之內(nèi)語音信號沒有短時能量或 過零率超過低門限 就認(rèn)為語音信號結(jié)束 反之 則把短時能量和過零率計算在 內(nèi)語音段內(nèi) 圖2 4 是以語音 你好 為例 是改進后的雙門限端點檢測 可以 精確的檢測到語音的起始點和終止點 1 0 圖2 3 改進前的端點檢測圖2 4 改進后的端點檢測 根據(jù)前面的理論分析 短時過零率可以檢測到語音信號的清音段 短時能量 可以檢測到濁音段 所以采用延長幀的雙門限端點檢測法可以準(zhǔn)確的判斷語音 信號的起始點和結(jié)束點 使得端點檢測更精確 丟棄一些噪聲信號幀 減少系統(tǒng) 的計算量 降低噪聲對系統(tǒng)性能的影響 采用改進后的端點檢測算法 對單個漢 字或多個漢字的語音命令均識別正常 2 4 語音信號的特征提取 在說話人識別時 特征參數(shù)的選取是至關(guān)重要的 能夠表征說話人個性的特 征有 語音幀能量 基因頻率 語音信號的短時頻譜 線性預(yù)測系數(shù) 倒譜特征 基因輪廓特征等 目前進行語音信號特征分析最有效 最重要的方法有線性預(yù)測 系數(shù)和美爾倒譜系數(shù) 躲 2 4 1 線性預(yù)測系數(shù) 說話人的語音信號是一種典型的時變信號 如果語音信號的觀察時間盡可能 短 則語音信號可以看做是近似平穩(wěn)的信號 全極點線性預(yù)測模型l p c l i n e a r p r e d i c t i v ec o d i n g 簡稱l p c 可以對聲管模型進行很好的描述 它的基本思想是 利用語音信號的相關(guān)性 用過去的取樣值來預(yù)測現(xiàn)在或未來的取樣值 即利用 過去若干個語音信號的取樣值與線性組合來逼近語音信號的取樣值 l p c 是基 于發(fā)音模型建立的 對于一個l p c 系統(tǒng) 采樣點n 的輸出s n 用p 個樣本的線 性組合來表示 一 s n a l s n 一1 口2 s n 2 口 口s n p q 口2 a p 為常數(shù) 2 1 1 口 上式可簡寫為s 珂 吼
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年物聯(lián)網(wǎng)市場合作協(xié)議書
- 2024-2025學(xué)年廣東省深圳市羅湖區(qū)四年級(上)期末數(shù)學(xué)試卷
- (新版)初級消防設(shè)施操作員《基礎(chǔ)知識》考試題庫完整版
- 2025年書面離婚合同協(xié)議(4篇)
- 2025年五年級班主任管理工作心得體會(6篇)
- 2025年中班幼兒園教師個人年終工作總結(jié)模版(二篇)
- 2025年中草藥植物購銷合同模板(三篇)
- 2025年產(chǎn)品委托代理協(xié)議范文(2篇)
- 2025年個人木材買賣合同范文(2篇)
- 2025年個人車輛租賃協(xié)議(五篇)
- GB/T 4662-2012滾動軸承額定靜載荷
- 法律專題(本)(52876)-國家開放大學(xué)電大學(xué)習(xí)網(wǎng)形考作業(yè)題目答案
- 人工智能技術(shù)介紹完整版人工智能概述、圍棋課件
- 加油站項目開辦申報表
- 單個軍人隊列動作教學(xué)法教案全(新條令)
- 《德育與班級管理》課程大綱
- (新教材)人教版高中化學(xué)必修第二冊第七章有機化合物(267張)課件
- 國貨當(dāng)自強精品課件
- 比多少(課件)人教版一年級上冊數(shù)學(xué)
- The foolish Donkey愚蠢的毛驢的故事英語伊索寓言
- 2021年懷化市會同縣人民醫(yī)院醫(yī)護人員招聘筆試試題及答案解析
評論
0/150
提交評論