




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、人工智能及識別技術(shù) 本欄目責任編輯 :李桂瑾1引言早在上世紀 60年代末 , 人臉識別即引起了研究者的強烈興 趣 . 但早期的人臉識別一般都需要人的某些先驗知識 , 無法擺脫人 的干預(yù) 。 進入上世紀 9O 年代 , 由于高速度 、 高性能計算機的出現(xiàn) , 人臉識別的方法有了重大突破 , 進入了真正的機器自動識別階 段 , 人臉識別研究得到了前所未有的重視 。 人臉識別方法有很多 種 :(1 特征臉方法 。 這種方法起源于圖像描述技術(shù) 。 采用特征臉識 別方法有良好的穩(wěn)定性 、 位移不變性 、 特征向量與圖像的高度成 比例變化以及轉(zhuǎn)置不變性 。 不足之處是受表情變化 、 光照角度強 度變化和視
2、角變化等嚴重影響 , 魯棒性較差 。 (2 隱馬爾可夫模型 方法 (Hidden Markov Mode1 是用于描述信號統(tǒng)計特征的一組統(tǒng)計 模型 。 HMM 的基本理論是由 Baum 和 Welch 等人在 20世紀 6O 年代末 70年代初建立 , 在語音識別中應(yīng)用較多 。 在 HMM 中 , 節(jié)點 表示狀態(tài) , 有向邊表示狀態(tài)之間的轉(zhuǎn)移 。 一個狀態(tài)可以具有特征 空間中的任一特征 , 對同一特征 , 不同狀態(tài)表現(xiàn)出這一特征的概 率不同 。 (3 彈性圖匹配方法 。 彈性圖匹配方法是一種基于動態(tài)連 接結(jié)構(gòu)的方法 。 它將人臉用格狀的稀疏圖表示 。 (4 神經(jīng)網(wǎng)絡(luò)方法 。 人工神經(jīng)網(wǎng)絡(luò)是由多
3、個神經(jīng)元按照一定的排列順序構(gòu)成的 , 是一 個非線性動力學(xué)系統(tǒng) , 其特色在于信息的分布式存儲和并行協(xié)同 處理 。 雖然單個神經(jīng)元的結(jié)構(gòu)極其簡單 , 功能有限 , 但由大量沖經(jīng) 元所構(gòu)成的網(wǎng)絡(luò)系統(tǒng)卻能夠?qū)崿F(xiàn)復(fù)雜豐富的功能 。 神經(jīng)網(wǎng)絡(luò)系統(tǒng) 除了具有集體運算的能力和自適應(yīng)的學(xué)習能力外 , 還有根強的容 錯性和魯棒性 . 善于聯(lián)想 、 綜合和推廣 。神經(jīng)網(wǎng)絡(luò)模型各種各樣 。 它們是從不同的角度對生物神經(jīng)系 統(tǒng)不同層次的描述和模擬 。 有代表性的網(wǎng)絡(luò)模型有感知器 、 多層 映射 BP 網(wǎng)絡(luò) 、 RBF 網(wǎng)絡(luò)等 。 目前 , 在人工神經(jīng)網(wǎng)絡(luò)的實際應(yīng)用中 , 絕大部分的神經(jīng)網(wǎng)絡(luò)模型都是采用 BP 網(wǎng)絡(luò)及
4、其變化形式 , 它也 是前向網(wǎng)絡(luò)的核心部分 , 是人工神經(jīng)網(wǎng)絡(luò)最精華的部分 。 BP 網(wǎng)絡(luò) 主要用于函數(shù)逼近 、 模式識別 、 數(shù)據(jù)壓縮等領(lǐng)域 。2BP 神經(jīng)網(wǎng)絡(luò)的人臉識別BP 神經(jīng)網(wǎng)絡(luò)用于人臉識別一般應(yīng)先對輸入圖像實行圖像預(yù) 處理 , 然后進行特征提取 , 接下來就是 BP 網(wǎng)絡(luò)訓(xùn)練 , 最后用訓(xùn)練好 的網(wǎng)絡(luò)進行識別 , 獲得識別結(jié)果 。 圖像預(yù)處理的目的是便于特征提 取 , 而特征提取是去相關(guān)過程 , 將圖像中大量的冗余信息去除 , 即實 現(xiàn)數(shù)據(jù)壓縮 , 同時也降低了神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的復(fù)雜度 , 提高了神經(jīng)網(wǎng) 絡(luò)的訓(xùn)練效率和收斂率 。 本文以 ORL 人臉圖像數(shù)據(jù)庫為研究對 象 , 將輸入圖像
5、進行圖像壓縮 、 圖像抽樣 、 輸入矢量標準化等圖像 預(yù)處理后 , 送入 BP 神經(jīng)網(wǎng)絡(luò)訓(xùn)練 , 經(jīng)過競爭選擇 , 獲得識別結(jié) 果 。 下面分別敘述其處理過程 。2.1人臉圖像預(yù)處理(1 圖像壓縮輸入圖像一般精度比較高 , 存在大量的冗余信息 。 為避免神經(jīng) 網(wǎng)絡(luò)結(jié)構(gòu)過于復(fù)雜 , 在輸入神經(jīng)網(wǎng)絡(luò)之前必須進行圖像壓縮 。 圖像 壓縮通常采用插值算法 , 包括近鄰插值 、 雙線性插值和雙立方插 值 。 插值算法的好壞關(guān)系到圖像的失真程度 , 插值函數(shù)的設(shè)計是插 值算法的核心問題 。(2 圖像抽樣所謂圖像抽樣即為將壓縮后的二維圖像矩陣 一 行 接 一 行 拉 成一維列矢量 , 其目的是便于后續(xù)神經(jīng)網(wǎng)
6、絡(luò)的輸入 。(3 輸入矢量標準化圖像抽樣的輸出是一維列矢量 , 其元素的值域范圍為 0,255。 如果直接將該列矢量輸入神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練 , 由于數(shù)值較大 , 勢 必影響計算效率和收斂率 。 因此 , 在將該列矢量輸入神經(jīng)網(wǎng)絡(luò)之 前 , 應(yīng)實行輸入矢量標準化 。2.2BP 神經(jīng)網(wǎng)絡(luò)及訓(xùn)練策略2.2.1BP 神經(jīng)網(wǎng)絡(luò)介紹BP 網(wǎng)絡(luò)是一種前向網(wǎng)絡(luò) 。 一般包括輸入層 、 中間層和輸出 層 。 中間層可以有一層 、 二層甚至更多層以便于分析各因素間的 相互作用 , 每一層由若干個神經(jīng)元組成 , 相鄰兩層的每一個神經(jīng) 元之間均有權(quán)值聯(lián)系 , 權(quán)值的大小反映了這兩個神經(jīng)元之間的連 接強度 , 整個網(wǎng)絡(luò)的
7、計算過程是由輸入層到中間層再到輸出層單 向進行 , 所以稱為前向網(wǎng)絡(luò) 。2.2.2學(xué)習算法(1 每層神經(jīng)元的輸出算法 (sigmoid 函數(shù) M i =1/(1+e -Z i Z i =ni =1! W ij T j 為 從 輸 入 層 (或 中 間 層 到 中 間 層 (或輸出層 的結(jié)點凈輸入 , n 表示中間層 (或輸出層 的個數(shù) , T j 表示輸入層 (或中間層 第 j 個量 , Wij是權(quán)值 。(2 權(quán)值 W ij 修正理論上 Wij的初始值可以是隨機數(shù) (或根據(jù)經(jīng)驗自己確定 , 但如果權(quán)值不符合要求就要進行修正 。從輸出層反向傳遞到中間層 , 公式為W ij (t+1=W ij (
8、t+j M i +W ij (t-W ij (t-1W ij (t 是 t 時刻從神經(jīng)元 i 到上一層 (輸入層或中間層 神經(jīng)元 j (中間層或輸出層 的連接權(quán) 。 M i 是神經(jīng)元 j 在 t 時刻的實際輸出 。 是步長調(diào)整因子 , (0, 1 , 是平滑因子 (0, 1 , j是誤 差權(quán)重調(diào)因子 。(下轉(zhuǎn)第 188頁 神經(jīng)網(wǎng)絡(luò)在人臉識別中的應(yīng)用劉廣亮 , 馬曉普 , 張哲(南陽師范學(xué)院計算機與信息技術(shù)學(xué)院 , 河南 南陽 473061摘要 :將 BP 神經(jīng)網(wǎng)絡(luò)用于人臉識別 , 并建立了人臉識別模型 , 該識別模型包括圖像壓縮 、 圖像抽樣 、 輸入矢量標準化 、 BP 神經(jīng)網(wǎng)絡(luò)與 競爭選擇
9、處理過程 , 具有簡單 , 識別率較高的特點 。關(guān)鍵詞 :圖像壓縮 ; 圖像抽樣 ; 神經(jīng)網(wǎng)絡(luò) ; 人臉識別中圖分類號 :TP183文獻標識碼 :A 文章編號 :1009-3044(200713-30181-01Face Recognition Based on Neural NetworkLIU Guang-liang, MA Xiao-pu , ZHANG Zhe(The school of Computer and Information Technology of Nanyang Normal University,Nanyang 473061,ChinaAbstract:The BP
10、 neural network is applied in face recognition.A face recognition model is established , and its designed includes image compression , image sampling , input vector standardization , BP neural network and competition selection. The recognition model is simple and has a high recognition rate.Key word
11、s:Image compression;Image extraction;Neural network;Face recognition收稿日期 :2007-05-21作者簡介 :劉廣亮 (1978- , 男 , 安徽阜南人 , 研究方向為人工智能 。181人工智能及識別技術(shù)本欄目責任編輯 :李桂瑾 電腦知識與技術(shù)(上接第 181頁 (3 誤差分析選取網(wǎng)絡(luò)相對誤差函數(shù) E E k =(M k0-M k /M k0M k0為實際輸出值 , M k 為預(yù)測的網(wǎng)絡(luò)輸出值 。一般情況下如果誤差 E k 不大于網(wǎng)絡(luò)的誤差允許值 , 就可以認 為模型的計算不存在誤差 , 如果 E k 大于網(wǎng)絡(luò)誤差允許值
12、, 要回溯 到第二步調(diào)整權(quán)值后再進行計算 。八十年代 Robert Hecht -Nielson 已證明 , 一個三層 BP 神經(jīng) 網(wǎng)絡(luò)可以實現(xiàn)任意精度 、 近似任何連續(xù)函數(shù) 。 BP 網(wǎng)絡(luò)能夠?qū)崿F(xiàn)一 種特殊的非線性映射 , 將輸入空間變換到由輸出所張成的空間 , 使 在這個空間分類問題變得簡單易行 。 目前 , BP 網(wǎng)絡(luò)已廣泛應(yīng)用于 函數(shù)逼近 、 模式識別 、 分類 、 數(shù)據(jù)壓縮等方面 。 BP 網(wǎng)絡(luò)用于人臉識 別時 , 網(wǎng)絡(luò)的每一個輸入節(jié)點對應(yīng)樣本的一個特征 , 而輸出節(jié)點數(shù) 等于類別數(shù) , 一個輸出節(jié)點對應(yīng)一個類 。 在訓(xùn)練階段 , 如果輸入訓(xùn) 練樣本的類別標號是 i, 則訓(xùn)練時的期望
13、輸出假設(shè)第 i 個節(jié)點為 1, 而其余輸出節(jié)點均為 0。 在識別階段 , 當一個未知類別樣本作用到 輸入端時 , 考察各輸出節(jié)點的輸出 , 并將這個樣本類別判定為具有 最大值的輸出節(jié)點對應(yīng)的類別 。 如果具有最大值的輸出節(jié)點與其 它輸出節(jié)點之間的距離較小 (小于某個閾值 , 則作出拒絕判斷 。在 BP 網(wǎng)絡(luò)樣本訓(xùn)練過程中 , 如果采取適當?shù)挠?xùn)練策略能有 效地提高系統(tǒng)的識別率 。 可以有樣本采樣訓(xùn)練 、 樣本批量訓(xùn)練和 樣本完整訓(xùn)練三種策略 。 所謂樣本采樣訓(xùn)練指的是對訓(xùn)練集中的 樣本按間隔進行采樣 , 并對所得樣本獨立地進行訓(xùn)練 , 直至所有 樣本訓(xùn)練完為止 。 至于采樣間隔的選擇應(yīng)根據(jù)訓(xùn)練集
14、中的樣本數(shù) 來確定 。 所謂樣本批量訓(xùn)練指的是取訓(xùn)練集中的一批樣本一同進 行訓(xùn)練 , 訓(xùn)練完之后再取下一批 , 直到訓(xùn)練完為止 。 批量大小也應(yīng) 根據(jù)訓(xùn)練集中的樣本數(shù)來確定 。 所謂樣本完整訓(xùn)練指的是將訓(xùn)練 集中的樣本一次性進行訓(xùn)練 。 采取不同的訓(xùn)練策略對 BP 網(wǎng)絡(luò)權(quán) 值和閾值的調(diào)節(jié)會產(chǎn)生完全不同的結(jié)果 , 繼而影響系統(tǒng)的識別率 。2.3競爭選擇BP 網(wǎng)絡(luò)的輸出是一維列矢量 , 所謂競爭選擇 , 是將 BP 網(wǎng) 絡(luò) 的輸出映射成一個具體的類別 。 其實現(xiàn)過程是 , 選擇 BP 網(wǎng)絡(luò)具有 最大值的輸出節(jié)點所在的位置標號 , 則該位置標號對應(yīng)一個具體 的輸出類別 。 如果 BP 網(wǎng)絡(luò)輸出節(jié)點同
15、時存在多個最大值 , 則作出 拒絕判斷 。3識別策略本文研究的原始圖像取自 ORL 人臉數(shù)據(jù)庫 。 該數(shù)據(jù)庫由 40人 、 每人 10幅 、 大小為 112×92、灰度級為 256的人臉圖像所組成 。 訓(xùn)練集由每人前 8幅共 320幅人臉圖像所組成 , 測試集由每人后 2幅共 80幅人臉圖像所組成 , 且訓(xùn)練集和測試集中的人臉圖像互不 重疊 。 訓(xùn)練集的樣本排列結(jié)構(gòu)為第 1類別樣本的 8幅圖像 ; 第 2類 別樣本的 8幅圖像 ; .; 第 40類別樣本的 8幅圖像 。 輸入圖像經(jīng)壓縮處理后 , 將 112×92維圖像轉(zhuǎn)變?yōu)?8×7維 。 BP 網(wǎng)絡(luò)輸入層節(jié)點 數(shù)
16、為 56, 隱含層節(jié)點數(shù)為 70, 輸出層節(jié)點數(shù)為 40。 實驗時 , 樣本采 樣訓(xùn)練 、 樣本批量訓(xùn)練和樣本完整訓(xùn)練三種策略配合使用 。方案 I 實行樣本完整訓(xùn)練 。方案 II 先實行樣本批量訓(xùn)練 , 再實行樣本完整訓(xùn)練 。 批量訓(xùn) 練時將訓(xùn)練集中相同類別的樣本一道訓(xùn)練 , 即以同一類別的 8幅 圖像為一組進行訓(xùn)練 。方案 III 先實行樣本采樣訓(xùn)練 , 再實行樣本完整訓(xùn)練 。 采樣間隔取為 4。即先對第 1類別樣本的第 1幅圖像進行訓(xùn)練 , 接著對第 1類別樣本的第 5幅圖像進行訓(xùn)練 , 然后對第 2類別樣本的第 1幅圖像進行訓(xùn)練 , 依次類推 , 直到第 40類別樣本的第 1幅圖像訓(xùn) 練
17、完為止 。 最后進行樣本完整訓(xùn)練 。方案 I 每次所得樣本均為不同類別 , 采樣間隔較大 。方案 II 的 批量大小固定在相同類別的樣本數(shù)上 。下面表 1是實驗中各種方案訓(xùn)練集和 測 試 集 的 錯 誤 率 及 其 拒判率的結(jié)果 。表 1識別結(jié)果對比從上面的表中可以看到訓(xùn)練集和測試集的拒判率都是 0, 訓(xùn) 練集的錯誤率也是 0, 其中方案 III 的識別率是 94.9%, 識 別 率 最 高 , 這說明 BP 網(wǎng)絡(luò)不斷對新類別樣本進行學(xué) 習 , 網(wǎng) 絡(luò) 性 能 較 好 。 方案 II 的識別率處于方案 I 和方案 III 之間 , 而方案 I 的識別率最 底 , 說明訓(xùn)練樣本逐步加入 , 比一
18、次性加入網(wǎng)絡(luò)調(diào)節(jié)性能要好 。 常 規(guī)訓(xùn)練方法一般采用方案 I , 如果將方案 I 使用的樣本完整訓(xùn)練 策略與其它訓(xùn)練策略相配合 , 如方案 III, 則識別率將大大提高 。4結(jié)束語本文將 BP 神經(jīng)網(wǎng)絡(luò)用于人臉識別 , 建立了簡單識別模型 , 模 型用的數(shù)據(jù)庫是 ORL 人臉數(shù)據(jù)庫 , 并采用了適當?shù)挠?xùn)練策略 , 從 而達到了識別人臉的目的 。參考文獻 :1蘇劍波 , 徐波 . 應(yīng)用模式識別技術(shù)導(dǎo)論 人臉識別與語音 識別 M. 上海 :上海交通大學(xué)出版社 , 2001.2金忠 . 人臉圖像特征抽取與維數(shù)研究 博士學(xué)位論文 D. 南 京 :南京理工大學(xué) ,1999.3宋剛 , 艾海舟 , 徐光 . 紋理約束下的人臉特征點跟蹤 J. 軟件 學(xué)報 , 2004(15,11.4邊 肇 祺 , 張 學(xué) 工 . 模 式 識 別 M. 北 京 :清 華 大 學(xué) 出 版 社 ,2000.sl(; qhy(;k=k2;m=m2;i1=i2;j1=j
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025屆河北省永年縣一中高一物理第二學(xué)期期末監(jiān)測模擬試題含解析
- 教育技術(shù)應(yīng)用與文化傳承的關(guān)系研究
- 教育技術(shù)中的專利申請與風險規(guī)避
- 2025屆江西省豐城二中高二物理第二學(xué)期期末預(yù)測試題含解析
- 2025屆廣東省廣州市番禺區(qū)禺山高級中學(xué)物理高一下期末調(diào)研模擬試題含解析
- 探索教育游戲化如何影響孩子的情緒認知能力
- 教育技術(shù)項目的投資規(guī)劃與風險控制
- 福建省師范大學(xué)附中2025年高一物理第二學(xué)期期末考試試題含解析
- 醫(yī)療培訓(xùn)中融入教育心理學(xué)的效果評估
- 技術(shù)如何塑造現(xiàn)代辦公模式
- 2025至2030年中國森林消防車行業(yè)市場全景評估及未來趨勢研判報告
- 2025生產(chǎn)與運作管理試題及答案
- 暑假的一次冒險經(jīng)歷記事作文4篇范文
- 入職預(yù)支薪資協(xié)議書
- 《中國特色社會主義理論體系的形成和發(fā)展》(課件)
- 職業(yè)技術(shù)學(xué)院嬰幼兒托育服務(wù)與管理專業(yè)人才培養(yǎng)方案
- 2025臺州市椒江區(qū)輔警考試試卷真題
- 中學(xué)生零食消費情況調(diào)查與分析
- 國開本科《管理英語4》機考總題庫及答案
- 軟裝行業(yè)競品分析報告
- 公司收購公司協(xié)議書
評論
0/150
提交評論