信息工程概論課件 第六講 信息的識別_第1頁
信息工程概論課件 第六講 信息的識別_第2頁
信息工程概論課件 第六講 信息的識別_第3頁
信息工程概論課件 第六講 信息的識別_第4頁
信息工程概論課件 第六講 信息的識別_第5頁
已閱讀5頁,還剩12頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

第6講信息的識別6.1信息的表示方法信號表示:對各種需要測量的“量”可以通過傳感器轉(zhuǎn)換為電量,并以信號的形式進行表示。符號表示:一般不同的事物要用不同的信號進行表達,這樣描述起來就不很方便,因此,科學家就對事物進行形式化抽象,抽取出一類事物共同的特征(這是一個從特殊到一般的過程),并以符號的方式進行表達,這就是信息的符號表示。機器表示:為了可以使用計算機來存儲和處理信息,可以將符號表示的信息通過編碼的方式變成一種計算機“可懂”的“數(shù)據(jù)”,這就是信息的機器表示。信息科學導論6.1信息的表示方法語音信息表示語音信號的數(shù)字化處理主要包括三個基本環(huán)節(jié):抽樣、量化、編碼。計算機中語音信息數(shù)字化的標準抽樣頻率通常是11.025、22.05、44.1KHz、64KHz,頻率越高保真度越好,但得到的數(shù)據(jù)量越大,需要的存儲空間也越大。量化是將抽樣后的信號按幅度分成有限個電平級別,幅度落在同一個級別范圍的用同一個電平級別表示。量化過的信號就成為數(shù)字信號,記為PCM(Pulse-CodedModulation)。因為PCM的幅度為有限個,所以可以用二進制編碼表示,通常采用16比特分段編碼的方式進行編碼,即PCM編碼。信息科學導論6.1信息的表示方法圖形圖像數(shù)據(jù)表示(1)位圖(Bitmap)位圖使用像素陣列來表示圖像,用于表示計算機中的靜態(tài)圖片,位圖文件有很多種的格式,如擴展名為.BMP.JPG.GIF.PIC文件都屬于位圖。在位圖中圖像將由每一個像素點的位置和色彩值來決定。計算機中圖像根據(jù)顏色可分為黑白圖像、灰度圖像和真彩色圖像。(2)矢量圖(Vector)計算機中矢量圖使用直線和曲線來描述圖形,矢量圖由一系列的點、線段、圓、多邊形和曲線等圖形元素組成,而這些圖形又可以用數(shù)學表達式的方式來描述,因此矢量圖可以用數(shù)學計算的方法來存儲和顯示。比如一個圓,如果用矢量方式來描述,只需要存儲它的圓心坐標和半徑大小即可。由于矢量圖形可通過公式計算獲得,所以矢量圖形文件體積一般較小,存儲量較少。信息科學導論6.2信息的識別信息特征獲取前述信息獲取主要解決“是否有信息存在”的問題,但這還不夠,還需要對所感知的信息作出判斷,解決“存在的信息屬于哪一類”的問題,這就是信息識別(也叫模式識別)的問題。目前所討論的信息識別只能是基于語法信息的識別,也就是采用類比方式進行的識別:將所感知的事物運動狀態(tài)及其變化形式與特定形式的“模板”進行比較、匹配,確定二者是否相同。常規(guī)的做法是提取那些能代表事物主體的特征:一組形式化的參量,即用很少的數(shù)據(jù)量來表征某一事物的狀態(tài)和狀態(tài)變化方式。

信息科學導論6.2信息的識別信息特征獲取把不同方面的特征有效集成起來獲得更全面地認識,這便是“(特征)信息融合”問題。融合(Fusion)是指采集并集成各種信息源、多媒體和多格式信息,從而生成完整、準確、及時和有效的綜合信息過程。按照融合過程中信息抽象的層次,可以將信息融合過程分為三個層次,即數(shù)據(jù)層(DataLevel)融合、特征層(FeatureLevel)融合和決策層(DecisionLevel)融合。

信息科學導論信息識別的模型6.2信息的識別信息科學導論以二元識別為例來說明統(tǒng)計識別法的基本工作原理。于是,任一模式只有兩種可能的類屬。用符號Ω表示模式空間,Ω1表示第一類模式的子空間,Ω2表示第二類模式的子空間,ω1和ω2分別表示Ω1和Ω2中的點,即Ω={Ω1,Ω2},其中6.3統(tǒng)計識別方法現(xiàn)有一未知模式x,問題是要識別究竟x∈Ω1還是x∈Ω2? 顯然,在判斷x的歸屬時有四種可能:

1,x本屬Ω1,判為x∈Ω1:判決正確;2,x本屬Ω1,判為x∈Ω2:判決錯誤;3,x本屬Ω2,判為x∈Ω1:判決錯誤;4,x本屬Ω2,判為x∈Ω2:判決正確。信息科學導論6.3統(tǒng)計識別方法舉例:假設在某個局部地區(qū)細胞識別中正常(ω1)和異常(ω2)先驗概率為: 現(xiàn)有一待識別的細胞,其觀察值為x,從類條件概率密度分布曲線上查得: 試用最小錯誤率分類方法對該細胞進行分類。信息科學導論6.3統(tǒng)計識別方法解:利用貝葉斯公式可得信息科學導論6.3統(tǒng)計識別方法如果故合理的決策是把x歸類于正常狀態(tài)?;谧钚″e誤率的貝葉斯決策規(guī)則為:則把x歸類于正常狀態(tài)ω1,反之歸于異常狀態(tài)ω2利用貝葉斯公式還可以得到其它決策的等價形式:似然比閾值信息科學導論6.3統(tǒng)計識別方法對細胞的分類不僅要考慮到盡可能作出正確判斷,而且還要考慮到作出錯誤判斷時會帶來什么后果,因此,引入“損失”概念,在考慮錯判所造成的損失時,就不能只根據(jù)后驗概率的大小來做決策,而必須考慮所采取的決策是否使損失最小,為此建立一個決策表。狀態(tài)損失決策自然狀態(tài)ω1ω2Α1(判為ω1)C11C12α2(判為ω2)C21C22信息科學導論6.3統(tǒng)計識別方法Cij表示示本屬Ωi的x判為x∈Ωj所引起的損失,i,j=1,2.因此在采取決策αi情況下的條件期望損失為:最小風險貝葉斯決策規(guī)則為:信息科學導論6.3統(tǒng)計識別方法狀態(tài)損失決策自然狀態(tài)ω1ω2α1(判為ω1)06α2(判為ω2)10在上例中,若決策表:信息科學導論6.3統(tǒng)計識別方法由上例知后驗概率為:再計條件風險:信息科學導論6.3統(tǒng)計識別方法由于則采取決策α2,即判待識別的細胞為異常(ω2)總之,統(tǒng)計模式識別方法的基本原理是要求出待識模式的某種統(tǒng)計特征(即鑒別函數(shù)和判決閾),然后通過類比的準則作出分類判決。信息科學導論信息識別的基本原理總結(jié)如下:第一,語法信息識別(分類)的基本原理是信息特征的比較。不同類別的信息,其特征也不相同。因此,只要把握了類別特征,原則上就可能準確識別。第二,識別的準則是:相似而認同,相異而

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論