版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、,信息論與編碼基礎(chǔ),學(xué)而不思則罔, 思而不學(xué)則殆。 孔子,信息論與編碼基礎(chǔ),離散信源,一、信源的數(shù)學(xué)模型及分類,二、離散信源的信息熵及其性質(zhì),三、離散無(wú)記憶的擴(kuò)展信源,四、離散平穩(wěn)信源,五、信源的剩余度,信息論與編碼基礎(chǔ),離散信源,一、信源的數(shù)學(xué)模型及分類,二、離散信源的信息熵及其性質(zhì),三、離散無(wú)記憶的擴(kuò)展信源,四、離散平穩(wěn)信源,五、信源的剩余度,信息論與編碼基礎(chǔ),離散信源,信源的分類,離散信源:電報(bào)、文字、代碼,07314575707,連續(xù)信源:模擬語(yǔ)音、模擬視頻,概念,樣本空間,概率空間,事物所有可能選擇的消息的集合。,一個(gè)樣本空間和它的概率測(cè)度。,信息論與編碼基礎(chǔ),離散信源,信息論與編碼
2、基礎(chǔ),離散信源,1) 信源輸出的消息由隨機(jī)變量描述,信息論與編碼基礎(chǔ),離散信源,定義2.1 若信源輸出的消息數(shù)是有限的或可數(shù)的,而且每次只輸出符號(hào)集中的一個(gè)消息,這樣的信源稱為簡(jiǎn)單的離散信源。,信源空間,信息論與編碼基礎(chǔ),離散信源,樣本,概率,紅(100) 黃(50) 藍(lán)(25) 白(25),信息論與編碼基礎(chǔ),離散信源,定義2.2 若信源輸出的是單個(gè)符號(hào)的消息,但是其可能出現(xiàn)的消息數(shù)是不可數(shù)的無(wú)限值,即輸出消息的取值是連續(xù)的,這樣的信源稱為簡(jiǎn)單的連續(xù)信源。,或,或,例如:語(yǔ)音信號(hào);遙控系統(tǒng)中測(cè)得的電壓、溫度、壓力等連續(xù)數(shù)據(jù)。,信息論與編碼基礎(chǔ),離散信源,復(fù)雜信源,例1:中文自然語(yǔ)言文字信源,牛
3、,氣,沖 天,例2:離散化的平面灰度圖像信源,信息論與編碼基礎(chǔ),離散信源,2) 信源輸出的消息由隨機(jī)矢量描述,定義2.3 若離散信源輸出的消息是由一系列符號(hào)所組成的(不妨假設(shè)由N個(gè)符號(hào)組成,其中N為有限正整數(shù)或可數(shù)的無(wú)限值),這樣的信源稱為多維的離散信源。,信息論與編碼基礎(chǔ),離散信源,其中,1)離散無(wú)記憶信源,2)離散有記憶信源,馬爾可夫信源,擴(kuò)展信源,信息論與編碼基礎(chǔ),離散信源,定義2.4 若連續(xù)信源輸出的消息是由一系列符號(hào)所組成的,這樣的信源稱為多維的連續(xù)信源。,2) 信源輸出的消息由隨機(jī)矢量描述,連續(xù)平穩(wěn)信源: 隨機(jī)矢量的各維概率密度都與時(shí)間起點(diǎn)無(wú)關(guān),信息論與編碼基礎(chǔ),離散信源,3) 信
4、源輸出的消息由隨機(jī)過程描述,隨機(jī)波形信源,只要是時(shí)間上或頻率上為有限的過程,就可以把隨機(jī)過程用一系列 時(shí)間離散的取樣值來(lái)表示,而每個(gè)取樣值都是連續(xù)型隨機(jī)變量。,隨機(jī)過程,隨機(jī)序列,離散信源,信息論與編碼基礎(chǔ),離散信源,一、信源的數(shù)學(xué)模型及分類,二、離散信源的信息熵及其性質(zhì),三、離散無(wú)記憶的擴(kuò)展信源,四、離散平穩(wěn)信源,五、信源的剩余度,信息論與編碼基礎(chǔ),離散信源,1、自信息,2、信源的信息熵,3、熵的基本性質(zhì),信息論與編碼基礎(chǔ),離散信源,簡(jiǎn)單的離散信源模型,信息論與編碼基礎(chǔ),離散信源,期末考試中,我擠進(jìn)了班級(jí)十強(qiáng)。,期末考試中,我擠進(jìn)了年級(jí)十強(qiáng)。,603教學(xué)樓已經(jīng)開始使用。,小明體育經(jīng)常不及格,
5、昨天測(cè)試成績(jī)排名第一。,現(xiàn)在正在進(jìn)行信息論與編碼基礎(chǔ)課程學(xué)習(xí)。,北京天安門前有游客在照相。,1、自信息,度量信息的基本思路,若信源中事件xi的出現(xiàn)所帶來(lái)的信息量用I(xi)來(lái)表示并稱之為事件xi的自信息量, 則概率為p(xi)的信源輸出xi所包含的信息量I(xi)必須滿足以下幾個(gè)條件:,信息論與編碼基礎(chǔ),離散信源,度量信息的基本思路,1. 信源輸出xi所包含的信息量?jī)H依賴于它的概率,而與它的取值無(wú)關(guān)。 2. I (xi)是p(xi)的連續(xù)函數(shù)。 3. I (xi )是p(xi)的減函數(shù),即: 如果p(xi) p(xj),則I(xi) I(xj)。 極限情況,若p(xi) = 0, 則 I(xi
6、) ; 若 p(xi) = 1, 則I(xi) = 0。 4.若兩個(gè)單符號(hào)離散信源(符號(hào)集合X, Y )統(tǒng)計(jì)獨(dú)立, 則X中出現(xiàn)xi 、Y中出現(xiàn)yj的聯(lián)合信息量 I (xi , yj) = I (xi) + I (yj) 問題:什么函數(shù)能夠同時(shí)滿足以上條件呢?,信息論與編碼基礎(chǔ),離散信源,自信息含義,信息論與編碼基礎(chǔ),自信息,r = 2 bit,r = e nat,r = 10 hart,含義,離散信源,驗(yàn)證(獨(dú)立相加性),信息論與編碼基礎(chǔ),離散信源,自信息量計(jì)算舉例,舉例 一個(gè)0, 1等概的二進(jìn)制隨機(jī)序列,求任一碼元的自信息量。 解:任一碼元不是為0就是為1 因?yàn)?p(0) = p(1) =
7、1/2 所以 I (0) = I (1) = log (1/2) = 1(bit),信息論與編碼基礎(chǔ),離散信源,自信息量計(jì)算舉例,舉例,對(duì)于2n進(jìn)制的數(shù)字序列, 假設(shè)每一符號(hào)的出現(xiàn)完全隨機(jī)且概率相等,求任一符號(hào)的自信息量。 解:設(shè)2n進(jìn)制數(shù)字序列任一碼元xi的出現(xiàn)概率為p (xi),根據(jù)題意, p(xi) = 1/2n I (xi ) = log(1/2n) = n (bit) 事件的自信息量只與其概率有關(guān),而與它的取值無(wú)關(guān)。,信息論與編碼基礎(chǔ),離散信源,信息量與不確定性的關(guān)系,信源中某一消息發(fā)生的不確定性越大,一旦它發(fā)生,并為收信者收到后,消除的不確定性就越大,獲得的信息也就越大。 由于種種
8、原因(例如噪聲太大),收信者接收到受干擾的消息后,對(duì)某信息發(fā)生的不確定性依然存在或者一點(diǎn)也未消除時(shí),則收信者獲得較少的信息或者說一點(diǎn)也沒有獲得信息。,信息論與編碼基礎(chǔ),離散信源,信息量的直觀定義: 收到某消息獲得的信息量不確定性減少的量 (收到此消息前關(guān)于某事件發(fā)生的不確定性) (收到此消息后關(guān)于某事件發(fā)生的不確定性) 在無(wú)噪聲時(shí),通過信道的傳輸,可以完全不失真地收到所發(fā)的消息,收到此消息后關(guān)于某事件發(fā)生的不確定性完全消除,此項(xiàng)為零。因此得 收到某消息獲得的信息量 收到此消息前關(guān)于某事件發(fā)生的不確定性 信源輸出的某消息中所含有的信息量,信息量與不確定性的關(guān)系,信息論與編碼基礎(chǔ),離散信源,信息量
9、與不確定性的關(guān)系,信宿端收到某一消息后所得到的信息量,可以等效為接收者在通信前后“不確定”因素的減少或消除。 事件的不確定性可用不確定度描述,它同樣是事件概率的函數(shù),在數(shù)值和量綱上和自信息量相等,因此都可以用右式來(lái)計(jì)算: 某一隨機(jī)事件的出現(xiàn)所給出的信息量(自信息量),在數(shù)值上與該隨機(jī)事件的不確定度不但相關(guān)而且相等,即事件的出現(xiàn)等效成事件不確定集合的元素的減少,或簡(jiǎn)稱為事件不確定度的減少。,信息論與編碼基礎(chǔ),離散信源,信息量與不確定性,自信息量和該事件的不確定度的含義有本質(zhì)的區(qū)別。 不確定度只與事件的概率有關(guān),是一個(gè)統(tǒng)計(jì)量,在靜態(tài)狀態(tài)下也存在; 自信息量只有該隨機(jī)事件出現(xiàn)時(shí)才給出,不出現(xiàn)時(shí)不給出
10、,因此它是一個(gè)動(dòng)態(tài)的概念。,信息論與編碼基礎(chǔ),離散信源,自信息含義,當(dāng)事件xi發(fā)生以前:表示事件xi發(fā)生的不確定性。 當(dāng)事件xi發(fā)生以后:表示事件xi所含有(或所提供)的信息量。在無(wú)噪信道中,事件xi發(fā)生后,能正確無(wú)誤地傳輸?shù)绞招耪?,所以I(xi)可代表接收到消息xi后所獲得的信息量。這是因?yàn)橄薎(xi)大小的不確定性,才獲得這么大小的信息量。 自信息的測(cè)度單位及其換算關(guān)系 信息論中“比特”與計(jì)算機(jī)術(shù)語(yǔ)中“比特”區(qū)別,信息論與編碼基礎(chǔ),離散信源,自信息的測(cè)度單位及其換算關(guān)系,如果取以2為底,則信息量單位稱為比特(binary unit) I(xi)=log2(1/p(xi) 比特 如果取以
11、e為底,則信息量單位稱為奈特(nature unit) I(xi)=ln(1/p(xi) 奈特 如果取以10為底,則信息量單位稱為哈特(Hart unit,以紀(jì)念哈特萊首先提出用對(duì)數(shù)來(lái)度量消息) I(xi)=lg(1/p(xi) 哈特 1奈特1.44比特 1哈特3.32比特 在通信及目前的絕大多數(shù)信息傳輸系統(tǒng)中,都是以二進(jìn)制為基礎(chǔ)的,因此信息量單位以比特最為常用。因此一般都采用以“2”為底的對(duì)數(shù),為了書寫簡(jiǎn)潔,有時(shí)把底數(shù)2略去不寫。,信息論與編碼基礎(chǔ),離散信源,信息論中“比特”與 計(jì)算機(jī)術(shù)語(yǔ)中“比特”區(qū)別,如果p(xi)=1/2,則I(xi)=1比特。所以1比特信息量就是兩個(gè)互不相容的等可能事
12、件之一發(fā)生時(shí)所提供的信息量。 信息論中“比特”是指抽象的信息量單位; 計(jì)算機(jī)術(shù)語(yǔ)中“比特”是代表二元數(shù)字; 這兩種定義之間的關(guān)系是:每個(gè)二元數(shù)字所能提供的最大平均信息量為1比特。,信息論與編碼基礎(chǔ),離散信源,信息論與編碼基礎(chǔ),離散信源,例 假設(shè)一次擲兩個(gè)各自均勻、互相不可區(qū)分又互不相關(guān)的骰子。如事件(A)(B)(C)分別表示:(A)僅有一個(gè)骰子是3;(B)至少有一個(gè)骰子是4;(C)骰子點(diǎn)數(shù)的總和是偶數(shù)。試計(jì)算事件(A)(B)(C)發(fā)生后所提供的信息量。,信息論與編碼基礎(chǔ),離散信源,信息論與編碼基礎(chǔ),離散信源,信息論與編碼基礎(chǔ),離散信源,聯(lián)合自信息,簡(jiǎn)記為,信息論與編碼基礎(chǔ),離散信源,條件自信息
13、,簡(jiǎn)記為,在事件y=b給定條件下,在x=a發(fā)生前的不確定性;,在事件y=b給定條件下,在事件x=a發(fā)生后所得到的信息量,信息論與編碼基礎(chǔ),離散信源,例2.1,I(xy) = log64 = 6 bit,I(x|y) = log8 = 3 bit,信息論與編碼基礎(chǔ),離散信源,2、信源的信息熵,信息單位/信源符號(hào),信源熵,自信息是一個(gè)隨機(jī)變量:自信息是指某一信源發(fā)出某一消息所含有的信息量。所發(fā)出的消息不同,它們所含有的信息量也就不同。 信源熵:自信息的數(shù)學(xué)期望。也稱為信源的信息熵/信源熵/香農(nóng)熵/無(wú)條件熵/熵函數(shù)/熵。 信息熵的單位:取決于對(duì)數(shù)選取的底。一般選用以2為底,其單位為比特/符號(hào)。 信息
14、熵的意義:信源的信息熵H是從整個(gè)信源的統(tǒng)計(jì)特性來(lái)考慮的。它是從平均意義上來(lái)表征信源的總體特性的。對(duì)于某特定的信源,其信息熵只有一個(gè)。不同的信源因統(tǒng)計(jì)特性不同,其熵也不同。,信息論與編碼基礎(chǔ),離散信源,例1,有一布袋內(nèi)放100個(gè)球,其中80個(gè)球是黃色的,20個(gè)球是白色的。隨便摸出一個(gè)球,猜測(cè)是什么顏色,其概率空間為 x1:表示摸出的是黃球 x2:表示摸出的是白球,信息論與編碼基礎(chǔ),離散信源,信息論與編碼基礎(chǔ),離散信源,例2,三個(gè)信源,1 bit事件,信息論與編碼基礎(chǔ),離散信源,信源熵的三種物理含義,信源熵是從平均意義上來(lái)表征信源的總體特性的一個(gè)量。因此信源熵有以下三種物理含義。 信源熵H(X)是
15、表示信源輸出后每個(gè)消息/符號(hào)所提供的平均信息量; 信源熵H(X)是表示信源輸出前,信源的平均不確定性; 用信源熵H(X)來(lái)表征變量X的隨機(jī)性。 如下例,變量Y取y1和y2是等概率的,所以其隨機(jī)性大。而變量X取x1的概率比取x2的概率大很多,這時(shí)變量X的隨機(jī)性就小。因此H(X)反映了變量的隨機(jī)性。,信息論與編碼基礎(chǔ),離散信源,信源熵與平均自信息量,信源熵和平均自信息量?jī)烧咴跀?shù)值上是相等的,但含意并不相同。 信源熵H(X)表征信源的平均不確定度,平均自信息量是消除不確定度所需要的信息的量度; 信源一定,不管它是否輸出離散消息,只要這些離散消息具有一定的概率特性,必有信源的熵值;在離散信源的情況下,
16、信源熵的值是有限的; 信息量只有當(dāng)信源輸出離散消息并被接收后,才有意義。這就是給予接收者的信息度量。當(dāng)信源輸出連續(xù)消息時(shí),信息量的值可以是無(wú)窮大。,信息論與編碼基礎(chǔ),離散信源,信源熵與平均獲得的信息量,信源熵是信源的平均不確定性的描述。在一般情況下它并不等于平均獲得的信息量。只有在無(wú)噪情況下,接收者才能正確無(wú)誤地接收到信源所發(fā)出的消息,消除了H(X)大小的平均不確定性,所以獲得的平均信息量就等于H(X)。在一般情況下獲得的信息量是兩熵之差,并不是信源熵本身。,信息論與編碼基礎(chǔ),離散信源,舉 例,有兩個(gè)信源,其概率空間分別為 信息熵分別為 H(X)=-0.99log0.99-0.01log0.0
17、1=0.08 比特/符號(hào) H(Y)=-0.5log0.5-0.5log0.5=1 比特/符號(hào) 可見 H(Y)H(X) 本例結(jié)論 信源Y的二個(gè)輸出消息是等可能性的,所以在信源沒有輸出消息以前,事先猜測(cè)哪一個(gè)消息出現(xiàn)的不確定性要大; 信源Y比信源X的平均不確定性大; 信源X的二個(gè)輸出消息不是等概率的,事先猜測(cè)x1和x2哪一個(gè)出現(xiàn),雖然具有不確定性,但大致可以猜出x1會(huì)出現(xiàn),因?yàn)閤1出現(xiàn)的概率大。所以信源X的不確定性要??; 信息熵反映的就是信源輸出前平均不確定程度的大小。,信息論與編碼基礎(chǔ),離散信源,信息論與編碼基礎(chǔ),離散信源,一、信源的數(shù)學(xué)模型及分類,二、離散信源的信息熵及其性質(zhì),三、離散無(wú)記憶的
18、擴(kuò)展信源,四、離散平穩(wěn)信源,五、信源的剩余度,信息論與編碼基礎(chǔ),離散信源,1、自信息,2、信源的信息熵,3、熵的基本性質(zhì),信息論與編碼基礎(chǔ),離散信源,3、熵的基本性質(zhì),概率矢量,熵函數(shù),H(0.3, 0.4, 0.3),H(0.3),信息論與編碼基礎(chǔ),離散信源,1)非負(fù)性,3、熵的基本性質(zhì),信息論與編碼基礎(chǔ),離散信源,2)確定性,3、熵的基本性質(zhì),信息論與編碼基礎(chǔ),離散信源,例設(shè)X,Y,Z三個(gè)信源,3、熵的基本性質(zhì),節(jié)日上空彩球,學(xué)術(shù)會(huì)議參與者膚色,天氣情況,信息論與編碼基礎(chǔ),離散信源,4)擴(kuò)展性,3、熵的基本性質(zhì),信息論與編碼基礎(chǔ),離散信源,5)可加性,信源X,Y統(tǒng)計(jì)獨(dú)立,極值性,信息論與編
19、碼基礎(chǔ),離散信源,6)極值性,最大離散熵定理,最大離散熵定理,最大離散熵定理,最大離散熵定理,最大離散熵定理,信息論與編碼基礎(chǔ),離散信源,例,二元信源(1,0)的信息熵,H(0,1),確定性,H(0.5,0.5),極值性,計(jì)算與思考,計(jì)算與思考,計(jì)算與思考,信源空間必定是一個(gè)完備集,信源空間的描述,7) 香農(nóng)輔助定理,對(duì)任意兩個(gè)消息數(shù)相同的信源 有 上式含義:任一概率分布p(xi),它對(duì)其它概率分布p(yi)的自信息 取數(shù)學(xué)期望時(shí),必不小于p(xi)本身的熵。,信息論與編碼基礎(chǔ),離散信源,由熵的極值性可以證明條件熵不大于信源熵/無(wú)條件熵: H(X/Y)H(X) H(Y/X)H(Y) 證明:H(X/Y)H(X) 已知Y時(shí)X的不確定度應(yīng)小于一無(wú)所知時(shí)X的不確定度。因?yàn)橐阎猋后,從Y得到了一些關(guān)于X的信息,從而使X的不確定度下降。,信息論與編碼基礎(chǔ),離散信源,8) 上凸性,HP +(1-)Q H(P )+(1-)H(Q ) 上凸性證明: 設(shè)有一
溫馨提示
- 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 四川省瀘縣高三三診模擬語(yǔ)文試卷(含答案)
- 中職班主任選手備賽七部曲匯報(bào)人王秀芳講解
- 職業(yè)溝通與禮儀健康管理系施怡寧講解
- 簡(jiǎn)單聘用合同范本
- 2025抵押物的借款合同范本「標(biāo)準(zhǔn)版」
- 實(shí)習(xí)生用人合同協(xié)議書
- 2025三方工程合同
- 安防監(jiān)控工程施工合同范本
- 防水工程施工合同書范文
- 高考滿分作文常見結(jié)構(gòu)完全解讀
- 專題2-2十三種高考補(bǔ)充函數(shù)歸類(講練)
- 三年級(jí)英語(yǔ)上冊(cè)整冊(cè)書單詞默寫表學(xué)生版(外研版三起)
- 六年級(jí)數(shù)學(xué)上冊(cè)100道口算題(全冊(cè)完整版)
- 如愿三聲部合唱簡(jiǎn)譜
- 高三數(shù)學(xué)開學(xué)第一課
- 系統(tǒng)解剖學(xué)考試重點(diǎn)筆記
- 云南省地圖含市縣地圖矢量分層地圖行政區(qū)劃市縣概況ppt模板
- 暖通空調(diào)基礎(chǔ)知識(shí)及識(shí)圖課件
- 防滲墻工程施工用表及填寫要求講義
- 交通信號(hào)控制系統(tǒng)檢驗(yàn)批質(zhì)量驗(yàn)收記錄表
評(píng)論
0/150
提交評(píng)論