![數(shù)字音視頻概述_第1頁](http://file3.renrendoc.com/fileroot_temp3/2022-7/4/25f53e6f-042c-4888-a5a8-cc838edd5431/25f53e6f-042c-4888-a5a8-cc838edd54311.gif)
![數(shù)字音視頻概述_第2頁](http://file3.renrendoc.com/fileroot_temp3/2022-7/4/25f53e6f-042c-4888-a5a8-cc838edd5431/25f53e6f-042c-4888-a5a8-cc838edd54312.gif)
![數(shù)字音視頻概述_第3頁](http://file3.renrendoc.com/fileroot_temp3/2022-7/4/25f53e6f-042c-4888-a5a8-cc838edd5431/25f53e6f-042c-4888-a5a8-cc838edd54313.gif)
![數(shù)字音視頻概述_第4頁](http://file3.renrendoc.com/fileroot_temp3/2022-7/4/25f53e6f-042c-4888-a5a8-cc838edd5431/25f53e6f-042c-4888-a5a8-cc838edd54314.gif)
![數(shù)字音視頻概述_第5頁](http://file3.renrendoc.com/fileroot_temp3/2022-7/4/25f53e6f-042c-4888-a5a8-cc838edd5431/25f53e6f-042c-4888-a5a8-cc838edd54315.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、北京信息科技大學(xué)吳韶波 第一章數(shù)字視頻基礎(chǔ)北京信息科技大學(xué)數(shù)字音視頻技術(shù)的基本概念數(shù)字音視頻技術(shù)的基本概念1.1數(shù)字音視頻系統(tǒng)的組成數(shù)字音視頻系統(tǒng)的組成 1.3數(shù)字音視頻系統(tǒng)的應(yīng)用與發(fā)展數(shù)字音視頻系統(tǒng)的應(yīng)用與發(fā)展1.4數(shù)字音視頻技術(shù)的發(fā)展趨勢數(shù)字音視頻技術(shù)的發(fā)展趨勢 1.5數(shù)字音視頻技術(shù)的主要特點數(shù)字音視頻技術(shù)的主要特點 1.2北京信息科技大學(xué)p 音頻基礎(chǔ)音頻基礎(chǔ)u聲音聲音物理特性、人的聽覺特性、物理特性、人的聽覺特性、p 視頻基礎(chǔ)視頻基礎(chǔ)u視覺視覺人類視覺系統(tǒng)、人類視覺系統(tǒng)、北京信息科技大學(xué)p音頻音頻u通常指正常人耳所能聽到的,相應(yīng)于正弦聲波通常指正常人耳所能聽到的,相應(yīng)于正弦聲波的任何頻率
2、。的任何頻率。p聲音聲音u是由材料振動產(chǎn)生的一種物理現(xiàn)象,通過空氣是由材料振動產(chǎn)生的一種物理現(xiàn)象,通過空氣等介質(zhì)的傳播,引起人的耳膜振動,并為人耳等介質(zhì)的傳播,引起人的耳膜振動,并為人耳所感知。所感知。北京信息科技大學(xué)p從物理學(xué)的角度來看,聲音實際上是通過空從物理學(xué)的角度來看,聲音實際上是通過空氣等介質(zhì)傳播的一種連續(xù)的波,稱為聲波。氣等介質(zhì)傳播的一種連續(xù)的波,稱為聲波。頻率、聲速和波長頻率、聲速和波長聲調(diào)(聲調(diào)(PitchPitch,音調(diào)),音調(diào))響度(響度(LoundnessLoundness)音色(音色(TimbreTimbre)北京信息科技大學(xué)圖圖1 1 聲強與聲壓的關(guān)系聲強與聲壓的關(guān)系
3、北京信息科技大學(xué)p聽覺的方向性聽覺的方向性u人對聲音方向的定位能力是由聽覺的定位特性決定的。人對聲音方向的定位能力是由聽覺的定位特性決定的。u人耳對聲音的方位非常敏感,能在大約人耳對聲音的方位非常敏感,能在大約1 1度的范圍內(nèi)辨知聲音的度的范圍內(nèi)辨知聲音的方向,同時還可以判斷聲源離人耳的距離。方向,同時還可以判斷聲源離人耳的距離。u在測試環(huán)境中,聽眾坐在具有同樣構(gòu)造的兩個揚聲器前面,盡管在測試環(huán)境中,聽眾坐在具有同樣構(gòu)造的兩個揚聲器前面,盡管兩揚聲器的聲音幅度相同,但聽者定位右邊揚聲器的聲音更強,兩揚聲器的聲音幅度相同,但聽者定位右邊揚聲器的聲音更強,這是因為左邊揚聲器傳輸有接近這是因為左邊揚
4、聲器傳輸有接近15ms15ms的的時延時延。u當(dāng)時延超過當(dāng)時延超過50ms50ms時,聽眾感知到來自左邊和右邊揚聲器兩個不同時,聽眾感知到來自左邊和右邊揚聲器兩個不同聲音事件。聲音事件。u為彌補這一延時產(chǎn)生的影響,需增加該延時聲道的幅度。為彌補這一延時產(chǎn)生的影響,需增加該延時聲道的幅度。u設(shè)計立體聲設(shè)備和指導(dǎo)放聲布局及聆聽方法時應(yīng)充分考慮這一點。設(shè)計立體聲設(shè)備和指導(dǎo)放聲布局及聆聽方法時應(yīng)充分考慮這一點。北京信息科技大學(xué)p聽覺的頻率特性聽覺的頻率特性u聲音信號的頻率范圍為聲音信號的頻率范圍為20Hz20Hz20kHz20kHz。u單一頻率的信號稱為分量信號,由許多不同頻率的信號單一頻率的信號稱為
5、分量信號,由許多不同頻率的信號組成的是復(fù)合信號。組成的是復(fù)合信號。u它們的電平及頻譜分布雖有差異,但有著相同的規(guī)律。它們的電平及頻譜分布雖有差異,但有著相同的規(guī)律。u人類聽覺對聲音頻率的感覺不僅表現(xiàn)為音調(diào)的高低,而人類聽覺對聲音頻率的感覺不僅表現(xiàn)為音調(diào)的高低,而且在聲音強度相同條件下對聲音主觀感覺的強弱也是不且在聲音強度相同條件下對聲音主觀感覺的強弱也是不同的,即人類聽覺的頻率響應(yīng)不是平坦的。同的,即人類聽覺的頻率響應(yīng)不是平坦的。u由于外耳具有一定長度的耳道,會對某段頻率產(chǎn)生共鳴。由于外耳具有一定長度的耳道,會對某段頻率產(chǎn)生共鳴。北京信息科技大學(xué)p有些頻率的聲音人耳感覺很靈敏,很小的聲強就能有
6、些頻率的聲音人耳感覺很靈敏,很小的聲強就能感覺到,而頻率很低的聲音必須強度很高人耳才能感覺到,而頻率很低的聲音必須強度很高人耳才能感覺得到,這個頻率段大約在感覺得到,這個頻率段大約在3 35kHz5kHz。p因此人耳聽到聲音的響度與聲音的頻率有關(guān)。因此人耳聽到聲音的響度與聲音的頻率有關(guān)。p描述響度、聲音聲壓級以及聲源頻率之間的關(guān)系曲描述響度、聲音聲壓級以及聲源頻率之間的關(guān)系曲線稱為等響度曲線。線稱為等響度曲線。p等響度曲線是將聽起來與等響度曲線是將聽起來與1kHz1kHz純音(基音)響度相純音(基音)響度相同的各頻率的聲音的聲壓求得后用曲線連接起來的同的各頻率的聲音的聲壓求得后用曲線連接起來的
7、結(jié)果,又叫做響度的靈敏度曲線。結(jié)果,又叫做響度的靈敏度曲線。北京信息科技大學(xué)圖圖2 2 等響度特性曲線等響度特性曲線北京信息科技大學(xué)p等響度曲線與人的年齡以及人耳結(jié)構(gòu)有關(guān),從對該等響度曲線與人的年齡以及人耳結(jié)構(gòu)有關(guān),從對該曲線分析得出如下結(jié)論。曲線分析得出如下結(jié)論。u響度與人耳處的聲壓級有關(guān)。聲壓級提高,相應(yīng)的響度隨響度與人耳處的聲壓級有關(guān)。聲壓級提高,相應(yīng)的響度隨之增大。之增大。 u在在4 45kHz5kHz附近的聲音聽起來比較響,這是因為外耳道對附近的聲音聽起來比較響,這是因為外耳道對其產(chǎn)生共鳴。其產(chǎn)生共鳴。u圖中的等響度線越向上越趨向平直,下部曲線變化較大。圖中的等響度線越向上越趨向平直
8、,下部曲線變化較大。說明當(dāng)聲壓級很高時,不同頻率下的聲音差不多一樣響,說明當(dāng)聲壓級很高時,不同頻率下的聲音差不多一樣響,基本上與聲音的頻率無關(guān)。當(dāng)聲壓級降低,等響度曲線低基本上與聲音的頻率無關(guān)。當(dāng)聲壓級降低,等響度曲線低頻區(qū)的變化率要大于高頻區(qū)變化率,也就是在此區(qū)域內(nèi),頻區(qū)的變化率要大于高頻區(qū)變化率,也就是在此區(qū)域內(nèi),聲壓級略有變化,其低頻聲音響度級會有明顯地變化。聲壓級略有變化,其低頻聲音響度級會有明顯地變化。u等響度曲線中的下方虛線以下區(qū)域為不可聞區(qū),表示雖然等響度曲線中的下方虛線以下區(qū)域為不可聞區(qū),表示雖然人耳處存在一定的聲壓,卻感覺不到。對于頻率為人耳處存在一定的聲壓,卻感覺不到。對于
9、頻率為200Hz200Hz的聲音,只有它的聲壓級高于的聲音,只有它的聲壓級高于22dB22dB人耳才能聽到。人耳才能聽到。北京信息科技大學(xué)p聽覺靈敏度聽覺靈敏度u聽覺靈敏度是指人耳對聲壓、頻率及方位的微小變化的聽覺靈敏度是指人耳對聲壓、頻率及方位的微小變化的判斷能力。判斷能力。u當(dāng)聲壓發(fā)生變化時,人們聽到的響度會有變化。當(dāng)聲壓發(fā)生變化時,人們聽到的響度會有變化。例如聲壓級在例如聲壓級在50dB50dB以上時,人耳能分辨出的最小聲壓級差約為以上時,人耳能分辨出的最小聲壓級差約為1dB1dB;而聲壓級小于;而聲壓級小于40dB40dB時,要變化時,要變化1 13dB3dB才能覺察出來。才能覺察出來
10、。u當(dāng)頻率發(fā)生變化時,人們聽到的音調(diào)會有變化。當(dāng)頻率發(fā)生變化時,人們聽到的音調(diào)會有變化。例如頻率為例如頻率為1000Hz1000Hz、聲壓級為、聲壓級為40dB40dB的聲音,變化的聲音,變化3Hz3Hz就能覺察就能覺察出來,當(dāng)頻率超過出來,當(dāng)頻率超過1000Hz1000Hz、聲壓超過、聲壓超過40dB40dB時,人耳能覺察到的時,人耳能覺察到的相對頻率變化范圍(相對頻率變化范圍( f f/ /f f)約為)約為0.0030.003。聽覺靈敏度還與年齡有關(guān)。聽覺靈敏度還與年齡有關(guān)。北京信息科技大學(xué)p研究結(jié)果表明:對于純音,人耳能分辨出研究結(jié)果表明:對于純音,人耳能分辨出280280個個聲壓層次
11、和聲壓層次和14001400個頻率層次。個頻率層次。p對于復(fù)音,人耳只能分辨對于復(fù)音,人耳只能分辨7 7種不同的響度層次和種不同的響度層次和7 7種不同的音調(diào),共種不同的音調(diào),共4949種響度和音調(diào)的組合。種響度和音調(diào)的組合。p這個數(shù)字接近我們在語言中可覺察到的音素數(shù)。這個數(shù)字接近我們在語言中可覺察到的音素數(shù)。p在高保真音響系統(tǒng)中,如果能將聲音的畸變控制在高保真音響系統(tǒng)中,如果能將聲音的畸變控制在人耳無法覺察的范圍內(nèi)便可以獲得高保真的主在人耳無法覺察的范圍內(nèi)便可以獲得高保真的主觀聽覺效果。觀聽覺效果。北京信息科技大學(xué)p掩蔽效應(yīng)掩蔽效應(yīng)u人耳的另一個聽覺特性是掩蔽效應(yīng)。人耳的另一個聽覺特性是掩蔽
12、效應(yīng)。u所謂掩蔽效應(yīng),即一個聲音的存在會影響人耳所謂掩蔽效應(yīng),即一個聲音的存在會影響人耳對其他聲音的聽覺能力,在聽覺效果上似乎一對其他聲音的聽覺能力,在聽覺效果上似乎一個聲音掩蔽了另一個聲音。個聲音掩蔽了另一個聲音。u頻域掩蔽效應(yīng)頻域掩蔽效應(yīng)u時域掩蔽效應(yīng)時域掩蔽效應(yīng)北京信息科技大學(xué)類類 別別名名 稱稱掩蔽出現(xiàn)時間掩蔽出現(xiàn)時間掩蔽持續(xù)掩蔽持續(xù)時間時間效效 果果同時同時掩蔽掩蔽同時掩蔽同時掩蔽與掩蔽聲同時與掩蔽聲同時同時掩聲同時掩聲在掩蔽聲持續(xù)時間內(nèi),對被掩蔽在掩蔽聲持續(xù)時間內(nèi),對被掩蔽聲的掩蓋最為明顯聲的掩蓋最為明顯非同時非同時掩蔽掩蔽超前掩蔽超前掩蔽在掩蔽聲之前在掩蔽聲之前20ms20ms由
13、于人耳的積累效應(yīng),被掩蔽聲由于人耳的積累效應(yīng),被掩蔽聲尚未被聽到,掩蔽聲已經(jīng)出現(xiàn),尚未被聽到,掩蔽聲已經(jīng)出現(xiàn),其掩蓋效果很差其掩蓋效果很差滯后掩蔽滯后掩蔽在掩蔽聲之后在掩蔽聲之后100ms100ms由于人耳的存儲效應(yīng),掩蔽聲雖由于人耳的存儲效應(yīng),掩蔽聲雖已消失,掩蔽效應(yīng)仍然存在已消失,掩蔽效應(yīng)仍然存在表表l l 時域掩蔽效應(yīng)的分類及效果時域掩蔽效應(yīng)的分類及效果北京信息科技大學(xué)p聲波的特性及聽覺的主觀感受聲波的特性及聽覺的主觀感受u生理聲學(xué)認為,聽覺形成的基本機理可以這樣描述:由生理聲學(xué)認為,聽覺形成的基本機理可以這樣描述:由聲源振動發(fā)出的聲波,通過外耳道、鼓膜和小聽骨的傳聲源振動發(fā)出的聲波,通
14、過外耳道、鼓膜和小聽骨的傳導(dǎo),引起耳蝸中淋巴液和基底膜的振動,并轉(zhuǎn)換成電信導(dǎo),引起耳蝸中淋巴液和基底膜的振動,并轉(zhuǎn)換成電信號,由神經(jīng)元編碼形成脈沖序列,通過神經(jīng)系統(tǒng)傳遞到號,由神經(jīng)元編碼形成脈沖序列,通過神經(jīng)系統(tǒng)傳遞到大腦皮層中的聽覺中樞,產(chǎn)生聽覺,感受到聲音。大腦皮層中的聽覺中樞,產(chǎn)生聽覺,感受到聲音。u聽覺的這些基本特性決定著人們對聲音的主觀感受。聽覺的這些基本特性決定著人們對聲音的主觀感受。u可聞聲可聞聲u聽閾和痛閾聽閾和痛閾北京信息科技大學(xué)p視頻視頻u主要指不斷變化的電視圖像,即動態(tài)圖像,主要指不斷變化的電視圖像,即動態(tài)圖像,或活動圖像、運動圖像或活動圖像、運動圖像p視覺視覺u光輻射刺
15、激人眼時,將會引起復(fù)雜的生光輻射刺激人眼時,將會引起復(fù)雜的生理和心理變化,這種感覺就是理和心理變化,這種感覺就是 。北京信息科技大學(xué)p人類視覺系統(tǒng)(人類視覺系統(tǒng)(HVS)u是人類獲取外界圖像、視頻信息的工具是人類獲取外界圖像、視頻信息的工具u是人類最重要、同時也是最完美的感知手段是人類最重要、同時也是最完美的感知手段u首先通過眼睛感覺觀察來獲取原始的場景信息,首先通過眼睛感覺觀察來獲取原始的場景信息,然后在大腦中加工處理,再綜合其他已有的現(xiàn)然后在大腦中加工處理,再綜合其他已有的現(xiàn)場信息,進而展開人類的視知覺智能推理活動場信息,進而展開人類的視知覺智能推理活動u研究包括光學(xué)、色度學(xué)、視覺生理學(xué)、
16、視覺心研究包括光學(xué)、色度學(xué)、視覺生理學(xué)、視覺心理學(xué)、解剖學(xué)、神經(jīng)科學(xué)和認知科學(xué)等領(lǐng)域理學(xué)、解剖學(xué)、神經(jīng)科學(xué)和認知科學(xué)等領(lǐng)域北京信息科技大學(xué)人眼是一個構(gòu)造及其復(fù)雜而精密的光學(xué)信息處理系統(tǒng),從解人眼是一個構(gòu)造及其復(fù)雜而精密的光學(xué)信息處理系統(tǒng),從解剖學(xué)看,人類視覺系統(tǒng)由眼球和視神經(jīng)系統(tǒng)組成剖學(xué)看,人類視覺系統(tǒng)由眼球和視神經(jīng)系統(tǒng)組成北京信息科技大學(xué)鞏膜是一種不透明的膜,起保護眼球的作用鞏膜是一種不透明的膜,起保護眼球的作用北京信息科技大學(xué)角膜堅硬而透明,角膜堅硬而透明,覆蓋在眼睛的前覆蓋在眼睛的前表面,光線由此表面,光線由此進入眼內(nèi)進入眼內(nèi)北京信息科技大學(xué)虹膜是在角膜后面,虹膜是在角膜后面,不透明,隨
17、不同種不透明,隨不同種族具有不同顏色族具有不同顏色北京信息科技大學(xué)虹膜中間有一個小虹膜中間有一個小孔叫瞳孔,在虹膜孔叫瞳孔,在虹膜環(huán)狀肌的作用下,環(huán)狀肌的作用下,瞳孔直徑可調(diào)瞳孔直徑可調(diào)(28mm),從而),從而控制進入人眼的光控制進入人眼的光通量,類似于相機通量,類似于相機的光圈的光圈北京信息科技大學(xué)瞳孔后面是扁球形的晶體,相當(dāng)于相機的鏡頭,瞳孔后面是扁球形的晶體,相當(dāng)于相機的鏡頭,在睫狀肌的作用下,可以通過調(diào)節(jié)曲率來改變焦在睫狀肌的作用下,可以通過調(diào)節(jié)曲率來改變焦距,使不同距離景象在視網(wǎng)膜上成像距,使不同距離景象在視網(wǎng)膜上成像北京信息科技大學(xué)視網(wǎng)膜由大量光敏視網(wǎng)膜由大量光敏細胞和神經(jīng)纖維組
18、細胞和神經(jīng)纖維組成,是人眼的感光成,是人眼的感光部分。光敏細胞通部分。光敏細胞通過視神經(jīng)纖維連接過視神經(jīng)纖維連接到大腦的視覺皮層到大腦的視覺皮層上,人們觀察物體上,人們觀察物體時,物體通過晶體時,物體通過晶體在視網(wǎng)膜上形成一在視網(wǎng)膜上形成一個清晰的像,光敏個清晰的像,光敏細胞受到光的刺激細胞受到光的刺激引起視覺,人就看引起視覺,人就看清了該物體。清了該物體。北京信息科技大學(xué)光敏細胞按形狀可分光敏細胞按形狀可分為:為:錐狀細胞:分布在視錐狀細胞:分布在視網(wǎng)膜中心部分,能辨網(wǎng)膜中心部分,能辨別光的強弱和顏色。別光的強弱和顏色。桿狀細胞:分布在視桿狀細胞:分布在視網(wǎng)膜的邊緣部分,靈網(wǎng)膜的邊緣部分,靈
19、敏度更高,但不能辨敏度更高,但不能辨顏色,夜晚觀察用顏色,夜晚觀察用北京信息科技大學(xué)黃斑區(qū)是視網(wǎng)膜上視覺最敏黃斑區(qū)是視網(wǎng)膜上視覺最敏感的區(qū)域,即視覺最清楚的感的區(qū)域,即視覺最清楚的區(qū)域。區(qū)域。北京信息科技大學(xué)p光源光源u自然光源:太陽和其他恒星自然光源:太陽和其他恒星u人工光源:火焰、火花、蠟燭、電燈、發(fā)光管、激光人工光源:火焰、火花、蠟燭、電燈、發(fā)光管、激光器等器等p人眼人眼對光的敏感程度對光的敏感程度與與光的波長(光的波長( )和和光輻射光輻射功率功率有關(guān)有關(guān)u可見光波長范圍:可見光波長范圍:380780nm380780nm北京信息科技大學(xué)p光譜效率函數(shù)光譜效率函數(shù)V(V( ) )u衡量人
20、眼對不同波長的光的敏感程度差別衡量人眼對不同波長的光的敏感程度差別p明視覺明視覺u日間視覺日間視覺u指人眼白天對各種波長的光的敏感程度差別指人眼白天對各種波長的光的敏感程度差別u即白天人眼視網(wǎng)膜的錐狀細胞對光的響應(yīng)即白天人眼視網(wǎng)膜的錐狀細胞對光的響應(yīng)u可用明視覺光譜效率函數(shù)可用明視覺光譜效率函數(shù)V(V( ) )來描述來描述p暗視覺暗視覺北京信息科技大學(xué)p暗視覺暗視覺u夜間視覺夜間視覺u指人眼在夜晚或微指人眼在夜晚或微弱光線下對光的敏感弱光線下對光的敏感程度程度u即白天視網(wǎng)膜的桿即白天視網(wǎng)膜的桿狀細胞對光的響應(yīng)狀細胞對光的響應(yīng)u可用暗視覺光譜效可用暗視覺光譜效率函數(shù)率函數(shù)V(V( ) )來描述來
21、描述北京信息科技大學(xué)p可見光譜可見光譜u單色光單色光:單一波長,只有一種顏色:單一波長,只有一種顏色u復(fù)合光復(fù)合光:由兩種或兩種以上波長的光混合而:由兩種或兩種以上波長的光混合而成的光,人眼的感覺是混合色,如自然光成的光,人眼的感覺是混合色,如自然光北京信息科技大學(xué)p亮度視覺u也稱為也稱為明暗視覺明暗視覺u光的能量越大,感受到的亮度越亮光的能量越大,感受到的亮度越亮u人眼對光的亮度感覺有關(guān)的參數(shù):人眼對光的亮度感覺有關(guān)的參數(shù):光強光強光通量光通量發(fā)光效率發(fā)光效率照度照度亮度亮度北京信息科技大學(xué)p人眼對光的亮度感覺有關(guān)的參數(shù):人眼對光的亮度感覺有關(guān)的參數(shù):u光強光強:發(fā)光強度,單位發(fā)光強度,單位
22、cdcd(坎(坎 德拉德拉 )u光通量光通量:能為人眼所感受到的那部分光的輻射功率,單能為人眼所感受到的那部分光的輻射功率,單位位lmlm(流明)(流明)u發(fā)光效率發(fā)光效率:每瓦特消耗功率所發(fā)出的光通量,單位每瓦特消耗功率所發(fā)出的光通量,單位lm/Wlm/Wu照度照度:被照明的物體表面單位面積上所接收的光通量,被照明的物體表面單位面積上所接收的光通量,單位單位lx lx(勒(勒 克斯克斯 )代表)代表1m1m2 2面積上均勻分布面積上均勻分布1lm1lm的光通量的光通量u亮度亮度:發(fā)光面在不同位置和不同方向的發(fā)光特性,單位發(fā)光面在不同位置和不同方向的發(fā)光特性,單位cd/cd/m m2 2北京信
23、息科技大學(xué)p彩色與視覺彩色與視覺u彩色是一種視覺信息彩色是一種視覺信息u人眼對顏色感覺的參量包括:人眼對顏色感覺的參量包括:亮度亮度色調(diào)色調(diào)飽和度飽和度北京信息科技大學(xué)p是指人眼對光的明亮程度的感覺,光源的是指人眼對光的明亮程度的感覺,光源的亮度正比于光通量亮度正比于光通量p物體的亮度不僅取決于物體反射(或透射)物體的亮度不僅取決于物體反射(或透射)光的能力,也取決于照射該物體的光源的光的能力,也取決于照射該物體的光源的輻射功率輻射功率p反射(或透射)光的能力越強,物體就越反射(或透射)光的能力越強,物體就越明亮明亮p照射物體的輻射功率越大,物體越明亮照射物體的輻射功率越大,物體越明亮2011
24、年秋季北京信息科技大學(xué)* * *亮度亮度北京信息科技大學(xué)p表示顏色的類別表示顏色的類別p彩色物體的色調(diào)取決于物體在光照下所反彩色物體的色調(diào)取決于物體在光照下所反射的光譜成分,不同波長的反射光使物體射的光譜成分,不同波長的反射光使物體呈現(xiàn)不同的色調(diào)呈現(xiàn)不同的色調(diào)p對于透射的物體,其色調(diào)取決于透射光的對于透射的物體,其色調(diào)取決于透射光的波長波長p彩色物體的色調(diào)既取決于物體的吸收特性彩色物體的色調(diào)既取決于物體的吸收特性和反射或透射特性,也與照明光源的光譜和反射或透射特性,也與照明光源的光譜分布有關(guān)分布有關(guān)北京信息科技大學(xué)* * *色調(diào)色調(diào)2011年秋季北京信息科技大學(xué)p指彩色光所呈現(xiàn)彩色的深淺程度(
25、或濃度)指彩色光所呈現(xiàn)彩色的深淺程度(或濃度)p對于同一色調(diào)的彩色光,其飽和度越高,對于同一色調(diào)的彩色光,其飽和度越高,它的顏色就越深它的顏色就越深北京信息科技大學(xué)p色度色度u指色調(diào)和飽和度的合稱指色調(diào)和飽和度的合稱u既反映了彩色光的顏色,也反映了顏色的既反映了彩色光的顏色,也反映了顏色的深淺程度深淺程度u非彩色光由于沒有色度,只用亮度來描述非彩色光由于沒有色度,只用亮度來描述p用亮度、色調(diào)和飽和度三個參量能準(zhǔn)確用亮度、色調(diào)和飽和度三個參量能準(zhǔn)確描述彩色光描述彩色光北京信息科技大學(xué)p立體視覺立體視覺u雙眼立體視覺雙眼立體視覺指人們看到的自然景物都是具有寬度、高度和深度指人們看到的自然景物都是具
26、有寬度、高度和深度的立體圖像的立體圖像主要原因:雙眼視差和輻輳主要原因:雙眼視差和輻輳u單眼立體視覺單眼立體視覺指單眼分辨景物深度所產(chǎn)生的立體感覺指單眼分辨景物深度所產(chǎn)生的立體感覺主要原因:為保證不同距離景物能在視網(wǎng)膜上成像,主要原因:為保證不同距離景物能在視網(wǎng)膜上成像,需要適當(dāng)調(diào)節(jié)睫狀肌,產(chǎn)生不同深度感覺需要適當(dāng)調(diào)節(jié)睫狀肌,產(chǎn)生不同深度感覺北京信息科技大學(xué)p亮度適應(yīng)性亮度適應(yīng)性p人眼覺察亮度變化人眼覺察亮度變化的能力的能力p色調(diào)對比效應(yīng)色調(diào)對比效應(yīng)p飽和度對比效應(yīng)飽和度對比效應(yīng)p面積對比效應(yīng)面積對比效應(yīng)p馬赫效應(yīng)馬赫效應(yīng)p視覺惰性視覺惰性p閃爍感覺閃爍感覺p視野與視覺視野與視覺p人眼的分辨率
27、人眼的分辨率p人眼的彩色分辨率人眼的彩色分辨率北京信息科技大學(xué)北京信息科技大學(xué)北京信息科技大學(xué)北京信息科技大學(xué)亦稱亦稱“馬赫范得效應(yīng)馬赫范得效應(yīng)”當(dāng)亮度發(fā)生躍變時,會有一種邊緣增強的感當(dāng)亮度發(fā)生躍變時,會有一種邊緣增強的感覺,視覺上會感到亮側(cè)更亮,暗側(cè)更暗。馬赫效覺,視覺上會感到亮側(cè)更亮,暗側(cè)更暗。馬赫效應(yīng)會導(dǎo)致局部閾值效應(yīng),即在邊緣的亮側(cè),靠近應(yīng)會導(dǎo)致局部閾值效應(yīng),即在邊緣的亮側(cè),靠近邊緣像素的誤差感知閾值比遠離邊緣閾值高邊緣像素的誤差感知閾值比遠離邊緣閾值高3434倍,倍,可以認為邊緣掩蓋了其鄰近像素,因此對靠近邊可以認為邊緣掩蓋了其鄰近像素,因此對靠近邊緣的像素編碼誤差可以大一些。緣的像
28、素編碼誤差可以大一些。北京信息科技大學(xué)北京信息科技大學(xué)人眼受到周期性光脈沖照射時,若重復(fù)的頻率不太人眼受到周期性光脈沖照射時,若重復(fù)的頻率不太高,則會產(chǎn)生忽明忽暗的閃爍感覺高,則會產(chǎn)生忽明忽暗的閃爍感覺臨界閃爍頻率臨界閃爍頻率:不引起閃爍感覺的光脈沖最低的重:不引起閃爍感覺的光脈沖最低的重復(fù)頻率復(fù)頻率光脈沖亮度越高,臨界光脈沖亮度越高,臨界閃爍頻率也越高閃爍頻率也越高亮度變化幅度越大,臨亮度變化幅度越大,臨界閃爍頻率也越高界閃爍頻率也越高北京信息科技大學(xué)p視野視野即頭部不動時眼球向正前方注視,所能看到即頭部不動時眼球向正前方注視,所能看到的空間范圍。的空間范圍。p視野也稱周邊視力,指黃斑中心凹
29、以外的視力視野也稱周邊視力,指黃斑中心凹以外的視力p正常人眼的最大范圍約在左右正常人眼的最大范圍約在左右3535 和上下和上下4040 ,最,最佳視野范圍約左右佳視野范圍約左右1515 和上下和上下1515 ,最大固定視野,最大固定視野約在左右約在左右9090 和上下和上下7070 ,頭部活動時視野可擴展,頭部活動時視野可擴展到左右到左右9595 和上下和上下9090 p視野還受背景色影響。視野還受背景色影響。北京信息科技大學(xué)p人眼的分辨力是指人眼對所觀察的實物細節(jié)或圖像細人眼的分辨力是指人眼對所觀察的實物細節(jié)或圖像細節(jié)的辨別能力,具體量化起來就是能分辨出平面上的節(jié)的辨別能力,具體量化起來就是
30、能分辨出平面上的兩個點的能力。兩個點的能力。u分辨力的定義是:眼睛對被觀察物上相鄰兩點之間能分辨分辨力的定義是:眼睛對被觀察物上相鄰兩點之間能分辨的最小距離所對應(yīng)的視角的最小距離所對應(yīng)的視角 的倒數(shù),即分辨力的倒數(shù),即分辨力= =u用用L L表示眼睛與圖像之間的距離,表示眼睛與圖像之間的距離,d d表示能分辨的兩點間最表示能分辨的兩點間最小距離,則有:小距離,則有: Ld1dL6036021北京信息科技大學(xué)p人眼的分辨力是有限的,在一定距離、一定對人眼的分辨力是有限的,在一定距離、一定對比度和一定亮度的條件下,人眼只能區(qū)分出小比度和一定亮度的條件下,人眼只能區(qū)分出小到一定程度的點,如果點更小,
31、就無法看清了。到一定程度的點,如果點更小,就無法看清了。p位置越近,分辨率越高位置越近,分辨率越高p靜止物體分辨率高靜止物體分辨率高p運動物體速度越快,分辨率越低運動物體速度越快,分辨率越低p水平運動比垂直運動分辨率高水平運動比垂直運動分辨率高北京信息科技大學(xué)p人眼對彩色細節(jié)的分辨力人眼對彩色細節(jié)的分辨力u人眼對彩色細節(jié)的分辨力遠比對黑白細節(jié)分辨力低人眼對彩色細節(jié)的分辨力遠比對黑白細節(jié)分辨力低p人眼對彩色色調(diào)的分辨力人眼對彩色色調(diào)的分辨力u對不同色調(diào),人眼的分辨力不同,紅黃之間的彩色色對不同色調(diào),人眼的分辨力不同,紅黃之間的彩色色調(diào)分辨力最高調(diào)分辨力最高p人眼對彩色飽和度的分辨力人眼對彩色飽和
32、度的分辨力u人眼對不同色調(diào)的飽和度變化的敏感程度不同人眼對不同色調(diào)的飽和度變化的敏感程度不同北京信息科技大學(xué)p建立視覺模型就是試圖用光學(xué)系統(tǒng)的概念建立視覺模型就是試圖用光學(xué)系統(tǒng)的概念來模擬某些視覺特性來模擬某些視覺特性p視覺信息處理模型視覺信息處理模型光學(xué)系統(tǒng)光學(xué)系統(tǒng)視網(wǎng)膜視網(wǎng)膜視覺通路視覺通路光信號電信號感知視頻景物眼球作用區(qū)大腦作用區(qū)光電轉(zhuǎn)換視頻信息處理北京信息科技大學(xué)p黑白視覺模型黑白視覺模型低通濾波器低通濾波器對數(shù)運算器對數(shù)運算器高通濾波器高通濾波器模擬人眼模擬人眼的光學(xué)系的光學(xué)系統(tǒng)統(tǒng)反應(yīng)視覺的亮度恒定現(xiàn)象,即當(dāng)景物反應(yīng)視覺的亮度恒定現(xiàn)象,即當(dāng)景物背景亮度和對比度保持一定時,即使背景亮
33、度和對比度保持一定時,即使景物和背景的亮度在很大范圍內(nèi)變化,景物和背景的亮度在很大范圍內(nèi)變化,人眼對景物的亮度感覺仍然保持不變?nèi)搜蹖拔锏牧炼雀杏X仍然保持不變反應(yīng)側(cè)抑制反應(yīng)側(cè)抑制引起的馬赫引起的馬赫效應(yīng)效應(yīng)北京信息科技大學(xué)p彩色視覺模型彩色視覺模型I(x,y,I(x,y, ) )為彩色圖為彩色圖像像北京信息科技大學(xué)p彩色視覺模型彩色視覺模型3 3個彩色濾波器,個彩色濾波器,反映人類視覺三反映人類視覺三基色理論基色理論北京信息科技大學(xué)p彩色視覺模型彩色視覺模型反映視神經(jīng)反映視神經(jīng)對光強的非對光強的非線性響應(yīng)線性響應(yīng)北京信息科技大學(xué)p彩色視覺模型彩色視覺模型反映視覺通路上的反映視覺通路上的響應(yīng),分
34、為彩色輸響應(yīng),分為彩色輸出和亮度輸出出和亮度輸出北京信息科技大學(xué)北京信息科技大學(xué)p對相互對立的顏色對分別為紅對相互對立的顏色對分別為紅- -綠對、黃藍綠對、黃藍對和黑白對,反映了在視覺通路上的響應(yīng),對和黑白對,反映了在視覺通路上的響應(yīng),L L為亮度輸出,為亮度輸出,C C1 1C C2 2為彩色輸出為彩色輸出p式中式中abcabc為常數(shù)為常數(shù)*1*2*( , )( , )( , )lg( , )( , )( , )( , )lg( , )( , )( , )( , ) lg ( , )lg ( , )lg ( , ) R x yCa R x yG x yaG x yR x yCb R x yB
35、 x ybB x yLc aR x yG x yB x yc aR x yG x yB x y北京信息科技大學(xué)北京信息科技大學(xué)p三基色原理三基色原理u自然界的絕大多數(shù)彩色都自然界的絕大多數(shù)彩色都可以由三種不同的基色按不可以由三種不同的基色按不同的比例相加混和得到,合同的比例相加混和得到,合成彩色的亮度是這三個基色成彩色的亮度是這三個基色的亮度之和,色度(色調(diào)和的亮度之和,色度(色調(diào)和飽和度)則由三個基色分量飽和度)則由三個基色分量的比例決定的比例決定u基本要求:三種基色必須基本要求:三種基色必須是彼此獨立的是彼此獨立的北京信息科技大學(xué)p人類視覺系統(tǒng)對不同彩色的感覺具有相加人類視覺系統(tǒng)對不同彩色
36、的感覺具有相加混色的能力,并產(chǎn)生一種合成的彩色感覺混色的能力,并產(chǎn)生一種合成的彩色感覺u時間混色法:時間混色法:按一定順序輪流將三種基色投射到同一平面上按一定順序輪流將三種基色投射到同一平面上原理:人眼的視覺惰性和相加混色功能原理:人眼的視覺惰性和相加混色功能應(yīng)用:場順序制彩色電視應(yīng)用:場順序制彩色電視u空間混色法空間混色法u生理混色法生理混色法u全反射混色法全反射混色法北京信息科技大學(xué)p空間混色法空間混色法u將三種基色光同時分別投射到同一表面上的相將三種基色光同時分別投射到同一表面上的相鄰鄰3 3點,點,3 3點相距足夠近點相距足夠近u原理:人眼的分辨力有限和相加混色功能原理:人眼的分辨力有
37、限和相加混色功能u應(yīng)用:彩色顯像管應(yīng)用:彩色顯像管p生理混色法生理混色法p全反射混色法全反射混色法北京信息科技大學(xué)p生理混色法生理混色法u若左右兩眼分別觀察不同的顏色,則人眼感覺若左右兩眼分別觀察不同的顏色,則人眼感覺到的彩色不是兩種單色光,而是這兩種顏色的到的彩色不是兩種單色光,而是這兩種顏色的混合色混合色u應(yīng)用:立體彩色電視機應(yīng)用:立體彩色電視機p全反射混色法全反射混色法u將三種基色光以不同比例同時投射到一塊反射將三種基色光以不同比例同時投射到一塊反射表面,三種基色光產(chǎn)生全反射而相加混色形成表面,三種基色光產(chǎn)生全反射而相加混色形成混合色混合色u應(yīng)用:投影電視(包括背投)應(yīng)用:投影電視(包括
38、背投)北京信息科技大學(xué)北京信息科技大學(xué)p色度學(xué)u是研究彩色視覺(心理量)和光譜特性是研究彩色視覺(心理量)和光譜特性(物理量)的學(xué)科(物理量)的學(xué)科u包括:包括:CIE-RGBCIE-RGB彩色模型彩色模型XYZXYZ彩色模型彩色模型北京信息科技大學(xué)pCIE-RGBCIE-RGB彩色模型彩色模型北京信息科技大學(xué)pXYZXYZ彩色模型彩色模型北京信息科技大學(xué)pRGBRGB彩色顯示模型彩色顯示模型pCMYKCMYK彩色顯示模型彩色顯示模型北京信息科技大學(xué)pRGBRGB彩色顯示模型彩色顯示模型NTSC:Y= 0.299R + 0.587G + 0.114BPAL:Y= 0.222R + 0.707G
39、 + 0.071BRCIE 1.167 -0.146 -0.151 RGCIE = 0.144 0.753 0.159 GBCIE -0.007 0.059 1.128 BX 0.607 0.174 0.201 RY = 0.229 0.587 0.114 GZ 0.000 0.066 0.117 B北京信息科技大學(xué)北京信息科技大學(xué)pCMYKCMYK彩色顯示模型彩色顯示模型u采用相減混色法采用相減混色法u青色青色(C)(C)、品紅、品紅(M)(M)、黃、黃(Y)(Y)和黑和黑(K)(K)K=min(R,G,B)C=1-RM=1-GY=1-B北京信息科技大學(xué)北京信息科技大學(xué)2011年秋季北京信息
40、科技大學(xué)p彩色傳輸模型主要有彩色傳輸模型主要有YUVYUV、YIQYIQ和和YCYCb bC Cr r模型模型 與黑白電視兼容,人對亮度敏感度高、對色差敏感度低與黑白電視兼容,人對亮度敏感度高、對色差敏感度低與黑白兼容,信號傳輸?shù)膭討B(tài)范圍要滿足亮度信號要求,別造成幅度失真。RGB空間空間YUV空間空間YUV 0.3 0.59 0.11-0.15 -0.29 0.44 0.61 -0.52 -0.096RGB=PAL:Y- 4.43MHz; U、V-1.3MHzY U V = 8 4 4 or 8 2 2北京信息科技大學(xué)YUV空間空間YIQ空間空間美日美日UVQIF33U = Q cos - I
41、 sinV = Q sin + I cosI = V cos - U sinQ = V sin + U cosNTSC:Q - 0.5MHz分辨紅黃強: V = R-Y分辨藍紫弱: U = B -Y 北京信息科技大學(xué)p反映了人的視覺系統(tǒng)觀察彩色的方式反映了人的視覺系統(tǒng)觀察彩色的方式pH H表示色調(diào)表示色調(diào)(Hue)(Hue),I I表示亮度表示亮度(Inrensity)(Inrensity),I I與彩色與彩色信息無關(guān);信息無關(guān);S S表示飽和度表示飽和度(Saturation)(Saturation),H H和和S S分量與分量與人感受顏色的方式密切相關(guān)人感受顏色的方式密切相關(guān)北京信息科技大
42、學(xué)彩色空間的轉(zhuǎn)換彩色空間的轉(zhuǎn)換RGB空間空間HIS空間空間H (Hue):色調(diào)色調(diào)S (Saturation):色飽和度色飽和度I (Intensity):亮度亮度白白黑黑IISH紅紅黃黃綠綠藍藍紫紫黃黃藍藍 - H (斜斜)更接近人的認識,可簡化處理更接近人的認識,可簡化處理黑白灰度、邊緣處理黑白灰度、邊緣處理 - I北京信息科技大學(xué)p視頻表示p視頻信息和信號的特點p模擬視頻p數(shù)字視頻北京信息科技大學(xué)p圖像分類圖像分類u按灰度等級:二值圖像和多灰度級黑白按灰度等級:二值圖像和多灰度級黑白圖像圖像u按圖像的色調(diào):黑白圖像和彩色圖像按圖像的色調(diào):黑白圖像和彩色圖像u按圖像占空間維數(shù):二維、三維和
43、多維按圖像占空間維數(shù):二維、三維和多維圖像圖像u按圖像內(nèi)容變化性質(zhì):靜止圖像和動態(tài)按圖像內(nèi)容變化性質(zhì):靜止圖像和動態(tài)圖像圖像北京信息科技大學(xué)北京信息科技大學(xué)北京信息科技大學(xué)北京信息科技大學(xué)北京信息科技大學(xué)北京信息科技大學(xué)北京信息科技大學(xué)北京信息科技大學(xué)p存儲容量大,傳輸效率較高存儲容量大,傳輸效率較高 數(shù)字音視頻數(shù)數(shù)字音視頻數(shù)據(jù)量大,在存儲與傳輸?shù)倪^程中必須進行據(jù)量大,在存儲與傳輸?shù)倪^程中必須進行壓縮編碼。音視頻數(shù)字信號經(jīng)過壓縮后,壓縮編碼。音視頻數(shù)字信號經(jīng)過壓縮后,可以在可以在68MHz68MHz的傳輸信道傳輸?shù)膫鬏斝诺纻鬏?424套標(biāo)準(zhǔn)套標(biāo)準(zhǔn)清晰度電視(清晰度電視(SDTVSDTV)節(jié)目或
44、一套高清晰)節(jié)目或一套高清晰度電視(度電視(HDTVHDTV)節(jié)目,而一張壓縮格式)節(jié)目,而一張壓縮格式的的DVDDVD存儲容量可達存儲容量可達7GB7GB8GB8GB。北京信息科技大學(xué)p便于進行編輯加工便于進行編輯加工 傳統(tǒng)磁帶重復(fù)聽傳統(tǒng)磁帶重復(fù)聽某段音樂或觀看某段畫面時需不停地某段音樂或觀看某段畫面時需不停地倒帶、快進,編輯過程也是順序的線倒帶、快進,編輯過程也是順序的線性。數(shù)字音視頻則不同,可以瞬時定性。數(shù)字音視頻則不同,可以瞬時定位,非線性邏輯組織,還可以利用非位,非線性邏輯組織,還可以利用非線性編輯軟件做特效。線性編輯軟件做特效。北京信息科技大學(xué)p信息傳輸存儲的可靠性高信息傳輸存儲的
45、可靠性高 數(shù)字信號不會產(chǎn)生噪數(shù)字信號不會產(chǎn)生噪聲和失真的積累,便于存儲、控制、修改。數(shù)聲和失真的積累,便于存儲、控制、修改。數(shù)字音視頻可以不失真的進行無數(shù)次復(fù)制,而模字音視頻可以不失真的進行無數(shù)次復(fù)制,而模擬音視頻信號每轉(zhuǎn)錄一次,就會有一次誤差積擬音視頻信號每轉(zhuǎn)錄一次,就會有一次誤差積累,產(chǎn)生信號失真。模擬音視頻長時間存放后累,產(chǎn)生信號失真。模擬音視頻長時間存放后質(zhì)量會降低,而數(shù)字音視頻可以長時間的存放質(zhì)量會降低,而數(shù)字音視頻可以長時間的存放而沒有任何失真。而沒有任何失真。北京信息科技大學(xué)p有效保護信息和進行版權(quán)管理有效保護信息和進行版權(quán)管理 數(shù)字音視數(shù)字音視頻可以方便地與密碼及認證技術(shù)相結(jié)合
46、,頻可以方便地與密碼及認證技術(shù)相結(jié)合,便于實現(xiàn)信息加密便于實現(xiàn)信息加密/ /解密以及加擾解密以及加擾/ /解擾,解擾,適用于專業(yè)應(yīng)用(軍用、商用、民用)適用于專業(yè)應(yīng)用(軍用、商用、民用)或條件接收、視頻點播、雙向互動傳送或條件接收、視頻點播、雙向互動傳送等應(yīng)用。等應(yīng)用。北京信息科技大學(xué)p具有可擴展性,便于與其他數(shù)字設(shè)備融合。具有可擴展性,便于與其他數(shù)字設(shè)備融合。數(shù)字音視頻易于與其它系統(tǒng)配合使用,與數(shù)字音視頻易于與其它系統(tǒng)配合使用,與其他數(shù)字設(shè)備融合,在各類通信信道和網(wǎng)其他數(shù)字設(shè)備融合,在各類通信信道和網(wǎng)絡(luò)上進行傳輸。易于集成化和大規(guī)模生產(chǎn),絡(luò)上進行傳輸。易于集成化和大規(guī)模生產(chǎn),其性能一致性好,
47、且成本低。其性能一致性好,且成本低。 北京信息科技大學(xué)圖圖1-1 1-1 數(shù)字音視頻傳輸模型數(shù)字音視頻傳輸模型北京信息科技大學(xué)p信源為語音或視頻信號采集設(shè)備;信源為語音或視頻信號采集設(shè)備;p信源編碼旨在通過對信源的壓縮、加密、擾亂等處理,信源編碼旨在通過對信源的壓縮、加密、擾亂等處理,用最少的編碼傳遞最大的信息量,即提高通信的有效性,用最少的編碼傳遞最大的信息量,即提高通信的有效性,使信號更有效地傳輸和存儲;使信號更有效地傳輸和存儲;p信道編碼主要用于提高可靠性,保證信號在傳輸或存儲信道編碼主要用于提高可靠性,保證信號在傳輸或存儲的過程中盡量不出錯,或出錯后能夠檢錯甚至糾錯;的過程中盡量不出錯
48、,或出錯后能夠檢錯甚至糾錯; p信道可以是有線或無線信道可以是有線或無線p存儲介質(zhì)可以是磁盤、磁帶、光盤等存儲介質(zhì)可以是磁盤、磁帶、光盤等p信宿為音視頻重放設(shè)備信宿為音視頻重放設(shè)備北京信息科技大學(xué)p信息處理信息處理u主要包括信息獲取,信息變換,信息特主要包括信息獲取,信息變換,信息特征的抽取與選擇、分類與識別,信息安征的抽取與選擇、分類與識別,信息安全與授權(quán)等方面的內(nèi)容。全與授權(quán)等方面的內(nèi)容。北京信息科技大學(xué)p信息的數(shù)字化處理信息的數(shù)字化處理uDSPDSP技術(shù)通常是指利用計算機或技術(shù)通常是指利用計算機或/ /和專用和專用處理設(shè)備(或器件),對數(shù)字化的信號進處理設(shè)備(或器件),對數(shù)字化的信號進行
49、采集、濾波、檢測、均衡、變換、調(diào)制、行采集、濾波、檢測、均衡、變換、調(diào)制、壓縮、降噪、估計等處理,以得到更能滿壓縮、降噪、估計等處理,以得到更能滿足人們需要的信號形式。足人們需要的信號形式。u例如,對音視頻信號的降噪處理的目的例如,對音視頻信號的降噪處理的目的是減少原音視頻信號中的噪聲或干擾信息,是減少原音視頻信號中的噪聲或干擾信息,使信號變換成更便于人們識別和理解的形使信號變換成更便于人們識別和理解的形式。式。北京信息科技大學(xué)北京信息科技大學(xué)p是指把語音信號數(shù)字化并在數(shù)字狀態(tài)下進是指把語音信號數(shù)字化并在數(shù)字狀態(tài)下進行記錄、傳輸、重放以及其他加工處理等行記錄、傳輸、重放以及其他加工處理等一整套
50、技術(shù)。一整套技術(shù)。p研究對象是語音信息的獲取、表示、傳輸研究對象是語音信息的獲取、表示、傳輸與處理(編碼、存儲、變換、識別、綜合、與處理(編碼、存儲、變換、識別、綜合、理解)的方法、規(guī)律及其利用。理解)的方法、規(guī)律及其利用。北京信息科技大學(xué)p以物理聲學(xué)、生理聲學(xué)、心理聲學(xué)、以物理聲學(xué)、生理聲學(xué)、心理聲學(xué)、語言學(xué)、語音學(xué)為基礎(chǔ),涉及包括語言學(xué)、語音學(xué)為基礎(chǔ),涉及包括電聲技術(shù)、電子技術(shù)、微電子技術(shù)、電聲技術(shù)、電子技術(shù)、微電子技術(shù)、數(shù)字技術(shù)、計算機控制技術(shù)和精密數(shù)字技術(shù)、計算機控制技術(shù)和精密加工技術(shù)在內(nèi)的多個學(xué)科領(lǐng)域。加工技術(shù)在內(nèi)的多個學(xué)科領(lǐng)域。北京信息科技大學(xué)p在廣播電視與消費類電子產(chǎn)品中的應(yīng)在廣
51、播電視與消費類電子產(chǎn)品中的應(yīng)用用p在多媒體計算機中的應(yīng)用在多媒體計算機中的應(yīng)用北京信息科技大學(xué)圖圖1-3 1-3 廣播電視和視聽消費電子類設(shè)備和產(chǎn)品的數(shù)字化發(fā)展廣播電視和視聽消費電子類設(shè)備和產(chǎn)品的數(shù)字化發(fā)展北京信息科技大學(xué)圖圖1-4 1-4 多媒體計算機系統(tǒng)多媒體計算機系統(tǒng)北京信息科技大學(xué)u(1 1)會議業(yè)務(wù))會議業(yè)務(wù)u(2 2)談話業(yè)務(wù))談話業(yè)務(wù)u(3 3)分配業(yè)務(wù))分配業(yè)務(wù)u(4 4)檢索業(yè)務(wù))檢索業(yè)務(wù)u(5 5)采集業(yè)務(wù))采集業(yè)務(wù)u(6 6)消息業(yè)務(wù))消息業(yè)務(wù)北京信息科技大學(xué)p 多媒體應(yīng)用主要包括以下方面。多媒體應(yīng)用主要包括以下方面。(1 1)辦公自動化。)辦公自動化。(2 2)遠程會議
52、。)遠程會議。(3 3)交互式電視與視頻點播。)交互式電視與視頻點播。(4 4)交互式影院與數(shù)字化電影。)交互式影院與數(shù)字化電影。(5 5)出版。)出版。(6 6)信息查詢。)信息查詢。(7 7)數(shù)字化圖書館。)數(shù)字化圖書館。(8 8)家庭信息中心。)家庭信息中心。(9 9)遠程教育。)遠程教育。(1010)遠程醫(yī)療。)遠程醫(yī)療。(1111)協(xié)同工作。)協(xié)同工作。(1212)媒體空間與賽博空間。)媒體空間與賽博空間。北京信息科技大學(xué)p數(shù)字音視頻技術(shù)領(lǐng)域的總體發(fā)展方向是數(shù)字化、高集成化、數(shù)字音視頻技術(shù)領(lǐng)域的總體發(fā)展方向是數(shù)字化、高集成化、多功能化、智能化和綜合化。多功能化、智能化和綜合化。p數(shù)字
53、音視頻技術(shù)是廣播電視、計算機和通信技術(shù)發(fā)展、融數(shù)字音視頻技術(shù)是廣播電視、計算機和通信技術(shù)發(fā)展、融合、互相滲透的結(jié)果,而今,一種稱為合、互相滲透的結(jié)果,而今,一種稱為“信息電器信息電器(Information ApplianceInformation Appliance,IAIA)”的新理念被列入信息技術(shù)的新理念被列入信息技術(shù)開發(fā)的議程。開發(fā)的議程。p信息電器是指任何能夠幫助我們上網(wǎng)獲取信息、令人愉快信息電器是指任何能夠幫助我們上網(wǎng)獲取信息、令人愉快的裝置,它涵蓋的產(chǎn)品包括機頂盒、的裝置,它涵蓋的產(chǎn)品包括機頂盒、DVDDVD、HDTVHDTV、車載、車載電腦、手持電腦、掌上電腦、無線手機、游戲機
54、、網(wǎng)絡(luò)計電腦、手持電腦、掌上電腦、無線手機、游戲機、網(wǎng)絡(luò)計算機等。算機等。北京信息科技大學(xué)p 目前,國外音視頻技術(shù)領(lǐng)域正在發(fā)展的主要技術(shù)包括如目前,國外音視頻技術(shù)領(lǐng)域正在發(fā)展的主要技術(shù)包括如下幾點。下幾點。u壓縮碼率更高、算法更先進的音視頻數(shù)字信號壓縮編碼、解碼技壓縮碼率更高、算法更先進的音視頻數(shù)字信號壓縮編碼、解碼技術(shù);術(shù);u傳輸效率更高、傳輸質(zhì)量更優(yōu)的數(shù)字信號調(diào)制、解調(diào)技術(shù);傳輸效率更高、傳輸質(zhì)量更優(yōu)的數(shù)字信號調(diào)制、解調(diào)技術(shù);u加快已成熟的數(shù)字音視頻技術(shù)產(chǎn)品的商品化,推廣、普及高清晰加快已成熟的數(shù)字音視頻技術(shù)產(chǎn)品的商品化,推廣、普及高清晰度電視(度電視(HDTVHDTV)技術(shù),通過衛(wèi)星電視
55、直播接收、電纜電視傳輸)技術(shù),通過衛(wèi)星電視直播接收、電纜電視傳輸系統(tǒng)、地面廣播等系統(tǒng)、地面廣播等3 3個途徑實現(xiàn)模擬電視向數(shù)字電視的過渡;個途徑實現(xiàn)模擬電視向數(shù)字電視的過渡;北京信息科技大學(xué)p發(fā)展存儲容量更大的存儲媒體,例如高集成度的發(fā)展存儲容量更大的存儲媒體,例如高集成度的CMOSCMOS半導(dǎo)體存儲器、固體存儲器、藍光技術(shù)的高密度光盤等;半導(dǎo)體存儲器、固體存儲器、藍光技術(shù)的高密度光盤等;p發(fā)展新型顯示器件,提高顯示器件的清晰度、對比度、發(fā)展新型顯示器件,提高顯示器件的清晰度、對比度、亮度,降低成本,提高重顯彩色色域,尋求新型平板顯亮度,降低成本,提高重顯彩色色域,尋求新型平板顯示方式和新型發(fā)
56、光材料,除目前比較成熟的平面型陰極示方式和新型發(fā)光材料,除目前比較成熟的平面型陰極射線管之外,還有等離子顯示屏(射線管之外,還有等離子顯示屏(PDPPDP)、液晶顯示器)、液晶顯示器(LCDLCD)、有機發(fā)光二極管()、有機發(fā)光二極管(OLEDOLED)型顯示器等;)型顯示器等;p(6 6)發(fā)展新型電聲器件和數(shù)字音頻技術(shù),包括微傳聲器,)發(fā)展新型電聲器件和數(shù)字音頻技術(shù),包括微傳聲器,基于傳聲器陣列的語言增強和說話定位技術(shù)、多聲道回基于傳聲器陣列的語言增強和說話定位技術(shù)、多聲道回聲抵消技術(shù)等。聲抵消技術(shù)等。北京信息科技大學(xué)(1 1)AVSAVS標(biāo)準(zhǔn)帶動數(shù)字音視頻業(yè)發(fā)展標(biāo)準(zhǔn)帶動數(shù)字音視頻業(yè)發(fā)展(2
57、 2)多媒體處理器成為移動音視頻業(yè))多媒體處理器成為移動音視頻業(yè)競爭的焦點競爭的焦點(3 3)有機發(fā)光二極管()有機發(fā)光二極管(OLEDOLED)顯示)顯示技術(shù)技術(shù)北京信息科技大學(xué)p 填空題填空題 (1) (1) 波長在波長在 _nmnm范圍內(nèi)的電磁波能夠使人眼產(chǎn)范圍內(nèi)的電磁波能夠使人眼產(chǎn)生顏色感覺,生顏色感覺, 稱為稱為 _。 (2) (2) 由不同光譜混合出相同色光的現(xiàn)象叫由不同光譜混合出相同色光的現(xiàn)象叫 _。 (3) (3) 發(fā)光體的顏色由它本身所發(fā)出的發(fā)光體的顏色由它本身所發(fā)出的 _確定。確定。 (4) (4) 不發(fā)光體的顏色與不發(fā)光體的顏色與 _的光譜和不發(fā)光體對的光譜和不發(fā)光體對照射光的照射光的 _、_特性有關(guān)。特性有關(guān)。 北京信息科技大學(xué)(5) (5) 光通量是按人眼的光感覺來度量的輻射功率,光通量是按人眼的光感覺來度量的輻射功率, 用符號用符
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 淺灘海域施工方案
- 辦公室裝修終止合同聲明
- 汽車制造液氮配送合同
- 親子游泳館裝修合同管理費
- 倉儲物流中心改造拆除協(xié)議
- 北城小學(xué)1年級數(shù)學(xué)試卷
- 銀行柜臺施工方案
- 安師大附中初三數(shù)學(xué)試卷
- 鋁掛片吊頂施工方案
- 司機不定時工作制合同范例
- 二零二五年知識產(chǎn)權(quán)共享及收益分成合作協(xié)議3篇
- 北師大版二年級數(shù)學(xué)上冊計算題專項復(fù)習(xí)大全272
- 南通市2025屆高三第一次調(diào)研測試(一模)生物試卷(含答案 )
- 2024年09月2024渤海銀行天津濱海新區(qū)分行校園招聘筆試歷年參考題庫附帶答案詳解
- 期末考試成績分析報告課件
- 兒童哮喘的防治與治療
- 人教版PEP版小學(xué)英語三年級下冊Unit 4 Healthy food Part A課件
- 學(xué)校安全教師培訓(xùn)
- 2024年陜西省中考道德與法治真題(A卷)(原卷版)
- (2024)湖北省公務(wù)員考試《行測》真題及答案解析
- 金融警示教育案例
評論
0/150
提交評論