版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第4章多媒體信息處理技術(shù)及標(biāo)準(zhǔn)
4.1多媒體信息4.2語(yǔ)音壓縮及編碼技術(shù)4.3視頻壓縮及編碼技術(shù)
4.1多媒體信息
4.1.1信息與媒體
1.信息的概念
英文信息(Information)一詞的含義是情報(bào)、資料、消息、報(bào)導(dǎo)、知識(shí)等。長(zhǎng)期以來(lái)人們就把信息看做是消息的同義語(yǔ),簡(jiǎn)單地把信息定義為能夠帶來(lái)新內(nèi)容、新知識(shí)的消息。目前關(guān)于信息大致的說(shuō)法有:
(1)信息是用語(yǔ)言、文字、數(shù)字、符號(hào)、圖像、聲音、情景、表情、狀態(tài)等方式傳遞的內(nèi)容。
(2)1948年,信息論的奠基人之一香農(nóng)(Shanon,美國(guó)數(shù)學(xué)家)第一個(gè)以信息公式的方式定義“信息是熵的減少”,這里用到的“熵”是不確定性的度量。香農(nóng)的信息定義實(shí)際上是說(shuō),信息是“用來(lái)消除不確定性的東西”。
(3)控制論的奠基人維納(Wiener)在1948年指出:“信息就是信息,不是物質(zhì),也不是能量”,專(zhuān)門(mén)指出了信息是區(qū)別于物質(zhì)與能量的第三類(lèi)資源。
(4)根據(jù)信息與通信的關(guān)系,信息可分為技術(shù)信息(物質(zhì)屬性的反映,例如事物運(yùn)動(dòng)的狀態(tài)與方式等)、語(yǔ)義信息(人們適應(yīng)外部世界,并同外部進(jìn)行內(nèi)容交換的標(biāo)記,例如各種知識(shí)與技能等)和價(jià)值信息(具有價(jià)值性、有效性、經(jīng)濟(jì)性及其他特性的知識(shí))。
信息的定義很多,但信息關(guān)心的是內(nèi)容。從此觀點(diǎn)出發(fā),信息是通過(guò)交流得到的關(guān)于特定事物的知識(shí)。信息的獲得是通過(guò)人類(lèi)感知系統(tǒng)的活動(dòng)來(lái)完成的,其中視覺(jué)是感知信息(主要對(duì)文字、圖畫(huà)和視頻圖像)的重要途徑,視覺(jué)所感知到的信息約占人類(lèi)從外部世界獲取信息總量的80%;聽(tīng)覺(jué)是感知信息(主要對(duì)聲音)的次要途徑,其所感知到的信息約占人類(lèi)從外部世界獲取信息總量的10%;另外,嗅覺(jué)、味覺(jué)和觸覺(jué)所感知到的信息共約占10%。
2.媒體的概念
媒體(Media)是信息表示、傳輸、存儲(chǔ)的形式載體。常見(jiàn)的表示媒體有文字、圖畫(huà)、語(yǔ)言、音樂(lè)、動(dòng)畫(huà)和視頻圖像等;傳輸媒體有電話(huà)線、同軸電纜、光纖、電磁波、宇宙射線、空氣等;存儲(chǔ)媒體有碑石、石窟、紙張、磁帶、磁盤(pán)、光盤(pán)、半導(dǎo)體存儲(chǔ)器等。
3.信息與媒體的關(guān)系
信息與媒體是內(nèi)容與形式的關(guān)系,二者有著緊密的聯(lián)系。自然界的聲音、圖像以及經(jīng)過(guò)人腦加工處理后形成的語(yǔ)言文字等構(gòu)成了多媒體信息。也就是說(shuō),多媒體信息包含了信息和信息的表示形式。而一般意義上的媒體則指信息傳輸、存儲(chǔ)的形式載體。4.1.2文字與數(shù)據(jù)
文字(Text)是最基本的多媒體信息,也稱(chēng)為字元。文字的有序排列和組合形成字(Word)和數(shù)據(jù)(Data)。文字用二進(jìn)制編碼表示,不同的二進(jìn)制編碼代表不同的文字。
西文文字采用ASCII碼表示。ASCII碼是美國(guó)信息交換標(biāo)準(zhǔn)代碼(AmericanStandardCodeforInformationInterchange)的簡(jiǎn)稱(chēng),由美國(guó)國(guó)會(huì)圖書(shū)館交換代碼(LibraryofCongress,LC)發(fā)展而來(lái),其后演變成ISO646國(guó)際標(biāo)準(zhǔn)。依ASCII和ISO646的規(guī)定,ASCII碼包括大小寫(xiě)英文字母、標(biāo)點(diǎn)符號(hào)和阿拉伯?dāng)?shù)字。ASCII碼是信息交換的基礎(chǔ),故稱(chēng)為網(wǎng)絡(luò)的奠基標(biāo)準(zhǔn),至今仍被廣泛應(yīng)用。
ASCII碼簡(jiǎn)單,字母、數(shù)學(xué)符號(hào)、控制字符共128個(gè),采用7位二進(jìn)制編碼方式表示。ASCII碼的缺點(diǎn)是明顯的,它無(wú)法滿(mǎn)足世界多種民族語(yǔ)言文字的交換要求。
漢字?jǐn)?shù)目較多,常用的漢字就有3000多個(gè),因此漢字編碼必須采用多于7位的二進(jìn)制編碼方案。例如二級(jí)漢字編碼,國(guó)家標(biāo)準(zhǔn)GB2312-80規(guī)定,采用2×7個(gè)二進(jìn)制位表示一個(gè)漢字,共可表示6763個(gè)漢字和850個(gè)符號(hào)。為容納世界上多種語(yǔ)言的字元和符號(hào),ISO-WG2工作組制定了UCS(ISO/IEC-10646)標(biāo)準(zhǔn)。該標(biāo)準(zhǔn)規(guī)定采用16位(雙8位)編碼,具有65563個(gè)編碼空間,可以容納漢字、日文、韓文、希臘文、阿拉伯文、希伯萊文、中歐文字、德語(yǔ)、俄語(yǔ)等。同時(shí)為了配合8、16、32和64位運(yùn)算處理器,該標(biāo)準(zhǔn)規(guī)定字元碼長(zhǎng)度為定長(zhǎng)的4個(gè)8位元(Octet)。
另一種由美國(guó)Xerox、JoeBecker等公司提出的Unicode標(biāo)準(zhǔn),將字元編碼的基本單位由7或8個(gè)位元直接擴(kuò)充為16個(gè)位元。這一結(jié)構(gòu)后被ISO-WG2工作組采納,同時(shí)將Unicode標(biāo)準(zhǔn)融入ISO/IEC-10646標(biāo)準(zhǔn)。4.1.3聲音與MIDI
音頻信息有兩類(lèi):獲取的聲音和合成的聲音。
1.聲音
聲音也稱(chēng)聲波或音頻。聲音的屬性包括響度、音調(diào)和音色。響度指聲音的大小,通常用聲壓級(jí)(SPL)或聽(tīng)力級(jí)(HL)表示;音調(diào)指聲音的高低,對(duì)應(yīng)聲音的頻率;音色指聲音的諧波特性。
音頻(Audio)是指人耳可聞的聲音信息,頻率一般在20Hz~20kHz范圍內(nèi)。語(yǔ)音(Voice)是指人們正常講話(huà)時(shí)發(fā)出的聲音,頻率范圍為100Hz~7kHz。語(yǔ)音可以看做是音頻的一段,具有較窄的頻率范圍。正確理解二者的區(qū)別,對(duì)于多媒體系統(tǒng)的硬件及軟件設(shè)計(jì)具有重要的意義。對(duì)應(yīng)于不同的系統(tǒng)應(yīng)用,音頻的含義是不一樣的。電話(huà)系統(tǒng)語(yǔ)音的頻率范圍為200Hz~3.4kHz,調(diào)幅廣播的音頻頻率范圍為50Hz~7kHz,調(diào)頻廣播的音頻頻率范圍為20Hz~15kHz,高保真立體調(diào)頻廣播的音頻頻率范圍為20Hz~20kHz。
多媒體音頻信號(hào)一般指經(jīng)過(guò)采樣(Sampling)和量化后的數(shù)字化聲音。采樣有時(shí)也稱(chēng)取樣。采樣的目的是去掉模擬音頻信號(hào)的時(shí)間相關(guān)性。常用的采樣頻率有8kHz(主要用于語(yǔ)音通信系統(tǒng))、11.025kHz、22.05kHz、44.1kHz(主要用于CD級(jí)音質(zhì)的編碼系統(tǒng))。量化是指把不同的采樣值(某一時(shí)刻音頻信號(hào)的幅度)用不同的二進(jìn)制碼表示。二進(jìn)制碼位數(shù)越多,分辨率就越高。國(guó)際標(biāo)準(zhǔn)的語(yǔ)音編碼采用8位(8bit,即256個(gè)等級(jí))量化。
音頻文件的大小可按下列公式計(jì)算:
其中:S表示文件的大小,以字節(jié)B(Byte)為單位;T為采樣時(shí)間,以s為單位;D為采樣頻率,以kHz為單位;N為聲道數(shù)目,單聲道(Mono)取值為1,立體聲(Stereo)取值為2;R為二進(jìn)制量化等級(jí),通常為8或16bit。對(duì)于8kHz采樣、8bit量化的電話(huà)系統(tǒng),10s的語(yǔ)音文件大小為80kB;對(duì)于44.1kHz采樣、8bit量化的立體聲系統(tǒng),10s的音頻文件大小為441kB。可見(jiàn),通過(guò)采樣直接獲取的音頻文件需要很大的存儲(chǔ)空間。為了對(duì)音頻文件進(jìn)行處理,必須解決音頻信號(hào)的數(shù)據(jù)壓縮問(wèn)題。
2.常見(jiàn)音頻文件格式
1)Wave文件(后綴為.wav)
Wave格式是Microsoft公司開(kāi)發(fā)的一種聲音文件格式,它符合RIFF(ResourceInterchangeFileFormat)文件規(guī)范,用于保存Windows平臺(tái)的音頻信息資源,被Windows平臺(tái)及其應(yīng)用程序所廣泛支持。Wave格式支持MSADPCM、CCITTALaw、CCITTμLaw和其它壓縮算法,支持多種音頻位數(shù)、采樣頻率和聲道,是PC機(jī)上最為流行的聲音文件格式,但其文件尺寸較大,多用于存儲(chǔ)簡(jiǎn)短的聲音片斷。
2)AIFF文件(后綴為.aif/.aiff)
AIFF是音頻交換文件格式(AudioInterchangeFileFormat)的英文縮寫(xiě),是蘋(píng)果計(jì)算機(jī)公司開(kāi)發(fā)的一種聲音文件格式,被Macintosh平臺(tái)及其應(yīng)用程序所支持。NetscapeNavigator瀏覽器中的LiveAudio也支持AIFF格式,SGI及其它專(zhuān)業(yè)音頻軟件包也同樣支持這種格式。AIFF支持ACE-2、ACE-8、MAC-3和MAC-6壓縮,支持16位44.1kHz立體聲。
3)Audio文件(后綴為.au)
Audio文件是SunMicrosystems公司推出的一種經(jīng)過(guò)壓縮的數(shù)字聲音格式,是Internet中常用的聲音文件格式。NetscapeNavigator瀏覽器中的LiveAudio也支持Audio格式的聲音文件。
4)Sound文件(后綴為.snd)
Sound文件是NeXTComputer公司推出的數(shù)字聲音文件格式,支持壓縮。
5)Voice文件(后綴為.voc)
Voice文件是CreativeLabs開(kāi)發(fā)的聲音文件格式,多用于保存CreativeSoundBlaster系列聲卡所采集的聲音數(shù)據(jù),被Windows平臺(tái)和DOS平臺(tái)所支持,支持CCITTALaw和CCITTμLaw等壓縮算法。
6)MPEG音頻文件(后綴為.mp1/.mp2/.mp3)
MPEG是運(yùn)動(dòng)圖像專(zhuān)家組(MovingPictureExpertsGroup)的英文縮寫(xiě),代表MPEG運(yùn)動(dòng)圖像壓縮標(biāo)準(zhǔn)。這里的音頻文件格式指的是MPEG標(biāo)準(zhǔn)中的音頻部分,即MPEG音頻層(MPEGAudioLayer)。MPEG音頻文件的壓縮是一種有損壓縮,根據(jù)壓縮質(zhì)量和編碼復(fù)雜程度的不同可分為三層(MPEGAudioLayer1/2/3),分別對(duì)應(yīng)MP1、MP2和MP3這三種聲音文件。MPEG音頻編碼具有很高的壓縮率。MP1和MP2的壓縮率分別為4∶1和6∶1~8∶1,而MP3的壓縮率則高達(dá)10∶1~12∶1。也就是說(shuō),一分鐘CD音質(zhì)的音樂(lè),未經(jīng)壓縮需要10MB存儲(chǔ)空間,而經(jīng)過(guò)MP3壓縮編碼后只需1MB左右,同時(shí)其音質(zhì)基本保持不失真,因此,MP3文件格式目前使用的最多。
7)RealAudio文件(后綴為.ra/.rm/.ram)
RealAudio文件是RealNetworks公司開(kāi)發(fā)的一種新型流式音頻(StreamingAudio)文件格式,它包含在RealNetworks公司所制定的音頻、視頻壓縮規(guī)范RealMedia中,主要用于在低速率的廣域網(wǎng)上實(shí)時(shí)傳輸音頻信息。采用這種文件格式,網(wǎng)絡(luò)連接速率不同,客戶(hù)端所獲得的聲音質(zhì)量也不盡相同:對(duì)于14.4kb/s的網(wǎng)絡(luò)連接,可獲得調(diào)幅質(zhì)量的音質(zhì);對(duì)于28.8kb/s的連接,可以達(dá)到廣播級(jí)的聲音質(zhì)量;如果擁有ISDN或更快的線路連接,則可獲得CD音質(zhì)的聲音。
3.合成聲音
1)MIDI(樂(lè)器數(shù)字接口)
合成音樂(lè)與MIDI(MusicalInstrumentDigitalInterface)緊密相關(guān),已形成標(biāo)準(zhǔn);合成語(yǔ)言目前處在研究階段,還未形成實(shí)用化標(biāo)準(zhǔn)。
MIDI是20世紀(jì)80年代初提出的數(shù)字音樂(lè)/電子合成樂(lè)器的統(tǒng)一國(guó)際標(biāo)準(zhǔn)。它定義了計(jì)算機(jī)音樂(lè)程序、合成器及其它電子設(shè)備交換音樂(lè)信號(hào)的方式,還規(guī)定了不同廠家的電子樂(lè)器與計(jì)算機(jī)連接的電纜和硬件及設(shè)備間數(shù)據(jù)傳輸?shù)膮f(xié)議,可用于為不同樂(lè)器創(chuàng)建數(shù)字聲音,可以模擬大提琴、小提琴、鋼琴等常見(jiàn)樂(lè)器的聲音。
2)MIDI文件(后綴為.mid/.rmi)
MIDI并不是數(shù)字化的聲音,MIDI信息實(shí)際上是一段音樂(lè)的數(shù)字形式描述。在MIDI文件中,只包含產(chǎn)生某種聲音的指令,這些指令包括使用什么MIDI設(shè)備的音色、聲音的強(qiáng)弱、聲音持續(xù)的時(shí)間等,計(jì)算機(jī)將這些指令發(fā)送給聲卡,聲卡按照指令將聲音合成出來(lái)。MIDI聲音在重放時(shí)可以有不同的效果,這取決于音樂(lè)合成器的質(zhì)量。相對(duì)于保存真實(shí)采樣數(shù)據(jù)的聲音文件,MIDI文件顯得更加緊湊,其文件尺寸通常比聲音文件小得多。
3)模塊文件(后綴為.mod/.s3m/.xm/.mtm/.far/.kar/.it)
模塊(Module)格式是一種已經(jīng)存在了很長(zhǎng)時(shí)間的聲音記錄方式,它同時(shí)具有MIDI與數(shù)字音頻的共同特性。模塊文件中既包括如何演奏樂(lè)器的指令,又保存了數(shù)字聲音信號(hào)的采樣數(shù)據(jù),因此,其聲音回放質(zhì)量對(duì)音頻硬件的依賴(lài)性較小,也就是說(shuō),在不同的機(jī)器上可以獲得基本相似的聲音回放質(zhì)量。模塊文件根據(jù)不同的編碼方法有MOD、S3M、XM、MTM、FAR、KAR、IT等多種不同格式。
4.獲取聲音與MIDI的比較
獲取聲音是聲音的實(shí)際表示,包含了聲音的瞬時(shí)特性,與設(shè)備無(wú)關(guān),每次播放時(shí)具有較好的一致性;其缺點(diǎn)是文件數(shù)據(jù)量大,需要較大的存儲(chǔ)空間。
MIDI文件與設(shè)備有關(guān),與獲取聲音相比,其優(yōu)點(diǎn)為:
(1)文件緊湊,所占空間小,其文件大小與回放質(zhì)量完全無(wú)關(guān)。通常情況下,MIDI文件比CD質(zhì)量級(jí)的獲取聲音文件小200到1000倍。
(2)在某些情況下,如果所用的MIDI聲源較好,MIDI有可能發(fā)出比獲取聲音更好的質(zhì)量。
(3)在不需要改變音調(diào)或降低音質(zhì)的情況下,可以改變MIDI文件的長(zhǎng)度(通過(guò)改變其速度)。
(4)MIDI數(shù)據(jù)是完全可編輯的,我們可以用多種方法來(lái)處理它的每一個(gè)細(xì)節(jié)。
MIDI文件的缺點(diǎn)是:
(1)因MIDI文件并不是聲音,故僅當(dāng)MIDI回放設(shè)備與產(chǎn)生時(shí)所指定的設(shè)備相同時(shí),回放的結(jié)果才是精確的。
(2)MIDI目前還不能很容易地用來(lái)回放語(yǔ)音對(duì)話(huà)。在視頻會(huì)議系統(tǒng)中,音頻一般為獲取的聲音,且以語(yǔ)音對(duì)話(huà)為主,較少使用MIDI。4.1.4圖像與圖形
圖像(Image)是可視的多媒體信息。在使用圖像這一概念時(shí),一般指靜態(tài)圖像(StillImage)。根據(jù)圖像產(chǎn)生和表示的方式不同,圖像可分為位圖(Bitmap)和矢量畫(huà)(Vector-drawn)。位圖和矢量畫(huà)是計(jì)算機(jī)圖像顯示的主要方式。單獨(dú)使用圖像這一概念時(shí),我們更多側(cè)重于計(jì)算機(jī)圖像的含義。另一個(gè)容易混淆的概念是圖形(Graphics)。圖形是指用計(jì)算機(jī)繪圖工具繪制的圖畫(huà)(Picture)。構(gòu)成圖形的要素包括刻畫(huà)形狀的點(diǎn)、線、面、體等幾何要素以及反映物體表面屬性或材質(zhì)的灰度顏色等非幾何要素。圖形一般按各個(gè)成分的參數(shù)形式存儲(chǔ),可以對(duì)各個(gè)成分進(jìn)行移動(dòng)、縮放、旋轉(zhuǎn)和扭曲等變換,可以在繪圖儀上將各個(gè)成分輸出。對(duì)人眼而言,圖形和圖像沒(méi)有區(qū)別。圖形方式是計(jì)算機(jī)顯示的另一種主要方式,在制作Web頁(yè)面時(shí)使用較多。典型的圖形標(biāo)準(zhǔn)有:
CGM——計(jì)算機(jī)圖形元語(yǔ)言;
STEP——工程圖紙?jiān)谟?jì)算機(jī)中的描述;
SPDL——標(biāo)準(zhǔn)頁(yè)面描述語(yǔ)言標(biāo)準(zhǔn)。
1.位圖
位圖用于表示逼真照片或要求精細(xì)的圖像。位圖由點(diǎn)(Dot)組成,點(diǎn)是位圖圖像的最小元素,通常也稱(chēng)為像素(Pixel)。每個(gè)像素可以具有不同的顏色和亮度。
一幅圖像由若干個(gè)像素組成,其位圖文件存放著與該幅圖像每一個(gè)像素相對(duì)應(yīng)的數(shù)字矩陣。矩陣中的每一個(gè)元素就是像素值,它反映所對(duì)應(yīng)的像素的某些特征(顏色編碼或灰度級(jí)),該矩陣就稱(chēng)為該幅圖像的“位圖”。簡(jiǎn)單理解位圖即像素信息矩陣。單色位圖用一維矩陣表示,只有兩種顏色(黑和白),更多的顏色則要用較大的“深度”(彩色),即多位編碼表示,稱(chēng)之為顏色深度,常用的有4位、8位、16位、24位顏色。以24位位圖為例,每個(gè)像素可以有1600多萬(wàn)種顏色。
位圖產(chǎn)生的方法有:
(1)用畫(huà)圖程序獲取。
(2)用屏幕抓圖程序獲取。
(3)用掃描儀、數(shù)碼相機(jī)或通過(guò)數(shù)字化視頻處理設(shè)備獲取。
2.位圖處理和位圖文件的格式
如上所述,位圖適合于表現(xiàn)含有大量細(xì)節(jié)(如明暗變化、復(fù)雜場(chǎng)景和多種顏色等)的畫(huà)面,并可直接、快速地在屏幕上顯示出來(lái)。位圖占用的存儲(chǔ)空間較大,一般需要進(jìn)行數(shù)據(jù)壓縮。位圖圖形的一個(gè)不利條件是它們?cè)诳s放時(shí)清晰度降低并且出現(xiàn)鋸齒,如圖4-1所示;而矢量圖在縮放時(shí)清晰度不降低,如圖4-2所示。圖4-1位圖放大時(shí)會(huì)導(dǎo)致鋸齒圖4-2矢量圖放大時(shí)沒(méi)有鋸齒處理位圖時(shí),輸出圖像的質(zhì)量決定于處理過(guò)程開(kāi)始時(shí)設(shè)置的分辨率的高低。分辨率是一個(gè)籠統(tǒng)的術(shù)語(yǔ),它指一個(gè)圖像文件中包含的細(xì)節(jié)和信息的大小,以及輸入、輸出或顯示設(shè)備能夠產(chǎn)生的細(xì)節(jié)程度。操作位圖時(shí),分辨率既會(huì)影響最后輸出的質(zhì)量,也會(huì)影響文件的大小。處理位圖需要三思而后行,因?yàn)榻o圖像選擇的分辨率通常在整個(gè)過(guò)程中都伴隨著文件。無(wú)論是在一個(gè)300dpi的打印機(jī)上還是在一個(gè)2570dpi的照排設(shè)備上印刷位圖文件,文件總是以創(chuàng)建圖像時(shí)所設(shè)的分辨率大小印刷的,除非打印機(jī)的分辨率低于圖像的分辨率。如果希望最終輸出看起來(lái)和屏幕上顯示的一樣,那么在開(kāi)始工作前,就需要了解圖像的分辨率和不同設(shè)備分辨率之間的關(guān)系。為了便于位圖的存儲(chǔ)和交流,產(chǎn)生了種類(lèi)繁多的文件格式,常見(jiàn)的有BMP(后綴為.bmp/.rle)、GIF(后綴為.gif)、PCX(后綴為.pcx)和TIFF(后綴為.tif)等。
(1)BMP是由微軟及IBM公司聯(lián)合開(kāi)發(fā)Windows平臺(tái)上最常用的圖像文件格式,RLE格式文件可以壓縮的形式存盤(pán)。
(2)GIF格式主要用于在不同平臺(tái)上進(jìn)行圖像交換,文件最大為64MB,顏色數(shù)最多256色,壓縮率為2∶1,多用于網(wǎng)頁(yè)顯示及制作。
(3)PCX將以壓縮編碼的形式存儲(chǔ)圖像文件。
(4)TIFF文件格式廣泛用于高質(zhì)量的圖像文件處理中。TIFF格式文件有壓縮和非壓縮兩大類(lèi),這種格式文件是許多圖像應(yīng)用軟件所支持的主要文件格式之一。
(5)JPEG是由JointPohotgraphicExpertsGroup(聯(lián)合圖像專(zhuān)家組)提出的一個(gè)標(biāo)準(zhǔn),主要用于靜止圖像的壓縮,其最大優(yōu)點(diǎn)是以極小的失真進(jìn)行高壓縮比壓縮,失真度一般都低于10%,但不能進(jìn)行較大的放大操作。
(6)TGA格式大量用于電視廣播。
(7)PCD是由柯達(dá)相片公司開(kāi)發(fā)的光盤(pán)相片格式,文件較大,保存圖像較為逼真。
(8)PSD為AdobePhotoshop圖像格式,這種格式僅在Photoshop中出現(xiàn),為Photoshop所特有,能存儲(chǔ)所有Photoshop文件信息(如通道、圖層、路徑等)和各種色彩模式。它以壓縮文件形式存儲(chǔ),以節(jié)約磁盤(pán)空間,是一種不失真壓縮。在Photoshop處理圖像時(shí)可盡量采用這種存盤(pán)格式。
(9)PCT/PCI格式,此格式大量用于蘋(píng)果系統(tǒng)的圖像應(yīng)用中,對(duì)于有大量相同色彩的文件能進(jìn)行有效的壓縮。
(10)PXR格式主要用于3D動(dòng)畫(huà),只支持灰度圖像及RGB模式。
(11)EPS格式常用于繪圖和排版軟件中。
(12)RAW格式比較原始,它將所有像素以依次記錄的方式存盤(pán),不對(duì)圖像壓縮,占用較大的磁盤(pán)空間。
(13)SCT格式可以記錄圖像間的連續(xù)層次,主要用于印刷系統(tǒng)。處理位圖的軟件非常多,主要的軟件工具有:
(1)Adobe公司的Photoshop,它是專(zhuān)門(mén)的位圖和矢量圖處理工具,歷史悠久,技術(shù)成熟,功能強(qiáng)大,是制作專(zhuān)業(yè)圖片的較好選擇。
(2)Ulead公司的photoImpact。
(3)Macromedia公司的Fireworks,主要用于網(wǎng)頁(yè)制作。
(4)Painshop。
(5)ACDSee。
3.矢量圖
矢量圖像,也稱(chēng)為面向?qū)ο蟮膱D像或繪圖圖像,在數(shù)學(xué)上定義為一系列由線連接的點(diǎn)。矢量文件中的圖形元素稱(chēng)為對(duì)象。每個(gè)對(duì)象都是一個(gè)自成一體的實(shí)體,它具有顏色、形狀、輪廓、大小和屏幕位置等屬性。既然每個(gè)對(duì)象都是一個(gè)自成一體的實(shí)體,就可以在維持它原有清晰度和彎曲度的同時(shí),多次移動(dòng)和改變它的屬性,而不會(huì)影響圖例中的其它對(duì)象。這些特征使基于矢量的程序特別適用于圖例和三維建模,因?yàn)樗鼈兺ǔR竽軇?chuàng)建和操作單個(gè)對(duì)象?;谑噶康睦L圖同分辨率無(wú)關(guān)。這意味著矢量圖可以按最高分辨率顯示到輸出設(shè)備上。矢量圖用一組指令或參數(shù)來(lái)描述其中的各個(gè)成分,易于對(duì)各個(gè)成分進(jìn)行移動(dòng)、縮放、旋轉(zhuǎn)和扭曲等變換。矢量圖適合于描述由多種比較規(guī)則的圖形元素構(gòu)成的圖形,但輸出圖像畫(huà)面時(shí)將轉(zhuǎn)換成位圖形式。
矢量圖形文件格式有IGS、DXF、WMF等。
(1)DXF是由AutoDesk公司開(kāi)發(fā)的,作為AutoCAD中的ASCII繪圖交換文件,現(xiàn)為許多計(jì)算機(jī)輔助設(shè)計(jì)軟件應(yīng)用。
(2)IGS/IGES/作為CAD圖形的一個(gè)廣泛標(biāo)準(zhǔn),也多用于三維及二維動(dòng)畫(huà)設(shè)計(jì)軟件中。
4.位圖與矢量圖的轉(zhuǎn)換
就簡(jiǎn)單幾何圖形而言,采用矢量圖方式具有較小的數(shù)據(jù)量;對(duì)于復(fù)雜的圖像,用位圖方式可以比用矢量圖對(duì)象作圖得到更快的屏幕刷新速度。
大多數(shù)繪圖程序都提供幾種文件格式來(lái)保存圖像。矢量圖構(gòu)成的畫(huà)圖可以保存為位圖格式文件。位圖變換成矢量圖對(duì)象則相對(duì)困難一些,然而也有許多程序可以計(jì)算位圖圖像的邊界或彩色塊的形狀,然后得出用來(lái)描述該圖像的多邊形對(duì)象,這種處理過(guò)程叫做“自動(dòng)跟蹤”。在一些位圖和矢量圖的創(chuàng)作系統(tǒng)中就集成了這種功能。
5.計(jì)算機(jī)監(jiān)視器
監(jiān)視器是圖像的輸出顯示設(shè)備,了解監(jiān)視器的工作原理和主要特點(diǎn)有助于加深對(duì)圖像屬性的理解。這里只作簡(jiǎn)單的敘述。
依據(jù)色度學(xué)原理和彩色電視原理,我們可知自然界的彩色大部分是復(fù)合色,其所包含的顏色的種類(lèi)很多。人眼對(duì)彩色的分辨能力是有限的。監(jiān)視器采用有限的三種基色(紅、綠、藍(lán))光來(lái)重現(xiàn)自然界的彩色,這種重現(xiàn)是有限的,但同時(shí)也基本滿(mǎn)足人的要求,我們稱(chēng)之為RGB彩色模型。對(duì)于圖像處理軟件,為了適應(yīng)顯示、印刷、打印等不同輸出的需要,一般有多種色彩模式。例如,Photoshop圖像處理軟件中就有位圖、灰度、雙色調(diào)、索引、RGB、Lab、CMYK、多通道等8種色彩模式,它們之間具有某些特定的聯(lián)系,當(dāng)輸出一個(gè)印刷文件或需要對(duì)一個(gè)圖像進(jìn)行特殊處理時(shí),還需要從一個(gè)模式轉(zhuǎn)換到另一個(gè)模式。計(jì)算機(jī)監(jiān)示器總是使用RGB模型顯示顏色,這意味著在非RGB顏色模式(如CMYK)下工作時(shí),Photoshop會(huì)臨時(shí)將數(shù)據(jù)轉(zhuǎn)換成RGB數(shù)據(jù)再在屏幕上顯示。監(jiān)示器最主要的屬性有顏色、分辨率和刷新頻率,通過(guò)調(diào)整顯示適配器設(shè)置可以對(duì)這些屬性進(jìn)行調(diào)整。
顏色代表監(jiān)示器像素點(diǎn)紅色、綠色、藍(lán)色的總量,一般用二進(jìn)制位數(shù)表示,如8位、16位、24位。8位可以表示256種顏色(紅、綠、藍(lán)分別用3位、2位、3位表示),這對(duì)表示彩色圖像來(lái)說(shuō)一般足夠了;16位可以表示32768種顏色(紅、綠、藍(lán)分別用5位表示),具有較好的彩色質(zhì)量;24位可以表示16777216種顏色,一般稱(chēng)為真彩色。顏色設(shè)置要等于或大于欲顯示的圖像顏色種類(lèi)。監(jiān)示器的分辨率包括屏幕分辨率和像素分辨率。屏幕分辨率指屏幕水平方向可顯示的點(diǎn)數(shù)和垂直方向的掃描線數(shù)。我們所說(shuō)的VGA、SVGA、XGA、SXGA顯示標(biāo)準(zhǔn)所對(duì)應(yīng)的分辨率即指屏幕分辨率。像素分辨率指屏幕上紅、綠、藍(lán)三色熒光粉的點(diǎn)數(shù),所以也稱(chēng)為物理分辨率。欲顯示的圖像分辨率小于或等于屏幕分辨率時(shí),才可能完整地顯示。
監(jiān)示器刷新頻率指每秒鐘顯示圖像的幅數(shù)。刷新頻率越高,屏幕上顯示的圖像越穩(wěn)定,但同時(shí)會(huì)占用更多的顯存空間。4.1.5動(dòng)畫(huà)
動(dòng)畫(huà)(Animation)是一系列內(nèi)容相似但又有區(qū)別的圖像,按照一定的速度播放,依靠人的“視覺(jué)暫留”現(xiàn)象,使人產(chǎn)生一種物體在連續(xù)運(yùn)動(dòng)的感覺(jué)的技術(shù)。
動(dòng)畫(huà)由關(guān)鍵幀(Keyframe)和插入幀(Tweening)構(gòu)成。關(guān)鍵幀一般由動(dòng)畫(huà)設(shè)計(jì)師設(shè)計(jì),要能體現(xiàn)動(dòng)作過(guò)程的主要特點(diǎn);插入幀一般由計(jì)算機(jī)根據(jù)一定的算法自動(dòng)產(chǎn)生。
動(dòng)畫(huà)播放速度與圖像幀的數(shù)量有關(guān)。圖像幀數(shù)較少時(shí),播放速度可以快一些;圖像幀數(shù)較多時(shí),播放速度相應(yīng)要慢一些。合適的播放速度才能體現(xiàn)出較好的動(dòng)畫(huà)效果?;脽羝梢哉J(rèn)為是效果很差的動(dòng)畫(huà),而電影則是最好的動(dòng)畫(huà)。4.1.6視頻
1.視頻圖像及產(chǎn)生
視頻圖像是自然界景物通過(guò)人類(lèi)的視覺(jué)在人腦中形成的主觀映像,人眼所感覺(jué)的圖像是時(shí)間和空間的函數(shù)。人的大腦具有對(duì)歷史圖像回放的特性,這種特性建立在對(duì)現(xiàn)實(shí)世界的感知和存儲(chǔ)記憶的基礎(chǔ)之上。然而,人的記憶是有限的,不可能記得很多,也不可能記得太久。從空間上講,人不可能看到離自身很遠(yuǎn)的宏觀世界,也不可能看到極其微小的微觀世界。攝取客觀世界的圖像,并通過(guò)一定的存儲(chǔ)、記錄和傳輸,再由一定的顯示設(shè)備重現(xiàn)所記錄的光像,這種技術(shù)我們稱(chēng)之為電視。它包括圖像的攝取(光電轉(zhuǎn)換)、傳輸(記錄發(fā)送)和顯示(電光轉(zhuǎn)換)這三個(gè)過(guò)程。
2.光的基本特性與人的視覺(jué)特性
視頻圖像是可見(jiàn)的光像,所以研究視頻圖像時(shí)必須了解一下光的特性。
光是一種電磁波,有紅外光、可見(jiàn)光、紫外線等,如圖4-3所示??梢?jiàn)光為電磁波中很窄的一部分,波長(zhǎng)從780~380nm依次為紅、橙、黃、綠、青、藍(lán)、紫。具有單一波長(zhǎng)的光稱(chēng)為單色光。復(fù)合光包含多種波長(zhǎng)的單色光成分,給人以復(fù)合色的感覺(jué)。太陽(yáng)光便是一種給人以白色感覺(jué)的復(fù)合光。光源包括自然光源(日光、月光和星光等)和人工光源(各種照明燈及發(fā)光器件)。色源包括反射光引起的色源(不發(fā)光體的彩色)和發(fā)光體本身的色源。色彩與照明密切相關(guān)。白光是視頻技術(shù)中使用的主要光源,為了對(duì)具有不同光譜特性的白光進(jìn)行比較和色度計(jì)算,經(jīng)常使用色溫這個(gè)概念。當(dāng)絕對(duì)黑體在某一特定溫度下,其輻射光譜與某一光源的光譜具有相同的特性時(shí),則絕對(duì)黑體的這一溫度就定義為該光源的色溫;具有近似特性時(shí),則稱(chēng)為相關(guān)色溫。絕對(duì)黑體(也稱(chēng)全輻射體)是指既不反射也不透射而完全吸收入射輻射的物體。色溫的單位是開(kāi)氏度(K)。色溫不等于發(fā)光體的溫度。例如,鎢絲燈在2800K時(shí)發(fā)出的光,色溫為2854K。圖4-3電磁波譜圖
視頻技術(shù)中常用的標(biāo)準(zhǔn)白光光源有A光源(相關(guān)色溫為2854K)、B光源(相關(guān)色溫為4800K)、C光源(相關(guān)色溫為6770K)、D65光源(相關(guān)色溫為6500K)和E光源(相關(guān)色溫為5500K)。NTSC制式采用C光源,我國(guó)PAL制式采用D65光源,E光源為假想等量白光。目前電視演播室和視頻會(huì)議室多采用新式鹵素鎢燈,色溫為3200K,而顯像管的色溫多為9300K。色溫高的白光給人以偏藍(lán)的感覺(jué),色溫低的白光給人以偏紅的感覺(jué)。視頻圖像是人的主觀感覺(jué),視頻系統(tǒng)應(yīng)當(dāng)精確地模擬人的視覺(jué)特性。人眼對(duì)不同波長(zhǎng)光的敏感程度不同,對(duì)波長(zhǎng)為555nm(黃綠光)最為敏感,其視敏度定義為Km=K(555)。其它任意光的視敏度與它的比值稱(chēng)為相對(duì)視敏函數(shù)V(λ)。
人眼視網(wǎng)膜上具有桿狀和錐狀兩種光敏細(xì)胞。明視覺(jué)過(guò)程主要由錐狀細(xì)胞完成,它既產(chǎn)生明暗感覺(jué),又產(chǎn)生彩色感覺(jué)。在光線很暗時(shí),只有桿狀細(xì)胞起作用,不能分辨顏色。為明確表示某一彩色光,必須采用三個(gè)基本參量:亮度(也稱(chēng)明度)、色調(diào)和飽和度。這三個(gè)量在視覺(jué)中組成一個(gè)統(tǒng)一的總效果,并嚴(yán)格描述了彩色光。亮度是光作用于人眼時(shí)所引起的明亮程度的感覺(jué),色調(diào)反映了顏色的類(lèi)別,飽和度指彩色光所呈現(xiàn)彩色的深淺程度。色調(diào)和飽和度合稱(chēng)色度。人的視覺(jué)范圍(人眼所能感覺(jué)到的亮度范圍)是有限的,并與平均照度有關(guān),人眼的對(duì)比度一般為1000∶1。人的亮度感覺(jué)與景物的亮度的對(duì)數(shù)呈線性關(guān)系(韋勃-費(fèi)赫涅爾定律),同時(shí)還與周?chē)h(huán)境的亮度有關(guān),即與景物的對(duì)比度有關(guān)。人眼的分辨力是有限的,并且和照明強(qiáng)度及景物的相對(duì)對(duì)比度有關(guān)。人眼對(duì)彩色細(xì)節(jié)的分辨力很差,對(duì)色調(diào)的分辨力也很差。當(dāng)飽和度減少時(shí),色調(diào)分辨力將下降;當(dāng)亮度太大或太小時(shí),色調(diào)分辨力也會(huì)下降。人眼對(duì)不同顏色的飽和度分辨力不完全一樣,在黃色區(qū),只能分辨出4級(jí)飽和度;而在紅色和藍(lán)色區(qū),可以分辨25個(gè)等級(jí)的飽和度。
3.三基色原理
根據(jù)人眼彩色視覺(jué)的特性,彩色重現(xiàn)過(guò)程并不需要恢復(fù)原景物輻射光的光譜成分,更重要的是應(yīng)獲得與原景物相同的彩色感覺(jué)。不同波長(zhǎng)的單色光會(huì)引起不同的彩色感覺(jué),但相同的彩色感覺(jué)卻可以來(lái)源于不同的光譜成分的組合,比例決定色度感覺(jué),亮度之和決定亮度感覺(jué),這便是三基色原理的基礎(chǔ)。所謂基色,就是相互獨(dú)立的顏色,也就是說(shuō),其中任一基色都不能由其它兩色混合產(chǎn)生,這樣就能配出較多的彩色,這就是三基色原理的主要內(nèi)容。彩色電視采用相加混色法。將三種基色光按一定順序輪流投射到同一表面上,輪換速度足夠快,利用人的視覺(jué)惰性產(chǎn)生混色的方法稱(chēng)為時(shí)間混色法,它是順序制彩色電視的基礎(chǔ),例如DLP投影顯示器即采用這種混色方法。將三種基色光分別投射到同一表面上臨近的三個(gè)點(diǎn)上,只要這些點(diǎn)相距足夠近,利用人眼分辨率有限的特點(diǎn),就能產(chǎn)生三種基色相混合的彩色感覺(jué),這稱(chēng)為空間混色法,它是同時(shí)制彩色電視的基礎(chǔ)。利用兩只眼睛同時(shí)觀看兩種不同顏色的同一景像,也可以獲得混色效果,這稱(chēng)為生理混色法。常用的三基色計(jì)色方法有RGB制、XYZ制(CIE制)、UCS制和ULCS制。XYZ計(jì)色制應(yīng)用最廣,XYZ制色域圖比RGB制色域圖更容易理解。CIE是國(guó)際照明委員會(huì)的簡(jiǎn)稱(chēng)。
彩色CRT顯像是利用空間混色法來(lái)重現(xiàn)彩色的。它以紅、綠、藍(lán)三種熒光粉作為顯像三基色,而不能直接采用CIE規(guī)定的標(biāo)準(zhǔn)光譜三基色[R]、[G]、[B]。顯像基色選用要在重現(xiàn)色域和重現(xiàn)彩色亮度之間折中考慮。不同制式的彩色電視所選取的顯像三基色并不相同,所用標(biāo)準(zhǔn)白光和色度坐標(biāo)也不相同。PAL制顯像三基色構(gòu)成的重現(xiàn)色域與NTSC制的重現(xiàn)色域大面積重合,PAL制的重現(xiàn)色域略小一些,但PAL制所選三基色熒光粉效率高,所配出的彩色比較鮮艷。需要注意的是,電視系統(tǒng)中定義的飽和度和色度學(xué)中的飽和度不同。色度學(xué)中定義自然界中100%飽和度的色光為單波長(zhǎng)光,它位于CIE色度圖的譜色軌跡上。但在電視系統(tǒng)中,在重現(xiàn)三基色所組成的三角形的三邊上,各點(diǎn)所代表的彩色被稱(chēng)為100%飽和度的彩色,白光坐標(biāo)點(diǎn)所代表的飽和度為零,三角形內(nèi)其它各點(diǎn)彩色的飽和度都是相對(duì)于三邊上的飽和度而言的。在電視及視頻會(huì)議系統(tǒng)中,彩色飽和度均指后者。NTSC制的亮度方程(由顯像三基色配出的任意彩色光的光通量)為
Y=0.299Re+0.587Ge+0.114Be
對(duì)于PAL制,理論亮度方程為
Y=0.222Re+0.707Ge+0.071Be
但是,由于NTSC制彩色電視系統(tǒng)的采用比PAL制早十幾年,所以PAL制并未采用上述理論亮度方程,而沿用了NTSC制的亮度方程。其結(jié)果是,NTSC制的亮度雖然存在誤差,但在主要特性上仍能滿(mǎn)足視覺(jué)對(duì)亮度的要求。視頻圖像的最終顯示是由RGB三基色信號(hào)完成的,而在傳輸和處理過(guò)程中多采用色差和亮度信號(hào)。三基色信號(hào)既含有亮度信號(hào)又含有色度信號(hào),其幅度決定了亮度(亮度方程),相對(duì)比例決定了色度(彩色變換系數(shù))。因此,亮度信號(hào)和色差信號(hào)均可由三基色信號(hào)導(dǎo)出:
Y=0.299R+0.587G+0.114B
R-Y=0.701R-0.587G-0.114B
B-Y=-0.299R-0.587G+0.886B
G-Y=-0.299R+0.413G-0.114B
當(dāng)彩色攝像機(jī)的光譜響應(yīng)曲線(分色曲線)與顯像三基色分布色系數(shù)曲線(混色曲線)相匹配時(shí),就可實(shí)現(xiàn)彩色圖像的正確重現(xiàn)。當(dāng)攝像和顯像制式不同時(shí),應(yīng)采用校色矩陣電路進(jìn)行處理。攝像機(jī)光電轉(zhuǎn)換特性的非線性會(huì)引起圖像的灰度畸變(γ畸變),為消除這種畸變,在傳輸通道中必須設(shè)置γ校正電路。理論上,系統(tǒng)總的傳輸特性經(jīng)校正后應(yīng)為一直線,但實(shí)驗(yàn)證明,當(dāng)系統(tǒng)總的γs=1.28時(shí)效果最好。因此,在近代彩色顯像管的γ約為2.8,攝像管的γ約為1的情況下,通道的γ應(yīng)等于0.45。在圖像處理時(shí),應(yīng)根據(jù)不同的輸出設(shè)備,選擇不同的γ校正系數(shù)。模擬γ校正電路通常由具有非線性特性的二極管構(gòu)成。4.圖像的基本特征參數(shù)表4-1視頻圖像的基本參數(shù)表中所列的參數(shù)大多數(shù)意義明確,比較好理解,在此只介紹容易產(chǎn)生歧義的幾個(gè)參數(shù)。
1)清晰度
(1)系統(tǒng)清晰度。清晰度是主觀感覺(jué)到的圖像細(xì)節(jié)呈現(xiàn)的清晰程度,與系統(tǒng)傳送圖像細(xì)節(jié)的能力有關(guān),通常稱(chēng)為系統(tǒng)的分解力。
垂直分解力(M)指沿垂直方向區(qū)分黑白相間條紋的數(shù)目。其表達(dá)式為
M=K1(1-β)Z
其中:K1<1;β為逆程寬度;Z為掃描行數(shù);(1-β)Z為有效行數(shù)。水平分解力(N)指沿水平方向區(qū)分黑白相間條紋的數(shù)目,其表達(dá)式為
N=KK1(1-β)Z
其中:K為幅型比。
水平分解力大于垂直分解力。視頻傳輸通道的通頻帶應(yīng)適應(yīng)這一水平分解力的要求。水平分解力與垂直分解力二者相當(dāng)時(shí)圖像質(zhì)量最佳。通常我們所說(shuō)的電視清晰度都是指垂直清晰度。
(2)顯示器分辨率。顯示器分辨率通常用熒光粉的點(diǎn)距(DotPitch)或節(jié)距表示。點(diǎn)距是顯示器上兩個(gè)相鄰發(fā)光點(diǎn)中心到中心之間的水平距離。點(diǎn)距越小,代表屏幕上可以容納更多構(gòu)成影像的點(diǎn),也代表著清晰度越高。顯示器分辨率是圖像顯示系統(tǒng)清晰度的物理上限,故又稱(chēng)物理清晰度或基本分辨率(也叫固有分辨率)。
(3)圖像信號(hào)清晰度。對(duì)于模擬視頻圖像信號(hào),采用電視線的概念來(lái)描述其清晰度。對(duì)于數(shù)字視頻圖像信號(hào),圖像信號(hào)清晰度采用與計(jì)算機(jī)監(jiān)視器中相同的描述方法(像素)來(lái)表示。圖像信號(hào)清晰度又稱(chēng)原始分辨率。常用的數(shù)字視頻圖像的基本參量見(jiàn)表4-2。
(4)視頻帶寬與圖像信號(hào)清晰度的關(guān)系。圖像信號(hào)清晰度與視頻信號(hào)帶寬有關(guān)。視頻帶寬越高,代表畫(huà)面的品質(zhì)越好,也代表解像度越高。在PAL或NTSC制式狀態(tài)下,通常1MHz視頻頻寬可以換算為大約80線水平解像度。彩色電視測(cè)試圖卡包含5組清晰度測(cè)試用黑白條紋信號(hào),如表4-3所示。表4-3清晰度測(cè)試用黑白條紋
(5)支持顯示分辨率。支持顯示分辨率指通過(guò)視頻處理電路采取重新計(jì)算或抽行方式,將高于基本分辨率格式的圖像降頻顯示到屏幕上。如屏幕基本分辨率為1024×768,通過(guò)圖形處理電路,可支持分辨率為1600×1200的圖像顯示。但是,實(shí)際清晰度只有1024×768,和真正的1600×1200基本分辨率顯示屏畫(huà)質(zhì)是有差距的。
2)對(duì)比度
對(duì)比度反映圖像的亮度層次。亮度層次也稱(chēng)黑白層次、圖像亮度梯度級(jí)數(shù)或灰度等級(jí)。圖像一般由許多亮度不同的像素組成,如果從圖像中最亮部分到最暗部分之間能分辨的亮度層次越多,則圖像越清晰和逼真。
圖像對(duì)比度定義為最大亮度與最小亮度的比值,即實(shí)際上在提出圖像對(duì)比度要求時(shí),應(yīng)考慮到人眼黑白分辨率有限的特點(diǎn),過(guò)高的對(duì)比度要求有時(shí)并不能產(chǎn)生希望的效果。人眼所能分辨的亮度層次與圖像對(duì)比度的對(duì)數(shù)成正比,并受圖像最大對(duì)比度的限制,也受觀看環(huán)境亮度的影響。當(dāng)系統(tǒng)非線性系數(shù)大于1時(shí),圖像對(duì)比度隨亮度的增加而增大;當(dāng)系統(tǒng)非線性系數(shù)小于1時(shí),圖像對(duì)比度隨亮度的增加反而減小。人眼可分辨的亮度層次級(jí)數(shù)表達(dá)式為:
其中:ξ為費(fèi)赫涅爾系數(shù),又稱(chēng)人眼的對(duì)比度靈敏度閾值(最小可區(qū)分亮度梯度與平均亮度的比值),一般取值為0.005~0.02。
3)幾個(gè)常用的光學(xué)量
有幾個(gè)光學(xué)量,它們與圖像亮度密切相關(guān),故在此略作敘述。
(1)光通量(Φ)。
定義:光通量是光源在單位時(shí)間內(nèi)發(fā)出的經(jīng)過(guò)人眼視覺(jué)加權(quán)后的光能量。
單位:流明(lm),光瓦(W),1光瓦=680流明。
表達(dá)式:
(2)發(fā)光強(qiáng)度(L)。
定義:點(diǎn)光源在單位立體角內(nèi)輻射的光通量。
單位:坎德拉(cd)。
表達(dá)式:
(3)亮度(B)。
定義:發(fā)光面在某一給定方向上的發(fā)光強(qiáng)度與該發(fā)光面的面積在此方向上的投影之比。
單位:尼特(nt),英尺朗伯(ft.lm),英尺燭光(ft.cd),熙提(stilb),亞熙提。
(4)照度(I)。定義:單位面積上接受的光通量。單位:勒克司(lux)。表達(dá)式:
5.標(biāo)準(zhǔn)彩條信號(hào)
標(biāo)準(zhǔn)彩條信號(hào)是一種測(cè)試信號(hào),在會(huì)議電視系統(tǒng)中可用來(lái)對(duì)視頻編解碼器、傳輸系統(tǒng)和顯示輸出設(shè)備特性進(jìn)行測(cè)試和調(diào)整。標(biāo)準(zhǔn)彩條信號(hào)可由彩條信號(hào)發(fā)生器產(chǎn)生,也可由嵌入式CPU運(yùn)行相應(yīng)的應(yīng)用程序產(chǎn)生。
標(biāo)準(zhǔn)彩條信號(hào)為8條等寬的豎條,顏色自左至右依次為白、黃、青、綠、品、紅、藍(lán)、黑。白條對(duì)應(yīng)的電平定為1.0,黑條對(duì)應(yīng)的電平定為0,構(gòu)成彩條的三基色信號(hào)電平非1即0,此時(shí)稱(chēng)為100%飽和度、100%幅度彩條信號(hào)。常用的標(biāo)準(zhǔn)彩條信號(hào)有100-0-100-0彩條、100-0-75-0彩條、100-0-100-25彩條。我國(guó)采用100-0-75-0彩條,也稱(chēng)EBU(歐洲廣播聯(lián)盟)彩條。第一位和第二位數(shù)字表示組成無(wú)色條所對(duì)應(yīng)的R、G、B的最大值和最小值;第三位和第四位數(shù)字表示組成有色條所對(duì)應(yīng)的R、G、B的最大值和最小值。4數(shù)碼命名的彩條中,各信號(hào)均指經(jīng)γ校正后的信號(hào)。
標(biāo)準(zhǔn)彩條信號(hào)數(shù)據(jù)和信號(hào)波形可參見(jiàn)相應(yīng)的標(biāo)準(zhǔn)。
6.模擬廣播電視視頻三大標(biāo)準(zhǔn)
現(xiàn)有的彩色電視標(biāo)準(zhǔn)稱(chēng)為兼容制標(biāo)準(zhǔn),即兼容黑白制電視標(biāo)準(zhǔn)。根據(jù)對(duì)彩色信號(hào)處理方式的不同,模擬廣播電視主要有NTSC、PAL和SECAM三大標(biāo)準(zhǔn)。不同標(biāo)準(zhǔn)制式的模擬廣播電視信號(hào)之間的模擬轉(zhuǎn)換幾乎是不可能的。
彩色電視信號(hào)為了能與黑白電視兼容,總是把R、G、B三基色信號(hào)組合為亮度信號(hào)Y和兩個(gè)色差信號(hào)C1和C2。色差是指基色信號(hào)中的R、G、B三個(gè)分量信號(hào)與亮度信號(hào)Y之差,色差C1和C2的含義與具體的應(yīng)用有關(guān)。兼容制的特點(diǎn)是亮度信號(hào)和色差信號(hào)同頻帶傳輸,同時(shí)色度信號(hào)的帶寬相對(duì)較窄。為了減少亮色信號(hào)間的干擾,色度信號(hào)一般采用平衡調(diào)幅,并精確選擇彩色副載波頻率,實(shí)現(xiàn)亮度信號(hào)和色度信號(hào)的頻譜交錯(cuò)。在PAL彩色電視制式中,C1、C2分別表示U、V兩個(gè)色差信號(hào),故PAL制又稱(chēng)YUV系統(tǒng)。U、V分別表示經(jīng)過(guò)幅度壓縮的藍(lán)色差(B-Y)和紅色差(R-Y)信號(hào)(壓縮的目的是將亮色復(fù)合信號(hào)電平的最大擺動(dòng)范圍限制在-0.33和+1.33之間,從而避免視頻信號(hào)對(duì)圖像載波調(diào)幅時(shí)引起嚴(yán)重的過(guò)調(diào)制):
U=0.493(B-Y)
V=0.877(R-Y)
YUV與RGB彩色空間的變換關(guān)系為
在NTSC彩色電視制式中,C1、C2分別表示Q、I(壓縮色差)兩個(gè)色差信號(hào),故NTSC制又稱(chēng)YQI系統(tǒng)。Q、I分別表示經(jīng)過(guò)頻域帶寬壓縮的U、V信號(hào)。壓縮的目的是為了適應(yīng)NTSC制4.2MHz視頻帶寬的要求,減少串色。人眼不敏感的Q信號(hào)帶寬為0.5MHz,人眼敏感的I信號(hào)帶寬為1.5MHz。
Q、I正交軸與U、V正交軸有33°的夾角,兩坐標(biāo)系間存在下式關(guān)系:或
YQI與RGB彩色空間的變換關(guān)系為
1)NTSC制
NTSC制是由美國(guó)國(guó)家電視系統(tǒng)委員會(huì)(NationalTelevisionSystemsCommittee)在1953年制定的一種兼容制彩色電視標(biāo)準(zhǔn),是最早采用的彩色電視制式,應(yīng)用的國(guó)家有美國(guó)、日本及英聯(lián)邦國(guó)家。為了減少色度副載波對(duì)黑白圖像的干擾,NTSC制采用了平衡調(diào)幅和頻譜交錯(cuò)原理,故又稱(chēng)為正交平衡調(diào)幅制。
NTSC制采用隔行掃描方式,即一幀視頻圖像由奇、偶兩場(chǎng)構(gòu)成,可以有效克服屏幕閃爍。一幀視頻由525行水平掃描線構(gòu)成,以每秒30幀的速率傳送,采用YIQ彩色空間。在三種兼容制彩色電視標(biāo)準(zhǔn)中,NTSC制的接收和處理最簡(jiǎn)單,色度信號(hào)每行以同一方式傳送,因而不存在對(duì)圖像質(zhì)量有損害的行順序效應(yīng)(PAL、SECAM制都有行順序效應(yīng));亮度信號(hào)與色度信號(hào)以最大間距錯(cuò)開(kāi),兼容性好,亮色串?dāng)_較小。其缺點(diǎn)是色度信號(hào)的幅度失真會(huì)影響重現(xiàn)彩色的飽和度,特別是當(dāng)整個(gè)傳輸系統(tǒng)中存在非線性特性時(shí),系統(tǒng)對(duì)色度副載波的增益將與所疊加的亮度信號(hào)的電平有關(guān)(稱(chēng)為微分增益DG);色度信號(hào)的相位失真對(duì)重現(xiàn)彩色的色調(diào)有明顯的影響,即存在相位敏感性,特別是當(dāng)整個(gè)傳輸系統(tǒng)中存在非線性特性時(shí),色度信號(hào)產(chǎn)生的相移與所疊加的亮度信號(hào)的電平有關(guān)(稱(chēng)為微分相位DP)。
NTSC制視頻的主要技術(shù)參數(shù):
掃描方式:525行/幀(262.5行/場(chǎng),奇、偶兩場(chǎng));
消隱行數(shù):40行/幀(20行/場(chǎng),奇、偶兩場(chǎng));
有效行數(shù):485行/幀;
幀速率:30幀/秒(或29.97幀/秒);
彩色副載波頻率:3.579545MHz;
視頻帶寬:4.2MHz;
行頻:15734Hz;
行周期:63.5μs;行消隱期:(10.9±0.2)μs;
行同步脈沖寬度:4.7μs;
場(chǎng)頻:60Hz;
場(chǎng)周期:16.67ms;
場(chǎng)消隱期:20H+10.9μs(H為1個(gè)行周期時(shí)間);
場(chǎng)同步脈沖寬度:2.5H;
同步信號(hào)極性:負(fù)極性。
2)PAL制
PAL制是德國(guó)1962年制定的一種兼容制彩色電視制式。中國(guó)和大部分西歐國(guó)家使用這種制式。
PAL(PhaseAlternateLine)是“相位逐行交換”的意思,故PAL制又稱(chēng)逐行倒相正交平衡調(diào)制。彩色信號(hào)在發(fā)送端逐行改變相序(一行為NTSC行,下一行則為PAL行或倒相行),在接收端采用副載波延遲線或其它平均法,同時(shí)利用人的視覺(jué)惰性的輔助平均作用補(bǔ)償小幅度串色所引起的彩色偏差,這樣就可以減少傳輸誤差帶來(lái)的影響。為了減少亮色串?dāng)_,PAL制副載波采用1/4行頻偏置,同時(shí)附加25Hz半場(chǎng)頻偏置。根據(jù)接收時(shí)解調(diào)方式的不同,PAL制又細(xì)分為PALD、PALA、PALN、PALS等。
PAL制的特點(diǎn)是:對(duì)相位誤差不敏感,重現(xiàn)彩色受傳輸誤差影響小;對(duì)傳輸通道頻率特性缺陷具有抗御能力;微分相位影響較小;多徑接收的影響小;亮色信號(hào)頻譜交錯(cuò),相互干擾小,可以采用延時(shí)線或數(shù)字梳狀濾波器分離;微分增益與NTSC制相當(dāng);易出現(xiàn)行順序效應(yīng)(行蠕動(dòng)、爬行或百葉窗效應(yīng));處理技術(shù)和設(shè)備復(fù)雜。
PAL制視頻的主要技術(shù)參數(shù):
掃描方式:625行/幀(312.5行/場(chǎng),奇、偶兩場(chǎng));
消隱行數(shù):50行/幀(25行/場(chǎng),奇、偶兩場(chǎng));
有效行數(shù):575行/幀;
幀速率:25幀/秒;
彩色副載波頻率:4.433618MHz;
視頻帶寬:6MHz;
行頻:15625Hz;
行周期:64μs;行消隱期:(12.0±0.3)μs;
行同步脈沖寬度:(4.7±0.2)μs;
場(chǎng)頻:50Hz;
場(chǎng)周期:20ms;
場(chǎng)消隱期:25H±12μs;
場(chǎng)同步脈沖寬度:2.5H;
同步信號(hào)極性:負(fù)極性。
3)SECAM制式
SECAM(SéquentialCouleuràMèmoire)是法國(guó)1966制定的兼容制彩色電視制式,為法國(guó)、俄羅斯、蒙古等少數(shù)國(guó)家所使用。SECAM與PAL制同屬于525行/50場(chǎng)的系統(tǒng)。
與PAL制采用頻分方式處理色度信號(hào)的兩個(gè)分量方式不同,SECAM制采用時(shí)分原則來(lái)避免串色及由其造成的彩色失真,兩個(gè)色差信號(hào)在傳送行使用一次,在未被傳送行,將存儲(chǔ)在延時(shí)線中的信號(hào)再利用一次,亮度信號(hào)仍每行傳送,從而重現(xiàn)R、G、B三色信號(hào),因此SECAM制是一種順序-同時(shí)制。
SECAM制的特點(diǎn)是:受傳輸失真的影響小,大面積彩色部分幾乎不受DP、DG影響;接收機(jī)可以不設(shè)色調(diào)與飽和度調(diào)整旋鈕;存在行順序效應(yīng);復(fù)雜性居于NTSC與PAL之間。
兼容制彩色電視三大制式的選用,一定程度上受到二戰(zhàn)后冷戰(zhàn)思維的影響,其應(yīng)用國(guó)家或地區(qū)的廣泛程度并不能完全反映其技術(shù)的優(yōu)缺點(diǎn)。三大制式的存在顯然不利于人類(lèi)的信息交流,好在目前大規(guī)模集成電路得到應(yīng)用,全制式彩色解調(diào)技術(shù)已在接收機(jī)上普遍采用,同時(shí)數(shù)字視頻處理技術(shù)的應(yīng)用也為視頻信息的交流建立了一個(gè)統(tǒng)一的平臺(tái)。
7.數(shù)字電視及標(biāo)準(zhǔn)
數(shù)字電視(DigitalTelevision)有時(shí)也稱(chēng)為數(shù)碼電視。狹義的數(shù)字電視泛指把模擬電視信號(hào)轉(zhuǎn)換成數(shù)字信號(hào),或采用數(shù)字?jǐn)z像機(jī)直接獲得數(shù)字視頻信號(hào),并以數(shù)字形式進(jìn)行處理、傳輸、存儲(chǔ)或顯示。廣義的數(shù)字電視泛指同電視廣播有關(guān)的全部數(shù)字技術(shù),除了狹義的內(nèi)容外,還包括各種數(shù)字控制、監(jiān)測(cè)及附加信息的數(shù)字形式傳輸。
數(shù)字電視具有數(shù)字信號(hào)系統(tǒng)的特點(diǎn),如信噪比高、受傳輸系統(tǒng)影響小、信道適應(yīng)性好、便于多工傳輸、便于存儲(chǔ)、設(shè)備可靠、維護(hù)簡(jiǎn)單等特點(diǎn)。數(shù)字電視系統(tǒng)由編碼器、傳輸信道和解碼器組成,對(duì)應(yīng)于我們常說(shuō)的攝、錄、編、播系統(tǒng)。針對(duì)編解碼形式不同,形成了許多數(shù)字電視制式。
高清晰度電視(HighDefinitionTelevision,HDTV)是數(shù)字電視的一種主要形式,目的是采用數(shù)字技術(shù),以解決畫(huà)面清晰度、色彩還原度、聲音保真度為主要目標(biāo)。HDTV的低端標(biāo)準(zhǔn)一般兼容現(xiàn)有的模擬電視制式,屬于過(guò)渡性標(biāo)準(zhǔn),主要有IDTV(ImprovedDefinitionTV)和EDTV(ExtendedDefinitionTV)。HDTV的高端標(biāo)準(zhǔn)基本上不再考慮與現(xiàn)有模擬電視制式的兼容問(wèn)題。目前世界上主要有三種HDTV系統(tǒng)。一是日本在1984年提出的MUSE制HDTV系統(tǒng),該系統(tǒng)屬數(shù)字模擬混合制,采用MPEG-2數(shù)字壓縮技術(shù)和模擬傳送方式;二是歐洲電信協(xié)會(huì)公布的DVB-S/C/T標(biāo)準(zhǔn),主要有北歐的HD-DIVINE系統(tǒng)和德國(guó)的HDTV-T系統(tǒng);三是美國(guó)聯(lián)邦通信委員會(huì)(FCC)于1996年12月公布的DTV標(biāo)準(zhǔn),這是世界上第一個(gè)全數(shù)字HDTV標(biāo)準(zhǔn)。另一種新型的多媒體廣播業(yè)務(wù)ISDB(綜合業(yè)務(wù)數(shù)字廣播)技術(shù),系統(tǒng)地綜合了各項(xiàng)數(shù)字內(nèi)容,每一項(xiàng)內(nèi)容可以包括從LDTV到HDTV的多節(jié)目視頻、多節(jié)目音頻、圖形、文本等。ISDB幾乎包攬了目前世界上的電視、電信等不同業(yè)務(wù),其傳輸系統(tǒng)涵蓋各種業(yè)務(wù)不同的需求,比目前的DVB、HDTV和其它通信服務(wù)技術(shù)用途更廣泛。另一種新型的多媒體廣播業(yè)務(wù)ISDB(綜合業(yè)務(wù)數(shù)字廣播)技術(shù),系統(tǒng)地綜合了各項(xiàng)數(shù)字內(nèi)容,每一項(xiàng)內(nèi)容可以包括從LDTV到HDTV的多節(jié)目視頻、多節(jié)目音頻、圖形、文本等。ISDB幾乎包攬了目前世界上的電視、電信等不同業(yè)務(wù),其傳輸系統(tǒng)涵蓋各種業(yè)務(wù)不同的需求,比目前的DVB、HDTV和其它通信服務(wù)技術(shù)用途更廣泛。
1995年,由原廣電部、電子部等部委負(fù)責(zé)成立了我國(guó)第一個(gè)HDTV協(xié)調(diào)小組。1998年HDTV實(shí)驗(yàn)試播成功,并且中央電視臺(tái)于1999年10月1日采用數(shù)字電視地面廣播方式,對(duì)國(guó)慶節(jié)閱兵式進(jìn)行了試播,并計(jì)劃于2005年開(kāi)始數(shù)字電視地面廣播。我國(guó)目前對(duì)于HDTV標(biāo)準(zhǔn)的研究主要集中在HDTV地面廣播標(biāo)準(zhǔn)上,參與研究的高校主要有清華大學(xué)與上海交通大學(xué)。
我國(guó)目前關(guān)于HDTV的規(guī)范主要有:高端彩電(EDTV)基本規(guī)范,見(jiàn)表4-4;中國(guó)高端(HD兼容顯示)數(shù)字彩電(HDTV-READY或稱(chēng)HDTV顯示器)標(biāo)準(zhǔn),見(jiàn)表4-5;中國(guó)高清晰度數(shù)字彩電(IntegratedHDTV)標(biāo)準(zhǔn),見(jiàn)表4-6。
表4-4高端彩電(EDTV)基本規(guī)范表4-5中國(guó)高端數(shù)字彩電(HDTV-READY)標(biāo)準(zhǔn)
表4-6中國(guó)高清晰度數(shù)字彩電
8.計(jì)算機(jī)數(shù)字視頻和視頻卡
計(jì)算機(jī)數(shù)字視頻就是在計(jì)算機(jī)平臺(tái)上對(duì)視頻進(jìn)行數(shù)字處理。為了在計(jì)算機(jī)屏幕上顯示模擬視頻,必須先把模擬視頻變?yōu)閿?shù)字信號(hào),這一工作一般由插在計(jì)算機(jī)上的視頻數(shù)字化覆蓋卡(也稱(chēng)視頻捕捉卡、視頻采樣卡或視頻卡)來(lái)接收模擬視頻信號(hào),并進(jìn)行采樣和量化,然后可以和圖像、圖形、動(dòng)畫(huà)及文字等多媒體信息一起顯示。視頻卡選用時(shí)應(yīng)考慮的問(wèn)題:
(1)視頻采樣分辨率的大小。
(2)視頻采樣速率及實(shí)時(shí)性要求。
(3)特殊的處理功能,如凍結(jié)、淡入淡出、旋轉(zhuǎn)、鏡像、透明、縮放等。
(4)音頻輸入的處理功能及質(zhì)量。
(5)顯存的大小與存儲(chǔ)幀的數(shù)量。
(6)音視頻輸出功能。
(7)CATV接收功能。
(8)數(shù)字視頻接口等。
9.計(jì)算機(jī)視頻和電視視頻的區(qū)別
(1)掃描方式與掃描線數(shù)不同。電視視頻采用隔行掃描方式,對(duì)于每一種電視制式,其掃描線數(shù)都是固定的525行或625行,場(chǎng)頻與行頻也是固定的。計(jì)算機(jī)視頻采用逐行掃描方式,掃描線數(shù)、行頻與幀頻根據(jù)顯示適配器的設(shè)置而變化。例如在SVGA方式下幾乎全屏的圖像,在XGA方式顯示為一個(gè)小的窗口,而在VGA方式下只能部分顯示。
(2)過(guò)掃描問(wèn)題。在電視廣播中,電視臺(tái)播送的畫(huà)面總是比標(biāo)準(zhǔn)電視屏面所能容納的畫(huà)面略大,因此電視觀眾看到的圖像“邊界”總是受到電視的物理幀大小的限制。這種現(xiàn)象一般稱(chēng)為“過(guò)掃描”(Overscan)。相比之下,計(jì)算機(jī)監(jiān)視器上顯示的圖像較屏幕稍小,這樣當(dāng)數(shù)字化的視頻圖像顯示在計(jì)算機(jī)監(jiān)視器上時(shí),在圖像周?chē)蜁?huì)有一個(gè)邊框。而當(dāng)計(jì)算機(jī)監(jiān)視器屏幕上的圖像變換成電視視頻時(shí),該圖像的外邊界就會(huì)超出電視屏幕。
(3)視頻的顏色。在電視和計(jì)算機(jī)之間,顏色的再現(xiàn)和顯示是不同的。計(jì)算機(jī)監(jiān)視器使用的是RGB組合視頻,其顏色比電視屏幕上所能看到的那些顏色更精確。當(dāng)一個(gè)計(jì)算機(jī)的屏幕圖像變換成視頻時(shí),顯示出來(lái)的顏色就有差異。在電視中,使用有限顏色的調(diào)色板以及有限制的亮度電平和黑色電平。在計(jì)算機(jī)上產(chǎn)生的某些顏色,在RGB監(jiān)視器上顯示得很好,但在電視上就可能是不正確的。
(4)隔行掃描的影響。在RGB監(jiān)視器中,掃描線為一個(gè)像素厚度的逐行掃描線,這在監(jiān)視器上看起來(lái)沒(méi)有問(wèn)題,但在電視上就會(huì)出現(xiàn)閃爍。為了避免閃爍,應(yīng)確保掃描線的寬度大于兩個(gè)像素的厚度,這也可通過(guò)圖像編輯器中的去閃爍濾波器來(lái)解決。
10.視頻測(cè)量及視頻圖像質(zhì)量評(píng)價(jià)
視頻信號(hào)是一種電信號(hào),具有客觀性;視頻圖像是人的主觀感覺(jué),具有主觀性。對(duì)視頻的評(píng)價(jià)可從電信號(hào)測(cè)量和主觀評(píng)價(jià)兩方面著手進(jìn)行。
視頻測(cè)量的目的就是通過(guò)各種裝置對(duì)視頻處理設(shè)備和傳輸通道的工作狀態(tài)進(jìn)行監(jiān)視,并對(duì)其光學(xué)、電氣指標(biāo)以及模擬、數(shù)字處理變換特性進(jìn)行測(cè)量,通過(guò)各種參數(shù)來(lái)反映視頻系統(tǒng)信息處理及傳輸?shù)馁|(zhì)量。視頻測(cè)量通常對(duì)視頻通道進(jìn)行。所有對(duì)信號(hào)的處理過(guò)程在測(cè)量時(shí)均視為視頻通道。通道的測(cè)試項(xiàng)目包括反射損耗、插入損耗、雜波(信噪比)、非線性失真(亮度信號(hào)非線性幅度失真、色度信號(hào)對(duì)亮度信號(hào)的互調(diào)失真、色度信號(hào)微分增益、色度信號(hào)微分相位、色度信號(hào)非線性幅度失真、同步信號(hào)非線性失真等)、線性失真、壓縮損失等。測(cè)量可在頻域和時(shí)域進(jìn)行。
視頻測(cè)量一般采用監(jiān)視矢量示波器和專(zhuān)用的視頻特性參數(shù)測(cè)試儀(系統(tǒng)測(cè)試平臺(tái))來(lái)完成。視頻圖像的質(zhì)量最終由觀看者評(píng)價(jià),包含著十分復(fù)雜的主觀因素。主觀評(píng)價(jià)一般采用統(tǒng)計(jì)學(xué)的方法進(jìn)行。
我國(guó)電視圖像質(zhì)量評(píng)價(jià)標(biāo)準(zhǔn)一般采用5分制的主觀評(píng)價(jià)與統(tǒng)計(jì)分析方法,即請(qǐng)大量不同觀眾對(duì)多種圖像評(píng)分,再用統(tǒng)計(jì)方法作出總的評(píng)價(jià)。
圖像質(zhì)量評(píng)分為:5分——很好;4分——好;3分——可以;2分——差;1分——不能用。圖像受損五級(jí)評(píng)分標(biāo)準(zhǔn)為:5級(jí)——察覺(jué)不到;4級(jí)——?jiǎng)偪刹煊X(jué);3級(jí)——察覺(jué),但不討厭;2級(jí)——肯定討厭;1級(jí)——不能用。對(duì)評(píng)分結(jié)果進(jìn)行統(tǒng)計(jì)計(jì)算的方法有多種。一種常用的方法是:先求第i級(jí)(i=1~5)評(píng)分次數(shù)ni對(duì)評(píng)分總次數(shù)N所占的相對(duì)評(píng)分率Pi,然后計(jì)算平均評(píng)價(jià)Q,即圖像質(zhì)量的主觀評(píng)價(jià)與圖像各種失真的客觀測(cè)量數(shù)據(jù)緊密相關(guān),各種失真的測(cè)量參數(shù)可以反映圖像質(zhì)量的好壞。我國(guó)規(guī)定,國(guó)家質(zhì)量等級(jí)P與五項(xiàng)主要失真的換算關(guān)系為P=1.982+0.535×10-1x1-0.254×10-4x2-0.600×10-2x3-0.346×10-2x4-0.326×10-1x5
式中:x1為統(tǒng)一加權(quán)隨機(jī)信雜比(分貝);x2為亮-色延時(shí)差(毫微秒);x3為微分增益(百分?jǐn)?shù));x4為微分相位(度);x5為亮-色增益差(百分?jǐn)?shù))。 4.2語(yǔ)音壓縮及編碼技術(shù)
4.2.1語(yǔ)音壓縮技術(shù)
1.波形編碼
波形編碼就是根據(jù)語(yǔ)音信號(hào)波形導(dǎo)出相應(yīng)的數(shù)字編碼形式,它會(huì)盡可能構(gòu)造出包括背景噪聲在內(nèi)的模擬波形,輸出信號(hào)的波形和相位跟蹤輸入信號(hào)。波形編碼的語(yǔ)音信息是波形,編碼率在9.6~64kb/s之間,屬中頻帶編碼,重構(gòu)的聲音質(zhì)量較高。波形編碼易受量化噪聲的影響。
G.711規(guī)范采用8kHz抽樣、8bit量化的PCM編碼方式,比特率為64kb/s。為了降低語(yǔ)音波形編碼速率,目前主要采用差分脈沖編碼(DPCM)、自適應(yīng)量化與自適應(yīng)線性預(yù)測(cè)編碼(ADPCM)及子帶編碼(SBC),語(yǔ)音比特率可降低到32kb/s或16kb/s,再低就十分困難了。
1)非均勻量化壓擴(kuò)法
在PCM編碼中,語(yǔ)音信號(hào)的最大幅度影響著量化信噪比。在編碼位數(shù)一定的條件下,語(yǔ)音信號(hào)的幅度越小,量化信噪比也就越差。因此,為了達(dá)到信噪比和信號(hào)幅度無(wú)關(guān)的目的,那就要采用非均勻量化的方法,壓擴(kuò)法就是其中之一。在這種方法中,我們根據(jù)語(yǔ)音樣值非均勻分布的特點(diǎn),設(shè)法讓量化階距隨著概率密度的減小而增大,或者說(shuō)對(duì)大信號(hào)用大量化階距,對(duì)小信號(hào)用小量化階距,從而使量化信噪比不隨信號(hào)幅度而變。量化前用對(duì)數(shù)函數(shù)進(jìn)行幅度壓縮,解碼后再用指數(shù)函數(shù)進(jìn)行幅度擴(kuò)張,其效果是量化器的信噪比對(duì)信號(hào)幅度不敏感。
在壓擴(kuò)法編碼中,又分為A律和μ律兩種壓縮方法。其中μ律是美國(guó)、日本、加拿大等國(guó)采用的一種壓縮律,A律主要是中國(guó)和歐洲使用的一種壓縮律。
2)差分脈碼調(diào)制(DPCM)
統(tǒng)計(jì)表明,相鄰語(yǔ)音樣值之間存在著很大的相關(guān)性,即從一個(gè)樣值到另一個(gè)相鄰的樣值,信號(hào)的變化一般都不大。因此,我們可以不用傳輸信號(hào)樣值本身,而只傳輸相鄰信號(hào)之間的差值。由于這類(lèi)差值取值為0或取值很小的概率很大,因而我們可用較少的碼位來(lái)對(duì)差值進(jìn)行編碼,從而達(dá)到數(shù)據(jù)壓縮的目的。在解碼部分,在所恢復(fù)的前一樣值的基礎(chǔ)上加上當(dāng)前的差值信號(hào)就可以恢復(fù)出當(dāng)前的樣值,這就是差分脈碼調(diào)制。如果在DPCM的基礎(chǔ)上再采取自適應(yīng)措施,就形成了ADPCM的方法(AdaptiveDPCM),即自適應(yīng)差分脈碼調(diào)制,還可進(jìn)一步壓縮數(shù)據(jù)率。ADPCM的主要改進(jìn)在于它的量化器和預(yù)測(cè)器都是以自適應(yīng)的方式工作的,量化器和預(yù)測(cè)器能根據(jù)輸入信號(hào)的統(tǒng)計(jì)特性自適應(yīng)地處于最佳或接近最佳的工作狀態(tài)。
3)子帶編碼
在子帶編碼(Sub-BandCoding,SBC)中,首先采用一組帶通濾波器,將輸入信號(hào)的頻譜分成若干個(gè)頻帶,每個(gè)頻帶就是一個(gè)子帶。為了降低比特率,對(duì)每個(gè)較窄的子帶分配給一個(gè)自適應(yīng)編碼器分別進(jìn)行編碼,最后將各個(gè)子帶編碼器編好的碼流復(fù)接起來(lái)送到對(duì)端。在接收端,再將它們分接、解碼,并組合起來(lái)恢復(fù)出原始的輸入信號(hào)。由于量化噪聲在全部話(huà)音頻帶上不具有相同的可檢測(cè)性,因此通過(guò)控制話(huà)音信號(hào)頻帶范圍中的量化噪聲失真,可以大大改善編碼信號(hào)的質(zhì)量。子帶編碼充分利用了這一性質(zhì),首先,它把量化噪聲限制在各個(gè)子帶中,從而阻止了一個(gè)子帶的量化噪聲引入到整個(gè)頻帶。其次,它在每個(gè)子帶中可以使用獨(dú)立的量化階距,使低信號(hào)能量的子帶使用較小的量化階距,所產(chǎn)生的量化噪聲相應(yīng)地也較小;對(duì)于具有較高能量的子帶,可以使用較大的量化階距,從而使量化噪聲的頻譜與信號(hào)的短時(shí)頻譜相匹配,這樣就避免能量較小的頻帶內(nèi)的輸入信號(hào)被其它頻段的量化噪聲所遮蓋。最后,根據(jù)感性判斷來(lái)分配各個(gè)子帶中的比特?cái)?shù),使得在必須精確保持音調(diào)和元音音帶的共振峰結(jié)構(gòu)的較低子帶中,每個(gè)樣值用較多的比特?cái)?shù)來(lái)編碼,而且語(yǔ)音中出現(xiàn)磨擦音和類(lèi)似磨擦音的較高子帶中,每個(gè)樣值用較少的比特?cái)?shù)來(lái)編碼。這樣,在相同的碼率下,子帶編碼能獲得明顯優(yōu)于全頻帶編碼的信號(hào)質(zhì)量,或者說(shuō)在相同信號(hào)質(zhì)量的情況下,子帶編碼可以用明顯低于全頻帶編碼的比特率來(lái)傳輸。例如,16kb/s的子帶編碼器其編碼質(zhì)量接近于32kb/s的自適應(yīng)差分脈碼調(diào)制的水平。
2.參數(shù)編碼
參數(shù)編碼又稱(chēng)聲碼器(Vocoder),它根據(jù)聲音的形成原理模型來(lái)提取一組參數(shù),將這組參數(shù)送到接收端,用來(lái)導(dǎo)出語(yǔ)音,產(chǎn)生模擬聲音。再生的聲音的波形并非原始波形。
人的話(huà)音包含濁音和清音音素。濁音形成音調(diào),稱(chēng)之為基音?;舴l特性在某些頻率點(diǎn)呈現(xiàn)共振峰特點(diǎn),可以用來(lái)識(shí)別音素,一個(gè)音素持續(xù)時(shí)間較短,頻譜包絡(luò)反映了話(huà)音的短時(shí)相關(guān)性?;纛l譜的精細(xì)結(jié)構(gòu)具有周期性,周期對(duì)應(yīng)基音頻率,頻率變化慢,反映語(yǔ)音的長(zhǎng)時(shí)間相關(guān)性。頻譜能量主要集中在4kHz以?xún)?nèi)。清音頻譜特性和濁音完全不同,無(wú)峰值特點(diǎn)和周期性,類(lèi)似白噪聲。圖4-4參數(shù)編碼數(shù)字語(yǔ)音模型聲源包括激勵(lì)信號(hào)和增益,濁音的激勵(lì)源為一串周期性的脈沖,清音的激勵(lì)源為噪聲信號(hào),增益表示信號(hào)的強(qiáng)弱,開(kāi)關(guān)表示清音與濁音的判別,聲源決定了語(yǔ)音信號(hào)頻譜的精細(xì)結(jié)構(gòu),即語(yǔ)音的長(zhǎng)時(shí)相關(guān)性。聲道由濾波器組成,濾波器用來(lái)模擬說(shuō)話(huà)人的聲道輸出(參見(jiàn)WEST96),決定了語(yǔ)音信號(hào)頻譜的包絡(luò)特性,即反映了語(yǔ)音的短時(shí)相關(guān)性。
根據(jù)模型,語(yǔ)音編碼需要4類(lèi)參數(shù):濾波器系數(shù)(定義聲道共振特性)、增益系數(shù)、開(kāi)關(guān)參數(shù)和脈沖周期值。參數(shù)編碼根據(jù)結(jié)構(gòu)不同可分為5類(lèi):通道聲碼器、共振峰聲碼器、同態(tài)聲碼器、線性預(yù)測(cè)編碼(LPC)聲碼器和余弦聲碼器。前兩種聲碼器語(yǔ)音質(zhì)量不夠好,在IP電話(huà)系統(tǒng)中使用很少,目前主要使用的是LPC聲碼器。
LPC聲碼器和ADPCM類(lèi)似,采用線性預(yù)測(cè)來(lái)模擬聲道特性,通過(guò)對(duì)時(shí)域抽樣信號(hào)的相關(guān)計(jì)算得到預(yù)測(cè)系數(shù),再將預(yù)測(cè)系數(shù)轉(zhuǎn)換成表征各個(gè)級(jí)聯(lián)濾波器的反射系數(shù),利用線性代數(shù)方法求解N維線性聯(lián)立方程,求得N個(gè)預(yù)測(cè)系數(shù),從而由時(shí)域信號(hào)數(shù)據(jù)獲得聲道的頻域估計(jì)參數(shù),參數(shù)按幀進(jìn)行自適應(yīng)調(diào)整。編碼比特率取決于預(yù)測(cè)器的階數(shù)N和每個(gè)參數(shù)的量化精度。20世紀(jì)80年代末,人們又對(duì)LPC聲碼器作了大量的改進(jìn),提出混合激勵(lì)、規(guī)則激勵(lì)等LPC聲碼器算法。參數(shù)編碼以語(yǔ)音信號(hào)生成的數(shù)字模型為基礎(chǔ),以各種聲碼器為代表,根據(jù)輸入語(yǔ)音信號(hào)分析出模型參數(shù)(主要是指表征聲門(mén)振動(dòng)的激勵(lì)參數(shù)和表征聲道特性的聲道參數(shù)),然后在解碼端根據(jù)這些模型參數(shù)來(lái)恢復(fù)語(yǔ)音。
參數(shù)編碼器基于分析合成模型,可以用相當(dāng)少的參數(shù)表示語(yǔ)音信號(hào),這些參數(shù)通常每隔20~40ms就會(huì)從語(yǔ)音信號(hào)中提取并量化,不但可以利用樣值間的相關(guān)性,還可以充分利用幀與幀之間的信息冗余,有效地降低編碼比特率。參數(shù)編碼器的編碼率為0.8~4.8kb/s,主要用于在窄帶信道上提供低速率語(yǔ)音通信和一些對(duì)延時(shí)要求較寬
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025-2030全球故障安全制動(dòng)器行業(yè)調(diào)研及趨勢(shì)分析報(bào)告
- 2025年度鋼釘鐵釘產(chǎn)品專(zhuān)利授權(quán)與銷(xiāo)售合同2篇
- 2024年趣味化學(xué)知識(shí)競(jìng)賽題庫(kù)及答案(共170題)
- 委托房地產(chǎn)中介服務(wù)合同書(shū)
- 2025年度個(gè)人設(shè)備租賃借款合同模板6篇
- 科技驅(qū)動(dòng)下的康復(fù)治療新方法研究
- 二零二五年度車(chē)輛租賃合同補(bǔ)充協(xié)議范本- 商務(wù)接送服務(wù)4篇
- 2025版新編國(guó)際商務(wù)日語(yǔ)談判培訓(xùn)效果評(píng)估合同2篇
- 2025年度文化遺址蟲(chóng)害防治與文物保護(hù)服務(wù)協(xié)議4篇
- 技術(shù)與文化的融合企業(yè)創(chuàng)新的雙翼
- 紀(jì)委辦案安全培訓(xùn)課件
- 超市連鎖行業(yè)招商策劃
- 醫(yī)藥高等數(shù)學(xué)智慧樹(shù)知到課后章節(jié)答案2023年下浙江中醫(yī)藥大學(xué)
- 城市道路智慧路燈項(xiàng)目 投標(biāo)方案(技術(shù)標(biāo))
- 初中英語(yǔ)-Unit2 My dream job(writing)教學(xué)設(shè)計(jì)學(xué)情分析教材分析課后反思
- 【公司利潤(rùn)質(zhì)量研究國(guó)內(nèi)外文獻(xiàn)綜述3400字】
- 工行全國(guó)地區(qū)碼
- 新疆2022年中考物理試卷及答案
- 地暖工程監(jiān)理實(shí)施細(xì)則
- 頂部板式吊耳計(jì)算HGT-20574-2018
- 《內(nèi)證觀察筆記》
評(píng)論
0/150
提交評(píng)論