多媒體技術(shù)基礎(chǔ)第三版課后答案中_第1頁
多媒體技術(shù)基礎(chǔ)第三版課后答案中_第2頁
多媒體技術(shù)基礎(chǔ)第三版課后答案中_第3頁
多媒體技術(shù)基礎(chǔ)第三版課后答案中_第4頁
多媒體技術(shù)基礎(chǔ)第三版課后答案中_第5頁
已閱讀5頁,還剩6頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第6章 顏色空間變換6.1 PAL制彩色電視使用什么顏色模型?NTSC制彩色電視使用什么顏色模型?計(jì)算機(jī)圖像顯示使用什么顏色模型?(1) PAL制彩色電視:YUV(2) NTSC制彩色電視:YIQ(3) 計(jì)算機(jī)圖像顯示設(shè)備:RGB6.2 用YUV或YIQ模型來表示彩色圖像的優(yōu)點(diǎn)是什么?為什么黑白電視機(jī)可看彩色電視圖像?(1) YUV表示法的優(yōu)點(diǎn): 它的亮度信號(Y)和色度信號(U,V)是相互獨(dú)立的,因此可以對這些單色圖分別進(jìn)行編碼; 可以利用人眼的特性來降低數(shù)字彩色圖像所需要的存儲容量。YIQ同樣具有YUV的這兩個(gè)優(yōu)點(diǎn)。(2) 黑白電視能接收彩色電視信號的道理是利用了YUV/YIQ分量之間的獨(dú)

2、立性。6.3 在RGB顏色空間中,當(dāng)R=G=B,且為任意數(shù)值,問計(jì)算機(jī)顯示器顯示的顏色是什么顏色?灰色6.4 在HSL顏色空間中,當(dāng)H為任意值,S=L=0時(shí),R,G和B的值是多少?當(dāng)H0, S=1, L0.5,R,G和B的值是多少?(1) 當(dāng)H為任意值,S=L=0時(shí), R = G = B = 0(2) 當(dāng)H0, S=1, L0.5時(shí),R1,G B 06.5 打開Windows 操作系統(tǒng)中的“畫圖”程序,在“編輯顏色”窗口中的紅(R)、綠(G)、藍(lán)(B)和色調(diào)(H)、飽和度(S)、亮度(L)對應(yīng)顯示上,如果設(shè)置R=G=B255,問H, S和L的值分別為多少?分別改變R,G和B的值,觀察H,S和L

3、的值的變化。當(dāng)R=G=B255時(shí),H160,S=0,L=240。(2) (略)6.6 用MATLAB編寫RGB到HSL和HSL到RGB顏色空間的轉(zhuǎn)換程序:rgb2hsl.m和hsl2rgb.m。(略)6.7 用MATLAB編寫YCbCr和RGB0,219顏色空間的轉(zhuǎn)換程序:RGB2YCbCr和YCbCr2RGB.m。(略)第7章 小波與小波變換7.1 寫出矢量空間的哈爾小波并畫出它的波形。7.2 寫出44哈爾小波變換矩陣。先寫出: ,(1) 44哈爾小波變換矩陣:(2) 規(guī)范化的44哈爾小波變換矩陣:7.3 使用MATLAB中的多級一維小波分解函數(shù)例程(function)wavedec,對例7

4、.2所示的函數(shù)作小波變換。(略)7.4 使用規(guī)范化的小波變換算法,用MATLAB編寫一個(gè)M文件,重新計(jì)算的哈爾小波變換。(略)第8章 小波圖像編碼8.1 什么叫做零樹?“零樹”是指小波變換系數(shù)之間的一種數(shù)據(jù)結(jié)構(gòu)。因?yàn)殡x散小波變換是一種多分辨率的分解方法,每一級分解都會產(chǎn)生表示圖像比較粗糙(低頻圖像)和比較精細(xì)(高頻圖像)的小波系數(shù),在同一方向和相同空間位置上的所有小波系數(shù)之間的關(guān)系可用一棵樹的形式表示,如果樹根和它的子孫的小波系數(shù)的絕對值小于某個(gè)給定的閾值T(threshold),那么這棵樹就叫做零樹。8.2 解釋EZW的含義。嵌入零樹小波編碼(embedded zerotree wavele

5、t, EZW)是Shapiro, J. M在1993年開發(fā)的一種編碼算法。小波表示該算法以離散小波變換為基礎(chǔ),以變換后的大系數(shù)比小系數(shù)更重要以及高頻子帶中的小系數(shù)可以忽略為背景;零樹表示小波變換系數(shù)之間的一種數(shù)據(jù)結(jié)構(gòu),用同一方向和相同空間位置上的所有小波系數(shù)構(gòu)成一棵樹,如果樹根及其子孫的小波系數(shù)的絕對值小于某個(gè)給定域值,則這棵樹就稱為零樹;嵌入表示一幅圖像可以分解成一幅低分辨率圖像和分辨率由低到高(表示圖像細(xì)節(jié))的許多子圖像,圖像合成過程是通過子圖像生成許多分辨率不同的圖像。EZW編碼就是按照用戶對圖像分辨率的不同要求,編碼器進(jìn)行多次編碼,每進(jìn)行一次編碼,域值降低1/2,水平和垂直方向上的圖像

6、分辨率各提高1倍。編碼從最低分辨率圖像開始掃描,每當(dāng)遇到幅度大于域值的正系數(shù)就用符號P表示,幅度小于域值的負(fù)系數(shù)用符號N表示,樹根節(jié)點(diǎn)上的系數(shù)幅度小于域值而樹枝中有大于域值的非零樹用符號Z表示,零樹用符號T表示,編碼的輸出是符號集P, N, T, Z, 0, 1中的一系列符號。8.3 如果條件允許,用MATLAB或者其他語言編寫執(zhí)行EZW算法的編碼和解碼程序(略)8.4 解釋SPIHT的含義。層樹分集算法(set partitioning in hierarchical trees, SPIHT)的根據(jù)是,圖像經(jīng)過小波變換之后,大部分能量都集中在低頻子帶。從這個(gè)事實(shí)出發(fā),最先傳送幅度大的系數(shù),

7、這樣解碼器即使在低速率應(yīng)用環(huán)境下也可得到圖像的大部分信息。編碼樹的結(jié)構(gòu)與EZW算法的結(jié)構(gòu)類似,每一個(gè)節(jié)點(diǎn)要么沒有子節(jié)點(diǎn),要么有4個(gè)子節(jié)點(diǎn)。在編碼過程中,使用三個(gè)列表變量存儲重要系數(shù)和不重要系數(shù)。該算法適用于圖像的漸進(jìn)傳輸,具有比較高的PSNR,復(fù)雜度比較低,計(jì)算量比較少,位速率容易控制等優(yōu)點(diǎn)。8.5 如果條件允許,用MATLAB或者其他語言編寫執(zhí)行SPIHT算法的編碼和解碼程序。(略)8.6 請用因特網(wǎng)搜索工具,查找并閱讀EBCOT的詳細(xì)說明。(略)8.7 如果條件允許,用MATLAB或者其他語言編寫執(zhí)行EBCOT算法的編碼和解碼程序。(略)8.8 JPEG 2000有許多功能,請用因特網(wǎng)搜索

8、工具調(diào)查和描述它的詳細(xì)功能。(略)第9章 數(shù)字電視基礎(chǔ)9.1電視是什么?電視制是什么?世界上主要的彩色電視制有哪幾種?(1) 電視是捕獲、廣播和接收活動圖像和聲音的遠(yuǎn)程通信系統(tǒng);(2) 電視制(television system)是傳輸圖像和聲音的方法;(3) 目前世界上使用的彩色電視制式主要有PAL,NTSC,SECAM三種,都是模擬彩色電視制式。9.2 隔行掃描是什么意思?非隔行掃描是什么意思?(1) 在隔行掃描中,一幀畫面分兩場,第一場掃描總行數(shù)的一半,第二場掃描總行數(shù)的另一半。電子束掃完第1行后回到第3行開始的位置接著掃,如圖10-01(b)所示,然后在第5、7、,行上掃,直到最后一行

9、。奇數(shù)行掃完后接著掃偶數(shù)行,這樣就完成了一幀(frame)的掃描。隔行掃描要求第一場結(jié)束于最后一行的一半,不管電子束如何折回,它必須回到顯示屏頂部的中央,這樣就可以保證相鄰的第二場掃描恰好嵌在第一場各掃描線的中間。正是這個(gè)原因,才要求總的行數(shù)必須是奇數(shù)。(2) 在非隔行掃描中,電子束從顯示屏的左上角一行接一行地掃到右下角,在顯示屏上掃一遍就顯示一幅完整的圖像。9.3 電視機(jī)和計(jì)算機(jī)的顯示器各使用什么掃描方式?電視機(jī)通常使用隔行掃描;計(jì)算機(jī)的顯示器通常使用非隔行掃描。9.4 在ITU-R BT.601標(biāo)準(zhǔn)中,PAL和NTSC彩色電視的每一條掃描線上的有效顯示像素是多少?720個(gè)像素9.5 S-V

10、ideo信號是什么?它的連接器結(jié)構(gòu)是什么樣?S-Video(Separate Video)是亮度信號(Y)和色度信號(C)分開錄制和處理的一種電視信號。S-Video是分量模擬電視信號和復(fù)合模擬電視信號的一種折中方案。使用S-Video有兩個(gè)優(yōu)點(diǎn):(1) 減少亮度信號和色差信號之間的交叉干擾。(2) 不須要使用梳狀濾波器來分離亮度信號和色差信號,這樣可提高亮度信號的帶寬。S-Video連接器的結(jié)構(gòu)和外形可用搜索引擎的圖片搜索功能找到。注:S-VHS和Hi-8攝像機(jī)以及盒式錄像機(jī)(video cassette recorder,VCR)使用這種技術(shù),它比標(biāo)準(zhǔn)的VHS和8毫米格式的設(shè)備提供質(zhì)量比較

11、高的彩色圖像。在使用S-video技術(shù)的設(shè)備上,電視信號的輸出除含有分離的亮度(Y)和色差信號(C)輸出外,還有復(fù)合彩色全電視信號。S-video設(shè)備與其他設(shè)備連接的連接器使用S-video連接器,而不是普通的RCA連接器。有些電視圖像卡和高檔家用錄像機(jī)(VCR)可以支持這種信號。9.6 對彩色圖像進(jìn)行子采樣的理論根據(jù)是什么?人的視覺系統(tǒng)所具有的兩種特性。一是人眼對色度信號的敏感程度比對亮度信號的敏感程度低,利用這個(gè)特性可以把圖像中表達(dá)顏色的信號去掉一些而使人不易察覺;二是人眼對圖像細(xì)節(jié)的分辨能力有一定的限度,利用這個(gè)特性可以把圖像中的高頻信號去掉而使人不易察覺。子采樣是壓縮彩色電視信號的一種

12、技術(shù)。9.7 圖像子采樣是在哪個(gè)彩色空間進(jìn)行的?在YCbCr顏色空間9.8 一幅YUV彩色圖像的分辨率為720576像素。分別計(jì)算采用4:2:2、4:1:1和4:2:0子采樣格式采樣時(shí)的樣本數(shù)。(1) 4:4:4 這種采樣格式不是子采樣格式,它是指在每條掃描線上每4個(gè)連續(xù)的采樣點(diǎn)取4個(gè)亮度Y樣本、4個(gè)紅色差Cr樣本和4個(gè)藍(lán)色差Cb樣本,這就相當(dāng)于每個(gè)像素用3個(gè)樣本表示。7205763 1 244 160(2) 4:2:2 這種子采樣格式是指在每條掃描線上每4個(gè)連續(xù)的采樣點(diǎn)取4個(gè)亮度Y樣本、2個(gè)紅色差Cr樣本和2個(gè)藍(lán)色差Cb樣本,平均每個(gè)像素用2個(gè)樣本表示。7205762 829 440(3)

13、4:1:1 這種子采樣格式是指在每條掃描線上每4個(gè)連續(xù)的采樣點(diǎn)取4個(gè)亮度Y樣本、1個(gè)紅色差Cr樣本和1個(gè)藍(lán)色差Cb樣本,平均每個(gè)像素用1.5個(gè)樣本表示。7205761.5 622 080(4) 4:2:0 這種子采樣格式是指在水平和垂直方向上每2個(gè)連續(xù)的采樣點(diǎn)上取2個(gè)亮度Y樣本、1個(gè)紅色差Cr樣本和1個(gè)藍(lán)色差Cb樣本,平均每個(gè)像素用1.5個(gè)樣本表示。7205761.5 6220809.9 數(shù)字電視是什么?數(shù)字電視(digital television / digital TV,DTV) 是用數(shù)據(jù)壓縮技術(shù)和數(shù)字傳輸技術(shù)的遠(yuǎn)程通信系統(tǒng)9.10 在目前的數(shù)字電視傳輸方式中,有哪3種主要傳輸方式?目前

14、傳輸數(shù)字電視用得最多的方式是使用衛(wèi)星、地面廣播和電纜,用它們傳輸?shù)碾娨暦謩e稱為地面數(shù)字電視(digital terrestrial TV)、衛(wèi)星數(shù)字電視(digital satellite TV)和有線數(shù)字電視(digital cable TV)。9.11 高清晰度電視(HDTV)是什么?高清晰度電視(high definition television,HDTV)是具有正常視力的觀眾可得到與觀看原始景物時(shí)的感受幾乎相同的數(shù)字電視。通常認(rèn)為,在觀眾與顯示屏之間的距離等于3倍顯示屏高度的情況下就可獲得這種感受。9.12 你是否同意將DVB(Digital Video Broadcasting)譯

15、成“數(shù)字電視廣播(技術(shù))”而將DTV(digital television / digital TV)譯成“數(shù)字電視”;你是否同意“video是television的同義詞”的說法。略。第10章 MPEG簡介10.1制定MPEG標(biāo)準(zhǔn)有哪4個(gè)階段以及各階段提交什么類型的文件?(1) 工作文件(Working Draft,WD):工作組(Working Group,WG)準(zhǔn)備的工作文件(2) 委員會草案(Committee Draft,CD):從工作組WG準(zhǔn)備好的工作文件WD提升上來的文件。這是ISO文檔的最初形式,它由ISO內(nèi)部正式調(diào)查研究和投票表決。(3) 國際標(biāo)準(zhǔn)草案(Draft Inter

16、national Standard,DIS):投票成員國對CD的內(nèi)容和說明滿意之后由委員會草案CD提升上來的文件。(4) 國際標(biāo)準(zhǔn)(International Standard,IS):由投票成員國、ISO的其他部門和其他委員會投票通過之后出版發(fā)布的文件。10.2 MPEG-1, -2, -4,-7,-21分別是什么標(biāo)準(zhǔn),各自要達(dá)到的目標(biāo)是什么?MPEG-1是數(shù)字電視標(biāo)準(zhǔn)。MPEG-1處理的是標(biāo)準(zhǔn)圖像交換格式的電視,即NTSC制為352像素240行/幀30幀/秒,PAL制為352像素288行/幀25幀/秒,壓縮的輸出速率定義在1.5 Mbit/s以下。這個(gè)標(biāo)準(zhǔn)主要是針對當(dāng)時(shí)具有這種數(shù)據(jù)傳輸率的

17、CD-ROM和網(wǎng)絡(luò)而開發(fā)的,用于在CD-ROM上存儲數(shù)字影視和在網(wǎng)絡(luò)上傳輸數(shù)字影視。MPEG-2是數(shù)字電視標(biāo)準(zhǔn)。MPEG-2標(biāo)準(zhǔn)是一個(gè)直接與數(shù)字電視廣播有關(guān)的高質(zhì)量圖像和聲音編碼標(biāo)準(zhǔn),是MPEG-1的擴(kuò)充。MPEG-2提供位速率的可變性能功能,其最基本目標(biāo)是:位速率為49 Mbit/s,最高達(dá)15 Mbit/s。MPEG-4是視聽對象編碼標(biāo)準(zhǔn)。MPEG-4是為視聽數(shù)據(jù)的編碼和交互播放開發(fā)算法和工具,是一個(gè)數(shù)據(jù)速率很低的多媒體通信標(biāo)準(zhǔn)。MPEG-4的目標(biāo)是要在異構(gòu)網(wǎng)絡(luò)環(huán)境下能夠高度可靠地工作,并且具有很強(qiáng)的交互功能。MPEG-7是多媒體內(nèi)容描述接口標(biāo)準(zhǔn)。MPEG-7的名稱叫做多媒體內(nèi)容描述接口,

18、目的是制定一套描述符標(biāo)準(zhǔn),用來描述各種類型的多媒體信息及它們之間的關(guān)系,以便更快更有效地檢索信息。這些媒體材料可包括靜態(tài)圖像、圖形、3D模型、聲音、話音、電視以及在多媒體演示中它們之間的組合關(guān)系。在某些情況下,數(shù)據(jù)類型還可包括面部特性和個(gè)人特性的表達(dá)。MPEG-21是多媒體框架標(biāo)準(zhǔn)。MPEG- 21企圖描述多媒體的元數(shù)據(jù)(metadata)元數(shù)據(jù)(metadata)是描述數(shù)據(jù)本身特性的數(shù)據(jù),如描述包含在數(shù)據(jù)流中的聲音和視像數(shù)據(jù)的元數(shù)據(jù),描述文件中的標(biāo)題、主題、作者和大小等的元數(shù)據(jù)。,用于全球多媒體對象的集成、創(chuàng)建、使用、操作、管理和傳送等操作,便于不同人群在異構(gòu)網(wǎng)絡(luò)環(huán)境下使用各種多媒體資源,它

19、的目標(biāo)是為未來多媒體的應(yīng)用提供一個(gè)完整的平臺。MPEG-21要解決的核心問題是資源共享、知識產(chǎn)權(quán)和版權(quán)的管理與保護(hù)。10.3 MPEG-A, -B, -C, -D和-E分別是什么標(biāo)準(zhǔn)?MPEG-A:多媒體應(yīng)用格式標(biāo)準(zhǔn),集成多種MPEG技術(shù)以提供專用的格式;MPEG-B:為專用系統(tǒng)提供系統(tǒng)技術(shù)標(biāo)準(zhǔn);MPEG-C:為專用電視提供電視技術(shù)標(biāo)準(zhǔn);MPEG-D:為專用聲音提供聲音技術(shù)標(biāo)準(zhǔn);MPEG-E:為應(yīng)用程序提供下載和執(zhí)行功能的多媒體中間件標(biāo)準(zhǔn)10.4 說明電視規(guī)格MPML和HPHL各自的含義。MPML (Main Profile, Main Level)指的是具有這種特性的電視:分辨率為72057

20、630,子采樣格式為4:2:0,位速率可高達(dá)15 Mbps。HPHL (High Profile, High Level)指的是具有這種特性的電視:分辨率為1920115260,子采樣格式為4:2:0或者4:2:2,位速率可高達(dá)80 Mbps。第11章 MPEG聲音11.1 列出你所知道的聽覺系統(tǒng)的特性。響度感知, 音高感知, 掩蔽效應(yīng)11.2 什么叫做聽閾?什么叫做痛閾?(1) 當(dāng)聲音弱到人的耳朵剛剛可以聽見時(shí),稱此時(shí)的聲音強(qiáng)度為“聽閾”(2) 當(dāng)聲音強(qiáng)到人的耳朵剛剛感到疼痛時(shí),稱此時(shí)的聲音強(qiáng)度為“聽閾”。實(shí)驗(yàn)表明,如果頻率為1 kHz的純音的聲強(qiáng)級達(dá)到120 dB左右時(shí),人的耳朵就感到疼痛

21、,這個(gè)閾值稱為“痛閾”。11.3 什么叫做頻域掩蔽?什么叫做時(shí)域掩蔽?(1) 強(qiáng)純音掩蔽在其附近同時(shí)發(fā)聲的弱純音,這種特性稱為頻域掩蔽。(2) 在時(shí)間方向上相鄰聲音之間的掩蔽,這種特性稱為時(shí)域掩蔽。11.4 MPEG-1的層1、2和3編碼分別使用了聽覺系統(tǒng)的什么特性?層1:頻域掩蔽特性;層2:頻域掩蔽特性 + 時(shí)間掩蔽特性;層3:頻域掩蔽特性 + 時(shí)間掩蔽特性 + 臨界頻帶特性(聲音頻率與掩蔽曲線不是線性關(guān)系);11.5 MPEG-1的層1、2和3編碼器的聲音輸出速率范圍分別是多少?層1:384 kbps層2:256192 kbps層3:128112 kbps11.6 MPEG-1的聲音質(zhì)量是

22、:AM FM 電話 near-CD CD-DA AM FM 電話 near-CD CD-DA11.7 什么叫做5.1聲道立體環(huán)繞聲?什么叫做7.1聲道立體環(huán)繞聲?(1) “5.1環(huán)繞聲”也稱為“3/2-立體聲加LFE”,其中的“.1”是指LFE聲道。它的含義是播音現(xiàn)場的前面可有3個(gè)喇叭聲道(左、中、右),后面可有2個(gè)環(huán)繞聲喇叭聲道,LFE是低頻音效的加強(qiáng)聲道。7.1聲道環(huán)繞立體聲與5.1類似。11.8 簡述MPEG-2 AAC的特性。MPEG-2 AAC是MPEG-2標(biāo)準(zhǔn)中的一種非常靈活的聲音感知編碼標(biāo)準(zhǔn)。它使用聽覺系統(tǒng)的掩蔽特性來減少聲音的數(shù)據(jù)量,并且通過把量化噪聲分散到各個(gè)子帶中,用全局信

23、號把噪聲掩蔽掉。AAC支持的采用頻率可從8 kHz到96 kHz,AAC編碼器的音源可以是單聲道的、立體聲的和多聲道的聲音。AAC標(biāo)準(zhǔn)可支持48個(gè)主聲道、16個(gè)低頻音效加強(qiáng)通道LFE、16個(gè)配音聲道或者叫做多語言聲道和16個(gè)數(shù)據(jù)流。MPEG-2 AAC在壓縮比為11:1,即在每個(gè)聲道的數(shù)據(jù)率為(44.116 )/11=64 kbps,而5個(gè)聲道的總數(shù)據(jù)率為320 kbps的情況下,很難區(qū)分還原后的聲音與原始聲音之間的差別。與MPEG-Audio層2相比,MPEG-2 AAC的壓縮率可提高1倍,而且質(zhì)量更高,與MPEG的層3相比,在質(zhì)量相同的條件下數(shù)據(jù)率是它的70%。11.9 什么叫做自然聲音?

24、什么叫做合成聲音?自然聲音通常是指人、動物等發(fā)出的聲音、彈奏樂器或其他音源自然發(fā)出的聲音。合成聲音通常指合成器生成的聲音,如MIDI。11.10 什么叫做TTS?至少列舉TTS的3個(gè)潛在應(yīng)用例子。通過話音合成設(shè)備自動地把基于文字的數(shù)據(jù)轉(zhuǎn)換為聲音輸出的一種技術(shù)。文語轉(zhuǎn)換的最終目標(biāo)是要使計(jì)算機(jī)像人一樣輸出清晰而又自然的聲音,也就是說,根據(jù)文本的內(nèi)容可以不同的情調(diào)來朗讀任意的文本。TTS是一個(gè)十分復(fù)雜的系統(tǒng),涉及到語言學(xué)、語音學(xué)、信號處理、人工智能等諸多的學(xué)科。盡管現(xiàn)有的TTS系統(tǒng)結(jié)構(gòu)各異,轉(zhuǎn)換方法不同,但是基本上可以分成兩個(gè)相對獨(dú)立的部分:文本分析,通過對輸入文本進(jìn)行詞法分析、語法分析,甚至語義分

25、析,從文本中抽取音素和韻律等發(fā)音信息。語音合成,使用從文本分析得到的發(fā)音信息去控制合成單元的譜特征(音色)和韻律特征(基頻、時(shí)長和幅度),送入聲音合成器(軟件或硬件)產(chǎn)生相應(yīng)的語音輸出。通過電話訪問信息,朗讀文本,盲人計(jì)算機(jī)等。11.11說出窄帶話音和寬帶話音的頻率范圍和編碼時(shí)使用的采樣頻率。對1003800 Hz的窄帶話音使用8 kHz采樣率,對50 7000 Hz的寬帶話音使用16 kHz的采樣率。11.12 MP3是什么?MP4是什么?MP3 (MPEG Audio Layer 3)的含義有兩種: MPEG-1聲音層3:MPEG-1 Audio標(biāo)準(zhǔn)中定義的聲音壓縮技術(shù)。MPEG聲音的壓縮

26、技術(shù)分為1層,2層和3層。層1典型的壓縮比為1:4,相應(yīng)的數(shù)據(jù)率為384 kbps;層2典型的壓縮比為1:61:8,數(shù)據(jù)率為256192 kbps;層3典型的壓縮比為1:101:12,相應(yīng)的數(shù)據(jù)率為128112 kbps,聲音質(zhì)量接近CD-DA; MP3文件:使用MPEG-1聲音層3壓縮技術(shù)和存儲格式的聲音文件。MP3文件是目前因特網(wǎng)上最流行的文件,它的文件擴(kuò)展名是.mp3,可以下載到袖珍MP3播放機(jī)或計(jì)算機(jī)上播放。MP4目前的主要含義有兩種: 文件格式:MPEG-4標(biāo)準(zhǔn)定義的文件格式,可包含視像、自然和合成聲音、二維和三維圖形、動畫文字等各種媒體的內(nèi)容,可用于存儲和網(wǎng)上傳輸; MP4聲音文件

27、:使用MPEG-4 AAC壓縮技術(shù)和存儲格式的聲音文件,它的文件擴(kuò)展名為.mp4。第12章 MPEG視像12.1電視圖像數(shù)據(jù)中有哪些冗余數(shù)據(jù)可去掉,目前分別采用什么方法減少冗余數(shù)據(jù)?電視圖像數(shù)據(jù)中的冗余數(shù)據(jù)可歸納成兩類:人的視覺特性感覺不到的冗余數(shù)據(jù)和電視圖像數(shù)據(jù)自身的冗余數(shù)據(jù),針對不同類型的冗余采用不同方法減少冗余,詳見下表。視像壓縮利用的各種冗余信息種類內(nèi)容目前用的主要方法空間冗余像素間的相關(guān)性變換編碼,預(yù)測編碼時(shí)間冗余時(shí)間方向上的相關(guān)性幀間預(yù)測,移動補(bǔ)償圖像構(gòu)造冗余圖像本身的構(gòu)造輪廓編碼,區(qū)域分割知識冗余收發(fā)兩端對人物的共有認(rèn)識對象編碼,知識編碼視覺冗余人的視覺特性非線性量化,位分配其他

28、不確定性因素12.2 在MPEG視像數(shù)據(jù)壓縮技術(shù)中,目前利用了視覺系統(tǒng)的哪兩種特性?人的視覺系統(tǒng)具有的兩種特性可以用來壓縮電視圖像數(shù)據(jù)。一是人眼對色度信號的敏感程度比對亮度信號的敏感程度低,利用這個(gè)特性可以把圖像中表達(dá)顏色的信號去掉一些而使人不易察覺;二是人眼對圖像細(xì)節(jié)的分辨能力有一定的限度,利用這個(gè)特性可以把圖像中的高頻信號去掉而使人不易察覺。12.3 MPEG-1編碼器輸出的電視圖像的數(shù)據(jù)率大約是多少?1.15 Mbps12.4 MPEG專家組在制定MPEG1/2 Video標(biāo)準(zhǔn)時(shí)定義了哪幾種圖像?哪種圖像的壓縮率最高?哪種圖像的壓縮率最低?(1) MPEG專家組定義了三種圖像:幀內(nèi)圖像I

29、(intra),預(yù)測圖像P(predicted )和雙向預(yù)測圖像B (bi-directionally interpolated )。(2) 雙向預(yù)測圖的壓縮率最高,幀內(nèi)圖像的壓縮率最低。12.5 有人認(rèn)為“圖像壓縮比越高越好”。你對這種說法有何看法?在圖像壓縮算法中,為了獲得比較高的壓縮率,通常要采用有損壓縮。如果籠統(tǒng)說“圖像壓縮比越高越好”是不嚴(yán)格的。因?yàn)閴嚎s比越高,意味圖像的質(zhì)量損失越大,重構(gòu)圖像的質(zhì)量將會越低。如果說“在圖像質(zhì)量相同的前提下,圖像壓縮比越高越好”是認(rèn)可的。12.6 有人說“MPEG1編碼器的壓縮比大約是200:1”。這種說法對不對?為什么?不對?!?00:1”是使用子采

30、樣、降低圖像分辨率和MPEG-1視像壓縮技術(shù)獲得的,而(1)電視圖像的子采樣(4:1:1)不是MPEG編碼器的功能,它的壓縮比為2:1;(2)電視圖像畫面尺寸(如PAL制720576)的降采樣(變成360288)也不屬于MPEG編碼器的功能,它的壓縮比為4:1。12.7 電視圖像的空間分辨率和時(shí)間分辨率是什么意思?空間分辨率:圖像的尺寸。例如,PAL制圖像尺寸:720576,360288。時(shí)間分辨率:圖像的幀數(shù)每秒。例如,PAL制電視圖像的時(shí)間分辨率為30幀/秒,NTSC電視圖像的時(shí)間分辨率為25幀/秒,電影圖像的時(shí)間分辨率為24幀/秒。12.8 在MPEG-1和MPEG-2中,典型的宏塊由多

31、少個(gè)像素組成;子采樣為4:2:0的宏塊分成多少個(gè)亮度圖塊、紅色差圖塊和藍(lán)色差圖塊,每個(gè)圖塊由多少個(gè)像素組成。在MPEG-1, MPEG-2中,典型的宏塊為1616像素。在子采樣為4:2:0的宏塊分成4個(gè)亮度圖塊、1個(gè)紅色差圖塊和1個(gè)藍(lán)色差圖塊,每個(gè)圖塊由88個(gè)像素組成。12.9 什么叫做移動估算?移動估算(motion estimation)是計(jì)算移動矢量的過程,也就是在參考圖像中查找與當(dāng)前編碼圖塊匹配最佳的圖塊的過程。12.10 什么叫做移動補(bǔ)償?計(jì)算當(dāng)前編碼圖塊與參考幀中的圖塊的像素值之差的過程。在編碼時(shí),使用移動矢量表示當(dāng)前幀的圖塊相對于過去或?qū)韼膱D塊的偏移量,使用當(dāng)前幀的與過去或?qū)?/p>

32、來幀的像素值的差值表示圖像的變化程度,這個(gè)差值在重構(gòu)當(dāng)前幀的圖塊時(shí)作為“補(bǔ)償量”;在解碼時(shí),利用移動矢量確定當(dāng)前幀的圖塊相對于過去或?qū)韼膱D塊位置,使用過去或?qū)韼南袼刂岛途幋a時(shí)得到的補(bǔ)償量重構(gòu)當(dāng)前幀的圖塊。第13章 MPEG-4 AVC/H.264視像13.1 與先前的MPEG-Video視像標(biāo)準(zhǔn)相比,在視像質(zhì)量相同的前提下,MPEG-4 AVC/H.264視像標(biāo)準(zhǔn)的壓縮效率提高了多少。壓縮效率提高23倍。13.2 MPEG-4 AVC/H.264提高編碼效率的主要技術(shù)是什么?MPEG-4 AVC/H.264提高編碼效率的主要改進(jìn)技術(shù)包括:(1) 采用可變圖塊大小的幀間預(yù)測和移動補(bǔ)償,預(yù)

33、測圖塊的大小不再局限于1616像素,可小到44像素,這樣就提高了預(yù)測精度,如將移動矢量精度提高到1/4個(gè)像素。(2) 采用空間的幀內(nèi)預(yù)測,預(yù)測圖塊的大小可以是1616像素的宏塊,也可以是44像素的圖塊,而且定義了多種預(yù)測方式,目的是找到相關(guān)性最大的預(yù)測。(3) 采用從DCT演變來的稱為“整數(shù)變換編碼”的方法,提高了編碼的運(yùn)算速度。(4) 熵編碼采用編碼效率更高的前后文自適應(yīng)可變長度編碼(context-based adaptive variable length coding, CAVLC)和前后文自適應(yīng)二元算術(shù)編碼(Context-based Adaptive Binary Arithmet

34、ic Coding,CABAC)。此外,標(biāo)準(zhǔn)還采用了多參考幀(multiple reference frame)和消除“塊狀失真(因壓縮率過高導(dǎo)致重構(gòu)圖像呈現(xiàn)的塊狀外觀)”濾波等技術(shù)。MPEG-4 AVC/H.264視像與MPEG-2和MPEG-4 Visual的性能比較見表13-3。第14章 光盤存儲器14.1 只讀光盤是如何記錄“0”和“1”的?只讀光盤通常是指CD/DVD系列只讀光盤。在盤上壓制凹坑的機(jī)械辦法來記錄“0”和“1”。凹坑的邊緣代表“1”,凹坑和非凹坑的平坦部分代表“0”,凹坑的長度和非凹坑的長度都代表有多少個(gè)“0”。14.2 CDDA的音樂信號的采樣頻率為什么選擇44.1 kHz?人耳朵(因人而異)能聽到的聲音信號頻

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論