版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第3章MULTIMEDIATECHNOLOGY主講教師:何源多媒體技術視頻信號的獲取與處理第3
章3.1圖像的數字化3.2
顏色的基本概念
3.2.1顏色的基本知識
3.2.2顏色空間表示
3.2.3顏色空間從技術角度的分類3.3圖形圖像數據表示
3.3.1數字圖像類型
3.3.21位圖
3.3.38位灰度圖
3.3.424位彩色圖像
3.3.58位彩色圖像
3.3.6其它圖像數據類型
3.3.7色彩模式的轉換3.4
常見靜態(tài)圖像文件格式3.5常見動態(tài)圖像文件格式3.6
多媒體數據壓縮技術
3.6.1
信息、數據與編碼
3.6.2數據壓縮的條件
3.6.3數據壓縮算法
1圖像的數字化3.1圖像的數字化
圖像數字化:將模擬式的連續(xù)圖像離散化,轉換為數字圖像,是數字圖像處理的先決條件。
●
模擬圖像:日常生活中見到的各種照片、圖片、廣告畫等一般是連續(xù)形式的模擬圖像。
●
數字圖像:計算機能處理的,以數字格式存儲的圖像。圖像數字化過程:“采樣”和“量化”。圖像數字化后表示形式:
連續(xù)圖像數字化后,用由離散量組成的一個矩陣g(i,j)表示。
g(1,1)g(1,2)……g(1,N)g(2,1)g(2,2)……g(2,N)G=
……
……
g(M,1)g(M,2)……g(M,N)矩陣中每個元素稱為像素或圖像元素。g(i,j)代表點(i,j)的灰度值,即亮度值。幾點說明:①
g(i,j)取值范圍:0<g(i,j)<∞。②
數字化采樣一般是按正方形點陣取樣。如圖:采樣網格:③
表示形式
●
黑白圖像:g(i,j),g(i,j)的值是點(i,j)的灰度級值;
●
彩色圖像:g(i,j,λ),“λ”是波長,反映色彩變化;
●
運動圖像(時間域上連續(xù)的圖像):
g(i,j,λ,t),“t”反映時間變化。2采樣
圖像在空間的離散化,用空間上部分點的灰度值代表圖像,這些點稱為采樣點。采樣步驟(靜態(tài)圖像):①
先沿垂直方向,按一定間隔取出各水平線上灰度值的一維掃描;②
對一維掃描線信號沿水平方向,按一定間隔,取出垂直線的灰度值,得到離散信號。運動圖像:先在時間軸上采樣,再進行靜態(tài)圖像的采樣。采樣示意圖采樣時,若每行像素為M個,每列像素為N個,則圖像大小為M×N個像素。采樣定理:若采樣頻率是圖像變化頻率的兩倍,就能無失真重建原圖。一般,圖像中細節(jié)越多,采樣間隔應該越小。采樣列采樣行像素行間隔采樣列間隔3量化
把采樣后所得的各像素的灰度值或顏色樣本從模擬量轉換到離散量的過程。連續(xù)灰度值Z
灰度標尺Zi+1ZiZi-1qi+1qiqi-1量化值q(整數)灰度量化255254…128127…10量化為8bit二進制數3.2顏色的基本概念3.2.1顏色的基本知識1人類視覺系統(tǒng)工作原理眼睛的工作原理與照相機一樣,鏡頭聚焦在圖像上,并投射在視網膜上(上下和左右顛倒)。桿狀細胞產生圖像的灰色陰影,錐體細胞產生顏色信號;眼中錐體細胞約6百萬個,分為紅、綠、藍三種;
R、G、B三種錐體細胞比例約:40:20:1,由此產生的非彩色信號比例約:2R+G+B/20
眼睛錐體細胞對光譜敏感度函數通常不用RGB等字母來表示。一個波長為λ的激光可以刺激一定數量的神經細胞,產生反應。說明:
●
E(λ):光源函數
●
S(λ):反射函數
●
C(λ):顏色信號,
C(λ)=E(λ)S(λ)●
qR,G,B(λ):錐體細胞光譜敏感度函數2顏色的三特性
●色調(Hue)顏色的外觀,用于區(qū)別顏色種類,反映該顏色最接近什么樣的光譜波長。如:紅、橙、黃、綠、青、藍、紫。可見光波長范圍:380~780nm
●
飽和度(Saturation)顏色的純度,反映顏色中灰色成分的多少?;疑煞衷缴?,飽和度越高,顏色越深。
●
亮度(Brightness)顏色中光的強度。亮度越低,越接近黑色;反之,則對應白色。顏色紡錐體亮度公式
Y——白;R——紅;
G——綠;B——藍●
NTSC彩色電視制式:
Y=0.299R+0.587G+0.114B●
PAL電視制式:
Y=0.222R+0.707G+0.071B色調不同:飽和度不同:亮度不同:3三種互補色三種基色:紅(R)、綠(G)、藍(B)
國際標準照明委員會CIE規(guī)定三原色光波長:紅色——700nm綠色——546.1nm
藍色——435.8nm三色原理:自然界的所有色彩都可以由三原色按不同的比例混合得到。三種原色是互相獨立的,它們中任何一種顏都不能用另外兩種顏色混合得到。三種互補色:紅——青(Cyan)綠——品紅(Magenta)藍——黃(Yellow)3.2.2顏色空間表示
顏色空間:人們組織和表示顏色的方法,也稱顏色度量體系、顏色制或顏色體制。3.2.3顏色空間從技術角度的分類從技術角度分:1)計算機圖形顏色空間如:RGB、CMYK、HSB、HIS等2)電視系統(tǒng)顏色空間如:YUV、YIQ等3)與設備無關的顏色空間如:CIELab、CIEXYZ等1CRT顯示器的RGB顏色模型
利用R、G、B三種基色光按不同的比例相加產生顏色。稱為“相加混色模式”。
配色方程式:
F=r[R]+g[G]+b[B]
說明:F表示任意彩色光;
r、g、b表示三種基色所占比例,r+g+b=1;
r[R]、g[G]、b[B]為構成F色光的三色分量。2相減混色顏色空間:CMY顏色模型
相減混色顏色空間
印刷、彩色打印機采用的顏色空間。利用CMYK四種顏色光線相減產生顏色,稱為“相減混色模式”。2相減混色顏色空間:CMY顏色模型
RGB到CMY的轉換
RGB→CMY公式:CMY→RGB公式:
3視頻中的顏色模型
目前世界上流行的三種彩色電視制式:●
NTSC制:“正交平衡調幅制”,1952年美國制定。美國、加拿大、日本、韓國、臺灣采用。●
PAL制:“逐行倒相正交平衡調幅制”,1962年西德制定。德國、英國、中國、朝鮮等采用?!?/p>
SECAM制:“順序傳送彩色與存儲制”,法國制定。法國、前蘇聯(lián)及東歐國家采用。不同的電視制式采用的顏色空間不同:
●
PAL和SECAM制:采用YUV顏色空間
●
NTSC制:采用YIQ顏色空間
●
數字電視系統(tǒng):采用YCrCb或Y‘PbPr顏色空間4CIE顏色系統(tǒng)
CIE召開的顏色科學史上兩次重要會議:
第一次會議(1931年):
●
StandardObserver標準:用顏色匹配函數表示
●
StandardIlluminants
●CIEXYZ基色系統(tǒng)
●
CIExyY
顏色空間
●
CIE色度圖(CIEchromaticitydiagram)
第二次會議(1976年):
●
CIE1976L*a*b*ColorModel(或CIELAB)
●
CIELUV
CIE色度圖
將每個三色矢量(X,Y,Z)值投影在連接(0,0,1),(0,1,0),(1,0,0)三點所形成的平面上,形成CIE色度圖。EE說明:1、圖中間E點位置,坐標(0.33,0.33),是一個典型的白點(whitepoint)。2、光譜軌跡上的色度(如圖所示“馬蹄狀”)是最飽和的純色彩。最接近白點的顏色是比較不飽和的顏色。CIE1976年的重要成果
以“對色視覺理論為基礎:基色有紅、黃、綠和藍四種,分別組成紅-綠、黃-藍兩對對立色調,而黑-白是另外一對。5L*a*b*顏色系統(tǒng)以“對色視覺理論(opponentcolortheoryofvision)”為基礎:基色有紅、黃、綠和藍四種,分別組成紅-綠、黃-藍兩對對立色調,而黑-白是另外一對。對色視覺理論定義顏色空間:
L*:光亮度,值從0~100a*:紅-綠軸,值從0~10b*:黃-藍軸,值從0~106超出范圍的顏色對超出范圍顏色的處理方法:方法一:利用最接近范圍內可用的色彩,如下圖;方法二:挑選接近的互補色。7YUV顏色模型
YUV編碼方式
:①Y——亮度信號
YUV將一個亮度信號編碼,即Y'。②U,V——色差信號色差是在相同亮度下,彩色與參考白色的差異,分別用U,V表示兩個彩色分量。
說明:●亮度信號Y構成黑白灰度圖;●色差U,V信號分別構成的兩幅單色圖●
圖案彼此是相互獨立的。YUV信號轉換過程:彩色圖像信號RGB信號
R0G0B0三分量信號
亮度信號Y、色差信號R-Y和B-YYUV信號
分色棱鏡分解放大、γ校正
矩陣變換
編碼
同一信道發(fā)送
RGB與YUV顏色空間的轉換關系:(4.27)(4.28)
YUV定義U、V兩個色差信號分別為:RGB與YUV之間非線性信號轉換關系:亮度和色度分離的優(yōu)點:
1)亮度信號Y和色差信號U、V相對獨立,可以在黑白電視上接收彩色電視信號。
2)能更有效地壓縮圖像的數據量。人眼對彩色圖像分辯力低于亮度分辨力,對彩色信號可采用較低的壓縮比。常用壓縮比:
①Y:U:V=8:4:4
每個亮度信號Y用一個字節(jié)(256級)表示;每兩個U、V色差信號用一個字節(jié)表示;
②Y:U:V=8:2:2
每個亮度信號Y用一個字節(jié)(256級)表示;每四個U、V色差信號用一個字節(jié)表示;8YIQ顏色模型
YIQ編碼方式
:①
Y——亮度信號②
I,Q——色差信號
說明:●
Y’不變;●
I及Q是將U、V旋轉33度后的值;●
如下頁圖所示。9YCbCr顏色模型一個國際性的標準清晰度電視圖像數字化標準。由于Recommendation601標準定義了8-bit的編碼,最大Y’值只有219,最小值+16,CbandCr有正負112的范圍,還有位移的范圍是+128。假使R’、G’、B’是界于[0,+1]的浮點數,然后我們可以獲得Y’,Cb,Cr在[0,255]之間的值。3.3圖形圖像數據表示3.3.1數字圖像類型真彩色圖像(TrueColor)索引色圖像(IndexColor)灰度圖(GrayScale)線畫稿(LineArt)靜態(tài)圖動態(tài)圖位圖(Bitmap)矢量圖(Vector)①矢量圖(Vector):用一系列繪圖指令,通過數學方式繪制的曲線及其它幾何體組成的圖形。
優(yōu)點:文件數據量很??;圖像質量與分辨率無關;易于對各個成分進行移動、縮放、旋轉和扭曲等變換,適于描述由多種比較規(guī)則的圖形元素構成的圖形。
缺點:圖像不很逼真,不易制作色彩變化豐富的圖像;不易在不同的軟件間交換文件。
矢量圖文件格式:3DS,DXF,WMF等。②位圖(Bitmap):通過像素點表示的圖像。每個像素點具有顏色屬性和位置屬性??蓮臄荡a相機、掃描儀或某些繪圖軟件獲得。優(yōu)點:色彩豐富,可直接、快速地顯示或印出。缺點:存儲量大,一般需要壓縮存儲。分辨率的大小決定位圖圖象的大小,低分辨率的圖象放大后會模糊不清。位圖文件格式:GIF、JPG、BMP、TIF等。用一位二進制數的顏色模式表現圖像,只有黑白兩種顏色,通常也被稱為“黑白藝術”、“位圖藝術”、“一位元藝術”。3.3.21位圖
4.3.38位灰度圖
用8bit二進制數表示像素灰度級,像素取值介于黑和白之間的256種灰度中的一種。只有灰度顏色而沒有彩色?!岸怠眻D像“灰度”圖像屏幕顯示分辨率:顯示器屏幕上每單位長度顯示的像素數量,即水平與垂直方向的像素個數,表示顯示器屏幕上的最大顯示區(qū)域。單位:每英寸點數(dpi)。屏幕分辨率由計算機的顯卡來決定。打印機分辨率:又稱輸出分辨率,指打印機輸出圖像時,每英寸的點數(像素)。決定輸出圖像的質量。單位:DPI。打印機分辨率可達300dpi,甚至720dpi。像素分辨率:指像素點本身的寬和高之比,一般為1:1。像素深度:存儲每個像素所用的二進制位數。像素深度決定每幅圖像顏色數。例如:用RGB三個分量表示顏色,若每個分量用8位二進制數表示,一個顏色占24位二進制數,則像素深度為24。多媒體中至少要用8位——256種顏色。顏色深度顏色總數圖像名稱12單色圖像416索引16色圖像8256索引256色圖像1665536HI—Color
圖像2416672216TrueColor
圖像也稱作真彩色圖。每個像素由代表RGB的三個字節(jié)組成,每個字節(jié)能表示這種顏色0~255之間的不同亮度值。三個字節(jié)組合起來共24位,即每個像素的顏色用24位二進制來表示,可以產生1670萬種不同顏色。用這種方式獲得的顏色通常稱為RGB顏色。這種方式所表達的顏色遠遠超出了人眼所能辨別的范圍,故稱為“真彩色”。3.3.424位彩色圖像
即索引圖像(Index),也稱為“映射顏色”。
原理:預先定義一個顏色表——彩色碼表。表中的每種顏色有一個索引號。當顯示一幅彩色圖像時,先將圖片中像素值經過計算,轉換成彩色碼表中對應的顏色索引號,然后根據索引值,在表中找到可用的最接近的色彩,顯示出來。
特點:圖像顯示的顏色數量有限,一幅索引顏色的圖像最多只能顯示256種顏色;文件較小。3.3.58位彩色圖像
雙色調圖像模式:通過2-4種自定油墨創(chuàng)建雙色調圖像。3.3.6其它圖像數據類型
多通道模式:每個通道256級灰度。在進行特殊打印時,多通道圖像十分有用。3.3.7色彩模式的轉換
RGB色彩模式轉換成位圖
:先要將色彩模式轉換成灰度模式,然后才可完成位圖模式的轉換。RGB模式轉換成CMYK模式:必須經過校樣顏色、色域警告和色彩校正的設置,才能轉換成CMYK
模式。3.4常見靜態(tài)圖像文件格式
圖像數據量大小=像素總數×圖像深度÷8圖像文件大小用字節(jié)表示圖像文件大小時,一幅未經壓縮的數字圖像的數據量大小計算如下:例如:一幅640×480的256色圖像為
640×480×8/8=307200字節(jié)①GIF格式:索引圖像,CompuServe公司開發(fā)。稱圖像互換格式(GraphicInterchangeFormat)。
優(yōu)點:文件小,適合表現色彩不豐富的圖像,支持交錯,透明顏色及動畫(GIF89a)效果。
交錯:即圖象下載時從模糊逐漸到清晰的過程。對圖像進行交錯處理之后,顯示圖像時不再嚴格地從上到下,一行一行像素顯示,而是每隔八行處理一次,然后再填補其間的空隙直到清晰為止。用戶可以盡早看到圖像全局。版本:版本號GIF87a是1987年開,描述單一(靜止)圖像;
1989年擴充版本GIF89a,支持透明顏色和動畫,描述多幀圖像。②
BMP格式:
Windows采用的圖像文件存儲格式。文件描述單一(靜止)圖像,支持顏色數有2、16、256、16777216種。優(yōu)點:采用的是無損壓縮,因此圖像完全不失真。缺點:圖像文件的尺寸較大,且不支持含Alpha通道的圖像信息;不適于網絡傳送,不適于提供印刷文件。③
JPEG格式:“聯(lián)合圖像專家組”制定。
聯(lián)合圖像專家組(JointPhotographicExpertsGroup):由“國際標準化組織ISO”和“國際電工技術委員會IEC”組成的小組,負責制定靜態(tài)數字圖像數據壓縮編碼標準。這個專家組開發(fā)的算法稱為JPEG算法(標準),是國際上通用的標準。最新的JPEG標準是JPEG2000。優(yōu)點:支持16M色彩(24位色);采用有損壓縮編碼形式,數據量??;常用于色彩比較豐富的圖像壓縮,對顏色數較少的圖像壓縮沒有優(yōu)勢。缺點:經解壓縮,方可顯示圖像,顯示速度慢。④
TIFF格式:
TagImageFileFormat,Aldus公司開發(fā),用于精確描述圖像的場合。●使用要點
(1)平面設計作品的最佳表現形式
(2)用于提供印刷文件
(3)不適于網絡傳送文件頭標識信息區(qū)圖像數據●特點
(1)擴展名采用“.tif”(2)文件描述單一(靜止)圖像
(3)彩色模式:21(單色)
~232(4)支持多平臺(PC&Macintosh)(5)可采用多種壓縮數據格式⑤
PNG格式:
PortableNetworkGraphicFormat,流式網絡圖形格式,這個名稱來源于非官方的“PNG'sNotGIF”,是一種位圖文件存儲格式?!裉攸c使用彩色查找表,可支持256種顏色的彩色圖像;圖像文件格式允許連續(xù)讀出和寫入圖像數據;采用逐次逼近顯示的方式;獨立于計算機軟硬件環(huán)境;使用無損壓縮。⑥
EXIF格式:
ExchangeableImageFile,可交換圖像文件,是專門為數碼相機的照片設定的。
Exif
文件實際是JPEG文件的一種,用戶可以使用任何支持JPEG格式的圖像工具軟件觀看或修改Exif文件,但打開時可能看不到Exif信息。
EXIF信息就是由數碼相機采集一系列的信息,然后放置在JPEG/TIFF文件的頭部。即EXIF信息是鑲嵌在JPEG/TIFF圖像文件格式內的,包括攝影時的光圈、快門、ISO、日期時間,相機品牌型號,色彩編碼,拍攝時錄制的聲音GPS等一組拍攝參數。⑦
PDF格式:是由Adobe公司推出的專為網上出版而制訂的電子文件格式,可以覆蓋矢量式圖像和點陣式圖像,并支持超級鏈接。Adobe公司設計PDF文件格式的目的是為了支持跨平臺上的。
●特點可以保存多頁信息,包含圖形和文本;這種文件格式與操作系統(tǒng)平臺無關;可以不依賴操作系統(tǒng)的語言和字體及顯示設備;使用了工業(yè)標準的壓縮算法。⑧
WMF格式:
WindowsMetafile的縮寫,簡稱圖元文件,是微軟公司定義的一種Windows平臺下的圖形文件格式,屬于矢量文件格式。
●特點文件短小、圖案造型化;可以用ACDSEE編輯;圖形往往較粗糙。3.5常見動態(tài)圖像文件格式
動態(tài)圖像由多幅連續(xù)的圖像序列構成,圖像沿時間軸以Δt的間隔排列。當Δt≤視覺滯留時間,就會產生動感?!駝討B(tài)原理●動態(tài)圖像的特點1)具有時間上的連續(xù)性。2)具有時間上的延續(xù)性。3)具有幀之間的相關性。4)具有強烈的實時性。組合位圖數據調色盤數據速度參數壓縮算法●
動態(tài)圖像文件構成①MPEG/MPG/DAT格式:由ISO和IEC組成的一個專家組,稱為“活動圖像專家組”。負責開發(fā)電視圖像數據和聲音數據的編碼、解碼和它們的同步等標準。已有的MPEG標準:
MPEG-1:數字電視標準
MPEG-2:數字電視標準
MPEG-4:多媒體應用標準
MPEG-7:多媒體內容描述接口標準
MPEG-1數字電視標準:1992年正式發(fā)布。分三個組成部分:視頻、音頻和系統(tǒng)。廣泛應用在VCD的制作和在網絡上傳輸的數字影視上。
MPEG-1壓縮算法,可把一部120分鐘長的電影壓縮到1.2GB左右。
MPEG-2數字電視標準:應用在DVD制作,以及HDTV(高清晰電視廣播)和一些高要求視頻編輯、處理上。使用MPEG-2的壓縮算法壓縮一部120分鐘長的電影可以壓縮到5-8GB大小,但它的圖像質量是MPEG-1無法相比的。名稱MPEG-1MPEG-2(基本型)標準化時間1992年1994年主要應用CD-Rom上的數字電視,VCD數字TV、DVD空間分辨率CIF格式(1/4TV),288×360像素TV,(576×720)像素時間分辨率25~30幀/秒50-60場/秒位速率5Mb/s15Mb/s質量相當于VHS相當于NTSC/PAL電視壓縮率20~3030~40MPEG-1和MPEG-2的編碼參數②
AVI格式:
AudioVideoInterleave,音頻視頻交互。由微軟公司制定的動態(tài)影像標準,在Windows應用程序中較常見。
特點:●
AVI格式的文件不需要專門的硬件支持就能播放和存儲,可把視頻信號和音頻信號同時保存在文件中。●
采用320×240的顯示尺寸,擴展名為“.avi”?!窭靡曨l編輯軟件,可以進行剪輯、合成、配解說詞等多種編輯?!?/p>
PowerPoint可以播放AVI視頻圖像。利用高級程序設計語言,可定義、調用和播放AVI視頻文件。③
FLI/FLC格式:
Autodesk公司開發(fā)的文件格式,用于存儲一組位圖圖像。FLI和FLC是英文Flicks的不同縮寫形式,意為“電影”:
●
FLC格式采用幀與幀之間求差的算法以及運算長度壓縮算法進行數據的壓縮和解壓縮。FLC格式的動畫●特點:畫面尺寸隨意、數據量小、實時性好、動畫演播平穩(wěn)等。
FLC格式不支持同步聲音。④
RA/RM/RAM格式:
RealNetworks公司制定。通過RealPlayer在Internet上進行實況轉播的音頻/視頻文件。是視頻流技術的始創(chuàng)者。
特點:可以在用56KMODEM撥號上網的條件實現不間斷的視頻播放,圖像質量比VCD差。⑤
MOV格式:由Apple公司制定。能被QuickTime支持的數字視頻格式,提供1/4屏大小,已成為因特網實時動態(tài)圖像標準。⑥
WMV格式:一種流媒體技術標準。
優(yōu)點:可擴充的媒體類型、本地或網絡回放、可伸縮的媒體類型、流的優(yōu)先級化、多語言支持等。⑧
DIR格式:由Macromedia公司的Director動畫設計軟件產生的動態(tài)影像文件。⑦
ASF格式:是微軟為了和Realplayer競爭而發(fā)展出來的一種可以直接在網上觀看視頻節(jié)目的文件壓縮格式。使用MPEG4的壓縮算法,壓縮率和圖像的質量較好。質量比VCD差,比RAM格式好。3.6多媒體數據壓縮技術
3.6.1信息、數據與編碼1.信息和熵●信息量的大小和消息有一定的關系。在數學上,消息是其出現概率的單調下降函數?!裥畔⒘浚簽榱藦腘個相等的可能事件中挑選出一個事件所需的信息度量和含量,所提問“是或否”的次數。要從256個數中選定某一個數,可以先提問“是否大于128?”例例●隨著每次詢問,有半數的可能事件被取消,這個過程由公式表示:設:從N個數中選定任意一個數x的概率為p(x),假定選定任意一個數的概率都相等,即p(x)=1/N,則信息量為:log2256=8bit求信息的“熵”(熵是平均信息量),信息源X的符號集為xi(i=1,2,…,N)。設:xi出現的概率為p(xi),則信息源X的熵為:
I[p(x)]=log2N=-log21/N=-log2p(x)H(x)=P(xi
)log2p(xi)∑P(xi
)I[p(xi
)]=-∑ni=1ni=1信息與數據2.I(ai
)=-log2Pi(i=1,2,…,r)公式中,Pi(i
=1,2,…,r)是隨機消息組合X{a1,a2,…,ar}中的消息ai(i
=1,2,…,r)的先驗概率。而I(ai)(i=1,2,…,r)在X的先驗概率空間P{p1,p2,…,pr}中的統(tǒng)計平均值為信息源X的熵:H(X)=H{p1,p2,…,pr}=-Pilog2pi∑ni=1信息可以用函數表示:1)文本——假設屏幕顯示分辨率為1024×768,字符為16×16點陣,每個字符用4個字節(jié)表示,則:(1024/16)×(768/16)×4B=12288B2)圖像——假定8位彩色圖像顯示在1024×768分辨率的屏幕上,則:
1024×768×log2256=768KB3)音頻——假定模擬聲音頻率22050Hz,其字采樣頻率44100Hz,采樣精度為16bit,雙聲道立體聲模式,則1min所需數據量為:
44100Hz×2B×2×60s=10MB/min4)視頻——采用帶寬為5MHz的PAL制視頻信號,掃描速度25幀/s,樣本寬度24bit,采樣頻率最低10MHz,則:
10÷25×24=9.6Mbit多媒體信息的數據量3.數據壓縮的條件3.6.2●
數據冗余度●
信息傳輸與存儲的限制■44.1kHz/Stereo1.3MB■22.0kHz/Mono0.3MB■Stop重復數據可忽略數據●
人類不敏感因素224顏色(16,777,216色)28顏色(256色)●音頻不敏感因素(試聽)●
顏色不敏感因素數據冗余1●
冗余基本概念●
冗余——信息所具有的各種性質中多余的無用空間●
冗余度——多余的無用空間的程度I=D-duI—信息量D—數據量du—冗余量●
信息量與冗余的關系數據冗余1●
冗余分類●
空間冗余——規(guī)則物體的物理相關性。靜態(tài)圖像中最常見。●
時間冗余——視頻與動畫畫面間的相關性。●
統(tǒng)計冗余——具有空間冗余和時間冗余?!?/p>
結構冗余——規(guī)則紋理、相互重疊的結構表面。●
信息熵冗余——編碼冗余。●
視覺冗余——人的視覺系統(tǒng)對圖像的敏感性是非均勻和非線性的?!?/p>
知識冗余——可以憑借經驗識別的。●
其他冗余——上述7種以外的冗余。數據壓縮算法3.6.31數據壓縮算法分類●
無損壓縮編碼
——壓縮數據還原后,與原始數據一致,無損失。霍夫曼編碼行程編碼算術編碼……●
有損壓縮編碼
——壓縮后再還原的數據有損失。預測編碼變換編碼統(tǒng)計編碼行程編碼算數編碼LZW編碼……預測編碼原理2②.預測編碼的應用預測編碼用于圖像的傳輸和存儲。對于連續(xù)的多幀圖像,新一幀通常保留前一幀的部分內容。首先存儲當前內容,如像點、幀或線。然后與下一幀圖像進行比較(預測),把不同點存儲或傳輸,而相同點則是數據冗余,予以剔除?!耦A測編碼——有損壓縮編碼,主要對統(tǒng)計冗余進行壓縮。①.預測編碼的基本原理用原樣本值對新樣本進行預測,得到新樣本的預測值。接著,取新樣本的實際值和預測值進行比較,二者相減得到差值,再對差值進行編碼。DPCM預測壓縮算法③.●工作原理首先比較相鄰的兩個像素,如果存在差異,則傳送差異之處的差值;若無差異,則不傳送差值。④.ADPCM自適應差分編碼ADPCM,自適應差分編碼調制編碼,具有自適應特性,即預測器的預測系數和量化參數,能根據圖像的局部區(qū)域分布特點而自動調整。ADPCM是一種針對16bits(或8bits)聲音波形數據的一種有損壓縮算法,它將聲音流中每次采樣的16bit數據以4bit存儲,所以壓縮比為1:4。該編碼主要用于對中等質量的音頻信號進行高效率壓縮,如語音信號、調幅廣播信號的壓縮等?!?/p>
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度車庫門自動開閉系統(tǒng)維修合同3篇
- 英杰電氣:2024年半年度報告
- 2025年度石油鉆井平臺打眼鉆孔放炮合同4篇
- 二零二五年度斷橋鋁窗戶安裝與節(jié)能補貼申請合同3篇
- 2025年個人收入證明標準范本合同編制4篇
- 2025年度個人住房貸款延期還款及利率調整協(xié)議4篇
- 二零二五年度航空航天產業(yè)園廠房租賃及研發(fā)合同3篇
- 二零二五年度車庫車位租賃與停車場綠化美化合同4篇
- 玉溪云南玉溪易門縣教育體育系統(tǒng)面向2025年畢業(yè)生招聘教師6人筆試歷年參考題庫附帶答案詳解
- 玉溪2025年云南玉溪市江川區(qū)審計局招聘公益性崗位工作人員筆試歷年參考題庫附帶答案詳解
- 支氣管鏡護理測試題
- 大連理工大學信封紙
- VI設計輔助圖形設計
- 淺談小學勞動教育的開展與探究 論文
- 2023年全國4月高等教育自學考試管理學原理00054試題及答案新編
- 河北省大學生調研河北社會調查活動項目申請書
- JJG 921-2021環(huán)境振動分析儀
- 中藥炮制學-第五、六章
- 小兒高熱驚厥精品課件
- 兩段焙燒除砷技術簡介 - 文字版(1)(2)課件
- 實習證明模板免費下載【8篇】
評論
0/150
提交評論