多媒體信息編碼課件_第1頁
多媒體信息編碼課件_第2頁
多媒體信息編碼課件_第3頁
多媒體信息編碼課件_第4頁
多媒體信息編碼課件_第5頁
已閱讀5頁,還剩25頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

第四章數(shù)制和信息編碼多媒體信息編碼多媒體分類

通常,人們將文本、音頻、視頻、圖形、圖像、動畫的綜合體籠統(tǒng)稱為“多媒體”。由此可見,多媒體信息包括以下5種:

文本

圖形、圖像

動畫

聲音

視頻影像各類文字和符號文字和符號多媒體多媒體多媒體多媒體概述通過計算而描述的矢量圖形文字圖形矢量圖形對象●用像素點描述的自然影像文字圖形圖像位圖圖像對象●單畫面矢量動畫和多畫面幀動畫文字圖形圖像動畫多畫面幀動畫單畫面矢量動畫FRAME01FRAME02FRAME03FRAME04FRAME05FRAME06FRAME07動畫對象●音頻數(shù)字信號、壓縮音頻信號文字圖形圖像動畫音頻●midi音頻●

wav音頻●

mp3壓縮音頻音頻對象●視頻數(shù)字信號AVI、壓縮視頻信號MPG文字圖形圖像動畫音頻視頻音頻+視頻AudioVedioInformation視頻對象●END一、音頻信息

1.基本概念聲波:聲源體發(fā)生振動會引起四周空氣 振蕩,振蕩方式就是聲波。 復雜的聲波由許許多具有不同振幅和頻率的正弦波組成。周期T:重復出現(xiàn)的時間間隔;振幅A:波形相對基線的最大位移, 表示音量的大小;頻率f:信號每秒鐘變化的次數(shù),即1/T

以赫茲(Hz)為單位。聲音按頻率分類

正常人所能聽到的聲音頻率范圍為20Hz~20kHz。

聲音質(zhì)量的頻率范圍:CD如隨身聽

FM:調(diào)頻

AM:調(diào)幅

把調(diào)制信號從低頻搬移到了高頻,以便利用電離層傳播,

調(diào)頻聲音的高低變?yōu)轭l率的變化的電信號,調(diào)幅就是用聲音的高低變?yōu)榉鹊淖兓碾娦盘?2.模擬音頻的數(shù)字化用計算機對音頻信息處理,就要將模擬信號(如語音、音樂等)轉(zhuǎn)換成維數(shù)字信號。采樣

每隔一定時間間隔對模擬 波形上取一個幅度值。量化將每個采樣點得到的幅度值 以數(shù)字存儲。編碼將采樣和量化后的數(shù)字數(shù)據(jù) 以一定的格式記錄下來模擬信號采樣量化編碼數(shù)字信號

振幅

頻率1/T

采樣點

T

振幅1/TT3.數(shù)字音頻的技術指標

采樣頻率、量化位數(shù)和聲道數(shù)采樣頻率:

每秒鐘的采樣次數(shù)量化位數(shù)(采樣精度)

:存放采樣點振幅值的二進制位數(shù)。通常 量化位數(shù)有8位、16位,分別表示有28、216個等級。聲道數(shù):聲音通道的個數(shù),立體聲為雙聲道。每秒鐘存儲聲音容量的公式為:

采樣頻率×采樣精度×聲道數(shù)/8=字節(jié)數(shù)例如,用44.10kHz的采樣頻率,16位的精度存儲,則錄制1秒鐘的立體聲節(jié)目,其WAV文件所需的存儲量為:44100×16×2/8=176400(字節(jié))采樣頻率和量化參數(shù)比較4.數(shù)字音頻的文件格式

Wave格式文件(.Wav)

記錄了真實聲音的二進制采樣數(shù)據(jù),通常文件較大。

MIDI格式文件(.MID)

數(shù)字音樂的國際標準.記錄的是音符數(shù)字,文件小。

MPEG音頻文件(.MP1/.MP2/.MP3)

采用MPEG音頻壓縮標準進行壓縮的文件。

RA格式文件(.ra)

RA(RealAudio)是RealNetwork公司制定的音頻壓縮規(guī)范,有較高的壓縮比,采用流媒體的方式在網(wǎng)上實時播放。

5.聲音的錄制與播放

“錄音機”是用于聲音文件的錄制與播放,還可以對聲音進行編輯和特殊效果處理。錄制聲音

編輯聲音 刪除聲音當前位置之前或之后 插入聲音 移動聲音

刪除和插入間接完成二、數(shù)字圖像及處理

1.基本概念

圖形和圖像

圖形:由點、線等組成的有邊界畫面,文件中存放描述圖形的指令。圖像:由圖像設備輸入的無邊界畫面,數(shù)字化后以位圖形式存儲。圖形與圖像的數(shù)字化分辨率(行、列)和顏色深度真彩色每個像素點占3個字節(jié),224=16777216種顏色。計算存儲一秒圖像公式:

列數(shù)×行數(shù)×像素的顏色深度/8×幀/秒=字節(jié)數(shù)例:1280×1024分辨率的“真彩色”電視圖像,按每秒30幀計算,顯示1分鐘,則需要:

1280×1024×3×30×60≈6.6GB2.圖像的數(shù)字化采樣

用多少個像素點的“列數(shù)×行數(shù)”表示,分辨率越高,圖像越清晰,存儲量也越大。量化

量化是在圖像離散化后,將表示圖像色彩濃淡的連續(xù)變化值離化為整數(shù)值的過程。把量化時所確定的整數(shù)值取值個數(shù)稱為量化級數(shù),也稱為顏色深度.

圖像采樣量化數(shù)字圖像顏色深度①黑白圖圖像的顏色深度為1,則用一個二進制位1和0表示純白、純黑兩種情況;②灰度圖圖像的顏色深度為8,占一個字節(jié),灰度級別為256級。通過調(diào)整黑白兩色的程度(稱顏色灰度)來有效地顯示單色圖像;③RGB24位真彩色彩色圖像顯示時,由紅、綠、藍三基色通過不同的強度混合而成,當強度分成256級(值為0~255),占24位,就構(gòu)成了224=16777216種顏色的“真彩色”圖像?;叶葓D彩色圖

圖像的分辨率和像素位的顏色深度決定了圖像文件的大小,計算公式為:

列數(shù)×行數(shù)×顏色深度÷8=圖像字節(jié)數(shù)例8.2當要表示一個分辨率為640×480的“24位真彩色”圖像,則需要:

640×480×24÷8≈1MB

由此可見,數(shù)字化后的圖像數(shù)據(jù)量十分巨大,必須采用編碼技術來壓縮信息。它是圖像傳輸與存儲的關鍵。2.常用圖像文件格式BMP和DIB格式文件與設備無關的位圖格式文件,Windows環(huán)境中經(jīng)常使用.GIF格式文件

Internet上的重要文件格式之一,最大不超過64KB,

256色以內(nèi),壓縮比較高,與設備無關。JPEG格式文件(.JPG)

利用JPEG方法壓縮,Internet上重要文件格式之一,適用于處理256色以上、大幅面圖像。WMF格式文件位圖與矢量圖的混合體,Windows中許多剪貼畫圖像是以該格式存儲的。廣泛應用于桌面出版印刷領域。

3.圖像數(shù)據(jù)的獲取利用圖像處理軟件和現(xiàn)成的圖像庫

最常用的是Photoshop,可以繪圖,也可以編輯來自網(wǎng)絡、CD-ROM光盤上存儲的圖像庫

“畫圖”程序可以獲取屏幕界面利用數(shù)字化設備獲取數(shù)碼相機、數(shù)字攝象機,將拍攝的自然界景物按數(shù)字格式存儲通過連接轉(zhuǎn)換轉(zhuǎn)換成計算機中的圖像和影象文件。掃描儀將照片、藝術作品轉(zhuǎn)換成數(shù)字圖像文件。

三、視頻視頻是將一幅幅獨立圖像組成的序列按照一定的速率連續(xù)播放,利用視覺暫留現(xiàn)象在人的眼前呈現(xiàn)出連續(xù)運動的畫面。模擬視頻常用兩種標準:NTSC制式(30幀/秒,525行/幀)PAL制式(25幀/秒,625行/幀),我國采用PAL制式。

例1分鐘的數(shù)字視頻容量640×480×3×30×60=1658880000字節(jié)分辨率幀/秒采樣深度

時間常用視頻文件格式AVI(Audio-VideoInterleaved)文件將視頻與音頻信息交錯地保存在一個文件中,較好地解決了音頻與視頻的同步問題,已成為Windows視頻標準格式文件。MOV文件利用它可以合成視頻、音頻、動畫、靜止圖像等多種素材。MPG(.mpg)文件是按照MPEG標準壓縮的全屏視頻的標準文件。DAT文件是VCD專用的格式文件,文件結(jié)構(gòu)與MPG文件格式基本相同。

流媒體概述

流媒體一種可以使音頻、視頻等多媒體文件能在Internet上以實時的、無需下載等待的流式傳輸方式進行播放的技術應用互聯(lián)網(wǎng)直播視頻點播遠程教育視頻會議系統(tǒng)常用流媒體文件RealMedia(RealNetworks)RA(RealAudio)用來傳輸接近CD音質(zhì)的音頻數(shù)據(jù)RM(RealVideo)在低速率的網(wǎng)絡上實時傳輸活動視頻影像RF(RealFlash)一種高壓縮比的動畫格式QuickTime(Apple)是數(shù)字媒體領域事實上的工業(yè)標準,是創(chuàng)建3D動畫、實時效果、虛擬現(xiàn)實、A/V和其他數(shù)字流媒體的重要基礎。ASF與WMA(Microsoft)ASF是一種數(shù)據(jù)格式,音頻、視頻、圖像以及控制命令腳本等多媒體信息通過這種格式,以網(wǎng)絡數(shù)據(jù)包的形式傳輸,實現(xiàn)流式多媒體內(nèi)容發(fā)布。WMV是微軟公司推出的與MP3格式齊名的一種音頻格式,是用于高清晰度映像的編解碼器。數(shù)據(jù)壓縮技術

數(shù)字化了的視頻和音頻信號的數(shù)量之大是非常驚人的。帶來的問題

占用存儲容量降低通信干線的信道傳輸率影響計算機的處理速度和播放效果問題的解決:數(shù)據(jù)壓縮數(shù)據(jù)壓縮:一般可以分為有損壓縮和無損壓縮兩種。數(shù)據(jù)壓縮技術的性能指標

①壓縮比:

即壓縮前后所需的信息存儲之比要大;

②恢復效果即要盡可能恢復到原始數(shù)據(jù)

③速度即壓縮、解壓縮的速度

④開銷實現(xiàn)壓縮的軟、硬件開銷要小

無損壓縮(解壓縮后信息不失真,可逆)

這類算法主要特點是壓縮比較低,為2:1~5:1,一般用來壓縮文本數(shù)據(jù)或計算機繪制的圖像(色彩不豐富)。典型的編碼:行程編碼:對連續(xù)出現(xiàn)的符號用一個計數(shù)值來表示,能確保解壓后的數(shù)據(jù)不失真。例用于文字壓縮:

AAAAABBBBCCDDDDDD5A4B2C6D

Huffman編碼編碼思想:出現(xiàn)頻率較高的符號采用短碼字,出現(xiàn)頻率較低的符號采用較長的碼字,以達到縮短平均碼長來實現(xiàn)數(shù)據(jù)的壓縮。2.有損壓縮有損壓縮方法是以犧牲某些信息(這部分信息基本不影響對原始數(shù)據(jù)的理解)為代價,換取了較高的壓縮比。廣泛用于語音、圖像和視頻數(shù)據(jù)的壓縮。

3.數(shù)據(jù)壓縮的國際標準

JPEG標準適用于連續(xù)色調(diào)和多級灰度的靜態(tài)圖像

MPEG標準適用于運動圖像、音頻信息。包

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論