第五章-多媒體技術基礎-2016_第1頁
第五章-多媒體技術基礎-2016_第2頁
第五章-多媒體技術基礎-2016_第3頁
第五章-多媒體技術基礎-2016_第4頁
第五章-多媒體技術基礎-2016_第5頁
已閱讀5頁,還剩50頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、大學計算機基礎大學計算機基礎第5章 多媒體技術基礎5.1 多媒體技術概述5.2 聲音5.3 圖形和圖像5.4 動畫5.5 視頻n 什么是媒體5.1.1什么是多媒體技術 媒體的分類5.1.1什么是多媒體技術媒體的分類5.1.1什么是多媒體技術 媒體的分類5.1.1什么是多媒體技術 媒體的分類5.1.1什么是多媒體技術 媒體的分類5.1.1什么是多媒體技術 媒體的分類5.1.1什么是多媒體技術CPUOutputDeviceStorageInputDevice表示媒體存儲媒體顯示媒體顯示媒體感知媒體感知媒體傳輸媒體表示媒體 媒體的分類5.1.1什么是多媒體技術n 數(shù)字媒體:指以數(shù)字化形式存儲、處理和

2、傳播信息的媒體;這些信息載體包括數(shù)字化的文字、圖形、圖像、聲音、視頻影像和動畫等感知媒體,和表示這些感覺媒體的表示媒體(編碼),以及存儲、傳輸、顯示表示媒體的實物媒體。但通常意義下所稱的數(shù)字媒體常常指感知媒體。n2005中國數(shù)字媒體技術發(fā)展白皮書將數(shù)字媒體定義為:數(shù)字媒體是數(shù)字化的內容作品,以現(xiàn)代網(wǎng)絡為主要傳播載體,通過完善的服務體系,分發(fā)到終端和用戶進行消費的全過程。n 簡單來講,“數(shù)字媒體”一般就是指“多媒體”,是由數(shù)字技術支持的信息傳輸載體,其表現(xiàn)形式更復雜,更具視覺沖擊力,更具有互動特性。 什么是數(shù)字媒體5.1.1什么是多媒體技術包括文字、數(shù)字和符號信息,是數(shù)字媒體信息系統(tǒng)中出現(xiàn)最頻繁

3、的媒體。1, 2,3,4,5,6,7,8,9,05.1.1什么是多媒體技術5.1.1什么是多媒體技術5.1.1什么是多媒體技術5.1.1什么是多媒體技術5.1.1什么是多媒體技術n多媒體是指能同時同時獲取、處理、編輯和展示兩個兩個以上不同類型信息媒體的技術n多媒體技術的特點(1)數(shù)字化:多媒體數(shù)字化是指文字、數(shù)字、圖形、圖像、音頻、動畫和視頻等多媒體,都是以數(shù)字的形式表示,依賴于計算機進行存儲和傳播,而且便于修改和保存。(2)交互性:交互是指用戶可以與計算機的多媒體信息進行交互操作,并能有效地控制和使用信息。(3)多樣化:多樣化是指計算機所能處理的信息媒體的多樣化,包括文字、數(shù)字、圖形、圖像、

4、音頻、動畫和視頻等多種媒體信息。(4)集成性:集成性是指以計算機為中心綜合處理多種信息媒體,包括信息媒體的集成和處理這些媒體的硬件、軟件的集成。5.1.2 多媒體技術的應用領域視頻會議遠程教學遠程醫(yī)療虛擬現(xiàn)實網(wǎng)絡游戲交互式電視5.2 聲音什么是聲音聲音就是一種具有一定的頻率和振幅且隨時間變化的聲波。聲音的特性(1)聲波的頻率頻率表現(xiàn)為音調的高低音調的高低,不同發(fā)音,聲音的頻率是不同的。通常人能夠發(fā)出的聲音范圍是在80 Hz 3400Hz。(2)聲波的振幅振幅表現(xiàn)為音強音強,就是聲音的大小。通常我們使用音量來描述音強,以分貝分貝(1dB=20logP)為單位。人耳的聽覺響應與強度成對數(shù)關系,一般

5、的人只能察覺出3dB的音強變化。5.2 聲音聲音的特性(3)聲波的頻率范圍稱為帶寬。一般來講,帶寬越寬,音質也越好。人耳能夠聽到的頻率范圍是2020000Hz。5.2.2 聲音的數(shù)字化把模擬聲音信號轉變?yōu)閿?shù)字聲音信號的過程稱為聲音的數(shù)字化。聲音的數(shù)字化通過采樣、量化、編碼采樣、量化、編碼三個步驟來實現(xiàn)。5.2.2 聲音的數(shù)字化常用的抽樣頻率聲道數(shù):聲音通道的個數(shù)聲音記錄只產(chǎn)生一個波形即單音或單聲道,若產(chǎn)生兩個波形則為立體聲或雙聲道。5.2.2 聲音的數(shù)字化數(shù)字化聲音的存儲空間 數(shù)據(jù)量采樣頻率量化位數(shù)聲道數(shù)/8 思考:存儲一段5分鐘的CD音質的音樂(采樣頻率為44.1KHZ,量化位數(shù)為16位,立

6、體聲雙聲道),大約需要多少存儲空間? 1秒鐘的CD音樂需要: 44.1kHz 16bit 2聲道/8 = 176.4KB5分鐘的CD音樂需要: 176.4*300秒 = 51.7MB5.2.3 音頻文件的格式(1)WAV格式,文件擴展名為.WAV。 音頻文件最基本的格式就是WAV格式。它是把聲音信息直接取樣、量化、編碼后所得到的數(shù)字化音頻文件,沒有經(jīng)過任何壓縮,可以得到很好的聲音質量,但WAV文件的數(shù)據(jù)量大,要占用較大的存儲空間。(2)音樂CD,文件擴展名是 .CDA 音樂CD,即我們一般說的CD光盤上文件所使用的格式。它可以說是所有音頻文件中音質最好的,不過它的最大弱點就是容量太大。我們在C

7、D光盤中看到以CDA為后綴名的文件并沒有真正包含聲音的信息,而只是一個索引信息。不論CD音樂的長短,看到的“*.cda文件”都是44字節(jié)長,直接復制cda文件到硬盤上是無法播放的。 (3)MP3格式,文件擴展名為 .MP3 MP3是MPEG1 Layer3規(guī)定的音頻壓縮編碼格式,是目前使用最廣泛的音頻媒體格式。MP3文件采用一種有損的壓縮算法,具有101121的高壓縮比,解壓后的聲音質量仍然相當不錯。5.2.3 音頻文件的格式(4)Windows Media Audio格式,文件擴展名是 .WMA WMA格式是以減少數(shù)據(jù)流量的方法來達到更高的壓縮率目的,其壓縮率一般可以達到1:18。 WMA還

8、提供了數(shù)字版權管理(DRM:Digital Rights Management)技術,可以在WMA文件中加入防拷貝保護(這種內置的版權保護技術可以限制播放時間和播放次數(shù))(5)MIDI格式,文件擴展名是 .mid MIDI是樂器數(shù)字化接口(Musical Instrument Digital Interface),是關于數(shù)字音樂/電子合成樂器的統(tǒng)一國際標準。它不是具體的記錄每個時刻頻率的高低、聲波的強弱,而是用數(shù)字信號的形式說明了在這首樂曲中使用了什么樂器(例如鋼琴),彈奏的是什么音調(是1還是7,是高音還是低音),持續(xù)的時間是多長(1拍還是1/4拍)。 由于MIDI文件中只是一些數(shù)字化的符號

9、,和wav文件相比,文件的大小要小很多,適合于在網(wǎng)絡上傳送。一個播放0.63秒的wav文件是55KB(字節(jié)),而一個播放2分鐘的mid文件只有34KB(字節(jié))。5.2.4 音頻數(shù)據(jù)的采集處理5.3 圖形和圖像n色彩模型 (1)RGB顏色模式自然界中的所有顏色都可以由紅、綠、藍(Red、Green、Blue)三種顏色合成。在數(shù)字圖像中,對RGB三基色各進行8位編碼,針對紅(綠/藍)分量的多少,人為地劃分為0255共256個等級,0表示不含紅色(綠/藍)成分,255表示含有100%紅色(綠/藍)成分。例如一個像素,當它的紅、綠、藍成分分別為255、0、255時顯示為紫色。這樣就就構成了約1677萬

10、種顏色,這就是人們常說的真彩色。5.3 圖形和圖像nRGB彩色空間5.3 圖形和圖像n色彩模型 (2)CMYK顏色模式它由青、品紅、黃和黑(Cyan、Magenta、Yellow、black)4種顏色組成。該顏色模式對應的是印刷用的四種油墨顏色。因為將C、M、Y三種油墨顏色混合在一起,印刷出來的黑色不是很純正。為了使印刷品為純黑色,所以將黑色并入了印刷色中,以表現(xiàn)純正的黑色,還可以借此減少其他油墨的使用量。CMYK模式在本質上與RGB顏色模式?jīng)]有什么區(qū)別,只是產(chǎn)生色彩的原理不同。5.3 圖形和圖像n色彩模型 (3)HSB顏色模式HSB色彩把顏色分為色相、飽和度、明度(Hue、Saturatio

11、n、Brightness)三個因素。所謂飽和度相當于家庭電視機的色彩濃度,飽和度高色彩較艷麗。飽和度低色彩就接近灰色。明度也稱為亮度,等同于彩色電視機的亮度,亮度高色彩明亮,亮度低色彩暗淡,亮度最高得到純白,最低得到純黑??梢钥闯觯谶x取顏色的時候,HSB模式較為直觀和方便。5.3.2 圖形和圖像的數(shù)字化n圖形圖像數(shù)字化的第一步:確定“點”數(shù)像素圖形圖像上“點”的數(shù)目,這里所說的“點”稱為“像素”。把圖形圖像上像素的多少稱為“像素密度”。圖像分辨率像素密度用圖像分辨率來度量。圖像分辨率的第一種表示:水平方向的像素數(shù)垂直方向的的像素數(shù)。相乘后的結果就是圖像的總的像素的數(shù)目。圖像分辨率的另一種表示

12、:單位打印長度上的圖像像素的數(shù)目多少,即用每英寸多少點(dpi:dot per inch)。5.3.2 圖形和圖像的數(shù)字化n圖形圖像數(shù)字化的第二步:如何表示每一個像素。像素點顏色的表示黑白圖像灰度圖像真彩色圖像:紅、綠、藍3基色都有256個層次,三基色疊加后就可以產(chǎn)生256256256種顏色。每個像素編碼時所需要的二進制代碼的位數(shù)稱為“像素深度”。圖形圖像數(shù)字化以后,二進制編碼文件的大小按以下公式計算:文件大小 = 圖形圖像總的像素數(shù)目像素深度/8 (字節(jié)) 不同采樣點數(shù)對圖像質量的影響不同量化級數(shù)對圖像質量的影響5.3.2 圖形和圖像的數(shù)字化思考: 一幅分辨率為640*480的真彩色圖像(2

13、4位)需要的存儲空間是多少? 640*480*24/8 = 921 600B = 900KB 5.3.3 位圖和矢量圖n矢量圖矢量圖又稱幾何圖形,它是用一組指令來描述圖形元素。這些指令給出構成該畫面的所有直線、曲線、矩形、橢圓等的形狀、位置、顏色等各種屬性和參數(shù)。這種方法實際上是用數(shù)學方法來表示圖形數(shù)學方法來表示圖形,然后變成許許多多的數(shù)學表達式,再編制程序,用語言來表達。矢量圖特點矢量圖形的優(yōu)點在于不需要對圖上每一點進行量化保存無論放大、縮小或旋轉,圖形都不會失真矢量圖的自然度和逼真度低,不適于用來表示色彩矢量圖的自然度和逼真度低,不適于用來表示色彩艷麗多變,層次豐富的畫面艷麗多變,層次豐富

14、的畫面 5.3.3 位圖和矢量圖n位圖是使用像素陣列來表示的圖像,每個像素的色彩信息由RGB組合或者灰度值表示。根據(jù)顏色信息所需的數(shù)據(jù)位分為1、4、8、16、24及32位等,位數(shù)越高顏色越豐富,相應的數(shù)據(jù)量越大。其中使用1位表示一個像素顏色的位圖因為一個數(shù)據(jù)位只能表示兩種顏色,所以又稱為二值位圖。通常使用2424位位RGBRGB組合數(shù)據(jù)位表示的的位圖稱為真彩色位組合數(shù)據(jù)位表示的的位圖稱為真彩色位圖圖。5.3.4 常見圖像格式BMP圖像文件,文件擴展名是“.bmp”Windows系統(tǒng)采用的圖形文件格式,在Windows環(huán)境下運行的所有圖像處理軟件都支持BMP圖像文件格式??梢赃x擇每個像素采用1位

15、(黑白圖像)、4位(16色)、8位(256色,或者256個灰度等級),或24位二進制代碼(真彩色)的不同圖像深度。GIF文件格式,文件擴展名是“.gif”GIF是Graphics Interchange Format的縮寫,按字面來翻譯就是“圖形交換格式”,能在不同的平臺上使用。GIF圖像是基于顏色列表的圖像格式,可以支持256種不同的顏色,每種顏色對應于8位二進制數(shù)中的一個數(shù)。GIF采用無損壓縮存儲,在不影響圖像質量的情況下,可以生成很小的文件。GIF支持透明色,可以使圖像浮現(xiàn)在背景之上。GIF文件可以制作動畫,這是它最突出的一個特點。 5.3.4 常見圖像格式JPEG文件格,文件擴展名“.

16、jpg”JPEG是由ISO和ITU-T兩個國際組織聯(lián)合建立的專家組(Joint Photographic Experts Group)的名稱的簡稱。JPEG是一個適用范圍很廣的靜態(tài)圖像數(shù)據(jù)壓縮標準,既可用于灰度圖像又可用于彩色圖像。JPEG使用有損壓縮編碼。它依據(jù)人的視覺冗余:對于圖像中較小的顏色變化、亮度變化的不敏感性。所以JPEG壓縮的圖像壓縮比很高,對于人的視覺效果來說基本沒有差別。TIFF文件格式TIFF是Tagged Image File Format的縮寫。它是由Aldus公司與微軟公司共同開發(fā)設計的圖像文件格式。TIFF允許多達48位的色彩分辨(R、G、B各16位),可以作為全R

17、GB色彩。TIFF是一種靈活的位圖圖像格式,實際上被所有繪畫、圖像編輯和頁面排版應用程序所支持。幾乎所有桌面掃描儀都可以生成 TIFF 圖像。它可以處理黑白、灰度和彩色圖像。5.3.4 常見圖像格式PNG格式,文件擴展名“.png”PNG是Portable Network Graphic的縮寫,被稱為是“可移植的網(wǎng)絡圖像”,是一種無損數(shù)據(jù)壓縮位圖圖形文件格式。是為了適應網(wǎng)絡數(shù)據(jù)傳輸而設計的一種圖像文件格式。 每個像素可以是48位的真彩色圖像;或者是16位的灰度圖像。PNG格式可以根據(jù)需要來調整圖像的透明度、亮度。矢量圖的擴展名:不同的矢量圖作圖軟件使用不同的擴展名*.cdr是CorelDraw

18、中的一種圖形文件格式。它是所有CorelDraw 應用程序中均能夠使用的一種圖形圖像文件格式。CorelDraw是加拿大的Corel公司推出的平面設計軟件。*.dwg是AutoCAD中使用的一種圖形文件格式。AutoCAD是著名的計算機輔助繪圖工具軟件。*.ai是Adobe Illustrator使用的矢量圖格式。*.wmf是Microsoft Windows中常見的一種圖元文件格式,它具有文件短小、圖案造型化的特點,整個圖形常由各個獨立的組成部分拼接而成,但其圖形往往較粗糙,并且只能在Microsoft Office中調用編輯。5.4 動畫動畫(Animation)是指利用人的視覺暫留特性,

19、以每秒2430幀的速度播放畫面,從而產(chǎn)生動態(tài)效果。原畫:原畫也稱為關鍵幀,它一般表達某動作的極限位置、一個角色的特征或其它的重要內容。中間畫:也稱為中間幀,是位于關鍵幀之間的過渡畫,可能有若干張,目的是使動作更加流暢自然。動畫的分類動畫的分類二維動畫:由平面上的畫面組成三維動畫:3D動畫動畫的制作 Flash動畫:由美國Micromedia公司出品,用于二維矢量動畫編輯和創(chuàng)作的專業(yè)軟件。Flash源文件的擴展名為.fla制作完畢后發(fā)布時的文件擴展名是.swf5.5 視頻視頻是活動的圖像 ,一幅幅靜止圖像組成了視頻 在電視中把每幅圖像稱為一幀(frame)在電影中每幅圖像稱為一格 視頻信號的組成

20、和存儲方式上劃分模擬視頻:電影、電視數(shù)字視頻 數(shù)字視頻的存儲量每一秒鐘數(shù)字視頻的存儲量是: 一幅圖像的總像素像素深度每秒幀數(shù)/8(字節(jié))例:使計算機播放分辨率為1024768的24位真彩色高質量電視圖像,按每秒24幀來計算,則一分鐘的視頻需要的存儲空間是多少?解:每幀圖像的存儲空間: 102476824/8 = 2.25MB字節(jié)一分鐘視頻需要的存儲空間: 2.2524(幀/秒) 60(秒) = 3.2GB字節(jié)5.5.2 視頻的壓縮技術 數(shù)據(jù)壓縮就是在保持或者基本保持源信息不變的前提下,盡可能減少表示源信息所需要的數(shù)據(jù)量,以減少存儲、傳輸、處理數(shù)據(jù)所需要的成本。 視頻信號主要的編碼和壓縮標準是M

21、PEG標準 (Moving Picture Experts Group 活動圖像專家組) MPEG-1、MPEG-2、MPEG-4、MPEG-7和MPEG-21運動補償技術運動補償技術假設每一當前幀都可以從前面某一幀為原型經(jīng)變換而得到。這一變換是局部的,畫面上各點的位移方向和大小不必相同,只要對這些運動信息進行編碼,就可以在原來幀畫面的基礎上再造當前幀的畫面。 5.5.2 視頻的壓縮技術MPEG-2兼容MPEG-1標準,MPEG-2現(xiàn)在是制作DVD光盤的指定標準。MPEG-4是為多媒體應用制訂的音視頻編碼標準。在MPEG-4中,提出了音視頻對象的概念。MPEG-4標準要能夠對于這些音視頻對象單

22、獨進行編碼,然后按照需要對編碼后的對象進行組合,從而構成各種具體的應用場景。MPEG-7定義一種基于內容的多媒體描述標準。MPEG-21用來提供對“多媒體框架”,就是要為不同網(wǎng)絡(寬帶、移動、廣播)上通過不同終端(計算機、移動終端、數(shù)字電視)的不同用戶提供多媒體綜合利用的框架。5.5.3 常用的視頻文件格式AVI格式,文件的擴展名是 .AVIAVI格式的英文全稱為Audio Video Interleaved,即音頻視頻交叉存取格式。所謂“交叉”,就是可以將視頻和音頻交織在一起進行同步播放。優(yōu)點是圖像質量好。缺點是占用空間大;都是.AVI擴展名的文件編碼的格式可能不一樣,經(jīng)常造成AVI格式的視頻不能正常播放。5.5.3 常用的視頻文件格式VCD視頻格式,擴展名是 .DATVCD視頻格式就是使用MPEG-1標準制作的視頻文件格式。使用MPEG-1的壓縮算法,可以把一部120分鐘長的電影壓縮到兩張VCD光盤上采用MPEG-1標準的文件的擴展名也可以是.mpg、.mlv、.mpe、.mpeg等,都稱為MPEG文件。5.5.3 常用的視頻文件格式DVD視頻格式,擴展名是 .VOBDVD視頻格式就是使用MPEG-2標準制作的視頻文件格式。使用MPEG-2的壓縮算法,可以把一部120分鐘長的電

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論