武漢大學多媒體_第1頁
武漢大學多媒體_第2頁
武漢大學多媒體_第3頁
武漢大學多媒體_第4頁
武漢大學多媒體_第5頁
已閱讀5頁,還剩53頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

理解多媒體、多媒體技術(shù)的概念明確多媒體中的主要元素及其特點了解多媒體的關鍵特性以及這些特性之間的關系了解多媒體的關鍵技術(shù)、主要應用領域和發(fā)展方向了解多媒體數(shù)據(jù)壓縮方法第8章多媒體技術(shù)概述多媒體的基本概念1多媒體的定義2多媒體技術(shù)及其特性3多媒體中的媒體元素及其特征1多媒體的定義“多媒體”一詞譯自英文“Multimedia”即“Multiple”和”Media”的合成其核心詞是媒體何謂多媒體呢?媒質(zhì):存儲信息的實體,如磁盤、光盤、磁帶、半導體存儲器等。媒介:傳遞信息的載體,如數(shù)字、文字、聲音、圖形和圖像等。媒體(medium)在計算機領域有兩種含義:即媒質(zhì)和媒介。 (1)感覺媒體:能直接作用于人們的感覺器官,從而能使人產(chǎn)生直接感覺的媒體。如語音、音樂、各種圖像、動畫、文本等。 (2)表示媒體:為了傳送感覺媒體而人為研究出來的媒體。借助于此種媒體,便能更有效的存儲或傳送感覺媒體。如語言編碼、電報碼等。 通常概念的“媒體”,可分為以下五種類型: (3)顯示媒體:用于通信中使電信號和感覺媒體之間產(chǎn)生轉(zhuǎn)換用的媒體。如輸入、輸出設施,鍵盤鼠標器、顯示器、打印機等。 (5)存儲媒體:用于存放某種媒體的媒體如紙張、磁帶、磁盤、光盤等。 (4)傳輸媒體:用于傳輸某些媒體的媒體,如電話線、電纜光纖等。 多媒體計算機技術(shù)的定義: 計算機綜合處理多種媒體信息,文本圖形、圖像、音頻和視頻,使多種信息建立邏輯連接,集成為一個系統(tǒng)并具有交互性。2計算機技術(shù)及其特性多媒體計算機技術(shù)的三個主要特性信息載體的多樣性交互性集成性

信息載體的多樣性是相對于計算機而言的,即指信息媒體的多樣性。 多媒體就是要把計算機處理的信息多樣化或多維化,從而改變計算機信息處理的單一模式,使人們能交互的處理多種信息。信息載體的多樣性交互性 多媒體的交互性是指用戶可以與計算機的多種信息媒體進行交互操作從而為用戶提供了更加有效地控制和使用信息的手段。集成性

集成性是指以計算機為中心綜合處理多種信息媒體,它包括信息媒體的集成和處理這些媒體的設備的集成。

信息媒體的集成包括信息的多通道統(tǒng)一獲取、多媒體信息的統(tǒng)一組織和存儲、多媒體信息表現(xiàn)合成等方面。

多媒體設備的集成包括硬件和軟件兩個方面。 多媒體媒體元素是指多媒體應用中可顯示給用戶的媒體組成。1.1.3多媒體中的媒體元素及特征音頻動畫視頻文本圖形圖像文本 文本分為非格式化文本文件和格式化文本文件。 非格式化文本文件:只有文本信息沒有其他任何有關格式信息的文件,又稱為純文本文件。如“.TXT”文件。 格式化文本文件:帶有各種文本排版信息等格式信息的文本文件。如“.DOC”文件。圖形 圖形(Graphic)一般指用計算機繪制的畫面,如直線、圓、圓弧、矩形、任意曲線和圖表等。 圖形的格式是一組描述點、線、面等幾何圖形的大小、形狀及其位置、維數(shù)的指令集合。 在圖形文件中只記錄生成圖的算法和圖上的某些特征點,因此也稱矢量圖。圖像圖像(Image)是指由輸入設備捕捉的實際場景畫面,或以數(shù)字化形式存儲的任意畫面。 靜止的圖像是一個矩陣,陣列中的各項數(shù)字用來描述構(gòu)成圖像的各個點(稱為像素點pixel)的強度與顏色等信息。這種圖像也稱為位圖(bit-mappedpicture)。 用于生成和編輯位圖圖像的軟件通常稱為“paint”程序。 圖像文件在計算機中的存儲格式有多種,如BMP、PCX、TIF、TGA、GIF、JPG等,一般數(shù)據(jù)量都較大。圖像處理時要考慮三個因素:分辨率圖像深度與顯示深度圖像文件大小分辨率屏幕分辨率:顯示器屏幕上的最大顯示 區(qū)域,即水平與垂直方向 的像素個數(shù)。圖像分辨率:數(shù)字化圖像的大小,即該 圖像的水平與垂直方向的 像素個數(shù)。像素分辨率:像素的寬和高之比一般為 1:1。圖像深度和顯示深度

圖像深度(也稱圖像灰度、顏色深度)表示數(shù)字位圖圖像中每個像素上用于表示顏色的二進制數(shù)字位數(shù)。

顯示深度:表示顯示器上每個點用于顯示顏色的2進制數(shù)字位數(shù)。 若顯示器的顯示深度小于數(shù)字圖像的深度,就會使數(shù)字圖像顏色的顯示失真。顏色深度與顯示的顏色數(shù)目圖像文件大小 用字節(jié)表示圖像文件大小時,一幅未經(jīng)壓縮的數(shù)字圖像的數(shù)據(jù)量大小計算如下:圖像數(shù)據(jù)量大小=像素總數(shù)×圖像深度÷8例如:一幅640×480的256色圖像為 640×480×8/8=307200字節(jié)Comparison:寬度:271高度:300顏色:2大小:9.9KB寬度:271高度:300顏色:4大?。?9.8KBComparison:寬度:271高度:300顏色:256大小:79.4KB寬度:271高度:300顏色:真彩色大?。?38.2KB1.BMP格式 BMP是標準的WINDOWS和OS/2的圖形和圖像的基本位圖格式,有壓縮(RLE)和非壓縮之分。BMP支持黑白圖像、16色和256色的偽彩色圖像以及RGB真彩色圖像。2.PCX格式 是使用游程長編碼(RLE)方法進行壓縮的圖像文件格式文件。支持黑白圖像、16色和256色的偽彩色圖像、灰度圖像以及RGB真彩色圖像,圖像文件的基本格式3.GIF格式 GIF是壓縮圖像存儲格式,它使用LZW壓縮方法,壓縮比較高,文件長度較小。支持黑白圖像、16色和256色的彩色圖像。4.TIF格式 TIF格式是工業(yè)標準格式,支持所有圖像類型。文件分成壓縮和非壓縮兩大類。5.JPG和PIC格式 JPG和PIC都使用JPEG方法進行圖像數(shù)據(jù)壓縮。這兩種格式的最大特點是文件非常小。它是一種有損壓縮的靜態(tài)圖像文件存儲格式。支持灰度圖像、RGB真彩色圖像和CMYK真彩色圖像。6.PCD格式 PCD格式是Photo-CD的專用存儲格式,文件中含有從專業(yè)攝影照片到普通顯示用的多種分辨率的圖像,所以數(shù)據(jù)量都非常大。3視頻和動畫的文件格式

動畫文件的格式主要有兩種:FLIC格式和MMM格式。

視頻文件的使用一般與標準有關,主要有AVI、MOV、MPG、DAT、DIR等。音頻 數(shù)字音頻(Audio)可分為波形聲音語音和音樂。 波形聲音實際上已經(jīng)包含了所有的聲音形式,它可以將任何聲音都進行采樣量化,相應的文件格式是WAV文件或VOC文件。

語音也是一種波形,所以和波形聲音的文件格式相同。

音樂是符號化了的聲音,樂譜可轉(zhuǎn)變?yōu)榉柮襟w形式。對應的文件格式是MID或CMF文件。 計算機音頻技術(shù)主要包括聲音的采集、數(shù)字化、壓縮/解壓縮以及聲音的播放。

數(shù)字化主要包括采樣和量化這兩個方面。

采樣頻率(samplingrate)是將模擬聲音波形轉(zhuǎn)換為數(shù)字時,每秒鐘所抽取聲波幅度樣本的次數(shù),單位是Hz(赫茲)。

量化數(shù)據(jù)位數(shù)(也稱量化級)是每個采樣點能夠表示的數(shù)據(jù)范圍,經(jīng)常采用的有8位、12位和16位。

例如,8位量化級表示每個采樣點可以表示256個不同量化值,而16位量化級則可以表示65536個不同的量化值 記錄聲音時,如果每次生成一個聲道數(shù)據(jù),稱為單聲道;每次生成兩個聲波數(shù)據(jù),稱為立體聲(雙聲道)。

數(shù)字音頻的存儲量: 可用以下公式估算聲音數(shù)字化后每秒所需的存儲量(未經(jīng)壓縮的)存儲量=采樣頻率×量化位數(shù)÷8

例如,數(shù)字激光唱盤(CD-DA)的標準采樣頻率為44.1kHz,量化位數(shù)為16位,立體聲。一分鐘CD-DA音樂所需的存儲量為44.1K×16×2×60÷8=10584KB若使用雙聲道,存儲量再增加一倍聲音文件的基本格式1.WAV文件2.MP33.MIDI文件WAV文件 Windows所用的標準數(shù)字音頻稱為波形文件,文件的擴展名是“.WAV”,它記錄了對實際聲音進行采樣的數(shù)據(jù)。它可以重現(xiàn)各種聲音,但產(chǎn)生的文件很大。 人的講話聲使用8位量化級11.025KHz采樣率就能較好的還原。CD音質(zhì)需要16位量化級、44.1KHz的采樣率。mp3文件MP3是MPEG(MovingPictureExpertGroup運動圖像專家組)第三層壓縮文件格式,提供8kb/s到128kb/s的數(shù)據(jù)率和高達96:1的壓縮比,有較好的音質(zhì)。主要應用于因特網(wǎng)上的聲音傳輸。常見的MP3音樂就使用了該壓縮標準,是MP3播放器的主要格式。MIDI MIDI文件的擴展名為“.MID”,它與波形文件不同,記錄的不是聲音本身,而是將每個音符記錄為一個數(shù)字,因此比較節(jié)省空間,可以滿足長時間音樂的需要。 MIDI的主要限制是缺乏重現(xiàn)真實自然的能力。采用波表法進行音樂合成的聲音卡可以使MIDI音樂的質(zhì)量大大提高。 動畫是活動的畫面,實質(zhì)是一幅幅靜態(tài)圖像的連續(xù)播放。動畫的連續(xù)播放既指時間上的連續(xù),也指圖像內(nèi)容上的連續(xù)。 計算機設計動畫有兩種:一種是幀動畫,一種是造型動畫。動畫

幀動畫是由一幅幅位圖組成的連續(xù)的畫面,就如電影膠片或視頻畫面一樣要分別設計每屏幕顯示的畫面。

造型動畫是對每一個運動的物體分別進行設計,賦予每個動元一些特征,然后用這些動元構(gòu)成完整的幀畫面。動元的表演和行為是由制作表組成的腳本來控制。 存儲動畫的文件格式有FLC、MMM等視頻 視頻是由一幅幅單獨的畫面序列(幀frame)組成,這些畫面以一定的速率(fps)連續(xù)地投射在屏幕上,使觀察者具有圖像連續(xù)運動的感覺。 視頻文件的存儲格式有AVI、MPGMOV等。視頻和動畫的文件格式

動畫文件的格式主要有兩種:FLIC格式和MMM格式。

視頻文件的使用一般與標準有關,主要有AVI、MOV、MPG、DAT、DIR等。1.FLIC動畫

早期版本的FLIC文件只支持320×200×256色模式,文件的擴展名為“.FIY”。較新版本支持的分辨率和顏色數(shù)都有所提高,文件的擴展名也改為“.FLC”。它使用了無損壓縮方法,畫面效果十分清晰,但本身不能存儲同步聲音。2.MMM動畫 MMM格式是微軟多媒體動畫的文件格式。3.AVI文件 AVI文件將視頻和音頻信號混合交錯地存儲在一起。其文件擴展名為“.AVI”,采用了Intel公司的Indeo視頻有損壓縮技術(shù),較好地解決了音頻信息與視頻信息同步的問題。4.MOV文件 MOV是Macintosh計算機用的影視文件格式。也采用了Intel公司的Indeo視頻有損壓縮技術(shù),以及視頻與音頻信息混排技術(shù)。5.MPG文件 是PC機上全屏幕活動視頻的標準文件格式,它是使用MPEG方法進行壓縮的全運動視頻圖像。6.DAT文件 DAT是VideoCD或KaraokeCD數(shù)據(jù)文件的擴展名,也是基于MPEG壓縮方法的一種文件格式。7.DIR格式 DIR是MarcoMedia公司使用的Director多媒體著作工具產(chǎn)生的電影文件格式。多媒體技術(shù)的應用 就目前而言,多媒體技術(shù)已在商業(yè)教育培訓、電視會議、聲像演示等方面得到了充分應用。在教育與培訓方面的應用在通信方面的應用在其他方面的應用在教育與培訓方面的應用 多媒體技術(shù)使教材不僅有文字、靜態(tài)圖像,還具有動態(tài)圖像和語音等。使教育的表現(xiàn)形式多樣化,可以進行交互式遠程教學。 利用多媒體計算機的文本、圖形、視頻、音頻和其交互式的特點,可以編制出計算機輔助教學CAI(ComputerAssistedInstruction)軟件,即課件。在通信方面的應用多媒體技術(shù)在通信方面的應用主要有: 可視電話 視頻會議 信息點播(InformationDemand) 計算機協(xié)同工作CSCW (ComputerSupported CooperativeWork)

信息點播有桌上多媒體通信系統(tǒng)和交互電視ITV。

計算機協(xié)同工作CSCW是指在計算機支持的環(huán)境中,一個群體協(xié)同工作以完成一項共同的任務。 計算機的交互性,通信的分布性和多媒體的現(xiàn)實性相結(jié)合,將構(gòu)成繼電報電話、傳真之后的第四代通信手段。在其他方面的應用 多媒體技術(shù)給出版業(yè)帶來了巨大的影響,其中近年來出現(xiàn)的電子圖書和電子報刊就是應用多媒體技術(shù)的產(chǎn)物。 利用多媒體技術(shù)可為各類咨詢提供服務,如旅游、郵電、交通、商業(yè)、金融、賓館等。 多媒體技術(shù)還將改變未來的家庭生活,多媒體技術(shù)在家庭中的應用將使人們在家中上班成為現(xiàn)實。多媒體技術(shù)的發(fā)展方向目前,多媒體主要從以下幾個方向發(fā)展:

多媒體通信網(wǎng)絡環(huán)境的研究和建立將使多媒體從單機單點向分布、協(xié)同多媒體環(huán)境發(fā)展,在世界范圍內(nèi)建立一個可全球自由交互的通信網(wǎng)。 對該網(wǎng)絡及其設備的研究和網(wǎng)上分布應用與信息服務研究將是熱點。1 利用圖像理解、語音識別、全文檢索等技術(shù),研究多媒體基于內(nèi)容的處理、開發(fā)能進行基于內(nèi)容的處理系統(tǒng)是多媒體信息管理的重要方向。

多媒體標準仍是研究的重點:各類標準的研究將有利于產(chǎn)品規(guī)范化,應用更方便。它是實現(xiàn)多媒體信息交換和大規(guī)模產(chǎn)業(yè)化的關鍵所在。23 多媒體技術(shù)與相鄰技術(shù)相結(jié)合,提供了完善的人機交互環(huán)境。多媒體仿真智能多媒體等新技術(shù)層出不窮,擴大了原有技術(shù)領域的內(nèi)涵,并創(chuàng)造新的概念。 多媒體技術(shù)與外圍技術(shù)構(gòu)造的虛擬現(xiàn)實研究仍在繼續(xù)進展。多媒體虛擬現(xiàn)實與可視化技術(shù)需要相互補充,并與語音、圖像識別、智能接口等技術(shù)相結(jié)合,建立高層次虛擬現(xiàn)實系統(tǒng)。45虛擬現(xiàn)實技術(shù)(VR)

虛擬現(xiàn)實的定義可歸納為:利用計算機技術(shù)生成的一個逼真的視覺、聽覺觸覺及嗅覺等的感覺世界,用戶可以用人的自然技能對這個生成的虛擬實體進行交互考察。 虛擬現(xiàn)實技術(shù)是在眾多相關技術(shù)上發(fā)展起來的一個高度集成的技術(shù),是計算機軟硬件技術(shù)、傳感技術(shù)、機器人技術(shù)、人工智能及心理學等飛速發(fā)展的結(jié)晶。多媒體數(shù)據(jù)壓縮方法 壓縮處理一般是由兩個過程組成:一是編碼過程,即將原始數(shù)據(jù)經(jīng)過編碼進行壓縮,以便存儲與傳輸;二是解碼過程,此過程對編碼數(shù)據(jù)進行解碼,還原為可以使用的數(shù)據(jù)。 數(shù)據(jù)壓縮可分為兩種類型:一種叫做無損壓縮,另一種叫做有損壓縮。無損壓縮混合壓縮有損壓縮無損壓縮 無損壓縮常用在原始數(shù)據(jù)的存檔,如文本數(shù)據(jù)、程序以及珍貴的圖片和圖像等。 其原理是統(tǒng)計壓縮數(shù)據(jù)中的冗余(重復的數(shù)據(jù))部分。常用的有:RLE(runlengthencoding)行程編碼Huffman編碼算術(shù)編碼LZW(lempel-ziv-welch)編碼有損壓縮 圖像或聲音的頻帶寬、信息豐富,人類視覺和聽覺器官對頻帶中某些頻率成分不大敏感,有損壓縮以犧牲這部分信息為代價,換取了較高的壓縮比。 常用的有損壓縮方法有:PC

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論