第5章 多媒體技術(shù)_第1頁
第5章 多媒體技術(shù)_第2頁
第5章 多媒體技術(shù)_第3頁
第5章 多媒體技術(shù)_第4頁
第5章 多媒體技術(shù)_第5頁
已閱讀5頁,還剩31頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第5章

多媒體技術(shù)數(shù)學(xué)計算機(jī)科學(xué)學(xué)院2內(nèi)容提要5.1

文本5.2

圖像5.3

圖形5.4音頻5.5視頻數(shù)學(xué)計算機(jī)科學(xué)學(xué)院35.1文本文本是文字、字母、數(shù)字和各種功能符號的集合。在多媒體作品中,文本是最基本也是最常用的素材,主要用于記載和存儲文字信息,一些說明、介紹、作品中的文字資料都會用到文本。5.1.1文本的分類幾種比較流行的文本文件格式:TXT格式DOC/DOCX格式RTF格式WPS格式PDF格式CAJ格式HTML超文本格式數(shù)學(xué)計算機(jī)科學(xué)學(xué)院45.1.2文本的錄入

多媒體計算機(jī)系統(tǒng)中,文本資料可以用多種方式獲取。鍵盤輸入OCR文字識別輸入語音識別輸入聯(lián)機(jī)手寫識別輸入數(shù)學(xué)計算機(jī)科學(xué)學(xué)院55.1.3文本處理工具文字處理軟件種類較多,各具特色,常見的有:記事本寫字板MicrosoftWordWPS文字?jǐn)?shù)學(xué)計算機(jī)科學(xué)學(xué)院65.2

圖像

圖像是指用數(shù)碼攝像機(jī)、掃描儀等輸入設(shè)備捕捉實(shí)際的畫面并經(jīng)過采樣和數(shù)字化后得到的一個由像素點(diǎn)陣構(gòu)成的畫面,每個像素的顏色和亮度都由一定的比特位來描述。圖像又稱為點(diǎn)位圖、點(diǎn)陣圖、像素圖、光柵圖。數(shù)學(xué)計算機(jī)科學(xué)學(xué)院75.2.1圖像的獲取多種獲取方式:使用數(shù)碼相機(jī)拍照獲取掃描獲取通過軟件繪制獲取從屏幕中捕捉獲取使用現(xiàn)有圖像獲取數(shù)學(xué)計算機(jī)科學(xué)學(xué)院85.2.2圖像的存儲1.圖像的存儲方式像素(pixel)一幅圖像就是一個矩形點(diǎn)陣,上面的每一個點(diǎn)稱之為像素,像素是數(shù)字圖像中的基本單位。分辨率每英寸顯示的像素數(shù)即圖像的分辨率,其基本單位是ppi(pixelsperinch),也可使用單位dpi(dotsperinch)?;叶戎蹈鱾€像素所具有的明暗程度的標(biāo)識。數(shù)學(xué)計算機(jī)科學(xué)學(xué)院95.2.2圖像的存儲2.常見的圖像格式BMP格式GIF格式JPEG/JPG格式TIFF格式PNG格式PSD格式數(shù)學(xué)計算機(jī)科學(xué)學(xué)院105.2.3圖像的處理與應(yīng)用1.圖像處理技術(shù)2.圖像處理軟件3.圖像處理的應(yīng)用領(lǐng)域數(shù)學(xué)計算機(jī)科學(xué)學(xué)院111.圖像處理技術(shù)圖像數(shù)字化(1)采樣(2)量化圖像增強(qiáng)和恢復(fù)圖像分割圖像壓縮與編碼圖像分析圖像識別數(shù)學(xué)計算機(jī)科學(xué)學(xué)院122.圖像處理軟件數(shù)學(xué)計算機(jī)科學(xué)學(xué)院13常見的圖像處理軟件3.圖像處理的應(yīng)用領(lǐng)域文字、圖形、圖像的自動識別醫(yī)學(xué)圖像處理遙感圖像處理智能機(jī)器人視覺技術(shù)數(shù)學(xué)計算機(jī)科學(xué)學(xué)院145.3

圖形

圖形是指由外部輪廓線條構(gòu)成的矢量圖,通常是由點(diǎn)、線、面、體等幾何元素和灰度、色彩、線型、線寬等非幾何屬性組成的幾何圖形。

數(shù)學(xué)計算機(jī)科學(xué)學(xué)院155.3.1圖形的概念圖形是用數(shù)學(xué)方法描述的一系列點(diǎn)、線、弧、面、體和其他幾何形狀,如圖所示。計算機(jī)圖形學(xué)是研究怎樣用計算機(jī)生成、處理和顯示圖形的學(xué)科。它主要研究用計算機(jī)及其圖形設(shè)備輸入、表示、變換、運(yùn)算和輸出圖形的原理、算法及系統(tǒng)。數(shù)學(xué)計算機(jī)科學(xué)學(xué)院165.3.1圖形的概念存放圖形所使用的格式稱為矢量圖格式,存儲的數(shù)據(jù)主要是繪制圖形的數(shù)學(xué)描述,通常是一組繪圖指令集合,如描述構(gòu)成該圖的各種圖元位置維數(shù)、形狀、運(yùn)算關(guān)系及顏色數(shù)據(jù)等。矢量圖可任意縮放也不會失真,而圖像則不同,圖像與分辨率有關(guān),所以放大會出現(xiàn)鋸齒狀邊緣。數(shù)學(xué)計算機(jī)科學(xué)學(xué)院175.3.2圖形的格式DXF格式CDR格式SVG格式DWG格式WMF格式數(shù)學(xué)計算機(jī)科學(xué)學(xué)院185.4音頻聲音是人們用來傳遞信息和交流情感的最直接和最方便的方式之一。處理聲音之前要把聲音數(shù)字化,只有數(shù)字化的聲音才能使用計算機(jī)處理。數(shù)字化的聲音叫做“數(shù)字音頻”。數(shù)學(xué)計算機(jī)科學(xué)學(xué)院195.4.1聲音信號的數(shù)字化處理聲音之前,首先要把連續(xù)的模擬形式的自然聲音轉(zhuǎn)換成離散的數(shù)字化聲音,數(shù)字化的過程主要包括采樣、量化和編碼三個步驟,如圖所示。音頻信號數(shù)字化的基本過程數(shù)學(xué)計算機(jī)科學(xué)學(xué)院205.4.1聲音信號的數(shù)字化1.采樣

自然聲信號是連續(xù)變化的,而數(shù)字化的聲音則是階躍變化的。在時間軸上,每隔一個固定的時間間隔(虛線表示)對波形信號的振幅進(jìn)行一次取值,這就是采樣。2.量化

量化處理就是把幅度上連續(xù)取值的模擬量轉(zhuǎn)換為離散量。3.編碼

編碼是將量化后的采樣值用二進(jìn)制的數(shù)碼來表示,并轉(zhuǎn)換成由許多位的二進(jìn)制編碼0和1組成的數(shù)字信號。數(shù)學(xué)計算機(jī)科學(xué)學(xué)院215.4.2聲音的存儲1.聲音的存儲表示在計算機(jī)中,所有的資料都是以數(shù)字形式(0和1)存儲的,聲音也不例外。未經(jīng)壓縮的數(shù)字音頻的數(shù)據(jù)量可由下式進(jìn)行計算:數(shù)據(jù)量(Byte)=采樣頻率(Hz)×(量化位數(shù)/8)×聲道數(shù)×持續(xù)時間(s)例如,采樣頻率為44.1KHz,量化位數(shù)16,雙聲道存儲的5分鐘數(shù)字音頻的數(shù)據(jù)量為:數(shù)據(jù)量=44100×(16/8)×2×300=52920000B(約合50.47MB)數(shù)學(xué)計算機(jī)科學(xué)學(xué)院225.4.2聲音的存儲2.聲音文件的分類1)WAV格式2)MIDl文件格式3)CDA格式4)MP3格式5)RA格式6)WMA格式數(shù)學(xué)計算機(jī)科學(xué)學(xué)院235.4.3聲音的處理與應(yīng)用1.聲音的處理1)數(shù)字聲音的錄制2)聲音文件格式的轉(zhuǎn)換3)聲音的剪輯4)合成聲音5)其他效果6)高級處理2.聲音處理軟件

聲音處理軟件的主要功能是實(shí)現(xiàn)音頻的二次編輯,達(dá)到改變音樂風(fēng)格和多音頻混合編輯的目的。數(shù)學(xué)計算機(jī)科學(xué)學(xué)院245.4.4語音識別技術(shù)1.概念

語音識別技術(shù),也被稱為自動語音識別(AutomaticSpeechRecognition,簡稱ASR),其目標(biāo)是將人類語音中的詞匯內(nèi)容轉(zhuǎn)換為計算機(jī)可讀的輸入,例如按鍵、二進(jìn)制編碼或者字符序列。

語音識別技術(shù)的應(yīng)用包括語音撥號、語音導(dǎo)航、室內(nèi)設(shè)備控制、語音文檔檢索和簡單的聽寫數(shù)據(jù)錄入等。語音識別技術(shù)與其他自然語言處理技術(shù)如機(jī)器翻譯及語音合成技術(shù)相結(jié)合,可以構(gòu)建出更加復(fù)雜的應(yīng)用,例如語音到語音的翻譯。數(shù)學(xué)計算機(jī)科學(xué)學(xué)院255.4.4語音識別技術(shù)2.語音識別技術(shù)在Windows7中的應(yīng)用在Windows7操作系統(tǒng)中帶有語音識別的功能,用戶可以暫時拋開鍵盤的束縛,跟計算機(jī)直接對話交流,從而運(yùn)行程序,比如播放影音、打開網(wǎng)頁和輸入文字等。用戶在使用之前必須啟動語音識別功能。首先,把麥克風(fēng)正確接入計算機(jī);其次,啟動Windows7的語音識別功能(開始→控制面板→輕松訪問→語音識別);第三步,進(jìn)入語音識別項目后,選擇“啟動語音識別”這一選項。數(shù)學(xué)計算機(jī)科學(xué)學(xué)院265.4.4語音識別技術(shù)3.語音技術(shù)在MSOffice2010中的應(yīng)用

除了Windows7的語音輸入功能在辦公自動化(OA)軟件中的應(yīng)用之外,MSOffice2010應(yīng)用程序中也有一個非常實(shí)用的功能,就是可以使用TTS(Text-To-Speech)語音引擎,實(shí)現(xiàn)語音功能。數(shù)學(xué)計算機(jī)科學(xué)學(xué)院275.5視頻視頻,也稱為影像視頻,就其本質(zhì)而言是指內(nèi)容隨時間變化的一組動態(tài)圖像,所以又叫運(yùn)動圖像或者活動圖像。視頻信號分為模擬視頻信號和數(shù)字視頻信號兩大類。模擬信號指信號幅度的取值是連續(xù)的,幅值可以由無限個數(shù)值表示;數(shù)字信號指信號幅度的取值是離散的,幅值表示被限制在有限個數(shù)值之內(nèi)。處理視頻之前,要把連續(xù)的模擬視頻信號轉(zhuǎn)換成離散的計算機(jī)可以顯示和處理的數(shù)字信號。數(shù)學(xué)計算機(jī)科學(xué)學(xué)院285.5.1視頻信號的數(shù)字化視頻模擬信號的數(shù)字化一般包括以下幾個步驟:1.采樣

通過周期性地以某一規(guī)定間隔截取模擬信號,從而將連續(xù)的模擬視頻信號變換為離散的數(shù)字信號的過程。2.量化

把經(jīng)過抽樣得到的瞬時值變?yōu)殡x散值,即用一組規(guī)定的電平,把瞬時抽樣值用最接近的電平值來表示。3.編碼

將量化后的采樣值用二進(jìn)制的數(shù)碼來表示,并轉(zhuǎn)換成由許多位的二進(jìn)制編碼0和1組成的數(shù)字信號。編碼有壓縮與非壓縮兩種格式。數(shù)學(xué)計算機(jī)科學(xué)學(xué)院295.5.2視頻的存儲表示數(shù)字化的視頻文件格式主要分為以下幾大類:1.MOV格式2.MPEG格式3.AVI格式4.RM格式5.RMVB格式6.WMV格式7.ASF格式8.FLV格式數(shù)學(xué)計算機(jī)科學(xué)學(xué)院305.5.3視頻的處理與應(yīng)用1.視頻的處理1)視頻剪輯2)視頻疊加3)視頻和聲音同步4)為視頻配音5)添加字幕和特殊效果2.視頻處理軟件

視頻處理軟件的主要功能有視頻的播放、輸入、剪輯、字幕、特效、轉(zhuǎn)場(過渡)和輸出等。數(shù)學(xué)計算機(jī)科學(xué)學(xué)院315.5.3視頻的處理與應(yīng)用3.視頻處理技術(shù)的應(yīng)用1)視頻會議2)視頻點(diǎn)播3)虛擬現(xiàn)實(shí)4)遠(yuǎn)程教育數(shù)學(xué)計算機(jī)科學(xué)學(xué)院325.5.4計算機(jī)動畫1.計算機(jī)動畫的概念計算機(jī)動畫是指由許多幀靜止的畫面,以一定的速度(如每秒16張)連續(xù)播放時,人們?nèi)庋垡蛞曈X殘像產(chǎn)生錯覺,而誤以為畫面活動的作品。2.常見的動畫格式1)GIF格式2)SWF格式3)FLC格式4)AVI格式數(shù)學(xué)計算機(jī)科學(xué)學(xué)院335.5.4計算機(jī)動畫3.動畫處理軟件數(shù)學(xué)計算機(jī)科學(xué)學(xué)院34

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論