版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
蘇州大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院第7章多媒體及應(yīng)用
目錄(1)*多媒體技術(shù)概述文本與文本處理圖像與圖形數(shù)字化音頻及應(yīng)用數(shù)字化視頻及應(yīng)用12345目錄(2)*多媒體制作開(kāi)發(fā)工具簡(jiǎn)介65*7.1多媒體技術(shù)概述1.媒體
媒體在計(jì)算機(jī)領(lǐng)域中主要有兩種含義:一是指用以存儲(chǔ)信息的實(shí)體,如磁帶、磁盤、光盤等;二是指用以承載信息的載體,如數(shù)字、文字、聲音、圖形、圖像、視頻等。2.多媒體和多媒體技術(shù)多媒體(Multimedia)是數(shù)字、文字、聲音、圖形、圖像、動(dòng)畫和視頻等多種媒體信息的集合。
多媒體技術(shù)是指以數(shù)字化技術(shù)為基礎(chǔ),利用計(jì)算機(jī)綜合處理多媒體信息,使多種媒體信息之間建立邏輯關(guān)系,并連同多媒體設(shè)備一起集成為一個(gè)具有交互性能的應(yīng)用系統(tǒng)的技術(shù)。7.1.1多媒體概念7.1.2多媒體技術(shù)的特點(diǎn)1.集成性集成性是指將多種媒體信息有機(jī)地組織在一起,共同表達(dá)一個(gè)完整的多媒體信息,使這些媒體成為密切聯(lián)系的一體化系統(tǒng)。
2.交互性用戶可以通過(guò)鍵盤、鼠標(biāo)、觸摸屏等輸入設(shè)備來(lái)控制媒體的播放,實(shí)現(xiàn)了從“你播放我接收”的單向傳輸?shù)健拔尹c(diǎn)播你播放”的交互方式的改變。
3.實(shí)時(shí)性實(shí)時(shí)性是指多媒體系統(tǒng)中多種媒體間無(wú)論在時(shí)間上還是空間上都存在密切的關(guān)系,是具有同步性和協(xié)調(diào)性的群體。7.1.3多媒體系統(tǒng)的組成多媒體系統(tǒng)是指能夠提供交互式處理文本、聲音、圖像、視頻等多種媒體信息的計(jì)算機(jī)系統(tǒng),主要由四個(gè)部分組成。1.多媒體硬件系統(tǒng)2.多媒體操作系統(tǒng)3.媒體系統(tǒng)處理工具4.用戶應(yīng)用軟件返回目錄7.2文本與文本處理7.2.1西文字符的編碼1.標(biāo)準(zhǔn)ASCII編碼全稱為“AmericanStandardCodeforInformationInterchange(美國(guó)信息交換標(biāo)準(zhǔn)代碼)”。標(biāo)準(zhǔn)ASCII碼采用一個(gè)字節(jié)表示一個(gè)字符,但只使用其中的低7位,共表示128個(gè)字符,每個(gè)字節(jié)的最高位在計(jì)算機(jī)內(nèi)部通常保持為“0”。已被國(guó)際標(biāo)準(zhǔn)化組織(ISO)批準(zhǔn)為國(guó)際標(biāo)準(zhǔn),稱為ISO-646標(biāo)準(zhǔn)。7.2.1西文字符的編碼1.標(biāo)準(zhǔn)ASCII編碼【例7-1】下列特殊字符的編碼,其相互關(guān)系一般需要記住。字符’A’的編碼為1000001,對(duì)應(yīng)的十六進(jìn)制編碼為41H,對(duì)應(yīng)的十進(jìn)制編碼為65。字符’a’的編碼為1100001,對(duì)應(yīng)的十六進(jìn)制編碼為61H,對(duì)應(yīng)的十進(jìn)制碼為97。*2.?dāng)U充ASCII編碼使用8位二進(jìn)制數(shù)來(lái)表示字符的擴(kuò)充字符集??梢允褂?56種數(shù)字代碼表示更多的字符。在這些字符集中,從0~127的代碼與ASCII保持兼容,從128~255用于其它的字符和符號(hào)。擴(kuò)充出來(lái)的128個(gè)編碼稱為擴(kuò)展ASCII編碼,對(duì)應(yīng)的字符稱為擴(kuò)展ASCII字符。國(guó)際標(biāo)準(zhǔn)化組織的ISO8859標(biāo)準(zhǔn)得到了廣泛的使用。7.2.2漢字的編碼1.GB2312漢字編碼1980年發(fā)布的國(guó)家標(biāo)準(zhǔn),共收錄了6763個(gè)漢字和682個(gè)圖形符號(hào),總計(jì)7445個(gè)字符。GB2312規(guī)定“對(duì)任意一個(gè)圖形字符都采用兩個(gè)字節(jié)表示,每個(gè)字節(jié)均采用七位編碼表示。”GB2312將編碼表分為94個(gè)區(qū),對(duì)應(yīng)第一字節(jié),每個(gè)區(qū)94個(gè)位,對(duì)應(yīng)第二字節(jié)。由區(qū)號(hào)和位號(hào)共同構(gòu)成區(qū)位碼。為了避免信息通訊中漢字區(qū)位碼與通訊控制碼的沖突,每個(gè)漢字的區(qū)號(hào)和位號(hào)必須分別加上32(即二進(jìn)制的00100000,十六進(jìn)制的20H),經(jīng)過(guò)這樣處理的代碼稱為漢字的國(guó)標(biāo)交換碼(簡(jiǎn)稱國(guó)標(biāo)碼)。
為了區(qū)分漢字編碼和ASCII碼,將國(guó)標(biāo)碼的每個(gè)字節(jié)的最高位由0變?yōu)?,變換后的國(guó)標(biāo)碼稱為漢字機(jī)內(nèi)碼(簡(jiǎn)稱機(jī)內(nèi)碼)。
漢字機(jī)內(nèi)碼、國(guó)標(biāo)碼、區(qū)位碼之間的關(guān)系為:國(guó)標(biāo)碼=區(qū)位碼+2020H機(jī)內(nèi)碼=國(guó)標(biāo)碼+8080H=區(qū)位碼+A0A0H
例如:“新”的區(qū)號(hào)為48,位號(hào)為34,其區(qū)位碼為4834,其二進(jìn)制表示為0011000000100010,其十六進(jìn)制為3022H。“新”的國(guó)標(biāo)碼為8066(5042H)。“新”的機(jī)內(nèi)碼為D0C2H。7.2.2漢字的編碼2.GBK漢字編碼1995年發(fā)布了另一個(gè)漢字編碼標(biāo)準(zhǔn),其全稱為《漢字內(nèi)碼擴(kuò)展規(guī)范》,簡(jiǎn)稱GBK。GBK也采用雙字節(jié)表示,GBK向下與GB2312完全兼容,向上支持ISO10646國(guó)際標(biāo)準(zhǔn)。在GBK中共收錄了21003個(gè)漢字和883個(gè)圖形符號(hào),除了GB2312的全部漢字和符號(hào)外,還收錄了繁體字和生僻字。微軟公司的Windows簡(jiǎn)體中文版操作系統(tǒng)XP就支持GBK編碼方案。
3.UCS/Unicode與GB18030漢字編碼國(guó)際標(biāo)準(zhǔn)化組織制定了一個(gè)能夠覆蓋幾乎任何語(yǔ)言的編碼表,稱為UCS(對(duì)應(yīng)的工業(yè)標(biāo)準(zhǔn)為Unicode),它的具體實(shí)現(xiàn)(如UTF-8和UTF-16)已在Windows、Unix、Linux操作系統(tǒng)中及許多Internet應(yīng)用中廣泛使用。
GB18030是我國(guó)政府于2000年發(fā)布了新的漢字編碼國(guó)家標(biāo)準(zhǔn)該標(biāo)準(zhǔn)收錄了27484個(gè)漢字,同時(shí)還收錄了藏文、蒙文、維吾爾文等少數(shù)名族文字,它向下兼容GB2312和GBK,并擴(kuò)充了UCS/Unicode中的字符,目前已在許多計(jì)算機(jī)系統(tǒng)和軟件中使用。4.BIG5漢字編碼GB2312、GBK和GB18030標(biāo)準(zhǔn)主要在我國(guó)大陸使用,中國(guó)臺(tái)灣、香港等地區(qū)還在使用繁體中文,他們制定了一套表示繁體中文的字符編碼,稱為“BIG5漢字編碼標(biāo)準(zhǔn)”(簡(jiǎn)稱“大五碼”),采用雙字節(jié),但不兼容GB2312和GBK。7.2.3文本信息的輸入與輸出1.文本信息的輸入(1)人工輸入人工輸入又分為鍵盤輸入、手寫筆和語(yǔ)音輸入。人工鍵盤輸入是指用手工擊鍵方式按照一定的規(guī)律把漢字輸入到計(jì)算機(jī)。漢字輸入碼就是利用鍵盤輸入漢字時(shí)所用的編碼。目前常用的漢字輸入碼主要分為以下兩類。①音碼類②形碼類7.2.3文本信息的輸入與輸出1.文本信息的輸入(2)自動(dòng)識(shí)別輸入文字的自動(dòng)識(shí)別分為印刷體識(shí)別和手寫體識(shí)別兩大類:①印刷體識(shí)別利用光電掃描儀將印刷體的文本掃描成圖像,再通過(guò)專用的光學(xué)字符識(shí)別(OpticalCharacterRecognition,簡(jiǎn)稱OCR)系統(tǒng)進(jìn)行文字識(shí)別,將漢字的圖像轉(zhuǎn)換成文本的形式,最后用“文件發(fā)送”或“導(dǎo)出”功能輸出到其他文檔編輯軟件中。這種輸入方法只能用于印刷體文字的輸入。受識(shí)別系統(tǒng)能力的限制,后期要做一些編輯修改工作。OCR軟件種類很多,常用的有清華紫光OCR、漢王OCR、蒙恬OCR等。②手寫體識(shí)別脫機(jī)手寫體漢字的識(shí)別難度很大,目前還不能達(dá)到實(shí)用階段。7.2.3文本信息的輸入與輸出*2.文本信息的輸出文本的輸出主要是顯示和打印可以把字符的形狀看成是一種圖形。漢字有很多字體,如宋體、楷體、黑體、隸書等,同一個(gè)漢字的字體不同,字的形狀也不同,為了輸出這些不同的漢字,以及同一個(gè)漢字的不同字體,要求把每一個(gè)漢字字形碼(又稱漢字字模)信息預(yù)先存放在計(jì)算機(jī)中。這些一定數(shù)量的字符形狀描述信息的集合稱為字形信息庫(kù),簡(jiǎn)稱字庫(kù)。要顯示或打印某個(gè)字符時(shí),計(jì)算機(jī)根據(jù)該字符的機(jī)內(nèi)碼找到其在字庫(kù)中的位置,再取出其字形碼(字模)信息作為字形在屏幕上顯示或在打印機(jī)上輸出。漢字字形碼通常有兩種表示方式:點(diǎn)陣和矢量表示方式。7.2.4文本的常見(jiàn)格式1.簡(jiǎn)單文本(純文本)簡(jiǎn)單文本幾乎不包含任何格式信息和結(jié)構(gòu)信息。這種文本通常稱為純文本或ASCII文本,文件后綴名是TXT。2.豐富格式文本豐富文本格式文件也稱富文本格式(RichTextFormat,簡(jiǎn)稱RTF)是由微軟公司開(kāi)發(fā)的跨平臺(tái)文檔格式,以純文本描述內(nèi)容,能夠保存各種格式信息。
3.超文本超文本也稱為非線性文本,文本的組織結(jié)構(gòu)是網(wǎng)狀結(jié)構(gòu),即包含鏈接信息的豐富格式文本。
4.超媒體超媒體=超文本+多媒體。
7.2.5文本編輯、排版與處理1.文本編輯與排版文本編輯與排版功能,一般包括:(1)對(duì)字、詞、句、段落進(jìn)行添加、刪除、修改等操作;(2)文字的格式處理:設(shè)置字體、字號(hào)、字的排列方向、間距、顏色、效果等;(3)段落的格式處理:設(shè)置行距、段間距、段縮進(jìn)、對(duì)齊方式等;(4)表格制作和繪圖;(5)定義超鏈。(6)頁(yè)面布局。7.2.5文本編輯、排版與處理2.文本處理常用文本處理的有關(guān)內(nèi)容:(1)字?jǐn)?shù)統(tǒng)計(jì),字頻統(tǒng)計(jì)、簡(jiǎn)/繁體相互轉(zhuǎn)換、漢字/拼音相互轉(zhuǎn)換;(2)詞語(yǔ)排序,詞語(yǔ)錯(cuò)誤檢測(cè)、文句語(yǔ)法檢查;(3)自動(dòng)分詞,詞頻統(tǒng)計(jì)、詞性標(biāo)注、詞義辨識(shí)、大陸/臺(tái)灣術(shù)語(yǔ)轉(zhuǎn)換;(4)文本壓縮,文本加密、文本著作權(quán)保護(hù);(5)關(guān)鍵詞提取,文摘自動(dòng)生成、文本分類;(6)文本檢索(關(guān)鍵詞檢索、全文檢索)、文本過(guò)濾;(7)文語(yǔ)轉(zhuǎn)換(語(yǔ)音合成)、文種轉(zhuǎn)換(機(jī)器翻譯);(8)篇章理解,自動(dòng)問(wèn)答、自動(dòng)寫作等。7.2.5文本編輯、排版與處理3.常用文本處理軟件(1)面向通信的文本處理軟件
如微軟公司的OutlookExpress(2)面向辦公的文本處理軟件
微軟公司Office套件中的Word和我國(guó)自行開(kāi)發(fā)的WPS(3)面向出版的文本處理軟件(4)面向網(wǎng)絡(luò)信息發(fā)布和電子出版的文本處理軟件
7.3圖像與圖形7.3圖像與圖形能夠被計(jì)算機(jī)處理的圖像為數(shù)字圖像。數(shù)字圖像按生成方式大致分為兩類:位圖圖像和矢量圖形。位圖圖像是指由掃描儀和數(shù)碼相機(jī)等輸入設(shè)備捕捉實(shí)際的畫面產(chǎn)生的數(shù)字圖像。也稱為取樣圖像或點(diǎn)陣圖像,常簡(jiǎn)稱為圖像。矢量圖形又稱為矢量圖像,常稱為圖形,一般是指通過(guò)計(jì)算機(jī)繪圖軟件生成的矢量圖形。矢量圖形文件存儲(chǔ)的是描述生成圖形的指令,因此不必對(duì)圖形中每一點(diǎn)進(jìn)行數(shù)字化處理。7.3.1圖像的獲取與數(shù)字化1.?dāng)?shù)字圖像獲取設(shè)備數(shù)字圖像獲取設(shè)備的功能是將現(xiàn)實(shí)的景物輸入到計(jì)算機(jī)內(nèi)并以取樣圖像的形式表示。2D圖像獲取設(shè)備(如掃描儀、數(shù)碼相機(jī)等)只能對(duì)圖片或景物的2D投影進(jìn)行數(shù)字化,3D掃描儀則能獲取包括深度信息在內(nèi)的3D景物的信息。7.3.1圖像的獲取與數(shù)字化2.圖像的數(shù)字化圖像獲取的過(guò)程實(shí)質(zhì)上是模擬信號(hào)的數(shù)字化過(guò)程,具體的處理步驟大致分為以下四步:7.3.1圖像的獲取與數(shù)字化2.圖像的數(shù)字化(1)掃描將畫面劃分成M×N個(gè)網(wǎng)格,每個(gè)網(wǎng)格即一個(gè)取樣點(diǎn),又稱像素。這樣,一幅模擬圖像就轉(zhuǎn)換為M×N個(gè)取樣點(diǎn)組成的矩陣。(2)分色將彩色圖像取樣點(diǎn)的顏色通過(guò)一種特殊的棱鏡分解成三個(gè)基色,如紅,綠,藍(lán)三種顏色。如果不是彩色圖像,則不必進(jìn)行分色。(3)取樣通過(guò)圖像傳感元件將每個(gè)取樣點(diǎn)(像素)的每個(gè)分量(基色)的亮度值轉(zhuǎn)換成與其成比例的電壓值(灰度值)。(4)量化將取樣得到的每個(gè)分量的電壓值進(jìn)行模數(shù)轉(zhuǎn)換,即把模擬量的電壓值使用數(shù)字量(一般為8~12位正整數(shù))來(lái)表示。
7.3.2圖像的基本參數(shù)1.顏色模型在對(duì)圖像進(jìn)行數(shù)字化時(shí),首先將圖像離散成若干行和若干列的像素點(diǎn),然后將每個(gè)點(diǎn)用二進(jìn)制的顏色編碼表示。圖像中的顏色編碼可以使用不同的顏色模型,顏色模型又稱為顏色空間,是指彩色圖像所使用的顏色描述方法。常用的顏色模型有:RGB(紅、綠、藍(lán))、CMYK(青藍(lán)、洋紅、黃、黑)、YUV(亮度、色度)等。從理論上講這些顏色模型都可以互相轉(zhuǎn)換。
7.3.2圖像的基本參數(shù)2.圖像分辨率一個(gè)圖像取樣后得到的像素?cái)?shù)目稱為圖像分辨率,是用于表示圖像大小的一個(gè)參數(shù),一般表示為“水平分辨率×垂直分辨率”的形式,其中水平分辨率表示圖像在水平方向的像素?cái)?shù),垂直分辨率表示圖像在垂直方向的像素?cái)?shù),如800×600,1024×768等。對(duì)于一個(gè)相同尺寸的圖像,組成該圖的像素?cái)?shù)量越多,說(shuō)明圖像的分辨率越高,看起來(lái)就越逼真,相應(yīng)地,圖像文件占用的存儲(chǔ)空間也越大;相反,像素?cái)?shù)量越少,圖像文件占用的存儲(chǔ)空間少了,但圖像顯得越粗糙。7.3.2圖像的基本參數(shù)3.位平面數(shù)目即矩陣的數(shù)目,也就是彩色分量的數(shù)目,如RGB的位平面數(shù)是3,而CMYK的位平面數(shù)是4。4.像素深度即像素的所有顏色分量的二進(jìn)制位數(shù)之和,它決定了不同顏色或亮度的最大數(shù)目。例如24位真彩色,每種顏色分別用8位二進(jìn)制數(shù)表示,其像素深度是8+8+8=24,它可以表示224,即16777216(約1600萬(wàn))種不同的顏色。7.3.3圖像的壓縮一幅圖像的數(shù)據(jù)量的計(jì)算公式是:圖像數(shù)據(jù)量=水平分辨率×垂直分辨率×像素深度/8(單位為字節(jié))以表7-2中1024×768的圖像為例,未經(jīng)壓縮的24位(真彩色)圖像的數(shù)據(jù)量計(jì)算方法如下:圖像數(shù)據(jù)量=1024×768×24/8B=2.25MB7.3.3圖像的壓縮如果對(duì)圖像進(jìn)行壓縮,則一幅圖像的數(shù)據(jù)量為:圖像數(shù)據(jù)量=未壓縮前的圖像數(shù)據(jù)量/圖像壓縮的倍數(shù)【例7-2】一架數(shù)碼相機(jī),其Flash存儲(chǔ)器容量為20MB,它一次可以連續(xù)拍攝像素深度16位(65536色)的1024×1024的彩色相片40張,計(jì)算其圖像數(shù)據(jù)的壓縮倍數(shù)。(1024×1024×16×40)/(20×1024×1024×8)=4圖像壓縮分為兩種類型,一種是無(wú)損壓縮,另一種是有損壓縮。7.3.4常用圖像格式1.BMP格式BMP(Bitmap,位圖)是微軟公司在Windows環(huán)境下的一種標(biāo)準(zhǔn)圖像文件格式,是一種通用的圖像格式,文件的擴(kuò)展名為“.bmp”。BMP可以有多種彩色模式,如4位、16位、24位真彩色,最新版本的BMP格式允許32位真彩色。由于BMP文件占用存儲(chǔ)空間較大,所以一般在單機(jī)上比較流行,而在Internet上使用得較少。2.GIF格式GIF格式的特點(diǎn)是壓縮比高,磁盤空間占用較少,但不能存儲(chǔ)超過(guò)256色的圖像,是Internet上常用的文件格式之一。由于GIF圖像文件短小、下載速度快、可用許多具有同樣大小的圖像文件組成動(dòng)畫。
7.3.4常用圖像格式3.JPEG格式JPEG是JointPhotographicExpertsGroup(聯(lián)合圖像專家組)的縮寫,文件后輟名為.jpg或.jpeg,是最常用的圖像文件格式。目前各類瀏覽器均支持JPEG這種圖像格式,因?yàn)镴PEG格式的文件尺寸較小,下載速度快,是網(wǎng)絡(luò)上最受歡迎的圖像格式之一。4.TIFFTIFF(TagImageFileFormat)是Mac中廣泛使用的圖像格式,它由Aldus和微軟聯(lián)合開(kāi)發(fā),文件的擴(kuò)展名為“.tif”。它的特點(diǎn)是圖像格式復(fù)雜、存貯信息多。非常有利于原稿的復(fù)制。5.PNG格式PNG(Portable
NetworfGraphics)的原名為“可移植性網(wǎng)絡(luò)圖像”,是網(wǎng)上接受的最新圖像文件格式。7.3.5圖像處理與應(yīng)用1.?dāng)?shù)字圖像處理數(shù)字圖像處理是指利用計(jì)算機(jī)技術(shù)對(duì)圖像進(jìn)行降噪、增強(qiáng)、復(fù)原、分割、提取特征、壓縮、存儲(chǔ)、管理、檢索等操作。2.圖像處理軟件Windows操作系統(tǒng)附件中的畫圖軟件(paint)和映像軟件(Imageforwindows)Office中的MicrosoftPhotoEditor和PictureManager軟件還有Adobe公司的Photoshop、IllustratorUlead公司的Paintshop、PhotoImpactAcdSystem公司的ACDSee軟件
7.3.5圖像處理與應(yīng)用3.?dāng)?shù)字圖像的應(yīng)用數(shù)字圖像處理在通信、遙感、電視、出版、廣告、工業(yè)生產(chǎn)、醫(yī)療診斷、電子商務(wù)等領(lǐng)域得到了廣泛的應(yīng)用,例如:(1)圖像通信,包括傳真、電視電話、電視會(huì)議等。(2)遙感。對(duì)航空遙感或衛(wèi)星遙感圖像進(jìn)行處理加工,用于礦藏勘探、地理資源調(diào)查、自然災(zāi)害預(yù)測(cè),環(huán)境污染檢測(cè),氣象預(yù)報(bào)等。(3)醫(yī)療診斷。例如,利用X射線、超聲、計(jì)算機(jī)斷層掃描(CT)、核磁共振等技術(shù)形成成圖像,進(jìn)行病理分析和疾病診斷。(4)工業(yè)生產(chǎn)應(yīng)用。如產(chǎn)品質(zhì)量檢測(cè),生產(chǎn)過(guò)程自動(dòng)控制等。(5)機(jī)器人視覺(jué)。(6)軍事、公安、檔案管理等方面的應(yīng)用。7.3.6計(jì)算機(jī)圖形與應(yīng)用1.計(jì)算機(jī)圖形矢量圖形又稱為矢量圖像,常稱為圖形,一般是指通過(guò)計(jì)算機(jī)繪圖軟件生成的矢量圖形。圖形通常是由計(jì)算機(jī)模擬產(chǎn)生的,可以是各種具體實(shí)在的物體,如家俱,房屋,機(jī)械零件等,也可以是假想的事物,如天氣形勢(shì),人口分布,經(jīng)濟(jì)增長(zhǎng)趨勢(shì)等。計(jì)算機(jī)圖形學(xué)研究的是用計(jì)算機(jī)模型來(lái)生成真實(shí)或想象中物體的圖像。在計(jì)算機(jī)中為物體建模的方法很多,它與物體的類型有密切關(guān)系。7.3.6計(jì)算機(jī)圖形與應(yīng)用1.計(jì)算機(jī)圖形以普通工業(yè)產(chǎn)品為例,它們可使用基本的幾何元素(如點(diǎn)、線、面、體等)及表面材料的性質(zhì)等進(jìn)行描述,所建立的模型稱為幾何模型,這在工業(yè)品的計(jì)算機(jī)輔助設(shè)計(jì)/制造(CAD/CAM)中有著重要的應(yīng)用。在現(xiàn)實(shí)世界中,有許多景物是很難使用幾何模型來(lái)描述的,例如山脈、云彩、海浪、煙火、樹(shù)木等。對(duì)于這些景物,需要找出它們的生成規(guī)律,使用相應(yīng)的算法來(lái)描述其規(guī)律,這種模型稱為過(guò)程模型或景物模型。7.3.6計(jì)算機(jī)圖形與應(yīng)用2.計(jì)算機(jī)圖形學(xué)的應(yīng)用計(jì)算機(jī)圖形的主要應(yīng)用領(lǐng)域有:(1)圖形用戶界面(2)計(jì)算機(jī)輔助設(shè)計(jì)與制造(CAD/CAM)(3)事務(wù)和商務(wù)數(shù)據(jù)的圖形展示(4)地形地貌和自然資源的圖形顯示(5)過(guò)程控制及系統(tǒng)環(huán)境模擬(6)電子出版及辦公室自動(dòng)化7.3.6計(jì)算機(jī)圖形與應(yīng)用3.常用計(jì)算機(jī)繪圖軟件AutoCAD、MAPInfo、ARCInfo等專用領(lǐng)域的繪圖軟件通用的辦公事務(wù)處理、平面設(shè)計(jì)、桌面出版所涉及的二維繪圖軟件,如Corel公司的CorelDraw,Adobe公司的Illustrator,Macromedia公司的FreeHand,微軟公司的MicrosoftViso等。7.4數(shù)字化音頻及應(yīng)用7.4.1聲音的數(shù)字化1.基本概念聲音是一種波,它由許多不同頻率的諧波組成。按頻率可分為次聲(頻率低于20Hz)、超聲(頻率高于20kHz)和可聽(tīng)聲(頻率在20Hz~20kHz),次聲和超聲是人耳無(wú)法聽(tīng)到的。多媒體技術(shù)處理的聲音主要是人耳可聽(tīng)到的20Hz~20kHz的音頻信號(hào),稱為全頻帶聲音。人說(shuō)話的聲音的頻率大致在300Hz~3000Hz之間,稱為語(yǔ)音;其他聲音,如音樂(lè),即各種樂(lè)器產(chǎn)生的聲音;大自然物理現(xiàn)象產(chǎn)生的聲音,如刮風(fēng)、下雨、打雷等;還有人工產(chǎn)生的爆破聲以及機(jī)器運(yùn)轉(zhuǎn)發(fā)出的聲音、各種動(dòng)物的叫聲等等。7.4.1聲音的數(shù)字化2.聲音信號(hào)的數(shù)字化聲音是模擬信號(hào),為了使用計(jì)算機(jī)進(jìn)行處理,必須將它轉(zhuǎn)換為二進(jìn)制數(shù)字編碼的形式,這個(gè)過(guò)程稱為聲音信號(hào)的數(shù)字化。波形編碼是最常用的一種聲音信號(hào)數(shù)字化的處理方式,它直接對(duì)音頻信號(hào)的時(shí)域或頻域進(jìn)行取樣量化編碼,處理過(guò)程如圖7-9所示。7.4.1聲音的數(shù)字化(1)取樣所謂取樣就是每隔一定時(shí)間間隔在聲音波形上取一個(gè)幅度值,把時(shí)間上連續(xù)的信號(hào)變?yōu)闀r(shí)間上離散的信號(hào)。該時(shí)間間隔稱為取樣周期。取樣周期的倒數(shù)稱取樣頻率,即每秒鐘的取樣次數(shù)。如44.1khz表示將1秒鐘的聲音用44100個(gè)取樣點(diǎn)數(shù)據(jù)表示,取樣頻率越高,數(shù)字化音頻的質(zhì)量越高,但數(shù)據(jù)量也越大。(2)量化量化是將每個(gè)取樣點(diǎn)的幅度值以數(shù)字存儲(chǔ)。聲音信號(hào)的量化位數(shù)一般取8位,12位或16位,量化位數(shù)越高,聲音的保真度越好。量化位數(shù)是另一個(gè)影響聲音質(zhì)量的重要指標(biāo),它決定了表示聲音振幅的精度。(3)編碼編碼是將取樣和量化后的數(shù)字?jǐn)?shù)據(jù)以一定的格式記錄下來(lái)。編碼的方式很多,常用的編碼方式是脈沖編碼調(diào)制(PulseCodeModulation,簡(jiǎn)稱PCM),其主要優(yōu)點(diǎn)是抗干擾能力強(qiáng),失真小、傳輸特性穩(wěn)定,但編碼的數(shù)據(jù)量比較大。7.4.2聲音的獲取設(shè)備與播放1.聲音的獲取設(shè)備聲音的獲取設(shè)備包括話筒(麥克風(fēng))和聲卡。話筒的作用是將聲波信號(hào)轉(zhuǎn)換為電信號(hào),然后由聲卡進(jìn)行數(shù)字化。聲卡是多媒體技術(shù)中最基本的組成部分,是實(shí)現(xiàn)聲波/數(shù)字信號(hào)相互轉(zhuǎn)換的硬件。聲卡既參與聲音的獲取,也負(fù)責(zé)聲音的重建,它控制并完成聲音的輸入與輸出。2.聲音的播放計(jì)算機(jī)輸出聲音的過(guò)程稱為聲音的播放,一般分為兩步:先把聲音從數(shù)字信號(hào)形式轉(zhuǎn)換為模擬信號(hào)形式,這個(gè)過(guò)程稱為聲音的重建;然后再將模擬信號(hào)經(jīng)過(guò)處理和放大后送到揚(yáng)聲器發(fā)出聲音。聲音的重建也由聲卡完成。7.4.3聲音的技術(shù)指標(biāo)和壓縮標(biāo)準(zhǔn)1.聲音的技術(shù)指標(biāo)數(shù)字化的波形聲音的質(zhì)量技術(shù)指標(biāo)有:取樣頻率、量化位數(shù)、聲道數(shù)、使用的壓縮編碼方法以及比特率。聲道數(shù)指聲音通道的個(gè)數(shù)。單聲道只記錄和產(chǎn)生一個(gè)波形;雙聲道產(chǎn)生兩個(gè)波形,也即立體聲,存儲(chǔ)空間是單聲道的兩倍。比特率也稱為碼率,它指的是每秒鐘的數(shù)據(jù)量。7.4.3聲音的技術(shù)指標(biāo)和壓縮標(biāo)準(zhǔn)1.聲音的技術(shù)指標(biāo)波形聲音未壓縮前,波形聲音的碼率計(jì)算公式為:波形聲音的碼率=取樣頻率(Hz)×量化位數(shù)(bit)×聲道數(shù)壓縮編碼后的碼率則為壓縮前的碼率除以壓縮倍數(shù)?!纠?-3】用44.1kHz的取樣頻率,量化位數(shù)為16,錄制1秒鐘的立體聲(雙聲道)節(jié)目,其聲音文件的數(shù)據(jù)量為:44.1×1000×16×2b/s=1411200b/s=1411.2kb/s=1411.2/8kB/s=176.4kB/s7.4.3聲音的技術(shù)指標(biāo)和壓縮標(biāo)準(zhǔn)2.聲音的壓縮標(biāo)準(zhǔn)波形聲音經(jīng)過(guò)數(shù)字化之后數(shù)據(jù)量很大,以CD盤片上所存儲(chǔ)的立體聲高保真的全頻帶數(shù)字音樂(lè)為例,1小時(shí)的數(shù)據(jù)量大約是635MB。為了降低存儲(chǔ)成本和提高通信效率(降低傳輸帶寬),對(duì)數(shù)字波形聲音進(jìn)行數(shù)據(jù)壓縮是十分必要的。波形聲音的數(shù)據(jù)壓縮也是完全可能的。其依據(jù)是聲音信號(hào)中包含大量的冗余信息,再加上人具有聽(tīng)覺(jué)感知特性,因此,產(chǎn)生了許多壓縮算法。7.4.4聲音文件的常見(jiàn)格式1.WAV(.wav)文件WAV是微軟公司開(kāi)發(fā)的一種聲音文件存儲(chǔ)格式,是PC機(jī)上最為流行的聲音文件格式。2.MPEG(.mp1/.mp2/.mp3)文件采用MPEG-1
Audio
Layer
3標(biāo)準(zhǔn)壓縮的聲音文件稱為mp3格式文件
mp3文件具有尺寸小,音質(zhì)相對(duì)較好,制作簡(jiǎn)單、便于交換等優(yōu)點(diǎn),非常適合在網(wǎng)上傳播,是目前使用最多的音頻格式文件。3.WMA(.wma)文件WMA的全稱是WindowsMediaAudio,是微軟力推的一種音頻格式。4.RealAudio文件(.ra、.rm、ram)5.MIDI(.mid)文件7.4.5計(jì)算機(jī)合成聲音1.計(jì)算機(jī)合成音樂(lè)計(jì)算機(jī)合成音樂(lè)是指計(jì)算機(jī)自動(dòng)演奏樂(lè)曲。計(jì)算機(jī)的聲卡一般都帶有音源,音源也稱為“音樂(lè)合成器”,相當(dāng)于樂(lè)器,可以模仿幾十種樂(lè)器的聲音。樂(lè)譜在計(jì)算機(jī)中既不用簡(jiǎn)譜也不用五線譜表示,而是用一種叫MIDI的音樂(lè)描述語(yǔ)言來(lái)表示。計(jì)算機(jī)中支持MIDI音樂(lè)播放的軟件就相當(dāng)于演奏人員,例如WindowsMediaPlayer、RealPlayer等。7.4.5計(jì)算機(jī)合成聲音2.計(jì)算機(jī)合成語(yǔ)音計(jì)算機(jī)合成語(yǔ)音就是利用計(jì)算機(jī)模仿人把一段文字朗讀出來(lái),這個(gè)過(guò)程稱為文語(yǔ)轉(zhuǎn)換(TTS)。計(jì)算機(jī)合成語(yǔ)音有很多方面的應(yīng)用。例如,股票交易、航班動(dòng)態(tài)查詢、電話報(bào)稅等;又如有聲E-mail服務(wù);CAI課件或游戲解說(shuō)詞的自動(dòng)配音;文稿校對(duì)、語(yǔ)言學(xué)習(xí)、語(yǔ)音秘書、自動(dòng)報(bào)警、殘疾人服務(wù)等。7.5數(shù)字化視頻及應(yīng)用7.5.1視頻基礎(chǔ)1.基本概念視頻分為數(shù)字視頻和模擬視頻。數(shù)字視頻簡(jiǎn)稱DV(Digitalvideo),是指以數(shù)字化方式表示連續(xù)變化的圖像信息?,F(xiàn)在出現(xiàn)的VCD、DVD和數(shù)字便攜攝像機(jī)都是數(shù)字視頻。模擬視頻是指信號(hào)在時(shí)間和幅度上連續(xù)的信號(hào),早期的電視、錄像機(jī)、攝像機(jī)中采用的就是模擬視頻。模擬電視制式是國(guó)際上通用的電視顯示標(biāo)準(zhǔn),世界上主要使用的電視廣播制式有PAL、NTSC和SECAM三種。7.5.1視頻基礎(chǔ)2.?dāng)?shù)字視頻計(jì)算機(jī)處理的對(duì)象是數(shù)字視頻。數(shù)字視頻與模擬視頻相比有很多優(yōu)點(diǎn)。例如,復(fù)制和傳輸時(shí)不會(huì)造成質(zhì)量下降、容易編輯修改、有利于傳輸、可節(jié)省頻率資源等。視頻信號(hào)的數(shù)字化過(guò)程比聲音要復(fù)雜。PC機(jī)中用于視頻信號(hào)數(shù)字化的插卡是視頻采集卡,簡(jiǎn)稱視頻卡。它能將模擬視頻信號(hào)及其伴音信號(hào)進(jìn)行數(shù)字化然后存儲(chǔ)在硬盤中。在數(shù)字化的同時(shí),視頻圖像經(jīng)過(guò)彩色空間轉(zhuǎn)換(由YUV轉(zhuǎn)換為RGB)與計(jì)算機(jī)圖形顯示卡產(chǎn)生的圖像疊加,用戶就可以在顯示器上觀看到視頻內(nèi)容。7.5.1視頻基礎(chǔ)2.?dāng)?shù)字視頻數(shù)字?jǐn)z像頭是一種在線獲取數(shù)字視頻的設(shè)備。數(shù)字?jǐn)z像頭通過(guò)光學(xué)鏡頭和CCD器件采集圖像,然后直接將圖像轉(zhuǎn)換成數(shù)字信號(hào)并輸入到計(jì)算機(jī),不再需要使用專門的視頻采集卡。數(shù)字?jǐn)z像頭有分辨率、鏡頭視角、幀率等主要技術(shù)參數(shù)。大多數(shù)數(shù)字?jǐn)z像頭采用CCD傳感器,有些產(chǎn)品采用CMOS類型的光傳感器,雖然分辨率不高,但功耗低、速度快。數(shù)字?jǐn)z像頭的接口大多采用USB接口,有些采用高速的IEEE1394接口。7.5.1視頻基礎(chǔ)2.?dāng)?shù)字視頻數(shù)字?jǐn)z像機(jī)是一種離線的數(shù)字視頻獲取設(shè)備。它通過(guò)將CCD轉(zhuǎn)換光信號(hào)得到的視頻信號(hào)進(jìn)行A/D轉(zhuǎn)換,得到數(shù)字視頻信號(hào),然后經(jīng)過(guò)數(shù)字信號(hào)處理、數(shù)據(jù)壓縮,最終可輸出壓縮的數(shù)字視頻信號(hào)。數(shù)字?jǐn)z像機(jī)輸出的圖像質(zhì)量較好,高清晰度的數(shù)字?jǐn)z像機(jī)可達(dá)720線,是高清晰度數(shù)字電視(HDTV)標(biāo)準(zhǔn)中最高級(jí)的一種。7.5.2視頻壓縮編碼1.MPEG-1MPEG-1主要適用于VCD、數(shù)碼相機(jī)和數(shù)字?jǐn)z像機(jī)等,也可用于數(shù)字電話網(wǎng)絡(luò)上的視頻傳輸,如視頻點(diǎn)播(VOD)等。2.MPEG-2MPEG-2主要針對(duì)數(shù)字電視(DTV)的應(yīng)用要求,碼率為1.5Mb/s~60Mb/s甚至更高。MPEG-2最顯著的特點(diǎn)是通用性,它保持了與MPEG-1向下兼容。7.5.2視頻壓縮編碼3.MPEG-4與MPEG-1和MPEG-2相比,MPEG-4的特點(diǎn)是更注重多媒體系統(tǒng)的交互性和靈活性。
MPEG-4主要應(yīng)用于可視電話、可視電子郵件以及遠(yuǎn)程監(jiān)視和控制等。4.MPEG-7和MPEG-21MPEG-7并不是一種壓縮編碼方法,而是一種多媒體內(nèi)容描述接口,它不針對(duì)某個(gè)具體的應(yīng)用。MPEG-7可應(yīng)用于數(shù)字圖書館、多媒體查詢服務(wù)、廣播媒體選擇和多媒體編輯等。MPEG-21的正式名稱是“多媒體框架”或“數(shù)字視聽(tīng)框架”,其目的是為所有使用多媒體信息的用戶提供透明而有效的電子交易和使用環(huán)境,使用戶能以各種方式使用分布在全球不同設(shè)備上的各種各樣的多媒體信息。7.5.3數(shù)字視頻的常見(jiàn)格式1.AVI格式Windows視頻標(biāo)準(zhǔn)格式文件。AVI兼容性好、使用方便、圖像質(zhì)量好,但文件體積太大。
2.MOV格式MOV文件是美國(guó)Apple公司開(kāi)發(fā)的一種視頻格式。其最大的特點(diǎn)是跨平臺(tái)性,即不僅支持Mac操作系統(tǒng),同樣也能支持Windows操作系統(tǒng)。一般認(rèn)為MOV格式文件的圖像質(zhì)量好于AVI格式。3.MPEG格式MPEG文件是按照MPEG標(biāo)準(zhǔn)壓縮的全屏視頻的標(biāo)準(zhǔn)文件。目前很多視頻處理軟件都支持這種格式的文件。7.5.2視頻壓縮編碼4.DAT格式DAT文件是一種為VCD及卡拉OKCD專用的視頻文件格式,采用MPEG壓縮、解壓縮。計(jì)算機(jī)配備視頻卡或安裝解壓縮程序就可以進(jìn)行播放。5.RM格式RM(Rea
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024人工智能算法研發(fā)維護(hù)合同
- 2024年仲裁委托代理合同
- 2024年信息技術(shù)服務(wù)外包項(xiàng)目保密協(xié)議
- 2024南寧市森林公園開(kāi)發(fā)合同
- 2024年品牌授權(quán)合同:國(guó)際知名奢侈品牌的授權(quán)生產(chǎn)與銷售
- 2024住宅小區(qū)物業(yè)服務(wù)費(fèi)用托管協(xié)議
- 2024年實(shí)習(xí)合同范本
- 物流配送行業(yè)有序用電管理辦法
- 建筑基礎(chǔ)擋土墻施工合同
- 04版「汽車銷售與服務(wù)」合同
- 攤位布局規(guī)劃方案
- 注塑工藝損耗率
- 鋼結(jié)構(gòu)漏雨維修方案
- (含附件)ktv承包協(xié)議書模板-2024
- (高清版)DZT 0289-2015 區(qū)域生態(tài)地球化學(xué)評(píng)價(jià)規(guī)范
- 2024年強(qiáng)基計(jì)劃解讀 課件-2024屆高三下學(xué)期主題班會(huì)
- 我國(guó)區(qū)域經(jīng)濟(jì)發(fā)展戰(zhàn)略(二)
- 合肥新站集貿(mào)市場(chǎng)規(guī)劃方案
- 城市道路橋梁工程施工質(zhì)量驗(yàn)收規(guī)范 DG-TJ08-2152-2014
- 急診急救知識(shí)培訓(xùn)
- 雨水泵站及配套工程施工組織設(shè)計(jì)樣本
評(píng)論
0/150
提交評(píng)論