版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第三章多媒體技術(shù)基礎(chǔ)3.1音頻信息處理技術(shù)音頻的基本概念聲音聲音多媒體系統(tǒng)中一個(gè)基本的元素,是攜帶信息的重要媒體。在多媒體系統(tǒng)中,聲音是指人耳能識(shí)別的音頻信息,它的主要表現(xiàn)形式為語(yǔ)音、自然聲、音樂(lè)以及各種人工合成的聲音等。2音頻的基本概念聲音的三個(gè)重要指標(biāo)振幅:通常是指音量,也就是聲波波形的高低幅度,表示聲音的強(qiáng)弱程度。周期:兩個(gè)相鄰聲波之間的時(shí)間長(zhǎng)度,即重復(fù)出現(xiàn)的時(shí)間間隔,以秒(s)為單位。頻率:每秒鐘聲波振動(dòng)的次數(shù),以赫茲(Hz)為單位。3音頻的基本概念聲音的三要素音調(diào):代表了聲音的高低。音調(diào)與頻率有關(guān),頻率越高,音調(diào)越高。音色:具有特色的聲音。純音,是指振幅和周期均為常數(shù)的聲音復(fù)音則是具有不同頻率和不同振幅的混合聲音,大自然中的聲音大部分是復(fù)音。在復(fù)音中,最低頻率的聲音是基音,它是聲音的基調(diào)。其他頻率的聲音稱(chēng)為諧音,稱(chēng)為泛音?;艉椭C音是構(gòu)成聲音音色的重要因素。音強(qiáng):聲音的強(qiáng)度,也被稱(chēng)為聲音的響度或聲音的大小,它取決于聲波振幅的大小,振幅越大,強(qiáng)度越大。常說(shuō)的音量也是指音強(qiáng)。4音頻的基本概念聲音的其他特性聲音的傳播與可聽(tīng)域聲音依靠介質(zhì)的振動(dòng)進(jìn)行傳播。模擬音頻信號(hào)由許多頻率不同的信號(hào)組成,每個(gè)信號(hào)都有各自的頻率范圍,這個(gè)組合信號(hào)被稱(chēng)為復(fù)合信號(hào)。聲音的頻率范圍又稱(chēng)頻域或頻帶,不同種類(lèi)的聲源其頻帶也不同。一般而言,聲源的頻帶越寬則表現(xiàn)力越好,層次越豐富。人耳的可聽(tīng)域在20~20000Hz之間,這些信號(hào)稱(chēng)為音頻信號(hào);頻率低于20Hz(稱(chēng)為亞音信號(hào)或次音信號(hào))和高于20000Hz(稱(chēng)為超音頻信號(hào))的聲音信號(hào)人類(lèi)是聽(tīng)不到的。5音頻的基本概念聲音的其他特性聲音的方向聲音以振動(dòng)波的形式從聲源向四周傳播,人類(lèi)在辨別聲源位置時(shí),首先依靠聲音到達(dá)左、右兩耳的微小時(shí)間差和強(qiáng)度差異進(jìn)行辨別,然后經(jīng)過(guò)大腦綜合分析而判斷出聲音來(lái)自何方。6音頻的基本概念聲音的其他特性聲音的頻譜聲音的頻譜有線性頻譜和連續(xù)頻譜之分。線性頻譜是指具有周期性的單一頻率聲波連續(xù)頻譜是指具有非周期性的帶有一定頻帶所有頻率分量的聲波。純粹的單一頻率的聲波只能在專(zhuān)門(mén)的設(shè)備中創(chuàng)造出來(lái),聲音效果單調(diào)而乏味。自然界中的聲音幾乎全部屬于非周期性聲波,具有廣泛的頻率分量,聽(tīng)起來(lái)聲音飽滿、音色多樣、具有生氣。7音頻的基本概念聲音的其他特性聲音的質(zhì)量聲音的質(zhì)量簡(jiǎn)稱(chēng)音質(zhì),音質(zhì)的好壞與音色和頻率范圍有關(guān)。影響音質(zhì)的因素對(duì)于數(shù)字音頻信號(hào),音質(zhì)的好壞與數(shù)據(jù)采樣頻率和數(shù)據(jù)位數(shù)有關(guān)。采樣頻率越低,位數(shù)越少,音質(zhì)越差。音質(zhì)與聲音還原設(shè)備有關(guān),音響放大器和揚(yáng)聲器的質(zhì)量能夠直接影響重放的音質(zhì)。音質(zhì)與信號(hào)噪聲比有關(guān)。在錄制聲音時(shí),音頻信號(hào)幅度與噪聲幅度的比值越大越好,否則聲音被噪聲干擾,會(huì)影響音質(zhì)。8音頻的基本概念聲音的其他特性聲音的連續(xù)時(shí)基性聲音在時(shí)間軸上是連續(xù)信號(hào),具有連續(xù)性和過(guò)程性,屬于連續(xù)時(shí)基性媒體形式。構(gòu)成聲音的數(shù)據(jù)前后之間具有強(qiáng)烈的相關(guān)性。除此之外,聲音還具有實(shí)時(shí)性,這對(duì)處理聲音的硬件和軟件提出很高的要求。數(shù)字化聲音聲音是自然界中一切可聽(tīng)到的振動(dòng)波,為了用計(jì)算機(jī)表示和處理聲音,必須把聲音進(jìn)行數(shù)字化,即用數(shù)字表示聲波。數(shù)字化的聲音稱(chēng)為“數(shù)字音頻信號(hào)”,它除了包含有自然界中所有的聲音之外,還具有經(jīng)過(guò)計(jì)算機(jī)處理的獨(dú)特音色和特質(zhì),這些是自然界所沒(méi)有的。9音頻的基本概念數(shù)字音頻數(shù)字音頻是以二進(jìn)制的方式記錄的音頻,是模擬音頻的數(shù)字化表達(dá)。數(shù)字音頻技術(shù)是指把模擬信號(hào)通過(guò)采樣、量化和編碼過(guò)程轉(zhuǎn)換成數(shù)字信號(hào),然后再進(jìn)行記錄、傳輸以及其他加工處理;在重放時(shí)再將這些記錄的數(shù)字信號(hào)還原為模擬信號(hào),獲得連續(xù)的聲音。10音頻的基本概念模擬音頻數(shù)字化采樣采樣就是每隔一段時(shí)間從連續(xù)變化的模擬音頻信號(hào)中取一個(gè)幅度值(也稱(chēng)為采樣值),從而把時(shí)間上的連續(xù)信號(hào)變成時(shí)間上的離散信號(hào)。采樣的時(shí)間間隔稱(chēng)為采樣周期;每秒內(nèi)采樣的次數(shù)稱(chēng)為采樣頻率;采樣后所得的一系列在時(shí)間上離散的樣本值稱(chēng)為樣值序列。11音頻的基本概念模擬音頻數(shù)字化量化采樣是把模擬音頻信號(hào)轉(zhuǎn)變?yōu)闀r(shí)間上離散的樣值序列。但每個(gè)樣值的幅度仍然是一個(gè)連續(xù)的模擬量。因此還必須對(duì)其進(jìn)行離散化處理,將其轉(zhuǎn)換為有限個(gè)離散值,才能最終用數(shù)碼來(lái)表示其幅度值。這種對(duì)采樣值進(jìn)行離散化的過(guò)程稱(chēng)為量化。12音頻的基本概念模擬音頻數(shù)字化編碼采樣、量化后的信號(hào)還不是數(shù)字信號(hào),需要把它轉(zhuǎn)換成數(shù)字編碼脈沖,這一過(guò)程稱(chēng)為編碼。最簡(jiǎn)單的編碼方式是二進(jìn)制編碼。就是用n位二進(jìn)制碼來(lái)表示已經(jīng)量化了的采樣值,每個(gè)二進(jìn)制數(shù)對(duì)應(yīng)一個(gè)量化值,然后把它們排列,得到一串由二值脈沖組成的數(shù)字信息流。13音頻的基本概念數(shù)字音頻的技術(shù)指標(biāo)采樣頻率采樣頻率是對(duì)聲音波形每秒鐘進(jìn)行采樣的次數(shù)。奈奎斯特理論指出:采樣頻率不應(yīng)低于模擬音頻信號(hào)最高頻率的兩倍,這樣才能將數(shù)字化的聲音還原為原始聲音,這叫做無(wú)損數(shù)字化(losslessdigitization)。音頻數(shù)據(jù)的采樣頻率f采樣與聲音還原頻率f還原的關(guān)系如下:f采樣=2×f還原音頻數(shù)據(jù)的采樣頻率是還原模擬聲音頻率的兩倍。例如,人的聽(tīng)覺(jué)的頻率上限為20kHz左右,為了使聲音不發(fā)生失真,采樣頻率一般在40kHz左右。常使用的采樣頻率有11.025kHz、22.05kHz和44.1kHz等。采樣頻率越高,聲音失真越小,音頻數(shù)據(jù)量越大。14音頻的基本概念數(shù)字音頻的技術(shù)指標(biāo)采樣精度采樣精度是每次采樣的數(shù)據(jù)位數(shù)。數(shù)據(jù)位數(shù)是每個(gè)采樣點(diǎn)的振幅動(dòng)態(tài)響應(yīng)數(shù)據(jù)范圍,經(jīng)常采用的有8位、12位和16位。例如,8位量化表示每個(gè)采樣點(diǎn)可以表示28個(gè)不同量化值。采樣量化位數(shù)越高,聲音質(zhì)量越好,而需要的存儲(chǔ)空間也越多。15音頻的基本概念數(shù)字音頻的技術(shù)指標(biāo)聲道數(shù)聲道數(shù)表示一次采樣的聲音波形個(gè)數(shù)。單聲道一次采樣一個(gè)聲音波形,雙聲道被人們稱(chēng)為“立體聲”,一次采樣兩個(gè)聲音波形。從而雙聲道比單聲道多一倍的數(shù)據(jù)量,而多聲道的數(shù)據(jù)量則更大。16音頻的基本概念數(shù)字音頻的技術(shù)指標(biāo)編碼算法編碼算法的作用采用一定的格式來(lái)記錄數(shù)據(jù)采用一定的算法來(lái)壓縮數(shù)據(jù)。壓縮比是壓縮編碼的基本指標(biāo),表示壓縮的程度,是壓縮前的音頻數(shù)據(jù)量與壓縮后的音頻數(shù)據(jù)量的比值。壓縮程度越大,信息丟失越多、信號(hào)還原后失真越大。根據(jù)不同的應(yīng)用,應(yīng)該選用不同的壓縮編碼算法。17音頻的基本概念模擬音頻數(shù)字化過(guò)程中的采樣頻率和采樣精度越高,結(jié)果越接近原始聲音,但記錄數(shù)字聲音所需存儲(chǔ)空間也隨之增加。未經(jīng)壓縮的音頻文件所需的存儲(chǔ)空間的計(jì)算公式如下:v=(f×b)/8×s×t其中,v代表存儲(chǔ)容量(字節(jié));f是采樣頻率;b是采樣精度(數(shù)據(jù)位數(shù));s是聲道數(shù);t是時(shí)間(秒)例如,以CD激光盤(pán)音質(zhì)(44.1kHz的采樣頻率、16位立體聲形式)記錄一首1分鐘的樂(lè)曲,則其存儲(chǔ)容量為:v=(44.1×16)/8×2×60=10584KB≈10.34MB18數(shù)字音頻文件格式WAV格式MIDI(樂(lè)器數(shù)字化接口)CDA格式MP3格式MP4格式WMA格式RealAudio格式VOC格式AIFF格式AU格式19語(yǔ)音技術(shù)的應(yīng)用語(yǔ)音識(shí)別技術(shù)語(yǔ)音識(shí)別技術(shù)就是讓計(jì)算機(jī)通過(guò)識(shí)別和理解過(guò)程把語(yǔ)音信號(hào)轉(zhuǎn)變?yōu)橄鄳?yīng)的文本或命令的技術(shù)。語(yǔ)音識(shí)別以語(yǔ)音為研究對(duì)象,是語(yǔ)音信號(hào)處理的一個(gè)重要研究方向,是模式識(shí)別的一個(gè)分支,其目的就是要讓機(jī)器具有人的聽(tīng)覺(jué)功能,在人機(jī)語(yǔ)音通訊中“聽(tīng)懂”人類(lèi)的語(yǔ)言。語(yǔ)音識(shí)別是一個(gè)多學(xué)科交叉的研究領(lǐng)域,涉及語(yǔ)言學(xué)、認(rèn)知科學(xué)以及計(jì)算機(jī)科學(xué)等多個(gè)學(xué)科。20語(yǔ)音技術(shù)的應(yīng)用語(yǔ)音識(shí)別系統(tǒng)結(jié)構(gòu)語(yǔ)音特征提?。浩淠康氖菑恼Z(yǔ)音波形中提取出隨時(shí)間變化的語(yǔ)音特征序列。聲學(xué)模型與模式匹配(識(shí)別算法):聲學(xué)模型通常將獲取的語(yǔ)音特征通過(guò)學(xué)習(xí)算法產(chǎn)生。在識(shí)別時(shí)將輸入的語(yǔ)音特征同聲學(xué)模型(模式)進(jìn)行匹配與比較,得到最佳的識(shí)別結(jié)果。語(yǔ)言模型與語(yǔ)言處理:語(yǔ)言模型包括由識(shí)別語(yǔ)音命令構(gòu)成的語(yǔ)法網(wǎng)絡(luò)或由統(tǒng)計(jì)方法構(gòu)成的語(yǔ)言模型,語(yǔ)言處理可以進(jìn)行語(yǔ)法、語(yǔ)義分析。對(duì)小詞表語(yǔ)音識(shí)別系統(tǒng),往往不需要語(yǔ)言處理部分。21語(yǔ)音技術(shù)的應(yīng)用語(yǔ)音識(shí)別系統(tǒng)的分類(lèi)語(yǔ)音識(shí)別系統(tǒng)可以根據(jù)對(duì)輸入語(yǔ)音的限制加以分類(lèi)從說(shuō)話者與設(shè)別系統(tǒng)的相關(guān)性考慮,語(yǔ)音設(shè)別系統(tǒng)可分為:特定人語(yǔ)音設(shè)別系統(tǒng)、非特定人語(yǔ)音識(shí)別系統(tǒng)和多人的識(shí)別系統(tǒng)。從說(shuō)話的方式考慮,語(yǔ)音設(shè)別系統(tǒng)可分為:孤立詞語(yǔ)音識(shí)別系統(tǒng)、連接詞語(yǔ)音識(shí)別系統(tǒng)和連續(xù)語(yǔ)音識(shí)別系統(tǒng)。從識(shí)別系統(tǒng)的詞匯量大小考慮,語(yǔ)音設(shè)別系統(tǒng)可分為:小詞匯量語(yǔ)音識(shí)別系統(tǒng)、中等詞匯量語(yǔ)音識(shí)別系統(tǒng)和大詞匯量語(yǔ)音識(shí)別系統(tǒng)。22語(yǔ)音技術(shù)的應(yīng)用語(yǔ)音識(shí)別的基本方法基于聲道模型和語(yǔ)音知識(shí)的方法該方法起步較早,在語(yǔ)音識(shí)別技術(shù)提出的開(kāi)始,就有了這方面的研究,但由于其模型及語(yǔ)音知識(shí)過(guò)于復(fù)雜,現(xiàn)階段沒(méi)有達(dá)到實(shí)用的階段。模式匹配的方法該方法發(fā)展比較成熟,目前已達(dá)到了實(shí)用階段。在模式匹配方法中,要經(jīng)過(guò)四個(gè)步驟:特征提取、模式訓(xùn)練、模式分類(lèi)和判決。常用的技術(shù)有三種:動(dòng)態(tài)時(shí)間歸正、隱馬爾可夫理論、矢量量化技術(shù)。利用人工神經(jīng)網(wǎng)絡(luò)的方法該方法是80年代末期提出的一種新的語(yǔ)音識(shí)別方法。人工神經(jīng)網(wǎng)絡(luò)本質(zhì)上是一個(gè)自適應(yīng)非線性動(dòng)力學(xué)系統(tǒng),模擬了人類(lèi)神經(jīng)活動(dòng)的原理,具有自適應(yīng)性、并行性、魯棒性、容錯(cuò)性和學(xué)習(xí)特性,其強(qiáng)大的分類(lèi)能力和輸入/輸出映射能力在語(yǔ)音識(shí)別中都很有吸引力。但由于存在訓(xùn)練、識(shí)別時(shí)間太長(zhǎng)的缺點(diǎn),目前仍處于實(shí)驗(yàn)探索階段。23語(yǔ)音技術(shù)的應(yīng)用語(yǔ)音識(shí)別的關(guān)鍵技術(shù)語(yǔ)音識(shí)別單元選取語(yǔ)音識(shí)別單元有單詞、音節(jié)和音素三種。特征參數(shù)提取技術(shù)從語(yǔ)言信號(hào)中提取用于語(yǔ)音識(shí)別的有用信息。模式匹配及模型訓(xùn)練技術(shù)模式匹配是指根據(jù)一定準(zhǔn)則,使未知模式與模型庫(kù)中某一模型獲得最佳匹配。模型訓(xùn)練是指按照一定準(zhǔn)則,從大量已知模式中提取表示該模式特征的模型參數(shù)。24語(yǔ)音技術(shù)的應(yīng)用語(yǔ)音合成技術(shù)語(yǔ)音合成,又稱(chēng)文語(yǔ)轉(zhuǎn)換技術(shù),能將任意文字信息實(shí)時(shí)轉(zhuǎn)化為標(biāo)準(zhǔn)流暢的語(yǔ)音朗讀出來(lái)。它涉及聲學(xué)、語(yǔ)言學(xué)、數(shù)字信號(hào)處理、計(jì)算機(jī)科學(xué)等多個(gè)學(xué)科技術(shù)。通過(guò)計(jì)算機(jī)語(yǔ)音合成可以在任何時(shí)候?qū)⑷我馕谋巨D(zhuǎn)換成具有高自然度的語(yǔ)音,從而真正實(shí)現(xiàn)讓機(jī)器“像人一樣開(kāi)口說(shuō)話”。語(yǔ)音合成技術(shù)可以通過(guò)將預(yù)先錄制并存儲(chǔ)的語(yǔ)音信號(hào)重新播放來(lái)實(shí)現(xiàn)。也可以采用數(shù)字信號(hào)處理的方法,通過(guò)激勵(lì)一個(gè)類(lèi)似人們發(fā)聲時(shí)聲道諧振特性的時(shí)變數(shù)字濾波器,調(diào)整濾波器的相關(guān)參數(shù),生成各種音調(diào)的語(yǔ)音。25語(yǔ)音技術(shù)的應(yīng)用語(yǔ)音合成的三個(gè)層次語(yǔ)音合成可分為三個(gè)層次,分別是文字到語(yǔ)音、概念到語(yǔ)音、意向到語(yǔ)音的合成。要合成出高質(zhì)量的語(yǔ)言,不僅要對(duì)語(yǔ)言進(jìn)行理解,還必須遵循人類(lèi)語(yǔ)言的一些表達(dá)規(guī)則,如語(yǔ)義學(xué)規(guī)則、詞匯規(guī)則、語(yǔ)音學(xué)規(guī)則。26語(yǔ)音技術(shù)的應(yīng)用語(yǔ)音合成系統(tǒng)的三大模塊。一個(gè)典型的語(yǔ)言合成系統(tǒng)可分為文本分析、韻律建模和語(yǔ)音合成三大模塊。主要功能是根據(jù)韻律建模的結(jié)果,從原始語(yǔ)音庫(kù)中取出相應(yīng)的語(yǔ)言基元,然后利用特定的語(yǔ)音合成技術(shù)對(duì)語(yǔ)音基元進(jìn)行韻律特性的調(diào)整和修改,最終合成出符合要求的語(yǔ)音。27語(yǔ)音技術(shù)的應(yīng)用常用的語(yǔ)音合成方法按照合成方法分類(lèi)參數(shù)合成法:通過(guò)調(diào)整合成器參數(shù)實(shí)現(xiàn)語(yǔ)音合成。基音同步疊加法:通過(guò)對(duì)時(shí)域波形拼接實(shí)現(xiàn)語(yǔ)音合成?;跀?shù)據(jù)庫(kù)的語(yǔ)音合成法:采用預(yù)先錄制語(yǔ)音單元并保存在數(shù)據(jù)庫(kù)中,再?gòu)臄?shù)據(jù)庫(kù)中選擇并拼接出各種語(yǔ)音內(nèi)容。28語(yǔ)音技術(shù)的應(yīng)用常用的語(yǔ)音合成方法按照技術(shù)方式分類(lèi)波形編輯合成:將語(yǔ)句、短語(yǔ)、詞或音節(jié)作為合成單元。這些單元被分別錄音后進(jìn)行壓縮編碼,組成一個(gè)語(yǔ)音庫(kù)。重放時(shí),取出相應(yīng)單元的波形數(shù)據(jù),串接或編輯在一起,經(jīng)解碼還原出語(yǔ)音。這種合成方式也稱(chēng)為錄音編輯合成。參數(shù)分析合成:以音節(jié)、半音節(jié)或音素為合成單元。按照語(yǔ)音理論,對(duì)所有合成單元的語(yǔ)音進(jìn)行分析,提取有關(guān)語(yǔ)音參數(shù),這些參數(shù)經(jīng)編碼后組成一個(gè)合成語(yǔ)音庫(kù);輸出時(shí),根據(jù)待合成的語(yǔ)音信息,從語(yǔ)音庫(kù)中取出相應(yīng)的合成參數(shù),經(jīng)編輯和連接,順序送入語(yǔ)音合成器。在合成器中,通過(guò)合成參數(shù)的控制,將語(yǔ)音波形重新還原出來(lái)。規(guī)則合成:存儲(chǔ)的是較小的語(yǔ)音單位,如音素、雙音素、半音節(jié)或音節(jié)的聲學(xué)參數(shù),以及由音素組成音節(jié)、再由音節(jié)組成詞或句子的各種規(guī)則。當(dāng)輸入字母符號(hào)時(shí),合成系統(tǒng)利用規(guī)則自動(dòng)地將它們轉(zhuǎn)換成連續(xù)的語(yǔ)音波形。29語(yǔ)音技術(shù)的應(yīng)用語(yǔ)音合成發(fā)展方向提高合成語(yǔ)音的自然度豐富合成語(yǔ)音的表現(xiàn)力降低語(yǔ)音合成技術(shù)的復(fù)雜度多語(yǔ)種文語(yǔ)合成30常用音頻處理軟件AdobeAuditionGoldWaveSonar313.2圖像信息處理技術(shù)圖像的基本概念像素:圖像最基本的單位。一個(gè)像素通常被視為圖像最小的完整采樣,是一個(gè)帶有顏色的小方塊。分辨率:衡量圖像質(zhì)量的重要參數(shù)。顯示分辨率:顯示分辨率是指在某一種顯示模式下計(jì)算機(jī)屏幕上最大的顯示區(qū)域,以水平和垂直方向的像素個(gè)數(shù)來(lái)表示,也即屏幕上的點(diǎn)數(shù)。圖像分辨率:圖像分辨率是指每英寸圖像中含有的點(diǎn)(或像素)的個(gè)數(shù)。33圖像的基本概念數(shù)字圖像種類(lèi)矢量圖:采用數(shù)學(xué)方法描述的圖形,一般有點(diǎn)、線、矩形、多邊形、圓和弧線等幾何圖形組成。點(diǎn)陣圖:也稱(chēng)位圖,它由許多顏色不同、深淺不同的像素組成。34圖像的基本概念像素深度顏色深度,是指存儲(chǔ)每個(gè)像素所用的位數(shù),像素深度決定彩色圖像的每個(gè)像素可能有的顏色數(shù),或者確定灰度圖像的每個(gè)像素可能有的灰度級(jí)數(shù)。35圖像的基本概念色彩模式RGB模式:又稱(chēng)加色模式,是日常生活中最常見(jiàn)的一種模式,由紅、綠、藍(lán)三種顏色疊加產(chǎn)生的色彩模式。CMYK模式:也稱(chēng)減色模式,是印刷中普遍使用的色彩模式。C表示青色,M表示品紅色,Y表示黃色,K表示黑色。HSB模式:是一種基于人對(duì)顏色的感覺(jué)的色彩模式,是以色相(H)、飽和度(S)和亮度(B)彩色三要素為基礎(chǔ)來(lái)描述顏色的。位圖模式:又稱(chēng)黑白模式,用黑、白兩種顏色表示圖像中的像素。灰度模式:該模式只有灰度色。所謂灰度色,就是指純白、純黑以及兩者中的一系列從黑到白的過(guò)渡色。Lab模式:由L通道、A通道和B通道三個(gè)通道組成,其中L通道表示亮度,A通道包括的顏色是從深綠色到灰色再亮粉紅色,B通道包括的顏色是從亮藍(lán)色到灰色再到黃色。雙色調(diào)模式:通過(guò)兩至四種自定油墨創(chuàng)建單色調(diào)、雙色調(diào)(兩種顏色)、三色調(diào)(三種顏色)和四色調(diào)(四種顏色)的灰度圖像。索引顏色模式:是使用最多含有256種顏色來(lái)表現(xiàn)彩色圖像的模式,該模式只支持8位色彩。多通道模式:在多通道模式中,每個(gè)通道都使用256級(jí)灰度??梢詫⒁粋€(gè)以上通道合成的任何圖像轉(zhuǎn)換為多通道模式,而原來(lái)的通道則被轉(zhuǎn)換為專(zhuān)色通道。36圖像的基本概念色彩理論對(duì)圖像色彩和色調(diào)的控制是所有圖像處理的關(guān)鍵。色彩和色調(diào)調(diào)節(jié)主要是對(duì)圖像的亮度、對(duì)比度、飽和度以及色相的調(diào)節(jié)。只有有效地控制圖像的色彩和色調(diào),才能制作出高品質(zhì)的圖像。亮度:就是各種色彩模式下的圖像原色(例如CMYK圖像的原色為C、M、Y、K四種)的明暗程度。對(duì)比度:指不同顏色之間的差異。對(duì)比度越大,兩種顏色之間的差異就越大。飽和度:指圖像顏色的強(qiáng)度和純度。它表示純色中灰成分的相對(duì)比例數(shù)量。色相:指色彩的相貌,也就是色彩的基本特征。色調(diào):一幅畫(huà)像的總體色彩傾向,是上升到一種藝術(shù)高度的色彩概括。37圖像處理技術(shù)圖像處理通常是指利用計(jì)算機(jī)對(duì)圖像進(jìn)行處理。其處理手段非常豐富。一般,圖像處理可以通過(guò)圖像處理軟件完成。38圖像處理技術(shù)數(shù)字圖像處理主要研究?jī)?nèi)容:圖像變換圖像編碼壓縮圖像增強(qiáng)和復(fù)原圖像分割圖像描述圖像分類(lèi)39圖像處理技術(shù)數(shù)字圖像處理技術(shù)主要優(yōu)點(diǎn):再現(xiàn)性好。數(shù)字圖像不會(huì)因圖像的存儲(chǔ)、傳輸或復(fù)制等一系列變換操作導(dǎo)致圖像質(zhì)量的退化。處理精度高。圖像的數(shù)字化精度可以達(dá)到很高的應(yīng)用需求。靈活性高。數(shù)字圖像處理不僅能完成線性運(yùn)算,而且能實(shí)現(xiàn)非線性運(yùn)算,即凡是可以用數(shù)學(xué)公式或邏輯關(guān)系表達(dá)的一切運(yùn)算都可以由數(shù)字圖像處理實(shí)現(xiàn)。適用面寬。圖像可以來(lái)自多種信息源,既可以是可見(jiàn)光圖像,也可以是不可見(jiàn)的波譜圖像。只要針對(duì)不同的圖像信息源,采取相應(yīng)的圖像采集方法,就可以用圖像處理技術(shù)處理任何圖像。40圖像文件格式JPEG格式是圖像最常用的有損壓縮格式,文件的擴(kuò)展名為“.jpg”。JPEG格式的壓縮率是目前各種圖像文件中最高的,是目前網(wǎng)絡(luò)上流行的圖像格式。BMP格式是Windows操作系統(tǒng)中標(biāo)準(zhǔn)的位圖文件格式,其擴(kuò)展名為“.bmp”。這種格式的特點(diǎn)是包含的圖像信息較豐富,但不采用壓縮技術(shù),故占用磁盤(pán)空間過(guò)大,不利于網(wǎng)絡(luò)傳輸。GIF格式是由CompuServe公司開(kāi)發(fā)的圖像文件格式,文件的擴(kuò)展名為“.gif”。GIF格式的顏色數(shù)目最多,達(dá)到256色,但文件壓縮比較大,因此文件小,適合網(wǎng)上傳輸。TIFF格式是由Aldus和Microsoft公司為掃描儀和臺(tái)式計(jì)算機(jī)出版軟件開(kāi)發(fā)的,是為存儲(chǔ)黑白圖像、灰度圖像和彩色圖像而定義的存儲(chǔ)格式,文件的擴(kuò)展名為“.tif”。PNG格式是為適應(yīng)網(wǎng)絡(luò)傳輸而設(shè)計(jì)的靜態(tài)圖像文件格式,文件的擴(kuò)展名為“.png”。41常用圖像處理軟件ACDSeeACDSee是由ACDsystem公司開(kāi)發(fā)的數(shù)字圖像處理軟件,它提供了良好的操作界面,簡(jiǎn)單人性化的操作方式,優(yōu)質(zhì)的快速圖形解碼方式,支持豐富的圖形格式,強(qiáng)大的圖形文件管理功能。能廣泛應(yīng)用于圖像的獲取、管理、瀏覽和優(yōu)化等操作。PhotoshopPhotoshop是Adobe公司推出的最優(yōu)秀的圖像處理軟件之一,被廣泛應(yīng)用于平面設(shè)計(jì)、廣告攝影、影像創(chuàng)意、建筑設(shè)計(jì)、照片設(shè)計(jì)和修復(fù)、網(wǎng)頁(yè)制作、印刷等應(yīng)用領(lǐng)域。CoreldrawCorelDRAW是一款由Corel公司開(kāi)發(fā)的矢量圖形繪制軟件,被廣泛地應(yīng)用于商標(biāo)設(shè)計(jì)、標(biāo)志制作、模型繪制、描圖描畫(huà)、排版及分色輸出等諸多領(lǐng)域。它提供繪圖和排版兩大功能。FireworksFireworks是由Adobe公司開(kāi)發(fā)的專(zhuān)為網(wǎng)頁(yè)制作者設(shè)計(jì)的處理網(wǎng)絡(luò)圖像的軟件。使用Fireworks,不僅可以輕松地制作出十分動(dòng)感的GIF動(dòng)畫(huà),還可以輕易地完成大圖切割、動(dòng)態(tài)按鈕、動(dòng)態(tài)翻轉(zhuǎn)圖等。423.3動(dòng)畫(huà)制作44
動(dòng)畫(huà)的基本概念產(chǎn)生動(dòng)畫(huà)的原理從屏幕上觀看電影、電視或動(dòng)畫(huà)片時(shí),看到的畫(huà)面是連續(xù)的,而從膠片上看到的卻是一幅幅定格的畫(huà)面,這是由于人眼有視覺(jué)殘留的生理特點(diǎn)。人的眼睛在看到一幅畫(huà)或一個(gè)物體后,在1/24秒內(nèi)不會(huì)消失。利用這一原理,如果以每秒24幅畫(huà)面的速度播放,人眼就可以看到連續(xù)的畫(huà)面,產(chǎn)生了運(yùn)動(dòng)的視覺(jué)效果。動(dòng)畫(huà)的基本原理壓縮與拉伸預(yù)備動(dòng)作演出(布局)4445
動(dòng)畫(huà)的基本概念順序動(dòng)畫(huà)與原圖——?jiǎng)赢?huà)制作方式追隨與交搭動(dòng)作慢入與慢出運(yùn)動(dòng)弧線次要?jiǎng)幼鲿r(shí)間掌握夸張立體造型吸引力4546
動(dòng)畫(huà)的基本概念動(dòng)畫(huà)的分類(lèi)二維動(dòng)畫(huà)又稱(chēng)為平面動(dòng)畫(huà)三維動(dòng)畫(huà)又稱(chēng)為3D動(dòng)畫(huà)計(jì)算機(jī)動(dòng)畫(huà)的特點(diǎn)計(jì)算機(jī)動(dòng)畫(huà)與手工動(dòng)畫(huà)相比有許多優(yōu)越性,使用計(jì)算機(jī)可以進(jìn)行角色設(shè)計(jì)、背景繪制、描線上色等常規(guī)工作,它具有操作方便、顏色一致、準(zhǔn)確等特點(diǎn),不用擔(dān)心顏料變質(zhì)等問(wèn)題。其繪圖界線明確,不需晾干,不會(huì)串色,改色方便,更不會(huì)因?qū)訑?shù)增多而影響下層的顏色。4647
動(dòng)畫(huà)的基本概念計(jì)算機(jī)動(dòng)畫(huà)的特點(diǎn)計(jì)算機(jī)動(dòng)畫(huà)還具有檢查方便、簡(jiǎn)化管理、提高生產(chǎn)效率、縮短制作周期等優(yōu)點(diǎn)。很多重復(fù)勞動(dòng)可以借助計(jì)算機(jī)來(lái)完成,比如計(jì)算機(jī)生成的圖像可以復(fù)制、翻轉(zhuǎn)、放大、縮小。4748
動(dòng)畫(huà)制作技術(shù)
逐幀動(dòng)畫(huà)逐幀動(dòng)畫(huà)是最基礎(chǔ)的動(dòng)畫(huà)表現(xiàn)方法,每一幀的內(nèi)容都不同,需要一幀一幀繪制。逐幀動(dòng)畫(huà)具有非常大的靈活性,幾乎可以表現(xiàn)任何想表現(xiàn)的內(nèi)容,適合制作表演很細(xì)膩的動(dòng)畫(huà),如3D效果、人走路等。但是,由于逐幀動(dòng)畫(huà)需要逐幀繪制每一幀的內(nèi)容,增加了制作負(fù)擔(dān),而且最終輸出的文件也很大。48動(dòng)畫(huà)制作技術(shù)路徑動(dòng)畫(huà)生活中存在著大量的曲線運(yùn)動(dòng),例如:大炮射出炮彈的拋物體運(yùn)動(dòng),人造衛(wèi)星圍繞地球的圓周運(yùn)動(dòng)等。在動(dòng)畫(huà)中,如果讓對(duì)象沿曲線運(yùn)動(dòng),應(yīng)先繪制曲線作為對(duì)象運(yùn)動(dòng)的軌跡,然后進(jìn)行相應(yīng)的設(shè)置,可以看到對(duì)象沿著曲線運(yùn)動(dòng),這就是路徑動(dòng)畫(huà)。494950
動(dòng)畫(huà)制作技術(shù)
變形動(dòng)畫(huà)變形指對(duì)象的形狀變化,它可以使一個(gè)對(duì)象逐漸變成另一個(gè)完全不同的對(duì)象,或者改變一個(gè)對(duì)象的形狀。變形的起始對(duì)象和結(jié)束對(duì)象分別在兩個(gè)關(guān)鍵幀中,從起始形狀變化到結(jié)束形狀的關(guān)鍵在于自動(dòng)地生成中間形狀,即自動(dòng)生成中間幀。5051
動(dòng)畫(huà)制作技術(shù)
粒子動(dòng)畫(huà)粒子動(dòng)畫(huà)方面的先驅(qū)是Reeves,他提出了粒子系統(tǒng)理論。粒子系統(tǒng)的基本思想是把不規(guī)則模糊物體看作由一定數(shù)量的粒子組成的粒子群體,每個(gè)粒子有共同的屬性,如速度、加速度、顏色、生存周期、大小、形狀等。粒子在隨時(shí)間的變化過(guò)程中,按照所賦予的粒子動(dòng)力學(xué)規(guī)律改變其狀態(tài),這種粒子運(yùn)動(dòng)均可以通過(guò)受控的隨機(jī)過(guò)程來(lái)模擬實(shí)現(xiàn)。由于粒子系統(tǒng)是一個(gè)有“生命”的系統(tǒng),它充分體現(xiàn)了不規(guī)則物體的動(dòng)態(tài)性和隨機(jī)性,這使模擬動(dòng)態(tài)的自然景觀如火、云、水等成為可能。通過(guò)粒子動(dòng)畫(huà)模擬的火光、煙霧、閃電等特殊光效,已廣泛應(yīng)用于電影行業(yè)。5152
動(dòng)畫(huà)制作技術(shù)
群體動(dòng)畫(huà)在生物界,許多動(dòng)物如鳥(niǎo)、魚(yú)等以群體的方式運(yùn)動(dòng)。這種運(yùn)動(dòng)既有隨機(jī)性,又有一定的規(guī)律性。Reynolds提出的群體動(dòng)畫(huà)成功地解決了這一問(wèn)題。群體的行為包含兩個(gè)對(duì)立的因素,既要相互靠近又要避免碰撞??梢允褂冒磧?yōu)先級(jí)遞減的碰撞避免原則(即避免與相鄰的群體成員相碰)、速度匹配原則(即盡量匹配相鄰群體成員的速度)和群體合群原則(即群體成員之間盡量靠近)三條原則,來(lái)控制群體的行為。5253
動(dòng)畫(huà)文件格式
GIF格式GIF(GraphicsInterchangeFormat)即“圖像交換格式”,文件的擴(kuò)展名是“.GIF”。這種格式在20世紀(jì)80年代由美國(guó)一家著名的在線信息服務(wù)機(jī)構(gòu)CompuServe開(kāi)發(fā)而成。GIF格式的顏色數(shù)較少,最多只能用256種顏色來(lái)表示對(duì)象。GIF格式文件小,適合網(wǎng)絡(luò)傳輸??紤]到網(wǎng)絡(luò)傳輸中的實(shí)際情況,GIF格式還增加了漸顯方式,在圖像傳輸過(guò)程中,用戶可以先看到圖像的大致輪廓,然后隨著傳輸過(guò)程的繼續(xù)而逐步看清圖像中的細(xì)節(jié)部分,從而適應(yīng)了用戶的“從朦朧到清楚”的觀賞心理。目前Internet上大量采用的彩色動(dòng)畫(huà)文件多為這種格式的文件。5354
動(dòng)畫(huà)文件格式
SWF格式動(dòng)畫(huà)制作軟件Flash制作出擴(kuò)展名為“.SWF”的動(dòng)畫(huà)文件。這種格式的動(dòng)畫(huà)文件比較小并且畫(huà)面質(zhì)量高。在圖像的傳輸方面,采用的是流式動(dòng)畫(huà)播放技術(shù),用戶不必等到文件全部下載才能觀看,而是可以邊下載邊欣賞,因此特別適合網(wǎng)絡(luò)傳輸。此外,SWF動(dòng)畫(huà)是基于矢量技術(shù)制作的,因此不管將畫(huà)面放大多少倍,畫(huà)面仍然清晰流暢,質(zhì)量不會(huì)因此而降低。SWF格式動(dòng)畫(huà)作品受到了越來(lái)越多網(wǎng)頁(yè)設(shè)計(jì)者的青睞,成為網(wǎng)頁(yè)動(dòng)畫(huà)的主流。5455
動(dòng)畫(huà)文件格式
FLIC格式FLIC是AutoDesk公司在其出品的2D、3D動(dòng)畫(huà)制作軟件中,采用的彩色動(dòng)畫(huà)文件格式。FLIC是FLI和FLC的統(tǒng)稱(chēng),F(xiàn)LI是最初的基于320×200像素的動(dòng)畫(huà)文件格式,而FLC則是FLI的擴(kuò)展格式,采用了更高效的數(shù)據(jù)壓縮技術(shù),其分辨率也不再局限于320×200像素。FLIC文件采用行程編碼(RLE)算法和Delta算法進(jìn)行無(wú)損數(shù)據(jù)壓縮,首先壓縮并保存整個(gè)動(dòng)畫(huà)序列中的第一幅圖像,然后逐幀計(jì)算前后兩幅相鄰圖像的差異或改變部分,并對(duì)這部分?jǐn)?shù)據(jù)進(jìn)行RLE壓縮,由于動(dòng)畫(huà)序列中前后相鄰圖像的差別通常不大,因此可以得到相當(dāng)高的數(shù)據(jù)壓縮率。5556二維動(dòng)畫(huà)制作二維動(dòng)畫(huà)二維動(dòng)畫(huà)又稱(chēng)為平面動(dòng)畫(huà),通過(guò)平面上物體的運(yùn)動(dòng)和變形來(lái)實(shí)現(xiàn)動(dòng)畫(huà)。二維動(dòng)畫(huà)是對(duì)手工傳統(tǒng)動(dòng)畫(huà)的改進(jìn)。可以輸入和編輯關(guān)鍵幀,計(jì)算和生成中間幀,定義運(yùn)動(dòng)路徑,實(shí)現(xiàn)畫(huà)面與聲音的同步。二維動(dòng)畫(huà)應(yīng)用領(lǐng)域二維動(dòng)畫(huà)主要應(yīng)用于網(wǎng)站建設(shè)、動(dòng)畫(huà)短片、游戲開(kāi)發(fā)和制作教學(xué)課件等領(lǐng)域。5657二維動(dòng)畫(huà)制作常用二維動(dòng)畫(huà)制作軟件ANIMO是英國(guó)CambridgeAnimation公司開(kāi)發(fā)的動(dòng)畫(huà)制作軟件,模擬傳統(tǒng)的動(dòng)畫(huà)制作過(guò)程,操作方式直觀。TOONZ是優(yōu)秀的卡通動(dòng)畫(huà)制作軟件,被廣泛應(yīng)用于卡通動(dòng)畫(huà)系列片、音樂(lè)片、教育片、商業(yè)廣告片中的卡通動(dòng)畫(huà)制作。Flash是目前流行的二維動(dòng)畫(huà)制作軟件,制作的動(dòng)畫(huà)具有體積小、交互性好的特點(diǎn),被廣泛應(yīng)用于網(wǎng)絡(luò)動(dòng)畫(huà)制作。5758三維動(dòng)畫(huà)制作三維動(dòng)畫(huà)三維動(dòng)畫(huà)又稱(chēng)3D動(dòng)畫(huà),是近年來(lái)隨著計(jì)算機(jī)軟硬件技術(shù)的發(fā)展而產(chǎn)生的新興技術(shù)。三維動(dòng)畫(huà)軟件在計(jì)算機(jī)中首先建立一個(gè)虛擬的世界,設(shè)計(jì)師在這個(gè)虛擬的三維世界中按照要表現(xiàn)的對(duì)象的形狀尺寸建立模型以及場(chǎng)景,設(shè)置模型的動(dòng)畫(huà)效果,最后按要求為模型賦上特定的材質(zhì),并打上燈光。5859三維動(dòng)畫(huà)制作三維動(dòng)畫(huà)應(yīng)用領(lǐng)域三維動(dòng)畫(huà)能給觀賞者以身臨其境的感覺(jué),主要應(yīng)用于廣告、影視、建筑、模擬動(dòng)畫(huà)、園林設(shè)計(jì)和產(chǎn)品演示等領(lǐng)域。常用三維動(dòng)畫(huà)制作軟件3dsMax是AutoDesk公司出品的三維動(dòng)畫(huà)制作軟件。它具有優(yōu)良的多線程運(yùn)算能力、豐富的建模和動(dòng)畫(huà)能力以及出色的材質(zhì)編輯系統(tǒng)。5960三維動(dòng)畫(huà)制作Maya是AutoDesk公司出品的三維動(dòng)畫(huà)制作軟件。作為三維動(dòng)畫(huà)軟件的后起之秀,深受業(yè)界歡迎和鐘愛(ài)。它不僅包括一般三維和視覺(jué)效果制作的功能,而且還結(jié)合了最先進(jìn)的建模、數(shù)字化布料模擬、毛發(fā)渲染和運(yùn)動(dòng)匹配技術(shù)。Maya因其強(qiáng)大的功能在3D動(dòng)畫(huà)界造成巨大的影響,已經(jīng)滲入到電影、電視、游戲可視化等領(lǐng)域,成為三維動(dòng)畫(huà)軟件中的佼佼者。Lightwave3D是NewTek公司的產(chǎn)品。它具有出色的品質(zhì),價(jià)格卻非常低廉,這也是眾多公司選用它的原因之一。Softimage3D是由專(zhuān)業(yè)動(dòng)畫(huà)師設(shè)計(jì)的強(qiáng)大的三維動(dòng)畫(huà)制作工具。603.4視頻信息處理技術(shù)視頻的基本概念視頻基礎(chǔ)視頻:由一系列單獨(dú)的靜止圖像組成,每秒鐘連續(xù)播放靜止圖像,利用人眼的視覺(jué)殘留現(xiàn)象,在觀者眼中就產(chǎn)生了平滑而連續(xù)活動(dòng)的影像。幀(Frame):視頻圖像的最小單位,一幀表示掃描獲得一幅完整圖像的模擬信號(hào)。幀頻:每秒鐘連續(xù)播放的幀數(shù),單位是幀/秒。典型的幀頻:24幀/秒、25幀/秒和30幀/秒(29.97幀/秒)。掃描:在電視臺(tái)發(fā)射的信號(hào)中,每幀圖像都是逐行“畫(huà)”成的,稱(chēng)為“掃描”。逐行掃描:一幀即是一個(gè)垂直掃描場(chǎng).隔行掃描:一幀由奇數(shù)場(chǎng)和偶數(shù)場(chǎng)兩個(gè)場(chǎng)構(gòu)成,兩個(gè)隔行掃描場(chǎng)表示一幀。常見(jiàn)的視頻信號(hào)有:電視和電影。62視頻的基本概念電視的色彩模型電視所采用的色彩模型有RGB模型和YUV模型等。RGB:又稱(chēng)三原色相加混色模型。在彩色電視拍攝和播放時(shí),采用這種色彩模型。YUV:又稱(chēng)亮度色差模型。在電視信號(hào)傳送時(shí),采用這種色彩模型。由于電視的制式不同,采用的色彩模型也不一樣。但基本的原理是一樣的,即拍攝和播放時(shí)采用RGB模型,傳送時(shí)用YUV模型。兩種模型之間可以相互轉(zhuǎn)換。63視頻的基本概念電視制式電視的制式就是電視信號(hào)的標(biāo)準(zhǔn)。制式的區(qū)分主要在于幀頻、分辨率、信號(hào)帶寬以及載頻、色彩空間的轉(zhuǎn)換關(guān)系上。不同的制式對(duì)視頻信號(hào)的解碼方式、色彩處理方式以及屏幕掃描頻率的要求都有所不同。目前全世界有NTSC、PAL、SECAM和HDTV幾種常見(jiàn)的彩色電視制式。中國(guó)采用的是PAL制式。64視頻的基本概念NTSC制式NTSC(NationalTelevisionSystemsCommittee,即國(guó)家電視制式委員會(huì))是1952年美國(guó)國(guó)家電視標(biāo)準(zhǔn)委員會(huì)定義的彩色電視廣播標(biāo)準(zhǔn),它采用了正交平衡調(diào)幅技術(shù)(正交平衡調(diào)幅制)。美國(guó)、加拿大等大部分西半球國(guó)家,和亞太地區(qū)日本、韓國(guó)、菲律賓等國(guó)和中國(guó)的臺(tái)灣地區(qū)采用這種制式。NTSC制式規(guī)定:幀頻為30幀/秒(29.97幀/秒),每幀圖像有525行掃描線,掃描方式為隔行掃描,寬高比是4:3,場(chǎng)掃描頻率是60Hz,色彩模型為YIQ。YIQ也是一種亮度色差模型,其中:Y表示亮度,I和Q表示色差。65視頻的基本概念PAL制式PAL(Phase-AlternativeLine,即逐行相位交換)是1962年德國(guó)(當(dāng)時(shí)的聯(lián)邦德國(guó))制定的一種彩色電視廣播標(biāo)準(zhǔn)。德國(guó)、英國(guó)等一些西歐國(guó)家,以及中國(guó)、朝鮮、新加坡、澳大利亞、新西蘭等國(guó)家采用這種制式。PAL制式規(guī)定:幀頻為25幀/秒,每幀圖像有625行掃描線,掃描方式為隔行掃描,寬高比是4:3,場(chǎng)掃描頻率是50Hz,色彩模型為YUV。66視頻的基本概念SECAM制式SECAM(SequentialColourAvecMemoire,即順序傳送彩色信號(hào)與存儲(chǔ)恢復(fù)彩色信號(hào))是法國(guó)1956年提出、1966年制定的一種彩色電視廣播標(biāo)準(zhǔn),這種制式與PAL制類(lèi)似,其差別是SECAM中的色度信號(hào)是頻率調(diào)制(FM)。法國(guó)、前蘇聯(lián)、東歐以及中東部分國(guó)家采用這種制式。SECAM制式規(guī)定:幀頻為25幀/秒,每幀圖像有625行掃描線,掃描方式為隔行掃描,寬高比是4:3,場(chǎng)掃描頻率50Hz,色彩模型為YUV。67視頻的基本概念HDTVHDTV(HighDefinitionTV,即高清晰度電視)是目前正在蓬勃發(fā)展的電視標(biāo)準(zhǔn),尚未完全統(tǒng)一。但一般認(rèn)為:每幀掃描在1000行以上,寬高比是16:9,掃描方式為逐行掃描,有較高的掃描頻率,傳送的信號(hào)全部數(shù)字化。68視頻的基本概念視頻時(shí)間碼一段視頻片段的持續(xù)時(shí)間以及它的開(kāi)始幀和結(jié)束幀通常用時(shí)間單位和地址來(lái)計(jì)算,這些時(shí)間單位和地址被稱(chēng)為時(shí)間碼(簡(jiǎn)稱(chēng)時(shí)碼)。時(shí)碼標(biāo)準(zhǔn)為SMPTE,其格式為“小時(shí):分鐘:秒:幀”。例:一個(gè)PAL制式(25幀/秒)的素材片段表示為“00:01:30:12”,播放的幀率為25幀/秒,那么這段素材共有25×60+25×30+12=2262(幀)69視頻的基本概念視頻的特點(diǎn)直觀、生動(dòng)、具體高分辨率、色彩逼真(真彩色)信息容量大人類(lèi)接受的信息約70%來(lái)自視覺(jué)一般還包括音頻信號(hào)。70視頻的基本概念模擬視頻模擬視頻信號(hào)是一種用于傳輸圖像和聲音且隨時(shí)間連續(xù)變化的電信號(hào)。早期視頻的獲取、存儲(chǔ)和傳輸都是采用模擬方式,所用的存儲(chǔ)介質(zhì)、處理設(shè)備以及傳輸網(wǎng)絡(luò)都是模擬的。計(jì)算機(jī)不能處理模擬視頻信息,只有把模擬視頻圖像轉(zhuǎn)換成數(shù)字化的視頻圖像,計(jì)算機(jī)才能對(duì)視頻信號(hào)進(jìn)行處理。71視頻的基本概念數(shù)字視頻數(shù)字視頻是以離散的數(shù)字信號(hào)表示、存儲(chǔ)、處理和傳輸?shù)囊曨l信息,所用的存儲(chǔ)介質(zhì)、處理設(shè)備以及傳輸網(wǎng)絡(luò)都是數(shù)字的,對(duì)模擬視頻進(jìn)行數(shù)字化后得到的就是數(shù)字視頻。模擬視頻數(shù)字化過(guò)程:模/數(shù)轉(zhuǎn)換(A/D)數(shù)字信號(hào)轉(zhuǎn)換成模擬信號(hào)的過(guò)程:數(shù)/模轉(zhuǎn)換(D/A)72視頻的基本概念模擬視頻數(shù)字化采樣、量化和編碼。視頻采樣。模擬視頻一般采用分量數(shù)字化方式,使用RGB模型中的R、G、B分量或YUV模型中的Y、U、V分量表示圖像上的數(shù)據(jù),這是模擬視頻轉(zhuǎn)換成數(shù)字視頻常用的方法。數(shù)字視頻常用的采樣格式有4:4:4、4:2:2、4:1:1、4:2:0四種。4:4:4采樣格式稱(chēng)為全采樣格式,其他采樣格式稱(chēng)為子采樣格式。視頻量化。對(duì)視頻圖像進(jìn)行離散化處理,如果信號(hào)的量化精度為8位二進(jìn)制,信號(hào)就有28=256個(gè)量化等級(jí)。相對(duì)于以上不同的采樣格式,如果使用相同的量化精度,則每個(gè)像素的采樣數(shù)據(jù)也不同。編碼。數(shù)字視頻信號(hào)要經(jīng)過(guò)編碼壓縮后才能以視頻文件的形式存儲(chǔ)或傳輸,最后由解碼器將壓縮后的數(shù)字視頻還原輸出,實(shí)現(xiàn)視頻播放。73視頻的基本概念數(shù)字視頻技術(shù)的發(fā)展概況第一發(fā)展階段,此時(shí)的硬盤(pán)存儲(chǔ)容量一般只有幾百兆字節(jié),數(shù)字視頻技術(shù)基本上用于專(zhuān)業(yè)視頻影像領(lǐng)域,可編輯的視頻信號(hào)長(zhǎng)度非常有限。第二發(fā)展階段,隨著計(jì)算機(jī)硬件技術(shù)的發(fā)展,外存儲(chǔ)器的存儲(chǔ)容量成倍地增長(zhǎng),可編輯的數(shù)字視頻信號(hào)在時(shí)間上得到延長(zhǎng)。第三發(fā)展階段,數(shù)據(jù)壓縮算法的快速發(fā)展,使得對(duì)視頻數(shù)據(jù)序列進(jìn)行壓縮處理并保存得以實(shí)現(xiàn),解決了數(shù)字視頻信號(hào)數(shù)據(jù)量大的問(wèn)題。然而,標(biāo)準(zhǔn)化的問(wèn)題卻日漸突出,盡快解決標(biāo)準(zhǔn)化的問(wèn)題變得非常迫切。第四發(fā)展階段,定義了數(shù)字視頻信號(hào)的標(biāo)準(zhǔn)文件格式,比如AVI(AudioVideoInterleaved)格式,使得數(shù)字視頻信號(hào)實(shí)現(xiàn)了標(biāo)準(zhǔn)化,同時(shí)進(jìn)一步完善了視頻信號(hào)的壓縮和解壓縮技術(shù),使個(gè)人計(jì)算機(jī)處理、交換、網(wǎng)絡(luò)傳輸和保存視頻信號(hào)成為可能。74視頻的基本概念數(shù)字視頻的特點(diǎn)數(shù)字視頻的播放速度為每秒25幀;可倒序播放,具有逆向性;保存時(shí)間長(zhǎng),遠(yuǎn)距離傳輸沒(méi)有失真的積累,抗干擾性能強(qiáng),無(wú)信號(hào)衰減問(wèn)題;可以無(wú)限制地復(fù)制副本,圖像質(zhì)量好,不存在失真問(wèn)題;利用計(jì)算機(jī)視頻編輯技術(shù)制作特殊效果,例如三維動(dòng)畫(huà)效果、變形動(dòng)畫(huà)效果;可以采用成本低、容量大的激光盤(pán)存儲(chǔ)介質(zhì);可以把數(shù)字信號(hào)轉(zhuǎn)換成模擬信號(hào),記錄在錄像帶上。75視頻的基本概念數(shù)字視頻的技術(shù)參數(shù)幀頻為了產(chǎn)生動(dòng)感,視頻信號(hào)在連續(xù)播放時(shí),采用快速切換幀的方法。不同制式的視頻信號(hào)幀率不同。電影的幀率是24幀/秒,NTSC制式的幀率為30幀/秒,PAL制式的幀率為25幀/秒。在互聯(lián)網(wǎng)中,有時(shí)有意減少數(shù)據(jù)量,幀率降低至16幀/秒或更低,視覺(jué)效果盡管不如25幀/秒的播放效果,但能快速傳送視頻信號(hào)。數(shù)據(jù)量視頻信號(hào)的大量數(shù)據(jù)將使計(jì)算機(jī)和顯示器的運(yùn)行速度跟不上,因此數(shù)據(jù)壓縮方法是減少數(shù)據(jù)量最常用的方法,此外,通過(guò)減小畫(huà)面尺寸、降低幀率、減少彩色數(shù)量等也可以達(dá)到減少數(shù)據(jù)量的目的,當(dāng)然過(guò)分減少數(shù)據(jù)量的結(jié)果,會(huì)使視覺(jué)效果不佳。圖像質(zhì)量過(guò)分壓縮的結(jié)果,使圖像質(zhì)量明顯下降。因此需要掌握適當(dāng)?shù)膲嚎s倍數(shù),在圖像質(zhì)量與數(shù)據(jù)量之間尋求平衡。76視頻的基本概念數(shù)字視頻壓縮技術(shù)壓縮比一般指壓縮前的數(shù)據(jù)量與壓縮后的數(shù)據(jù)量之比由于視頻是連續(xù)的靜態(tài)圖像,因此其壓縮編碼算法與靜態(tài)圖像的壓縮編碼算法有些相同的地方。隨著視頻壓縮技術(shù)和硬件技術(shù)的發(fā)展,專(zhuān)門(mén)用于壓縮和解壓縮的協(xié)處理器芯片問(wèn)世,目前的視頻壓縮卡上都有這種協(xié)處理器芯片,大大加快了壓縮和解壓縮的速度。目前所有數(shù)字視頻壓縮技術(shù)均采用有損數(shù)據(jù)壓縮方法有損壓縮意味著解壓縮后的數(shù)據(jù)與壓縮前的數(shù)據(jù)不一致。在壓縮過(guò)程中要損失一些人眼和人耳所不敏感的圖像信息,而且丟失的信息不可恢復(fù)。但由于損失被控制在很小的范圍內(nèi),并且圖像是動(dòng)態(tài)的,因此肉眼無(wú)法察覺(jué)。可根據(jù)使用場(chǎng)合的不同和圖像質(zhì)量的不同選擇合適的視頻數(shù)據(jù)壓縮比。77視頻的基本概念視頻數(shù)字化的優(yōu)點(diǎn)。數(shù)字視頻便于處理數(shù)字視頻再現(xiàn)性好數(shù)字視頻可以長(zhǎng)距離傳輸78數(shù)字視頻文件格式AVI格式MPEG/MPG/DAT格式RA/RM/RAM格式MOV格式VCD光盤(pán)視頻標(biāo)準(zhǔn)DVD光盤(pán)視頻標(biāo)準(zhǔn)79常用視頻處理軟件AdobePremiereAfterEffects會(huì)聲會(huì)影803.5多媒體素材制備數(shù)碼音頻的制備技巧數(shù)碼音頻制作時(shí),其音頻質(zhì)量除了與設(shè)備質(zhì)量有關(guān)外,還與音頻的制作方法有關(guān)。要使音頻效果好,應(yīng)注意以下幾條原則:(1)盡量避免記錄聲音信號(hào),要記錄電信號(hào)(2)盡量用高電平錄音,而不用低電平錄音(3)選擇錄音的輸入方式音頻幾種電信號(hào)錄音方式:線路輸入,DIN插座輸入和話筒輸入。各種輸入方式對(duì)輸入的電信號(hào)的要求是:線路輸入:約為20mV-100mV左右;DIN插座輸入:約為30mV左右;話筒輸入:是把語(yǔ)音信號(hào)直接轉(zhuǎn)換為電信號(hào),電信號(hào)強(qiáng)度與DIN插座輸入接近82數(shù)碼圖像的制備技巧概述數(shù)碼圖像的獲取可以分為兩種方法:一種是對(duì)采用模擬設(shè)備獲取的圖像通過(guò)掃描儀等設(shè)備轉(zhuǎn)化為數(shù)碼圖像;另一種是直接用數(shù)碼照相機(jī)通過(guò)攝影獲取數(shù)碼圖像。在攝影中主要是注意光源、構(gòu)圖和色彩三個(gè)方面的問(wèn)題。圖像掃描技術(shù)掃描儀是一種把模擬圖像轉(zhuǎn)換為計(jì)算機(jī)能夠處理的數(shù)碼圖像的必備工具,它是一種捕獲圖像,并將之轉(zhuǎn)化為計(jì)算機(jī)可以顯示、編輯、存儲(chǔ)、打印的一種數(shù)字化輸入設(shè)備。其采用封閉的光學(xué)掃描環(huán)境,受環(huán)境的影響小,圖像穩(wěn)定,掃描精度高,在數(shù)字圖像獲取領(lǐng)域具有重要作用。83圖像攝影中的光源應(yīng)用技巧在攝影中常用的光源有自然光、人工光和混合光三種。(1)自然光:自然界中有許多發(fā)光體及發(fā)光現(xiàn)象,這些發(fā)光體所發(fā)出的光都屬于自然光,但在攝影中所指的自然光一般指太陽(yáng)光。自然光的屬性包含照度變化、照射角度、光質(zhì)變化、色溫變化(2)人工光人工光包括照明燈光和閃光燈兩種人工光特點(diǎn):光源本身的面積較小,屬于點(diǎn)光源,其照度及曝光量的變化與照射距離有關(guān);光源本身面積越小,燈泡透明度越高,發(fā)光越集中,光質(zhì)越硬,被照物體明暗反差越強(qiáng),物體投影越濃重,輪廓清晰;照明燈含色各不相同,色溫也有很大差異,所以拍攝彩色圖像必須注意色溫。84圖像畫(huà)面構(gòu)圖技巧(1)構(gòu)圖的一般規(guī)律內(nèi)容的簡(jiǎn)潔性。形式結(jié)構(gòu)的相關(guān)性。表現(xiàn)手法的多樣性。操作實(shí)踐的靈活性。(2)構(gòu)圖的基本要素在構(gòu)圖中有多種要素會(huì)影響整個(gè)畫(huà)面的主題,這些要素包括線條、形狀、明暗、質(zhì)感、立體感、時(shí)間感、均衡、節(jié)奏、布局、對(duì)比、夸張等。布局就是畫(huà)面的總體設(shè)計(jì),要把各種有利于表達(dá)主題的構(gòu)圖要素做一個(gè)統(tǒng)一的安排。在布局中要注意兩點(diǎn):突出一個(gè)中心。在變化中求統(tǒng)一,在統(tǒng)一中求變化。85圖像中的色彩色彩是通過(guò)眼、腦和人們的生活經(jīng)驗(yàn)所產(chǎn)生的一種對(duì)光的視覺(jué)效應(yīng)。人對(duì)顏色的感覺(jué)不僅僅由光的物理性質(zhì)所決定,比如人類(lèi)對(duì)顏色的感覺(jué)往往受到周?chē)?/p>
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 店鋪代理收租合同范例
- 機(jī)加工配件合同范例
- 愛(ài)車(chē)保潔服務(wù)合同范例
- 個(gè)人轉(zhuǎn)讓廠房合同范例
- 泡沫配件采購(gòu)合同范例
- 不可逾越合同范例
- 公司人才租房合同范例
- 異地訂購(gòu)合同范例
- 工商汽車(chē)合同范例
- 護(hù)理管理基礎(chǔ)模擬考試題(附答案)
- 《物理學(xué)之美 插圖珍藏版 》讀書(shū)筆記思維導(dǎo)圖PPT模板下載
- 國(guó)開(kāi)電大本科《人文英語(yǔ)4》機(jī)考總題庫(kù)珍藏版
- 腮腺疾病圍手術(shù)期護(hù)理查房
- 學(xué)生假期安全承諾書(shū)200字(5篇)
- 血液透析個(gè)案護(hù)理兩篇
- GB/T 37814-2019綜采綜放工作面遠(yuǎn)距離供電系統(tǒng)技術(shù)規(guī)范
- 高中通用技術(shù)《技術(shù)試驗(yàn)及其方法》公開(kāi)課課件
- PSSR試車(chē)前的安全檢查
- 基于R語(yǔ)言數(shù)據(jù)挖掘課程期末論文
- 數(shù)字電子技術(shù)課程設(shè)計(jì)電子密碼鎖
- 防火防爆安全技術(shù)課件
評(píng)論
0/150
提交評(píng)論