運(yùn)動(dòng)圖像國(guó)際壓縮標(biāo)準(zhǔn)MPEG課件_第1頁(yè)
運(yùn)動(dòng)圖像國(guó)際壓縮標(biāo)準(zhǔn)MPEG課件_第2頁(yè)
運(yùn)動(dòng)圖像國(guó)際壓縮標(biāo)準(zhǔn)MPEG課件_第3頁(yè)
運(yùn)動(dòng)圖像國(guó)際壓縮標(biāo)準(zhǔn)MPEG課件_第4頁(yè)
運(yùn)動(dòng)圖像國(guó)際壓縮標(biāo)準(zhǔn)MPEG課件_第5頁(yè)
已閱讀5頁(yè),還剩169頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

運(yùn)動(dòng)圖像國(guó)際壓縮標(biāo)準(zhǔn)MPEG2005年fall運(yùn)動(dòng)圖像國(guó)際壓縮標(biāo)準(zhǔn)MPEG2005年fall11概述MPEG(MotionPictureExpertsGroup)是運(yùn)動(dòng)圖像專家小組的英文縮寫(xiě)。這是一個(gè)為視頻壓縮開(kāi)發(fā)制造與平臺(tái)獨(dú)立標(biāo)準(zhǔn)的全球性組織。MPEG的活動(dòng)始于1988年。JPEG和MPEG都是在ISO領(lǐng)導(dǎo)下的專家小組,其成員也有很大的交疊。JPEG的目標(biāo)集中于靜止圖像壓縮,而MPEG的目標(biāo)是針對(duì)活動(dòng)圖像的數(shù)據(jù)壓縮,但靜止圖像與活動(dòng)圖像有密切關(guān)系。1概述MPEG(MotionPictureExpert2MPEG國(guó)際標(biāo)準(zhǔn)化組織(InternationalOrganizationforStandardization,ISO)和國(guó)際電工委員會(huì)(InternationalElectro-technicalCommission,IEC)聯(lián)合成立ISO/IECJTC1/SC29/WG11,負(fù)責(zé)開(kāi)發(fā)電視圖像數(shù)據(jù)和聲音數(shù)據(jù)的編碼、解碼和它們的同步等標(biāo)準(zhǔn)MPEG標(biāo)準(zhǔn)主要有MPEG-1、MPEG-2、MPEG-4和正在制定的MPEG-7等。MPEG國(guó)際標(biāo)準(zhǔn)化組織(InternationalOrga3MPEG標(biāo)準(zhǔn)文件的創(chuàng)建過(guò)程工作文件(WorkingDraft,WD)工作組(WorkingGroup,WG)準(zhǔn)備的工作文件委員會(huì)草案(CommitteeDraft,CD)從工作組WG準(zhǔn)備好的工作文件WD提升上來(lái)的文件。這是ISO文檔的最初形式,由ISO內(nèi)部正式調(diào)查研究和投票表決國(guó)際標(biāo)準(zhǔn)草案(DraftInternationalStandard,DIS)投票成員國(guó)對(duì)CD的內(nèi)容和說(shuō)明滿意之后由委員會(huì)草案CD提升上來(lái)的文件國(guó)際標(biāo)準(zhǔn)(InternationalStandard,IS)由投票成員國(guó)、ISO的其他部門和其他委員會(huì)投票通過(guò)之后出版發(fā)布的文件MPEG標(biāo)準(zhǔn)文件的創(chuàng)建過(guò)程工作文件(WorkingDraf4MPEG的第一個(gè)成果MPEG-1于1992年推出,是VCD的基礎(chǔ)。由于有限的352×288像素分辨率,MPEG-1只適用于家庭環(huán)境,獲得的視頻質(zhì)量及數(shù)據(jù)率相當(dāng)?shù)汀?995推出MPEG-2。720×576的像素以及更高的分辨率大大提高了視頻質(zhì)量。1999年12月發(fā)布了MPEG-4。MPEG-7為多媒體內(nèi)容描述接口標(biāo)準(zhǔn)。從MPEG組織成立至今,其任務(wù)和方向都發(fā)生了很多變化。MPEG-1和MPEG-2已經(jīng)是成熟的編碼標(biāo)準(zhǔn),現(xiàn)在的熱點(diǎn)主要集中在MPEG-4和MPEG-7上。MPEG的第一個(gè)成果MPEG-1于1992年推出,是VCD的5MPEG系列MPEG-1:ISO/IEC11172MPEG-2:ISO/IEC13818MPEG-4:ISO/IEC14496MPEG-7:ISO/IEC15938MPEG-21:ISO/IEC21000MPEG系列MPEG-1:ISO/IEC111726組成videocodingaudiocodingsystemdefinitionwhichdescribesthecombinationofindividualdatastreamsintoacommonstream.組成videocoding72視頻編碼Animagemustconsistofthreecomponents.luminanceYtwocolordifferencesignalsCrandCbcolorsubsampling14differentpixelaspectratios1:116:94:32視頻編碼Animagemustconsistof8refreshfrequency23.976Hz,24Hz,25Hz,29.97Hz,30Hz,50Hz,59.94Hz,and60HzAnMPEGmacroblockispartitionedinto16×16pixelsfortheluminancecomponentand8×8pixelsforeachofthetwochrominancecomponents.Amacroblockisformedofsixblocksof8×8pixels:firstfourblocksfortheluminancecomponentthenthetwochrominanceblocks.refreshfrequency9宏塊獲得高速壓縮的關(guān)鍵是去掉盡可能多的冗余,在靜止圖像壓縮方面,MPEG和JPEG算法幾乎是一樣的。首先把圖像轉(zhuǎn)換成YUV空間。Y分量被劃分成1616的小塊,U及V分量被劃分成88;然后,把1616亮度塊再劃分成4個(gè)88塊,這樣88塊就可以進(jìn)行DCT變換。由一個(gè)1616像素的亮度信息和兩個(gè)88像素的色度信息組成的塊稱為宏塊。一幅靜態(tài)圖像就是由許多這樣的宏塊組成。對(duì)于分辨率為352240的NTSC制式的一幅圖像,有2215=330個(gè)宏塊組成。對(duì)于分辨率是352288的PAL制式的一幅圖像,有2218=396個(gè)宏塊組成。宏塊獲得高速壓縮的關(guān)鍵是去掉盡可能多的冗余,在靜止圖像壓縮方10宏塊的組成

宏塊的組成11efficientcodingtemporalredundanciesofsuccessiveimagesrandomaccessimagesarecodedindividually.MPEGsupportsfourtypesofimagecoding.IPBDefficientcoding12I幀(幀內(nèi)圖像intraframe),是對(duì)整幅圖像采用JPEG編碼的圖像,是一個(gè)獨(dú)立的幀,其信息由自身畫(huà)面決定,不需要參照其他畫(huà)面而產(chǎn)生,是P圖和B圖的參考圖。P圖(前向預(yù)測(cè)幀PredictedPicture),參照前一幅I或P圖像做運(yùn)動(dòng)補(bǔ)償編碼。B圖像(雙向預(yù)測(cè)BidirectionalPrediction),它參照前一幅和后一幅I或P圖像做雙向運(yùn)動(dòng)補(bǔ)償編碼。

I幀(幀內(nèi)圖像intraframe),是對(duì)整幅圖像采用JP13Iframes(intracodedpictures)codedwithoutusinginformationaboutotherframes(intraframecoding).AnIframeistreatedasastillimage.HereMPEGfallsbackontheresultsofJPEG.UnlikeJPEG,real-timecompressionmustbepossible.ThecompressionrateisthusthelowestwithinMPEG.Iframesformtheanchorsforrandomaccess.Iframes(intracodedpictures14IframesareencodedasinJPEG.ADCTonthe8×8blocksdefinedwithinthemacroblocksTheDC-coefficientsarethenDPCMcoded,thedifferencesbetweenconsecutiveblocksofeachcomponentarecalculatedandtransformedintovariable-lengthcodewords.AC-coefficientsarerun-lengthencodedandthentransformedintovariable-lengthcodewords.MPEGdistinguishestwotypesofmacroblocks:thosecontainonlycodeddatathoseadditionallycontainaparameterusedforscalingthecharacteristiccurveusedforsubsequentquantization.IframesareencodedasinJPE15I幀圖像采用幀內(nèi)編碼方式,即只利用了單幀圖像內(nèi)的空間相關(guān)性,而沒(méi)有利用時(shí)間相關(guān)性。由于I幀不依賴其他幀,所以是隨機(jī)存取的入點(diǎn),同時(shí)是解碼的基準(zhǔn)幀。I幀主要用于接收機(jī)的初始化和信道的獲取,以及節(jié)目的切換和插入,I幀圖像的壓縮倍數(shù)相對(duì)較低。I幀圖像周期性地出現(xiàn)在圖像序列中的,出現(xiàn)頻率可由編碼器選擇。I幀圖像采用幀內(nèi)編碼方式,即只利用了單幀圖像內(nèi)的空間相關(guān)性,16Pframes(predictivecodedpictures)requireinformationaboutpreviousIand/orPframesforencodinganddecoding.DecodingaPframerequiresdecompressionofthelastIframeandanyinterveningPframes.ThecompressionratioisconsiderablyhigherthanforIframes.APframeallowsthefollowingPframetobeaccessediftherearenointerveningIframes.Pframes(predictivecodedpic17themostsimilarmacroblockintheprecedingimagemustbedeterminedMPEGdoesnotspecifyanalgorithmformotionestimation,butratherspecifiesthecodingoftheresult.motionvector(thespatialdifferencebetweenthetwomacroblocks)andthesmalldifferencebetweenthemacroblocksneedtobeencoded.Thesearchrange,thatis,themaximumlengthofthemotionvector,isnotdefinedbythestandard.Asthesearchrangeisincreased,themotionestimationbecomesbetter,althoughthecomputationbecomesslower.themostsimilarmacroblocki18運(yùn)動(dòng)補(bǔ)償運(yùn)動(dòng)補(bǔ)償算法是當(dāng)前視頻圖像壓縮技術(shù)中使用最普遍的方法之一。幀序列的相鄰畫(huà)面之間的運(yùn)動(dòng)部分具有連續(xù)性,即當(dāng)前畫(huà)面上的圖像可以看成是前面畫(huà)面某時(shí)刻畫(huà)面的位移,位移的幅度值和方向在畫(huà)面各處可以不同。運(yùn)動(dòng)補(bǔ)償工作于宏塊一級(jí),主要是消除預(yù)測(cè)圖與插補(bǔ)圖在時(shí)間上的冗余,以提高壓縮比。運(yùn)動(dòng)補(bǔ)償是一種預(yù)測(cè),它不是對(duì)每個(gè)像素預(yù)測(cè),而是以1616圖像塊為單位的預(yù)測(cè)。運(yùn)動(dòng)補(bǔ)償把當(dāng)前子塊認(rèn)為是先前面某個(gè)時(shí)刻圖像塊的位移,位移(運(yùn)動(dòng)矢量)的內(nèi)容包括運(yùn)動(dòng)方向和運(yùn)動(dòng)幅度。運(yùn)動(dòng)補(bǔ)償運(yùn)動(dòng)補(bǔ)償算法是當(dāng)前視頻圖像壓縮技術(shù)中使用最普遍的方法19宏預(yù)測(cè)與運(yùn)動(dòng)補(bǔ)償示意圖

宏預(yù)測(cè)與運(yùn)動(dòng)補(bǔ)償示意圖20BlockMotionEstimationBlockMotionEstimation21Videosequence:Tennisframe0Videosequence:Tennisframe22Videosequence:Tennisframe1Videosequence:Tennisframe23FrameDifferenceFrameDifference24MotionVector-MotionEstimationMotionVector-MotionEstimatio25P圖是把I圖中的“準(zhǔn)宏塊”復(fù)制過(guò)來(lái),拼成的一幅圖?!皽?zhǔn)宏塊”的邊界不是I圖中的1616的宏塊,是I圖中的一個(gè)類似塊,這一個(gè)復(fù)制過(guò)程稱為“運(yùn)動(dòng)”。由于P是在I的將來(lái),所以稱為“前向預(yù)測(cè)”。把一個(gè)類似塊復(fù)制過(guò)來(lái)之后,與真正的P圖是不吻合的,需要修正,這個(gè)過(guò)程就是運(yùn)動(dòng)補(bǔ)償。經(jīng)過(guò)“補(bǔ)償”之后,P圖就與原來(lái)沒(méi)壓縮的圖像相差無(wú)幾了。P圖是把I圖中的“準(zhǔn)宏塊”復(fù)制過(guò)來(lái),拼成的一幅圖。“準(zhǔn)宏塊”261616的運(yùn)動(dòng)矢量塊是預(yù)測(cè)誤差,必須進(jìn)行編碼、傳送、供解碼時(shí)恢復(fù)圖像時(shí)使用。不同區(qū)域宏塊的運(yùn)動(dòng)矢量,可有不同的選擇,運(yùn)動(dòng)矢量的選擇范圍是基于幀間圖像的時(shí)間分辨率,和塊內(nèi)圖像的時(shí)間分辨率,以及幀序列圖像的性質(zhì)而選定。例如,當(dāng)兩個(gè)1616宏塊所包含的畫(huà)面內(nèi)容在傳送中完全靜止不動(dòng),那么宏塊的運(yùn)動(dòng)矢量為零(宏塊的坐標(biāo)沒(méi)有改變)。1616的運(yùn)動(dòng)矢量塊是預(yù)測(cè)誤差,必須進(jìn)行編碼、傳送、供解碼27PframescanconsistofmacroblocksasinIframes,aswellassixdifferentpredictivemacroblocks.IncodingP-frame-specificmacroblocksdifferencesbetweenmacroblocksaswellasthemotionvectorneedtobeconsidered.Thedifferencevaluesbetweenallsix8×8pixelblocksofamacroblockbeingcodedandthebestmatchingmacroblockaretransformedusingatwo-dimensionalDCT.Pframescanconsistofmacro28FurtherdatareductionisachievedbynotfurtherprocessingblockswhereallDCTcoefficientsarezero.Thisiscodedbyinsertingasix-bitvalueintotheencodeddatastream.Otherwise,theDC-andAC-coefficientsarethenencodedusingthesametechnique.Next,run-lengthencodingisappliedandavariablelengthcodingisdeterminedaccordingtoanalgorithmsimilartoHuffman.motionvectorsofadjacentmacroblocksareDPCMcoded.Theresultisagaintransformedintovariable-lengthcodedwordsusingatable.Furtherdatareductionisachi29BframesBframes(bidirectionallypredictivecodedpictures)requireinformationfrompreviousandfollowingIand/orPframes.BframesyieldthehighestcompressionratioattainableinMPEG.ABframeisdefinedasthedifferencefromapredictionbasedonapreviousandafollowingIorPframe.Itcannoteverserveasareferenceforpredictioncodingofotherpictures.BframesBframes(bidirectional30AmacroblockcanbederivedfrommacroblocksofpreviousandfollowingPand/orIframes.apredictioncaninterpolatetwosimilarmacroblocks.twomotionvectorsareencodedonedifferenceblockisdeterminedbetweenthemacroblocktobeencodedandtheinterpolatedmacroblock.SubsequentquantizationandentropyencodingareperformedasforP-frame-specificmacroblocks.Bframesneednotbestoredinthedecoder.Amacroblockcanbederivedf31DframesDframes(DCcodedpictures)areintraframe-codedandcanbeusedforefficientfastforward.DuringtheDCT,onlytheDC-coefficientsarecoded;theACcoefficientsareignored.DframesDframes(DCcodedpic32Dframescontainonlythelow-frequencycomponentsofanimage.AD-framealwaysconsistsofonetypeofmacroblockandonlytheDC-coefficientsoftheDCTarecoded.Dframesareusedforfast-forwarddisplay.ThiscouldalsoberealizedbyasuitableplacementofIframes.Dframescontainonlythelow-33運(yùn)動(dòng)圖像國(guó)際壓縮標(biāo)準(zhǔn)MPEG課件34P幀和B幀圖像采用幀間編碼方式,即同時(shí)利用了空間和時(shí)間上的相關(guān)性。P幀圖像只采用前向時(shí)間預(yù)測(cè),可以提高壓縮效率和圖像質(zhì)量。P幀圖像中可以包含幀內(nèi)編碼的部分,即P幀中的每一個(gè)宏塊可以是前向預(yù)測(cè),也可以是幀內(nèi)編碼。B幀圖像采用雙向時(shí)間預(yù)測(cè),可以大大提高壓縮倍數(shù)。由于B幀圖像采用了未來(lái)幀作為參考,因此MPEG-1編碼碼流中圖像幀的傳輸順序和顯示順序是不同的。從壓縮的程度來(lái)看,I圖的壓縮率最?。挥捎赑圖只存儲(chǔ)當(dāng)前幀和參考幀的誤差信號(hào),因此P圖得到了較大的壓縮;而B(niǎo)圖的壓縮率是最大的,這也使得B幀不能作為預(yù)測(cè)基準(zhǔn)的原因。

P幀和B幀圖像采用幀間編碼方式,即同時(shí)利用了空間和時(shí)間上的相35運(yùn)動(dòng)圖像國(guó)際壓縮標(biāo)準(zhǔn)MPEG課件36MPEG的幀序列使MPEG獲得較大的壓縮率的方法是消除連續(xù)幀中的時(shí)間冗余。無(wú)論在視頻上看到如何激烈的動(dòng)作,兩幅連續(xù)幀之間的差別總是很小的。由于JPEG只壓縮一幅單獨(dú)圖像的信息,所以MPEG必須處理時(shí)間冗余。從根本上講,這屬于差分編碼的技術(shù)。首先在發(fā)送端發(fā)送一個(gè)基本幀,然后比較后續(xù)幀的區(qū)別進(jìn)行編碼,壓縮后加以傳送。接收端能夠根據(jù)第一個(gè)基本幀和接收到的差值重建所有的幀。

MPEG的幀序列使MPEG獲得較大的壓縮率的方法是消除連續(xù)幀37把這種思想加以擴(kuò)展就是MPEG所做的工作,當(dāng)然,MPEG要比這復(fù)雜。計(jì)算當(dāng)前幀與前一個(gè)幀的差別來(lái)處理那些在視野中移動(dòng)的圖形是非常有效的,因?yàn)槟切﹫D形就在前一個(gè)幀中。但它不適用于那些不在前一個(gè)幀中的圖像。比如說(shuō),一個(gè)全新的情景就不能這樣壓縮。新老情景間的差別很大,這時(shí)很可能不得不發(fā)送新的場(chǎng)景。把這種思想加以擴(kuò)展就是MPEG所做的工作,當(dāng)然,MPEG要比38不同的幀類型在一個(gè)幀序列中應(yīng)按什么形式排列?要保證I幀必須在任何幀序列中周期性地出現(xiàn)。這是因?yàn)椴罘志幋a計(jì)算適用于幀之間差別極小的情況,但與一個(gè)固定幀差別很小的情況總是局限在相對(duì)較短的一段時(shí)間內(nèi),如果出現(xiàn)新的物體,隨后情景就會(huì)發(fā)生改變。這種情況涉及那些藏在某些移動(dòng)體后面的物體。例如當(dāng)一個(gè)人在一個(gè)場(chǎng)景中移動(dòng)時(shí),前一幀中原本藏在人后面的物體會(huì)出現(xiàn)在后續(xù)的幀中。讓I幀周期性地出現(xiàn)確保差異是相對(duì)于最近的情景進(jìn)行計(jì)算的,能消除錯(cuò)誤的傳播。不同的幀類型在一個(gè)幀序列中應(yīng)按什么形式排列?39怎樣從其他幀重建P幀和B幀?播放時(shí)看到的幀次序不是傳送的幀的次序。P幀在最初的兩個(gè)B幀前面?zhèn)魉?,而第二個(gè)I幀在最后的兩個(gè)B幀前面?zhèn)魉?。然后P幀和兩個(gè)I幀可以被緩存起來(lái),這樣接下來(lái)收到的B幀就可以在觀看端進(jìn)行解碼。怎樣從其他幀重建P幀和B幀?40QuantizationAC-coefficientsofBandPframesareusuallyverylargevalues,whereasthoseofIframesareverysmall.MPEGquantizationadjustsitselfaccordingly.Ifthedatarateincreasestoomuch,quantizationbecomesmorecoarse.Ifthedataratefalls,thenquantizationisperformedwithfinergranularity.QuantizationAC-coefficientsof413語(yǔ)音編碼MPEGaudiocodingiscompatiblewiththecodingofaudiodatausedforCompactDiscDigitalAudio(CD-DA)andDigitalAudioTape(DAT).Themostimportantcriterionisthechoiceofsamplerateof44.1kHzor48kHz(additionally32kHz)at16bitspersamplevalue.Eachaudiosignaliscompressedtoeither64,96,128,or192Kbit/s.3語(yǔ)音編碼MPEGaudiocodingiscom42Threequalitylevels(layers)aredefinedwithdifferentencodinganddecodingcomplexity.AnimplementationofahigherlayermustbeabletodecodetheMPEGaudiosignalsoflowerlayersFFTisappliedforaudio,andthespectrumisdividedinto32nonoverlappingsubbandsnoiselevelineachsubbandisdeterminedusingapsychoacousticmodel.Threequalitylevels(layers)43Inthefirstandsecondlayers,theappropriatelyquantizedspectralcomponentsaresimplyPCM-encoded.ThethirdlayeradditionallyperformsHuffmancoding.MPEGprovidesfortwotypesofstereosound.Twochannelsareprocessedcompletelyindependently.Inthejointstereomode,MPEGachievesahighercompressionratiobyexploitingredundanciesbetweenthetwochannelsInthefirstandsecondlayers44運(yùn)動(dòng)圖像國(guó)際壓縮標(biāo)準(zhǔn)MPEG課件45Theminimalvalueisalways32Kbit/s.Thelayerssupportdifferentmaximalbitrates:layer1allowsforamaximumof448Kbit/slayer2for384Kbit/slayer3for320Kbit/s.Forlayers1and2,notallcombinationsofbitrateandmodeareallowed,andadecoderisnotrequiredtosupportavariablebitrate.Inlayer3,avariablebitrateisspecifiedbyallowingthebitrateindextobeswitched.Theminimalvalueisalways32464數(shù)據(jù)流Anaudiostreamiscomprisedofframes,whicharemadeupofaudioaccessunits,whichinturnaredividedintoslots.Anaudioaccessunitisthesmallestcompressedaudiosequencethatcanbecompletelydecodedindependentlyofallotherdata.4數(shù)據(jù)流Anaudiostreamiscompri47VideoStreamAvideostreamiscomprisedof6layers:sequencelayerthebeginningofthesequencelayerincludestwoentries:theconstantbitrateofthesequenceandtheminimumstoragecapacityrequiredduringdecoding.Avideobufferverifierinfluencesthequantizerandformsatypeofcontrolloop.groupofpictureslayerThislayercontainsatleastanIframe,whichmustbeoneofthefirstimages.thedifferencebetweendecodingorderanddisplayorderVideoStreamAvideostreamis48picturelayercontainsawholestillimage.imagenumber.slicelayerEachsliceconsistsofmacroblocksAslicealsoincludesthescalingusedforDCTquantizationofallitsmacroblocks.macroblocklayerblocklayerpicturelayer49SystemDefinitionspecifiesthecombinationofaudioandvideodatastreamsthecoordinationofinputdatastreamswithoutputdatastreams,clockadjustment,andbuffermanagement.Onecoulddefineaprotocoltosupplytheheaderuponrequest.MPEGdoesnotprescribecompressioninreal-time.MPEGdefinesthedecodingprocessbutnotthedecoderitself.SystemDefinitionspecifiesthe505MPEG-1MPEG-1的標(biāo)準(zhǔn)號(hào)為ISO/IEC11172,標(biāo)準(zhǔn)名稱為“信息技術(shù)——用于數(shù)據(jù)速率高達(dá)大約1.5Mbit/s的數(shù)字存儲(chǔ)媒體的電視圖像和伴音編碼”(Informationtechnology—Codingofmovingpicturesandassociatedaudiofordigitalstoragemediaatuptoabout1.5Mbit/s)。MPEG-1標(biāo)準(zhǔn)1992年公布。其任務(wù)是在一種可接受的質(zhì)量下,把視頻和伴音信號(hào)壓縮到速率大約為1.5Mb/s的單一MPEG數(shù)據(jù)流。MPEG-1標(biāo)準(zhǔn)包括MPEG視頻、MPEG音頻和MPEG系統(tǒng)三部分MPEG-1標(biāo)準(zhǔn)是一個(gè)通用標(biāo)準(zhǔn),既考慮了應(yīng)用要求,又獨(dú)立于應(yīng)用之上。5MPEG-1MPEG-1的標(biāo)準(zhǔn)號(hào)為ISO/IEC11151MPEG-1Codingofmovingpicturesandassociatedaudioatuptoabout1.5Mbit/s

Part1:SystemsPart2:VideoPart3:AudioPart4:ConformancetestingPart5:SoftwaresimulationMPEG-1Codingofmovingpicture52MPEG-1視頻壓縮算法必須有與存儲(chǔ)相適應(yīng)的性質(zhì),即能夠隨機(jī)訪問(wèn)、快進(jìn)/快退、檢索、倒放,同時(shí)需要音像同步、一定的容錯(cuò)能力、延時(shí)控制、可編輯性及靈活的視頻窗口格式,這與多媒體技術(shù)所要求的交互性相適應(yīng),構(gòu)成了MPEG-1視頻壓縮算法的特點(diǎn)。MPEG-1視頻壓縮算法必須有與存儲(chǔ)相適應(yīng)的性質(zhì),即能夠隨機(jī)53MPEG-l標(biāo)準(zhǔn)采用了一系列技術(shù)以獲得高壓縮比:

對(duì)高度與色差信號(hào)進(jìn)行采樣,減少數(shù)據(jù)量;采用運(yùn)動(dòng)補(bǔ)償技術(shù)減少幀間冗余度

做二維DCT變換去除空間相關(guān)性

對(duì)DCT分量進(jìn)行量化,舍去不重要的信息,將量化后DCT分量按照頻率重新排序

將DCT分量進(jìn)行變字長(zhǎng)編碼

對(duì)每數(shù)據(jù)塊的直流分量(DC)進(jìn)行預(yù)測(cè)差分編碼MPEG-l標(biāo)準(zhǔn)采用了一系列技術(shù)以獲得高壓縮比:54在通信網(wǎng)絡(luò)方面,MPEG-1標(biāo)準(zhǔn)可適應(yīng)多種網(wǎng)絡(luò),如ISDN、LAN等通信網(wǎng)絡(luò),廣泛應(yīng)用于網(wǎng)絡(luò)上的圖像傳輸。在媒體存儲(chǔ)方面,采用MPEG-1標(biāo)準(zhǔn)編碼的數(shù)據(jù)可存儲(chǔ)在光盤、數(shù)字錄音帶、硬盤、可寫(xiě)磁光盤等媒體中。其中應(yīng)用最廣泛的是VCD光盤。VCD采用MPEG-1壓縮標(biāo)準(zhǔn),將圖像壓縮25~200倍,聲音壓縮65倍,并以數(shù)字方式加以記錄,可播放長(zhǎng)達(dá)74分。VCD具有288線的垂直解象率,圖像質(zhì)量略優(yōu)于VHS錄象帶。VCD能按節(jié)目索引、時(shí)間等進(jìn)行檢索,可立即找到用戶想要的節(jié)目段落的起點(diǎn)。在通信網(wǎng)絡(luò)方面,MPEG-1標(biāo)準(zhǔn)可適應(yīng)多種網(wǎng)絡(luò),如ISDN、55MPEG-2MPEG-2的標(biāo)準(zhǔn)號(hào)為ISO/IEC13818,標(biāo)準(zhǔn)名稱為“信息技術(shù)—電視圖像和伴音信息的通用編碼(Informationtechnology—Genericcodingofmovingpicturesandassociatedaudioinformation)”。MPEG-2標(biāo)準(zhǔn)從1990年開(kāi)始研究,1995年正式成為標(biāo)準(zhǔn)。MPEG-2是MPEG-1的擴(kuò)充,它們的基本編碼算法都相同。但MPEG-2增加了許多MPEG-1所沒(méi)有的功能,例如增加了隔行掃描電視的編碼,提供了位速率的可變性能(scalability)功能。MPEG-2MPEG-2的標(biāo)準(zhǔn)號(hào)為ISO/IEC1381856MPEG-2GenericcodingofmovingpicturesandassociatedaudioPart1

SystemsPart2

VideoPart3

AudioPart4

ConformancetestingPart5

SoftwaresimulationPart6

Systemextensions-DSM-CCPart7

Audioextension-NBCmodePart8

VOID-(withdrawn)Part9

SystemextensionRTIPart10Conformanceextension-DSM-CCPart11IPMPonMPEG-2SystemsMPEG-2Genericcodingofmoving57它是一個(gè)直接與數(shù)字電視廣播有關(guān)的高質(zhì)量圖像和聲音編碼標(biāo)準(zhǔn)。MPEG-2主要針對(duì)高清晰度電視(HDTV)所需要的視頻及伴音信號(hào).MPEG-2視頻編碼的基本技術(shù)與MPEG-1不同之處主要在于:MPEG-2采用了場(chǎng)處理方式,而MPEG-1只采用了幀處理方式。MPEG-2有幀圖和場(chǎng)圖兩種圖,預(yù)測(cè)也分為幀預(yù)測(cè)和場(chǎng)預(yù)測(cè),因此MPEG-2可以對(duì)隔行視頻源數(shù)據(jù)進(jìn)行直接編碼,而MPEG-1則不行。它是一個(gè)直接與數(shù)字電視廣播有關(guān)的高質(zhì)量圖像和聲音編碼標(biāo)準(zhǔn)。M58MPEG-2標(biāo)準(zhǔn)將圖像分為五個(gè)配置(Profiles)和四個(gè)等級(jí)(levels),由檔次和等級(jí)組成的組合共有20種。其中11種組合已達(dá)成共識(shí),形成技術(shù)規(guī)范,用于從低端的電視會(huì)議/可視電話到高端的高清晰度電視等不同的場(chǎng)合。目前,DVD采用了用于數(shù)字視盤和數(shù)字電視衛(wèi)星直播的技術(shù)規(guī)范,以1~10Mb/s可變速率進(jìn)行圖像和聲音的傳輸處理,速率大小依據(jù)圖像復(fù)雜程度與聲音數(shù)據(jù)的多少而改變,平均速度為4.69Mb/s。DVD采用MPEG-2標(biāo)準(zhǔn),這也為以后與高清晰度電視HDTV接軌打下了基礎(chǔ)。MPEG-2標(biāo)準(zhǔn)將圖像分為五個(gè)配置(Profiles)和四個(gè)59運(yùn)動(dòng)圖像國(guó)際壓縮標(biāo)準(zhǔn)MPEG課件60MPEG-41999年推出ISO/IEC標(biāo)準(zhǔn)MPEG-4。MPEG-4是目前視頻壓縮技術(shù)的最新發(fā)展水平。數(shù)字化電視、交互式圖形應(yīng)用(如PC游戲、虛擬環(huán)境)及WWW(萬(wàn)維網(wǎng))這三個(gè)領(lǐng)域的成功促進(jìn)了MPEG-4的誕生。MPEG-4旨在為視音頻數(shù)據(jù)的通信、存取與管理提供一個(gè)靈活的框架與一套開(kāi)放的編碼工具。這些工具將支持大量的應(yīng)用功能(新的和傳統(tǒng)的)。MPEG-4提供的多種視音頻(自然的與合成的)的編碼模式使圖像或視音頻中對(duì)象的存取大為便利,稱作基于內(nèi)容的存取。MPEG-41999年推出ISO/IEC標(biāo)準(zhǔn)MPEG-4。M61MPEG1與MPEG2最主要的目標(biāo)是通過(guò)數(shù)據(jù)壓縮技術(shù),實(shí)現(xiàn)數(shù)字音頻、視頻數(shù)據(jù)的有效存儲(chǔ)和傳輸。因此,所處理的是音頻及基于“矩形幀”的視頻信息,而其交互功能也僅僅是局限在音頻及矩形幀層次上。MPEG-4標(biāo)準(zhǔn)支持基于內(nèi)容的交互功能,以音視頻對(duì)象AVO(AudiovisualObject)的形式對(duì)AV場(chǎng)景進(jìn)行描述,這些AVO在空間及時(shí)間上有一定的關(guān)聯(lián),分析后,可對(duì)AV場(chǎng)景進(jìn)行分層描述。因此,MPEG-4提供了一種嶄新的交互方式-基于內(nèi)容的交互(Content-basedInteractivity)MPEG1與MPEG2最主要的目標(biāo)是通過(guò)數(shù)據(jù)壓縮技術(shù),實(shí)現(xiàn)數(shù)62在視頻編碼方面,MPEG-4與現(xiàn)有標(biāo)準(zhǔn)相比也有了重要突破。傳統(tǒng)圖像編碼方法依據(jù)信源編碼理論的框架,將圖像作為隨機(jī)信號(hào),利用其隨機(jī)特性來(lái)達(dá)到壓縮的目的。這種方法本身未能考慮信息獲取者的主觀意義與主觀特性,未能考慮事件本身的特性如具體含義、重要性以及后果等等。MPEG-4的目標(biāo)在于采用現(xiàn)代圖像編碼方法,利用人眼的視覺(jué)特性,抓住圖像信息傳輸?shù)谋举|(zhì),從輪廓-紋理的思路出發(fā),支持基于視覺(jué)內(nèi)容的交互功能。關(guān)鍵在于基于視頻對(duì)象的編碼,MPEG-4引入了視頻會(huì)晤VS、視頻對(duì)象VO、視頻對(duì)象層VOL及視頻對(duì)象面VOP等概念。在視頻編碼方面,MPEG-4與現(xiàn)有標(biāo)準(zhǔn)相比也有了重要突破。傳63MPEG-4Codingofaudio-visualobjectsPart1SystemsPart2VisualPart3AudioPart4ConformancetestingPart5ReferenceSoftwarePart6DeliveryMultimediaIntegrationFramework

Part7OptimizedsoftwareforMPEG-4toolsPart8MPEG4onIPframeworkMPEG-4Codingofaudio-visualo64MPEG-4Part9ReferenceHardwareDescriptionPart10AdvancedVideoCodingPart11SceneDescriptionandApplicationEngine

Part12ISOBaseMediaFileFormatPart13IPMPExtensionsPart14MP4FileFormatPart15AVCFileFormatPart16AnimationFrameworkeXtension(AFX)MPEG-4Part9ReferenceHardwa65MPEG-4VersionsVersion1:December1998Version2:December1999moretoolswereaddedinsubsequentamendmentsthatcouldbequalifiedasversions,eventhoughtheyarehardertorecognizeassuchMPEG-4VersionsVersion1:Decem66AudiovisualObjects(AVOs)inMPEG-4AVOsareindividuallycodedinordertoachievemaximumefficiency.definingasyntaxforstoringinformationaboutIntellectualPropertyRights(IPR)pertainingtoMPEG-4AVOsanddevelopingtoolstosupportIPRidentificationandIPRprotection.AudiovisualObjects(AVOs)in67MPEG4MPEG468CodingofVisualObjectsObject-basedscenelayeringandseparatecodinganddecodingoflayersShape-adaptiveDCTcodingObject-basedtoolboxformotionpredictionCodingofVisualObjectsObject69ImportantcomponentsofanMPEG-4terminalImportantcomponentsofanMPE70ExampleofSpriteCodingExampleofSpriteCoding71MoreonMPEG4TexturesandStillImagesSyntheticObjectsfaceandbodyanimationStaticandDynamicMeshCodingwithtexturemappingTextureCodingforViewDependentapplicationsNaturalSoundSynthesizedSoundTTS、SAMoreonMPEG4TexturesandStil72MPEG-4支持的應(yīng)用包括:因特網(wǎng)多媒體應(yīng)用;交互式視頻游戲;實(shí)時(shí)可視通信,例如可視電話、會(huì)議電視等;交互式存儲(chǔ)媒體應(yīng)用,例如光盤、DVD等;廣播電視,演播室技術(shù)及電視后期制作;多媒體郵件,移動(dòng)通信條件下的多媒體應(yīng)用;遠(yuǎn)程視頻監(jiān)控等等。MPEG-4支持的應(yīng)用包括:73在家用PC上將DVD轉(zhuǎn)換為MPEG-4格式,然后就可以在筆記本電腦上播放了(無(wú)需DVD-ROM驅(qū)動(dòng)器)。聲頻信號(hào)能夠以MPEG-4壓縮通過(guò)Internet實(shí)現(xiàn)“聲頻點(diǎn)播”。這種數(shù)字聲頻傳播之所以可能實(shí)現(xiàn)是因?yàn)樗恍枰s16kbit/s的寬帶。這種情況與視頻服務(wù)及2D或3D對(duì)象的動(dòng)畫(huà)相似,能夠以不同的數(shù)據(jù)率通過(guò)Internet同時(shí)進(jìn)行傳送。最新的移動(dòng)無(wú)線標(biāo)準(zhǔn)UMTS也基于MPEG-4壓縮技術(shù)。在家用PC上將DVD轉(zhuǎn)換為MPEG-4格式,然后就可以在筆記74在較低的數(shù)據(jù)率及較高的視頻質(zhì)量下,MPEG-4使得數(shù)碼視頻市場(chǎng)發(fā)生了變革。MPEG-4提供了比MPEG-1與MPEG-2更好的壓縮運(yùn)算性能。但是,MPEG-4序列的編碼需要更強(qiáng)的計(jì)算能力。在較低的數(shù)據(jù)率及較高的視頻質(zhì)量下,MPEG-4使得數(shù)碼視頻市75MPEG-7視聽(tīng)多媒體信息越來(lái)越多,需要一種檢索多媒體信息的方法。MPEG-7提出了相應(yīng)的解決辦法。MPEG-7正式名稱叫作“多媒體內(nèi)容描述接口”,為各種類型的多媒體信息規(guī)定一種標(biāo)準(zhǔn)化的描述方法,這種描述與多媒體信息的內(nèi)容本身一起,支持用戶對(duì)其感興趣的各種“資料”進(jìn)行快速、有效的檢索。MPEG-7并不針對(duì)某種特殊的應(yīng)用,支持盡可能廣泛的應(yīng)用。MPEG-7的功能與其他MPEG標(biāo)準(zhǔn)互為補(bǔ)充。MPEG-1、MPEG-2和MPEG-4是內(nèi)容本身的表示,而MPEG-7是有關(guān)內(nèi)容的信息。MPEG-7視聽(tīng)多媒體信息越來(lái)越多,需要一種檢索多媒體信息的76MPEG7MultimediaContentDescriptionInterfacePart1SystemsPart2DescriptionDefinitionLanguagePart3VisualPart4AudioPart5DescriptionSchemesPart6ReferenceSoftwarePart7ConformancePart8ExtractionandUseofMPEG-7Descriptions

MPEG7MultimediaContentDescri77MPEG-7的目標(biāo)是根據(jù)信息的抽象層次,提供一種描述多媒體材料的方法以便表示不同層次上的用戶對(duì)信息的需求。視覺(jué)內(nèi)容的較低抽象層包括形狀、尺寸、紋理、顏色、運(yùn)動(dòng)(軌道)和位置的描述。音頻的較低抽象層包括音調(diào)、調(diào)式、音速、音速變化、音響空間位置。最高層給出語(yǔ)義信息:如“這是一個(gè)場(chǎng)景:一個(gè)鴨子正躲藏在樹(shù)后并有一個(gè)汽車正在幕后通過(guò)?!敝虚g抽象層也可能存在。抽象層與提取特征的方式有關(guān):許多低層特征能以完全自動(dòng)的方式提取,而高層特征需要更多人的交互作用。MPEG-7還允許依據(jù)視覺(jué)描述的查詢?nèi)z索聲音數(shù)據(jù),反之也一樣。MPEG-7的目標(biāo)是根據(jù)信息的抽象層次,提供一種描述多媒體材78MPEG-7的目標(biāo)支持多種音頻和視覺(jué)的描述,包括自由文本、N維時(shí)空結(jié)構(gòu)、統(tǒng)計(jì)信息、客觀屬性、主觀屬性、生產(chǎn)屬性和組合信息。對(duì)于視覺(jué)信息,描述將包括顏色、視覺(jué)對(duì)象、紋理、草圖、形狀、體積、空間關(guān)系、運(yùn)動(dòng)及變形等。MPEG-7的目標(biāo)支持多種音頻和視覺(jué)的描述,包括自由文本、N79MPEG-7的應(yīng)用領(lǐng)域音視數(shù)據(jù)庫(kù)的存儲(chǔ)和檢索;廣播媒體的選擇(廣播、電視節(jié)目);

因特網(wǎng)上的個(gè)性化新聞服務(wù);

智能多媒體;

教育領(lǐng)域的應(yīng)用;

遠(yuǎn)程購(gòu)物;

社會(huì)和文化服務(wù);調(diào)查服務(wù);

遙感;

監(jiān)視;

生物醫(yī)學(xué)應(yīng)用;

建筑、不動(dòng)產(chǎn)及內(nèi)部設(shè)計(jì)等。

MPEG-7的應(yīng)用領(lǐng)域音視數(shù)據(jù)庫(kù)的存儲(chǔ)和檢索;80原則上,任何類型的AV素材可以通過(guò)任何類型的查詢來(lái)檢索。例如,AV素材可以通過(guò)視頻、音樂(lè)、語(yǔ)言等來(lái)查詢,通過(guò)搜索引擎匹配MPEG-7的音視描述。幾個(gè)查詢例子:音樂(lè):在鍵盤上彈幾個(gè)音符就能得到包含(或近似)要求曲調(diào)的音樂(lè)作品列表,或以某種方式匹配音符的圖像。圖形:在屏幕上畫(huà)幾條線就能得到類似圖形、標(biāo)識(shí)、表意文字(符號(hào))等的一組圖像。圖像:定義物體,包括顏色插補(bǔ)或紋理,得到一些例子,從中可以選擇感興趣的物體來(lái)組成圖像。

運(yùn)動(dòng):對(duì)一組給定的物體,描述在物體之間的運(yùn)動(dòng)和關(guān)系,就會(huì)得到實(shí)現(xiàn)所描述的時(shí)空關(guān)系的動(dòng)畫(huà)列表。原則上,任何類型的AV素材可以通過(guò)任何類型的查詢來(lái)檢索。例如81電影拍攝劇本(劇情說(shuō)明):對(duì)給定的內(nèi)容,描述出動(dòng)作就會(huì)得到發(fā)生類似動(dòng)作的電影拍攝劇本(劇情說(shuō)明)列表。嗓音:通過(guò)摘選一段世界級(jí)著名歌唱家的嗓音,就能得到有關(guān)本人情況的列表,包括履歷、正在演唱的視頻片段等。電影拍攝劇本(劇情說(shuō)明):對(duì)給定的內(nèi)容,描述出動(dòng)作就會(huì)得到發(fā)82MPEG-7不僅僅用于多媒體信息的檢索,更能廣泛地用于其他與多媒體信息內(nèi)容管理相關(guān)的領(lǐng)域。許多應(yīng)用將從MPEG-7標(biāo)準(zhǔn)中獲得好處。在MPEG-7推薦的應(yīng)用中蘊(yùn)涵了許多值得研究的課題。MPEG-7不僅僅用于多媒體信息的檢索,更能廣泛地用于其他與83新標(biāo)準(zhǔn)H.264經(jīng)過(guò)近十年的使用,國(guó)際上音視頻領(lǐng)域的專家已經(jīng)制定了許多信源編碼技術(shù)的標(biāo)準(zhǔn),如MPEG-1、MPEG-2、H.261、H.263等。為了進(jìn)一步提高效率,2001年12月成立了JVT(JointVideoTeam,視頻聯(lián)合工作組),由ITU-T和ISO兩個(gè)國(guó)際標(biāo)準(zhǔn)化組織的有關(guān)視頻編碼的專家聯(lián)合組成。JVT的工作目標(biāo)是制定一個(gè)新的視頻編碼標(biāo)準(zhǔn),以實(shí)現(xiàn)視頻的高壓縮比、高圖像質(zhì)量、良好的網(wǎng)絡(luò)適應(yīng)性等目標(biāo)。ITU-T于2003年5月正式公布了該標(biāo)準(zhǔn)。國(guó)際電信聯(lián)盟將該系統(tǒng)命名為H.264/AVC,國(guó)際標(biāo)準(zhǔn)化組織和國(guó)際電工委員會(huì)將其稱為14496-10/MPEG-4AVC。新標(biāo)準(zhǔn)H.264經(jīng)過(guò)近十年的使用,國(guó)際上音視頻領(lǐng)域的專家已經(jīng)84H.264的優(yōu)點(diǎn)低碼流:在同等圖像質(zhì)量下,采用H.264技術(shù)壓縮后的數(shù)據(jù)量只有MPEG2的1/8,MPEG4的1/3。圖象質(zhì)量高:提供連續(xù)、流暢的高質(zhì)量圖象。容錯(cuò)能力強(qiáng):提供了解決在不穩(wěn)定網(wǎng)絡(luò)環(huán)境下容易發(fā)生的丟包等錯(cuò)誤的必要工具。網(wǎng)絡(luò)適應(yīng)性強(qiáng):H.264提供了網(wǎng)絡(luò)適應(yīng)層(NetworkAdaptationLayer),使得H.264的文件能容易地在不同網(wǎng)絡(luò)上傳輸(例如互聯(lián)網(wǎng),CDMA,GPRS,WCDMA,CDMA2000等)。H.264的優(yōu)點(diǎn)低碼流:在同等圖像質(zhì)量下,采用H.264技85H.264的基本系統(tǒng)無(wú)需使用版權(quán),具有開(kāi)放的性質(zhì)H.264(MPEG-4Part10)有可能被廣播、通信和存儲(chǔ)媒體(CD、DVD)接受成為統(tǒng)一的標(biāo)準(zhǔn),成為交互媒體技術(shù)的標(biāo)準(zhǔn)。H.264的基本系統(tǒng)無(wú)需使用版權(quán),具有開(kāi)放的性質(zhì)86運(yùn)動(dòng)圖像國(guó)際壓縮標(biāo)準(zhǔn)MPEG課件87運(yùn)動(dòng)圖像國(guó)際壓縮標(biāo)準(zhǔn)MPEG2005年fall運(yùn)動(dòng)圖像國(guó)際壓縮標(biāo)準(zhǔn)MPEG2005年fall881概述MPEG(MotionPictureExpertsGroup)是運(yùn)動(dòng)圖像專家小組的英文縮寫(xiě)。這是一個(gè)為視頻壓縮開(kāi)發(fā)制造與平臺(tái)獨(dú)立標(biāo)準(zhǔn)的全球性組織。MPEG的活動(dòng)始于1988年。JPEG和MPEG都是在ISO領(lǐng)導(dǎo)下的專家小組,其成員也有很大的交疊。JPEG的目標(biāo)集中于靜止圖像壓縮,而MPEG的目標(biāo)是針對(duì)活動(dòng)圖像的數(shù)據(jù)壓縮,但靜止圖像與活動(dòng)圖像有密切關(guān)系。1概述MPEG(MotionPictureExpert89MPEG國(guó)際標(biāo)準(zhǔn)化組織(InternationalOrganizationforStandardization,ISO)和國(guó)際電工委員會(huì)(InternationalElectro-technicalCommission,IEC)聯(lián)合成立ISO/IECJTC1/SC29/WG11,負(fù)責(zé)開(kāi)發(fā)電視圖像數(shù)據(jù)和聲音數(shù)據(jù)的編碼、解碼和它們的同步等標(biāo)準(zhǔn)MPEG標(biāo)準(zhǔn)主要有MPEG-1、MPEG-2、MPEG-4和正在制定的MPEG-7等。MPEG國(guó)際標(biāo)準(zhǔn)化組織(InternationalOrga90MPEG標(biāo)準(zhǔn)文件的創(chuàng)建過(guò)程工作文件(WorkingDraft,WD)工作組(WorkingGroup,WG)準(zhǔn)備的工作文件委員會(huì)草案(CommitteeDraft,CD)從工作組WG準(zhǔn)備好的工作文件WD提升上來(lái)的文件。這是ISO文檔的最初形式,由ISO內(nèi)部正式調(diào)查研究和投票表決國(guó)際標(biāo)準(zhǔn)草案(DraftInternationalStandard,DIS)投票成員國(guó)對(duì)CD的內(nèi)容和說(shuō)明滿意之后由委員會(huì)草案CD提升上來(lái)的文件國(guó)際標(biāo)準(zhǔn)(InternationalStandard,IS)由投票成員國(guó)、ISO的其他部門和其他委員會(huì)投票通過(guò)之后出版發(fā)布的文件MPEG標(biāo)準(zhǔn)文件的創(chuàng)建過(guò)程工作文件(WorkingDraf91MPEG的第一個(gè)成果MPEG-1于1992年推出,是VCD的基礎(chǔ)。由于有限的352×288像素分辨率,MPEG-1只適用于家庭環(huán)境,獲得的視頻質(zhì)量及數(shù)據(jù)率相當(dāng)?shù)汀?995推出MPEG-2。720×576的像素以及更高的分辨率大大提高了視頻質(zhì)量。1999年12月發(fā)布了MPEG-4。MPEG-7為多媒體內(nèi)容描述接口標(biāo)準(zhǔn)。從MPEG組織成立至今,其任務(wù)和方向都發(fā)生了很多變化。MPEG-1和MPEG-2已經(jīng)是成熟的編碼標(biāo)準(zhǔn),現(xiàn)在的熱點(diǎn)主要集中在MPEG-4和MPEG-7上。MPEG的第一個(gè)成果MPEG-1于1992年推出,是VCD的92MPEG系列MPEG-1:ISO/IEC11172MPEG-2:ISO/IEC13818MPEG-4:ISO/IEC14496MPEG-7:ISO/IEC15938MPEG-21:ISO/IEC21000MPEG系列MPEG-1:ISO/IEC1117293組成videocodingaudiocodingsystemdefinitionwhichdescribesthecombinationofindividualdatastreamsintoacommonstream.組成videocoding942視頻編碼Animagemustconsistofthreecomponents.luminanceYtwocolordifferencesignalsCrandCbcolorsubsampling14differentpixelaspectratios1:116:94:32視頻編碼Animagemustconsistof95refreshfrequency23.976Hz,24Hz,25Hz,29.97Hz,30Hz,50Hz,59.94Hz,and60HzAnMPEGmacroblockispartitionedinto16×16pixelsfortheluminancecomponentand8×8pixelsforeachofthetwochrominancecomponents.Amacroblockisformedofsixblocksof8×8pixels:firstfourblocksfortheluminancecomponentthenthetwochrominanceblocks.refreshfrequency96宏塊獲得高速壓縮的關(guān)鍵是去掉盡可能多的冗余,在靜止圖像壓縮方面,MPEG和JPEG算法幾乎是一樣的。首先把圖像轉(zhuǎn)換成YUV空間。Y分量被劃分成1616的小塊,U及V分量被劃分成88;然后,把1616亮度塊再劃分成4個(gè)88塊,這樣88塊就可以進(jìn)行DCT變換。由一個(gè)1616像素的亮度信息和兩個(gè)88像素的色度信息組成的塊稱為宏塊。一幅靜態(tài)圖像就是由許多這樣的宏塊組成。對(duì)于分辨率為352240的NTSC制式的一幅圖像,有2215=330個(gè)宏塊組成。對(duì)于分辨率是352288的PAL制式的一幅圖像,有2218=396個(gè)宏塊組成。宏塊獲得高速壓縮的關(guān)鍵是去掉盡可能多的冗余,在靜止圖像壓縮方97宏塊的組成

宏塊的組成98efficientcodingtemporalredundanciesofsuccessiveimagesrandomaccessimagesarecodedindividually.MPEGsupportsfourtypesofimagecoding.IPBDefficientcoding99I幀(幀內(nèi)圖像intraframe),是對(duì)整幅圖像采用JPEG編碼的圖像,是一個(gè)獨(dú)立的幀,其信息由自身畫(huà)面決定,不需要參照其他畫(huà)面而產(chǎn)生,是P圖和B圖的參考圖。P圖(前向預(yù)測(cè)幀PredictedPicture),參照前一幅I或P圖像做運(yùn)動(dòng)補(bǔ)償編碼。B圖像(雙向預(yù)測(cè)BidirectionalPrediction),它參照前一幅和后一幅I或P圖像做雙向運(yùn)動(dòng)補(bǔ)償編碼。

I幀(幀內(nèi)圖像intraframe),是對(duì)整幅圖像采用JP100Iframes(intracodedpictures)codedwithoutusinginformationaboutotherframes(intraframecoding).AnIframeistreatedasastillimage.HereMPEGfallsbackontheresultsofJPEG.UnlikeJPEG,real-timecompressionmustbepossible.ThecompressionrateisthusthelowestwithinMPEG.Iframesformtheanchorsforrandomaccess.Iframes(intracodedpictures101IframesareencodedasinJPEG.ADCTonthe8×8blocksdefinedwithinthemacroblocksTheDC-coefficientsarethenDPCMcoded,thedifferencesbetweenconsecutiveblocksofeachcomponentarecalculatedandtransformedintovariable-lengthcodewords.AC-coefficientsarerun-lengthencodedandthentransformedintovariable-lengthcodewords.MPEGdistinguishestwotypesofmacroblocks:thosecontainonlycodeddatathoseadditionallycontainaparameterusedforscalingthecharacteristiccurveusedforsubsequentquantization.IframesareencodedasinJPE102I幀圖像采用幀內(nèi)編碼方式,即只利用了單幀圖像內(nèi)的空間相關(guān)性,而沒(méi)有利用時(shí)間相關(guān)性。由于I幀不依賴其他幀,所以是隨機(jī)存取的入點(diǎn),同時(shí)是解碼的基準(zhǔn)幀。I幀主要用于接收機(jī)的初始化和信道的獲取,以及節(jié)目的切換和插入,I幀圖像的壓縮倍數(shù)相對(duì)較低。I幀圖像周期性地出現(xiàn)在圖像序列中的,出現(xiàn)頻率可由編碼器選擇。I幀圖像采用幀內(nèi)編碼方式,即只利用了單幀圖像內(nèi)的空間相關(guān)性,103Pframes(predictivecodedpictures)requireinformationaboutpreviousIand/orPframesforencodinganddecoding.DecodingaPframerequiresdecompressionofthelastIframeandanyinterveningPframes.ThecompressionratioisconsiderablyhigherthanforIframes.APframeallowsthefollowingPframetobeaccessediftherearenointerveningIframes.Pframes(predictivecodedpic104themostsimilarmacroblockintheprecedingimagemustbedeterminedMPEGdoesnotspecifyanalgorithmformotionestimation,butratherspecifiesthecodingoftheresult.motionvector(thespatialdifferencebetweenthetwomacroblocks)andthesmalldifferencebetweenthemacroblocksneedtobeencoded.Thesearchrange,thatis,themaximumlengthofthemotionvector,isnotdefinedbythestandard.Asthesearchrangeisincreased,themotionestimationbecomesbetter,althoughthecomputationbecomesslower.themostsimilarmacroblocki105運(yùn)動(dòng)補(bǔ)償運(yùn)動(dòng)補(bǔ)償算法是當(dāng)前視頻圖像壓縮技術(shù)中使用最普遍的方法之一。幀序列的相鄰畫(huà)面之間的運(yùn)動(dòng)部分具有連續(xù)性,即當(dāng)前畫(huà)面上的圖像可以看成是前面畫(huà)面某時(shí)刻畫(huà)面的位移,位移的幅度值和方向在畫(huà)面各處可以不同。運(yùn)動(dòng)補(bǔ)償工作于宏塊一級(jí),主要是消除預(yù)測(cè)圖與插補(bǔ)圖在時(shí)間上的冗余,以提高壓縮比。運(yùn)動(dòng)補(bǔ)償是一種預(yù)測(cè),它不是對(duì)每個(gè)像素預(yù)測(cè),而是以1616圖像塊為單位的預(yù)測(cè)。運(yùn)動(dòng)補(bǔ)償把當(dāng)前子塊認(rèn)為是先前面某個(gè)時(shí)刻圖像塊的位移,位移(運(yùn)動(dòng)矢量)的內(nèi)容包括運(yùn)動(dòng)方向和運(yùn)動(dòng)幅度。運(yùn)動(dòng)補(bǔ)償運(yùn)動(dòng)補(bǔ)償算法是當(dāng)前視頻圖像壓縮技術(shù)中使用最普遍的方法106宏預(yù)測(cè)與運(yùn)動(dòng)補(bǔ)償示意圖

宏預(yù)測(cè)與運(yùn)動(dòng)補(bǔ)償示意圖107BlockMotionEstimationBlockMotionEstimation108Videosequence:Tennisframe0Videosequence:Tennisframe109Videosequence:Tennisframe1Videosequence:Tennisframe110FrameDifferenceFrameDifference111MotionVector-MotionEstimationMotionVector-MotionEstimatio112P圖是把I圖中的“準(zhǔn)宏塊”復(fù)制過(guò)來(lái),拼成的一幅圖?!皽?zhǔn)宏塊”的邊界不是I圖中的16

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論