多媒體中音頻信息035mpeg編碼_第1頁
多媒體中音頻信息035mpeg編碼_第2頁
多媒體中音頻信息035mpeg編碼_第3頁
多媒體中音頻信息035mpeg編碼_第4頁
多媒體中音頻信息035mpeg編碼_第5頁
已閱讀5頁,還剩24頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

MPEG中的音頻編碼MPEG標準國際標準化組織ISO(International

Organizationfor

Standardization)和國際電工委員會IEC(InternationalElectrotechnicalCommission)所屬WG11工作組,1986年成立了運動圖像壓縮編碼組織MPEG(

Moving Picture

ExpectGroup),負責(zé)開發(fā)電視圖象數(shù)據(jù)和聲音數(shù)據(jù)的編碼、解碼和它們的同步等標準。2021/7/192數(shù)字音頻處理技術(shù)MPEG工作進程2021/7/193數(shù)字音頻處理技術(shù)¤

1993年08月

公布

MPEG-1

ISO/IEC

11172¤

1994年08月

公布

MPEG-2

ISO/IEC

13818¤

1999年01月

公布

MPEG-4

ISO/IEC

14496

V1.01999年12月

公布

MPEG-4

ISO/IEC 14496

V2.0¤

1998年10月征集建議MPEG-72001年07月公布國際標準草案2001年09月公布國際標準¤

2000年03月成立MPEG-21工作組MPEG工作進程2021/7/194數(shù)字音頻處理技術(shù)¤

1993年08月

公布

MPEG-1

ISO/IEC

11172¤

1994年08月

公布

MPEG-2

ISO/IEC

13818第一代壓縮編碼方法數(shù)據(jù)編碼預(yù)測編碼、變換編碼、熵編碼、參數(shù)編碼MPEG工作進程2021/7/195數(shù)字音頻處理技術(shù)¤

1999年01月

公布

MPEG-4

ISO/IEC 14496

V1.0¤

1999年12月

公布

MPEG-4

ISO/IEC 14496

V2.0¤

基于對象的編碼¤

面向媒體的基于內(nèi)容的訪問、檢索、操作的需求¤

定義的是格式、框架,而不是具體算法?!枰曨l對象(VideoObject):能夠訪問(檢索或瀏覽)和操作(剪貼)的實體?!?/p>

壓縮比高、基于內(nèi)容的交互功能MPEG工作進程2021/7/196數(shù)字音頻處理技術(shù)¤

1998年10月征集建議MPEG-72001年07月公布國際標準草案2001年09月公布國際標準多媒體內(nèi)容描述接口MPEG-1音頻規(guī)定了高質(zhì)量音頻編碼方法,存儲表示和解碼方法。編碼器的輸入和解碼器的輸出與現(xiàn)存的PCM標準兼

容。視頻、音頻的總數(shù)據(jù)率為1.5Mb/s。音頻使用的采樣率為32kHz、44.1kHz、48kHz。有四種不同的編碼模式:單聲道模式、雙聲道模式、立體聲模式和聯(lián)合立體聲模式。2021/7/197數(shù)字音頻處理技術(shù)MPEG-1音頻層Ⅰ把數(shù)字音頻變成32個子帶的基本映射。將數(shù)據(jù)格式化成塊的固定分段。決定自適應(yīng)位分配的心理聲學(xué)模型。使用塊壓擴和格式化的量化器。理論上,層Ⅰ編碼/解碼的最小延時約為19ms。層Ⅱ提供了位分配、縮放因子和抽樣的附加編碼。使用了不同的幀格式。這層理論上的最小編碼/解碼延時約為35ms。層Ⅲ采用混合帶通濾波器來提高頻率分辨率。它增加了差值量化(非均勻)、自適應(yīng)分段和量化值的熵編碼。這層理論上的最小編碼/解碼延時為59ms。2021/7/198數(shù)字音頻處理技術(shù)MPEG-1音頻MPEG-1是VCD工業(yè)標準的核心,MP3音樂格式利用

MPEG

音頻第三層編碼算法。2021/7/199數(shù)字音頻處理技術(shù)MPEG-2音頻MPEG-2標準定義了兩種聲音數(shù)據(jù)壓縮格式:一種稱為MPEG-2

Audio,或者稱為MPEG-2多通道(Multichannel)聲音,它與MPEG-1 Audio是兼容的,又稱為MPEG-2

BC

(Backward

Compatible)。另一種稱為MPEG-2

AAC(Advanced

Audio

Coding),它與MPEG-1聲音格式不兼容,通常稱為非后向兼容MPEG-2

NBC(Non-Backward-Compatible)標準。2021/7/1910數(shù)字音頻處理技術(shù)MPEG-2音頻MPEG-2做了如下擴充:①增加了16

kHz,

22.05kHz和24kHz采樣頻率,②擴展了編碼器的輸出速率范圍,由32~384kbps擴展到8~640kbps,③增加了聲道數(shù),支持5.1聲道的環(huán)繞聲。此外MPEG-2還支持Linear

PCM(線性PCM)和Dolby

AC-3(AudioCode

Number

3)編碼。2021/7/1911數(shù)字音頻處理技術(shù)AC-3音頻1992年DOLBY

實驗室在AC-2的基礎(chǔ)上開發(fā)了AC-3數(shù)字音頻編碼技術(shù)AC-3采用了重疊窗口的FFT頻譜分析技術(shù)。非線性子帶帶寬分配、動態(tài)時域/頻域帶寬分配、心理聲學(xué)摸型和多聲道耦合技術(shù),具有很高的數(shù)據(jù)壓縮率和很低的失真度。比特率為320Kb/s。杜比AC-3有6個聲道;左、右、中、左環(huán)繞、右環(huán)繞和一個低于120Hz的超低音聲道,因此又稱作

5.1聲道。通帶頻響為20Hz-20KHz。2021/7/1912數(shù)字音頻處理技術(shù)AC-3音頻AC-3是由5個全頻聲道和一個超重低音聲道組成的環(huán)繞立體聲。再加上專業(yè)的定位配置,能和影片中的三維空間同時變換,把您的整個身心都融入影音的動感世界。1993年10月25日AC-3被定為美國HDTV的音頻標準。2021/7/1913數(shù)字音頻處理技術(shù)MPEG-2音頻MPEG-2AAC是MPEG-2標準中的一種非常靈活的聲音感知編碼標準。,MPEG-2AAC主要使用聽覺系統(tǒng)的掩蔽特性來減少聲音的數(shù)據(jù)量,并且通過把量化噪聲分散到各個子帶中,用全局信號把噪聲掩蔽掉。AAC支持的采用頻率可從8

kHz到96

kHz,音源可以是單聲道的、立體聲的和多聲道的聲音。AAC標準可支持48個主聲道、16個低頻音效加強通道LFE

(low

frequency

effects)、

16

個配音聲道(overdub

channel)或者叫做多語言聲道

(multilingual

channel)和16個數(shù)據(jù)流。MPEG-2

AAC在壓縮比為11:1(即每個聲道的數(shù)據(jù)率為(44.1×16)/11=64

kbps),5聲道的總數(shù)據(jù)率為320

kbps的情況下,很難區(qū)分還原后的聲音與原始聲音之間的差別。與MPEG的層2相比,MPEG-2

AAC的壓縮率可提高1倍,而且質(zhì)量更高,與MPEG的層3相比,在質(zhì)量相同的條件下數(shù)據(jù)率是它的70%。2021/7/1914數(shù)字音頻處理技術(shù)MPEG-4音頻MPEG-4的初衷是針對視頻會議、視頻電話的超低

比特率編碼,但在制定中根據(jù)技術(shù)發(fā)展修訂了計劃,表現(xiàn)為:通過高性能芯片實現(xiàn)壓縮編碼;對多媒體信息的應(yīng)用從播放型轉(zhuǎn)向基于內(nèi)容的訪問。將基于內(nèi)容的檢索與編碼結(jié)合起來。MPEG-4標準的編碼時基于對象的,這樣就便于操作和控制對象。2021/7/1915數(shù)字音頻處理技術(shù)MPEG-4音頻MPEG-4

coding

of

audio

objects

provides

toolsfor

both

representing

natural

sounds

(such

asspeech

and

music)

and

for

synthesizing

soundsbased

on

structured

descriptions.The

representation

for

synthesized

sound

can

bederived

from

text

data

or

so-called

instrumentdescriptions

and

by

coding

parameters

to

provideeffects,

such

as

reverberation

and

spatialization.The

representations

provide

compression

andother

functionalities,

such

as

scalability

andeffects

processing.2021/7/1916數(shù)字音頻處理技術(shù)MPEG-4音頻MPEG4中基于內(nèi)容的數(shù)據(jù)壓縮編碼方法。主要特征是采用了第二代編碼技術(shù):基于對象的編碼(object-based)、基于模型的編碼(model-based)MPEG

4的目標:支持多種多媒體的應(yīng)用開放編碼系統(tǒng),可隨時加進新的算法模塊創(chuàng)建了交互式數(shù)字化音頻世界的新技術(shù)。實現(xiàn)低碼率編碼2021/7/1917數(shù)字音頻處理技術(shù)MPEG-4音頻音頻工具:

SpeechToolAudio

ToolSynthesisToolComposition

ToolScalability

Tool提供聲音合成能力2021/7/1918數(shù)字音頻處理技術(shù)MPEG-4音頻eXcitation2021/7/1919數(shù)字音頻處理技術(shù)Coding)諧波矢量自然語音編碼:碼率范圍2—24kb/s算法:HVXC(HarmonicVector激勵編碼2.0-4.0kb/s,變化速度和音高,Excited

Linear

Prediction)碼激勵線性CELP(Code預(yù)測編碼8-16kb/sMPEG-4音頻文語轉(zhuǎn)換:混合/多級可擴展TTS接口指定了韻律信息、人臉活動參數(shù)和其他活動參數(shù)的聯(lián)合編碼方法。制作功能:混合聲音、音樂、音效結(jié)構(gòu)化音頻:SAOL(Structured

Audio

Orchestra

Language)SASL

(Structured

Audio

Sore

Language)SASBF

(Structured

Audio

Sample

Bank

Format)標準化的調(diào)度描述參考MIDI標準2021/7/1920數(shù)字音頻處理技術(shù)MPEG-7The

work

plan

for

MPEG-7

isshownbelow:Call

for

Proposals:October

1998Evaluation

:February

1999First

version

of

Working

Draft

(WD):December1999Committee

Draft

(CD)

:October

2000Final

Committee

Draft

(FCD)

:February2001Draft

International

Standard

(DIS)

:July

2001International

Standard

(IS)

:September

20012021/7/1921數(shù)字音頻處理技術(shù)MPEG-7MPEG-7

Audio

Final

CommitteeDraftcomprises

sixtechnologies:

the

audio

description

framework

(which

includesthe

scale

tree

and

low-level

descriptors),sound

effect

description

tools,instrumental

timbre

description

tools,spoken

content

description,the

uniform

silence

segment,melodic

descriptors

to

facilitate

query-by-humming.2021/7/1922數(shù)字音頻處理技術(shù)MPEG-7音頻“多媒體內(nèi)容描述接口”(

Multimedia

Content

Description

Interface).它將各種媒體規(guī)定為一種標準化的描述,以支持基于內(nèi)容的檢索。數(shù)據(jù)(Data)特征(Feature)描述符(Descriptor)描述方案(Description

Scheme)描述(Description)編碼的描述(

Coded

Description)描述定義語言(Description

Definition

Language)2021/7/1923數(shù)字音頻處理技術(shù)MPEG-7音頻MPEG-7

正式名稱是“多媒體內(nèi)容描述接口”

(MultimediaContentDescriptionInterface).它將各種媒體規(guī)定為一種標準化的描述,以支持基于內(nèi)容的檢索。以下應(yīng)用領(lǐng)域?qū)腗PEG標準的制定中獲益:數(shù)字圖書館(圖書分類、音樂辭典)多媒體目錄服務(wù)(電話黃頁)廣播式媒體(廣播頻道選擇)多媒體編輯(個人電子新聞服務(wù)、媒體著作)2021/7/1924數(shù)字音頻處理技術(shù)MPEG-21音頻1999年8月MPEG主席Leonardo

Chiarigione

提出了“Technologies

for

E-content”1999年10月日本代表團提出制定MPEG-21標準的提案,以支持電子內(nèi)容傳輸和電子貿(mào)易。1999年12月通過了征集Multimedia Framework技術(shù)報告的協(xié)議。2000年3月成立MPEG-21工作組。2021/7/1925數(shù)字音頻處理技術(shù)MPEG-21

OverviewISO/IEC

JTC1/SC29/WG11/N4041,

Singapore,March

2001Many

elements

exist

to

build

an

infrastructurefor

the

delivery

and

consumption

of

multimediacontent.

There

is,

however,

no

'big

picture'

todescribe

how

these

elements,

either

in

existenceor

under

development,

relate

to

each

other.

Theaim

for

MPEG-21

is

to

describe

how

thesevarious

elements

fit

together.2021/7/1926數(shù)字音頻處理技術(shù)MPEG-21

OverviewWhere

gaps

exist,

MPEG-21

will mend

whichnew

standards

are

required.

ISO/IEC

JTC

1/SC29/WG

11

(MPEG)

will

then

develop

newstandards

as

appropriate

while

other

relevantstandards

may

be

developed

by

other

bodies.These

specific

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論