版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
MPEG中的音頻編碼MPEG標準國際標準化組織ISO(International
Organizationfor
Standardization)和國際電工委員會IEC(InternationalElectrotechnicalCommission)所屬WG11工作組,1986年成立了運動圖像壓縮編碼組織MPEG(
Moving Picture
ExpectGroup),負責(zé)開發(fā)電視圖象數(shù)據(jù)和聲音數(shù)據(jù)的編碼、解碼和它們的同步等標準。2021/7/192數(shù)字音頻處理技術(shù)MPEG工作進程2021/7/193數(shù)字音頻處理技術(shù)¤
1993年08月
公布
MPEG-1
ISO/IEC
11172¤
1994年08月
公布
MPEG-2
ISO/IEC
13818¤
1999年01月
公布
MPEG-4
ISO/IEC
14496
V1.01999年12月
公布
MPEG-4
ISO/IEC 14496
V2.0¤
1998年10月征集建議MPEG-72001年07月公布國際標準草案2001年09月公布國際標準¤
2000年03月成立MPEG-21工作組MPEG工作進程2021/7/194數(shù)字音頻處理技術(shù)¤
1993年08月
公布
MPEG-1
ISO/IEC
11172¤
1994年08月
公布
MPEG-2
ISO/IEC
13818第一代壓縮編碼方法數(shù)據(jù)編碼預(yù)測編碼、變換編碼、熵編碼、參數(shù)編碼MPEG工作進程2021/7/195數(shù)字音頻處理技術(shù)¤
1999年01月
公布
MPEG-4
ISO/IEC 14496
V1.0¤
1999年12月
公布
MPEG-4
ISO/IEC 14496
V2.0¤
基于對象的編碼¤
面向媒體的基于內(nèi)容的訪問、檢索、操作的需求¤
定義的是格式、框架,而不是具體算法?!枰曨l對象(VideoObject):能夠訪問(檢索或瀏覽)和操作(剪貼)的實體?!?/p>
壓縮比高、基于內(nèi)容的交互功能MPEG工作進程2021/7/196數(shù)字音頻處理技術(shù)¤
1998年10月征集建議MPEG-72001年07月公布國際標準草案2001年09月公布國際標準多媒體內(nèi)容描述接口MPEG-1音頻規(guī)定了高質(zhì)量音頻編碼方法,存儲表示和解碼方法。編碼器的輸入和解碼器的輸出與現(xiàn)存的PCM標準兼
容。視頻、音頻的總數(shù)據(jù)率為1.5Mb/s。音頻使用的采樣率為32kHz、44.1kHz、48kHz。有四種不同的編碼模式:單聲道模式、雙聲道模式、立體聲模式和聯(lián)合立體聲模式。2021/7/197數(shù)字音頻處理技術(shù)MPEG-1音頻層Ⅰ把數(shù)字音頻變成32個子帶的基本映射。將數(shù)據(jù)格式化成塊的固定分段。決定自適應(yīng)位分配的心理聲學(xué)模型。使用塊壓擴和格式化的量化器。理論上,層Ⅰ編碼/解碼的最小延時約為19ms。層Ⅱ提供了位分配、縮放因子和抽樣的附加編碼。使用了不同的幀格式。這層理論上的最小編碼/解碼延時約為35ms。層Ⅲ采用混合帶通濾波器來提高頻率分辨率。它增加了差值量化(非均勻)、自適應(yīng)分段和量化值的熵編碼。這層理論上的最小編碼/解碼延時為59ms。2021/7/198數(shù)字音頻處理技術(shù)MPEG-1音頻MPEG-1是VCD工業(yè)標準的核心,MP3音樂格式利用
MPEG
音頻第三層編碼算法。2021/7/199數(shù)字音頻處理技術(shù)MPEG-2音頻MPEG-2標準定義了兩種聲音數(shù)據(jù)壓縮格式:一種稱為MPEG-2
Audio,或者稱為MPEG-2多通道(Multichannel)聲音,它與MPEG-1 Audio是兼容的,又稱為MPEG-2
BC
(Backward
Compatible)。另一種稱為MPEG-2
AAC(Advanced
Audio
Coding),它與MPEG-1聲音格式不兼容,通常稱為非后向兼容MPEG-2
NBC(Non-Backward-Compatible)標準。2021/7/1910數(shù)字音頻處理技術(shù)MPEG-2音頻MPEG-2做了如下擴充:①增加了16
kHz,
22.05kHz和24kHz采樣頻率,②擴展了編碼器的輸出速率范圍,由32~384kbps擴展到8~640kbps,③增加了聲道數(shù),支持5.1聲道的環(huán)繞聲。此外MPEG-2還支持Linear
PCM(線性PCM)和Dolby
AC-3(AudioCode
Number
3)編碼。2021/7/1911數(shù)字音頻處理技術(shù)AC-3音頻1992年DOLBY
實驗室在AC-2的基礎(chǔ)上開發(fā)了AC-3數(shù)字音頻編碼技術(shù)AC-3采用了重疊窗口的FFT頻譜分析技術(shù)。非線性子帶帶寬分配、動態(tài)時域/頻域帶寬分配、心理聲學(xué)摸型和多聲道耦合技術(shù),具有很高的數(shù)據(jù)壓縮率和很低的失真度。比特率為320Kb/s。杜比AC-3有6個聲道;左、右、中、左環(huán)繞、右環(huán)繞和一個低于120Hz的超低音聲道,因此又稱作
5.1聲道。通帶頻響為20Hz-20KHz。2021/7/1912數(shù)字音頻處理技術(shù)AC-3音頻AC-3是由5個全頻聲道和一個超重低音聲道組成的環(huán)繞立體聲。再加上專業(yè)的定位配置,能和影片中的三維空間同時變換,把您的整個身心都融入影音的動感世界。1993年10月25日AC-3被定為美國HDTV的音頻標準。2021/7/1913數(shù)字音頻處理技術(shù)MPEG-2音頻MPEG-2AAC是MPEG-2標準中的一種非常靈活的聲音感知編碼標準。,MPEG-2AAC主要使用聽覺系統(tǒng)的掩蔽特性來減少聲音的數(shù)據(jù)量,并且通過把量化噪聲分散到各個子帶中,用全局信號把噪聲掩蔽掉。AAC支持的采用頻率可從8
kHz到96
kHz,音源可以是單聲道的、立體聲的和多聲道的聲音。AAC標準可支持48個主聲道、16個低頻音效加強通道LFE
(low
frequency
effects)、
16
個配音聲道(overdub
channel)或者叫做多語言聲道
(multilingual
channel)和16個數(shù)據(jù)流。MPEG-2
AAC在壓縮比為11:1(即每個聲道的數(shù)據(jù)率為(44.1×16)/11=64
kbps),5聲道的總數(shù)據(jù)率為320
kbps的情況下,很難區(qū)分還原后的聲音與原始聲音之間的差別。與MPEG的層2相比,MPEG-2
AAC的壓縮率可提高1倍,而且質(zhì)量更高,與MPEG的層3相比,在質(zhì)量相同的條件下數(shù)據(jù)率是它的70%。2021/7/1914數(shù)字音頻處理技術(shù)MPEG-4音頻MPEG-4的初衷是針對視頻會議、視頻電話的超低
比特率編碼,但在制定中根據(jù)技術(shù)發(fā)展修訂了計劃,表現(xiàn)為:通過高性能芯片實現(xiàn)壓縮編碼;對多媒體信息的應(yīng)用從播放型轉(zhuǎn)向基于內(nèi)容的訪問。將基于內(nèi)容的檢索與編碼結(jié)合起來。MPEG-4標準的編碼時基于對象的,這樣就便于操作和控制對象。2021/7/1915數(shù)字音頻處理技術(shù)MPEG-4音頻MPEG-4
coding
of
audio
objects
provides
toolsfor
both
representing
natural
sounds
(such
asspeech
and
music)
and
for
synthesizing
soundsbased
on
structured
descriptions.The
representation
for
synthesized
sound
can
bederived
from
text
data
or
so-called
instrumentdescriptions
and
by
coding
parameters
to
provideeffects,
such
as
reverberation
and
spatialization.The
representations
provide
compression
andother
functionalities,
such
as
scalability
andeffects
processing.2021/7/1916數(shù)字音頻處理技術(shù)MPEG-4音頻MPEG4中基于內(nèi)容的數(shù)據(jù)壓縮編碼方法。主要特征是采用了第二代編碼技術(shù):基于對象的編碼(object-based)、基于模型的編碼(model-based)MPEG
4的目標:支持多種多媒體的應(yīng)用開放編碼系統(tǒng),可隨時加進新的算法模塊創(chuàng)建了交互式數(shù)字化音頻世界的新技術(shù)。實現(xiàn)低碼率編碼2021/7/1917數(shù)字音頻處理技術(shù)MPEG-4音頻音頻工具:
SpeechToolAudio
ToolSynthesisToolComposition
ToolScalability
Tool提供聲音合成能力2021/7/1918數(shù)字音頻處理技術(shù)MPEG-4音頻eXcitation2021/7/1919數(shù)字音頻處理技術(shù)Coding)諧波矢量自然語音編碼:碼率范圍2—24kb/s算法:HVXC(HarmonicVector激勵編碼2.0-4.0kb/s,變化速度和音高,Excited
Linear
Prediction)碼激勵線性CELP(Code預(yù)測編碼8-16kb/sMPEG-4音頻文語轉(zhuǎn)換:混合/多級可擴展TTS接口指定了韻律信息、人臉活動參數(shù)和其他活動參數(shù)的聯(lián)合編碼方法。制作功能:混合聲音、音樂、音效結(jié)構(gòu)化音頻:SAOL(Structured
Audio
Orchestra
Language)SASL
(Structured
Audio
Sore
Language)SASBF
(Structured
Audio
Sample
Bank
Format)標準化的調(diào)度描述參考MIDI標準2021/7/1920數(shù)字音頻處理技術(shù)MPEG-7The
work
plan
for
MPEG-7
isshownbelow:Call
for
Proposals:October
1998Evaluation
:February
1999First
version
of
Working
Draft
(WD):December1999Committee
Draft
(CD)
:October
2000Final
Committee
Draft
(FCD)
:February2001Draft
International
Standard
(DIS)
:July
2001International
Standard
(IS)
:September
20012021/7/1921數(shù)字音頻處理技術(shù)MPEG-7MPEG-7
Audio
Final
CommitteeDraftcomprises
sixtechnologies:
the
audio
description
framework
(which
includesthe
scale
tree
and
low-level
descriptors),sound
effect
description
tools,instrumental
timbre
description
tools,spoken
content
description,the
uniform
silence
segment,melodic
descriptors
to
facilitate
query-by-humming.2021/7/1922數(shù)字音頻處理技術(shù)MPEG-7音頻“多媒體內(nèi)容描述接口”(
Multimedia
Content
Description
Interface).它將各種媒體規(guī)定為一種標準化的描述,以支持基于內(nèi)容的檢索。數(shù)據(jù)(Data)特征(Feature)描述符(Descriptor)描述方案(Description
Scheme)描述(Description)編碼的描述(
Coded
Description)描述定義語言(Description
Definition
Language)2021/7/1923數(shù)字音頻處理技術(shù)MPEG-7音頻MPEG-7
正式名稱是“多媒體內(nèi)容描述接口”
(MultimediaContentDescriptionInterface).它將各種媒體規(guī)定為一種標準化的描述,以支持基于內(nèi)容的檢索。以下應(yīng)用領(lǐng)域?qū)腗PEG標準的制定中獲益:數(shù)字圖書館(圖書分類、音樂辭典)多媒體目錄服務(wù)(電話黃頁)廣播式媒體(廣播頻道選擇)多媒體編輯(個人電子新聞服務(wù)、媒體著作)2021/7/1924數(shù)字音頻處理技術(shù)MPEG-21音頻1999年8月MPEG主席Leonardo
Chiarigione
提出了“Technologies
for
E-content”1999年10月日本代表團提出制定MPEG-21標準的提案,以支持電子內(nèi)容傳輸和電子貿(mào)易。1999年12月通過了征集Multimedia Framework技術(shù)報告的協(xié)議。2000年3月成立MPEG-21工作組。2021/7/1925數(shù)字音頻處理技術(shù)MPEG-21
OverviewISO/IEC
JTC1/SC29/WG11/N4041,
Singapore,March
2001Many
elements
exist
to
build
an
infrastructurefor
the
delivery
and
consumption
of
multimediacontent.
There
is,
however,
no
'big
picture'
todescribe
how
these
elements,
either
in
existenceor
under
development,
relate
to
each
other.
Theaim
for
MPEG-21
is
to
describe
how
thesevarious
elements
fit
together.2021/7/1926數(shù)字音頻處理技術(shù)MPEG-21
OverviewWhere
gaps
exist,
MPEG-21
will mend
whichnew
standards
are
required.
ISO/IEC
JTC
1/SC29/WG
11
(MPEG)
will
then
develop
newstandards
as
appropriate
while
other
relevantstandards
may
be
developed
by
other
bodies.These
specific
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 電商一件代發(fā)協(xié)議模板2024年
- 2024年期住宅物業(yè)管理委托協(xié)議模板
- 2024年期土地修復(fù)坑塘施工保障協(xié)議
- 公司代收購農(nóng)產(chǎn)品協(xié)議書范本
- 南京信息工程大學(xué)《應(yīng)用軟件基礎(chǔ)》2022-2023學(xué)年期末試卷
- 2024煤礦項目投資合作協(xié)議
- 2024經(jīng)營權(quán)出售協(xié)議范本
- 房屋抵押貸款反擔保示范協(xié)議2024
- 光學(xué)儀器在冶金工程中的應(yīng)用考核試卷
- 寵物脫毛療法減輕寵物過敏和脫毛問題考核試卷
- 森林消防專業(yè)隊伍建設(shè)方案
- 社交媒體在教育中的應(yīng)用與影響
- 管理經(jīng)濟學(xué)(第3版) 課件【ch03】個人行為
- 學(xué)校財務(wù)處理程序制度
- 塔里木河流域胡楊林生態(tài)恢復(fù)成效評估
- 環(huán)境保護Theenvironmentalprotection英語演講課件
- 2023年事故序列模型介紹
- 兒童免疫性疾病課件
- 中圖版八年級地理上冊《世界氣候》復(fù)習(xí)課件
- 無損檢測通用作業(yè)指導(dǎo)書
- 2023年中考語文復(fù)習(xí):150個文言實詞-課件(共183張PPT)
評論
0/150
提交評論