![北郵劉剛教授-信息工程導(dǎo)論課件-多媒體信息處理-2015_第1頁](http://file4.renrendoc.com/view/94f3911be87fe6a710ed31442a0c66fc/94f3911be87fe6a710ed31442a0c66fc1.gif)
![北郵劉剛教授-信息工程導(dǎo)論課件-多媒體信息處理-2015_第2頁](http://file4.renrendoc.com/view/94f3911be87fe6a710ed31442a0c66fc/94f3911be87fe6a710ed31442a0c66fc2.gif)
![北郵劉剛教授-信息工程導(dǎo)論課件-多媒體信息處理-2015_第3頁](http://file4.renrendoc.com/view/94f3911be87fe6a710ed31442a0c66fc/94f3911be87fe6a710ed31442a0c66fc3.gif)
![北郵劉剛教授-信息工程導(dǎo)論課件-多媒體信息處理-2015_第4頁](http://file4.renrendoc.com/view/94f3911be87fe6a710ed31442a0c66fc/94f3911be87fe6a710ed31442a0c66fc4.gif)
![北郵劉剛教授-信息工程導(dǎo)論課件-多媒體信息處理-2015_第5頁](http://file4.renrendoc.com/view/94f3911be87fe6a710ed31442a0c66fc/94f3911be87fe6a710ed31442a0c66fc5.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
多媒體信息處理劉剛網(wǎng)絡(luò)搜索教研中心模式識別與智能系統(tǒng)實(shí)驗(yàn)室liugang@06二月2023信息工程導(dǎo)論目錄概述多媒體信息采集多媒體通信/存儲多媒體信息識別多媒體信息檢索多媒體信息生成總結(jié)2023年2月6日2信息與通信工程學(xué)院liugang@1.概述什么是多媒體為什么要研究多媒體信息信息處理流程多媒體信息處理研究內(nèi)容2023年2月6日3信息與通信工程學(xué)院liugang@1.1什么是多媒體媒體(Media)就是人與人之間實(shí)現(xiàn)信息交流的中介,簡單地說,就是信息的載體,也稱為媒介。多媒體就是多重媒體的意思可以理解為直接作用于人感官的文字、圖形、圖像、動畫、聲音和視頻等各種媒體的統(tǒng)稱,即多種信息載體的表現(xiàn)形式和傳遞方式。2023年2月6日4信息與通信工程學(xué)院liugang@信息來源統(tǒng)計(jì)根據(jù)美國哈佛商學(xué)院有關(guān)研究人員的分析資料表明,人的大腦每天通過五種感官接受外部信息的比例分別為:味覺1%,觸覺1.5%,嗅覺3.5%,聽覺11%,以及視覺83%。主要的三個(gè)媒體聲音:語音(語言的表達(dá)形式之一),音樂,音效(一般音頻)圖像:圖形,圖像,動畫,視頻文本(抽象):文本(語言的表達(dá)形式之一),數(shù)據(jù)等2023年2月6日5信息與通信工程學(xué)院liugang@1.2為什么要研究多媒體信息多媒體是信息載體的總稱,是信息的承載形式或表現(xiàn)形式。多媒體信息處理,實(shí)際上就是信息處理。信息及其處理是當(dāng)前時(shí)代的標(biāo)志信息處理是信息工程專業(yè)的使命多媒體信息處理又有自身的特點(diǎn)2023年2月6日6信息與通信工程學(xué)院liugang@2023年2月6日信息與通信工程學(xué)院liugang@7信息及其處理是當(dāng)前時(shí)代的標(biāo)志社會發(fā)展史:
農(nóng)業(yè)社會(物質(zhì)資源)擴(kuò)展人的體質(zhì)能力工業(yè)社會(能量資源)擴(kuò)展人的體力能力信息社會(信息資源)擴(kuò)展人的智力能力沒有物質(zhì)什麼都不存在,沒有能量什麼都不發(fā)生,沒有信息什麼都沒意義信息處理是信息工程專業(yè)的使命信息工程的使命信息工程是面向信息通信行業(yè),口徑寬、適應(yīng)面廣的專業(yè)。該專業(yè)培養(yǎng)系統(tǒng)掌握信息傳輸和處理的基本理論和基本知識,掌握信息獲取和應(yīng)用的核心技術(shù),能從事現(xiàn)代信息網(wǎng)絡(luò)和智能信息系統(tǒng)的設(shè)計(jì)、開發(fā)、研究及運(yùn)營等方面工作的高素質(zhì)專門人才。2023年2月6日8信息與通信工程學(xué)院liugang@多媒體信息處理又有自身的特點(diǎn)音頻---隨機(jī)視頻---隨機(jī)文本/數(shù)據(jù)---確定多媒體融合2023年2月6日信息與通信工程學(xué)院liugang@9如何結(jié)合不同媒體的特點(diǎn)進(jìn)行更好的信息處理如何進(jìn)行多個(gè)媒體的信息融合處理1.3信息處理的流程2023年2月6日信息與通信工程學(xué)院liugang@10信息處理的流程信息科學(xué)基本原理2023年2月6日信息與通信工程學(xué)院liugang@11通信通信1.3信息處理的流程2023年2月6日信息與通信工程學(xué)院liugang@12信息獲取通信信息決策信息施效通信多媒體信息處理主要研究與媒體相關(guān)的部分1.4多媒體信息處理研究內(nèi)容2023年2月6日信息與通信工程學(xué)院liugang@13數(shù)字信號處理數(shù)據(jù)采集技術(shù)通信原理信息處理與編碼模式識別Web搜索語音信號數(shù)字處理,數(shù)字圖像處理信號層次內(nèi)容層次1.4多媒體信息處理研究內(nèi)容研究如何更有效地產(chǎn)生、傳輸、存儲、獲取和應(yīng)用多媒體信息多媒體信息采集多媒體通信/存儲多媒體編碼/譯碼----信源編碼多媒體內(nèi)容處理---智能信息處理多媒體信息識別多媒體信息檢索多媒體信息生成2023年2月6日14信息與通信工程學(xué)院liugang@目錄概述多媒體信息采集多媒體通信/存儲多媒體信息識別多媒體信息檢索多媒體信息生成總結(jié)2023年2月6日15信息與通信工程學(xué)院liugang@2.多媒體信息采集概述傳感器模數(shù)轉(zhuǎn)換/數(shù)模轉(zhuǎn)換噪聲處理等預(yù)處理2023年2月6日16信息與通信工程學(xué)院liugang@2.1多媒體信息采集-概述采集原則不失真有用信號不失真噪聲干擾小處理過程傳感器采集模數(shù)轉(zhuǎn)換/數(shù)模轉(zhuǎn)換噪聲處理等預(yù)處理2023年2月6日17信息與通信工程學(xué)院liugang@數(shù)據(jù)采集技術(shù)2.2傳感器傳感器transducer/sensor一種檢測裝置,能感受到被測量的信息,并能將感受到的信息,按一定規(guī)律變換成為電信號或其他所需形式的信息輸出兩個(gè)功能信號敏感換能2023年2月6日信息與通信工程學(xué)院liugang@182.2傳感器傳感器是人類五官的延長,又稱之為電五官光敏傳感器——視覺聲敏傳感器——聽覺氣敏/化學(xué)傳感器——嗅覺化學(xué)傳感器——味覺壓敏、溫敏、流體傳感器——觸覺2023年2月6日信息與通信工程學(xué)院liugang@19可燃?xì)怏w感器二氧化氮傳感器鹽度傳感器紅外壓力可穿戴柔性觸覺2.2傳感器---Mic陣列2023年2月6日20信息與通信工程學(xué)院liugang@2.2傳感器---Mic陣列2023年2月6日21信息與通信工程學(xué)院liugang@2.2傳感器---Mic陣列2023年2月6日22信息與通信工程學(xué)院liugang@針對復(fù)雜應(yīng)用如:音源定位遠(yuǎn)距離聲音采集聲場分析等2023年2月6日信息與通信工程學(xué)院liugang@012345672.3模數(shù)轉(zhuǎn)換量化編碼000011011100100101110111111111111110101011010量化誤差0.5-0.5抽樣23圖像二值化等2023年2月6日24信息與通信工程學(xué)院liugang@2.3預(yù)處理噪聲的去除和有用信息的初步提取降噪分割檢測……2023年2月6日信息與通信工程學(xué)院liugang@25語音預(yù)處理語音增強(qiáng)語音端點(diǎn)檢測2023年2月6日信息與通信工程學(xué)院liugang@26譜減法語音增強(qiáng)Kalman濾波法2023年2月6日27圖像的降噪/group/dipr信息與通信工程學(xué)院liugang@2023年2月6日28圖像增強(qiáng)信息與通信工程學(xué)院liugang@2023年2月6日29圖像恢復(fù)運(yùn)動模糊圖像恢復(fù)圖像信息與通信工程學(xué)院liugang@2023年2月6日30圖像的分割信息與通信工程學(xué)院liugang@周界檢測系統(tǒng)系統(tǒng)可以自動檢測到進(jìn)入到場景中的運(yùn)動目標(biāo),判斷是否進(jìn)入設(shè)定警戒區(qū)域。應(yīng)用場景:機(jī)場,小區(qū),軍事禁區(qū)2023年2月6日31信息與通信工程學(xué)院liugang@目錄概述多媒體信息采集多媒體通信/存儲多媒體信息識別多媒體信息檢索多媒體信息生成總結(jié)2023年2月6日32信息與通信工程學(xué)院liugang@3.多媒體通信和存儲
—多媒體編碼為什么要進(jìn)行編碼信源編碼---壓縮,提高有效性為什么可以壓縮信號本身的冗余度---語音感知特性----人耳的聽覺特性語音--G.721,G.729,G.723.1混合音頻編碼圖像--JPEG、JPEG2000視頻--MPEG-1,MPEG-2和MPEG-4,H261,H.263,MPEG7,MPEG212023年2月6日33信息與通信工程學(xué)院liugang@目錄概述多媒體信息采集多媒體通信/存儲多媒體信息識別多媒體信息檢索多媒體信息生成總結(jié)2023年2月6日34信息與通信工程學(xué)院liugang@4.多媒體信息識別模式識別概述語音識別音頻事件識別圖像識別多模態(tài)模式識別2023年2月6日35信息與通信工程學(xué)院liugang@4.1模式識別模式識別(PatternRecognition)模式分類模式識別是從模式到類別的映射模式識別是模擬人的某些功能模擬人的視覺:計(jì)算機(jī)+光學(xué)系統(tǒng)--圖像識別模擬人的聽覺:計(jì)算機(jī)+聲音傳感器---語音識別模擬人的嗅覺和觸覺:計(jì)算機(jī)+傳感器模式識別是從模式到類別的映射2023年2月6日36信息與通信工程學(xué)院liugang@模式識別在智能信息處理中的地位2023年2月6日37信息與通信工程學(xué)院liugang@模式識別在信息處理中的地位2023年2月6日信息與通信工程學(xué)院liugang@382023年2月6日信息與通信工程學(xué)院liugang@38信息獲取通信信息處理信息施效通信模式識別的原理框圖2023年2月6日39信息與通信工程學(xué)院liugang@模式識別的原理4.2語音識別什么是語音識別語音識別是研究如何采用數(shù)字信號處理技術(shù)自動提取以及決定語音信號中最基本、最有意義的信息的一門新興的邊緣學(xué)科。分類語音識別(內(nèi)容)特定人/非特定人,孤立詞/連續(xù)語音/關(guān)鍵詞識別說話人識別/聲紋語種識別/方言識別性別識別情緒識別,母語/非母語,發(fā)音評價(jià),疾病診斷,說話時(shí)吃東西?2023年2月6日41信息與通信工程學(xué)院liugang@演示系統(tǒng)語音輸入法/語音搜索谷歌、百度、搜狗、訊飛、微信語音問答系統(tǒng)蘋果SIRI 計(jì)算機(jī)聲控系統(tǒng)2023年2月6日42信息與通信工程學(xué)院liugang@4.3音頻事件識別語音音頻音頻事件識別關(guān)鍵事件---安全監(jiān)控腳步聲,關(guān)門開門聲,槍聲,玻璃破碎聲,重物落地聲,語音等音頻場景分析/情境計(jì)算音視頻摘要、檢索2023年2月6日43信息與通信工程學(xué)院liugang@演示系統(tǒng)2023年2月6日信息與通信工程學(xué)院liugang@444.4圖像識別一、二維條碼識別簡單問題文字識別、指紋識別、虹膜識別、掌紋識別、人臉識別、車牌識別……物體識別2023年2月6日45信息與通信工程學(xué)院liugang@46字符識別脫機(jī)offlineOCR聯(lián)機(jī)online手寫輸入2023年2月6日信息與通信工程學(xué)院liugang@2023年2月6日47
遼C79388信息與通信工程學(xué)院liugang@人臉識別人臉識別是指通過人臉進(jìn)行身份確認(rèn)或者身份查找的技術(shù)人臉圖像采集人臉定位人臉識別預(yù)處理身份確認(rèn)以及身份查找等;2023年2月6日48信息與通信工程學(xué)院liugang@49人臉檢測2023年2月6日信息與通信工程學(xué)院liugang@50人臉識別2023年2月6日信息與通信工程學(xué)院liugang@51指紋識別2023年2月6日信息與通信工程學(xué)院liugang@52虹膜識別2023年2月6日信息與通信工程學(xué)院liugang@生物特征識別生物特征識別:未來的身份驗(yàn)證方法!生物:指紋、虹膜、人臉、掌紋、手形、視網(wǎng)膜、紅外溫譜行為:筆跡、步態(tài)、聲紋2023年2月6日53信息與通信工程學(xué)院liugang@手勢識別體態(tài)識別靜止運(yùn)動步態(tài)識別2023年2月6日54信息與通信工程學(xué)院liugang@物體識別(圖像解析)2023年2月6日55信息與通信工程學(xué)院liugang@4.5多模態(tài)模式識別聽覺視覺雙模態(tài)語音識別視頻與聽覺語音聯(lián)合使用,提高識別率---多媒體融合2023年2月6日56信息與通信工程學(xué)院liugang@目錄概述多媒體信息采集多媒體通信/存儲多媒體信息識別多媒體信息檢索多媒體信息生成總結(jié)2023年2月6日57信息與通信工程學(xué)院liugang@5.多媒體信息檢索文本檢索語音檢索音頻檢索圖像檢索多媒體融合信息檢索2023年2月6日58信息與通信工程學(xué)院liugang@5.1文本檢索另外一講多媒體檢索與文本檢索的異同文本檢索是信息檢索的基礎(chǔ)多媒體檢索需要進(jìn)行識別再進(jìn)行檢索識別錯誤會產(chǎn)生影響2023年2月6日信息與通信工程學(xué)院liugang@595.2語音檢索查詢方式文本,語音檢索對象文本,語音2023年2月6日60信息與通信工程學(xué)院liugang@語音檢索演示語音檢索檢索對象:廣播新聞?wù)Z音,如新聞聯(lián)播檢索輸入:文本2023年2月6日61信息與通信工程學(xué)院liugang@2023年2月6日信息與通信工程學(xué)院liugang@625.3音頻檢索基于樣例的音頻檢索哼唱檢索基于語義的音頻檢索音頻事件檢索音頻場景檢索2023年2月6日63信息與通信工程學(xué)院liugang@基于樣例的音頻檢索功能簡介通過音頻片斷(原始的音頻片段或者錄制的)搜索到整個(gè)音頻的完整信息2023年2月6日64信息與通信工程學(xué)院liugang@2023年2月6日信息與通信工程學(xué)院liugang@65基于樣例的音頻檢索哼唱檢索QBH(QueryByHumming)通過哼唱歌曲的某個(gè)片段來找到想要搜尋
的歌曲,是一種基于內(nèi)容的音樂信息檢索方式。2023年2月6日66信息與通信工程學(xué)院liugang@2023年2月6日信息與通信工程學(xué)院liugang@67多媒體融合信息檢索
---以音樂檢索為例檢索輸入信息:歌名,歌手,歌詞,旋律,曲譜,流派,風(fēng)格等形式:文本,語音,哼唱,音頻,圖像(曲譜)檢索對象(輸出)文本,語音,歌曲,圖像等技術(shù)文本檢索,語音檢索(語音識別),哼唱檢索,流派識別,樣例檢索,音頻屬性檢索,多媒體信息融合等2023年2月6日68信息與通信工程學(xué)院liugang@5.4圖像信息檢索圖片檢索(谷歌、百度圖片搜索)文本檢索圖片圖片檢索圖片基于圖像的商品檢索2023年2月6日69信息與通信工程學(xué)院liugang@基于3G手機(jī)的圖片檢索系統(tǒng)2023年2月6日70信息與通信工程學(xué)院liugang@目錄概述多媒體信息采集多媒體通信/存儲多媒體信息識別多媒體信息檢索多媒體信息生成總結(jié)2023年2月6日71信息與通信工程學(xué)院liugang@6.多媒體信息生成
---虛擬現(xiàn)實(shí)/增強(qiáng)現(xiàn)實(shí)多媒體信息的再生---轉(zhuǎn)換多媒體信息的合成---合成人臉表情合成語音合成聽覺場景生成視覺場景生成3D4D5D電影---全息。。。。。。2023年2月6日72信息與通信工程學(xué)院liugang@6.1語音合成(TTS)什么是TTSTextToSpeech讓機(jī)器開口說話評價(jià)指標(biāo)可懂度、自然度2023年2月6日73信息與通信工程學(xué)院liugang@6.2人臉表情合成2023年2月6日74信息與通信工程學(xué)院liugang@6.2人臉表情合成2023年2月6日75信息與通信工程學(xué)院liugang@聽覺場景生成計(jì)算聽覺場景分析用計(jì)算機(jī)技術(shù)將人類聽覺對聲音的處理過程(聽覺場景分析)建模,使計(jì)算機(jī)具備從混合聲音中分離各物理聲源并作出合理解釋的能力。聽覺場景生成通過多揚(yáng)聲器在新的聲學(xué)空間重現(xiàn)聲學(xué)場景環(huán)繞立體聲免提全息電話Bee游戲虛擬現(xiàn)實(shí)2023年2月6日76信息與通信工程學(xué)院liugang@視覺場景生成全息投影/景象往往包括音頻(即聽覺)3D4D5D電影---全息MicrosoftHoloLens
全息眼鏡MagicLeap2023年2月6日信息與通信工程學(xué)院liugang@773D,4D,5D電影3D立體效果的基礎(chǔ)上增加動感座椅,環(huán)境特效,5D電影院讓觀眾從聽覺、視覺、觸覺,這幾方面達(dá)到最強(qiáng)大的逼真感如同置身于影片中,通過環(huán)境模擬實(shí)現(xiàn)風(fēng)、雨、電、煙、雪花、泡泡、火焰掃腿、捅背、震動、香煙等環(huán)境效果,順著影視內(nèi)容變化可實(shí)時(shí)感受到置身“閃電、煙霧、雪花”中,在“火焰”前有灼熱感,海浪撲身時(shí)會“濕”了衣裳。體驗(yàn)下墜、震動、刮風(fēng)、下雨、掃腿等全新的真切感覺,對電影行業(yè)有一定的推動作用。2023年2月6日信息與通信工程學(xué)院liugang@78MicrosoftHoloLens
全息眼鏡Holograms借助頭戴設(shè)備HoloLen的幫助,讓用戶的眼前出現(xiàn)懸浮界面,以實(shí)際環(huán)境作為載體,實(shí)時(shí)處理、獲取虛擬信息:如在墻上查看消息、查找聯(lián)系人,在地上玩游戲、在客廳墻上直接進(jìn)行Skype視頻通話、觀看球賽。2023年2月6日信息與通信工程學(xué)院liugang@792023年2月6日信息與通信工程學(xué)院liugang@80MagicLeap公司的3D裸眼技術(shù)2023年2月6日信
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年IC卡鑒別機(jī)合作協(xié)議書
- 湖南理工職業(yè)技術(shù)學(xué)院《儀表自動化》2023-2024學(xué)年第二學(xué)期期末試卷
- 成都四川成都簡陽市三合鎮(zhèn)便民服務(wù)和智慧蓉城運(yùn)行中心招聘綜治巡防隊(duì)員2人筆試歷年參考題庫附帶答案詳解
- 集美大學(xué)《計(jì)算機(jī)技術(shù)與應(yīng)用》2023-2024學(xué)年第二學(xué)期期末試卷
- 2025年黑龍江貨運(yùn)從業(yè)資格證模擬考試題庫及答案
- 中級經(jīng)濟(jì)師保險(xiǎn)專業(yè)-中級經(jīng)濟(jì)師《保險(xiǎn)專業(yè)知識與實(shí)務(wù)》模擬試卷5
- 2024信息運(yùn)維檢修專項(xiàng)測試題附答案
- 2025年中國皮草釘市場調(diào)查研究報(bào)告
- 廣東省汕頭市達(dá)濠華橋中學(xué)2023-2024學(xué)年高三下學(xué)期起點(diǎn)考試數(shù)學(xué)試題試卷
- 2025年中國五層角落架市場調(diào)查研究報(bào)告
- 高標(biāo)準(zhǔn)農(nóng)田施工組織設(shè)計(jì)(全)
- 宿舍、辦公樓消防應(yīng)急預(yù)案
- 細(xì)胞全能性的課件資料
- 職業(yè)安全健康工作總結(jié)(2篇)
- 14S501-1 球墨鑄鐵單層井蓋及踏步施工
- YB 4022-1991耐火泥漿荷重軟化溫度試驗(yàn)方法(示差-升溫法)
- 水土保持方案中沉沙池的布設(shè)技術(shù)
- 安全生產(chǎn)技術(shù)規(guī)范 第25部分:城鎮(zhèn)天然氣經(jīng)營企業(yè)DB50-T 867.25-2021
- 現(xiàn)代企業(yè)管理 (全套完整課件)
- 走進(jìn)本土項(xiàng)目化設(shè)計(jì)-讀《PBL項(xiàng)目化學(xué)習(xí)設(shè)計(jì)》有感
- 高中語文日積月累23
評論
0/150
提交評論