




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
內(nèi)容簡介
物體檢索與定位是計算機視覺技術(shù)最核心的技術(shù)之一本書主要闡述了物體檢索與定位
。
中的關(guān)鍵問題和相關(guān)技術(shù)包括大數(shù)據(jù)時代的目標(biāo)檢索及應(yīng)用視覺詞組的貝葉斯池化模型
,、、
位置對齊的深度示例檢索模型多示例在線學(xué)習(xí)模型基于顯著性的深度特征表示人工智能
、、、
時代的信息檢索技術(shù)展望
。
本書內(nèi)容新穎條理清晰適合作為計算機與人工智能相關(guān)行業(yè)從業(yè)人員的專業(yè)技術(shù)類參
、,
考用書
。
圖書在版編目CIP數(shù)據(jù)
()
物體檢索與定位姜文暉著北京中國鐵道出版社
/.—:
有限公司
,2021.12
ISBN978-7-113-28655-2
物姜數(shù)據(jù)檢索研究
Ⅰ.①…Ⅱ.①…Ⅲ.①-Ⅳ.①G254.926
中國版本圖書館數(shù)據(jù)核字第號
CIP(2021)268557
書名:物體檢索與定位
作者:姜文暉
策劃:曹莉群編輯部電話:
(010)63549501
責(zé)任編輯:賈星包寧許璐
封面設(shè)計:劉穎
責(zé)任校對:焦桂榮
責(zé)任印制:樊啟鵬
出版發(fā)行:中國鐵道出版社有限公司北京市西城區(qū)右安門西街號
(100054,8)
網(wǎng)址:
http://www.tdpress.com/51eds/
印刷:北京富資園科技發(fā)展有限公司
版次:年月第版年月第次印刷
20211212021121
開本:印張:字?jǐn)?shù):千
787mm×1092mm1/166.75131
書號:
ISBN978-7-113-28655-2
定價:元
45.00
版權(quán)所有侵權(quán)必究
凡購買鐵道版圖書如有印制質(zhì)量問題請與本社教材圖書營銷部聯(lián)系調(diào)換電話
,,。:(010)63550836
打擊盜版舉報電話
:(010)63549461
隨著移動互聯(lián)網(wǎng)和物聯(lián)網(wǎng)的發(fā)展,海量數(shù)據(jù)正在發(fā)生爆發(fā)式增長,從大規(guī)模數(shù)
據(jù)中檢索與定位最重要的目標(biāo)信息具有廣泛且重要的應(yīng)用價值,因而受到學(xué)術(shù)界
和工業(yè)界的大量關(guān)注。物體檢索與定位,是指給定查詢目標(biāo)在某種模態(tài)下的信息,
在大規(guī)模圖像視頻數(shù)據(jù)中集中定位該目標(biāo)的技術(shù)。物體檢索與定位是計算機視覺
技術(shù)最核心的課題之一。然而,由于光照、視角、遮擋等外部因素和物體本身的形
變、類別多樣性等內(nèi)部因素的共同影響,圖像在不同層次上存在復(fù)雜的表象變化。
除此之外,示例、圖像和標(biāo)簽之間的層次關(guān)聯(lián)繁雜多樣,這些都給物體檢索與定位
帶來了很大的困難。
本書從實際應(yīng)用的角度出發(fā),針對示例檢索、標(biāo)簽檢索和物體定位三個相關(guān)問
題進(jìn)行深入研究。以視覺詞袋模型和深度卷積網(wǎng)絡(luò)模型為基礎(chǔ),從模型表示、模型
學(xué)習(xí)和關(guān)聯(lián)匹配幾個方面進(jìn)行擴展和完善。
()針對基于視覺詞組的示例檢索模型進(jìn)行了研究。首先,優(yōu)化了視覺詞組的
1
定義方式,提高了視覺詞組的區(qū)分性。其次,分析了一類容易被忽視的現(xiàn)象,即視
覺詞組的突爆匹配。最后,基于概率模型,提出了一種新穎的貝葉斯池化模型用于
消除突爆匹配,從而優(yōu)化了圖像之間的相似性度量,提高了示例檢索的準(zhǔn)確性。
()針對基于深度卷積網(wǎng)絡(luò)的示例檢索模型進(jìn)行了研究。針對示例檢索的查
2
詢敏感的空間位置關(guān)聯(lián)性問題,提出了一種空間位置對齊的模型框架。更進(jìn)一步,
提出了一種基于排序的深度卷積網(wǎng)絡(luò),用于建模物體的類內(nèi)和類間差異性。為了
訓(xùn)練這個網(wǎng)絡(luò),設(shè)計了一種半監(jiān)督的訓(xùn)練樣本收集策略。該策略不需要任何對查
詢物體的先驗知識,并且極大地減少了人工收集訓(xùn)練樣本所需的成本。實驗結(jié)果
表明,這一方法顯著地提高了深度模型下示例檢索的準(zhǔn)確性。
()針對前背景的模糊性,從特征學(xué)習(xí)的角度,介紹了一種多示例在線學(xué)習(xí)模
3
型解決弱監(jiān)督條件下的圖像標(biāo)注和物體定位問題。首先,在現(xiàn)有的多示例學(xué)習(xí)模
型的基礎(chǔ)上,改進(jìn)了訓(xùn)練樣本的選擇和更新策略。改進(jìn)后的策略能夠收集準(zhǔn)確多
樣的正樣本以及有區(qū)分性的負(fù)樣本,從而提高前背景的區(qū)分性。其次,設(shè)計了一個
端到端的模型,同時進(jìn)行訓(xùn)練樣本的選擇和物體檢測器的訓(xùn)練。最后,通過對示例
標(biāo)注和圖像標(biāo)注進(jìn)行關(guān)聯(lián),從而通過一個模型聯(lián)合學(xué)習(xí)圖像標(biāo)注和物體檢測算法。
實驗結(jié)果表明,這一模型有效地提高了圖像標(biāo)注和物體定位的性能。
·Ⅰ·
()從特征表示的角度對標(biāo)簽檢索和物體定位問題進(jìn)行了研究。具體地,本書
4
介紹了一種基于顯著性的深度特征模型,改善基于矩形框的物體特征表示。顯著
性模型使得矩形框內(nèi)背景區(qū)域的特征響應(yīng)被抑制,而前景中重要的視覺區(qū)域的特
征激活得到增強。這樣的特征表示模型使得前景區(qū)域和背景區(qū)域的類內(nèi)差異變
小,類間差異變大,從而減少了前背景的模糊性。這一顯著性特征模型可以與當(dāng)前
最好的弱監(jiān)督物體檢測模型融合,從而進(jìn)行端到端的聯(lián)合訓(xùn)練。這一方法的可靠
性在多個數(shù)據(jù)集上得到了驗證。
圖展示了本書各章之間的關(guān)系。具體結(jié)構(gòu)安排如下:
1
圖1全書結(jié)構(gòu)示意圖
第章介紹了物體檢索與定位的研究意義、關(guān)鍵技術(shù)、相關(guān)工作進(jìn)展,并介紹
1
全書的創(chuàng)新點和組織結(jié)構(gòu)。
第章和第章針對示例檢索任務(wù)提出了兩種解決方案。其中第章對基于
232
局部特征的檢索模型展開研究,介紹了一種基于視覺詞組的貝葉斯池化的圖像檢
索模型;第章提出了一種位置對齊的深度示例檢索模型。
3
第章和第章針對圖像標(biāo)注和物體定位展開研究。其中第章從特征學(xué)習(xí)
454
的角度提出了一種多示例在線學(xué)習(xí)模型;第章則從特征表示的角度提出了一種
5
特征模型。
第章對全書進(jìn)行總結(jié),并對今后的研究工作進(jìn)行展望。
6
由于著者的學(xué)術(shù)水平和研究深度所限,書中紕漏和不妥之處在所難免,歡迎廣
大讀者批評指正。
姜文暉
年月
20219
·Ⅱ·
第1章大數(shù)據(jù)時代的目標(biāo)檢索及應(yīng)用
11大數(shù)據(jù)時代的大搜索趨勢…………………1
.
12物體搜索:問題與挑戰(zhàn)……2
.
121示例檢索…………3
..
122標(biāo)簽檢索與定位…………………4
..
123關(guān)鍵技術(shù)難題……5
..
13針對物體檢索與定位的研究歷史與現(xiàn)狀…6
.
131基于示例的檢索模型……………7
..
132圖像標(biāo)注…………9
..
133物體檢測…………10
..
14技術(shù)測評…………………11
.
141數(shù)據(jù)集介紹………11
..
142性能評價指標(biāo)……12
..
參考文獻(xiàn)…………13
第2章視覺詞組的貝葉斯池化模型
21詞袋模型…………………21
.
22詞袋模型相關(guān)工作………24
.
221視覺單詞的上下文建模…………24
..
222視覺突爆現(xiàn)象……25
..
223貝葉斯決策理論…………………26
..
23基于視覺詞組的示例檢索模型…………26
.
231視覺詞組的挖掘…………………26
..
232相似性度量………28
..
233相關(guān)工作在框架下的解釋………29
..
·Ⅰ·
24貝葉斯池化模型…………30
.
241突爆匹配與池化………………30
..
242模型的建立………32
..
243參數(shù)估計…………33
..
實驗結(jié)果與分析…………
2.535
實現(xiàn)細(xì)節(jié)…………
2.5.135
參數(shù)影響…………
2.5.237
性能對比…………
2.5.340
可視化分析………
2.5.441
小結(jié)………………
42
參考文獻(xiàn)…………
43
第3章位置對齊的深度示例檢索模型
31示例檢索的研究現(xiàn)狀……45
.
32示例檢索有關(guān)的技術(shù)發(fā)展………………46
.
321深度卷積網(wǎng)絡(luò)……46
..
322基于深度卷積網(wǎng)絡(luò)的示例檢索…47
..
33模型整體結(jié)構(gòu)……………48
.
34似物性采樣………………49
.
35基于排序?qū)W習(xí)的深度特征學(xué)習(xí)模型……50
.
351模型結(jié)構(gòu)…………50
..
352模型訓(xùn)練…………52
..
353特征提取…………53
..
36半監(jiān)督的訓(xùn)練數(shù)據(jù)收集策略……………53
.
37搜索與排序………………55
.
371級聯(lián)量化編碼……55
..
372索引結(jié)構(gòu)…………56
..
373在線查詢…………57
..
38實驗結(jié)果與分析…………57
.
381實現(xiàn)細(xì)節(jié)…………57
..
382性能對比…………57
..
383效率分析…………60
..
·Ⅱ·
目錄
384可視化分析………61
..
小結(jié)………………62
參考文獻(xiàn)…………62
第4章多示例在線學(xué)習(xí)模型
41監(jiān)督信息…………………65
.
42物體檢測的工作…………68
.
421多示例學(xué)習(xí)………68
..
422多標(biāo)簽學(xué)習(xí)……70
..
423基于CNN的弱監(jiān)督物體檢測…70
..
43多示例在線學(xué)習(xí)…………71
.
431概述………………71
..
432特征表示模塊……72
..
433示例分類模塊……73
..
434示例采樣模塊…………………73
..
435迭代精化………74
..
44實驗結(jié)果與分析…………75
.
441實現(xiàn)細(xì)節(jié)………75
..
442關(guān)鍵區(qū)域選擇的重要性………76
..
443與弱監(jiān)督深度檢測網(wǎng)絡(luò)WSDDN的變種進(jìn)行
..
性能對比………79
444與其他模型的性能對比………79
..
小結(jié)………………81
參考文獻(xiàn)…………81
第5章基于顯著性的深度特征表示
51視覺注意機制……………84
.
52視覺注意機制相關(guān)工作…………………85
.
53模型結(jié)構(gòu)…………………86
.
531物體的顯著性模型………………87
..
532顯著性池化………88
..
·Ⅲ·
54實驗結(jié)果與分析…………89
.
541實現(xiàn)細(xì)節(jié)…………89
..
542模型分析………90
..
543與其他方法的性能對比…………91
..
544可視化分析……92
..
小結(jié)………………94
參考文獻(xiàn)…………95
第6章人工智能時代的信息檢索技術(shù)展望
61物體檢索與定位技術(shù)總結(jié)………………98
.
62物體檢索與定位研究展望………………99
.
·Ⅳ·
第1章
大數(shù)據(jù)時代的
目標(biāo)檢索及應(yīng)用
1.1大數(shù)據(jù)時代的大搜索趨勢
隨著行業(yè)信息化建設(shè)移動互聯(lián)網(wǎng)和物聯(lián)網(wǎng)的深度普及以及集成電路和高精
、,
度傳感器的快速發(fā)展信息的存儲與傳播方式正在發(fā)生巨大轉(zhuǎn)變其中包括圖像
,。,
視頻在內(nèi)的可視媒體因具有表現(xiàn)力強信息量大生動具體等特點目前已經(jīng)成為
、、,
用戶獲取信息傳播信息和消費信息的主要對象是消耗網(wǎng)絡(luò)帶寬存儲和計算資
、,、
源的主要數(shù)據(jù)形式一方面公共新聞媒體和社交網(wǎng)絡(luò)都存儲了大量可視媒體
。,。
年某社交網(wǎng)站就已經(jīng)存儲了億張圖像某視頻網(wǎng)站同年宣布平均每分
2015,2500;
鐘上傳的視頻超過官方顯示年平均每天有億張圖片被
400h;Instagram,20160.8
用戶分享另一方面隨著城市規(guī)模不斷擴大和建設(shè)平安城市的需要監(jiān)控攝像機
。,,
也在全球范圍內(nèi)廣泛部署據(jù)統(tǒng)計目前我國已經(jīng)部署了約萬臺視頻監(jiān)控
。,4000
攝像機監(jiān)控視頻數(shù)據(jù)在持續(xù)增長
,。
海量的多媒體數(shù)據(jù)在信息交流智能安防等應(yīng)用中起到越來越重要的作用對
、,
人們?nèi)粘I畹姆椒矫婷娈a(chǎn)生著深遠(yuǎn)的影響然而如此龐大和日益增長的數(shù)據(jù)
。,
并非對每個用戶都具有同等的價值從大規(guī)模多媒體數(shù)據(jù)中檢索和定位最相關(guān)的
。
資源返回給用戶并提供全面準(zhǔn)確的搜索結(jié)果的服務(wù)具有巨大的市場需求據(jù)統(tǒng)
,、。
計百度搜索引擎每天收到的查詢請求達(dá)多億次在這種背景下設(shè)計一套可
,60。,
以智能地分析和理解圖像視頻內(nèi)容的計算機系統(tǒng)使之擁有與人類視覺相當(dāng)?shù)男?/p>
,
息處理能力從而滿足更全面準(zhǔn)確的搜索需求是未來大數(shù)據(jù)背景下大搜索系統(tǒng)
,、,
的重要發(fā)展趨勢
。
物體檢索與定位是指給定某件或某類查詢物體的視覺圖像或標(biāo)簽信息從大
,,
1
··
規(guī)模圖像視頻數(shù)據(jù)集中快速檢索出包含該目標(biāo)的圖片或鏡頭并標(biāo)注目標(biāo)出現(xiàn)的
,
位置早期的圖像檢索系統(tǒng)以元數(shù)據(jù)為核心[1]對圖像的元數(shù)據(jù)或用戶生成的標(biāo)
。,
簽進(jìn)行匹配如使用數(shù)十萬專業(yè)術(shù)語對藝術(shù)建筑和文化方面的多媒體
,GettyAAT、
對象進(jìn)行標(biāo)注和檢索然而由于用戶認(rèn)知差異性的存在標(biāo)簽可能與圖像內(nèi)容存
。,,
在偏差[2]另外人工標(biāo)注元數(shù)據(jù)耗時耗力難以滿足大規(guī)模實際應(yīng)用相比之
。,,。
下基于圖像示例和系統(tǒng)標(biāo)簽的搜索系統(tǒng)在大數(shù)據(jù)背景下顯得更加實用
,。
一幅圖像勝過千言萬語以目標(biāo)的圖像作為查詢依據(jù)可提供豐富的視覺細(xì)節(jié)
,,
信息用于對特定地標(biāo)商品人物進(jìn)行精準(zhǔn)搜索本書稱這一搜索場景為示例檢
,、、。
索示例檢索的典型應(yīng)用是特定商品搜索[3]和行人再辨識[4]
(instancesearch)。。
與此同時依靠計算機視覺技術(shù)由系統(tǒng)自動生成的圖像標(biāo)簽具有準(zhǔn)確規(guī)范全面
,、、
等特點可以代替用戶手動添加的標(biāo)簽提供更準(zhǔn)確的查詢線索通常系統(tǒng)生成的
,,。
標(biāo)簽涵蓋了抽象廣義的查詢信息可以應(yīng)用在以關(guān)聯(lián)匹配知識發(fā)現(xiàn)為目的的搜
、,、
索場景中本書稱這一搜索場景為標(biāo)簽檢索標(biāo)簽檢索的典型
。(tag-basedsearch)。
應(yīng)用是圖像視頻門戶網(wǎng)站的索引這兩種搜索情景雖有區(qū)別但在功能上互補
。,。
查詢的目標(biāo)類別都覆蓋廣泛成為當(dāng)前圖像檢索與定位的主要技術(shù)途徑
,。
物體檢索與定位的關(guān)鍵技術(shù)難題在于對圖像和視頻的內(nèi)容理解并建立查詢
,
與數(shù)據(jù)集的視覺目標(biāo)之間的關(guān)聯(lián)模型然而不同于文本和其他類型數(shù)據(jù)圖像和
。,,
視頻數(shù)據(jù)因其非結(jié)構(gòu)化的數(shù)據(jù)格式復(fù)雜龐大的內(nèi)容和數(shù)據(jù)來源多樣等特點使得
、,
數(shù)據(jù)本身內(nèi)容主觀模糊信息隱藏深差異性大關(guān)系繁雜這對多媒體搜索技術(shù)提
、、、,
出了很大的挑戰(zhàn)
。
本書主要針對圖像數(shù)據(jù)集對示例檢索和標(biāo)簽檢索的幾個關(guān)鍵技術(shù)進(jìn)行深入
,
研究在研究現(xiàn)有國內(nèi)外最新成果的基礎(chǔ)上提出新的模型以改善圖像表示和關(guān)
。,
聯(lián)模型的固有缺陷為多媒體數(shù)據(jù)的準(zhǔn)確查找和智能應(yīng)用提供更好的技術(shù)途徑
,。
1.2物體搜索:問題與挑戰(zhàn)
本書主要研究示例檢索和標(biāo)簽檢索與定位兩類問題本節(jié)將具體介紹這兩類
。
問題并將其中的區(qū)別匯總在表中
,1-1。
表1-1示例檢索和標(biāo)簽檢索與定位的對比
特征示例檢索標(biāo)簽檢索與定位
查詢對象物體物體
查詢模態(tài)圖像標(biāo)簽
查詢內(nèi)容用戶定義系統(tǒng)定義
2
··
第1章大數(shù)據(jù)時代的目標(biāo)檢索及應(yīng)用
續(xù)表
特征示例檢索標(biāo)簽檢索與定位
訓(xùn)練集無有
應(yīng)用場景精準(zhǔn)搜索關(guān)聯(lián)匹配知識發(fā)現(xiàn)
,
1.2.1示例檢索
示例檢索以物體的一張圖片作為查詢在大規(guī)模的圖像數(shù)據(jù)集中定位所有包
,
含該物體的圖像按置信度排序后返回給用戶在典型的應(yīng)用問題中查詢的示例
,。,
種類多樣且均為用戶定義因此沒有可靠的訓(xùn)練樣本提供準(zhǔn)確的查詢示例與數(shù)據(jù)
,
集相關(guān)圖像的關(guān)聯(lián)圖像示例作為輸入提供了較為有效且豐富的信息歧義性小
。,,
因此返回的結(jié)果較有針對性且較為精準(zhǔn)基于示例的精準(zhǔn)檢索與基于內(nèi)容的圖像
。
檢索[5]或近似拷貝檢測
(content-basedimageretrieval,CBIR)(nearduplicate
[6]在形式上比較接近但在功能上有明顯區(qū)別如圖所示在基于內(nèi)
detection),。1-1,
容的圖像檢索和近似復(fù)制檢測中查詢圖像與數(shù)據(jù)集中的相關(guān)圖像存在全局的視
,
覺相似性而在示例檢索中查詢物體只與圖像的部分區(qū)域相似
。,。
示例檢索
(a)
基于內(nèi)容的圖像檢索近似復(fù)制檢測
(b)/
圖1-1示例檢索與基于內(nèi)容的圖像檢索的區(qū)別
3
··
值得注意的是本書研究的示例檢索與傳統(tǒng)的類別檢索[7,8]也有所不同類別
,。
檢索的目標(biāo)是查詢與圖像屬于同一類別的物體示例檢索的目標(biāo)是查詢與圖像完
;
全一樣的物體
。
1.2.2標(biāo)簽檢索與定位
標(biāo)簽檢索與定位問題中查詢以一個或多個標(biāo)簽作為輸入在大規(guī)模的圖像數(shù)
,,
據(jù)集中查找所有包含標(biāo)簽內(nèi)容的圖像用矩形框標(biāo)注出對應(yīng)的物體并按置信度排
,,
序返回給用戶不同于基于示例的搜索場景系統(tǒng)標(biāo)簽種類多樣但類型有限且每
。,,
一個被定義的標(biāo)簽都擁有少量訓(xùn)練圖像利用這些圖像系統(tǒng)訓(xùn)練圖像標(biāo)注算法
。,
對更大規(guī)模的圖像集合自動進(jìn)行結(jié)構(gòu)化標(biāo)注從而方便圖像的管理與檢索標(biāo)簽
,。
檢索的核心在于設(shè)計圖像標(biāo)注算法根據(jù)訓(xùn)練圖像標(biāo)記內(nèi)容的豐富性可以把監(jiān)
。,
督信號分為強和弱兩類如圖所示強監(jiān)督信號是指訓(xùn)練數(shù)據(jù)集中標(biāo)注了每
,1-2。
一個物體出現(xiàn)的位置然而人工標(biāo)注每個示例費時費力數(shù)據(jù)集的作者
。,。ILSVRC
們通過統(tǒng)計發(fā)現(xiàn)標(biāo)注每個示例的位置平均耗時約為[9,10]因此標(biāo)注的困難
,26s。,
使得算法不能方便地擴展到更多的類別中弱監(jiān)督信號則是指訓(xùn)練圖像中只有圖
。
像級的標(biāo)簽表示圖中是否存在該類物體但并未給出物體的數(shù)目和出現(xiàn)的準(zhǔn)確位
,
置弱監(jiān)督假設(shè)將對標(biāo)注的需求大幅弱化對于將標(biāo)簽檢索與定位技術(shù)進(jìn)行大規(guī)
。,
模應(yīng)用具有實際價值因此本書重點研究弱監(jiān)督信號下的標(biāo)簽檢索與定位
。,。
圖1-2強監(jiān)督學(xué)習(xí)與弱監(jiān)督學(xué)習(xí)的區(qū)別
值得注意的是本書研究的標(biāo)簽檢索與定位和傳統(tǒng)的圖像標(biāo)注問題有兩方面
,
不同首先圖像標(biāo)注問題中研究重點在于使每幅圖像返回的前K個標(biāo)簽盡可能
。,,
準(zhǔn)確[11]而在標(biāo)簽檢索問題中研究重點在于使每個標(biāo)簽對應(yīng)的前K幅圖像盡可
。,
4
··
第1章大數(shù)據(jù)時代的目標(biāo)檢索及應(yīng)用
能準(zhǔn)確其次圖像標(biāo)注問題中一個示例可以觸發(fā)多個標(biāo)簽例如由人臉可以同
。,,,
時觸發(fā)表情性別膚色等另外一些標(biāo)簽可能無法定位例如場景節(jié)日而本
、、。,,、。
書研究的標(biāo)簽檢索主要針對物體所研究的標(biāo)簽也是物體的標(biāo)簽進(jìn)而針對物體的
,,
可定位性和類別的唯一性展開研究在不引起歧義的條件下本書中用圖像標(biāo)注
。,
指代本書研究的物體標(biāo)注
。
1.2.3關(guān)鍵技術(shù)難題
在有限的數(shù)據(jù)集中定位目標(biāo)對人類而言非常容易而對計算機而言則非常具
,,
有挑戰(zhàn)這是由圖像語義提取的復(fù)雜性造成的具體來說體現(xiàn)在以下兩方面
。。,:
1.內(nèi)容理解與建模
物體的圖像在不同層次上存在不同程度的差異性不同類的物體之間存在類
。
別表象變化同類別的不同物體之間存在個體表象變化如圖所示建立圖像
,,1-3。
的特征表示模型以同時反映不用程度的差異性一直是計算機視覺領(lǐng)域的基礎(chǔ)性核
心問題
。
不同類別的物體之間類別表象變化示例
(a)
同類別的不同物體之間的個體表象變化示例
(b)
圖1-3物體表象變化示例
圖像信息具有復(fù)雜的語義屬性從人的認(rèn)知角度來看對語義的認(rèn)知既包括
。,
簡單的底層概念又有抽象程度較高的高層概念高層語義概念又包含物體場
,。、
景事件等不同層次和粒度因此人的視覺對語義的分析和理解是不同層次不
、。,、
同粒度語義信息的交互過程反觀計算機視覺的特征模型往往以邊緣顏色紋
。,、、
理等底層特征為基本單元向上構(gòu)建復(fù)雜語義和抽象概念
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 大學(xué)生黨員自我批評(6篇)
- 地理信息行業(yè)安全管理工作總結(jié)計劃
- 總結(jié)與自我提升并行的管理思路計劃
- 公司經(jīng)理職位合同標(biāo)準(zhǔn)文本
- 任命書范文8篇
- 供暖維修合同標(biāo)準(zhǔn)文本
- 2025福州退休人員聘用合同
- 交易轉(zhuǎn)讓合同標(biāo)準(zhǔn)文本
- 重要原則國際物流師試題及答案
- 保密合同標(biāo)準(zhǔn)文本 資料
- 高考語文一輪復(fù)習(xí):散文中重要詞語和句子的含義(公開課獲獎教案優(yōu)質(zhì)公開課獲獎教學(xué)設(shè)計) (高三)
- DB64∕1539-2020 復(fù)合保溫板結(jié)構(gòu)一體化系統(tǒng)應(yīng)用技術(shù)規(guī)程
- DIN1783厚度在0.35mm以上冷軋的鋁及鋁塑性合金帶材和板材、尺寸
- 橋門式起重機司機培訓(xùn)教材課件
- Model5000功率計(介紹及操作)
- 現(xiàn)場總線技術(shù)03 PROFIBUS總線
- 義務(wù)教育(英語)新課程標(biāo)準(zhǔn)(2022年修訂版)
- 混合痔病歷模板
- “馮茹爾”杯2022年江蘇省“化學(xué)與可持續(xù)發(fā)展”化學(xué)活動周高中化學(xué)競賽試題
- 員工食堂5月份菜譜
- 中國、俄羅斯、歐美電子管型號代換
評論
0/150
提交評論