計算機視覺課件chapter第二章Marr的理論_第1頁
計算機視覺課件chapter第二章Marr的理論_第2頁
計算機視覺課件chapter第二章Marr的理論_第3頁
計算機視覺課件chapter第二章Marr的理論_第4頁
計算機視覺課件chapter第二章Marr的理論_第5頁
已閱讀5頁,還剩23頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

Marr過零點的尺度理論(scalingtheoremsforzero-完全的初始簡圖(fullprimal2.52.5Marr木世界理解就是根據(jù)線畫圖來理解由多面體構成的景物這方面的研究開始于Roberts[Rob65],[Wa72][Huf77]。但要從實際景物或獲得線畫圖不可避免地要通過低層視覺信息處理。當時 另一方面,自60年代以來對人類視覺的研究也已取得了一的成果。Hubel和Wiesl[Hub,Wie62,68]關于大腦視皮層細腦感受野的論述,以及Campell和Robesn[Cam68]關于視覺對人類視覺的研究迫切地需要理論的指導。麻省理工學院(MIT)人工智能的西方的思維科學來源于邏輯和計算理論,根據(jù)這個理論,NewellSimon[new81]提出了的一系列概念加深了我們對智力本質的認識。Marr視覺計算理論與此是一脈相Marr的視覺計算理論是首次闡述視覺機理的系統(tǒng)理論,并且對人類視覺和計算理解。Marr正是由于不能正確地區(qū)分這三個層次中涉及的不同的研究問題阻礙了人工Fourier分析理論,F(xiàn)ourierFourier變換是屬于第一層的理論。而計算FourierFourierFourier算,如前所述,Marr認為視覺是一個信息處理任務。Marr同時又視覺和處理并不完全表象描述一個給定的實體所得到的結果稱為該實體在這種表象下的一個描述。例如數(shù)制二進制數(shù)制它們都是表“數(shù)的形式化系統(tǒng)數(shù)字表象由數(shù)(0,1,2,…,8,9),1001012的冪所Marr的設想,從圖象推得形狀信息的過程分成三個表象階段:初始簡圖(primalsketch)、2.5維簡圖(2.5dimensionalsketch)和三維模型(3Dmodel)。景物的照明情況;(4)觀察點的方位;在圖象中所有這些因素是混雜在一起的。某些灰度變始簡圖和2.5型表象。這個視覺系統(tǒng)的表象層次總結成圖2.1。在第2.2節(jié)到第2.4節(jié)中對這個表象圖圖初始簡2.5維簡三維模圖 初始簡圖(primal這被稱為完全的初始簡圖。圖2.2中所示為亮度圖象、未處理的初始簡圖和在產(chǎn)生完全的初 圖 初始簡圖(AI.App.p.212.fig8-未處理的初始簡圖(rawprimal較大的算子檢測平緩的亮度

較小的算子檢測急劇的亮度-

+1-

2.32.4(a上出現(xiàn)一個峰點(b),而在二階微分的圖形上相應地出現(xiàn)一個過零點c)。通過確定亮度二階 圖2.4 第一步從圖象建立平均亮度陣列。用局部的亮度平均來減少噪聲的影響。Iii點的圖象亮度,Aii點周圍的亮度的局部平均值:AIi1IiIi Ai+1-Ai和左鄰Ai-Ai-1相平均。這相當于把Ai+1Ai-1相平均。Fi是平均亮度的平均一次差分:Ai1AiAiAi1 Fi

i i 圖2.5 (a)理想邊緣的亮度分布;(b)對(a)進行平均運算的結果;(c)對(b)進行平均差分的結果;(d)對(c)進行平均差分的結果。Fi1FiFiFi1 Si

i i (2.5(d))。這個S點Oi的影響與兩點之間相隔距離關系如下述所示:oiPjiIj2.6(b)2.6(c)所示的點擴散函數(shù)圖2.6 CampbellRobson[cam68]的研究表明人類視覺信率方差(Constraintofspatiallocalization)景物中可引起圖象中亮度變化的因素為:(1)照明變化;(2)可見表面的方向和相對觀察者的距離變化;(3)表面反射率變化。重要的是這些因素可被認為是以它們各自的尺度在空間濾波器應有小的空間方差x。44Gaussian1Gx1/22expx21

22其中Gaussian函數(shù)的方差

x2Gr22 22,x2G*I(x,y)。f(x,y)=D2[G(r)*I(x,f(x,y)=D2G*I(x,D2GI(x,y)G(r)I(x,y)卷積后進行二階微分的結果完全相同。D2G形狀看起來很象墨西哥草帽(2.7),因此有時被稱為草帽形算子。D2G算子作卷積,用各向同性的算子。唯一與方向無關的二階微分算子是Lacian算子2。Marr[Mar80]證明可簡便地在某一尺度下通過搜索2GIx,y2G112exp2

2

22

x

y

x2y2,w4/ 負向區(qū)域的寬度2D等2D2這個濾波器的大小由的數(shù)值或等價地由2D的數(shù)值來確定。為了不使函數(shù)被過分地截短,它應在足夠大的窗口內(nèi)作計算,窗口寬度通常取為d3.62D

2G算子的橫圖2.8中所示為2G算子與其它兩種不是最優(yōu)的算子的對比。因為我們是根據(jù)在頻率Gaussian濾波器的,而在所示的例子中這兩條要2.82G2G圖2.92G濾波器與二階微分(以近似)濾波器特性比中次序與圖2.8(a)中相同;(b)中上方所示為以近似的二階微分濾波器及其的2G2G現(xiàn)這樣的理論呢?現(xiàn)已發(fā)現(xiàn)2GDOG(DifferenceofGaussian)函數(shù)來近子很接近。圖象中的不同尺度的亮度變化需要有一組這種類型的DOG圖 GaussianGaussian算子濾波,后求導所得Marr的亮度變化檢測理論的生理實驗依Marr所方法與在靈長目動物身上進行的神經(jīng)生理學實驗結果很好地符合,并且2.11所示。讓實驗動物觀察各種正在移過白色背景的試驗圖案,試驗2.12所示為比較的結果。2.12(a)2.12(b)表示以合適的草帽形算子2.12(c)X神經(jīng)節(jié)細胞上取得的實驗XXX2.12(c)所示實際上是正的和負的細胞的激發(fā)率之差。圖2.12(b)和圖2.12(c)比較的結果表明二者驚GaussianGaussian函數(shù)之差來精確地近似。如果把寬的負向GaussianGaussian算子卷積結果稍加延遲,那么對試驗圖案的反應就如果圖2.12(d)所示。這些新的曲線與靈長目動物的實驗結果之間的相似程度大二維Gaussian算子作卷積所得圖象之差。周圍的抑制作用對于的激發(fā)作用要稍為延遲Marr對人類視覺系統(tǒng)中初級處理所理論。然而,作為一種通用的邊緣檢測理論來說,雖然圖 )從被試驗的猴子取得記錄;(d)加進延遲修正的預計反應。Marr(spatialcoincidenceassumption):如果過零點邊緣段出現(xiàn)在一組毗鄰的獨立2G通道中,并且這些邊緣段在每個通道中的方圖 孤立邊緣在不同的2G通道中產(chǎn)生的過零2.13所示為孤立的邊緣在不同的通道中產(chǎn)生的過零點。這些過零點在空間上是一致未處理的初始簡圖(2.14)就是由這些基本符號構成的。圖 不同通道信息的合并(Marr&Hildrechp.204Fig圖2.4ab)=9和18的2G算子(=2)處理并的描述中邊緣就與()中所示一樣。()、)和()中所示為()中標注的位置處的符號描述:(c)(d)()(斑點(位置14621)(邊(位置10423)(線(位置118(方位)(方位 (方位)()(- (-)(長度)(長度 (長度)(寬度 (寬度)過零點的尺度理論(ScalingTheoremsforZero同尺度時的變化可得到關于基本物理過程本質的寶貴信息。例如,如果用不同尺度的2G下的描述可以得到許多有用信息。為檢測在不同尺度下的亮度變化,Marr小的2G算子作卷積,并提出用某些啟發(fā)式規(guī)則來合并從不同通道得到的信息。以后Terzopoulos[Terz82]又成功地把多級算法應用于重構視覺表面的問題,但如何把初級視覺處理最近x是過零點的空間位置。Gaussian濾波器的方差。Witkin通過分重要特性的濾波器,YuillePoggio[Yui86]又把上述結論推廣到二維。2.2.2完全的初始簡圖(fullprimal(邊(對比度43(方位(方(模糊度56賦以特性和被,或作為以后處理的輸入。運算遵循最小允諾原則(leastcommitment):因為出錯要付出很大代價,所以不要(relaxationprocess)[DavMarr把運算和紋理區(qū)別過程的最終結果稱為完全的初始簡圖。這種表象完全和明Marr理論的一個重要特點是完全初始簡圖的計算不需要知道某種物體是否出現(xiàn)在圖象中。Marr在這個階段所用的方法是力圖描述圖象的屬性,而不需要對景物中有什么物體作2.15中所示為完全初始簡圖的實例。圖中的圖 過2.5維簡2.14中的二維數(shù)據(jù)獲得外部世界在以物體為中心的坐標數(shù)據(jù)在作分割時遇到的來說明這個問題。嗎?頭是物體嗎?如果頭與物體連在一起是否還認為是一個物體?那么在馬背上的人又怎的數(shù)據(jù)按相似性其他純覺的線用方獲得所希的區(qū)域因為物體識2.5維簡圖的概念。現(xiàn)在的問題是如何建立景物信息信息類視差,因而可得到,光可能有影s和在表中: 的連續(xù)或小的的不連續(xù) ss的連續(xù)或小的變 s圖 為解決如何用合適的表象來表達與表面有關的信息,Marr作了以下觀察和分析。當我這是不對的。根據(jù)上述些觀察,Marr對表面表象的性質作出以下推測:度描述。這個全局的深度描述與由上述信息所提供的局部描述相協(xié)調。Marr把這樣的表象2.5維簡圖。2.17中未標出。這樣的表象與觀察者的視角有關。因此,它是在以觀察者為中心的坐總之,2.5維簡圖完全而明確地表達了初級視覺處理從圖象中獲得的各種信息。因此,可以認為初級視覺處理的主要目的就是構造這種表象。2.5維簡圖只涉及圖象中表面的各種特性,這就從根本上避免了定義“物體”、“背景”這些圖象分割方法中固有的。2.5維簡圖還有不少問題未被很好理解和解決(詳見[Marr82])。此外,對于這個介Marr2.5維簡圖在某些方圖 2.5維簡圖(visualinformtion,D.MarrP53.Fig.)2.5三維模Marr視覺計算理論的最后部分是建立適用于視覺識別的三維形狀表象。識別是指把以是把它與人腦中的物體表象相匹配。匹配成功則完成了識別。2.5維簡圖采用以觀察者認為第二種更為合適。圖2.18所示為由三維模型分級組合構成的三維形狀表象。圖中圖 2.20中所示的動物圖形,表示動物體每的大箱子等等但是應該有些表面例如一團揉皺的報紙是無法用廣義錐來近的。圖 圖 按照這種自底向上的組織,2.5維簡圖的計算只需要初始簡圖中的信息,而不需要直接從圖另一種可能是,在初始簡圖和2.5維簡圖中的各種計算是靠混雜的約束來進行的。還有一種可能是信息自頂向動,對圖象的理解在很大程度上取決于有控制的想象。[陳86]Marr的之中,而這樣的條件在自然界,或在實際情況下通常是不滿足的。因此,不少學者[Kan87]對Marr主張的這種不考慮視覺中的選擇性和整體性,完全是自底向上,數(shù)據(jù)驅動以逐點計算Marr2.5維此外,Marr的視覺信息處理方法遇到的另一個嚴重就是以逐點計算方式進行處理為了克服上述,學者們對Marr的視覺計算理論進行了修正,主要的趨勢有以下兩Marr此,問題是找到一組通用的組件[Pen86]。在構成這樣的組件模型時要解決的關鍵問題是第二種趨勢是提出了視覺的連接主義模型(ConnectionistModelsofVision)[Fel8385][Bal86]Marr理論中采用點狀表象帶來的復雜性,提出了具有高度并行性描述。并且Hough變換從本質上說就是可并行實現(xiàn)的。動視覺中的研究方向可參閱[Swa91]。[Bab83]Babaud,J.,Wintkin,A.andDuda,R.,UniquenessoftheGaussiankernalforscale-spacefiltering,FairchildTech.Rep.645,Flair22,1983.[Bar78]Barrow,H.G.AndTenenbaum,J.M.,Recoveringscenecharacteristicsfromimages,A.R.HansonandE.M.Riseman(Eds),ComputerVisionSystems,NewYork,AcademicPress,3-[Bar81]Barrow,H.G.andTenenbaum,J.M.,ComputationalVision,ProceedingsofIEEE,Vol.69,no.5,1981.[Bin81]Binford,T.O.Inferringsurfacesfromimages,SpicialIssueonVision,ArtificilaInligence17,205-244,1981.[Bra65]Bracewell,R.,TheFouriertransformanditsapplications,NewYork,MacGraw-Hill,1965.[Cam68]Campbell,F.W.C.andRobson,J.,ApplicationofFourierysistothevisibilityofgratings,J.Physiol.(Land)197,551-566,1968.[Fel83]Feldman,J.A.AndBallard,D.H.,Computingwithconnections,InJ.Beck,B.HoopeA.Rosenfeld(Eds.),HumanandMachineVision,AcademicPress,[Fel85]Feldman,J.A.,Fourframessuffice:AProvisionalmodelofvisionandspace,andBrainSciences8,1985,265-[Har84]Haraick,M.,Digitaledgesfromzerocrossingofseconddirectionalderivative,IEEETrans. .Mach.In l.,PAMI-6,1984,58-68.[Hoc81]Hochberg,J.,Levelsofperceptualorganization,InM.KubovyandJ.R.Pomerantz(Eds.),PereptualOrganization,255,1981.[Hub,Wie62]Hubel,D.H.andWiesel,T.N.,Receptivefields,Binocularin ctionandfunctionalarchitecture,InCat'svisualcortex,J.Physiol.(Land),166,106-154,1962.[Hub68]Hubel,O.H.AndWiesel,T.N.,Receptivefieldsandfunctionalarchitectureofmonkeystriatecortex,J.Physiol.(Land)195,215-243,1968.[Huf77]Huffman,D.A.,Relizableconfigurationsoflinesinituresofpolyhedre,InE.W.ElcockandD.Mikhail(Eds),MachneIn ligence8,EdiburghUniversityPress,493-509,1977.[Kan87]K ,L.AndTsao,T.,ArtificialIn ligenceandnaturalperception,InIn AutonomousSystems,60-70,1987.[Mar80]Marr,D.AndHildreth,E.,Theoryofedgedetection,Proc.R.Soc.LandB207,187-[Mar82]Marr,D.,Vision,W. manand,[May81]Mayhew,J.E.W.andFrisby,J.P.,Psychophysicalandcomputationalstudiestowardsatheoryofhumanstereopisis,ArtificialIn ligence17,347-386,1981.[New72]Newell,A.AndSimon,H.A.,Humanproblemsolving,Englewood,Cliffs,N.J.,Prentice-[Pen86]Pentlad,A.P.,Partmodels,InProc.ofInt.Conf.PatternRecognitionandComputerVision,MiamiBeach,Florida,June22-26,1986,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論