版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、第05講視覺感知導(dǎo)語在人類心智的機(jī)器模似研究中,恐怕沒有那個方面 像在視覺上那樣取得如此巨人的實(shí)際應(yīng)用性成功了。不 僅如此,視覺感知能力是人類獲取環(huán)境信息的主要渠道, 在人類感知外部世界中起者舉足輕重的作用。因此,作 為對人類心智模擬的首要方面,也作為機(jī)器感知的典型 代農(nóng),我們就從機(jī)器視覺方面來還是我們智能科學(xué)研究 的講述。為此,首先還是讓我們具體先來看一看人類豐 富的視覺現(xiàn)彖吧!第5.1節(jié)視覺機(jī)制在漫長的進(jìn)化歷程中,我們發(fā)展了粘:妙的視覺系統(tǒng), 使得我們的視覺能力適應(yīng)在復(fù)雜環(huán)境小獲取有益于更 好生存的視覺信息。因此,對于視覺而言,捕捉環(huán)境變 化中的意義是第一位的,而沒冇意義的視覺信息是可以
2、被忽略的,事實(shí)上也確實(shí)被忽略了。英國心理學(xué)家 gregrory在teyesand brains一-書中指出:“感官接受 的是牛動的圖案,但是我們很少看圖案,我們看的是事 物。相對來說,圖案是無意義的標(biāo)記的組合,而事物除 了具有感官特征以外,還有許多其它特征?!睂τ谌祟愐曈X系統(tǒng)這種關(guān)注事物意義何忽略無意 義的視覺信息的功能,幾乎發(fā)展到了無以復(fù)加的地步。 美國心理學(xué)家卡洛琳布魯墨在視覺原理一書的開 頭就強(qiáng)調(diào)指出:“人的頭腦從外來的刺激中“毫無節(jié)制” 地產(chǎn)生著含意。這是一個事實(shí),你所無法逃脫的過程, 不管你愿意或不愿意都在發(fā)生著的活動。你的頭腦不斷 賦了外界事物以含意一一以致有時候這些含意木不存 在
3、,完全是你的幻想創(chuàng)造出來的。”讀者或許在生活中早有這樣的經(jīng)驗(yàn):從天上的飄云中看 出各種你所熟悉的造形;在斑駁的墻上看到了人物肖像、 各種動作各異的動物形體;其至還會為h然界形成的奇 石怪峰,牽強(qiáng)附會地來冠以石猴、石龜、二郎探母等名 號,等等。無 11生有的視覺示例 不僅如此,對于一幅視覺圖案,含義的理解還存在 著畫而意義和畫外z音的區(qū)分。例如就以右圖而言,光 憑圖案木身的識別并不能得出其所要發(fā)生的一切內(nèi)容, 只冇根據(jù)知識和經(jīng)驗(yàn)并加以推斷,才能獲得更全面的意 義領(lǐng)會,其中包括那只盧鳥鶴隨時將會捕捉水中小魚的預(yù) 期意義。有時,視覺圖案的意義往往存在多重選擇性,對其 含義的確切把握不僅依賴于主觀心理
4、定勢,而也依賴 丁圖案本身所提供視覺刺激的微小變化。例如對于圖右, 你可以看作是一位標(biāo)致的年輕女子微微轉(zhuǎn)過臉去的側(cè) 身像,乂可以看作是一位老婦人的側(cè)身像。-條覓食的鬣狗但如果給圖案稍稍改變;那么你就不再會有這種二 難選擇的困難了,參下面的兔鴨圖(b)。此時圖(a) 只能被理解為鴨了而圖(c)也只能被理解為兔了。說明這種“無中生意”的極好例子是“他在長椅上的男人”幻像。如圖所示,除了 一些在黑背景中的口斑塊外, 原本什么也沒有畫,但您卻能從這幅圖屮看出意義來: -位坐在長椅上的男人形彖。其實(shí)這也不是什么新鮮事,當(dāng)然,對于有多種理解的情形,有吋主觀意向或意 念也會起到重要作用。只有當(dāng)一個意念,在一
5、定的環(huán)境 因素觸動之下,被動的圖案及其環(huán)境與其發(fā)生關(guān)系時, 才會突現(xiàn)出來,成為授終理解的結(jié)果含義。遺憾的是,我們對人類的這種視覺理解的發(fā)牛機(jī)制 的規(guī)律還知z不多,但有一點(diǎn)可以肯定的,這其中包含 了非線性突變的因素,即微小的擾動町以引起完全不同 的理解結(jié)果。這種現(xiàn)象我們也稱之為蝴蝶效應(yīng),指的是 對初始條件的敏感依賴性,是不可預(yù)測性的。所謂“差之 毫厘,失之千里”指的就是這種效應(yīng)。西方有一首民謠唱 到:釘了缺,蹄鐵卸;蹄鐵卸,戰(zhàn)馬蹶; 戰(zhàn)馬蹶,騎士絕;騎士絕,戰(zhàn)事折; 戰(zhàn)事折,國家滅。形象生動地講的也就是這個道理。圖案多重理解的困難還不僅于此,有時對于歧義圖 案的多重選擇也存在歧義。也就是說不是所
6、有的歧義圖 案都具有確定的幾種含義對供選擇,有時連有幾種意義 木身也是含糊不清的。下一頁給出了三種不同類型的歧 義圖案,其中(a)圖屬于“含糊不清”型歧義圖,你無 法知道應(yīng)該將此圖案理解為幾個人臉;(b)圖則屬于 “多重選擇”型歧義圖,其具冇二個相互獨(dú)立的并是排 他性的含義,主觀理解了其一種含義就不會產(chǎn)生第二種 含義;(c )圖屬于“一圖雙關(guān)”型歧義圖,就象一語雙 關(guān)的句子一樣,其同時給出了二個以上含義。于此可見, 歧義圖案的理解問題遠(yuǎn)遠(yuǎn)要比我們想象的還要復(fù)雜,而 這一切又不過只是我們?nèi)恳曈X思維機(jī)制的一部分。la 冇多少張人臉?b人號演奏家還是美女c既是箭頭又是小人在視覺圖案的理解把握中,除
7、了對意義本身理解困 難外,在視覺思維中還有一個機(jī)器所要面臨的更大困難, 那就是機(jī)辭如何能象人類那樣具備觀看圖案的意圖。很 明顯,圖案隱含著一定的含義這是意義把握問題;而觀 察者愿意不愿意以及基于什么樣的目的去理解圖案則 是觀察者的意圖問題,這種觀察意圖直接影響了對圖案 的理解結(jié)果。7/4/rar有時即使遇到像右圖那樣具有不可整合的認(rèn)知圖 例,在無法完成冇意義形彖的感知時,我們的視覺系統(tǒng) 也不會一味地死心眼陷于困境而不能口拔,而是會產(chǎn)生 一個新的意圖跳出任務(wù),t脆不再去作無謂的觀看了。在人類視覺認(rèn)知活動小,對圖案觀察的深度和詳細(xì) 程度往往是依賴于所要完成的任務(wù)的,一目任務(wù)完成, 觀看者就不再會去
8、費(fèi)思耗神作額外的分析理解去把握 不必耍的意義。對于給定視覺認(rèn)知任務(wù),你會發(fā)現(xiàn),當(dāng) 觀看者完成任務(wù)后(正確報(bào)告了要求回答的結(jié)果),對 圖形本少的形狀和布局依然知z其少,這說明一口達(dá)到 了目的,觀察者是不會再作任何進(jìn)一步的觀看理解的。歸納起來,人類視覺機(jī)制涉及整體知覺、主觀意念, 多重選擇和意圖行為等問題。就感知層面何言,即使不 考慮主觀意念,多重選擇和意圖行為等這些髙級思維層 次的認(rèn)知機(jī)制,其中的整體知覺也是不可回避的核心機(jī) 制。那么,人類視覺又是如何實(shí)現(xiàn)這種整體知覺機(jī)制的 呢?機(jī)器視覺從中又能獲得哪些啟示呢?下面,我們就 圍繞著視覺整體知覺能力,來展開分析。"貓頭膵簡筆應(yīng)的確,就我們
9、的視覺系統(tǒng)而言,對視覺對彖的識認(rèn)請觀看右圖,我想人們總是將其看作為一個貓頭鷹 而不是有字母、線條、圓點(diǎn)部分構(gòu)成的拼圖,這就是整 體知覺效果的結(jié)果。也就是說,人們在把握視覺刺激時, 并不是以自下而上逐個分析來獲得生動的形彖的,而是 同時將整幅圖案進(jìn)行整合感知為有意義的形彖。我們具 有整體知覺能力。并不是通過部分分析,|何是通過全局整體性特征的把握 得以完成。對這一認(rèn)識,苦名的瑞士心理學(xué)家皮亞杰看 得更為深刻,他在結(jié)構(gòu)主義一書中指出:“在任何既 定情境里,i種因素的木質(zhì)就其木身而言是沒啟意義的, 它的意義事實(shí)上由它和既定情境中的其他因素z間的 關(guān)系所決定??倆,任何實(shí)體或經(jīng)驗(yàn)的完整意義除非它 被結(jié)
10、合到結(jié)構(gòu)屮去,否則便不能被人們感覺到?!逼鋵?shí),早在20世紀(jì)初,發(fā)韌于徳國而成熟于美國的 格式塔心理學(xué)派就對這種整體知覺及其規(guī)律有過金面 的論述。格式塔理論認(rèn)為,形式知覺產(chǎn)生于該形式部分 之間的關(guān)系屮,而部分特性就人們所能確定的內(nèi)容來說, 依賴于它們所處整體的全部關(guān)系,部分只有在整體中起 作用,離開了整體的部分是沒有意義的?;谶@樣的認(rèn) 識,格式塔心理學(xué)派將反映這種整體知覺的規(guī)律歸納為 一些普遍性規(guī)則,稱為知覺組織律。首先,格式塔理論認(rèn)為,在整體知覺中,人們的視 覺所作出的最基本的區(qū)分乃是圖形與背景之間的區(qū)分, 圖形在背景中顯現(xiàn)出來反映的正是整體性知覺機(jī)制。很 明顯,圖形傾向于輪廓更加鮮明、更好
11、定位、更加緊密 和完整,一句話更貝-有整體統(tǒng)一性;反之,背景就顯得 不那么整齊規(guī)范,沒有什么結(jié)構(gòu)可言。不過,有時圖形與背景會相互交替,你可以將圖形 當(dāng)作背景,而將背景當(dāng)作圖形,這就是在町以互為形基 關(guān)系圖例屮取得的效果。具至有時你很難正確區(qū)分出圖 形與背景,但這并不影響總是存在圖形與背景關(guān)系這一總的原則。除了形基規(guī)律外,整體知覺的組織規(guī)律還其他一些 規(guī)律,分別是:a.接近律:也就是說,我們的視覺易于根據(jù)部分彼此z間的鄰近或接近關(guān)系血組合起來并因此血得出整體 形象。b.相似律:指具有某種特征(形狀、顏色、朝向、動 向等)相似的項(xiàng)日,只要不被接近因素掩蓋,則傾向于 聯(lián)合在一起。c連續(xù)律:如果一套點(diǎn)
12、子中有些點(diǎn)子顯得連續(xù)或完成 一個有規(guī)律的系列、或者擴(kuò)展成一條簡單的曲線,這套 點(diǎn)子往往易于組織起來。a b cd e f p h i i k 1 m n 16接近律o°o c o 2 o o o °o° °連續(xù)律簡單律_o o o c c o封閉律相似律d. 封閉律:有時,各種視覺組織律會在知覺過程中產(chǎn) 生競爭英至沖突現(xiàn)象,此時最終知覺的結(jié)果形象往往取 決于哪種因素更為重要了,其中封閉的圖案往往冇較大 的優(yōu)勢。e. 簡單律:最后,整體知覺的一般規(guī)律還告訴我們, 在其它因素相同時,人們將把視覺對象看成有組織的簡 單規(guī)則圖形,就是說,看作是傾向于對稱、整齊、
13、勻稱、 慣常的圖形,這就是知覺的簡單律。實(shí)際上,視覺過程中,整體知覺就是把部分整合為 個與以往經(jīng)驗(yàn)相關(guān)聯(lián)的完整形象,而簡單律就意味著 這一過程遵循著經(jīng)濟(jì)原則,得出一個最簡單可能的形象 去與刺激模式相匹配。從這個意義上講,整體知覺一方 面體現(xiàn)了部分只冇在整體中才冇意義這一原則;另一方 面也體現(xiàn)了經(jīng)驗(yàn)形成的完形在知覺中的作用是以經(jīng)濟(jì) 原則為基礎(chǔ)的。rvarx mrtnh cf pupil «nd irw*«tl hred rye人類的視覺系統(tǒng)現(xiàn)代認(rèn)知神經(jīng)科學(xué)研究己經(jīng)告訴我們,我們這種復(fù) 雜的整體知覺能力完全是人腦視覺皮層屮許多離散分 布的特異化神經(jīng)組織功能活動的產(chǎn)物。那么人類的
14、視覺 系統(tǒng)又是如何如此復(fù)雜的視覺功能的呢?讓我們走進(jìn) 人類的視覺神經(jīng)系統(tǒng)之中,一探究竟。在人類視覺系統(tǒng)中,笫一個起到收集視覺刺激信息 的器官是眼晴。如圖所示,眼睛是一種粘:巧萬分的球狀 器官,光線由外射入可以在眼睛的底部內(nèi)側(cè)形成一個倒 立的像,這一點(diǎn)很象我們生活屮使用的照相機(jī);所不同 的是,照相機(jī)的底片是由被動感光材料構(gòu)成的膠片,而 眼睛的“底片”則是大腦神經(jīng)外圍組織的神經(jīng)細(xì)胞群構(gòu) 成的視網(wǎng)脫,并具有主動跟蹤獲取和能動解釋信息的能 力。眼睛中的晶狀體是一種町調(diào)節(jié)焦距的透明物質(zhì),而 通過頭/眼運(yùn)動系統(tǒng),則町以完成主動跟蹤被視物體; 另外視網(wǎng)膜中神經(jīng)細(xì)胞的口主活動與相互作用乂為能動解釋視覺信息提供
15、了可能。視網(wǎng)膜,復(fù)蓋在眼睛底部 的網(wǎng)狀薄膜,是由多層神經(jīng)細(xì)胞相互交錯連接而成的, 如圖所示。最底層的那層細(xì)胞稱為感光細(xì)胞,其上附著 一定的色素,不勻均地分布在中央凹的周圍。整個視網(wǎng)脫上,約有1億個感光細(xì)胞,它們?nèi)梭w可 以分為桿體細(xì)胞和錐體細(xì)胞二類。桿體細(xì)胞主要對光的 明暗性敏感,因此在夜間起著主要作用。錐體細(xì)胞啟三 種,分別對紅、綠和藍(lán)三種波長的光起反應(yīng),而三種錐 體細(xì)胞的混合反應(yīng)便町對白天的色彩知覺起作用。變?yōu)樗腿氪竽X的某種電脈沖編碼組合模式,其代表的就 是從外界觀察到的景物。然后,乂經(jīng)過了十分復(fù)雜行進(jìn) 路線,到達(dá)視覺皮層。因此,不管外界的刺激是源h二 維的圖畫還是三維的景物,從視網(wǎng)膜到人腦
16、都冇一個相 同的將二維形狀解釋為三維形體的過程。dotmiqwwu*ventrei視網(wǎng)膜結(jié)構(gòu)人類視覺通路示意圖在人類的觀察活動屮,眼睛的作用實(shí)際上就是將外 來刺激的光照信號,經(jīng)過視網(wǎng)膜中神經(jīng)細(xì)胞的加工后,v2(tempomu視覺加工的雙通路結(jié)構(gòu)總z,在視覺通路中,各層次神經(jīng)細(xì)胞普遍是以相 互作用的方式進(jìn)行通信的,以給出什么與哪里的視覺任 務(wù)??倆,整個視覺通路中的神經(jīng)聯(lián)接和排列方式,決 定了具有引起神經(jīng)細(xì)胞活動方式的視覺刺激或辯認(rèn)。而 且,進(jìn)一步,這種聯(lián)接和排列方式乂是最人限度地體現(xiàn) 了視覺通路屮不同階段視野區(qū)域的拓?fù)鋵?yīng)性、反映了 對相對強(qiáng)度信息的最佳敏感性以及突出了所冇層次神 經(jīng)細(xì)胞(群)
17、對視覺信息特征把握的特界性。第5.2節(jié)視覺計(jì)算我們己經(jīng)對人類視覺工作的基本原理有了初步了 解。那么,目前我們的機(jī)器是如何進(jìn)行視覺計(jì)算工作的 呢?相對于人類精妙無比的視覺機(jī)制,機(jī)器視覺還處于 十分初步的研究階段。所謂視覺計(jì)算,就是人工智能研 究用以解決機(jī)辭視覺感知問題的。具體地講,就是采用 攝象機(jī)和機(jī)器來部分代替人類視覺系統(tǒng)來進(jìn)行視覺感 知。冇關(guān)視覺計(jì)算理論、方法與技術(shù)的研究工作,自實(shí)際上,情況比這述耍復(fù)朵,上述視覺加工過程給 出的只是視覺通路的主要上行部分;而另外一小部分視 束則走向內(nèi)方,經(jīng)上丘骨到達(dá)上丘和頂蓋前區(qū),然后再 投射到丘腦枕,換元麻投射到視皮層。其主要功能雖非 直接與知覺感受有關(guān),
18、但対調(diào)節(jié)瞳孔、控制眼動等方血 起著重耍作用,為主動視覺的實(shí)現(xiàn)提供了不可替代的手 段。另外,所有的視覺通路的投射活動也并非只是單向 上行傳遞的,在各個不同通路階段,其實(shí)普遍存在著同 時的下行制約投射和并行制約投射。1965年肇始以來,已經(jīng)有將近50年的時間了。主要任務(wù) 就是要對采集到的圖像或視頻進(jìn)行分析處理,來實(shí)現(xiàn)圖 像或視頻屮(運(yùn)動)景物把握或含義理解。顯然,這樣 的研究有著十分廣闊的應(yīng)用前景,比如醫(yī)學(xué)圖像分析、 工業(yè)產(chǎn)品檢驗(yàn)、衛(wèi)星遙感圖像分析、軍事空中偵察等等。 當(dāng)然,開展視覺計(jì)算的研究工作,也會涉及到眾多的相 關(guān)學(xué)科。按照研究對象與目標(biāo)的不同,視覺計(jì)算有可以分為 圖像處理、模式識別、圖像理
19、解、景物分析、口標(biāo)檢測 與跟蹤等不同的方面。如果按照視覺計(jì)算的不同階段來 劃分,由淺入深,分別需要經(jīng)過如下不同的處理步驟:(1)圖像獲?。和ㄟ^某種視覺圖像采集設(shè)備,比如照 相機(jī)、攝象機(jī)、遙感儀、x光斷層掃描儀、雷達(dá)、超聲 波接受器、紅外感應(yīng)器等等,可以獲取二維圖像、三維 圖像、甚至圖像序列。(2)預(yù)處理:對于獲取的圖像,進(jìn)行各種濾波或矯疋 處理,使得獲取的圖像質(zhì)量更好、效果更佳。(3)特征提取:根據(jù)研究目標(biāo)的不同,獲取描述圖像 的各種基木要素,比如邊緣與線條、區(qū)域與紋理、深度 與運(yùn)動信息等,屬于低層信息處理階段。(4)區(qū)域分割:對獲取的特征集合進(jìn)行初步的整合處 理,將圖像分割為各個有機(jī)組成部分
20、,屬于中層信息處 理階段。(5)高級處理:或進(jìn)行圖像分類、或理解圖像含義、 或進(jìn)行景物分析或識別視覺冃標(biāo)、或跟蹤視覺冃標(biāo),都 需要有不同的高級計(jì)算處理,屬于高層信息處理階段。根據(jù)馬爾的觀點(diǎn),視覺感知首先是一個信息處理過 程,是要從圖像中發(fā)現(xiàn)外部世界中有什么以及處在什么 位置。因此,視覺對象的內(nèi)部表征就成為視覺計(jì)算的主 要載體。于是視覺計(jì)算任務(wù)就成為如何根據(jù)給定的圖像, 來獲取各個層次的內(nèi)部表征,直至恢復(fù)圖像的三維景物。馬爾的視覺計(jì)算理論馬爾便是從三個層次來建立視覺計(jì)算理論:(1) 計(jì)算理論:確定視覺計(jì)算的目的;(2)表征與算法: 如何實(shí)現(xiàn)視覺計(jì)算任務(wù),確定輸入輸岀的表征,給出不 同表征轉(zhuǎn)換之間
21、的算法;(3)硬件實(shí)現(xiàn):在物理上如 何實(shí)現(xiàn)視覺表征及其轉(zhuǎn)換算法。特別是笫二個層次,就 是視覺計(jì)算理論的核心內(nèi)容,為此,馬爾提出了具體四 級表征,分別是:(1)圖像:表達(dá)光強(qiáng),用像素表征;馬爾的視覺計(jì)算 理論(2)要素圖:表達(dá)二維圖像中的垂要變化信息及其分 布,比如零交叉、斑點(diǎn)、端點(diǎn)、不連續(xù)點(diǎn)、邊緣片段、 有效線段、組合群、曲線組織、邊界等;(3)2. 5維圖:在以觀察者為屮心的處標(biāo)系屮,將可 見朝向、人致深度及其不連續(xù)輪廓表達(dá)清楚,比如表面 要素的朝向、距離觀察者的深度、深度上不連續(xù)點(diǎn)、表 面朝向不連續(xù)點(diǎn)等。(4)3維模型:在以物體為中心的處標(biāo)系中,景物用 體積基元和面積基元給出的層次模塊化表
22、征。對上述各個層次表征的獲取,正好對應(yīng)視覺計(jì)算不 同步驟的計(jì)算分析處理階段,涉及到圖形檢測、運(yùn)動檢 測、空間檢測、分形檢測等差界性低層處理技術(shù),邊線 合成、區(qū)域牛成、紋理識別、表而恢復(fù)等相似性中層處 理技術(shù),以及景物匹配、含義推斷、知識習(xí)得、目標(biāo)規(guī) 劃等理解性高層處理技術(shù)。當(dāng)然,還應(yīng)該有對圖像含義 的理解處理,給出具體視覺對彖的含義,比如一棵樹、 一位女士、一個競技場等的語言性描述。隨著視覺計(jì)算理論、方法及技術(shù)的不斷發(fā)展,研究 人員越來越認(rèn)識到借鑒人類視覺運(yùn)作機(jī)制的重要性。因 此,近些年來,仿造人類視覺運(yùn)作機(jī)制來構(gòu)造新的視覺 計(jì)算方法代表了視覺計(jì)算領(lǐng)域前沿性的研究走向。冃前 主耍涉及的研究包括
23、利用視覺初級皮層區(qū)功能柱結(jié)構(gòu) 開展的視覺計(jì)算模型研究、有關(guān)視覺注意機(jī)制的計(jì)算模 型研究、以及視覺聯(lián)想機(jī)制的量子計(jì)算模型研究等等??傊?,視覺計(jì)算研究的目標(biāo)就是要構(gòu)建一套行之冇 效的視覺計(jì)算理論、方法與技術(shù),并應(yīng)川到實(shí)際問題的 解決z中。但由于人類視覺本身的困難,在視覺計(jì)算研 究中必然會存在許多意想不到的困難,甚至閑境。因此, 以下我們有必要對視覺計(jì)算化研究中可能會遇到的困 難做較為系統(tǒng)的分析,使得將來有志于開展視覺計(jì)算研 究工作人們一開始就明口問題關(guān)鍵之所在。第5.3節(jié)知覺困境與前而人類視覺相比較,即使在簡單的圖象分析理 解方面,機(jī)器視覺研究的成就無論如何也是難以金及的, 這說明視覺計(jì)算領(lǐng)域還冇
24、很長的路需要我們?nèi)ヌ剿髋c 研究。此時仔細(xì)研究人類視覺如下更為獨(dú)特的原理,可 能會對推動機(jī)器視覺的發(fā)展,有著重要的啟發(fā)意義。早上我們醍來睜開雙眼,就會有五光十色的事物映 入你的眼簾:你床頭的鬧鐘也許正在滴滴答答跳動著指 針;窗外的樹彩枝條也隨風(fēng)擺個不停;遠(yuǎn)處的云彩,在 一輪紅日的渲染下,更顯得絢麗嬌艷。此時,你也許根 本不會想到這一切不期然而然的結(jié)果,競都是視覺系統(tǒng) 的功勞。?;畛3>褪沁@樣,最習(xí)以為常的事情,不管 多么重要,當(dāng)你正擁有時你就不會珍愛關(guān)注,只有當(dāng)你 失去的時候,才會格外引起你的注意和重視。那么我們這種習(xí)以為常的視覺觀看就像攝像機(jī)一 樣,都是現(xiàn)實(shí)世界的忠實(shí)反映嗎?與人類視覺比鮫,基
25、 于攝像機(jī)的機(jī)器視覺還處于十分初步的水平,無論是形 狀知覺還是立體感知,機(jī)器都會遇到難以克服的閑難。 那么到底是什么導(dǎo)致了人類與機(jī)器之間存在這種不可 逾越的鴻溝呢?如果深諳人類的視覺運(yùn)作規(guī)律,就不難 發(fā)祥,這種困難,從深層的機(jī)制上講,一個集中體現(xiàn)的 方面,便是人類所具備的視覺怛常性和容錯性,難以為 機(jī)械精確、永遠(yuǎn)無錯的算法方式所描述。有科學(xué)家強(qiáng)調(diào),大小恒常性的原理是建立在“感知 大小=感知距離x視角”這一公式z上的。比如地平線 上的月亮顯得比升空的月亮更遠(yuǎn),由于月亮的視角基本 固定不變,我們就感到它較人。這個就是所謂的埃默特 定律。但距離知覺乂是怎么獲得的呢?由于距離的知覺 在很大程度上是建立
26、在人小恒常性的視覺經(jīng)驗(yàn)之上的, 因此將大小恒常性歸結(jié)為距離知覺未免又會陷入“先冇 雞述是先有蛋”的二難境地。其實(shí),恒常性主要來白于經(jīng)驗(yàn)和比較。猶太大學(xué)的 唐海勒用老鼠進(jìn)行了人小恒常性的實(shí)驗(yàn)就證實(shí)了經(jīng)驗(yàn) 対大小恒常性還是必要的。物體與所處背景的相対比較 則是恒常性的另一重要來源,而恒常性則對以看作是當(dāng) 前物體與已有經(jīng)驗(yàn)比較的結(jié)果。正因?yàn)檫@樣,有時我們 的視覺會得出錯誤的結(jié)論,產(chǎn)先幻覺或錯覺。經(jīng)驗(yàn)的成 見導(dǎo)致錯覺,但人類的視覺不會因有錯覺而否定經(jīng)驗(yàn)作 用,因?yàn)榻?jīng)驗(yàn)是人類賴以生存的基礎(chǔ)。這就是所謂的視 覺容錯性。-些恒常性錯覺圖案錯覺的極致,便是我們町以人為地感知不町能圖形。 也就是說,在實(shí)際世界中
27、根本不可能存在的形體,在我 們的知覺世界里竟然是合理的。圖給出了一個常見的不 可能圖形,你在現(xiàn)實(shí)屮根本就造不出這樣的實(shí)體來的。實(shí)際上,錯覺是我們擁有無比梢湛的視覺能力的必 然代價,如果有一天人類失去了錯覺能力,那么也就意 味著我們必然地同時也失去了精湛的視覺能力。的確, 人總是免不了會犯錯誤,而這止是人類值得驕傲的心智 特性。機(jī)器不會出錯,它總是精確地執(zhí)行人類為它編制 好的程序或程序的程序;因此如何使得機(jī)辭也能擁有視 覺恒常性并產(chǎn)生錯覺,就成為未來視覺計(jì)算研究的一個 重要課題。除了恒常性帶來的錯覺,對客觀景物理解還深深依 賴于我們的主觀意念,有時這種主觀意念,也會導(dǎo)致我 們對客觀事物理解上的偏
28、差。rvruxrfitter color rod synthesaed color eye color scyan sgray顏色主觀效應(yīng)似動視覺效應(yīng)美國科學(xué)家歐文洛克在知覺z謎一書中指hh “大腦并不是簡單地記錄下世界的準(zhǔn)確的映象,而是創(chuàng)造 出白己的“照片”來?!睙o獨(dú)有偶,英國的格里高里在視 覺心理學(xué)中也指出:“知覺不是簡單地被刺激模式?jīng)Q定 的,而是對冇效的資料能動地尋找最好的解釋?!弊罱?,著名科學(xué)家克里克在驚人的假設(shè)中更是 強(qiáng)調(diào):“看是一個建構(gòu)過程。在此過程中,大腦以并行的 方式對景物的很多不同“特征”進(jìn)行響應(yīng),并以以往的經(jīng) 驗(yàn)為指導(dǎo),把這些特征組合成一個侑意義的整體??瓷?及大腦中的某些
29、主動過程;它導(dǎo)致景物明晰的、多層次的符號化解釋?!焙苊黠@,對于一個物體的知覺,必須通過對這一物 體的各組成要素進(jìn)行感知把握z后才能完成;然而如果 在感知把握時,沒有一個幣體的概念作指導(dǎo),那么對這 個物體的知覺就連一步也不能深入下去。觀看并不是對 視覺對彖的機(jī)械復(fù)制,|何是對其總體結(jié)構(gòu)特征積極主動、 有選擇的把握。通俗一點(diǎn)講就是說,觀察者能看見什么, 不僅取決于外界呈現(xiàn)的視覺刺激,還取決于他主觀的注 意和意向指導(dǎo)。外界刺激只有在主觀意識活動的參少下, 才能形成視覺形彖的顯現(xiàn)。 似動視覺效應(yīng)其實(shí),從某種意義上講,一切理解都必然是主觀性 的、是個性化的。古代冇一則寓言,說的是:“人冇亡鉄 者,意其鄰人之子,視其行步,竊鉄也;顏色,竊鉄也; 言語,竊鉄也;動作態(tài)度,無為而不竊鉄也。俄而掘其 谷而得其鉄,他fi復(fù)見其鄰人z子,動作態(tài)度,無似竊 鉄者?!保▍问洗呵锶ビ绕┰谥鲃右曈X中,主觀 意念一旦產(chǎn)住有時會如此強(qiáng)烈,令你揮z不去,頑固盤 旋在你的腦海,左右著你的感知活動。()畫謎:主觀意念測試圖當(dāng)然,在這種主觀意念起作用的情況中,除了視覺 會主動啟選擇地去“發(fā)現(xiàn)”線
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 廣東理工學(xué)院《街舞》2023-2024學(xué)年第一學(xué)期期末試卷
- 廣東科技學(xué)院《薪酬管理》2023-2024學(xué)年第一學(xué)期期末試卷
- 廣東江門幼兒師范高等??茖W(xué)?!毒坝^設(shè)計(jì)基礎(chǔ)》2023-2024學(xué)年第一學(xué)期期末試卷
- 廣東機(jī)電職業(yè)技術(shù)學(xué)院《精確農(nóng)業(yè)概論》2023-2024學(xué)年第一學(xué)期期末試卷
- 廣東行政職業(yè)學(xué)院《移動通信技術(shù)》2023-2024學(xué)年第一學(xué)期期末試卷
- 廣東工業(yè)大學(xué)《特種材料連接》2023-2024學(xué)年第一學(xué)期期末試卷
- 廣東工程職業(yè)技術(shù)學(xué)院《互聯(lián)網(wǎng)金融產(chǎn)品規(guī)劃與設(shè)計(jì)》2023-2024學(xué)年第一學(xué)期期末試卷
- 廣東第二師范學(xué)院《公司理財(cái)雙語》2023-2024學(xué)年第一學(xué)期期末試卷
- 廣東財(cái)貿(mào)職業(yè)學(xué)院《傳統(tǒng)造像(圓雕)》2023-2024學(xué)年第一學(xué)期期末試卷
- 小班安全找媽媽課件
- 中石油職稱英語
- 2023年副主任醫(yī)師(副高)-神經(jīng)內(nèi)科學(xué)(副高)考試歷年真題薈萃帶答案
- 國家義務(wù)教育質(zhì)量監(jiān)測科學(xué)四年級創(chuàng)新作業(yè)測試卷【附答案】
- 硫磺安全技術(shù)說明書MSDS
- 工程施工現(xiàn)場存在的環(huán)保問題及解決建議
- 鍋爐過熱蒸汽溫度控制系統(tǒng)課程設(shè)計(jì)
- 四川省成都市2021-2022學(xué)年高一(上)期末調(diào)研考試物理試題 Word版
- 2023-2024江蘇小高考思想政治試卷及答案
- OFM軟件的一些使用技巧
- 2023-2024學(xué)年四川省樂山市小學(xué)數(shù)學(xué)四年級上冊期末模考考試題
- 工程進(jìn)度管理制度
評論
0/150
提交評論