版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、精選優(yōu)質(zhì)文檔-傾情為你奉上精選優(yōu)質(zhì)文檔-傾情為你奉上專心-專注-專業(yè)專心-專注-專業(yè)精選優(yōu)質(zhì)文檔-傾情為你奉上專心-專注-專業(yè) 摘 要基于圖象處理的機(jī)器視覺與智能識(shí)別技術(shù)是圖象處理的前沿和人工智能研究領(lǐng)域的重要分支,機(jī)器識(shí)別的方法在于研究合適的計(jì)算模型,然后利用機(jī)器來實(shí)現(xiàn)簡(jiǎn)單的智能判決。本文以“人”目標(biāo)的檢測(cè)為研究對(duì)象,采用歸一化方案和主動(dòng)輪廓算法提取采樣圖象中的目標(biāo)信息,即圖象特征,并利用一定的先驗(yàn)知識(shí)對(duì)該信息進(jìn)行判斷,達(dá)到檢測(cè)和識(shí)別“人”目標(biāo)的目的。 目標(biāo)檢測(cè)是識(shí)別的前提工作,本文通過加權(quán)灰度分析尋找一個(gè)可以逼近我們感興趣目標(biāo)的圖象點(diǎn)(即目標(biāo)點(diǎn)),并在此基礎(chǔ)上建立直角坐標(biāo)系,分割采樣圖,解
2、決多個(gè)目標(biāo)檢測(cè)的問題。目標(biāo)匹配是目標(biāo)跟蹤,識(shí)別領(lǐng)域的基本思想,在本課題中鑒于采樣圖獲取目標(biāo)的位置,角度和形態(tài)差異,直接進(jìn)行目標(biāo)匹配顯然是不可行的。本文采用歸一化的思想,通過角度修正,坐標(biāo)平移和坐標(biāo)伸縮,得到目標(biāo)的標(biāo)準(zhǔn)尺寸和形態(tài)。與傳統(tǒng)歸一化算法的區(qū)別在于,本文并不采用某個(gè)標(biāo)準(zhǔn)模板作為參考,因而可以防止非“人”目標(biāo)在歸一化之后具有和“人”目標(biāo)相似的尺寸和形態(tài)。輪廓檢測(cè)一直是目標(biāo)的識(shí)別算法中最基本也最困難的問題,傳統(tǒng)的輪廓檢測(cè)方案往往受采樣圖的實(shí)際效果影響較大,造成提取輪廓模糊或存在斷點(diǎn)乃至嚴(yán)重的輪廓失真。通常的解決方案是采用相應(yīng)的后續(xù)修正算法,讓目標(biāo)輪廓盡量保持連續(xù)。本文在目標(biāo)歸一化的基礎(chǔ)上,采
3、用主動(dòng)輪廓算法,較好的解決了輪廓對(duì)目標(biāo)的貼近及其本身連續(xù)性問題,避免了復(fù)雜的后續(xù)修正工作。通常情況下的目標(biāo)識(shí)別往往可以對(duì)識(shí)別過的目標(biāo)進(jìn)行標(biāo)記或能很快提取其不變特征,不至于影響其他目標(biāo)判斷。然而“人”目標(biāo)的形態(tài)會(huì)隨時(shí)間發(fā)生隨機(jī)的改變,不容易提取其不變性特征,鑒于人數(shù)統(tǒng)計(jì)的客觀要求,不能容許對(duì)同一個(gè)人重復(fù)計(jì)數(shù)。本文通過對(duì)上一次目標(biāo)檢測(cè)和目標(biāo)識(shí)別的結(jié)果以及當(dāng)前目標(biāo)檢測(cè)結(jié)果進(jìn)行綜合驗(yàn)算的方法,來判斷是否對(duì)當(dāng)前采樣圖進(jìn)行識(shí)別判斷,在解決了重復(fù)計(jì)數(shù)問題的同時(shí)大大降低了系統(tǒng)的實(shí)時(shí)處理數(shù)據(jù)量。關(guān)鍵詞: 目標(biāo)檢測(cè) 歸一化 主動(dòng)輪廓 計(jì)數(shù)ABSTRACTThe technology based on image
4、processing and machine vision is in the forefront of the Intelligent Recognition of image processing and it is the important research branch of artificial intelligence plant. The identificational method is to find a suitable model, and then using machines to achieve simple intelligent judgment. In t
5、his paper, we study the recognition and judgement of the target of human beings. We use the normalization program and an active contour to extract algorithm information of the object and image characteristics from sampling image .Then, we make use of some prior knowledge of this information to reach
6、 the judgement which cause to the identification of people Goals. Target detection is the premise of recognition. According to Gray weighted analysis we can find an interesting target which is close to us the image point (that may be the goal points). On basis of this, we can establishmen a Cartesia
7、n coordinates and segment from the sampling image to solve the numbers of targets detection problem. Target matching and target tracking is the basic ideology of identification area, in the light of the issue of uncertained sampling image.It is hard to gain the position, Morphological differences in
8、 perspective .So matching the target directly is obviously not feasible. In this paper, incording to the idea of normalization program, such as angle correction, coordinate translation and telescopic coordinates, we can obtain standard sizes and shapes of objects. In a different with traditional alg
9、orithm ,it doesnt use standard templates as a reference. thus we can prevent the other targets from getting similar size and morphology of “people” targets. Contour detection is always be the is the most fundamental and most difficult problem of objective recognition algorithm, traditional contour d
10、etection program often suffers from the inactual results of sampling map greatly, which causes Fuzzy result of contour extraction and breakpoints in contour or even serious distortion of the contours. The usual solution is to adopt corresponding amendments to the follow-up algorithms for object cont
11、ours to maintain continuous. Based on the goal of normalization and active contour algorithm issue in this paper, wo can solve the problem to get profile of the target close to his own continuity and void the complex follow-up rectification works.Under normal circumstances , the target recognition c
12、an often be solved by identifing the target or extracting its invariant feature as soon as possible. Thus, it will not affect judgment of other goals. However, people target patterns will have random changes over time. So it is not easy to extract its invariant features. Giving the statistical numbe
13、r of objectives is not allowed to repeat the same individual counts. Based on result of previous target detection and the identification of goals in current , we can use the integrated calculation method to determine the necessity of identifing and judging of the current sampling plan . In a result
14、, we solve the problem of counting repeatly and reduce the amount of date in a real-time processing.Keywords: target detecting , normalization, active contour, count.目 錄中文摘要I英文摘要II1 緒論11.1 研究背景11.2 研究現(xiàn)狀2 1.3 論文結(jié)構(gòu)安排32 計(jì)數(shù)系統(tǒng)的目標(biāo)檢測(cè)42.1 引言42.2 基于圖象的成象系統(tǒng)存在的技術(shù)瓶頸42.3 圖象采集方案52.4 目標(biāo)檢測(cè)63 圖象目標(biāo)的歸一化處理103.1 引言103.2
15、 圖象歸一化的基本問題103.3 歸一化轉(zhuǎn)動(dòng)角參數(shù)的確定123.4 輪廓平面上目標(biāo)區(qū)域的確定143.5 參照尺度的確定和比例調(diào)整174 主動(dòng)輪廓算法234.1 引言234.2 主動(dòng)輪廓算法的優(yōu)勢(shì)224.3 主動(dòng)輪廓算法的圖象模型244.4 模型工作機(jī)制264.5 輪廓的初步檢測(cè).274.6 基于SUSAN算子的角點(diǎn)檢測(cè)284.7 提取帶凹陷特征的目標(biāo)輪廓.315 仿真實(shí)現(xiàn)345.1 目標(biāo)檢測(cè)仿真345.2 歸一化的仿真385.3 主動(dòng)輪廓仿真415.4 計(jì)數(shù)部分仿真44 5.5 實(shí)時(shí)性分析466 硬件實(shí)現(xiàn)486.1 引言486.2 TMS320C5502的功能介紹486.3 硬件設(shè)計(jì)496.4
16、 工作原理537 結(jié)束語(yǔ)55致 謝57參考文獻(xiàn)58附錄: 一.60二 671 緒論1.1研究背景在我們生存的世界中,存在著多種多樣的可被我們所感知的信號(hào),從而幫助我們?nèi)チ私庵車沫h(huán)境。其中,光線的刺激作用于眼睛所形成的圖像信號(hào),占有著重要的地位,據(jù)資料顯示,人的80%以上的信息來源是通過視覺系統(tǒng)所獲得的圖像信號(hào)。人和高等動(dòng)物都有著發(fā)達(dá)的視覺系統(tǒng),使得客觀環(huán)境中存在的事務(wù)或目標(biāo)可以被識(shí)別,從而引發(fā)進(jìn)一步的處理。對(duì)于人類來說,這種功能是與身俱來的,十分輕松的事情。可對(duì)于機(jī)器視覺系統(tǒng)來說,這樣卻是十分困難的事情。分析我們?nèi)祟愐曈X判斷一個(gè)場(chǎng)景中的物體,比如判斷是否是一個(gè)人的過程,如果不確定是否是物體正
17、面,首先是從輪廓著手,將“人”目標(biāo)和其他目標(biāo)以及背景部分區(qū)別開來,其次是查看上下特征,在頭部區(qū)域查看是否有頭發(fā),眼睛,鼻子,耳朵等明顯的五官,在身體區(qū)域觀察是否有手,腿,腰等顯著軀干特征。通過以上觀察,和頭腦中的“人”目標(biāo)的概念進(jìn)行比對(duì)判斷,便可以得到結(jié)論。對(duì)于一個(gè)智能視覺處理系統(tǒng)來說,圖像的獲得可以通過各種光電器件如攝像頭,CCD)等得到,并轉(zhuǎn)化成數(shù)字信號(hào)。其后的處理一般是交給功能強(qiáng)大的計(jì)算機(jī)和微處理器來完成。一個(gè)完整的機(jī)器視覺系統(tǒng)基本上是由三個(gè)相互關(guān)聯(lián)而又有明顯區(qū)別的過程組成的,即場(chǎng)景分離、目標(biāo)生成和智能判決。攝象頭采集的原始圖象往往有很多冗余的信息或干擾,比如背景信息,噪聲干擾等等,這些
18、不必要信息對(duì)于我們找到真正感興趣的目標(biāo)信息是一個(gè)障礙,場(chǎng)景分離就是要通過圖象處理來弱化干擾因素的影響,強(qiáng)化我們感興趣的部分;目標(biāo)生成,是一個(gè)指定判斷區(qū)域和判斷對(duì)象的過程,通常是一個(gè)包括目標(biāo)和非目標(biāo)在內(nèi)的粗識(shí)別步驟,對(duì)可能是目標(biāo)的區(qū)域和物體收集或標(biāo)記,最后再通過進(jìn)一步的特征提取和處理,結(jié)合一定的判決模型,以較大的概率判斷這幅圖像或它的一部分是不是我們所要尋找的目標(biāo)。和人類視覺不同的是,機(jī)器智能受判決模型數(shù)學(xué)上的精確性和機(jī)器系統(tǒng)先驗(yàn)知識(shí)的局限性制約,無法在目標(biāo)可能的復(fù)雜性和判斷的準(zhǔn)確性上保持很高的一致。比如,人類視覺可以通過衣服等無法精確描述的附加物來識(shí)別“人”目標(biāo), 而機(jī)器系統(tǒng)卻不行。 然而,機(jī)
19、器識(shí)別作為圖象處理和人工智能相結(jié)合的新興科學(xué)具有和人的主觀識(shí)別完全不同的優(yōu)勢(shì),在文字處理,指紋處理,車輛監(jiān)控,安全檢查等諸多方面都有廣闊的應(yīng)用前景。針對(duì)不同的應(yīng)用場(chǎng)合,我們對(duì)“人”目標(biāo)的識(shí)別無外2種目的,一是充分提取細(xì)節(jié)特征識(shí)別到具體的個(gè)人,這類應(yīng)用在社會(huì)安全領(lǐng)域如犯罪調(diào)查,身份驗(yàn)證等方面已經(jīng)有相應(yīng)的硬件實(shí)現(xiàn);二是忽略單個(gè)目標(biāo),只對(duì)某場(chǎng)合的“人”目標(biāo)群體感興趣,比如只想知道該群體數(shù)目的增減情況,這一方面由于忽略了對(duì)每個(gè)目標(biāo)單位的詳細(xì)判斷,為降低算法復(fù)雜度,降低硬件成本提供了客觀依據(jù),因而可以在更普遍的場(chǎng)合得到應(yīng)用,而現(xiàn)有的智能識(shí)別系統(tǒng)針對(duì)這類應(yīng)用的研究并不充分。1.2研究現(xiàn)狀從原始圖象中識(shí)別和
20、檢測(cè)目標(biāo),一直是圖象處理領(lǐng)域的一個(gè)前沿課題。由謝樹煜等提出的實(shí)時(shí)視頻對(duì)象與計(jì)數(shù)系統(tǒng)的模型和算法設(shè)計(jì),通過綜合運(yùn)用顏色模型轉(zhuǎn)換、減影、膨脹、腐蝕、聚類、匹配、跟蹤等圖象處理技術(shù),成功的在非復(fù)雜背景的人物運(yùn)動(dòng)圖象中實(shí)現(xiàn)了對(duì)待檢測(cè)區(qū)域內(nèi)運(yùn)動(dòng)對(duì)象的識(shí)別檢測(cè)和計(jì)數(shù)。但這類方法受具體場(chǎng)合的影響很大,改變背景特征,改變攝象頭取圖高度,或者改變場(chǎng)景中的目標(biāo)運(yùn)動(dòng)方向,就必須對(duì)方案提出相應(yīng)的改變甚至更新整套設(shè)計(jì)。人工神經(jīng)網(wǎng)絡(luò)的理論和算法的成熟,為機(jī)器智能識(shí)別提供了可能,在matlab軟件包里面已經(jīng)集成了一部分基于人工神經(jīng)網(wǎng)絡(luò)理論的應(yīng)用型模塊。該技術(shù)通過機(jī)器對(duì)樣本的學(xué)習(xí),讓目標(biāo)的特征可以被機(jī)器掌握,從而在目標(biāo)和非目
21、標(biāo)的對(duì)象中做出選擇和判斷。但應(yīng)用人工神經(jīng)網(wǎng)絡(luò)的圖像處理和識(shí)別技術(shù),關(guān)鍵需要找到合適的模型來描述樣本的特征,其實(shí)質(zhì)仍然是特征的提取。近年來,隨著學(xué)科綜合趨勢(shì)的加強(qiáng),有學(xué)者將解剖學(xué),形態(tài)學(xué)以及圖象處理技術(shù)綜合起來,提出一種全新的骨點(diǎn)檢測(cè)算法,通過角度修正,骨點(diǎn)匹配,檢驗(yàn)當(dāng)前人目標(biāo)和數(shù)據(jù)庫(kù)信息的相似程度,該方法具有更高的精度,識(shí)別誤差非常小,但是由于是具體到目標(biāo)個(gè)體的識(shí)別,龐大的數(shù)據(jù)庫(kù)和硬件成本不能在普通的場(chǎng)合得到廣泛應(yīng)用。另外,根據(jù)不同的應(yīng)用要求,也沒有必要采用精確的目標(biāo)識(shí)別,比如類似本課題的識(shí)別計(jì)數(shù)系統(tǒng),分辨每個(gè)目標(biāo)單位是沒有必要的,我們只關(guān)心“人”目標(biāo)的數(shù)目,對(duì)于到底是誰(shuí),并不需要知道。近年來
22、公車車門附近普遍裝上了攝象頭,很自然的聯(lián)想到,是不是可以利用某種識(shí)別計(jì)數(shù)系統(tǒng)來計(jì)算上下車乘客的數(shù)目,為收集相應(yīng)的信息,制定合理的公車運(yùn)營(yíng)策略提供數(shù)據(jù)支持,這就是公車智能識(shí)別系統(tǒng)。參考相應(yīng)的文獻(xiàn)發(fā)現(xiàn),普遍的方案是采用紅外識(shí)別,重量傳感的思路,基于圖象處理的識(shí)別系統(tǒng)由于干擾因素較多,使得目標(biāo)搜索,目標(biāo)匹配等傳統(tǒng)方案不能達(dá)到一個(gè)令人滿意的準(zhǔn)確度。一些相關(guān)文章,依據(jù)傳統(tǒng)的圖象處理技術(shù),對(duì)乘客的衣著復(fù)雜度沒有充分考慮,對(duì)人的頭發(fā)顏色則取為黑色,忽略了白發(fā)乘客,戴帽子乘客可能帶來的識(shí)別困擾。目標(biāo)、背景分離技術(shù)已經(jīng)是圖象處理中最基本最成熟的技術(shù)之一,很多文獻(xiàn)將此過程稱為初始化。本文跳過目標(biāo),背景分離技術(shù),只
23、考慮中后過程的目標(biāo)識(shí)別和檢測(cè),是因?yàn)楦鱾€(gè)場(chǎng)合下的初始化方案必定有很大不同,沒有太多的參考價(jià)值,而初始化以后的“人”目標(biāo)檢測(cè)和特征提取過程卻有很大的參考余地。因此,我們討論單純背景的“人”目標(biāo)識(shí)別計(jì)數(shù)系統(tǒng),對(duì)于類似的課題有一定的通用性。由于傳統(tǒng)輪廓提取方案的局限性加上人體輪廓的復(fù)雜性和隨機(jī)性,絕大多數(shù)“人”目標(biāo)識(shí)別方案都沒有考慮輪廓提取方法。本文采用與傳統(tǒng)輪廓方案有很大不同的主動(dòng)輪廓算法來提取輪廓特征,主要通過衣服較少的頭部輪廓和帽子不能遮蔽的臉部輪廓,作出判斷,是一種新的嘗試。1.3 論文的結(jié)構(gòu)安排(研究意義)第一章為緒論,主要包括課題的研究背景,研究現(xiàn)狀,提出本文的基本思路,綜述本文的創(chuàng)新重
24、點(diǎn)。第二章介紹目標(biāo)檢測(cè)的處理流程和系統(tǒng)的工作機(jī)制。第三章介紹歸一化算法及其在本文中的實(shí)現(xiàn)步驟。第四章引入主動(dòng)輪廓算法的理論和在本文的具體應(yīng)用。第五章為硬件實(shí)現(xiàn)和實(shí)驗(yàn)結(jié)論。第六章為結(jié)束語(yǔ)。2 計(jì)數(shù)系統(tǒng)的目標(biāo)檢測(cè)2.1 引言 基于圖象處理的目標(biāo)檢測(cè)是圖象智能識(shí)別的前提,目標(biāo)檢測(cè)的任務(wù)是通過提取相應(yīng)的目標(biāo)特征,將我們要識(shí)別的目標(biāo)全部標(biāo)志出來,并盡可能的減少干擾目標(biāo)的存在。也就是,通過一套特征方案尋找一個(gè)包括所有感興趣目標(biāo)的識(shí)別目標(biāo)集。這個(gè)目標(biāo)集的大小,取決于我們的方案和待處理圖象的復(fù)雜程度。如果只包含感興趣目標(biāo),稱為理想目標(biāo)集,或者最小目標(biāo)集,而實(shí)際上,這樣的效果很難做到。在確定選取方案的時(shí)候,一方
25、面要考慮將目標(biāo)包括在內(nèi),另一方面要盡量排除干擾。所以過于嚴(yán)格的方案容易造成目標(biāo)遺漏,而提取寬松的特征,又會(huì)給后續(xù)判斷帶來較多的計(jì)算和比較,增加整個(gè)識(shí)別過程的復(fù)雜度。所以根據(jù)實(shí)際應(yīng)用的需求,需要綜合比較一些不同方案的優(yōu)劣。2.2 基于圖象的成象系統(tǒng)存在的技術(shù)瓶頸圖象識(shí)別的前提是獲取相關(guān)的圖象信息,好的圖象采集方案,不僅可以獲取較完整的信息,而且可以幫助提取目標(biāo)特征,方便圈定識(shí)別目標(biāo)集。對(duì)于公眾場(chǎng)合的成象系統(tǒng),將攝象頭放在成象視角較好的地方是第一個(gè)考慮因素,其次,要考慮該角度是否能夠取到明顯的目標(biāo)特征,能否降低干擾因素的存在?;趫D象的識(shí)別對(duì)各類噪聲和干擾往往比較敏感,所以選擇放置角度應(yīng)考慮背景變
26、化的因素。這些背景的變化包括景物變化,成象距離變化和光線變化等等,這些可能的變化對(duì)于識(shí)別目標(biāo)會(huì)帶來很大的困擾,使得我們很難找到一個(gè)簡(jiǎn)單有效的方案針對(duì)所有的成象背景都有令人滿意的效果。圖象的遮蔽效果是圖象處理中經(jīng)常無法回避的問題,這是圖象的二維局限性所決定的。在任意一個(gè)拍攝角度下,理論上都無法避免目標(biāo)遮蔽的存在。但在具體的應(yīng)用中,結(jié)合場(chǎng)景和目標(biāo)運(yùn)動(dòng)的特點(diǎn),可以決定一個(gè)最佳的圖象采樣角度。如果將遮蔽效果和背景特點(diǎn)結(jié)合考慮,則攝取角度將可能被局限于很小的范圍,或者無法令二者均達(dá)到最優(yōu)。以犧牲識(shí)別目標(biāo)集的完整性為代價(jià)的次優(yōu)方案成為這種技術(shù)困難下的一種解決途徑,但換一個(gè)角度考慮,投入少量的成本增加攝取角
27、度,讓各個(gè)角度存在相應(yīng)的互補(bǔ)性,無疑是一個(gè)更好的方法。但是,事實(shí)上這個(gè)方向的研究并沒有太多的進(jìn)展。多角度圖象雖然增加了獲取信息的完整性,但對(duì)于圖象同步和數(shù)據(jù)綜合提出了更多的挑戰(zhàn),特別是多幅同步圖象的信息綜合涉及更加復(fù)雜的控制和處理。對(duì)應(yīng)于某個(gè)采樣角度,必定存在相應(yīng)的容易提取的圖象特征。對(duì)于實(shí)時(shí)系統(tǒng)而言,采用的特征提取方案在保證準(zhǔn)確率的同時(shí)還應(yīng)注意時(shí)效性,即必須考慮這個(gè)方法占有的系統(tǒng)處理時(shí)間。這個(gè)時(shí)間主要和處理信息的多少,算法復(fù)雜度的大小有關(guān)。一方面,實(shí)時(shí)系統(tǒng)要求更快的信息處理,另一方面,我們希望能夠得到最優(yōu)的識(shí)別目標(biāo)集。時(shí)間和效果的最優(yōu)往往在實(shí)際的系統(tǒng)中難以兼顧,在此情況下,通常的方法是第一,
28、通過分析圖象特點(diǎn)和目標(biāo)特點(diǎn),找到采集圖象的數(shù)據(jù)冗余,依靠大量的減少實(shí)時(shí)數(shù)據(jù)量增加系統(tǒng)的時(shí)效性,第二,以犧牲檢測(cè)精度為代價(jià),獲取次優(yōu)的目標(biāo)集來降低系統(tǒng)的時(shí)間依賴性。2.3 圖象采集方案的要求通過2-2節(jié)的介紹,對(duì)于人目標(biāo)的實(shí)時(shí)計(jì)數(shù)系統(tǒng)圖象采集部分需要注意和考慮的問題已經(jīng)有了大致的框架。即需要讓攝象頭采樣的圖象包含盡量完整的目標(biāo)信息,減少目標(biāo)干擾,降低時(shí)間依賴性。在此基礎(chǔ)上確定一個(gè)方案(算法),該算法應(yīng)綜合考慮檢測(cè)效率和計(jì)算復(fù)雜度。假定我們安排單個(gè)攝象頭,為了能夠檢測(cè)到人目標(biāo)的顯著特征,當(dāng)然應(yīng)該盡量包含人目標(biāo)的頭不信息。因?yàn)?,人目?biāo)的頭部五官等具有區(qū)別于其他干擾目標(biāo)的顯著特征。所以,可以選擇頭部附
29、近前后左右上五個(gè)方向。其中,正面,側(cè)面和頭頂有明顯多于從背后攝象的圖象特征可以利用。正面圖象最容易發(fā)現(xiàn)人目標(biāo)的五官特征,檢測(cè)效率高,算法也比較簡(jiǎn)單。但是對(duì)于很多場(chǎng)合,無法處理目標(biāo)遮蔽帶來的識(shí)別障礙,另外,考慮背景因素的前提下,正面的攝象角度容易受到背景變化的干擾,在很多場(chǎng)合下,場(chǎng)合的入口處具有很強(qiáng)的隨時(shí)間變化的背景光線,在采樣圖象中非常明顯。側(cè)面圖象可以找到人目標(biāo)的耳朵,鼻子,嘴巴,下巴等特征,但是同樣無法應(yīng)對(duì)圖象遮蔽,而且由于人目標(biāo)是非剛性的形體, 頭部的旋轉(zhuǎn)和身體運(yùn)動(dòng)軌跡的隨機(jī)性都會(huì)讓側(cè)面圖象丟失滿意的視角,讓原本顯著的圖象特征不容易被發(fā)現(xiàn)和提取。相對(duì)而言,在不考慮背景因素前提下,受遮蔽影
30、響最小的是頂部攝象頭。很多應(yīng)用的場(chǎng)合下,留心觀察會(huì)發(fā)現(xiàn),攝象頭幾乎都是安排在頂部的。頂部采樣圖的特點(diǎn)是,能夠?qū)⒛繕?biāo)作為一個(gè)整體進(jìn)行觀察,找出相應(yīng)的目標(biāo)特征或運(yùn)動(dòng)特點(diǎn),并能夠運(yùn)用傳統(tǒng)的跟蹤,搜索和匹配技術(shù)實(shí)現(xiàn)對(duì)目標(biāo)的檢測(cè),識(shí)別。但是,如果要通過目標(biāo)輪廓來執(zhí)行后續(xù)判斷,頂部的輪廓特征相對(duì)于其他位置是最差的。本文從創(chuàng)新角度出發(fā),采用輪廓方案作為目標(biāo)識(shí)別和判斷的依據(jù),僅僅使用頂部攝象頭顯然是不行的。所以必須要獲得其他位置的圖象信息,這樣就必須引入多幅圖象的數(shù)據(jù)綜合問題。加上實(shí)時(shí)要求,對(duì)算法提出了復(fù)雜度的限制,所以,本文采取的方法是,利用頂部攝象頭獲取的圖象信息指導(dǎo)其他位置攝象頭的采樣和圖象矯正。本文的
31、圖象采集方案如下:在場(chǎng)景入口位置 ,設(shè)置三個(gè)攝像頭,分別處于上,左,右位置,如下圖所示A A C B 圖2.1 A,B,C表示三個(gè)攝像頭 Figure2.1 A,B,C indicate 3 cameras 在實(shí)際系統(tǒng)中,把A放在頂部的中央,B,C分別在左右對(duì)稱的位置,從平面上看,三個(gè)攝像頭的中心交于一點(diǎn)。這樣設(shè)計(jì)的好處在于,我們可以得到圖像的三維立體信息,同時(shí),由于攝像頭的分工給后續(xù)的檢測(cè)判斷提供方便。容易想到,由于離頂部最近,人目標(biāo)的頭部信息最有可能成為A俯視圖的重點(diǎn),這是目標(biāo)檢測(cè)的重要依據(jù)。而B,C負(fù)責(zé)提供側(cè)面圖像,為后面的輪廓判斷做好準(zhǔn)備,之所以設(shè)置左右2個(gè),是考慮到多目標(biāo),包括非“人
32、”目標(biāo)可能帶來的遮蔽效果;而左右對(duì)稱的設(shè)計(jì),可以給單個(gè)目標(biāo)的歸一化帶來方便。下面就進(jìn)一步介紹這個(gè)設(shè)計(jì)的具體作用。2.4 目標(biāo)檢測(cè) 假設(shè)對(duì)A每隔一定時(shí)間抓取一次圖像,這個(gè)時(shí)間間隔必須保證不會(huì)遺漏任何目標(biāo)的通過,并且能夠在連續(xù)的采樣圖上能觀察到目標(biāo)通過的基本過程,同時(shí)考慮到系統(tǒng)的實(shí)時(shí)處理需要的運(yùn)行時(shí)間,我們這里取為0.1秒。按照理想化的假設(shè),人目標(biāo)的頭部信息主要是頭發(fā),而黑色頭發(fā)在人群中有很高的比例。設(shè)圖像在坐標(biāo)處的象素灰度為,我們使用一個(gè)加權(quán)的方法對(duì)整個(gè)圖像范圍的灰度進(jìn)行計(jì)算并取平均 (2.1) (2.2)其中,M,N分別表示采樣圖的行列值,表示最終的橫縱坐標(biāo),表示一個(gè)加權(quán)后的平均灰度,表示對(duì)應(yīng)
33、的權(quán)值。假設(shè)對(duì)于黑色灰度取很高的權(quán)值,對(duì)于其他灰度按照其靠近黑色的程度取較小的權(quán)值,那么這樣計(jì)算下來,必定使得橫縱坐標(biāo)非常靠近黑色集中的區(qū)域或在黑色區(qū)域之內(nèi)。這就是用加權(quán)灰度尋找目標(biāo)點(diǎn)的基本思路,在這里,我們把目標(biāo)點(diǎn),稱為 “質(zhì)點(diǎn)”,它反應(yīng)了圖像中低灰度區(qū)域的重心。容易想到,如果有幾個(gè)黑色頭發(fā)的人目標(biāo)在這個(gè)圖里或者有其他灰度較低的干擾目標(biāo)存在,那么質(zhì)點(diǎn)很可能并不處于任何一個(gè)低灰讀區(qū)域之內(nèi)。質(zhì)點(diǎn) 質(zhì)點(diǎn) 低灰度區(qū)域 圖2. 2 質(zhì)點(diǎn)并不處于某個(gè)低灰度區(qū)域之內(nèi) Figure 2.2 Particle is not in a low-intensity region 于是,我們以這個(gè)圖的質(zhì)點(diǎn)為原點(diǎn),建
34、立一個(gè)直角坐標(biāo)系。在它的各個(gè)象限非別用式(2.1),(2.2)進(jìn)行質(zhì)點(diǎn)判斷,直到我們所找到的質(zhì)點(diǎn)已經(jīng)處于某個(gè)低灰度區(qū)域之內(nèi),并且該區(qū)域的面積不小于一個(gè)閥值時(shí),結(jié)束計(jì)算,這里我們把這個(gè)面積閥值稱為目標(biāo)判斷值。計(jì)算步驟如下:以整個(gè)圖的質(zhì)點(diǎn)為原點(diǎn)建立直角坐標(biāo),在垂直坐標(biāo)兩邊尋找質(zhì)點(diǎn),然后在水平坐標(biāo)兩邊尋找質(zhì)點(diǎn),若找到的質(zhì)點(diǎn)滿足后續(xù)條件,結(jié)束,否則轉(zhuǎn)3在4個(gè)象限分別尋找質(zhì)點(diǎn),若找到質(zhì)點(diǎn)滿足條件,結(jié)束,否則,對(duì)于不滿足條件的質(zhì)點(diǎn),若它所在的象限面積不小于一個(gè)規(guī)定值,(我們規(guī)定為不小于目標(biāo)判斷值的2倍)繼續(xù)建立直角坐標(biāo),轉(zhuǎn)2,否則轉(zhuǎn)4結(jié)束所有尋找,返回所有質(zhì)點(diǎn)的灰度值和坐標(biāo)。我們把這時(shí)候的質(zhì)點(diǎn)稱為“目標(biāo)質(zhì)
35、點(diǎn)”,目標(biāo)質(zhì)點(diǎn)的數(shù)目就是待測(cè)目標(biāo)的數(shù)目。圖2.3 目標(biāo)檢測(cè)流程 圖2.3 目標(biāo)檢測(cè)流程 采樣圖象 初步質(zhì)點(diǎn)判斷 建立坐標(biāo),循環(huán)判斷目標(biāo)質(zhì)點(diǎn)灰度圖象Figure 2.3 the processing of detecting objects 但是,對(duì)于實(shí)時(shí)運(yùn)算,對(duì)每個(gè)灰度值取不同的權(quán)值使得這一過程的計(jì)算量偏大,于是想到用階段量化的方法,設(shè)置幾個(gè)門限,大于相應(yīng)的門限值則取同樣的權(quán)值。而且,進(jìn)行整個(gè)視圖范圍的灰度計(jì)算受背景等因素干擾的可能性大大增加。我們考慮一些改進(jìn)如下,首先限制A攝像頭的抓取范圍,只保留一個(gè)寬度大于標(biāo)準(zhǔn)成人頭部長(zhǎng)度(從俯視角度,前額至后腦)1.5倍,長(zhǎng)度接近場(chǎng)景入口寬度的矩形條,如
36、圖:圖圖2.4 A攝像頭的抓取范圍 上邊界 下邊界D=1.5假設(shè)的頭部目標(biāo) Figure 2.4 the grasping scope of A camera 這樣一來,就大大減少了計(jì)算范圍, 圖中上邊界和下邊界的另一個(gè)好處是,可以判斷目標(biāo)是進(jìn)入還是離開場(chǎng)景,當(dāng)采樣圖中發(fā)現(xiàn)某個(gè)“目標(biāo)質(zhì)點(diǎn)”越來越靠近邊界時(shí),則給出一個(gè)目標(biāo)進(jìn)入或消失的信號(hào),并且當(dāng)前待測(cè)目標(biāo)數(shù)減1。由于A攝象頭的抓取間隔時(shí)間很短,不妨認(rèn)為在系統(tǒng)對(duì)目標(biāo)進(jìn)行判斷之后,目標(biāo)仍未離開圖2.2的矩形區(qū)域。那么,根據(jù)減少系統(tǒng)實(shí)時(shí)處理數(shù)據(jù)量和不可重復(fù)計(jì)數(shù)要求,我們制定如下的控制準(zhǔn)則:若頂部檢測(cè)目標(biāo)數(shù)大于側(cè)面檢測(cè)目標(biāo)數(shù),以側(cè)面檢測(cè)目標(biāo)數(shù)為準(zhǔn)。若頂
37、部檢測(cè)目標(biāo)數(shù)為0,將B,C置于無效狀態(tài)若頂部檢測(cè)目標(biāo)數(shù)小于側(cè)面檢測(cè)目標(biāo)數(shù),以頂部檢測(cè)目標(biāo)數(shù)為準(zhǔn)頂部檢測(cè)始終開啟若頂部采樣圖中不存在新目標(biāo),將B,C置于無效狀態(tài);否則同步開啟B,C采樣側(cè)面圖6. 在側(cè)面圖未獲取有效目標(biāo)區(qū)域的情況下,間隔0.2s繼續(xù)取3幅側(cè)面采樣圖進(jìn)行判斷,若仍未檢測(cè)到有效區(qū)域,視為假目標(biāo)由此,我們得到一個(gè)控制框圖如下:控制準(zhǔn)則控制準(zhǔn)則原始圖象頂部檢測(cè) 側(cè)面檢測(cè) Figure 2.5 the part of judge and control of counting system 圖2.5 計(jì)數(shù)系統(tǒng)的控制部分 值得注意的是,盡管使用了3個(gè)攝象頭采樣圖象數(shù)據(jù),但是對(duì)于3個(gè)以上的多目
38、標(biāo)識(shí)別仍然困難。這是因?yàn)?,攝象頭的取圖范圍十分有限,在3個(gè)以上的目標(biāo)同時(shí)通過入口場(chǎng)景時(shí),中間目標(biāo)存在嚴(yán)重的被遮蔽干擾,2側(cè)攝象頭無法保證得到中間目標(biāo)完整的側(cè)面信息。另外,在多數(shù)條件下,過于寬闊的場(chǎng)景入口給硬件安排也帶來了不便,允許2個(gè)以內(nèi)目標(biāo)同時(shí)進(jìn)入適用于大多數(shù)應(yīng)用場(chǎng)合(比如共車門口,可以觀察到幾乎沒有3個(gè)人同時(shí)進(jìn)入的情形),引入多個(gè)目標(biāo)在大大增加數(shù)據(jù)處理量的同時(shí),引入了更多的變動(dòng)因素,人為的調(diào)高了系統(tǒng)的設(shè)計(jì)復(fù)雜度,增加了誤報(bào)和漏報(bào)風(fēng)險(xiǎn),是沒有必要的。因此,本文主要討論2個(gè)以下的目標(biāo)進(jìn)入情景, 從理論方向保證了系統(tǒng)的計(jì)數(shù)精度。3圖象目標(biāo)的歸一化處理3.1 引言 數(shù)學(xué)上的歸一化運(yùn)算是把一個(gè)數(shù)據(jù)集
39、統(tǒng)一到一個(gè)標(biāo)準(zhǔn)尺度下的計(jì)算。在圖象處理中,對(duì)某一個(gè)場(chǎng)景取樣,可以把取樣的圖象看作是一個(gè)多元函數(shù),它表明圖象的內(nèi)容是隨時(shí)間和空間變化的。假定在連續(xù)場(chǎng)景中存在一個(gè)我們感興趣的目標(biāo),我們把含有且只含有該目標(biāo)的一系列連續(xù)的圖象禎稱為相關(guān)采樣圖象,把組成該目標(biāo)的象素在這些圖象中的表達(dá)函數(shù)記為,這個(gè)函數(shù)我們稱為目標(biāo)函數(shù)。它反應(yīng)了目標(biāo)在相關(guān)采樣圖象中的時(shí)空特征。那么顯然, 也是隨時(shí)空變化的。為了識(shí)別該目標(biāo),必須能夠找到一個(gè)相對(duì)穩(wěn)定的特征來代替這個(gè)變化的目標(biāo)函數(shù),歸一化就是其中一種思路。圖象處理中歸一化的基本思想是,通過相應(yīng)的參數(shù)確定一個(gè)算子,用該算子與目標(biāo)函數(shù)進(jìn)行某種運(yùn)算,得到一個(gè)新的函數(shù)。新函數(shù)至少在相關(guān)
40、采樣圖象的采樣時(shí)間內(nèi)對(duì)時(shí)間不敏感,并且坐標(biāo)位置的變化比原函數(shù)要小,相當(dāng)于將變化的目標(biāo)函數(shù)統(tǒng)一到了一個(gè)模板函數(shù)之下。這樣,就成功的減小了目標(biāo)的形態(tài),角度,位置變化給識(shí)別判斷帶來的影響,從而提高識(shí)別率。3.2 圖象歸一化的基本問題通過攝象頭抓取采樣圖象是把三維空間信息表達(dá)成二維信息的過程,所以我們無法從一幅二維圖象中確定每個(gè)象素的位置深度,即該點(diǎn)和攝像頭之間的距離。經(jīng)驗(yàn)告訴我們,當(dāng)某個(gè)目標(biāo)離攝象頭遠(yuǎn)的時(shí)候,它在采樣圖中占有的尺寸比例會(huì)相應(yīng)的減小,反之則增大。但它的實(shí)際大小究竟如何,沒有一個(gè)固定的參照很難得出結(jié)論。實(shí)際上,攝象頭帶來的尺寸縮放并不是一個(gè)嚴(yán)格按離開攝像頭的距離之比例變化的函數(shù),也就是說
41、,攝象頭不是一個(gè)按距離縮放的線性器件。特別對(duì)于一個(gè)三維物體,它的各個(gè)部分按照所處位置距離攝像頭的不同,被放大縮小的比例顯然并不一致。假設(shè)有一個(gè)采樣圖平面集,它們垂直于自身中心與攝象頭中心的連線,如圖,我們把這個(gè)平面集稱為標(biāo)準(zhǔn)平面集圖3.1 標(biāo)準(zhǔn)平面集 圖3.1 標(biāo)準(zhǔn)平面集 距離d . 攝象頭 Figure 3.1 standard planes set 考察其中一個(gè)標(biāo)準(zhǔn)平面與攝象頭的距離d,以及平面上象素和攝象頭中心的角度,如圖攝象頭 攝象頭 距離d 圖3.2 標(biāo)準(zhǔn)平面上象素與攝象頭的幾何關(guān)系Figure 3.2 the geometric relationships between a pi
42、xel in a standard plane and camera 按照簡(jiǎn)單的設(shè)想,由象素構(gòu)成物體的尺寸只與各象素與攝象頭的距離有關(guān), 前提是認(rèn)為攝象頭是一個(gè)按距離縮放的線性器件。不妨設(shè)這個(gè)比例函數(shù)為,距離不同,各象素點(diǎn)的坐標(biāo)需要相應(yīng)的調(diào)整,這樣才能讓整個(gè)物體的平面尺寸得到真實(shí)的反應(yīng)。 以標(biāo)準(zhǔn)平面的中心為原點(diǎn)建立直角坐標(biāo)系,那么,單個(gè)象素的坐標(biāo)x, y的調(diào)整式為 ; (3.1)式中是象素的原坐標(biāo),是新坐標(biāo),是該象素與攝象頭中心連線和平面中心和攝象頭中心連線的夾角。顯然,當(dāng)?shù)闹挡皇呛艽髸r(shí),新坐標(biāo)的變化也不大,也就是說,存在一個(gè)以標(biāo)準(zhǔn)平面中心為核心的鄰域,使得該區(qū)域內(nèi)的象素可以使用統(tǒng)一的比例函數(shù)
43、作為坐標(biāo)調(diào)整的依據(jù)。實(shí)際上,得到一個(gè)三維物體各部分的精確尺度并不是一個(gè)必要的環(huán)節(jié),基于其他顯著特征或特征匹配的圖象識(shí)別技術(shù)甚至不要求得到清晰的圖象輪廓。而基于輪廓的特征提取方案,最感興趣的顯然是圖象中物體的外形輪廓。為了解決這個(gè)問題,參考上面的敘述,我們可以取一個(gè)標(biāo)準(zhǔn)平面,并認(rèn)為,靠近該平面中心的某個(gè)鄰域內(nèi),物體的尺寸與距離攝象頭中心的距離存在一個(gè)相同的比例關(guān)系。比例確定以后,我們還需要一個(gè)固定的參照。這個(gè)參照是為了解決以誰(shuí)為標(biāo)準(zhǔn)進(jìn)行比例縮放的問題。為了方便起見,不妨認(rèn)為該參照平面也是一個(gè)標(biāo)準(zhǔn)平面,并且與攝象頭之間存在一個(gè)固定的距離,外形和大小相同的物體在該參照平面下有固定的尺寸。那么,依據(jù)這
44、個(gè)參照尺度進(jìn)行調(diào)整,可以認(rèn)為,調(diào)整后的圖象是處于同一個(gè)標(biāo)準(zhǔn)平面模式下。這樣,我們開始所關(guān)心的問題可以表達(dá)成如下幾個(gè)方面:采樣圖象中物體的輪廓是否處在一個(gè)標(biāo)準(zhǔn)平面上2. 在容許的誤差范圍內(nèi)如何確定該平面中心附近的一個(gè)區(qū)域,讓該區(qū)域內(nèi)的象素坐標(biāo)可以按照統(tǒng)一比例進(jìn)行調(diào)整3. 如何確定一個(gè)參照尺度,在采樣圖象中容易找到相應(yīng)的尺度,以確定調(diào)整的比例3.3 歸一化轉(zhuǎn)動(dòng)角參數(shù)的確定由于人的頭部旋轉(zhuǎn)的可能性比較大,所以抓取側(cè)面圖象的時(shí)候,并不能保證側(cè)面輪廓處于某一個(gè)標(biāo)準(zhǔn)平面上。但從俯視角度,可以找到一條平分頭發(fā)區(qū)域的直線。由于人體的對(duì)稱性,我們知道該直線與人的鼻尖或下巴尖共同決定了一個(gè)平面,而側(cè)面輪廓也必然包
45、含鼻尖,下巴尖和頭頂部分,于是可以認(rèn)為,平面非常貼近側(cè)面輪廓所在的平面,這個(gè)貼近的程度取決于與人的對(duì)稱線重合的程度。在實(shí)際應(yīng)用中,不妨認(rèn)為這2個(gè)平面是重合的。于是可以認(rèn)為,由直線和鼻尖,下巴尖共同構(gòu)成了人的側(cè)面頭部輪廓平面,該平面與上節(jié)所講的標(biāo)準(zhǔn)平面之間存在一個(gè)夾角。設(shè)這個(gè)夾角為,如果我們把這個(gè)平面旋轉(zhuǎn)角度,那么人的頭部輪廓就位于一個(gè)標(biāo)準(zhǔn)平面之內(nèi)了。這就回答了3-2節(jié)提出的第一個(gè)問題。那么我們?nèi)绾巫岊^部輪廓平面旋轉(zhuǎn)呢,這個(gè)旋轉(zhuǎn)角度到底如何確定?事實(shí)上,直線與標(biāo)準(zhǔn)平面存在如圖的幾何關(guān)系圖3.3 直線與標(biāo)準(zhǔn)平面幾何關(guān)系(俯視圖) 圖3.3 直線與標(biāo)準(zhǔn)平面幾何關(guān)系(俯視圖) 標(biāo)準(zhǔn)平面 直線(側(cè)輪廓平
46、面) 理想的頭部區(qū)域 Figure 3.3 the geometric relationships between line and standard plane 由上述內(nèi)容我們知道直線與頭部輪廓處在同一平面,但與標(biāo)準(zhǔn)平面的夾角未必就等于2個(gè)平面的夾角,由幾何關(guān)系可知,當(dāng)且僅當(dāng)該直線垂直于2平面交線的時(shí)候,直線與平面的夾角才等于平面之間的夾角。問題在于,從俯視角度,頭部輪廓平面是否如圖3.3,可以完全被直線遮蔽。由于人體的對(duì)稱特點(diǎn),如果只考慮頸部旋轉(zhuǎn),不考慮頸部向旁側(cè)的扭動(dòng),即頭部始終保持俯視角度的端正,那么直線一定可以完全遮蔽其側(cè)面輪廓平面,即在俯視角度用該直線代替整個(gè)輪廓平面。而標(biāo)準(zhǔn)平面是
47、正對(duì)側(cè)面攝象頭的平面,對(duì)于頂部俯視角度而言,它可以被頂部攝像頭采樣圖中的任意一條平行于y軸的直線代替表示。這樣2個(gè)平面的夾角就簡(jiǎn)化成了2條直線的夾角。聯(lián)系前面的章節(jié),我們把這個(gè)尋找夾角的過程表達(dá)出來,步驟如下:通過頂部攝像頭采樣圖像,尋找目標(biāo)質(zhì)點(diǎn)對(duì)每一個(gè)目標(biāo)質(zhì)點(diǎn)選擇一個(gè)相應(yīng)的區(qū)域,尋找一條直線將此區(qū)域內(nèi)的象素平分將此直線與采樣圖縱坐標(biāo)夾角記為步驟1的方法在2-2中已經(jīng)進(jìn)行了詳細(xì)介紹,這里我們給出步驟2的具體方法:對(duì)于步驟1尋找到的目標(biāo)質(zhì)點(diǎn),以該點(diǎn)為中心,取一個(gè)邊長(zhǎng)從到之間變化的正方形區(qū)域。為了盡量避開對(duì)整個(gè)采樣圖的計(jì)算,減少多目標(biāo)之間的互相干擾和其他非相關(guān)象素的干擾,提高人目標(biāo)頭部區(qū)域平分線的
48、精度,我們需要選擇一個(gè)合理的區(qū)域,盡量包含對(duì)應(yīng)于單個(gè)目標(biāo)質(zhì)點(diǎn)的可能的頭部區(qū)域,同時(shí)避開其他的非相關(guān)區(qū)域。根據(jù)人目標(biāo)頭部在頂端采樣圖中可能的尺寸,我們先確定其邊界,即包含一個(gè)人的頭部區(qū)域的正方形的最小尺寸不小于,同時(shí)不大于。在確定正方形邊長(zhǎng)范圍以后,通過步長(zhǎng)進(jìn)行區(qū)域匹配。一個(gè)最優(yōu)的正方形區(qū)域必須滿足如下條件:(1)以目標(biāo)質(zhì)點(diǎn)為中心,區(qū)域內(nèi)絕大多數(shù)象素的灰度值不低于某個(gè)閥值,該值的確定需要參照目標(biāo)質(zhì)點(diǎn)的灰度值;(2)該區(qū)域內(nèi)象素灰度值的方差不大于某個(gè)閥值;(3)該區(qū)域內(nèi)大于目標(biāo)質(zhì)點(diǎn)灰度值的象素的面積不小于正方形區(qū)域面積的一半,灰度值滿足條件(1)的象素面積不小于正方形區(qū)域的80%;(4)該區(qū)域滿足
49、條件(1),(2),(3),且是邊界范圍內(nèi)尋找到的一個(gè)最大的正方形區(qū)域。由于上述的條件(2)需要對(duì)區(qū)域內(nèi)象素的進(jìn)行方差運(yùn)算,對(duì)實(shí)時(shí)系統(tǒng)的要求較高,我們可以提高條件(1)的閥值,由于目標(biāo)質(zhì)點(diǎn)主要取決于周圍象素的灰度值,可以認(rèn)為它近似的等于周圍某區(qū)域內(nèi)的象素平均灰度值,加上閥值限制,則質(zhì)點(diǎn)周圍某正方形區(qū)域內(nèi)的象素灰度值的方差可以得到理論上的保證,對(duì)于這樣的正方形區(qū)域,可以省去條件(2)的判斷。如果能夠找到滿足以上4個(gè)條件的正方形區(qū)域,結(jié)束步驟2,轉(zhuǎn)步驟3;否則判斷該目標(biāo)質(zhì)點(diǎn)為無效質(zhì)點(diǎn),取采樣圖中下一個(gè)目標(biāo)質(zhì)點(diǎn),進(jìn)行步驟2,3的操作。到這里我們已經(jīng)回答了本章節(jié)開始提出的問題,得到了確定夾角的完整步驟
50、。在不考慮人目標(biāo)頸部側(cè)向扭動(dòng)的假設(shè)前提下,可以將本章節(jié)內(nèi)容概括為如下流程:圖3.4 計(jì)算夾角圖3.4 計(jì)算夾角流程 是 否 確定區(qū)域平分線計(jì)算直線與采樣圖軸夾角 是否滿足最優(yōu)條件 尋找正方形區(qū)域 目標(biāo)質(zhì)點(diǎn) 頂端采樣圖 Figure 3.4 process of calculate angle 由本節(jié)開始的問題,我們計(jì)算這個(gè)夾角是為了指導(dǎo)平面旋轉(zhuǎn)。其實(shí)平面并沒改變,各點(diǎn)在此平面上的坐標(biāo)也沒改變,但從視覺角度,經(jīng)過旋轉(zhuǎn)以后,各點(diǎn)的橫坐標(biāo)將發(fā)生變化,而從俯視角度看,旋轉(zhuǎn)是繞軸進(jìn)行的,目的是讓輪廓平面與標(biāo)準(zhǔn)平面重合。故輪廓平面縱坐標(biāo)不發(fā)生變化。記原平面上某點(diǎn)的象素坐標(biāo)為,將此平面轉(zhuǎn)動(dòng)角度,則該點(diǎn)對(duì)應(yīng)的
51、轉(zhuǎn)動(dòng)后的視覺坐標(biāo)顯然滿足 , (3.2)這樣,我們就解答了圖象歸一化基本問題的第一個(gè)問題,讓物體輪廓處在一個(gè)標(biāo)準(zhǔn)平面上。事實(shí)上,這也是整個(gè)歸一化過程的第一步。它的作用是,將側(cè)面采樣圖置于視覺上的標(biāo)準(zhǔn)平面,抵消由于人頭部的旋轉(zhuǎn)帶來的輪廓凹進(jìn)。必須指出的是,這個(gè)抵消作用只在一個(gè)不大的角度范圍內(nèi)適用。當(dāng)人的頭部旋轉(zhuǎn)角度過大,甚至接近正面采樣效果的時(shí)候,側(cè)面采樣圖中將無法找到鼻子,嘴巴,下巴等突出部分的外形輪廓,此時(shí)利用夾角參數(shù)來轉(zhuǎn)動(dòng)平面得到各象素的視覺坐標(biāo), 一定會(huì)產(chǎn)生失真,這個(gè)失真的嚴(yán)重程度取決于實(shí)際的轉(zhuǎn)動(dòng)角度的大小。在實(shí)際應(yīng)用中,小于40度的轉(zhuǎn)動(dòng)角是可以接受的。3.4 輪廓平面上目標(biāo)區(qū)域的確定歸
52、一化的第二個(gè)問題是,如何在輪廓平面上確定一個(gè)區(qū)域,使得這個(gè)區(qū)域能夠包含人目標(biāo)的頭部輪廓,為后續(xù)平移和比例調(diào)整帶來方便的同時(shí),降低大范圍歸一化帶來的幾何誤差。當(dāng)輪廓平面和標(biāo)準(zhǔn)平面重合以后,它的輪廓效果已經(jīng)大致接近位于目標(biāo)正側(cè)面的采樣效果。為方便后續(xù)論述,我們把采樣圖經(jīng)過旋轉(zhuǎn)后得到的標(biāo)準(zhǔn)平面稱為采樣標(biāo)準(zhǔn)平面。由3-2可知,這時(shí)候我們?nèi)匀浑y以確定輪廓平面(此時(shí)也可以稱標(biāo)準(zhǔn)平面)與側(cè)面攝象頭的距離,從而無法確定圖象目標(biāo)的實(shí)際尺寸。特別當(dāng)目標(biāo)輪廓靠近側(cè)面采樣圖的邊界時(shí),由于攝象頭的非線性縮放特性,目標(biāo)輪廓的外形和尺寸都會(huì)產(chǎn)生偏差,尤其是輪廓外形的偏差是很難用圖象的方法去復(fù)原的。于是,我們想到,在放置攝像
53、頭時(shí)將此情況考慮在內(nèi),讓側(cè)面攝像頭的高度能夠讓大多數(shù)人目標(biāo)的頭部區(qū)域經(jīng)過采樣圖的中心區(qū)域。當(dāng)側(cè)面采樣圖中的目標(biāo)輪廓距離這個(gè)中心區(qū)域太遠(yuǎn)的時(shí)候,對(duì)該目標(biāo)應(yīng)舍棄。這種舍棄主要針對(duì)了如下情況:即人目標(biāo)在采樣瞬間已經(jīng)快要通過側(cè)面攝象頭的抓圖范圍。由于人的側(cè)面采樣圖并不一定能找到象頭部那樣集中的低灰度區(qū)域,整個(gè)采樣圖的灰度分布也很難給出規(guī)律性的評(píng)價(jià)。我們面臨的問題如下:1. 如何在側(cè)面圖中確定人目標(biāo)頭部輪廓所在區(qū)域2. 如何確定該區(qū)域與采樣標(biāo)準(zhǔn)平面中心的距離,以及判斷是否需要舍棄和俯視角度不同,側(cè)面的灰度分布具有很大的隨機(jī)性,即使采樣圖中只有一個(gè)目標(biāo),依靠直接的灰度信息也很難找到頭部區(qū)域可能的位置,當(dāng)采
54、樣圖中包含多個(gè)人目標(biāo)和其他干擾目標(biāo)的時(shí)候,尋找可能是頭部的區(qū)域顯得更加困難。但是,我們?nèi)匀恍枰业揭粋€(gè)位于頭部區(qū)域中心或接近區(qū)域中心的點(diǎn),作為減小誤差,減少計(jì)算和提高判斷精度的依據(jù)。于是我們想到適用于頂部攝像頭采樣圖的尋找目標(biāo)質(zhì)點(diǎn)思路,可以認(rèn)為,如果側(cè)面采樣圖中有人目標(biāo)存在,那么他的頭部具有相對(duì)于其他區(qū)域更豐富的輪廓線,這個(gè)輪廓線集中的區(qū)域就是我們要尋找的擬人目標(biāo)的頭部區(qū)域。采用尋找目標(biāo)質(zhì)點(diǎn)的思路,我們先對(duì)側(cè)面采樣圖進(jìn)行輪廓提取,對(duì)整個(gè)圖的輪廓象素統(tǒng)一置1,其他置0。然后計(jì)算該圖的象素重心,同樣, 考慮到多個(gè)目標(biāo)(包括人目標(biāo)和干擾目標(biāo)),該重心可能并不落在某個(gè)目標(biāo)的輪廓區(qū)域之內(nèi),所以采用建立直
55、角坐標(biāo)和區(qū)域描述的方法,分區(qū)間尋找輪廓重心。其實(shí)現(xiàn)步驟描述如下:在整個(gè)輪廓圖上尋找象素重心,若此點(diǎn)與圖中心點(diǎn)距離超過30,則轉(zhuǎn)步驟3。以該點(diǎn)為中心劃定一個(gè)正方形區(qū)域,邊界分別以上下左右的邊緣象素所在坐標(biāo)位置為邊界,轉(zhuǎn)步驟2考察此區(qū)域內(nèi)象素的數(shù)目和它們距離重心的距離均值,考慮頭部區(qū)域的標(biāo)準(zhǔn)尺寸,該值應(yīng)不小于一個(gè)標(biāo)準(zhǔn)值范圍的75%(5590),且距離均值方差應(yīng)在一個(gè)給定的范圍內(nèi)(1420),判斷此區(qū)域?yàn)橛行^(qū)域,否則轉(zhuǎn)步驟3以原重心為中心建立直角坐標(biāo)系,在橫坐標(biāo)2邊重新尋找各自的輪廓重 心,并分別轉(zhuǎn)步驟1,若不能找到有效區(qū)域,則在縱坐標(biāo)2邊重新尋找各自的輪廓重心,并分別轉(zhuǎn)步驟1。若仍然不能找到有效
56、區(qū)域,則在該直角坐標(biāo)系四象限中最大的2個(gè)象限中尋找 。在此步驟的任何一個(gè)情況下,若找到有效區(qū)域,且區(qū)域最短邊大于一個(gè)標(biāo)準(zhǔn)側(cè)面頭部區(qū)域的75%,則返回其重心坐標(biāo)和區(qū)域邊界信息,并結(jié)束整個(gè)步驟,不再考慮其余情況。經(jīng)過上述步驟找到的有效區(qū)域,是輪廓線條豐富而且集中的區(qū)域,為了提供更多的選擇,我們還可以利用下面的判斷方法。假設(shè)側(cè)面采樣圖中存在人目標(biāo),那么在理想狀態(tài)下,他的頭部輪廓應(yīng)該是一條比較長(zhǎng)的曲線,該曲線兩端以頸部為結(jié)束點(diǎn)。根據(jù)這個(gè)特點(diǎn), 先提取采樣圖的輪廓,制定搜索區(qū)域,然后尋找一條長(zhǎng)度和彎曲程度滿足一定條件的曲線,就可以據(jù)此判斷找到一個(gè)可能是人頭部的區(qū)域,并返回該區(qū)域內(nèi)的某個(gè)點(diǎn)坐標(biāo)?,F(xiàn)在,考慮
57、實(shí)際情況和理想情況的差別,首先,實(shí)際的輪廓圖中人的頭部輪廓不一定是連續(xù)的曲線,其次,我們需要找到搜索這條曲線的大致范圍,使用全圖搜索顯然會(huì)引入衣服等更多的干擾輪廓并且難以解決多目標(biāo)帶來的多區(qū)域劃分,再者,在人的頭部曲線和身體輪廓線連接的地方,如何確定頭部曲線的結(jié)束點(diǎn),以防止將整個(gè)的輪廓鏈作為頭輪廓,擴(kuò)大了頭部輪廓的實(shí)際區(qū)域,給后續(xù)檢驗(yàn)帶來極大不便。觀察大多數(shù)側(cè)面圖的輪廓效果發(fā)現(xiàn),人的頭部輪廓曲線存在的斷點(diǎn)不會(huì)距離很遠(yuǎn),我們考慮一個(gè)斷點(diǎn)判斷準(zhǔn)則,在滿足該準(zhǔn)則的條件下,將斷點(diǎn)視為連續(xù);其次考慮輪廓包含的分叉線條,確定一個(gè)舍去準(zhǔn)則,保留長(zhǎng)度最大的曲線,舍去其余分叉曲線;最后,考慮誤差和頭頸連接因素,
58、制定截止準(zhǔn)則,由該準(zhǔn)則指導(dǎo)曲線搜索的截止。以上三個(gè)準(zhǔn)則均用于勾勒頭部輪廓曲線,為進(jìn)一步提高可靠度,需要計(jì)算該輪廓曲線的曲率。可以認(rèn)為,沒有其他目標(biāo)干擾的情況下的單個(gè)人體輪廓中, 頭部輪廓擁有最大的彎曲,此項(xiàng)計(jì)算可以更進(jìn)一步幫助我們完成頭部輪廓的區(qū)域定位。以上的內(nèi)容具體步驟描述如下:1. 對(duì)前面得到的有效區(qū)域的重心,考察與采樣標(biāo)準(zhǔn)平面中心的關(guān)系,考慮誤差容許,以采樣標(biāo)準(zhǔn)平面的中心為圓心,劃定一個(gè)半徑為的圓,若落在圓區(qū)域內(nèi),認(rèn)為此輪廓區(qū)域誤差在可接受范圍,轉(zhuǎn)步驟22. 在區(qū)域內(nèi)搜索尋找一條長(zhǎng)度,跨度,彎曲度分別不小于某規(guī)定值的曲線,若能夠找到,判斷此區(qū)域?yàn)橛行?,返回區(qū)域邊界信息和區(qū)域重心坐標(biāo)到采樣
59、標(biāo)準(zhǔn)平面中。按照前面提到的各項(xiàng)準(zhǔn)則,此步驟執(zhí)行程序如下:(1)在搜索區(qū)域內(nèi)左下位置(0,0)開始, 到右上方(M,N)結(jié)束,找到左下角第一個(gè)不為0的象素為基準(zhǔn);(2)搜索該象素周圍象素,若找到距離基準(zhǔn)象素不超過4,橫縱坐標(biāo)距離分別不超過2且值為1的象素,認(rèn)為其滿足連續(xù)準(zhǔn)則;如果找到的象素距離基準(zhǔn)象素橫縱坐標(biāo)之差分別不超過1,則認(rèn)為該象素是嚴(yán)格連續(xù)的(3)在所有滿足連續(xù)準(zhǔn)則的象素中,選擇與基準(zhǔn)象素橫縱坐標(biāo)距離之和最小的象素為基準(zhǔn)象素,當(dāng)同時(shí)有多個(gè)象素滿足此條件時(shí),優(yōu)先選擇嚴(yán)格連續(xù)象素為新基準(zhǔn)象素,并舍棄其他非嚴(yán)格連續(xù)的象素,此步驟允許存在多個(gè)新基準(zhǔn)象素。(4)在新的基準(zhǔn)象素位置重復(fù)步驟(2),直
60、到無法找到新的基準(zhǔn)象素或者得到一條長(zhǎng)度不小于值的曲線為止。對(duì)于長(zhǎng)度大于的曲線,以鏈碼形式返回其象素坐標(biāo);將所有不滿足長(zhǎng)度準(zhǔn)則,跨度準(zhǔn)則的曲線象素置為0(5)對(duì)于滿足步驟(4)條件的曲線,均勻節(jié)選曲線上i個(gè)點(diǎn),標(biāo)注每個(gè)點(diǎn)的斜率為集合(,若不小于值,則認(rèn)為滿足彎曲條件,結(jié)束搜索。否則從步驟(1)的基準(zhǔn)點(diǎn)開始,在搜索區(qū)域內(nèi)尋找下一個(gè)基準(zhǔn)點(diǎn),并重復(fù)上述步驟。在經(jīng)過以上計(jì)算和程序執(zhí)行以后,我們已經(jīng)從2個(gè)方向上進(jìn)行了是否為人目標(biāo)頭部區(qū)域的驗(yàn)證,并且保證了該區(qū)域偏離采樣標(biāo)準(zhǔn)平面中心在一個(gè)小的圓形區(qū)域內(nèi),即將該區(qū)域以其重心為基準(zhǔn)移動(dòng)到采樣圖中心,這樣做的依據(jù)是,對(duì)某個(gè)區(qū)域要按照統(tǒng)一比例進(jìn)行調(diào)整, 該區(qū)域一定要
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年人教五四新版七年級(jí)物理上冊(cè)月考試卷
- 2025年度新能源汽車銷售及售后服務(wù)合同范本8篇
- 行業(yè)退出中的政策建議分析-洞察分析
- 2025年滬科版七年級(jí)生物下冊(cè)階段測(cè)試試卷含答案
- 2025年外研版2024八年級(jí)地理上冊(cè)月考試卷含答案
- 部編版七年級(jí)語(yǔ)文上冊(cè)《散步》教學(xué)設(shè)計(jì)9
- 二零二五年度智慧城市運(yùn)營(yíng)服務(wù)出資協(xié)議3篇
- 2025年度地下綜合交通樞紐車位租賃合同4篇
- 二零二五年度床上用品租賃服務(wù)合同9篇
- 2025年度汽車租賃與車聯(lián)網(wǎng)技術(shù)集成合同2篇
- 2025年經(jīng)濟(jì)形勢(shì)會(huì)議講話報(bào)告
- 北師大版小學(xué)三年級(jí)上冊(cè)數(shù)學(xué)第五單元《周長(zhǎng)》測(cè)試卷(含答案)
- 國(guó)家安全責(zé)任制落實(shí)情況報(bào)告3篇
- 2024年度順豐快遞冷鏈物流服務(wù)合同3篇
- 六年級(jí)下冊(cè)【默寫表】(牛津上海版、深圳版)(漢譯英)
- 合同簽訂培訓(xùn)
- 新修訂《保密法》知識(shí)考試題及答案
- 電工基礎(chǔ)知識(shí)培訓(xùn)課程
- 鐵路基礎(chǔ)知識(shí)題庫(kù)單選題100道及答案解析
- 金融AI:顛覆與重塑-深化理解AI在金融行業(yè)的實(shí)踐與挑戰(zhàn)
- 住宅樓安全性檢測(cè)鑒定方案
評(píng)論
0/150
提交評(píng)論