計(jì)算機(jī)視覺(jué)關(guān)鍵技術(shù)在通信工程的應(yīng)用_第1頁(yè)
計(jì)算機(jī)視覺(jué)關(guān)鍵技術(shù)在通信工程的應(yīng)用_第2頁(yè)
計(jì)算機(jī)視覺(jué)關(guān)鍵技術(shù)在通信工程的應(yīng)用_第3頁(yè)
計(jì)算機(jī)視覺(jué)關(guān)鍵技術(shù)在通信工程的應(yīng)用_第4頁(yè)
計(jì)算機(jī)視覺(jué)關(guān)鍵技術(shù)在通信工程的應(yīng)用_第5頁(yè)
已閱讀5頁(yè),還剩1頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、計(jì)算機(jī)視覺(jué)關(guān)鍵技術(shù)在通信工程的應(yīng)用 摘要:本文首先總結(jié)了計(jì)算機(jī)視覺(jué)領(lǐng)域的重要關(guān)鍵技術(shù)和典型算法模型,然后介紹了這些技術(shù)在通信工程領(lǐng)域內(nèi)設(shè)備安裝、施工驗(yàn)收、三維測(cè)量和天面核查等4種典型場(chǎng)景下的應(yīng)用方案及實(shí)施效果,將為通信工程行業(yè)構(gòu)建數(shù)字孿生網(wǎng)絡(luò)提供有益探索。 關(guān)鍵詞:計(jì)算機(jī)視覺(jué);圖像質(zhì)檢;全景圖像;三維測(cè)量;目標(biāo)檢測(cè) 計(jì)算機(jī)視覺(jué)(CV)是指用計(jì)算機(jī)來(lái)模擬人的視覺(jué)系統(tǒng),去實(shí)現(xiàn)人的視覺(jué)功能,以適應(yīng)、理解外界環(huán)境和控制自身的運(yùn)動(dòng)。數(shù)據(jù)、算力和模型是計(jì)算機(jī)視覺(jué)行業(yè)發(fā)展的三大基石。2000年之后,數(shù)據(jù)量的上漲、運(yùn)算力的提升和深度學(xué)習(xí)算法的出現(xiàn)促進(jìn)了計(jì)算機(jī)視覺(jué)行業(yè)的迅猛發(fā)展。隨著高性能智能終端的普及和影像采

2、集設(shè)備成本的下降,通信行業(yè)逐漸在勘察、施工、優(yōu)化和運(yùn)維等領(lǐng)域積累了大量非結(jié)構(gòu)化的圖像數(shù)據(jù)。同時(shí),圖像處理器(GPU)的便利應(yīng)用也為開展高強(qiáng)度并行計(jì)算提供了算力基礎(chǔ)。 1計(jì)算機(jī)視覺(jué)領(lǐng)域的關(guān)鍵技術(shù) 1.1重要關(guān)鍵技術(shù)。計(jì)算機(jī)視覺(jué)技術(shù)發(fā)展迅猛,在通信工程領(lǐng)域應(yīng)用價(jià)值較高的主要有圖像分類、目標(biāo)檢測(cè)、圖像分割、場(chǎng)景文字識(shí)別和圖像生成5類。1.1.1圖像分類。圖像分類主要的研究?jī)?nèi)容是對(duì)圖像進(jìn)行特征描述。通常,圖像分類算法通過(guò)手工特征或者特征學(xué)習(xí)方法對(duì)整個(gè)圖像進(jìn)行全局描述,并依據(jù)圖像特征圖的不同語(yǔ)義信息進(jìn)行分類。該技術(shù)廣泛應(yīng)用于人臉識(shí)別、車輛識(shí)別、手寫文件或印刷識(shí)別等場(chǎng)景。常用的圖像分類模型包括AlexNe

3、t、VGG、ResNet、InceptionV4、MobileNetV3和ShuffleNet等。1.1.2目標(biāo)檢測(cè)。作為計(jì)算機(jī)視覺(jué)的一個(gè)重要分支,目標(biāo)檢測(cè)的任務(wù)是在一幅圖像或視頻中找到目標(biāo)類別和目標(biāo)位置。與圖像分類不同,目標(biāo)檢測(cè)側(cè)重于物體搜索,被檢測(cè)目標(biāo)必須有固定的形狀和輪廓。而圖像分類可以是任意目標(biāo)包括物體、屬性和場(chǎng)景等。目標(biāo)檢測(cè)已在人臉識(shí)別和自動(dòng)駕駛領(lǐng)域取得了非常顯著的效果,經(jīng)典的檢測(cè)模型有1.1.3圖像分割。圖像分割指的是將數(shù)字圖像細(xì)分為多個(gè)圖像子區(qū)域(像素的集合,也被稱作超像素)的過(guò)程。圖像分割的目的是簡(jiǎn)化或改變圖像的表示形式,使得圖像更容易理解和分析。圖像語(yǔ)義分割是一個(gè)像素級(jí)別的物

4、體識(shí)別,即每個(gè)像素點(diǎn)都要判斷它的類別。MaskR-CNN就是一種經(jīng)典的實(shí)力分割網(wǎng)絡(luò)。1.1.4場(chǎng)景文字識(shí)別。場(chǎng)景文字識(shí)別分為兩部分,首先通過(guò)目標(biāo)檢測(cè)來(lái)檢測(cè)出目標(biāo)區(qū)域,然后通過(guò)CRNN-CTC模型將網(wǎng)絡(luò)特征轉(zhuǎn)為文字序列。場(chǎng)景文字識(shí)別廣泛應(yīng)用于路牌識(shí)別和車牌檢測(cè)等領(lǐng)域。1.1.5圖像生成。圖像生成是指使用對(duì)抗網(wǎng)絡(luò)(GAN)根據(jù)輸入的隨機(jī)噪聲或向量生成目標(biāo)圖像。生成器和識(shí)別器是對(duì)抗網(wǎng)絡(luò)的重要組成部分。1.2典型算法模型近年來(lái),計(jì)算機(jī)視覺(jué)領(lǐng)域的優(yōu)秀算法層出不窮,以下介紹本文中研究使用的一些模型。1.2.1VGGNet2014年,牛津大學(xué)計(jì)算機(jī)視覺(jué)組和谷歌公司的研究員聯(lián)合研發(fā)出一種新的深度卷積神經(jīng)網(wǎng)絡(luò),

5、即VGGNet,并獲得當(dāng)年ILSVRC分類比賽的亞軍。VGGNet分為VGG16和VGG19,VGG16通過(guò)13層33的卷積網(wǎng)絡(luò)和3層全連接網(wǎng)絡(luò)構(gòu)建,VGG19則通過(guò)16層33的卷積網(wǎng)絡(luò)和3層全連接網(wǎng)絡(luò)構(gòu)建。VGG19被廣泛應(yīng)用于不同行業(yè)的圖像特征提取領(lǐng)域。1.2.2ResNet101。深度殘差網(wǎng)絡(luò)(ResNet101)是過(guò)去幾年中計(jì)算機(jī)視覺(jué)領(lǐng)域頗具開創(chuàng)性的算法。因其強(qiáng)大的表征能力,除圖像分類以外,包括目標(biāo)檢測(cè)和人臉識(shí)別在內(nèi)的許多計(jì)算機(jī)視覺(jué)應(yīng)用都得到了性能提升。ResNet101是其中的一種網(wǎng)絡(luò)堆疊方式,101層網(wǎng)絡(luò)指全連接層數(shù)目。1.2.3SIFT。尺度不變特征轉(zhuǎn)換(SIFT)是一種用來(lái)偵測(cè)

6、與描述影像局部性特征的重要算法。SIFT算法主要用于處理兩幅圖像之間發(fā)生平移、旋轉(zhuǎn)和仿射變換情況下的匹配問(wèn)題。1.2.4MaskR-CNN。MaskR-CNN是一種簡(jiǎn)潔、靈活的圖像實(shí)例分割框架,用于判斷圖像中不同目標(biāo)的類別和位置,并可做出像素級(jí)預(yù)測(cè)。該算法不僅能夠有效地檢測(cè)圖像中的目標(biāo),而且還能為每個(gè)實(shí)例生成一個(gè)高質(zhì)量的分割掩 2通信工程中典型應(yīng)用與效果 2.1設(shè)備安裝方式檢測(cè)。蓄電池是通信機(jī)房?jī)?nèi)的重要基礎(chǔ)設(shè)施。按照設(shè)備屬性和機(jī)房空間等因素,蓄電池的安裝方式可分為臥式和立式兩種。在局房設(shè)計(jì)時(shí),需要因地制宜地制定安裝方式。在施工驗(yàn)收時(shí),需要關(guān)注是否按圖施工。通常,安裝方式的信息采集和現(xiàn)場(chǎng)核驗(yàn)都是

7、人工判斷并填注到相應(yīng)信息系統(tǒng)中,填報(bào)錯(cuò)誤時(shí)有發(fā)生。本文引入VGG19模型中的二分類法,基于常規(guī)勘察設(shè)計(jì)現(xiàn)場(chǎng)拍攝的蓄電池圖像,設(shè)計(jì)出自動(dòng)識(shí)別算法,如圖1所示。測(cè)試表明,在僅需100張標(biāo)注樣本數(shù)據(jù)時(shí),置信度即可達(dá)到0.95以上。同時(shí),借助移動(dòng)互聯(lián)網(wǎng)手段,在圖像信息采集終端中還可以實(shí)現(xiàn)實(shí)時(shí)識(shí)別及自動(dòng)填寫,如圖2所示,從而提升現(xiàn)場(chǎng)查勘人員信息填寫效率并降低人工填報(bào)錯(cuò)誤率。2.2施工工藝圖像質(zhì)檢。當(dāng)前家寬裝維人工抽檢覆蓋率低、成本高。人工質(zhì)檢依靠經(jīng)驗(yàn),存在漏檢和錯(cuò)檢的情況,結(jié)果不可靠。通過(guò)計(jì)算機(jī)視覺(jué)技術(shù)可構(gòu)建家客智能化質(zhì)檢手段,對(duì)家寬裝維質(zhì)量進(jìn)行跟蹤監(jiān)管,自動(dòng)識(shí)別安裝結(jié)果是否合格,提升質(zhì)檢效率,減少人工

8、成本,改善安裝質(zhì)量,提升家客業(yè)務(wù)支撐水平,最終達(dá)到降本、增效、提質(zhì)的愿景目標(biāo)。以實(shí)際應(yīng)用中效果較好的尾纖安裝質(zhì)檢為例,傳統(tǒng)的人工圖像質(zhì)檢存在檢測(cè)準(zhǔn)確率低且人力成本高的問(wèn)題,本文采用基于深度學(xué)習(xí)的圖像識(shí)別技術(shù),基于VGG19模型構(gòu)建了相應(yīng)的檢測(cè)算法模塊,如圖3所示。如圖4所示,基于66張尾纖布放樣本圖像,開展了二分類標(biāo)注(圖4左、中),隨機(jī)挑取10張照片用于測(cè)試驗(yàn)證(圖4右),置信度可達(dá)到0.954528,方法有效。2.3全景圖像三維測(cè)量。三維全景是基于全景圖像的真實(shí)場(chǎng)景虛擬現(xiàn)實(shí)技術(shù),將相機(jī)環(huán)繞一周360拍攝的一組或多組照片拼接成一個(gè)全景圖像,也可通過(guò)一次拍攝實(shí)現(xiàn)成像。通過(guò)拼接,經(jīng)過(guò)一系列數(shù)學(xué)計(jì)

9、算可以得到其球形全景的立方體投影圖。最后通過(guò)計(jì)算機(jī)技術(shù)實(shí)現(xiàn)全方位互動(dòng)式觀看的真實(shí)場(chǎng)景還原展示。本文設(shè)計(jì)并實(shí)現(xiàn)了一種基于SIFT算法的三維全景圖像測(cè)量方案,如圖5所示,基于該方案可以開展機(jī)房?jī)?nèi)設(shè)施和天面設(shè)施等場(chǎng)景的三維空間距離測(cè)量,3種試驗(yàn)場(chǎng)景下的驗(yàn)證誤差均在5%以內(nèi),如圖6所示。2.4天線數(shù)量目標(biāo)檢測(cè)。天面是5G網(wǎng)絡(luò)建設(shè)的重要資源,也制約到5G工程建設(shè)進(jìn)展。在日??睖y(cè)、優(yōu)化及維護(hù)工作中,往往積累了大量的天面歷史影像資料。通過(guò)引入圖像檢測(cè)算法,可以探索天面資源的自動(dòng)核查方法。本文應(yīng)用MaskR-CNN算法設(shè)計(jì)了基于天面照片圖5基于SIFT算法和全景照片的三維距離測(cè)量方案的天線數(shù)量檢測(cè)算法。首先,

10、圖像經(jīng)過(guò)ResNet101和特征金字塔網(wǎng)絡(luò)(FPN)結(jié)構(gòu),提取多層特征圖,然后經(jīng)過(guò)區(qū)域選取網(wǎng)絡(luò)(RPN)微調(diào)特征圖對(duì)應(yīng)錨框(Anchor)的偏移量并且將錨框劃分為前景和背景,之后將生成的感興趣區(qū)域(ROI)經(jīng)過(guò)排序,輸出相同大小的感興趣區(qū)域。如圖7所示,在訓(xùn)練階段,分類和掩膜兩個(gè)分支同時(shí)進(jìn)行。其中分類包括類別、置信度和邊界框回歸,掩膜分支則用于分割目標(biāo)。在測(cè)試階段,則是先經(jīng)過(guò)分類分支,再經(jīng)過(guò)掩膜分支。本文基于微軟Coco技術(shù)來(lái)量化評(píng)估目標(biāo)檢測(cè)的效果,具體指標(biāo)是所有交并比(IOU)閾值的平均精度(AP)、IOU閾值為0.5的AP(AP50)和IOU閾值為0.75的AP(AP75)。如圖7所示,基于200套照片訓(xùn)練MaskR-CNN模型,另外挑選100張照片進(jìn)行驗(yàn)證。結(jié)果AP為0.423,AP50為0.801,AP57為0.442。從而說(shuō)明MaskR-CNN算法有著較強(qiáng)的魯棒性,可以有效解決天線數(shù)量檢測(cè)任務(wù),如圖8所示。 3結(jié)束語(yǔ) 計(jì)算機(jī)視覺(jué)是提升5G移動(dòng)通信網(wǎng)絡(luò)智能化水平的重要手段,本文引入

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論