版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
本文格式為Word版,下載可任意編輯——采用YOLO算法的交通路口智能交通系統(tǒng)設(shè)計(jì)李秋潭
隨著國(guó)內(nèi)機(jī)動(dòng)車保有量的急劇增加,一些交通繁忙的路口在上下班的時(shí)間段擁堵十分嚴(yán)重,交通事故發(fā)生量居高不下。行人和非機(jī)動(dòng)車駕駛?cè)吮黄毡闅w為是交通弱勢(shì)群體,需要在交通系統(tǒng)設(shè)計(jì)中予以特別的關(guān)注和保護(hù)。文章采用YOLOv4網(wǎng)絡(luò)對(duì)行人、摩托車、自行車、汽車、公交車等通行目標(biāo)進(jìn)行識(shí)別,通過搭建學(xué)習(xí)環(huán)境、設(shè)定數(shù)據(jù)集收集對(duì)象,對(duì)圖片集進(jìn)行訓(xùn)練和測(cè)試,統(tǒng)計(jì)視頻中包含目標(biāo)的識(shí)別正確率、漏檢率、誤檢率。結(jié)果說明,系統(tǒng)訓(xùn)練的網(wǎng)絡(luò)能夠確切、有效地識(shí)別視頻中的各種目標(biāo),達(dá)到了預(yù)期目標(biāo)。
行人;摩托車;自行車;汽車;檢測(cè);YOLO;交通指揮設(shè)計(jì)
TP29A1674-0688(2021)12-0016-03
1引言
在目標(biāo)識(shí)別領(lǐng)域,對(duì)行人和各種車輛等目標(biāo)的檢測(cè),不僅在無人駕駛領(lǐng)域得到了快速發(fā)展,在交通指揮信號(hào)系統(tǒng)設(shè)計(jì)方面也得到廣泛應(yīng)用。隨著城市人口的快速膨脹,機(jī)動(dòng)車輛的保有量不斷增長(zhǎng),道路交通擁堵問題日益嚴(yán)重,機(jī)動(dòng)車輛給人們帶來便利的同時(shí),也帶來巨大的交通安全風(fēng)險(xiǎn),對(duì)交通弱勢(shì)群體造成的傷害尤為嚴(yán)重。因此,交通指揮部門在規(guī)劃路口通行時(shí)間時(shí),不能單純地考慮機(jī)動(dòng)車如何通行,應(yīng)同時(shí)考慮交通弱勢(shì)群體的安全問題。
在一些特定的通行時(shí)間段,例如上學(xué)、放學(xué)高峰期,若是能根據(jù)目標(biāo)檢測(cè)結(jié)果,依照“行人優(yōu)先〞原則設(shè)計(jì)交通信號(hào)指揮系統(tǒng),將會(huì)給行人提供更多的通行保護(hù)。
2相關(guān)研究
通過檢索相關(guān)論文發(fā)現(xiàn),在目標(biāo)檢測(cè)領(lǐng)域,大多是對(duì)各種機(jī)動(dòng)車輛進(jìn)行識(shí)別和分類,但是針對(duì)行人和自行車等小目標(biāo)檢測(cè)進(jìn)行研究的文獻(xiàn)很少。目前,檢測(cè)效果較好的方案大多是基于深度學(xué)習(xí)算法,識(shí)別結(jié)果越來越準(zhǔn)確,本研究對(duì)行人、機(jī)動(dòng)車等目標(biāo)的識(shí)別也是基于深度學(xué)習(xí)算法開展。孟輝磊在《行人和電動(dòng)摩托車目標(biāo)檢測(cè)研究》[1]一文中提出訪用YOLO(YouOnlyLookOnce)網(wǎng)絡(luò)對(duì)電動(dòng)車進(jìn)行識(shí)別,基于緊急剎車區(qū)域的位置判斷思想,為本文的研究提供了思路。
3選取目標(biāo)檢測(cè)算法
參考多種基于CNN的目標(biāo)檢測(cè)算法對(duì)目標(biāo)識(shí)別的結(jié)果,研究人員決定采用YOLOv4算法。根據(jù)YOLOv4官方提供的數(shù)據(jù),它對(duì)小目標(biāo)識(shí)別效果超過了SSD算法,能夠?qū)煌房诨蛉诵械郎系男腥恕⑵囘M(jìn)行有效且確切的識(shí)別。
YOLO系列圖像識(shí)別算法目前已經(jīng)更新到第4代,即YOLOv4。YOLOv4的可定制化程度很高,在性能上優(yōu)于YOLOv5,但是其靈活性與速度弱于YOLOv5。
受時(shí)間和試驗(yàn)條件的限制,本文在定量分析時(shí)參考YOLOv4官方論文中給出的結(jié)果,選擇YOLOv4作為本文的目標(biāo)檢測(cè)算法。
4訓(xùn)練環(huán)境的建立和數(shù)據(jù)集的采集和訓(xùn)練
選定要使用的目標(biāo)檢測(cè)算法后,需要建立一個(gè)價(jià)格適合的深度學(xué)習(xí)工作平臺(tái)作為訓(xùn)練環(huán)境,進(jìn)行系統(tǒng)軟、硬件配置,根據(jù)本文的識(shí)別目標(biāo)設(shè)置YOLOv4網(wǎng)絡(luò)的參數(shù),設(shè)置參數(shù)是一個(gè)反復(fù)嘗試的過程[1]。
4.1建立訓(xùn)練環(huán)境
搭建訓(xùn)練環(huán)境時(shí)使用的硬件配置自然是越高越好,高配置的硬件可以大大減少調(diào)試的時(shí)間,特別是反復(fù)調(diào)校參數(shù)花費(fèi)的時(shí)間可以成倍地縮短。但受現(xiàn)有條件的限制,只能采用性能一般的硬件搭建訓(xùn)練環(huán)境。
操作系統(tǒng)選擇Windows10.064bit,它運(yùn)行十分穩(wěn)定。沒有選擇市場(chǎng)上較常用的Ubantu系統(tǒng)的原因是為了減少工作中在操作系統(tǒng)來回切換,節(jié)省模型訓(xùn)練和模型參數(shù)優(yōu)化的時(shí)間。本系統(tǒng)設(shè)計(jì)采用“影馳〞GTX1080Ti顯卡進(jìn)行運(yùn)算,能夠滿足訓(xùn)練要求。本文將使用自己的訓(xùn)練集模型VOC2022構(gòu)建一個(gè)可用的深度學(xué)習(xí)工作站。
4.1.1訓(xùn)練環(huán)境的軟、硬件配置
高配置的訓(xùn)練環(huán)境花費(fèi)巨大,為了降低資金投入,本文使用的顯卡是“影馳〞GTX1080Ti11G大將版,經(jīng)測(cè)試后選擇兼容性較好的Windows10.0和CUDA11.0。為了保持良好的兼容性,目前一些軟件版本還沒有使用最新版,因此測(cè)試過程中,最新版本的幾種軟件運(yùn)行時(shí)會(huì)出現(xiàn)不穩(wěn)定、出錯(cuò)崩潰等問題。
受條件所限,本文搭建的訓(xùn)練環(huán)境的軟、硬件配置見表1。
4.1.2YOLOv4的配置
YOLOv4默認(rèn)識(shí)別的對(duì)象包括交通標(biāo)志、汽車、船只等81種對(duì)象,這與本文要識(shí)別的對(duì)象不同,所以開始訓(xùn)練前要修改YOLOv4的默認(rèn)配置文件,在調(diào)試過程中也需反復(fù)修改,使識(shí)別結(jié)果和運(yùn)行速度滿足實(shí)時(shí)識(shí)別檢測(cè)要求。
4.2構(gòu)建數(shù)據(jù)集
建立YOLOv4訓(xùn)練數(shù)據(jù)集,對(duì)交通路口通行的行人、自行車、汽車等目標(biāo)進(jìn)行識(shí)別。建立數(shù)據(jù)集的思路為確定檢測(cè)對(duì)象—選擇數(shù)據(jù)集—標(biāo)注數(shù)據(jù)集—制作VOC2022數(shù)據(jù)集[2]。
4.2.1確定目標(biāo)檢測(cè)對(duì)象
交通路口要采集的目標(biāo)檢測(cè)對(duì)象為行人、自行車、汽車,而檢測(cè)對(duì)象數(shù)據(jù)集主要包括行人、自行車、摩托車、小汽車、公交車等,由于車型種類太多,所以系統(tǒng)未能進(jìn)行細(xì)化分類而只做了簡(jiǎn)單分類,后期假如對(duì)車輛類型劃分要求更高,則可以繼續(xù)添加細(xì)分,例如三輪摩托、四輪電動(dòng)車等。
4.2.2選擇數(shù)據(jù)集
VOC、COCO和ImageNet是目前圖像識(shí)別領(lǐng)域3種對(duì)比流行的數(shù)據(jù)集,YOLOv4官方演示的檢測(cè)識(shí)別結(jié)果就是通過前兩個(gè)數(shù)據(jù)集訓(xùn)練得到的。本系統(tǒng)設(shè)計(jì)參考相關(guān)研究的結(jié)果,選擇YOLOv4制作VOC2022格式的數(shù)據(jù)集。在選擇數(shù)據(jù)集時(shí),既考慮數(shù)據(jù)集中圖片的數(shù)量和質(zhì)量,也考慮數(shù)據(jù)的豐富性。除了VOC2022自帶的圖片,還參與UA-DETRAC數(shù)據(jù)集的圖片(如圖1所示)。為了讓數(shù)據(jù)集包含的種類更多一些,設(shè)計(jì)人員從互聯(lián)網(wǎng)下載了一部分交通路口的通行圖片。經(jīng)過整理,test數(shù)據(jù)集收集了約5100張圖片,train數(shù)據(jù)集收集了約11000張圖片。
4.2.3標(biāo)注數(shù)據(jù)集
LabelImg是深度學(xué)習(xí)中常用于標(biāo)注圖片中目標(biāo)位置與名稱的小工具,使用它可以很簡(jiǎn)單地對(duì)自定義的目標(biāo)進(jìn)行分類和標(biāo)注。圖片整理完成后,要將這些圖片依照YOLOv4網(wǎng)絡(luò)規(guī)定的格式進(jìn)行命名和管理:首先在電腦上安裝Python3.7.9,然后安裝labelImg進(jìn)行分類、標(biāo)注。
4.2.4制作數(shù)據(jù)集VOC2022
PASCALVOC數(shù)據(jù)集制定了規(guī)范化的目標(biāo)分類和識(shí)別方案,系統(tǒng)設(shè)計(jì)人員會(huì)選用它里面的一部分圖片,依照它的官方格式制作本系統(tǒng)的數(shù)據(jù)集。VOC2022數(shù)據(jù)集中有20個(gè)分類、11530張各種辨別率的圖片,標(biāo)定了27450個(gè)目標(biāo)對(duì)象。
VOC2022數(shù)據(jù)集的目錄結(jié)構(gòu)一共包含Annotations、JPEGImages、ImageSets、SegmentationClass、SegmentationObject5個(gè)文件夾,本系統(tǒng)只使用了前3個(gè),另2個(gè)未使用。
4.3訓(xùn)練數(shù)據(jù)集
訓(xùn)練參數(shù)設(shè)置主要包括Batch、Subdivisions、Widths、Heights、Channels、Max-batches、Momentum、Decay、Learning_rate、Burn-in等。本系統(tǒng)對(duì)主要參數(shù)進(jìn)行了設(shè)置和優(yōu)化調(diào)整,得出的最優(yōu)設(shè)置見表2。
5訓(xùn)練結(jié)果及分析
5.1訓(xùn)練結(jié)果
利用系統(tǒng)設(shè)計(jì)人員搭建的訓(xùn)練環(huán)境,經(jīng)過反復(fù)調(diào)試、優(yōu)化運(yùn)行,又經(jīng)過5天的VOC2022數(shù)據(jù)集訓(xùn)練,得到最終的平均損失不大于0.061820avg,結(jié)果基本符合系統(tǒng)設(shè)計(jì)人員的預(yù)期。由于數(shù)據(jù)量太大,所以只展示最終訓(xùn)練結(jié)果:4000∶0.043076,0.04307avg,0.000100rate,10.501258seconds,9267images。
本測(cè)試的目標(biāo)對(duì)象是行人、摩托車、自行車、汽車、公交車,由于檢測(cè)目標(biāo)少,所以速度對(duì)比快[3]。
5.2訓(xùn)練結(jié)果分析
為了展示訓(xùn)練結(jié)果,系統(tǒng)設(shè)計(jì)人員選取了一段UA-DETRAC數(shù)據(jù)集中的MVI_20221圖片,辨別率為960×540dpi,MVI_20221共包含664幀圖片,以每30幀截取一張圖片的方式截取前4幀,識(shí)別結(jié)果如圖2所示。
本段視頻共識(shí)別出52532個(gè)box,其中識(shí)別出目標(biāo)但識(shí)別錯(cuò)誤的一共351個(gè),未識(shí)別出的目標(biāo)472個(gè)。故本文訓(xùn)練網(wǎng)絡(luò)平均識(shí)別率為97.9%,錯(cuò)誤率為1.2%,漏檢率為0.9%。各種檢測(cè)目標(biāo)的識(shí)別結(jié)果統(tǒng)計(jì)見表3。
從整段視頻看,行人的檢測(cè)正確率對(duì)比高。從第一幀圖片的檢測(cè)結(jié)果看,圖片中并沒有摩托車和自行車,對(duì)汽車、公交車的檢測(cè)正確率很高,由于遮擋很嚴(yán)重,所以遠(yuǎn)處的一些車輛未被檢測(cè)到。在圖片中有摩托車和自行車、行人的幀圖片,檢測(cè)正確率符合預(yù)期。
從表3中的檢測(cè)結(jié)果看,系統(tǒng)設(shè)計(jì)人員訓(xùn)練的網(wǎng)絡(luò)對(duì)小目標(biāo)識(shí)別具有很高的正確率,并且能夠根據(jù)需要靈活設(shè)置識(shí)別目標(biāo)的種類,識(shí)別速度高達(dá)31FPS,在硬件配置不高的狀況下也能滿足實(shí)時(shí)性識(shí)別的要求。
6結(jié)語
目標(biāo)檢測(cè)的主要任務(wù)是對(duì)指定的目標(biāo)進(jìn)行分類和識(shí)別,本系統(tǒng)需要檢測(cè)的目標(biāo)的是行人、摩托車、自行車、汽車、公交車等。本系統(tǒng)基于YOLOv4網(wǎng)絡(luò)構(gòu)建了適合YOLOv4的VOC2022數(shù)據(jù)集,取得了對(duì)比理想的識(shí)別效果。在選用數(shù)據(jù)集時(shí),除了選用VOC數(shù)據(jù)集中自帶的一部分圖片,還選用了UA-DETRAC數(shù)據(jù)集的一部分圖片,假如再采集一些更清楚的圖片參與,會(huì)取得更好的訓(xùn)練結(jié)果。
當(dāng)識(shí)別目標(biāo)較小、速度較快、環(huán)境光線不足時(shí),對(duì)訓(xùn)練網(wǎng)絡(luò)的識(shí)別精度有較大的影響,相信隨著圖像采集、處理設(shè)備的升級(jí),這些問題會(huì)得到解決。在后續(xù)的研究中將基于“行人優(yōu)先〞的原則和本文取得
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 一的變調(diào)練習(xí)題
- 二零二五年度重型吊車安全責(zé)任及運(yùn)輸合同3篇
- 壓瘡的預(yù)防及護(hù)理課件
- 射箭游戲-數(shù)學(xué)
- 2024年浙江宇翔職業(yè)技術(shù)學(xué)院高職單招職業(yè)適應(yīng)性測(cè)試歷年參考題庫(kù)含答案解析
- 2024年濟(jì)源職業(yè)技術(shù)學(xué)院高職單招職業(yè)適應(yīng)性測(cè)試歷年參考題庫(kù)含答案解析
- 《科幻小說賞析與寫作》 課件 -第三章 “太空歌劇”的探索與開拓-《2001太空漫游》
- 2024年河南工業(yè)貿(mào)易職業(yè)學(xué)院高職單招職業(yè)技能測(cè)驗(yàn)歷年參考題庫(kù)(頻考版)含答案解析
- 二零二五年租賃權(quán)轉(zhuǎn)讓及配套設(shè)備協(xié)議范本3篇
- 2024年滄州職業(yè)技術(shù)學(xué)院高職單招語文歷年參考題庫(kù)含答案解析
- 昆蟲養(yǎng)殖業(yè)可行性分析報(bào)告
- 高中英語考試試卷(含答案)
- 通用技術(shù)試題庫(kù)(含答案)(精華版)
- 健康管理師操作技能考試題庫(kù)(含答案)
- 農(nóng)化分析土壤P分析
- GB/T 18476-2001流體輸送用聚烯烴管材耐裂紋擴(kuò)展的測(cè)定切口管材裂紋慢速增長(zhǎng)的試驗(yàn)方法(切口試驗(yàn))
- GA 1551.5-2019石油石化系統(tǒng)治安反恐防范要求第5部分:運(yùn)輸企業(yè)
- 拘留所教育課件02
- 沖壓生產(chǎn)的品質(zhì)保障
- 2023年湖南聯(lián)通校園招聘筆試題庫(kù)及答案解析
- 上海市徐匯區(qū)、金山區(qū)、松江區(qū)2023屆高一上數(shù)學(xué)期末統(tǒng)考試題含解析
評(píng)論
0/150
提交評(píng)論