計(jì)算機(jī)視覺模型數(shù)據(jù)準(zhǔn)備-常見計(jì)算機(jī)視覺數(shù)據(jù)集及格式_第1頁
計(jì)算機(jī)視覺模型數(shù)據(jù)準(zhǔn)備-常見計(jì)算機(jī)視覺數(shù)據(jù)集及格式_第2頁
計(jì)算機(jī)視覺模型數(shù)據(jù)準(zhǔn)備-常見計(jì)算機(jī)視覺數(shù)據(jù)集及格式_第3頁
計(jì)算機(jī)視覺模型數(shù)據(jù)準(zhǔn)備-常見計(jì)算機(jī)視覺數(shù)據(jù)集及格式_第4頁
計(jì)算機(jī)視覺模型數(shù)據(jù)準(zhǔn)備-常見計(jì)算機(jī)視覺數(shù)據(jù)集及格式_第5頁
已閱讀5頁,還剩5頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

計(jì)算機(jī)視覺模型數(shù)據(jù)準(zhǔn)備計(jì)算機(jī)視覺模型應(yīng)用常見計(jì)算機(jī)視覺數(shù)據(jù)集及格式MNIST是機(jī)器學(xué)習(xí)入門的標(biāo)準(zhǔn)數(shù)據(jù)集,共10個(gè)類別,由來自250個(gè)不同人的0-9手寫數(shù)字構(gòu)成,測試集也是同樣比例的手寫數(shù)字?jǐn)?shù)據(jù)。包含了60,000張28x28的二值訓(xùn)練圖像,10,000張28x28的二值測試圖像。最早的深度卷積網(wǎng)絡(luò)LeNet便是針對MNIST數(shù)據(jù)集的,而且當(dāng)前主流深度學(xué)習(xí)框架幾乎無一例外將MNIST數(shù)據(jù)集的處理作為介紹及入門第一教程。1MNIST數(shù)據(jù)集▲MNIST數(shù)據(jù)集示例圖片?常見計(jì)算機(jī)視覺數(shù)據(jù)集及格式ImageNet數(shù)據(jù)集有1400多萬幅圖片,涵蓋2萬多個(gè)類別;其中有超過百萬的圖片有明確的類別標(biāo)注和圖像中物體位置的標(biāo)注,具體信息及說明如下表:2ImageNet數(shù)據(jù)集信息說明數(shù)量Totalnumberofnon-emptysynsets數(shù)據(jù)集涵蓋類別21841Totalnumberofimages圖片的總數(shù)量14,197,122Numberofimageswithboundingboxannotations帶邊框批注的圖像數(shù)1,034,908NumberofsynsetswithSIFTfeatures具有SIFT(尺度不變性和光照不變性)特征的數(shù)據(jù)集數(shù)量1000NumberofimageswithSIFTfeatures具有SIFT(尺度不變性和光照不變性)特征的圖像數(shù)1,200,000常見計(jì)算機(jī)視覺數(shù)據(jù)集及格式ImageNet數(shù)據(jù)集目錄下包含多個(gè)文件夾,每個(gè)文件夾中的圖像均屬于同一個(gè)類別,文件夾的命名即為類別名。2ImageNet數(shù)據(jù)集▲ImageNet數(shù)據(jù)集示例圖片?文件描述train_list.txt訓(xùn)練集列表val_list.txt驗(yàn)證集列表labels.txt類別標(biāo)簽列表常見計(jì)算機(jī)視覺數(shù)據(jù)集及格式COCO是一個(gè)大規(guī)模的對象識(shí)別、分割以及Captioning數(shù)據(jù)集。具有以下特點(diǎn):3COCO數(shù)據(jù)集特點(diǎn)說明Objectsegmentation對象分割Recognitionincontext在上下文中可識(shí)別Superpixelstuffsegmentation超像素分割330Kimages(>200Klabeled)330K圖像(>200K標(biāo)記)1.5millionobjectinstances150萬個(gè)對象實(shí)例80objectcategories80個(gè)對象類別91stuffcategories91個(gè)類別5captionsperimage每張圖片5個(gè)字幕250,000peoplewithkeypoints有關(guān)鍵點(diǎn)的250,000人常見計(jì)算機(jī)視覺數(shù)據(jù)集及格式MSCOCO數(shù)據(jù)集將原圖片全部放在名為JPEGImages文件夾中,為了區(qū)分訓(xùn)練集和驗(yàn)證集,使用不同的json表示數(shù)據(jù)的劃分,例如train.json和val.json。3COCO數(shù)據(jù)集▲COCO數(shù)據(jù)集示例圖片PASCAL人類動(dòng)物鳥貓牛狗馬羊交通工具飛機(jī)自行車船公共汽車小轎車摩托車火車室內(nèi)瓶子椅子餐桌盆栽植物沙發(fā)電視常見計(jì)算機(jī)視覺數(shù)據(jù)集及格式PASCAL是一個(gè)用于模式分析和統(tǒng)計(jì)建模的數(shù)據(jù)集,包括圖像分類,目標(biāo)檢測,分割等任務(wù),是由PASCALVOC挑戰(zhàn)賽衍生出來的數(shù)據(jù)集。PASCALVOC2007之后的數(shù)據(jù)集包括以下20個(gè)類別。4PASCAL數(shù)據(jù)集常見計(jì)算機(jī)視覺數(shù)據(jù)集及格式數(shù)據(jù)集包括圖片的三種信息:原始圖片(JPEGImages文件夾),對象像素(SegmentationClass文件夾)和分類像素(SegmentationObject文件夾)。其中還有一個(gè)Annotations文件夾是圖片描述的xml文件。例如以下圖片,就會(huì)有相應(yīng)的xml文件描述該圖片,包括圖片的寬高、包含的Object的類別、坐標(biāo)等信息,同時(shí)還包括訓(xùn)練集列表train_list.txt,驗(yàn)證集列表val_list.txt和類別標(biāo)簽列表labels.txt三個(gè)文件。4PASCAL數(shù)據(jù)集▲PASCAL數(shù)據(jù)集示例圖片常見計(jì)算機(jī)視覺數(shù)據(jù)集及格式5CIFAR-10、CIFAR-100數(shù)據(jù)集MNIST數(shù)據(jù)集cifar-10數(shù)據(jù)集只是灰度圖像類別少,只是手寫數(shù)字并非真實(shí)數(shù)據(jù),沒有真實(shí)數(shù)據(jù)的局部統(tǒng)計(jì)特性都是真實(shí)圖片而不是手稿等圖中只有一個(gè)主體目標(biāo)可以有部分遮擋,但是必須可辨識(shí)常見計(jì)算機(jī)視覺數(shù)據(jù)集及格式cifar-100數(shù)據(jù)集包含100小類,每小類包含600個(gè)圖像,其中有500個(gè)訓(xùn)練圖像和100個(gè)測試圖像。與cifar-10不同的是,100類被分組為20個(gè)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論