基于多分類(lèi)支持向量機(jī)的圖像分割數(shù)據(jù)分析報(bào)告(共11頁(yè))_第1頁(yè)
基于多分類(lèi)支持向量機(jī)的圖像分割數(shù)據(jù)分析報(bào)告(共11頁(yè))_第2頁(yè)
基于多分類(lèi)支持向量機(jī)的圖像分割數(shù)據(jù)分析報(bào)告(共11頁(yè))_第3頁(yè)
基于多分類(lèi)支持向量機(jī)的圖像分割數(shù)據(jù)分析報(bào)告(共11頁(yè))_第4頁(yè)
基于多分類(lèi)支持向量機(jī)的圖像分割數(shù)據(jù)分析報(bào)告(共11頁(yè))_第5頁(yè)
已閱讀5頁(yè),還剩9頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、基于(jy)多分類(lèi)(fn li)支持向量機(jī)的圖像(t xin)分割數(shù)據(jù)分析報(bào)告1 數(shù)據(jù)集來(lái)源及理解這里的數(shù)據(jù)集來(lái)源于麻省大學(xué)的一個(gè)視覺(jué)小組,并由由其中的Carla Brodley貢獻(xiàn)給UCI數(shù)據(jù)集。用于訓(xùn)練的實(shí)例源于一個(gè)包含有7個(gè)戶外圖像的數(shù)據(jù)庫(kù)的隨機(jī)采樣結(jié)果,這些圖像中的各個(gè)部分已被手工分類(lèi),從而可以創(chuàng)建一個(gè)分類(lèi)器來(lái)給其他圖像的不同區(qū)域進(jìn)行分類(lèi)。每一個(gè)樣本實(shí)例都由原始圖像上某個(gè)取樣點(diǎn)所在的3x3鄰域的RGB值獲得,并根據(jù)一系列的分析,可得到以下屬性:中心點(diǎn)橫坐標(biāo)(region-centroid-col):取樣中心點(diǎn)所在的圖像的橫坐標(biāo);中心點(diǎn)縱坐標(biāo)(region-centroid-row):取

2、樣中心點(diǎn)所在的圖像的縱坐標(biāo);每個(gè)樣本所含點(diǎn)的數(shù)量(region-pixel-count):為9;低密集度計(jì)數(shù)(short-line-density-5)指在通過(guò)這個(gè)區(qū)域的在任意方向上的,長(zhǎng)度為5的線段當(dāng)中,有多少條對(duì)比度大小要低于或等于5;高密集度計(jì)數(shù)(short-line-density-2)指在通過(guò)這個(gè)區(qū)域的在任意方向上的,長(zhǎng)度為5的線段當(dāng)中,有多少條對(duì)比度大小要高于5;橫向像素差值的平均(vedge-mean):指在3x3的樣本中,所有的左右相鄰的兩像素亮度之差的絕對(duì)值(共有6個(gè))的平均數(shù);橫向像素差值的標(biāo)準(zhǔn)差(vedge-sd):上述像素差值的標(biāo)準(zhǔn)差;縱向像素差值的平均(hedge-m

3、ean):指在3x3的樣本中,所有的上下相鄰的兩像素亮度之差的絕對(duì)值(共有6個(gè))的平均數(shù);縱向像素差值的標(biāo)準(zhǔn)差(hedge-sd):上述像素差值的標(biāo)準(zhǔn)差;整體亮度的平均數(shù)(intensity-mean):亮度按(R + G + B)/3計(jì)算(上同),再根據(jù)9個(gè)點(diǎn)的這些亮度取平均數(shù)紅分量平均(rawred-mean):整個(gè)樣本區(qū)域的紅分量的平均值藍(lán)分量平均(rawblue-mean):整個(gè)樣本區(qū)域的綠分量的平均值綠分量平均(rawgreen-mean):整個(gè)樣本區(qū)域的lan分量的平均值紅色超出量(exred-mean):測(cè)量紅色多于其他顏色分量的程度,按(2R - (G + B)的公式計(jì)算藍(lán)色超

4、出量(exblue-mean):測(cè)量藍(lán)色多于其他顏色分量的程度,按(2B - (G + R)(的公式計(jì)算綠色超出量(exgreen-mean):測(cè)量綠色多于其他顏色分量的程度,按(2G - (R + B)的公式計(jì)算HSV空間中的V值平均(value-mean):從RGB到HSV顏色(yns)空間的轉(zhuǎn)換是一種三維的非線性轉(zhuǎn)換,這個(gè)算法可以在交互式計(jì)算機(jī)圖形學(xué)基礎(chǔ)教材Foley and VanDam中找到。HSV空間(kngjin)中的S值平均(satue-mean)HSV空間(kngjin)中的H值平均(hue-mean)此外,在這個(gè)數(shù)據(jù)集當(dāng)中,一個(gè)圖像的各個(gè)部分被分成了7種類(lèi)別,包括了磚塊表面

5、(BRICKFACE),天空(SKY),樹(shù)葉(FOLIAGE),水泥(CEMENT),窗戶(WINDOW),小路(PATH),以及草地(GRASS)。在這些數(shù)據(jù)集當(dāng)中,每個(gè)類(lèi)別均提供了30個(gè)訓(xùn)練數(shù)據(jù)和300個(gè)測(cè)試數(shù)據(jù),這兩個(gè)數(shù)據(jù)集分別按csv(逗號(hào)分隔)的格式儲(chǔ)存在segmentation.data和segmentation.test中,另外還有一個(gè)文件s儲(chǔ)存了這個(gè)數(shù)據(jù)集的說(shuō)明。2 方法與思路2.1 方法理解與簡(jiǎn)介L(zhǎng)IBSVM是臺(tái)灣大學(xué)林智仁(Lin Chih-Jen)副教授等開(kāi)發(fā)設(shè)計(jì)的一個(gè)簡(jiǎn)單、易用和快速有效的SVM模式識(shí)別與回歸的軟件包,不但提供了編譯好的

6、可在Windows系列系統(tǒng)的執(zhí)行文件,而且提供了源代碼,方便改進(jìn)、修改以及在其它操作系統(tǒng)上應(yīng)用;該軟件對(duì)SVM所涉及的參數(shù)調(diào)節(jié)相對(duì)比較少,提供了很多的默認(rèn)參數(shù),并提供了交互檢驗(yàn)(Cross Validation)的功能。利用這些參數(shù)和功能可以解決很多有關(guān)分類(lèi)與回歸的問(wèn)題,包括C-SVM、-SVM、-SVR和-SVR等問(wèn)題,也包括了包括基于一對(duì)一算法的多類(lèi)模式識(shí)別的問(wèn)題。LIBSVM 使用的一般步驟是:1) 準(zhǔn)備訓(xùn)練的數(shù)據(jù)集,包括每個(gè)樣本的維數(shù)l,每個(gè)樣本的屬性集x,以及每個(gè)樣本的對(duì)應(yīng)分類(lèi)編號(hào)y;2) 對(duì)數(shù)據(jù)進(jìn)行簡(jiǎn)單的縮放和平移操作來(lái)實(shí)現(xiàn)數(shù)據(jù)的歸一化;3) 考慮選用核函數(shù),包括線性核,RGF核,

7、多項(xiàng)式核,sigmoid核等;4) 采用交叉驗(yàn)證選擇最佳損失參數(shù)C與最合適的gamma系數(shù) ;5) 采用最佳參數(shù)C與gamma系數(shù) 對(duì)整個(gè)訓(xùn)練集進(jìn)行訓(xùn)練獲取支持向量機(jī)模型;6) 利用獲取的模型進(jìn)行測(cè)試。LibSVM是以源代碼和可執(zhí)行文件兩種方式給出的。如果是Windows系列操作系統(tǒng),可以直接使用軟件包提供的程序,也可以進(jìn)行修改編譯。使用軟件包提供的程序時(shí),該軟件使用的訓(xùn)練數(shù)據(jù)和檢驗(yàn)數(shù)據(jù)文件格式如下: : : .其中 是訓(xùn)練數(shù)據(jù)集的目標(biāo)值,對(duì)于分類(lèi),它是標(biāo)識(shí)某類(lèi)的整數(shù)(支持多個(gè)類(lèi));對(duì)于回歸,是任意實(shí)數(shù)。 是以1開(kāi)始的整數(shù),可以是不連續(xù)的;為實(shí)數(shù),也就是我們常說(shuō)的自變量。檢驗(yàn)數(shù)據(jù)文件中的lab

8、el只用于計(jì)算準(zhǔn)確度或誤差,如果它是未知的,只需用一個(gè)數(shù)填寫(xiě)這一欄,也可以空著不填。使用源代碼進(jìn)行編譯時(shí),對(duì)于用于訓(xùn)練的數(shù)據(jù)集,需要(xyo)按以下的格式進(jìn)行填寫(xiě):用于訓(xùn)練(xnlin)的數(shù)據(jù)集被定義為struct svm_problemint l;double *y;struct svm_node *x;其中l(wèi)表示樣本的數(shù)量,y表示每個(gè)樣本對(duì)應(yīng)的分類(lèi)ID值的集合,x代表每個(gè)樣本每個(gè)維的屬性集合的索引(每個(gè)樣本首個(gè)節(jié)點(diǎn)(ji din)的內(nèi)存地址),而這個(gè)屬性集合需要額外創(chuàng)建,令維數(shù)為n,則這個(gè)屬性的集合的長(zhǎng)度為l*(n+1)。對(duì)于用來(lái)測(cè)試的數(shù)據(jù)集,需要一個(gè)長(zhǎng)度為(n+1)的struct svm

9、_node數(shù)組,這里的svm_node被定義為:struct svm_nodeint index;double value;其中的value表示的是節(jié)點(diǎn)的值,index表示當(dāng)前樣本的屬性節(jié)點(diǎn)的編號(hào)(從1開(kāi)始,單調(diào)遞增),每個(gè)樣本的節(jié)點(diǎn)在每個(gè)維均賦值完成后,需要緊接著額外地加入一個(gè)index值為-1,value可以不設(shè)置的節(jié)點(diǎn)。這也是每個(gè)維度為n的樣本的屬性需要定義(n+1)個(gè)節(jié)點(diǎn)的原因。對(duì)于訓(xùn)練的參數(shù)而言,在struct svm_parameter的定義中,kernel_type(核函數(shù)類(lèi)型),gamma(RBF核的gamma系數(shù)),和c(損失系數(shù)),是經(jīng)常要設(shè)置的參數(shù),其他的參照照svm-t

10、oy.cpp中給出的默認(rèn)值進(jìn)行賦值即可。kernel_type的屬性一覽表:0 線性:uv1 多項(xiàng)式:(r*uv + coef0)degree2 RBF函數(shù):exp(-r|u-v|2)3 sigmoid:tanh(r*uv + coef0)svm_type的屬性一覽表:0 - C-SVC1 -v-SVC2 一類(lèi)(y li)SVM3 - e -SVR4 - v-SVR本程序(chngx)用的是C-SVC2.2 具體分析方法(fngf)和流程程序運(yùn)行的流程圖如下圖所示:在訓(xùn)練數(shù)據(jù)集當(dāng)中(dngzhng)可以看出(參見(jiàn)轉(zhuǎn)換格式后的電子表格文檔segmentation.data. xls),訓(xùn)練(xn

11、lin)的數(shù)據(jù)里的B、C兩列為取樣區(qū)域中心點(diǎn)的坐標(biāo),不能作為訓(xùn)練的列來(lái)使用,D列(REGION-PIXEL-COUNT)恒為9,E(SHORT-LINE-DENSITY-5)和F(SHORT-LINE-DENSITY-2)列中的非零數(shù)的個(gè)數(shù)很少,也不能用于訓(xùn)練分類(lèi)器。因此,只能用之后的最多為14個(gè)列作為分類(lèi)器來(lái)使用,為了測(cè)試方便,可以讓測(cè)試者自己在這14個(gè)列當(dāng)中(dngzhng)選擇適當(dāng)?shù)亓羞M(jìn)行訓(xùn)練。如下圖所示:圖上的上半部分的14個(gè)復(fù)選框可用于設(shè)置哪些類(lèi)可以參與訓(xùn)練,下半部分可以設(shè)置Gamma值與損失系數(shù)c,右方兩個(gè)的復(fù)選框用來(lái)設(shè)置是否使用RBF核(否則用線性核),以及是否對(duì)數(shù)據(jù)進(jìn)行按最大值

12、和最小值進(jìn)行歸一化處理。在segmentation.data.xls中,G-R列的最大值都沒(méi)有超過(guò)151,而現(xiàn)在的rgb值通常取0-255。為了量化的統(tǒng)一,需要在讀取到原始數(shù)據(jù)數(shù)組rawData時(shí)將這12個(gè)列乘以系數(shù)(256.0/151.0),否則不能用于完整的戶外圖像的測(cè)試操作。另外,第一列需要改寫(xiě)成類(lèi)別的ID,這里按出現(xiàn)順序分別賦了1-7這幾個(gè)整數(shù),其余的列按原樣寫(xiě)到rawData中。隨后需要根據(jù)每列的最大值和最小值進(jìn)行進(jìn)行對(duì)rawData的歸一化,由于歸一化的運(yùn)算屬于線性運(yùn)算,為此可以另外定義一個(gè)數(shù)組columnScale,長(zhǎng)度為segmentation.data. xls的列數(shù)的兩倍,

13、用來(lái)儲(chǔ)存其中每列的的縮放系數(shù)和平移系數(shù),在構(gòu)建svm屬性的svm_note數(shù)據(jù)集時(shí)再進(jìn)行這項(xiàng)運(yùn)算。歸一化的代碼(di m)如下:/獲得(hud)歸一化數(shù)據(jù)int probRowCount=rawData.GetSize()/20;double minValue=0.0;double maxValue=0.0;for(i=0;i20;i+)if(!willCalculateColumnsi)continue;if(!willScale)columnScale2*i=1.0;columnScale2*i=0.0;continue;minValue=rawDatai;maxValue=rawData

14、i;for(j=1;jrawDataj*20+i)minValue=rawDataj*20+i;if(maxValuerawDataj*20+i)maxValue=rawDataj*20+i;if(minValue!=maxValue)columnScale2*i=1.0/(maxValue-minValue);columnScale2*i+1=-minValue*columnScale2*i;elsecolumnScale2*i=0.0;columnScale2*i+1=0.5;進(jìn)行(jnxng)測(cè)試時(shí),也同時(shí)需要?dú)w一化的數(shù)據(jù),而且每列的線性運(yùn)算必須相同。為此,可以先定義一個(gè)原始的數(shù)組vx,

15、長(zhǎng)度為segmentation.data. xls的列數(shù),然后再在寫(xiě)入svm_node節(jié)點(diǎn)時(shí)進(jìn)行歸一化操作,將vx用來(lái)測(cè)試的代碼如下:void CTest1View:predict(double (&vx)20)/從向量開(kāi)始算出預(yù)測(cè)值if(model=NULL)return;int probColumnCount=0;/svm訓(xùn)練數(shù)據(jù)集的維數(shù)int i=0,j=0;for(i=1;i20;i+)if(willCalculateColumnsi)probColumnCount+;struct svm_node *nx=new struct svm_nodeprobColumnCount+1;/篩

16、選(shixun)過(guò)的向量j=0;for(i=1;i20 & jprobColumnCount;i+)if(willCalculateColumnsi)nxj.index=j+1;nxj.value=columnScale2*i*vxi+columnScale2*i+1;j+;nxj.index=-1;/nxj.value=0;double predictValue=svm_predict(model,nx);vx0=predictValue;delete nx;對(duì)于完整的真彩色bmp圖片,在計(jì)算的過(guò)程中,需要從非邊緣中的所有(suyu)點(diǎn)的3x3鄰域內(nèi)進(jìn)行各種屬性的運(yùn)算,具體代碼在segme

17、nt函數(shù)中,輸出的結(jié)果按不同的顏色顯示在第二張圖中。3 實(shí)驗(yàn)(shyn)及分析3.1 實(shí)驗(yàn)環(huán)境3.1.1 硬件環(huán)境電腦型號(hào):戴爾 Inspiron N4050 筆記本電腦處理器:英特爾 第二代酷睿 i3-2350M 2.30GHz 雙核主板:戴爾 02JCHC (英特爾 HM67 芯片組)內(nèi)存:4 GB ( 三星 DDR3 1333MHz / 昱聯(lián) DDR3 1333MHz )主硬盤(pán):西數(shù) WDC WD10JPVX-75JC3T0 ( 1 TB / 5400 轉(zhuǎn)/分 )顯卡:英特爾 HD Graphics Family ( 1809 MB / 戴爾 )顯示器:友達(dá) AUO183C ( 14 英

18、寸 )光驅(qū):東芝-三星 DVD+-RW SN-208BB DVD刻錄機(jī)聲卡:IDT 英特爾 6 Series Chipset 高保真音頻網(wǎng)卡:瑞昱 RTL8105E Family PCI-E FE NIC / 戴爾3.1.2 軟件(run jin)環(huán)境操作系統(tǒng)(co zu x tn):Windows 7 旗艦版 64位 SP1 ( DirectX 11 )libSVM版本(bnbn):libSVM 3.1.7開(kāi)發(fā)工具:Ms Visual C+ 6.0簡(jiǎn)體中文企業(yè)版開(kāi)發(fā)工具版權(quán):1994-98 Microsoft Corporation開(kāi)發(fā)工具漢化者:swordxy(辛玉強(qiáng)),WuZuWu(吳祖

19、武)3.2 實(shí)驗(yàn)結(jié)果與分析3.2.1 軟件的使用方法打開(kāi)程序目錄test1下的debug或release文件夾,在這個(gè)文件夾中,test1.exe是程序的主文件。exe所在目錄下segmentation.data按csv(逗號(hào)分隔)的格式儲(chǔ)存了訓(xùn)練數(shù)據(jù),segmentation.test也按csv的格式儲(chǔ)存了測(cè)試數(shù)據(jù),另外的s儲(chǔ)存了這個(gè)數(shù)據(jù)集的說(shuō)明。運(yùn)行test1.exe,先點(diǎn)擊文件菜單下的“訓(xùn)練樣本”項(xiàng),在對(duì)話框的上方選擇需要訓(xùn)練的屬性,下方設(shè)置的選項(xiàng)包括了gamma值和損失系數(shù)c,還有核函數(shù)是線性核還是RBF核,以及是否進(jìn)行原始數(shù)據(jù)的歸一化。點(diǎn)擊“確定”按

20、鈕后會(huì)生成model result.txt來(lái)輸出訓(xùn)練的模型。然后點(diǎn)擊文件菜單下的“測(cè)試結(jié)果”項(xiàng),根據(jù)segmentation.test進(jìn)行測(cè)試,判斷程序預(yù)測(cè)的結(jié)果是否與segmentation.test中的結(jié)果一致,并彈出相應(yīng)對(duì)話框顯示正確率,詳細(xì)的運(yùn)行結(jié)果保存到了segmentation.out文件中,用來(lái)依次顯示預(yù)測(cè)的結(jié)果。點(diǎn)擊文件菜單下的“打開(kāi)圖片”項(xiàng)可以進(jìn)行實(shí)際的bmp圖像分割,注意圖像不能太大。第一張圖為原圖,預(yù)測(cè)的結(jié)果按不同的顏色顯示在第二張圖中,具體的顏色圖例為:紅:磚;靛藍(lán):天空;綠:樹(shù)葉;灰:水泥;藍(lán):窗戶;紫:小路;黃:草地。再次點(diǎn)擊文件菜單下的“訓(xùn)練樣本”命令可以重新對(duì)分類(lèi)器進(jìn)行訓(xùn)練,從而可以獲得不同的預(yù)測(cè)值。3.2.2 測(cè)試數(shù)據(jù)集的測(cè)試結(jié)果分析如下圖所展示,默認(rèn)選擇這些列和參數(shù)進(jìn)行分類(lèi)器的訓(xùn)練。訓(xùn)練結(jié)果(ji gu):默認(rèn)設(shè)置,相符1531個(gè),不相符569個(gè),相符率為72.90%。gamma值為5時(shí),相符(xingf)1747個(gè),不相符353個(gè),相符率為83.19%。gamma值為100時(shí),相符(xingf)1819個(gè),不相符281個(gè),相符率為86.62%。ga

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論