pso-svm模型在財(cái)務(wù)危機(jī)預(yù)警中的應(yīng)用_第1頁(yè)
pso-svm模型在財(cái)務(wù)危機(jī)預(yù)警中的應(yīng)用_第2頁(yè)
pso-svm模型在財(cái)務(wù)危機(jī)預(yù)警中的應(yīng)用_第3頁(yè)
pso-svm模型在財(cái)務(wù)危機(jī)預(yù)警中的應(yīng)用_第4頁(yè)
pso-svm模型在財(cái)務(wù)危機(jī)預(yù)警中的應(yīng)用_第5頁(yè)
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

pso-svm模型在財(cái)務(wù)危機(jī)預(yù)警中的應(yīng)用

預(yù)算危機(jī)風(fēng)險(xiǎn)報(bào)警是一個(gè)重要而廣泛的研究主題。它通過(guò)實(shí)時(shí)監(jiān)控財(cái)務(wù)形勢(shì)、分析和挖掘數(shù)據(jù)來(lái)獲得有效知識(shí),評(píng)估公司是否陷入預(yù)算危機(jī),并對(duì)公司管理層、投資者、債權(quán)人和其他利益相關(guān)者做出決策,這對(duì)政府和證券監(jiān)督管理部的管理具有重要的實(shí)踐意義。為了獲得更高的預(yù)測(cè)精度,人們將統(tǒng)計(jì)方法、人工智能專家系統(tǒng)和理論方法應(yīng)用于預(yù)動(dòng)危機(jī)模型的風(fēng)險(xiǎn)預(yù)測(cè)器??紤]到公司的最終結(jié)果是正?;蛳萑胛C(jī)這兩個(gè)狀態(tài),公司財(cái)務(wù)危機(jī)的預(yù)警類似一個(gè)二元決策.例如,Fitzpartrick和Beaver運(yùn)用單個(gè)財(cái)務(wù)比率將樣本劃分為破產(chǎn)和非破產(chǎn)兩組.在此基礎(chǔ)上,后來(lái)有很多學(xué)者采用統(tǒng)計(jì)方法進(jìn)行了改進(jìn),其中線性判別分析、多重回歸、邏輯回歸等是應(yīng)用最多的方法.然而,在傳統(tǒng)統(tǒng)計(jì)方法中,若要求預(yù)警變量之間是線性、正態(tài)和獨(dú)立的,則限制了這些方法在實(shí)踐中的應(yīng)用.隨著新技術(shù)的發(fā)展,人工智能專家系統(tǒng)技術(shù)被應(yīng)用到預(yù)警研究中.在這些方法中,Vapnik提出的采用結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則的支持向量機(jī)(SVM)方法已成為人們關(guān)注的焦點(diǎn).然而,在應(yīng)用SVM進(jìn)行財(cái)務(wù)危機(jī)預(yù)警時(shí),特征集的選擇和核函數(shù)參數(shù)的選擇對(duì)預(yù)測(cè)結(jié)果有著很大的影響.本文嘗試結(jié)合粒子算法(PSO)和SVM建立混合模型,對(duì)預(yù)警指標(biāo)特征集和SVM參數(shù)同時(shí)進(jìn)行優(yōu)化,從而提高SVM模型的預(yù)測(cè)準(zhǔn)確度.1pso和svm的性能1.1局極值pgdPSO是一種基于迭代的優(yōu)化工具.系統(tǒng)初始化為一組隨機(jī)粒子(隨機(jī)解),通過(guò)迭代搜尋最優(yōu)值.在每一次迭代中,粒子通過(guò)跟蹤兩個(gè)“極值”來(lái)更新自己.一個(gè)是粒子本身所找到的最優(yōu)解,此解叫做個(gè)體極值pid.另一個(gè)極值是整個(gè)種群目前找到的最優(yōu)解,此極值是全局極值pgd.在找到這兩個(gè)最優(yōu)值時(shí),粒子速度和位置分別為:vid=wvid+c1rand()(pid-xid)+c2rand()(pgd-xid)(1)xid=xid+vid(2)vid=wvid+c1rand()(pid?xid)+c2rand()(pgd?xid)(1)xid=xid+vid(2)式中:rand()為介于(0,1)之間的隨機(jī)數(shù);c1、c2均為學(xué)習(xí)因子,通常c1=c2=2;w為慣性權(quán)重,用于控制前一次迭代產(chǎn)生的速度對(duì)本次迭代速度的影響,一般w∈.在每一維粒子的速度都會(huì)被限制在一個(gè)最大速度vmax,如果某一維更新后的速度超過(guò)用戶設(shè)定的vmax,那么這一維的速度就被限定為vmax.PSO根據(jù)適應(yīng)值來(lái)進(jìn)行一定的隨機(jī)搜索,整個(gè)搜索更新過(guò)程是跟隨當(dāng)前最優(yōu)解的過(guò)程.故在大多數(shù)情況下,所有的粒子可能較快地收斂于最優(yōu)解.1.2最優(yōu)分類面的構(gòu)造SVM是基于統(tǒng)計(jì)學(xué)習(xí)理論和結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則的機(jī)器學(xué)習(xí)方法.其基本思想是:把輸入空間的樣本通過(guò)非線性變換映射到高維特征空間,在特征空間中,求樣本線性分開(kāi)的最優(yōu)分類面.算法使用分類間隔控制線性學(xué)習(xí)機(jī)器的容量,從而使結(jié)構(gòu)風(fēng)險(xiǎn)最小,在有限樣本下具有較強(qiáng)的泛化能力.SVM是從線性可分情況下的最優(yōu)分類面發(fā)展而來(lái).設(shè)分類面的方程為x·w+b=0,使得對(duì)線性可分的樣本集(xi,yi)(i=1,2,…,n),x∈Rd,y∈{+1,-1},尋找最優(yōu)超平面的問(wèn)題等同于解決約束條件下的二次規(guī)劃問(wèn)題,優(yōu)化條件是兩類之間的距離,最后得到最優(yōu)決策函數(shù):f(x)=sgn(n∑i=1α*iyi(xi?x)+b*)(3)f(x)=sgn(∑i=1nα?iyi(xi?x)+b?)(3)對(duì)于非線性問(wèn)題,只需要將輸入向量非線性映射到一個(gè)更高維的特征空間,然后再構(gòu)造最優(yōu)分類超平面.這個(gè)分類超平面可定義為f(x)=sgn(n∑i=1α*iyiΚ(xi,x)+b*)(4)f(x)=sgn(∑i=1nα?iyiK(xi,x)+b?)(4)式中:K(xi,x)為核函數(shù);f(x)的符號(hào)決定x的類屬.構(gòu)造最優(yōu)超平面等同于尋找所有非零的αi,對(duì)應(yīng)于一個(gè)非零αi的任何數(shù)據(jù)點(diǎn)xi就是這個(gè)最優(yōu)超平面的支持向量.2pso特征集及核函數(shù)參數(shù)的優(yōu)化由于特征集的選擇、核函數(shù)參數(shù)對(duì)SVM模型預(yù)測(cè)性能有重要影響,本文采用PSO對(duì)特征集的選擇和核函數(shù)參數(shù)同時(shí)進(jìn)行優(yōu)化,得到接近最優(yōu)的特征集和核函數(shù)參數(shù),提高SVM模型的預(yù)測(cè)能力.2.1特征集的編碼優(yōu)化特征集的選擇有filter和wrapper方式.它們的區(qū)別在于特征集的選擇是否獨(dú)立于學(xué)習(xí)算法,如果獨(dú)立,則為filter方式;反之,則為wrapper方式.在filter方式中,先進(jìn)行特征集的選擇,然后進(jìn)行分類.同wrapper方式相比,filter方式計(jì)算效率更高.wrapper方式通過(guò)輸入一個(gè)給定的特征集訓(xùn)練分類系統(tǒng),采用一個(gè)檢驗(yàn)集估計(jì)分類的準(zhǔn)確性.盡管它是一個(gè)更加緩慢的過(guò)程,但選擇的特征集對(duì)于分類而言通常是最優(yōu)的.在財(cái)務(wù)危機(jī)預(yù)警研究中,特征集的選擇對(duì)于提高預(yù)測(cè)的準(zhǔn)確度是非常重要的.而且,當(dāng)特征數(shù)量很大時(shí),特征集的選擇顯得尤為重要.本文將采用wrapper方式、利用PSO優(yōu)化算法選擇SVM模型的最優(yōu)特征集.以二進(jìn)制字符串方式對(duì)特征集進(jìn)行編碼,代表原始特征集的一些子集.字符串中的每個(gè)bit代表對(duì)應(yīng)的特征是否被選擇,1代表對(duì)應(yīng)的特征被選擇,0則代表未被選擇.圖1所示為特征集的編碼方式.由于采用PSO不能直接對(duì)以上編碼進(jìn)行優(yōu)化,故在使用PSO進(jìn)行優(yōu)化前,將以上二進(jìn)制編碼轉(zhuǎn)化為對(duì)應(yīng)的整數(shù),再利用PSO對(duì)該整數(shù)進(jìn)行尋優(yōu).2.2svm模型的參數(shù)優(yōu)化SVM最大的一個(gè)問(wèn)題就是如何選擇恰當(dāng)?shù)暮撕瘮?shù)參數(shù)值,使得模型具有最佳的分類性能.然而,事先并不知道針對(duì)某一問(wèn)題參數(shù)取何值為最佳.因此,對(duì)核函數(shù)參數(shù)的優(yōu)化是提高基于SVM的財(cái)務(wù)危機(jī)預(yù)警模型預(yù)測(cè)準(zhǔn)確度的關(guān)鍵因素.本文采用RBF函數(shù)作為SVM預(yù)警模型的核函數(shù).由于涉及到的參數(shù)對(duì)SVM模型的性能起著至關(guān)重要的影響,故采用PSO對(duì)這2個(gè)參數(shù)進(jìn)行優(yōu)化.2.3pso-svm模型粒子的位置為{V1,V2,V3},V1為核函數(shù)的參數(shù)C,V2為核函數(shù)的參數(shù)δ2,V3為特征集,適應(yīng)度函數(shù)如式(5)所示.特征集和核函數(shù)參數(shù)通過(guò)SVM進(jìn)行評(píng)價(jià),該過(guò)程不斷重復(fù)直到滿足終止條件(本文采用達(dá)到最大迭代次數(shù)為算法終止條件).PSO-SVM模型的數(shù)據(jù)集分為兩部分:一部分訓(xùn)練SVM模型;另一部分則用于檢驗(yàn)?zāi)P?得到粒子的適應(yīng)值:Fitness=Vsize∑i=1Μi/Vsize(5)式中:Vsize為檢驗(yàn)集的大小;Mi為預(yù)測(cè)結(jié)果和實(shí)際結(jié)果的匹配情況.當(dāng)預(yù)測(cè)結(jié)果和實(shí)際結(jié)果一樣時(shí),Mi為1;反之,則為0.可以說(shuō),Fitness就是SVM模型的平均分類準(zhǔn)確度.3確認(rèn)研究3.1樣本選取和數(shù)據(jù)來(lái)源中國(guó)證監(jiān)會(huì)于1998年3月16日頒布了《關(guān)于上市公司狀況異常期間的股票特別處理方式的通知》,要求證券交易所應(yīng)對(duì)“狀況異?!钡纳鲜泄緦?shí)行股票的特別處理(ST).證券市場(chǎng)上被ST的股票大多是由于“連續(xù)2年虧損或每股凈資產(chǎn)低于股票面值(1元)”,即財(cái)務(wù)指標(biāo)惡化是上市公司被特別處理的主要原因.故國(guó)內(nèi)研究一般把被ST的股票作為上市公司陷入財(cái)務(wù)危機(jī)的標(biāo)準(zhǔn),本文也將ST公司視為財(cái)務(wù)危機(jī)公司,非ST公司視為正常公司.由于獲取資料的局限性,本文的樣本數(shù)據(jù)來(lái)自上市公司.將2000~2005年表現(xiàn)正常、2006年首次被ST的公司作為失敗組,公司狀況用“1”表示.這樣的選擇方式可以避免將包裝上市的公司選入失敗組,從而影響模型判定的準(zhǔn)確率.由于行業(yè)、企業(yè)規(guī)模等因素對(duì)企業(yè)的財(cái)務(wù)指標(biāo)影響較大,為了控制這些干擾因素,本文按相同行業(yè)、相同規(guī)模配對(duì)抽樣挑選出2000~2006年內(nèi)都表現(xiàn)正常的公司作為正常組,公司狀況用“0”表示.通過(guò)對(duì)這些樣本公司t-1年、t-2年、t-3年、t-4年(t為開(kāi)始陷入財(cái)務(wù)危機(jī)的年度,本文指2006年)基本財(cái)務(wù)數(shù)據(jù)所計(jì)算得到的59個(gè)指標(biāo)進(jìn)行長(zhǎng)時(shí)間的分布觀察,發(fā)現(xiàn)t-2年開(kāi)始,有多個(gè)指標(biāo)出現(xiàn)差異擴(kuò)大趨勢(shì).因此,本文決定采用t-2年、t-2年中期、t-1年、t-1年中期的數(shù)據(jù)作為立體樣本集合,以期真實(shí)反映財(cái)務(wù)數(shù)據(jù)的持續(xù)性變化和累積效果.刪除數(shù)據(jù)不全的公司,最后,入選樣本共268家(其中財(cái)務(wù)危機(jī)企業(yè)134家,配比公司134家).所有基礎(chǔ)數(shù)據(jù)均來(lái)自萬(wàn)德資訊(WIND).3.2基本特征選取結(jié)果結(jié)合國(guó)內(nèi)外的研究成果,本文初步選擇了財(cái)務(wù)結(jié)構(gòu)、償債能力、成長(zhǎng)能力、經(jīng)營(yíng)能力、盈利能力、現(xiàn)金流量、其他等7個(gè)方面共59個(gè)指標(biāo),以便對(duì)公司的情況進(jìn)行全面、綜合和系統(tǒng)地描述.通過(guò)多種方法對(duì)這59個(gè)指標(biāo)進(jìn)行了挑選,結(jié)果如表1所示.表中:“*”表示被選中;59FS代表所有指標(biāo)組成的特征集;7FS代表通過(guò)MDA逐步法從特征集挑選出7個(gè)指標(biāo)組成的特征子集;8FS代表通過(guò)LR逐步法從特征集挑選出8個(gè)指標(biāo)組成的特征子集;38FS代表通過(guò)獨(dú)立樣本t檢驗(yàn)方法從特征集挑選出38個(gè)指標(biāo)組成的特征子集;“PSO-SVM”表示通過(guò)本文提出的模型,從特征集挑選25個(gè)指標(biāo)組成的特征子集.3.3特征集對(duì)svm模型預(yù)測(cè)性能的影響將數(shù)據(jù)集按1∶1比例分為訓(xùn)練集和檢驗(yàn)集,對(duì)SVM模型采用不同參數(shù)、不同特征集進(jìn)行分類預(yù)測(cè).圖3(a)所示為對(duì)于不同的特征集,核函數(shù)參數(shù)C=5時(shí),δ2對(duì)SVM模型預(yù)測(cè)性能的影響.圖3(b)所示為對(duì)于不同的特征集,核函數(shù)參數(shù)δ2=30時(shí),C對(duì)SVM模型預(yù)測(cè)性能的影響.由圖3可見(jiàn),SVM模型的預(yù)測(cè)性能不僅與特征集的選擇有關(guān),還與核函數(shù)的2個(gè)參數(shù)有關(guān).因此,對(duì)特征集和核函數(shù)的參數(shù)同時(shí)進(jìn)行優(yōu)化,將提高模型的預(yù)測(cè)準(zhǔn)確度.3.4pso-svm模型預(yù)測(cè)結(jié)果本文采用種群規(guī)模為80,最大迭代次數(shù)為1000,通過(guò)PSO-SVM模型對(duì)特征集和核函數(shù)參數(shù)進(jìn)行同時(shí)優(yōu)化,模型預(yù)測(cè)準(zhǔn)確度和迭代次數(shù)的關(guān)系如圖4所示.實(shí)證結(jié)果表明,PSO-SVM模型對(duì)核函數(shù)參數(shù)的優(yōu)化結(jié)果為:C=90.52、δ2=12.93,特征集的優(yōu)化結(jié)果見(jiàn)表1,模型的最優(yōu)預(yù)測(cè)準(zhǔn)確度為90.30%.從SVM模型采用不同參數(shù)、不同特征集得到的預(yù)測(cè)準(zhǔn)確度中挑選最佳的預(yù)測(cè)結(jié)果,結(jié)合PSO-SVM模型的預(yù)測(cè)結(jié)果,預(yù)測(cè)準(zhǔn)確度如表2所示.由表可見(jiàn),本文提出的PSO-SVM模型由于通過(guò)PSO算法自動(dòng)優(yōu)化選擇特征子集和核函數(shù),在得到接近最優(yōu)特征子集和核函數(shù)的同時(shí),PSO-SVM模型也得到最

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論