版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
基于神經(jīng)網(wǎng)絡(luò)的股票價(jià)格走勢預(yù)測及其MATLAB實(shí)現(xiàn)摘要伴隨著我國經(jīng)濟(jì)的高速發(fā)展和廣大投資者日益旺盛的需求,股票投資已經(jīng)成為一種常見的投資手段,而股票價(jià)格預(yù)測也逐漸成為廣大投資者關(guān)心和研究的重點(diǎn)問題。股票價(jià)格的波動是一個高度復(fù)雜化的非線性動態(tài)系統(tǒng),其本身具有諸如大規(guī)模數(shù)據(jù)、噪聲、模糊非線性等特點(diǎn)。針對這些特點(diǎn)本文在深入分析股票市場實(shí)際預(yù)測中所面臨的關(guān)鍵問題和比較各種已有的股票預(yù)測方法的基礎(chǔ)上,探討運(yùn)用神經(jīng)網(wǎng)絡(luò)這一人工智能工具,研究基于歷史數(shù)據(jù)分析的股票預(yù)測模型。神經(jīng)網(wǎng)絡(luò)是建立在對大規(guī)模的股票歷史數(shù)據(jù)的學(xué)習(xí)仿真的基礎(chǔ)上,運(yùn)用黑盒預(yù)測方式找出股市波動的內(nèi)在規(guī)律,并通過將其存儲在網(wǎng)絡(luò)的權(quán)值、閾值中,以此來預(yù)測未來短期或是中長期的價(jià)格走勢。關(guān)鍵字:神經(jīng)網(wǎng)絡(luò),股票,預(yù)測,MATLAB工具箱ABSTRACTAlongwiththeeconomygrowthandincreasinglystrongdemandofmanyinvestorsinourcountry,stockhasbecomeacommonmeansofinvestment,andstockpriceforecasthasgreatlybeenoneofthefocusesofstudytopic.Thechangeofstockpriceisahighlycomplicatednonlineardynamicsystem,itselfhasmanycharacteristicssuchasmassivedata,noise,fuzzyandnonlinear.Thisarticleanalysesthekeyissuesbeingexistentintherealstockmarketpredictionandcomparesvariousexistingstockforecastingmethods.Wewilltrytoresearchonstockpricepredictionmodelbasedonaneuralnetworkwithhugehistoricaldata.Neuralnetworkisbasedonstudyingmassivehistoricaldata,usestheblackboxofforecastingwaystofindtheinternaldisciplinarianofstockmarket,andstoresthemintheweightsandvalvesvaluesoftheneuralnetworkforpredictingtheshort-termorlong-termtrendinthefuture.KEYWORD:Neuralnetworks,Stock,prediction,MATLABtoolbox目錄TOC\o"1-2"\u摘要 1一.緒論 31.1研究背景及意義 31.2國內(nèi)外研究的現(xiàn)狀 41.3論文的研究方法及其框架結(jié)構(gòu) 5二.股票預(yù)測的關(guān)鍵問題分析 62.1股票價(jià)格波動的因素以及預(yù)測的基本假設(shè) 62.2股票預(yù)測的常用術(shù)語和技術(shù)指標(biāo) 82.3股票數(shù)據(jù)的特點(diǎn) 11三.神經(jīng)網(wǎng)絡(luò)的基本原理介紹 113.1人工神經(jīng)網(wǎng)絡(luò)的定義和發(fā)展過程 123.2神經(jīng)網(wǎng)絡(luò)基本原理 123.3BP神經(jīng)網(wǎng)絡(luò)介紹 153.4神經(jīng)網(wǎng)絡(luò)的特點(diǎn) 193.5神經(jīng)網(wǎng)絡(luò)的在實(shí)際預(yù)測模型中的問題 19四.神經(jīng)網(wǎng)絡(luò)算法 214.1輸出輸入變量的選取 214.2數(shù)據(jù)歸一化處理 224.3數(shù)據(jù)樣本分類 224.4網(wǎng)絡(luò)初始化 224.5訓(xùn)練網(wǎng)絡(luò) 234.6網(wǎng)絡(luò)仿真 24五.仿真實(shí)驗(yàn) 244.1單日收盤價(jià)對單日收盤價(jià)預(yù)測 244.2單日收盤價(jià),成交量對單日收盤價(jià)預(yù)測 254.3多日收盤價(jià),成交量對單日收盤價(jià)預(yù)測 264.4多日收盤價(jià),成交量對多日收盤價(jià)預(yù)測 27六.結(jié)論和展望 28附錄(股票數(shù)據(jù)和程序代碼) 28一.緒論1.1研究背景及意義許多偉大的預(yù)言家認(rèn)為,每一個世紀(jì)的開始十年發(fā)生的事情將奠定這個世紀(jì)的發(fā)展方向。進(jìn)入新的21世紀(jì)以來,頭十年發(fā)生的最重要的一件事情莫過于2008年的金融危機(jī)。這場罕見的金融風(fēng)暴不僅給中國帶來了巨大的沖擊,也給國際市場帶來了更多的挑戰(zhàn)。毋庸置疑,21世紀(jì)是金融家的世紀(jì),雖然華爾街帶著貪婪與欲望的負(fù)面形象向我們走來,但我們堅(jiān)信在未來將會出現(xiàn)更多的這種華爾街聚集地。21世紀(jì)的經(jīng)濟(jì)既是一種以知識為本的經(jīng)濟(jì),又是一種金融化的經(jīng)濟(jì)?,F(xiàn)代科學(xué)技術(shù)的發(fā)展及其在產(chǎn)業(yè)中的擴(kuò)散,是2l世紀(jì)經(jīng)濟(jì)增長的原動力,而現(xiàn)代金融則使這種原動力以乘數(shù)效應(yīng)推動著經(jīng)濟(jì)的增長。證券投資是現(xiàn)代金融重要的組成部分,它是指投入貨幣或?qū)嵨铮纬勺C券形態(tài)的金融資產(chǎn),并通過持有和運(yùn)用這些資產(chǎn)獲取增值收益的行為。正是由于證券投資具有實(shí)現(xiàn)價(jià)值增值、支撐社會融資、化解供求壓力、穩(wěn)定經(jīng)濟(jì)運(yùn)行、傳遞經(jīng)濟(jì)信息等功能,證券投資成了政府、企業(yè)和眾多投資者關(guān)心并參與的經(jīng)濟(jì)活動。在經(jīng)濟(jì)全球化、市場一體化和資產(chǎn)證券化的大背景下,2l世紀(jì)全球經(jīng)濟(jì)體系之間將更加開放、更富有流動性,財(cái)富的物質(zhì)形態(tài)逐漸淡出,資產(chǎn)或財(cái)富的虛擬化傾向日益明顯,在資產(chǎn)或財(cái)富的快速流動中,財(cái)富或在流動中增值,或在流動中消失。財(cái)富聚合速度日益加快,市場競爭更加激烈,經(jīng)濟(jì)運(yùn)行的軸心逐步轉(zhuǎn)向現(xiàn)代金融業(yè),經(jīng)濟(jì)運(yùn)行的風(fēng)險(xiǎn)在明顯增大。而股票,作為證券投資的重要組成部分,眾所周知,股票價(jià)格受到國內(nèi)外政治、宏觀經(jīng)濟(jì)與微觀經(jīng)濟(jì)等許多錯綜復(fù)雜因素的影響,現(xiàn)在已經(jīng)成為整個社會經(jīng)濟(jì)的“晴雨表”和“報(bào)警器”,其對于經(jīng)濟(jì)發(fā)展的影響不可估量。股票是市場經(jīng)濟(jì)的產(chǎn)物,股票的發(fā)行與交易促進(jìn)了市場經(jīng)濟(jì)的發(fā)展。近年來,股票市場已經(jīng)逐步成為證券業(yè)乃至整個金融業(yè)必不可少的組成部分,顯示出強(qiáng)大的生命力,股票投資也已經(jīng)成為人們?nèi)粘I畹囊粋€重要組成部分。股市的暴漲暴跌對金融市場會產(chǎn)生很大的振蕩,直接影響到金融市場的穩(wěn)定和經(jīng)濟(jì)的健康發(fā)展。如果能夠預(yù)測股票的漲跌,及時對股票市場進(jìn)行合理的調(diào)控和健康的引導(dǎo),這將為我國經(jīng)濟(jì)的持續(xù)發(fā)展提供堅(jiān)實(shí)的后盾。股票預(yù)測,是經(jīng)濟(jì)預(yù)測的一個分支,是指以準(zhǔn)確的調(diào)查統(tǒng)計(jì)資料和股市信息為依據(jù),從股票市場的歷史、現(xiàn)狀和規(guī)律性出發(fā),運(yùn)用科學(xué)的方法,對股票市場的未來發(fā)展前景做出預(yù)測。在金融系統(tǒng)的預(yù)測研究中,股票預(yù)測是一個非常熱門的課題。這是因?yàn)楣善笔袌鼍哂懈呤找媾c高風(fēng)險(xiǎn)并存的特性,隨著股市的發(fā)展,人們不斷在探索其內(nèi)在規(guī)律,對于股市規(guī)律認(rèn)識逐步加深,產(chǎn)生各種各樣的股市預(yù)測方法。但是,股票市場作為一種影響因素眾多、各種不確定性共同作用的復(fù)雜的巨系統(tǒng),其價(jià)格波動往往表現(xiàn)出較強(qiáng)的非線性的特征。另外,股市的建模與預(yù)測所處理的信息量往往十分龐大,對算法有很高的要求。正是由于這些復(fù)雜的因素,使得關(guān)于股市的預(yù)測往往難如人意。中國的股票市場雖然起步較晚,但隨著有關(guān)政策、法律法規(guī)的出臺和完善,股票市場逐步走向成熟、規(guī)范。股民在交易行動之前對股票市場的未來加以預(yù)測也會成為一種自覺的思維活動。然而股票指數(shù)受國際市場、金融政策、利率政策、公司狀況及投資者心理承受能力等因素的影響,其走勢的預(yù)測非常困難。從中國股票市場的特征來看,大多數(shù)學(xué)者的結(jié)論支持中國股票市場的股票指數(shù)的時間序列是序列相關(guān)的,即歷史數(shù)據(jù)對股票的指數(shù)形成起作用,股票指數(shù)充分反映了所有相關(guān)的信息。因此,可以通過對歷史數(shù)據(jù)的分析來預(yù)測股票指數(shù)。在股票交易事務(wù)處理中,每天有開盤、最高價(jià)、最低價(jià)、收盤、流通量等交易信息為主的大量數(shù)據(jù)匯入數(shù)據(jù)庫。在股票交易過程中,每天有以交易信息為主的大量數(shù)據(jù)匯入數(shù)據(jù)庫,這些數(shù)據(jù)無疑對股民了解股市的走勢,做出正確的投資決策。本文利用神經(jīng)網(wǎng)絡(luò)具有很強(qiáng)的非線性逼近能力和自學(xué)習(xí)、自適應(yīng)等特性,將其應(yīng)用于股票預(yù)測中,通過對股票歷史的交易數(shù)據(jù)挖掘去預(yù)測未來的股票的交易價(jià)格的變化與趨勢。1.2國內(nèi)外研究的現(xiàn)狀股票交易作為一種現(xiàn)代經(jīng)濟(jì)活動中的常見風(fēng)險(xiǎn)投資交易,其高收益和高風(fēng)險(xiǎn)相伴相生的特點(diǎn),使得股票交易具有很強(qiáng)的投機(jī)性。這種投機(jī)性是基于市場供求關(guān)系變化以及股票價(jià)格的實(shí)時波動,投資者追求在低價(jià)買入高價(jià)拋售中賺取相應(yīng)差價(jià),從而實(shí)現(xiàn)資本增值或是盈利。因此不論是投資者,更包括市場的監(jiān)管部門等都對分析股市、試圖預(yù)測股市的發(fā)展趨勢等股市核心問題積極關(guān)注和廣泛研究。在這樣的背景下,國內(nèi)外許多學(xué)者都對股市的預(yù)測分析方法進(jìn)行了研究并都出了很多理論和實(shí)踐的結(jié)論。在股票市場上,一般采用兩類股票投資分析方法:基本分析法和技術(shù)分析法。其中基本分析法是通過對影響股票市場供求關(guān)系的基本因素進(jìn)行分析,以此來確定股票的真正價(jià)值,判斷股票市場的未來走勢,提供投資者選擇股票交易的依據(jù)。而技術(shù)分析法則是一種完全根據(jù)股票市場行情變化而加以分析的方法,它通過對歷史資料(如股票的成交量和成交價(jià)格)進(jìn)行分析,判斷整個股票市場或是個別單只股票價(jià)格未來的變化趨勢,給投資者提供交易股票的信號。這其中建立在統(tǒng)計(jì)學(xué)基礎(chǔ)之上常見的技術(shù)分析方法,有移動平均線法、點(diǎn)數(shù)圖法、K線圖法等。對于受政治、經(jīng)濟(jì)、心理、國際市場等多種因素影響的復(fù)雜股票市場,使用傳統(tǒng)的技術(shù)分析工具進(jìn)行股票買賣決策難度較大,大多數(shù)投資者應(yīng)用的結(jié)果并不理想。以下是幾種常見的股市預(yù)測方法介紹。1.時間序列分析法通過建立股價(jià)與綜合指數(shù)的時間序列辨識模型,如傳統(tǒng)的隨機(jī)游走模型(RW),自回歸移動平均模型(ARIMA),齊次非平穩(wěn)模型(ARMA)等來預(yù)測未來股價(jià)變化。它包括兩種類型:單變量與多變量。單變量模型對于短期預(yù)測具有良好的效果,但需要大量數(shù)據(jù),并且模型結(jié)構(gòu)與參數(shù)的選取是非常復(fù)雜的過程;多變量模型例如RegressionAnalysis??傊朔N分析方法只適用于短期預(yù)測,當(dāng)預(yù)測周期變長,其準(zhǔn)確性急劇下降。2.基于統(tǒng)計(jì)學(xué)理論的預(yù)測方法統(tǒng)計(jì)學(xué)理論的預(yù)測方法,主要是基于模型擬合和最小二乘原理建立各種回歸、自回歸、混合回歸模型進(jìn)行預(yù)測。此類方法,具有嚴(yán)格的數(shù)學(xué)基礎(chǔ),應(yīng)用較廣泛,近年也有相當(dāng)?shù)陌l(fā)展。如廣義線性模型,它放松了經(jīng)典線性模型的假設(shè),極大地豐富了回歸分析的理論,對假設(shè)進(jìn)一步放松,提出了一般的回歸模型,該領(lǐng)域研究具有十分驚人的前景,但由于其僅能辨識參數(shù)的方向,應(yīng)用起來十分不便,僅能對建模提供指導(dǎo)。3.灰色預(yù)測方法所謂灰色預(yù)測法,是指自變量和因變量之間滿足某種數(shù)學(xué)關(guān)系和滿足某種特定條件,但是由于歷史數(shù)據(jù)的不全面和不充分或某些變量尚不清楚和不確定,使預(yù)測處于一種半明半暗的狀態(tài)。4.組合預(yù)測法對某一問題的預(yù)測可采用不同的預(yù)測方法,而每種預(yù)測方法的適用條件不盡相同,所產(chǎn)生的預(yù)測結(jié)果不同,其預(yù)測精度往往也不同。但是這些單項(xiàng)預(yù)測法在數(shù)據(jù)處理及不同準(zhǔn)則方面均有其獨(dú)到之處,能從不同的角度來推導(dǎo)和演繹,其預(yù)測結(jié)果都有一定的價(jià)值。一種更為科學(xué)的做法是,將不同的預(yù)測方法以某種方式進(jìn)行適當(dāng)?shù)慕M合,綜合利用各種預(yù)測所提供的信息,盡可能地提高預(yù)測精度,于是就形成了組合預(yù)測方法。組合預(yù)測法就是先利用兩種或兩種以上不同的單項(xiàng)預(yù)測法對同一預(yù)測對象進(jìn)行預(yù)測。5.其他的預(yù)測方法主要有:專家評估法,市場調(diào)查法等傳統(tǒng)的定性方法,馬爾可夫鏈預(yù)測法,趨勢外推預(yù)測法干預(yù)分析模型預(yù)測法,景氣預(yù)測法等定量分析法。6.人工神經(jīng)網(wǎng)絡(luò)方法自上世紀(jì)初至今,人工智能多次成為研究的熱點(diǎn)問題,并取得很大的發(fā)展。特別是人工神經(jīng)網(wǎng)絡(luò)作為對人腦的一種簡單的抽象和模擬,是探索人類智能奧秘的有力工具,經(jīng)過長期的發(fā)展對神經(jīng)網(wǎng)絡(luò)的研究已經(jīng)取得了劃時代的進(jìn)步,將其應(yīng)用于各個領(lǐng)域。在金融領(lǐng)域,許多學(xué)者都開展了對神經(jīng)網(wǎng)絡(luò)的研究和應(yīng)用。這其中最早的研究是1988年White利用用神經(jīng)網(wǎng)絡(luò)來預(yù)測IBM普通股每日報(bào)酬率,但是經(jīng)過訓(xùn)練樣本的學(xué)習(xí)后,其預(yù)測結(jié)果不甚理想。他認(rèn)為原因可能是神經(jīng)網(wǎng)絡(luò)陷入局部極小值而無法跳出,造成預(yù)測能力不強(qiáng)。后來在Kimoo.Asakawa,YodaandTakeoka等人的努力下,于1990年利用神經(jīng)網(wǎng)絡(luò)開發(fā)了一款TokyostockexchangePriceindex(TPOIX)預(yù)測系統(tǒng),這款預(yù)測系統(tǒng)主要是對日本東京證券交易所股價(jià)加權(quán)平均指數(shù)進(jìn)行的預(yù)測,以此來為投資者決定買進(jìn)賣出股票的最佳時機(jī),最后得到的結(jié)果:人工神經(jīng)網(wǎng)絡(luò)模型所預(yù)測得到的報(bào)酬率優(yōu)于TOPIX加權(quán)平均指數(shù)的同等預(yù)測。1992年,Baba和Kozaki使用15個輸入變量、2個隱層及1個輸出變量的神經(jīng)網(wǎng)絡(luò)模型來預(yù)測日本股價(jià)的趨勢,訓(xùn)練樣本分成上漲及下跌兩種趨勢的學(xué)習(xí),在趨勢決定后,預(yù)測股價(jià)漲跌方向的正確率相當(dāng)高,但是,若趨勢決定錯誤時,神經(jīng)網(wǎng)絡(luò)的預(yù)測能力減弱,無法正確預(yù)測股價(jià)。其實(shí)他們的研究為后來學(xué)者提供了一種新的預(yù)測方向即是不預(yù)測具體股價(jià)的參數(shù),而運(yùn)用神經(jīng)網(wǎng)絡(luò)的分類效果直接預(yù)測股價(jià)的漲跌趨勢,這也是很有實(shí)際意義的。1996年,JovinaRoman等人介紹了神經(jīng)網(wǎng)絡(luò)在投資,組合決策以及股票預(yù)測等金融相關(guān)領(lǐng)域中的應(yīng)用,Shaun-innWu等人綜合應(yīng)用了傳統(tǒng)的預(yù)測與人工智能預(yù)測方法,提高了相應(yīng)的預(yù)測性能。1999年,Pesaran和Timmermann對過去25年的英國倫敦證券指數(shù)進(jìn)行了預(yù)測,他們采用神經(jīng)網(wǎng)絡(luò)技術(shù)預(yù)測證券指數(shù)的月變化率達(dá)到了60%左右的正確率。2001年,ChungKimKwong利用澳大利亞股票市場中的7家具體上市公司股票交易的數(shù)據(jù)進(jìn)行神經(jīng)網(wǎng)絡(luò)預(yù)測研究,得到的平均預(yù)測精度為48.2%。而與此同時國內(nèi)也有很多學(xué)者進(jìn)行了相關(guān)的研究。但不管預(yù)測結(jié)果如何,由于股票市場的多噪聲,不穩(wěn)定,非線性等特性,使得這些預(yù)測依然很難得到普遍的理想效果??蓮牧硗庖粋€方面來看,神經(jīng)網(wǎng)絡(luò)具有分布處理、自組織、自適應(yīng)、自學(xué)習(xí)和容錯性好等優(yōu)良特性,在處理股票預(yù)測這樣一個極其復(fù)雜的非線性動力學(xué)系統(tǒng)是可行的、有效的。所以這其中的研究重點(diǎn)在于樣本選取與預(yù)處理、神經(jīng)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)選擇(包括:神經(jīng)元個數(shù)、隱層數(shù)、輸入輸出函數(shù)等)、網(wǎng)絡(luò)的自適應(yīng)能力等方面亟需改進(jìn)。1.3論文的研究方法及其框架結(jié)構(gòu)其實(shí)在實(shí)際股票市場的交易中有很多相關(guān)的指標(biāo)諸如股票的開盤價(jià)、最高價(jià)、最低價(jià)、中間價(jià)以及收盤價(jià)等,這些數(shù)據(jù)都從不同的角度反映了當(dāng)前的股票市場的波動情況。而一般的股票預(yù)測都是基于以下三點(diǎn)假設(shè)前提的:1.有效市場假設(shè):當(dāng)股票價(jià)格的波動能夠充分地反映投資者所獲得的信息時,股票市場就是有效市場,也可以認(rèn)為是此時股票價(jià)格是真正的透明博弈的供求關(guān)系的結(jié)果。股票價(jià)格變化始終是受到一國國內(nèi)宏觀、微觀經(jīng)濟(jì)以及國際其他市場的影響,而各種價(jià)格的變動反映出股票市場是有效市場;2.供求決定假設(shè):指一切信息都會對股票市場的供求雙方相互博弈對比產(chǎn)生影響,供求關(guān)系決定了股票的交易量和交易價(jià)格;3.歷史相似原則:指由歷史資料所概括出來的規(guī)律(這些規(guī)律一般都認(rèn)為是隱藏在交易的價(jià)格和交易量等反映股票市場波動的相關(guān)指標(biāo)中的)已經(jīng)包含了未來股票市場的一切變動趨勢,忽略其他諸如一國國內(nèi)政局動亂沖突或是發(fā)生重大未曾預(yù)料的自然災(zāi)害。本文其實(shí)所選用的神經(jīng)網(wǎng)絡(luò)工具最重要的假設(shè)前提就是上面的第三條,即我們所得到的預(yù)測是基于黑箱的預(yù)測,股票的數(shù)據(jù)指標(biāo)已經(jīng)完全隱藏了未來市場波動的一切因素,忽略其他外在不可控的因素的干擾。二.股票預(yù)測的關(guān)鍵問題分析2.1股票價(jià)格波動的因素以及預(yù)測的基本假設(shè)2.1.1股票價(jià)格波動的因素股票價(jià)格是指股票在發(fā)行和交易時的價(jià)格,包括發(fā)行價(jià)格和市場價(jià)格。股票的發(fā)行價(jià)格是指股份公司在發(fā)行新股票時的價(jià)格。股票的發(fā)行價(jià)格一般是根據(jù)股票時價(jià),股票行市的變化趨勢,股票籌集資本的難易程度和發(fā)行新股票時原有股東利益的影響等因素來決定的。影響股票價(jià)格的主要因素主要有以下幾個方面:1.股票市場內(nèi)部因素:(1)股票的供求關(guān)系。市場供求關(guān)系是影響股票價(jià)格的直接因素。當(dāng)市場供給大于需求時,股票價(jià)格上漲,當(dāng)市場供給小于需求時,股票下跌。(2)大戶的操縱。這主要是由于股票市場上,一些大戶利用各種不正當(dāng)?shù)氖侄蝸聿倏v市場上股票的價(jià)格,使股票價(jià)格變化劇烈。在完全競爭有效的市場中是不存在這種壟斷力量的,但在實(shí)際的各個股票市場中都存在一定這種現(xiàn)象,特別是在我國的股市中,由于各個大型央企處于該行業(yè)的主導(dǎo)位置,很容易誘發(fā)高層腐敗所導(dǎo)致的操縱股市的行為。2.公司內(nèi)部因素:(1)公司的經(jīng)營狀況和盈利能力。這是影響股票價(jià)格最重要的基本因素。經(jīng)營狀況即指發(fā)行公司在經(jīng)營方面的概況包括經(jīng)營特征,如公司屬于商業(yè)企業(yè)還是工業(yè)企業(yè),公司在行業(yè)中的地位,產(chǎn)品性質(zhì),內(nèi)銷還是外銷,技術(shù)密集型還是勞動密集型,批量生產(chǎn)還是個別生產(chǎn),產(chǎn)品的生命周期,在市場上有無替代產(chǎn)品,產(chǎn)品的競爭力、銷售力和銷售網(wǎng)等。此外,公司的經(jīng)濟(jì)狀況還包括員工的構(gòu)成以及管理結(jié)構(gòu)、管理水平等。上述因素既可直接影響公司的財(cái)務(wù)狀況,亦可間接影響投資者的投資意向,進(jìn)而影響股價(jià)變化。當(dāng)公司的經(jīng)營狀況好,盈利能力強(qiáng),股票價(jià)格的基礎(chǔ)扎實(shí),大家認(rèn)為此時的股票很穩(wěn)定,上漲的機(jī)會多,反之,公司的經(jīng)營狀況差,盈利能力弱,股票價(jià)格難以提高,下跌的機(jī)會大。(2)上市公司的財(cái)務(wù)狀況。發(fā)行公司的財(cái)務(wù)狀況亦是影響股價(jià)的重要原因之一。依照各國法規(guī),凡能反映公司的財(cái)務(wù)狀況的重要指標(biāo)都必須公開,上市公司的財(cái)務(wù)狀況還需定期向社會公開。3.宏觀經(jīng)濟(jì)因素:(1)經(jīng)濟(jì)周期。宏觀經(jīng)濟(jì)周期的循環(huán)、波動與股價(jià)之間存在著緊密的聯(lián)系。一般情況下,股價(jià)總是伴隨著經(jīng)濟(jì)周期的變化而升降。在經(jīng)濟(jì)復(fù)蘇階段,投資逐步回升,資本周轉(zhuǎn)開始加速,利潤逐漸增加,股價(jià)呈上升趨勢。在繁榮階段,生產(chǎn)繼續(xù)增加,設(shè)備的擴(kuò)充、更新加速,技術(shù)引入或是創(chuàng)新加快,就業(yè)機(jī)會不斷增多,工資持續(xù)上升并引起消費(fèi)上漲;同時企業(yè)盈利不斷上升,投資活動趨于活躍,股價(jià)進(jìn)入大幅度上升。在危機(jī)階段,由于有支付能力的需求減少,造成整個社會的生產(chǎn)過剩,企業(yè)經(jīng)營規(guī)模逐步縮小,產(chǎn)量下降,失業(yè)人數(shù)迅速增加,企業(yè)盈利能力急劇下降,股價(jià)隨之下跌;同時,由于危機(jī)到來,企業(yè)倒閉增加,投資者紛紛拋售股票,股價(jià)亦急劇下跌。在蕭條階段,生產(chǎn)嚴(yán)重過剩并處于停滯狀態(tài),商品價(jià)格低落且銷售困難,而在危機(jī)階段中殘存的資本流入股票市場,股價(jià)不再繼續(xù)下跌并漸趨于穩(wěn)定狀態(tài)。從這不難看出,股價(jià)不僅是伴隨著經(jīng)濟(jì)周期的循環(huán)波動而起伏的,而且,其變動往往在經(jīng)濟(jì)循環(huán)變化之前出現(xiàn)。兩者間相互依存的關(guān)系一般表現(xiàn)為:復(fù)蘇階段--股價(jià)回升;繁榮階段--股價(jià)上升;危機(jī)階段--股價(jià)下跌;蕭條階段--股價(jià)穩(wěn)定。(2)物價(jià)的變動。商品的價(jià)格是貨幣購買力的表現(xiàn),所以物價(jià)水平被視為通貨膨脹或通貨緊縮的重要指標(biāo)。一般而言,商品價(jià)格上升時,公司的產(chǎn)品能夠以較高的價(jià)格水平售出,盈利相應(yīng)增加,股價(jià)亦會上升。如物價(jià)上升時,那些擁有較大庫存產(chǎn)品的企業(yè)的生產(chǎn)成本是按原來的物價(jià)計(jì)算的,因而,可導(dǎo)致直接的盈利上升;對于需大量依賴新購原材料的企業(yè)而言,則可能產(chǎn)生不利影響。此外,由于物價(jià)上漲,股票也有一定的保值作用,也由于物價(jià)上漲,貨幣供應(yīng)量增加,也會使社會游資進(jìn)入股票市場,增大需求,導(dǎo)致股價(jià)上升。需要說明的是,物價(jià)與股價(jià)的關(guān)系并非完全是正相關(guān),即物價(jià)上漲股價(jià)亦上升。當(dāng)物價(jià)上漲到一定程度,由于經(jīng)濟(jì)過熱又會推動利率上升,則股價(jià)亦可能下降;此外,如物價(jià)上漲所導(dǎo)致的上升成本無法通過銷售轉(zhuǎn)嫁出去;物價(jià)上漲的程度引起投資者對股票價(jià)值所用折現(xiàn)率的估計(jì)提高而造成股票價(jià)值降低;物價(jià)上漲的程度使股票的保值作用降低,投資者把資金從股市抽出,投到其他保值物品方面時等等,股價(jià)亦會相應(yīng)下降。4.政策因素:(1)政治因素。政治因素指能對經(jīng)濟(jì)因素發(fā)生直接或間接影響的政治方面的原因,政治因素包括社會經(jīng)濟(jì)發(fā)展規(guī)劃,經(jīng)濟(jì)政策,政權(quán)的更替,政府的國民信賴,戰(zhàn)爭,動亂等,這些都會影響股票價(jià)格。(2)國家的經(jīng)濟(jì)政策。各國政府在財(cái)政政策、稅收政策、產(chǎn)業(yè)政策、貨幣政策、外貿(mào)政策等方面的變化,會影響股價(jià)變動。就財(cái)政收支政策看,當(dāng)國家對某類企業(yè)實(shí)行稅收優(yōu)惠,那就意味著這些企業(yè)的盈利將相應(yīng)增加,而這些企業(yè)公司發(fā)行的股票亦會受到重視,其價(jià)格容易上升。從財(cái)政支出政策看,當(dāng)國家對某些行業(yè)或某類企業(yè)增加投入,就意味著這些行業(yè)、企業(yè)的生產(chǎn)將發(fā)展,亦會同樣引起投資者的重視。此外,如產(chǎn)業(yè)政策的執(zhí)行,政府對產(chǎn)品和勞務(wù)的限價(jià)會導(dǎo)致相應(yīng)股票價(jià)格下跌;稅收制度的改變,如調(diào)高個人所得稅,則會影響社會消費(fèi)水平下降,引起商品滯銷,乃至于影響公司盈利及股價(jià)下跌,等等。(3)利率。一般來說,利率與股票價(jià)格成反比,但也有相關(guān)學(xué)者運(yùn)用不同國家的股票市場數(shù)據(jù)得到了相反的結(jié)論。當(dāng)利率上升時,會引起幾方面的變化,從而導(dǎo)致股價(jià)下降;一是公司借款成本增加,相應(yīng)使利潤減少;二是資金從股市流入銀行,需求減少;三是投資者評估價(jià)值所用的折現(xiàn)率上升,股票價(jià)值因此會下降。反之則股價(jià)會上升。(4)財(cái)政開支;一般來說股票價(jià)格與財(cái)政開支同方向變化。(5)稅收制度.一般來說,當(dāng)稅率和課稅種類變更對公司和投資者有利時,股價(jià)將上升,反之則下降.(6)信用政策.一般來說當(dāng)信用政策比較寬松時,股票價(jià)格上升可能性較大,反之則較小。5.其他因素: (1)國際經(jīng)濟(jì)技術(shù)因素。主要是國際經(jīng)濟(jì)變化趨勢,國際經(jīng)濟(jì)景氣度等因素,這些因素會影響股票的價(jià)格。(2)心理預(yù)期因素。這主要是股票投資者在面對市場波動時心理預(yù)期的變化對股票價(jià)格的影響。市場上的大部分投資者都主觀認(rèn)為只要上市公司盈利每年趨升,其相應(yīng)股價(jià)必然會一起上漲,但事實(shí)往往是并非如此的,不同的投資者對上市公司未來的盈利狀況估計(jì)的結(jié)果不一致,例如一家公司的盈利較往年有超過百分之三十的升幅,公司股價(jià)亦都有可能因?yàn)槭袌鲱A(yù)期有百分之五十的盈利增長而下挫,反之,倘若市場認(rèn)為公司虧損將會增加百分之十,但當(dāng)最終的結(jié)果是該公司虧損只拓闊百分之五(即每股盈利出現(xiàn)負(fù)數(shù)),公司股價(jià)亦可能會因?yàn)闃I(yè)績較市場預(yù)期好而上升。另外,只要市場憧憬公司前景形勢可觀,能夠于將來為股東賺取大額回報(bào),就算目前公司每股盈利出現(xiàn)嚴(yán)重虧損,股價(jià)亦有可能因?yàn)檫@一次又一次的美好憧憬等待而大幅走高??傊?,影響公司股價(jià)的因素并不單單停留于每股盈利的多少,反而較市場預(yù)期的多或少,方才是決定公司股價(jià)升跌的重要元素。除此之外,新股上市、股票分割、匯率變動、國際收支以及個股的漲跌情況等因素對股價(jià)的波動也是有不同程度的影響的,因此,分析影響股價(jià)變動的因素有很多,市場的變化總是紛繁復(fù)雜的。2.1.2股市預(yù)測的基本假設(shè)1.市場行為涵蓋一切信息在前面分析影響股票價(jià)格波動的因素時,我們已經(jīng)知道股價(jià)未來變化的趨勢直接取決于供求關(guān)系雙方的相互博弈,不論是股票市場內(nèi)部,公司財(cái)務(wù)狀況,宏觀經(jīng)濟(jì)的周期波動,還是政策影響或是心理預(yù)期變化等等導(dǎo)致的供大于求,股價(jià)下跌,而下跌的幅度大小則與供求的雙方差額相互關(guān)聯(lián),但這些種種的復(fù)雜博弈都最終將集中反映在股票價(jià)格、成交量和時間序列之中。這些所有信息并不是每個投資者都可以直接得到,但所有的有需要的投資者都可以從股市的分析中得到有用的信息。2.股價(jià)變化有趨勢可遵循。股票價(jià)格的波動是有一定規(guī)律的,即保持原來運(yùn)動方向的慣性,而股票價(jià)格的漲跌方向是由供求關(guān)系決定的。股票價(jià)格的漲跌反映了一定時期內(nèi)供求關(guān)系的博弈,供求關(guān)系一旦確定,股票價(jià)格的變化趨勢就會一直持續(xù)下去。只要市場上的供求關(guān)系不發(fā)生根本改變,股票價(jià)格的波動趨勢就不會發(fā)生反轉(zhuǎn)。3.歷史會重演這條假設(shè)主要是基于心理學(xué)的命題。市場中進(jìn)行具體買賣的是人,是由人決定最終的操作行為。因此,這一行為必然要受到人類心理學(xué)中某些規(guī)律的制約。在真實(shí)的市場交易上,人們在面對相似的情境時,會根據(jù)以往的經(jīng)驗(yàn)和規(guī)律做出相類似的反映。而這些反映又會在新的應(yīng)用中失敗或是成功對比得到加強(qiáng)。因此,根據(jù)市場上的歷史資料概括出來的經(jīng)驗(yàn)和規(guī)律已經(jīng)包含了未來股票市場的一切變動趨勢,所以可以根據(jù)歷史資料的數(shù)據(jù)來預(yù)測未來股票的波動趨勢。根據(jù)以上這三條假設(shè),可以對股票市場的價(jià)格走勢做出合理的預(yù)測。2.2股票預(yù)測的常用術(shù)語和技術(shù)指標(biāo)2.2.1常用的股票術(shù)語1.收盤價(jià):前一交易日或前一天收盤前最后一筆交易的成交價(jià)格,反映該段交易多空雙方交戰(zhàn)的結(jié)果。2.開盤價(jià):是一天交易開始時第一筆成交價(jià),目前深滬實(shí)行集合競價(jià)。如果開市后30分鐘內(nèi)無成交價(jià),則以前日的收盤價(jià)作為開盤價(jià)。3.最高價(jià):是一天交易中最高價(jià)格的成交。4.最低價(jià):是一天交易中最低價(jià)格的成交。5.買進(jìn)價(jià):委托買入的價(jià)格。6.賣出價(jià):委托賣出的價(jià)格。7.成交價(jià):成交價(jià)有低于、等于買入價(jià),高于、等于賣出價(jià),在買入賣出之間五種。8.成交量:全日成交的總量(股數(shù)、金額)。9.漲跌:以每天的收盤價(jià)和前一天或前一交易日收盤價(jià)相比較,來決定股票價(jià)格實(shí)際漲跌狀況。10.委買手?jǐn)?shù):現(xiàn)在所有委托買入下三檔之手?jǐn)?shù)相加之總和。11.委賣手?jǐn)?shù):現(xiàn)在所有委托賣出上三檔之手?jǐn)?shù)相加之總和。12.委比:委托買入的手?jǐn)?shù)與委托賣出的手?jǐn)?shù)之比,委比正值大,買方比賣方強(qiáng),反之,賣方比買方強(qiáng)。13.外盤:成交價(jià)在賣出價(jià)為外盤。14.內(nèi)盤:成交價(jià)在買入價(jià)為內(nèi)盤。內(nèi)盤+外盤=總手?jǐn)?shù)15.莊家:指參與股市操作的證券、保險(xiǎn)、金融等資金雄厚的機(jī)構(gòu),它們構(gòu)成股市的主力,莊家的操作意圖對股市的趨勢起著決定性的作用,是散戶跟蹤的目標(biāo)。16.市盈率:指某種股票每股市價(jià)與每股盈利的比率。市盈率=普通股每股市場價(jià)格÷普通股每年每股盈利17.市凈率:指股票市場價(jià)格與賬面價(jià)格的比值。市凈率=股票價(jià)格÷每股凈值18.資產(chǎn)收益率:指企業(yè)凈利潤與平均資產(chǎn)總額的百分比。資產(chǎn)收益率=(凈利潤÷平均資產(chǎn)總額)*100%。19.綜合指數(shù):是大盤分析的代表變量,在我國國內(nèi)分為上證綜合指數(shù)和深證綜合指數(shù)。2.2.2常用的技術(shù)指標(biāo)1.指數(shù)平滑異同移動平均線(MACD)指數(shù)平滑異同移動平均線(MACD)是以快速移動平均線(短期線)與慢速移動平均線(長期線)相對距離的變化提示買賣時機(jī)的指標(biāo)。它首先以指數(shù)平滑計(jì)算法計(jì)算出快速移動平均線和慢速移動平均線,再以快速線數(shù)值減慢速線數(shù)值即得到快慢線相對距離的差離值,為使趨勢信號更明顯并且不受股價(jià)過分波動的影響,對差離值也進(jìn)行平滑計(jì)算,得到差離值的平均值,把差離值和差離平均值畫在以時間為橫軸,以MACD為縱軸的坐標(biāo)上,通過觀察差離值和差離平均值的方向、絕對位置和相對位置關(guān)系,把它們的同向、異向和交叉現(xiàn)象作為買賣信號的提示,為使買賣信號更直觀,還可以從差離值減差離平均值之差向時間軸引垂直線,得到MACD柱狀線。指數(shù)平滑異同移動平均線是利用了快速移動平均線和慢速移動平均線,在一段上漲或下跌行情中兩線之間的差距拉大,而在漲勢或跌勢趨緩時兩線又相互接近或交叉的特征,通過雙重平滑運(yùn)算后,用以研究和判別買賣時機(jī)的方法。2.威廉指標(biāo)(WMS)威廉指標(biāo)最早起源于期貨市場,由LarryWilliams于1973年首創(chuàng)。該指標(biāo)通過分析一段時間內(nèi)股價(jià)高低價(jià)位和收盤價(jià)之間的關(guān)系,來量度股市的超買超賣狀態(tài),依此作為短期投資信號的一種技術(shù)指標(biāo)。目前它已經(jīng)成為中國股市中被廣泛使用的指標(biāo)之一。WMS的操作法則從兩方面考慮:一是WMS的數(shù)值,二是WMS曲線的形狀。第一,從WMS的取值方面考慮:①當(dāng)WMS高于80時,處于超賣狀態(tài),行情即將見底,應(yīng)當(dāng)考慮買進(jìn);②當(dāng)WMS低于20時,處于超買狀態(tài),行情即將見頂,應(yīng)當(dāng)考慮賣出。這里80和20只是一個經(jīng)驗(yàn)數(shù)字,并不是絕對的。同時,WMS在使用過程中應(yīng)該注意與其他技術(shù)指標(biāo)相配合。在盤整過程中,WMS的準(zhǔn)確性較高;而在上升或下降趨勢當(dāng)中,卻不能只以WMS超買超賣信號作為行情判斷的依據(jù)。第二,從WMS的曲線形狀考慮。①在WMS進(jìn)入低數(shù)值區(qū)位后(此時為超買),一般要回頭。如果這時股價(jià)還繼續(xù)上升,就會產(chǎn)生背離,是賣出的信號。②在WMS進(jìn)人高數(shù)值區(qū)位后(此時為超賣),一般要反彈。如果這時股價(jià)還繼續(xù)下降,就會產(chǎn)生背離,是買進(jìn)的信號。③WMS連續(xù)幾次撞頂(底),局部形成雙重或多重頂(底),則是賣出(買進(jìn))的信號。這里需要說明的是,WMS的頂部數(shù)值為0,底部數(shù)值為100。3.隨機(jī)指數(shù)(KD)隨機(jī)指標(biāo)KD是分析師喬治·蘭德首先提出的技術(shù)分析理論。在股票、期貨等證券市場中有很好的實(shí)戰(zhàn)效果。從實(shí)踐看,KD指標(biāo)的核心原理是平衡的觀點(diǎn),即股價(jià)的任何動蕩都將向平衡位置回歸。KD指標(biāo)把一定周期內(nèi)最高股價(jià)和最低股價(jià)的中心點(diǎn)作為平衡位置,高于此位置過遠(yuǎn)將向下回歸,低于此位置過遠(yuǎn)將向上回歸。在分析中設(shè)置快速線K和慢速線D共同研判,另外還有考察K、D位置關(guān)系的J線。4.相對強(qiáng)弱指數(shù)(RSI)RSI指標(biāo)(RelativeStrengthlndex)是與KD指標(biāo)齊名的常用技術(shù)指標(biāo)。RSI以一特定時期內(nèi)股價(jià)的變動情況推測價(jià)格未來的變動方向,并根據(jù)股價(jià)漲跌幅度顯示市場的強(qiáng)弱。相對強(qiáng)弱指標(biāo)RSI是分析師(Wells.Wilder,Jr)于七十年代首先提出的技術(shù)分析理論。RSI是RelativeStrengthIndex的縮寫。盡管其歷史不長,但由于該指標(biāo)客觀實(shí)用的特點(diǎn),目前已為廣大投資者接受,從而成為廣泛使用的普及性指標(biāo)之一。技術(shù)分析原理之一是市場變化包含一切。相對強(qiáng)弱指標(biāo)正是從這一點(diǎn)出發(fā),從市場價(jià)格變化觀察買賣雙方的力量變化,其中以價(jià)格上漲幅度代表買方力量,以價(jià)格下跌幅度代表賣方力量,以漲跌幅度的對比代表買賣雙方力量的對比,通過對比預(yù)測未來股價(jià)的運(yùn)行方向,這種對比的比值就是RSI數(shù)值。5.乖離率(BIAS)乖離率是表示當(dāng)前股價(jià)偏離移動平均線程度的指標(biāo)。當(dāng)日收盤價(jià)減移動平均線之差與移動平均線的比值,即乖離率。在股市上,主要用乖離率來決定投資者的買賣行為。6.心理線指標(biāo)(PSY)PSY(PsychologicalLine)是從投資者的買賣趨向心理方面,將一定時期內(nèi)投資者看多或看空的心理事實(shí)轉(zhuǎn)化為數(shù)值,來研究和判斷股價(jià)未來走勢的技術(shù)指標(biāo)。7.交易量指標(biāo)(OBV)OBV的英文全稱是OnBalanceVolume,即“平衡交易量”,人們更多地稱其為能量潮,它是Granville在20世紀(jì)60年代提出來的。該指標(biāo)的理論基礎(chǔ)是市場價(jià)格的有效變動必須有成交量配合,量是價(jià)的先行指標(biāo)。利用OBV可以驗(yàn)證當(dāng)前股價(jià)走勢的可靠性,并可以得到趨勢可能反轉(zhuǎn)的信號。比起單獨(dú)使用成交量來,OBV看得更清楚。8.騰落指數(shù)(ADL)ADL(Advance/DeclineLine,騰落指數(shù)),中文名稱為騰落指數(shù),即上升下降曲線的意思。ADL是以股票每天上漲或下跌的家數(shù)作為觀察的對象,通過簡單算術(shù)加減來比較每日上漲股票和下跌股票家數(shù)的累積情況,形成升跌曲線,并與綜合指數(shù)相互對比,對大勢的未來進(jìn)行預(yù)測。9.漲跌比率(ADR)ADR(Advance/DeclineRatio),中文名稱為漲跌比指標(biāo),即上升下降比。ADR是根據(jù)股票的上漲家數(shù)和下跌家數(shù)的比值,推斷證券市場多空雙方力量的對比,進(jìn)而判斷出證券市場的實(shí)際情況。10.超買超賣指標(biāo)(OBOS)OBOS(OverBoughtOverSold,)中文名稱是超買超賣指標(biāo),也是運(yùn)用上漲和下跌的股票家數(shù)的差距對大勢進(jìn)行分析的技術(shù)指標(biāo)。與ADR相比,其涵義更直觀,計(jì)算更簡便。OBOS是用一段時間內(nèi)上漲和下跌股票家數(shù)的差距來反映當(dāng)前股市多空雙方力量的對比和強(qiáng)弱。11.人氣買賣指標(biāo)(AR)股市中買賣雙方的氣勢主要反映在每日股指最高點(diǎn)、最低點(diǎn)及開市點(diǎn)三者之間的關(guān)系上。人氣買賣指標(biāo)(AR)指標(biāo)是利用一定周期內(nèi)三者的差異及比值反映出股市強(qiáng)弱、買賣氣勢的指標(biāo)。12.買賣意愿指標(biāo)(BR)BR指標(biāo)反映的是昨日股指收盤價(jià)與今日最高股指和最低股指之間的強(qiáng)弱走勢,從而反映股指意愿。2.3股票數(shù)據(jù)的特點(diǎn)在前面我們已經(jīng)分析過,股票市場預(yù)測的常用變量和指標(biāo),而這些數(shù)據(jù)信息的本質(zhì)反映的是股票市場上多方復(fù)雜博弈的體現(xiàn),這就直接導(dǎo)致了股票市場上的數(shù)據(jù)本身具有一些特殊的性質(zhì)。這些特殊的性質(zhì)才導(dǎo)致股票價(jià)格預(yù)測的難度,可這也正是學(xué)者們研究的動力。1.股票市場上的數(shù)據(jù)含有較多噪聲。雖然在前面我們對股市預(yù)測的基本假設(shè)中已經(jīng)表明,股票市場上歷史總是會重演,因此我們可以用過去已有的數(shù)據(jù)黑箱預(yù)測未來股價(jià)波動,但實(shí)際上股票市場上經(jīng)常會有一些突發(fā)事件,它們并不會使股票價(jià)格的結(jié)構(gòu)(趨勢、周期等)發(fā)生質(zhì)的改變,僅僅會使股市數(shù)據(jù)發(fā)生暫時的偏離,但很快又會恢復(fù)到原來的趨勢及周期上去。例如:一國突發(fā)性的產(chǎn)生大規(guī)模的食品安全問題、發(fā)生強(qiáng)烈地震等自然災(zāi)害、機(jī)構(gòu)大戶的黑幕操作、局部武裝沖突等等。為了消除這些突然出現(xiàn)的噪聲奇異點(diǎn),在線性的條件下,一般可以通過設(shè)計(jì)各種濾波器將噪音濾除,但在非線性條件下卻不能輕易處理,因?yàn)樗鼈兛赡茴A(yù)示著股市基本結(jié)構(gòu)將要發(fā)生變化的趨勢,故而股票數(shù)據(jù)的這種特性要求處理股市數(shù)據(jù)的預(yù)測系統(tǒng)具有良好的魯棒性。2.股市上的數(shù)據(jù)具有非線性特性。股票價(jià)格自身以及影響其波動的因素多種多樣,這些變量之間往往呈現(xiàn)出非線性特性,并且這些非線性之間的數(shù)據(jù)關(guān)系一般都很復(fù)雜多元化,因此要求股市預(yù)測模型應(yīng)具有強(qiáng)大的處理非線性問題的能力。雖然已經(jīng)發(fā)展起來的非線性數(shù)學(xué)、耗散結(jié)構(gòu)理論等為描述非線性動力學(xué)系統(tǒng)提供了一些可用的工具,但實(shí)際應(yīng)用于股票市場上實(shí)證分析仍有不少亟需解決的問題。3.股市數(shù)據(jù)往往反映了投資者的主觀性。股票市場無論怎么復(fù)雜多方博弈,其實(shí)際操作者都是投資者這些人的因素,而這些不同的投資者投資行為各有不同。不同的投資者所思考的投資方式不同,達(dá)到的目的不同,所獲得的股市已有的信息也不同,所關(guān)心的具體個股或是大盤走勢側(cè)重點(diǎn)不同,這都導(dǎo)致了股票交易具有極大的主觀性。投資者的主觀性,使得股票預(yù)測誤差相當(dāng)大,并且隨著時間的累加誤差逐漸放大。與其他物理動力學(xué)系統(tǒng)不同,在股市預(yù)測系統(tǒng)中,對過去的樣本數(shù)據(jù)的最好匹配并不能保證是最好的未來預(yù)測,即建模數(shù)據(jù)的最小誤差準(zhǔn)則并不是提高預(yù)測精度的最好準(zhǔn)則,一種預(yù)測方法過去和現(xiàn)在的表現(xiàn)不能說明其未來的預(yù)測結(jié)果。4.我國的股市波動具有很強(qiáng)的政策性導(dǎo)向。由于我國股市建立時間短,投資者的投資心態(tài)還不十分成熟,市場經(jīng)濟(jì)體制還不完備,股市上還存在很多國有巨頭操盤,并帶有很多計(jì)劃經(jīng)濟(jì)體制的特征,因此我國股市對于國家的政策性導(dǎo)向非常敏感。故而我國上證和深證中經(jīng)常出現(xiàn)所謂的暴漲暴跌,因此很難用一個穩(wěn)定的模型來對這種股市的變動做出準(zhǔn)確的預(yù)測。三.神經(jīng)網(wǎng)絡(luò)的基本原理介紹3.1人工神經(jīng)網(wǎng)絡(luò)的定義和發(fā)展過程人工神經(jīng)網(wǎng)絡(luò)(ArtificialNeuralNetworks,ANN),是人工智能的一種核心方法,是人類中樞(大腦)神經(jīng)系統(tǒng)的簡化模型,是由大量簡單的并行分布的計(jì)算單元(神經(jīng)元,neurons)互相連接而成的自適應(yīng)非線性系統(tǒng)。神經(jīng)網(wǎng)絡(luò)作為一種對人腦的最簡單的抽象和模擬,是探索人類智能奧秘的有力工具,近年來它已經(jīng)發(fā)展成為一門設(shè)計(jì)生物、電子、計(jì)算機(jī)、數(shù)學(xué)、物理等多學(xué)科相互交叉的前沿性課題,其具有廣泛的應(yīng)用前景。神經(jīng)網(wǎng)絡(luò)的研究始于20世紀(jì)40年代。半個多世紀(jì)以來,它經(jīng)歷了一條由興起到衰退、又由衰退到興盛的曲折的發(fā)展過程,這一過程大致可分為以下的四個階段。1.初始發(fā)展階段:1940’s初,導(dǎo)致了人工智能的研究。早在1943年,心理學(xué)家W.S.McCulloch和數(shù)學(xué)家W.Pitts在研究生物神經(jīng)元的基礎(chǔ)上合作提出的“興奮”與“抑制”兩種狀態(tài)的神經(jīng)元模型和Hebb提出的神經(jīng)元連接強(qiáng)度的學(xué)習(xí)規(guī)則,開始了神經(jīng)科學(xué)理論的研究。1957年,F(xiàn).Rosenblatt提出了著名的感知器(Perceptron)模型,這是第一個真正的人工神經(jīng)網(wǎng)絡(luò)。1962年,B.Widrow和M.E.Hoff提出了的自適應(yīng)線性單元(Adaline)網(wǎng)絡(luò),其具有自適應(yīng)學(xué)習(xí)功能,在信號處理、模式識別等方面受到普遍重視和應(yīng)用。2.低潮時期:1960’s末,這個時期對神經(jīng)網(wǎng)絡(luò)的研究進(jìn)展不大。20世紀(jì)60年代到70年代,神經(jīng)網(wǎng)絡(luò)系統(tǒng)理論的發(fā)展處于一個低潮時期,造成這種情況的原因是發(fā)展過程中遇到了本質(zhì)的困難,即電子線路交叉極限的困難。在當(dāng)時計(jì)算機(jī)技術(shù)還不夠發(fā)達(dá)的狀況之下,神經(jīng)網(wǎng)絡(luò)的應(yīng)用沒有展開,而人工智能和專家系統(tǒng)還處于發(fā)展的高潮期,因此很多學(xué)者放棄了對神經(jīng)網(wǎng)絡(luò)的研究。3.重新興起時期:1980’s中,這個階段導(dǎo)致的對神經(jīng)網(wǎng)絡(luò)的研究熱潮,致使幾乎將其應(yīng)用于所有工程領(lǐng)域。1982年和1984年,John.J.Hopfield博士先后在美國國家科學(xué)院的刊物上發(fā)表了其著名的Hopfield模型理論,這是一個非線性動力系統(tǒng)的理論模型,它引起了各國學(xué)者的關(guān)注,并力圖將這一數(shù)學(xué)模型進(jìn)行電子學(xué)或光學(xué)的硬件實(shí)現(xiàn)。這就形成了人工神經(jīng)網(wǎng)絡(luò)的隊(duì)伍。1986年D.E.Rumelhart等提出了PDP(ParallelDistributedProcessing)網(wǎng)絡(luò)思想。其中的誤差反饋傳播算法,即BP算法,已成為至今影響最大、最為廣泛的一種網(wǎng)絡(luò)學(xué)習(xí)算法。4.發(fā)展高潮期:2000以后。20世紀(jì)90年代以來神經(jīng)網(wǎng)絡(luò)理論變得更加外向,注視著自身與科學(xué)技術(shù)之間的相互作用,不斷產(chǎn)生了具有重要意義的概念和方法,并形成了良好的工具。21世紀(jì)初,在這十幾年學(xué)者們的努力下,神經(jīng)網(wǎng)絡(luò)理論的主要前沿領(lǐng)域包括:對智能和機(jī)器關(guān)系問題的認(rèn)識進(jìn)一步增長;神經(jīng)計(jì)算和進(jìn)化計(jì)算取得重大進(jìn)展;神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)和神經(jīng)元芯片作用不斷擴(kuò)大。3.2神經(jīng)網(wǎng)絡(luò)基本原理3.2.1神經(jīng)元模型生物神經(jīng)元是一個小細(xì)胞,具有如下功能:1.接收來自感官或其它細(xì)胞的輸入(輸入功能);2.產(chǎn)生電輸出響應(yīng),并傳給其它神經(jīng)元(輸出功能)。而人腦包含:個神經(jīng)元,這其中:生物神經(jīng)元主要有三個組成部分:細(xì)胞體、軸突、樹突。(如下圖所示)突觸(連接強(qiáng)度)突觸(連接強(qiáng)度)樹突:Input(接收信息)細(xì)胞體軸突:Output(傳輸信息)圖1生物神經(jīng)元簡圖說明:樹突(接收信息):接收來自其它神經(jīng)元的電信號,并傳給細(xì)胞體。細(xì)胞體(信息處理器)對輸入信號:(數(shù)學(xué)描述)軸突(傳輸信息):把細(xì)胞體的輸出信號傳給其它神經(jīng)元。突觸(儲存信息):軸突和樹突的結(jié)合點(diǎn)(兩神經(jīng)元之間)。例如,新記憶的形成是通過改變突觸的強(qiáng)度(液狀體)來實(shí)現(xiàn)。人工神經(jīng)元人工神經(jīng)元是生物神經(jīng)元的簡單的模仿、簡化和抽象,是一個極其簡單的計(jì)算單元(函數(shù))。1943年,在神經(jīng)網(wǎng)絡(luò)研究的早期,由McCulloch(神經(jīng)解剖學(xué)家)和Pitts(數(shù)學(xué)家)提出的MP模型是一種簡單的人工神經(jīng)元模型。在該模型中,神經(jīng)元的活動表現(xiàn)為“興奮”和“抑制”兩種狀態(tài),其基本工作原理與如下的閾值單元模型基本相同。圖2人工神經(jīng)元模型上述人工神經(jīng)元實(shí)現(xiàn)了的極其簡單的非線性函數(shù)映射處理,即:,其中:—輸入(來自其它神經(jīng)元的信號);—輸出(軸突上的電信號);—權(quán)值(突觸的強(qiáng)度);—閾值、門限;—激活函數(shù)、傳輸函數(shù)。3.2.2神經(jīng)網(wǎng)絡(luò)三要素:激活函數(shù)、網(wǎng)絡(luò)結(jié)構(gòu)、學(xué)習(xí)規(guī)則。1.激活函數(shù):它用于對求和單元的計(jì)算結(jié)果進(jìn)行函數(shù)運(yùn)算得到神經(jīng)元的輸出。下面是幾種典型的神經(jīng)元的激活函數(shù)。(1)線性激活函數(shù):(用于線性自適應(yīng)網(wǎng)絡(luò))(2)硬限幅激活函數(shù):(用于感知器網(wǎng)絡(luò))(3)對數(shù)(S形)激活函數(shù):,性質(zhì):2.網(wǎng)絡(luò)結(jié)構(gòu):在此只介紹最重要的單隱層的前向網(wǎng)絡(luò)結(jié)構(gòu)。(a)網(wǎng)絡(luò)結(jié)構(gòu)圖3單隱層的前向網(wǎng)絡(luò)其中第一層的輸出表示為:,最終輸出為:(的非線性映射)=,(其中:—第k層第i個神經(jīng)元、第j個輸入的權(quán)值;—第k層第i個神經(jīng)元的閾值。)(b)逼近能力介紹現(xiàn)已證明:如上的單隱層(兩層)前向網(wǎng)絡(luò)(但選取第一層為對數(shù)S形激活函數(shù),蘇楚成取線性激活函數(shù))可任意精度的逼近中的任意函數(shù)。(此證明較難,在此略去)3.學(xué)習(xí)規(guī)則(訓(xùn)練規(guī)則):為了使網(wǎng)絡(luò)完成給定的任務(wù),利用訓(xùn)練樣本修正網(wǎng)絡(luò)權(quán)值和閾值的方法和過程。對于不同的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)和算法實(shí)現(xiàn)所選擇的學(xué)習(xí)規(guī)則都各有不同。3.2.3學(xué)習(xí)的兩種基本類型:有監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)。1.有監(jiān)督學(xué)習(xí),其訓(xùn)練樣本具有如下形式:,,…,.其中—網(wǎng)絡(luò)的輸入;—網(wǎng)絡(luò)的目標(biāo)輸出。利用訓(xùn)練樣本,調(diào)節(jié)網(wǎng)絡(luò)的參數(shù),使網(wǎng)絡(luò)對應(yīng)的輸出逼近2.無監(jiān)督學(xué)習(xí),其訓(xùn)練樣本為:;利用訓(xùn)練樣本,調(diào)節(jié)網(wǎng)絡(luò)的參數(shù),以表示輸入的某種固有特征(如聚類、某種統(tǒng)計(jì)上的分布特征)。3.3BP神經(jīng)網(wǎng)絡(luò)介紹由于BP神經(jīng)網(wǎng)絡(luò)已廣泛應(yīng)用于函數(shù)逼近、模式識別/分類、數(shù)據(jù)壓縮等領(lǐng)域,它也是前饋網(wǎng)絡(luò)的核心內(nèi)容,是人工神經(jīng)網(wǎng)絡(luò)最精的部分。因此,在此我們只詳細(xì)的探討B(tài)P網(wǎng)絡(luò)的結(jié)構(gòu)和相關(guān)算法。3.3.1BP神經(jīng)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)單隱層前向網(wǎng)絡(luò)一般層(第層結(jié)構(gòu)()) 其中,激活函數(shù):Sigmoid激活函數(shù):;對稱的Sigmoid激活函數(shù):;線性激活函數(shù):(輸出層,函數(shù)逼近)如果多層前向網(wǎng)絡(luò)的輸出層采用Sigmoid激活函數(shù),其輸出值將會限制在范圍(0,l)內(nèi)(通常用于分類問題);如果多層前向網(wǎng)絡(luò)的輸出層采用對稱的Sigmoid激活函數(shù),其輸出值將會限制在范圍(-1,l)內(nèi)(通常用于分類問題);如果多層前向網(wǎng)絡(luò)的輸出層采用線性激活函數(shù)則可以取任意值(通常用于函數(shù)逼近問題)。下面給出網(wǎng)絡(luò)第層更精確的結(jié)構(gòu)。第層輸出為,稱為第層第個神經(jīng)元的凈輸入。3.3.2反向傳播算法(BackpropagationAlgorithm)即BP算法在確定了網(wǎng)絡(luò)的結(jié)構(gòu)后,要通過訓(xùn)練樣本集對網(wǎng)絡(luò)進(jìn)行訓(xùn)練,即對網(wǎng)絡(luò)的閾值和權(quán)值進(jìn)行學(xué)習(xí)和修正,以使網(wǎng)絡(luò)實(shí)現(xiàn)給定的輸入/輸出映射關(guān)系。下面給出學(xué)習(xí)網(wǎng)絡(luò)的閾值和權(quán)值的BP算法。1.隨機(jī)梯度法(極小化均方誤差)設(shè),.記,其中,目標(biāo):求解 梯度法:由于無法計(jì)算,,因此采樣下面的隨機(jī)梯度法。隨機(jī)梯度法,2.BP算法推導(dǎo)目標(biāo):給出計(jì)算,的快速算法。為了給出計(jì)算,的遞推算法,通過引進(jìn)中間變量并使用鏈?zhǔn)角髮?dǎo)法則。(1)使用鏈?zhǔn)角髮?dǎo)法則化簡引進(jìn)中間變量:,.,(1)由于,故記,則(1)化簡為,(2)計(jì)算的反向遞推公式()下面給出與之間的遞推公式。.由于,所以.(如果,則)因此,有如下反向遞推公式:,當(dāng)時(即輸出層),有從而,3.3.3.BP算法的實(shí)現(xiàn)1.初始化在區(qū)間內(nèi)隨機(jī)選擇網(wǎng)絡(luò)的初始權(quán)值和閾值。2.前向計(jì)算(假設(shè)我們已知了第k步:),,,其中.3.向后計(jì)算第k步從而,通過如下遞推公式可計(jì)算出,.4.重新更正網(wǎng)絡(luò)權(quán)值和閾值,3.3.4BP網(wǎng)絡(luò)逼近能力分析K.Hornik已經(jīng)證明,對于任意緊集,單隱層(兩層)前向網(wǎng)絡(luò):,即,,可以任意精度的逼近中的任意函數(shù)。與此同時,Leshno也已經(jīng)證明:上述網(wǎng)絡(luò)可以任意精度的逼近任意連續(xù)函數(shù)。3.4神經(jīng)網(wǎng)絡(luò)的特點(diǎn)1.具有很強(qiáng)的學(xué)習(xí)能力。神經(jīng)網(wǎng)絡(luò)預(yù)測模型通過學(xué)習(xí)獲取知識,并不斷更新權(quán)值和閾值來改進(jìn)自身性能,最終使得預(yù)測準(zhǔn)確性較好。2.分布式存儲信息。神經(jīng)網(wǎng)絡(luò)存儲信息的方式與傳統(tǒng)計(jì)算機(jī)的思維方式是不同的,神經(jīng)網(wǎng)絡(luò)通過大量神經(jīng)元之間自適應(yīng)性的連接即閾值以及對各連接權(quán)值的分布來表示特點(diǎn)的預(yù)測信息。3.自適應(yīng)性。自適應(yīng)性是指整個神經(jīng)網(wǎng)絡(luò)進(jìn)行自我調(diào)節(jié)的能力,它包含四個方面的含義;自學(xué)習(xí)、自組織、泛化及訓(xùn)練。特別是在股市這樣的環(huán)境非平穩(wěn)的系統(tǒng)中,可以繼續(xù)學(xué)習(xí)訓(xùn)練以跟蹤環(huán)境的變化。而所謂的泛化能力是指經(jīng)過訓(xùn)練后的網(wǎng)絡(luò)對新樣本能夠做出正確的反應(yīng)的能力。4.映射的功能。在前面的原理分析部分,我們已經(jīng)知道單隱層前向網(wǎng)絡(luò)可以任意精度的逼近n維空間中的二次可積函數(shù)。5.并行性.傳統(tǒng)計(jì)算機(jī)處理信息的方式為串行處理,計(jì)算與存儲是完全獨(dú)立的兩部分,這樣存儲器與運(yùn)算器之間的通道就成了計(jì)算機(jī)的瓶頸,大大限制了它的運(yùn)算能力。神經(jīng)網(wǎng)絡(luò)的各個層中的神經(jīng)元都可以根據(jù)接收到的不同的信息進(jìn)行獨(dú)立的運(yùn)算和處理,然后將輸出的結(jié)果傳輸給其他的神經(jīng)元同時進(jìn)行并行處理。6.聯(lián)想記憶功能。神經(jīng)網(wǎng)絡(luò)在訓(xùn)練過程中,輸入端給出要記憶的模式,通過學(xué)習(xí)合理地調(diào)整網(wǎng)絡(luò)中的權(quán)值和閾值,網(wǎng)絡(luò)就能“記住”所有的輸入信息。7.魯棒性(容錯性)。由于神經(jīng)網(wǎng)絡(luò)采用分布式存儲信息的方式,即使網(wǎng)絡(luò)局部受損或外部信息部分丟失也不會影響整個系統(tǒng)的性能,使得它比傳統(tǒng)計(jì)算機(jī)模型具有較高的魯棒性,而這也完全適合股市預(yù)測的需要。3.5神經(jīng)網(wǎng)絡(luò)的在實(shí)際預(yù)測模型中的問題在前面的分析了神經(jīng)網(wǎng)絡(luò)的相關(guān)基本原理之后,對于我們下面將在具體的股市預(yù)測模型中進(jìn)行的編程存在一些亟需解決的問題,主要是指:網(wǎng)絡(luò)的初始化,網(wǎng)絡(luò)結(jié)構(gòu)的選擇,學(xué)習(xí)率的選擇,訓(xùn)練停止規(guī)則等等。其實(shí)在后面的實(shí)證分析的過程中我們就是需要通過對相同的數(shù)據(jù)進(jìn)行多次不同參數(shù)的選取來尋求一種相對最優(yōu)的預(yù)測方案。3.5.1網(wǎng)絡(luò)的初始化即指網(wǎng)絡(luò)權(quán)值和閾值的初始化問題,有兩種方案。1.初值直接選擇為很小的隨機(jī)數(shù):如取,中均勻分布的隨機(jī)數(shù)。2.取多組不同的初值試探。3.5.2網(wǎng)絡(luò)結(jié)構(gòu)的選擇神經(jīng)網(wǎng)絡(luò)的近似和泛化能力主要依靠:網(wǎng)絡(luò)結(jié)構(gòu)、訓(xùn)練樣本數(shù)等。而網(wǎng)絡(luò)結(jié)構(gòu)又包含所選網(wǎng)絡(luò)的層數(shù),各個不同層的神經(jīng)元個數(shù),不同的層之間的激活函數(shù)選擇以及網(wǎng)絡(luò)學(xué)習(xí)傳遞的方向等。1.網(wǎng)絡(luò)層數(shù)理論已經(jīng)證明單隱層(兩層)前向網(wǎng)絡(luò)可以任意精度的逼近n維空間中的二次可積函數(shù)類的任意函數(shù)。因此在一般的數(shù)據(jù)處理中常用二層(單隱層)網(wǎng)絡(luò)即可。但由于選取的單隱層網(wǎng)絡(luò)神經(jīng)元之間“相互作用”,使得模型缺少冗余性,提高映射在一個點(diǎn)的逼近精度而不惡化其它點(diǎn)的逼近程度是困難的。因此,有時也選擇雙隱層網(wǎng)絡(luò)使得,第一隱層學(xué)習(xí)局部特征,第二隱層抽取整體特征。2.隱層神經(jīng)元個數(shù)的選擇隱層神經(jīng)元數(shù)的選擇是一個十分復(fù)雜的問題??梢哉f隱層神經(jīng)元的個數(shù)的選擇與輸入層與輸出層神經(jīng)元的數(shù)量、訓(xùn)練樣本的數(shù)量和需解決的問題的復(fù)雜程度等都有直接關(guān)系。事實(shí)上,隱層神經(jīng)元太少通常導(dǎo)致欠擬合,而隱層神經(jīng)元太多通常導(dǎo)致過擬合,使網(wǎng)絡(luò)缺乏泛化能力。但是目前理論上還沒有一種科學(xué)的和普遍的確定方法。一般,確定隱層神經(jīng)元個數(shù)的基本原則:1)在滿足精度要求的前提下取盡可能緊湊的結(jié)構(gòu),即選取盡可能少的隱層神經(jīng)元的個數(shù)。例如,在實(shí)際應(yīng)用中一個常用的方法是:首先試著選擇,網(wǎng)絡(luò)參數(shù)個數(shù)訓(xùn)練樣本個數(shù),然后,根據(jù)網(wǎng)絡(luò)訓(xùn)練后的情況適當(dāng)增加或減少隱層神經(jīng)元的個數(shù)。2)若使用復(fù)雜的網(wǎng)絡(luò),那么避免過擬合的另一種辦法是在網(wǎng)絡(luò)得到恰當(dāng)調(diào)整后停止訓(xùn)練。3)在能夠解決問題的前提下,再加上1到2個神經(jīng)元以加快誤差的下降速度即可。實(shí)際上在處理預(yù)測模型過程中為防止過擬合可以采取交叉確認(rèn)的方法。即可將可利用數(shù)據(jù)的劃分:3.5.3輸入輸出神經(jīng)元個數(shù)輸入輸出神經(jīng)元的個數(shù)由具體預(yù)測過程所采取的訓(xùn)練樣本和目標(biāo)樣本之間相關(guān)。3.5.4學(xué)習(xí)率的選取通常選取很小的數(shù)諸如:0.1,0.05,0.01,0.005。但如果選取太小會導(dǎo)致網(wǎng)絡(luò)收斂速度過慢;選取太大又會導(dǎo)致網(wǎng)絡(luò)震蕩或不收斂。3.5.5網(wǎng)絡(luò)訓(xùn)練的停止準(zhǔn)則1.給定迭代次數(shù);2.記為迭代到第次,對應(yīng)所有訓(xùn)練樣本的平方誤差,停止:;3.交叉驗(yàn)證(Cross-Validation)原則:訓(xùn)練誤差曲線與確認(rèn)誤差曲線相背離,停止。神經(jīng)網(wǎng)絡(luò)算法BP神經(jīng)網(wǎng)絡(luò)在數(shù)據(jù)預(yù)測中的算法流程圖如下:開始導(dǎo)入并歸一化數(shù)據(jù)樣本數(shù)據(jù)分類樣本數(shù)據(jù)分類測試數(shù)據(jù)訓(xùn)練數(shù)據(jù)NY結(jié)束合格仿真結(jié)果評價(jià)網(wǎng)絡(luò)收斂代入測試數(shù)據(jù)初始化網(wǎng)絡(luò)給定神經(jīng)元個數(shù)訓(xùn)練網(wǎng)絡(luò)測試數(shù)據(jù)訓(xùn)練數(shù)據(jù)NY結(jié)束合格仿真結(jié)果評價(jià)網(wǎng)絡(luò)收斂代入測試數(shù)據(jù)初始化網(wǎng)絡(luò)給定神經(jīng)元個數(shù)訓(xùn)練網(wǎng)絡(luò)4.1輸出輸入變量的選取每日股票價(jià)格變化涉及的變量眾多,有開盤價(jià),收盤價(jià),最高價(jià),最低價(jià),成交量,成交額,還有眾多技術(shù)指標(biāo)。采用什么作為輸入量,什么作為輸出量是一個必須考慮的問題,好的輸入量配合好的模型和算法,就會給出很好的結(jié)果。考慮到股票價(jià)格中收盤價(jià)是最重要的,其是衡量每日股價(jià)漲跌的唯一價(jià)格,所以這里我們只選擇和股票收盤價(jià)的量作為輸出變量,這些量有:每日漲跌(即布爾量漲或跌,可將平盤看作上漲),每日漲跌幅度(-10%左右到10%左右),每日收盤價(jià)。至于輸出量可選擇前幾日股票的開盤價(jià),收盤價(jià),最高價(jià),最低價(jià),成交量,成交額等量,例如選擇前五日的股票的這些數(shù)據(jù)作為輸入量。但是這樣會有一個問題—輸入變量維數(shù)會很高,會有30個輸入變量。如此多的輸入變量,需要的訓(xùn)練樣本將會是十分龐大的。機(jī)器學(xué)習(xí)領(lǐng)域已經(jīng)證明需要的訓(xùn)練樣本是隨輸入變量的維數(shù)成指數(shù)增加的,也就是說輸入變量每增加一維,所需要的訓(xùn)練樣本的個數(shù)要在原來的基礎(chǔ)上翻幾倍,這也就是所謂的“維數(shù)災(zāi)難”。所以選取這么多輸入量明顯是不可取的,因?yàn)橛?xùn)練樣本的規(guī)模將無法滿足,得到的結(jié)果必然會是過擬合的,沒有泛化能力,也就沒有實(shí)用價(jià)值。所以變量的維數(shù)必須減小,可以通過兩個方面減小維數(shù):第一,減少需要數(shù)據(jù)的天數(shù),將前五日改為前三日或者前兩日;第二,減小每天的輸入變量,比如去掉最高價(jià),最低價(jià)等。我們采用第二種只考慮股票的收盤價(jià)和成交量,原因是股票的收盤價(jià)最重要,而成交額可以通過成交價(jià)和成交量估算出來,所以只用成交量。另外股票一般以五天為一周期即五個工作日,所以采用前五天的每天收盤價(jià)和每天的成交量作為輸入量。4.2數(shù)據(jù)歸一化處理數(shù)據(jù)的預(yù)處理和后處理是有效訓(xùn)練神經(jīng)網(wǎng)絡(luò)的很重要的步驟,常見的方法是將原始數(shù)據(jù)進(jìn)行歸一化處理,即通過一定的線性變換將輸入和輸出數(shù)據(jù)統(tǒng)一限制在[0,1]或者[-1,1]區(qū)間內(nèi)。歸一化的數(shù)據(jù)消除了輸入量之間的數(shù)量級差別,比如股票價(jià)格和成交量之間存在很大的數(shù)量級差別,若不歸一化,在神經(jīng)網(wǎng)絡(luò)計(jì)算權(quán)值和閾值的時候,可能使成交量相關(guān)的權(quán)值和閾值變得很小,這樣在計(jì)算機(jī)存在舍入誤差時很有可能被去掉或者改變,影響到訓(xùn)練后神經(jīng)網(wǎng)絡(luò)的性能。我們可以采用Matlab的代碼premnmx,將數(shù)據(jù)歸一化到[-1,1]區(qū)間;采用postmnmx代碼將歸一化后的數(shù)據(jù)還原。4.3數(shù)據(jù)樣本分類樣本數(shù)據(jù)的分類一般是將樣本數(shù)據(jù)分為訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù),訓(xùn)練數(shù)據(jù)用來訓(xùn)練網(wǎng)絡(luò),測試數(shù)據(jù)用來測試網(wǎng)絡(luò)的預(yù)測能力。這樣的話就可以通過測試數(shù)據(jù)代入訓(xùn)練后的網(wǎng)絡(luò),來訪真測試數(shù)據(jù)的輸出值,和真實(shí)的輸出值做比較便可以看出網(wǎng)絡(luò)的優(yōu)劣。測試數(shù)據(jù)和訓(xùn)練數(shù)據(jù)規(guī)模的比例不宜太高,太高的話訓(xùn)練的網(wǎng)絡(luò)使用的訓(xùn)練數(shù)據(jù)少,測試數(shù)據(jù)多,測試結(jié)果一般都會很差,這是可想而知的,用少量的數(shù)據(jù)來表示大量的數(shù)據(jù)顯然是不好的。我們選擇樣本數(shù)據(jù)的前4/5做訓(xùn)練樣本,后1/5來做測試樣本。4.4網(wǎng)絡(luò)初始化網(wǎng)絡(luò)初始化是給定網(wǎng)絡(luò)的一些基本參數(shù)包括隱層個層數(shù),隱層神經(jīng)元的個數(shù),還有網(wǎng)絡(luò)閾值和權(quán)值的初始選擇,已經(jīng)訓(xùn)練函數(shù)的選擇等。這里的參數(shù)主要指的是BP神經(jīng)網(wǎng)絡(luò)中的隱層層數(shù)和隱層神經(jīng)元的個數(shù)。由于單隱層的BP網(wǎng)絡(luò)可以解決大多數(shù)的數(shù)據(jù)預(yù)測問題,理論上也證明了單隱層的BP網(wǎng)絡(luò)有著很強(qiáng)的插值能力和擬合能力,其可以以任意精度逼近L2函數(shù)空間的任意函數(shù)。多隱層的BP網(wǎng)絡(luò)有著某些特殊的用途,在數(shù)據(jù)預(yù)測方面一般的數(shù)據(jù)輸出量和輸出量的關(guān)系用單隱層BP網(wǎng)絡(luò)來刻畫已經(jīng)足夠了。關(guān)于隱層神經(jīng)元個數(shù)的選取是預(yù)測問題中一個很重要的問題,其直接關(guān)系到模型結(jié)果的好壞。太少的隱層神經(jīng)元個數(shù)會導(dǎo)致得到的結(jié)果擬合能力比較差,預(yù)測誤差較大;太多的隱層神經(jīng)元會導(dǎo)致模型過擬合,缺乏泛化能力,預(yù)測結(jié)果難以令人信服。一般采用交叉驗(yàn)證法來確定隱層神經(jīng)元數(shù),該方法將數(shù)據(jù)分為訓(xùn)練數(shù)據(jù)和驗(yàn)證數(shù)據(jù),選取不同的神經(jīng)元個數(shù)利用訓(xùn)練數(shù)據(jù)訓(xùn)練網(wǎng)絡(luò),再將網(wǎng)絡(luò)用在驗(yàn)證數(shù)據(jù)上驗(yàn)證,求誤差,之后將訓(xùn)練數(shù)據(jù)和驗(yàn)證數(shù)據(jù)交換,同樣求誤差,兩次誤差求平均。哪種神經(jīng)元個數(shù)對應(yīng)的誤差最小就選擇那個神經(jīng)元。這種方法有一個確點(diǎn)就是要不斷的代入不同的神經(jīng)元個數(shù)進(jìn)行訓(xùn)練,當(dāng)樣本數(shù)據(jù)較大時,耗時將相當(dāng)多。當(dāng)然對于股票數(shù)據(jù)來說,樣本數(shù)據(jù)的量也不小,這樣一次次的訓(xùn)練將會很浪費(fèi)時間。我們回想到普通的數(shù)據(jù)擬合問題當(dāng)中,當(dāng)待估計(jì)參數(shù)的個數(shù)較多并很接近訓(xùn)練樣本的個數(shù)時,將會出現(xiàn)過擬合現(xiàn)象,根本原因是待求參數(shù)過多,而樣本數(shù)據(jù)過少,簡單的說就是方程組的變量很多,而方程組的個數(shù)卻很少。這時數(shù)據(jù)的擬合程度會非常好,而預(yù)測能力卻非常差,原因是過多的參數(shù),過少的樣本會導(dǎo)致每一組樣本的作用會變得很大,這樣求解方程時將會把每一組樣本里的一些誤差和個性的東西帶入模型當(dāng)中,而預(yù)測數(shù)據(jù)的誤差是隨機(jī)的,原來的模型就無法應(yīng)對這些誤差了。欠擬合現(xiàn)象剛好相反,即樣本數(shù)據(jù)很多,而模型參數(shù)卻很少,使得給出的模型對數(shù)據(jù)的可解釋性很差,模型考慮到數(shù)據(jù)的共性成分很多,而對每組樣本數(shù)據(jù)的個性很少,這樣同樣使得模型預(yù)測能力很差。對于某些樣本數(shù)據(jù)比較規(guī)范,規(guī)律比較明顯有時采用比較少的參數(shù),模型的泛函依然會很強(qiáng)。說以對于模型參數(shù)個數(shù)的選擇不僅依賴于樣本數(shù)據(jù)的多少還依賴于樣本數(shù)據(jù)的分布規(guī)律。那么和BP神經(jīng)網(wǎng)絡(luò)中的待求參數(shù)是什么呢?答案是網(wǎng)絡(luò)的權(quán)值和閾值,也就是說一個網(wǎng)絡(luò)中權(quán)值和閾值的個數(shù)就是該神經(jīng)網(wǎng)絡(luò)中待求參數(shù)的個數(shù),換句話說一個BP神經(jīng)網(wǎng)絡(luò)中的所有權(quán)值和閾值都給定了這個網(wǎng)絡(luò)就給定了。隱層神經(jīng)元的個數(shù)決定著這些權(quán)值和閾值個數(shù)。簡單的說的隱層神經(jīng)元,個輸入量一個輸出變量的單隱層前饋網(wǎng)絡(luò)對應(yīng)的權(quán)值數(shù)是()和閾值的個數(shù)是(+1)個,一共是()個,也就是說一共有這么多待求參數(shù),如果假設(shè)樣本的個數(shù)為個的話,要不過擬合的必要條件是,也就是說,這樣我們就給了隱層神經(jīng)元個數(shù)的一個上界估計(jì)。但僅僅滿足這個條件是不夠的,一般情況要不小的多,才能不過擬合。一般來說樣本數(shù)據(jù)規(guī)律比較明顯,映射關(guān)系比較簡單所需要的神經(jīng)元個數(shù)也就越少,但股票的量價(jià)關(guān)系復(fù)雜,股價(jià)的波動也很難用簡單的函數(shù)關(guān)系表示,所以股票預(yù)測問題中神經(jīng)元個數(shù)的選擇不會太少。我們可以選擇神經(jīng)元個數(shù)在之內(nèi)選取,采用交叉驗(yàn)證法來確定神經(jīng)元個數(shù)??梢圆捎肕atlab代碼net=newff(PR,[S1,S2,…,Sn],{TF1,TF2…TFn},BTF)對神經(jīng)網(wǎng)絡(luò)進(jìn)行初始化配置其中,PR為R×2維矩陣,表示R維輸入矢量中每維輸入的最小值和最大值之間的范圍;[S1,S2,…,Sn]中各元素分別表示從第一層隱層開始到輸出層的各層神經(jīng)元的數(shù)目;{TF1,TF2…TFn}中各元素表示各層神經(jīng)元采用的傳遞函數(shù);BTF表示神經(jīng)網(wǎng)絡(luò)訓(xùn)練時所用的訓(xùn)練函數(shù);net為生成的BP網(wǎng)絡(luò)對象。newff生成BP網(wǎng)絡(luò)的同時即對網(wǎng)絡(luò)的各層的權(quán)值和閥值自動進(jìn)行了初始化,根據(jù)不同的需要,使用者可以對各層網(wǎng)絡(luò)權(quán)值和閥值的初始化函數(shù)重新定義。4.5訓(xùn)練網(wǎng)絡(luò)在BP神經(jīng)網(wǎng)絡(luò)生成和初始化以后,即可以利用現(xiàn)有的“輸入一輸出”樣本矢量數(shù)據(jù)對網(wǎng)絡(luò)進(jìn)行訓(xùn)練。BP網(wǎng)絡(luò)的訓(xùn)練通常采用train數(shù)來完成,在訓(xùn)練之前有必要對網(wǎng)絡(luò)訓(xùn)練參數(shù)net.trainparam進(jìn)行適當(dāng)?shù)脑O(shè)置。設(shè)置完訓(xùn)練參數(shù)后,就可以調(diào)用train函數(shù)對BP網(wǎng)絡(luò)進(jìn)行訓(xùn)練。該函數(shù)采用動量法和學(xué)習(xí)速率自適應(yīng)調(diào)整策略訓(xùn)練網(wǎng)絡(luò),將動量法和自適應(yīng)學(xué)習(xí)速率結(jié)合起來,利用兩方面的優(yōu)點(diǎn),來優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的訓(xùn)練,返回誤差參數(shù)。其常用格式如下:[net,tr]=train(net,P,T)其中,尸為輸入樣本矢量集;T為對應(yīng)的目標(biāo)樣本矢量集:等號左右兩側(cè)的net分別用于表示訓(xùn)練得到和訓(xùn)練以前的神經(jīng)網(wǎng)絡(luò)對象;f,存儲訓(xùn)練過程中的步數(shù)信息和誤差信息,并給出網(wǎng)絡(luò)誤差實(shí)時變化曲線。4.6網(wǎng)絡(luò)仿真采用訓(xùn)練數(shù)據(jù)訓(xùn)練得到網(wǎng)絡(luò),可將訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù)一起代入網(wǎng)絡(luò)中得到網(wǎng)絡(luò)的模擬數(shù)據(jù)的輸出,與實(shí)際數(shù)據(jù)輸出做對比,可以觀察到網(wǎng)絡(luò)的預(yù)測效果。利用sim函數(shù)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024至2030年中國紙盒打碼鋼字頭數(shù)據(jù)監(jiān)測研究報(bào)告
- 2024至2030年中國八人餐桌行業(yè)投資前景及策略咨詢研究報(bào)告
- 2024至2030年中國中斜面水晶照片數(shù)據(jù)監(jiān)測研究報(bào)告
- 2024年中國靜電噴槍配件市場調(diào)查研究報(bào)告
- 2024至2030年吹沙槍項(xiàng)目投資價(jià)值分析報(bào)告
- 2024年中國鄰苯二酚-3,5-二磺酸鈉市場調(diào)查研究報(bào)告
- 2024年汽動起子頭套筒項(xiàng)目可行性研究報(bào)告
- 2024年壁掛式冷藏機(jī)組項(xiàng)目可行性研究報(bào)告
- 海水淡化處理對水資源可持續(xù)利用的貢獻(xiàn)考核試卷
- 應(yīng)急管理中的自然災(zāi)害演練與培訓(xùn)考核試卷
- 05S502閥門井圖集
- 煎餅公司創(chuàng)業(yè)的策劃方案書
- 工期日歷天計(jì)算器
- 儀表交工資料
- 走遍德國 A1(課堂PPT)
- 380V變頻器招標(biāo)技術(shù)文件2010
- 基于PLC的門禁系統(tǒng)的設(shè)計(jì)
- 報(bào)廢農(nóng)業(yè)機(jī)械回收確認(rèn)表(樣式)
- 機(jī)房精密空調(diào)維護(hù)驗(yàn)收報(bào)告
- 《數(shù)字信號處理》教案
- 鐵科研微機(jī)控制直通式電空制動系統(tǒng)
評論
0/150
提交評論