論基于股票時(shí)間序列數(shù)據(jù)的關(guān)聯(lián)規(guī)則挖掘研究_第1頁(yè)
論基于股票時(shí)間序列數(shù)據(jù)的關(guān)聯(lián)規(guī)則挖掘研究_第2頁(yè)
論基于股票時(shí)間序列數(shù)據(jù)的關(guān)聯(lián)規(guī)則挖掘研究_第3頁(yè)
論基于股票時(shí)間序列數(shù)據(jù)的關(guān)聯(lián)規(guī)則挖掘研究_第4頁(yè)
論基于股票時(shí)間序列數(shù)據(jù)的關(guān)聯(lián)規(guī)則挖掘研究_第5頁(yè)
已閱讀5頁(yè),還剩12頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、熬南昌大學(xué)200胺3級(jí)碩士學(xué)位論暗文文獻(xiàn)綜述報(bào)告爸基于股票時(shí)間序隘列數(shù)據(jù)的關(guān)聯(lián)規(guī)奧則挖掘研究骯Study o八n Minin板g Assoc伴iation 芭Rules f扒rom Sto辦ck Time瓣 Series扳 Data 八系 別:霸 計(jì)算機(jī)科學(xué)與壩技術(shù)系稗專 業(yè):凹 計(jì)算機(jī)應(yīng)用技辦術(shù)辦研究方向: 人頒工智能礙研 究 生: 爸汪廷華半導(dǎo) 師:鞍 程從從(教授胺)捌2005年03襖月一引言霸隨著計(jì)算機(jī)信息白系統(tǒng)的日益普及版,大澳容量存儲(chǔ)技術(shù)的埃發(fā)展以及條形碼埃等數(shù)據(jù)獲取技術(shù)霸的廣泛應(yīng)用,人捌們?cè)谌粘J聞?wù)處背理和科學(xué)研究中稗積累了大量的各罷種類型的數(shù)據(jù)。跋在這些數(shù)據(jù)中,啊有很大一部分是

2、拌呈現(xiàn)時(shí)間序列(半time se頒ries)類型笆的數(shù)據(jù)。所謂時(shí)皚間序列數(shù)據(jù)就是八按時(shí)間先后順序邦排列各個(gè)觀測(cè)記笆錄的數(shù)據(jù)集1澳,如金融證券懊市場(chǎng)中每天的股柏票價(jià)格變化;商霸業(yè)零售行業(yè)中,捌某項(xiàng)商品每天的八銷售額;氣象預(yù)版報(bào)研究中,某一捌地區(qū)的每天氣溫拌與氣壓的讀數(shù);岸以及在生物醫(yī)學(xué)柏中,某一癥狀病盎人在每個(gè)時(shí)刻的傲心跳變化等等。拜然而,我們應(yīng)該班注意到:時(shí)間序版列數(shù)據(jù)不僅僅是翱歷史事件的記錄澳,更重要的是蘊(yùn)敖藏這案些數(shù)擺據(jù)其中不顯現(xiàn)的胺、有趣的模式。熬隨著時(shí)間推移和啊時(shí)間序列數(shù)據(jù)的熬大規(guī)模增長(zhǎng),如般何對(duì)這些海量數(shù)板據(jù)進(jìn)行分析處理傲,挖掘其背后蘊(yùn)皚藏的價(jià)值信息,阿對(duì)于我們揭示事疤物發(fā)展規(guī)律變化

3、皚的內(nèi)部規(guī)律,發(fā)盎現(xiàn)不同事物之間阿的相互關(guān)系,為傲人們正確認(rèn)識(shí)事扒物和科學(xué)決策提敗供依據(jù)具有重要般的實(shí)際意義。俺時(shí)間序列數(shù)據(jù)分啊析按照不同的任伴務(wù)有各種不同的扒方法,一般包括埃趨勢(shì)分析、相似佰性搜索、與時(shí)間襖有關(guān)數(shù)據(jù)的序列頒模式挖掘、周期頒模式挖掘等2阿。本綜述是針板對(duì)證券業(yè)中股票凹時(shí)間序列分析的扳,試圖骯通過(guò)列舉、分析鞍有關(guān)證券業(yè)中股般票時(shí)間序列數(shù)據(jù)半分析的原理、方案法與技術(shù),著重百探討數(shù)據(jù)挖掘敖中基盎于股票時(shí)間序列笆數(shù)據(jù)的關(guān)聯(lián)規(guī)則把挖掘的概念、原癌理技術(shù)、實(shí)施過(guò)胺程及存在的障礙襖和問(wèn)題,以期能背有新的發(fā)現(xiàn)和領(lǐng)把悟。鞍二股票時(shí)間序澳列傳統(tǒng)研究方法叭概述笆隨著我國(guó)市場(chǎng)經(jīng)伴濟(jì)建設(shè)的發(fā)展,扳人們的

4、金融意識(shí)案和投資意識(shí)日益把增強(qiáng)。股票市場(chǎng)鞍作為市場(chǎng)經(jīng)濟(jì)的斑重要組成部分,敖正越來(lái)越多地受按到投資者的關(guān)注氨。目前股票投資斑已經(jīng)是眾多個(gè)人般理財(cái)中的一種重板要方式。不言而跋喻,如果投資者爸能正確預(yù)測(cè)股票氨價(jià)格、選準(zhǔn)買賣盎時(shí)機(jī),無(wú)疑會(huì)給岸投資者帶來(lái)豐厚礙的收益。于是,般在股票的預(yù)測(cè)和敖分析方面出現(xiàn)了板大量的決策分析壩方法和工具,以拔期能有效地指導(dǎo)傲投資者的投資決俺策。目前,我國(guó)傲股市用搬得較矮多的方法概括起邦來(lái)有兩類3伴:一類是基本分班析和技術(shù)分析,敗另一類是經(jīng)濟(jì)統(tǒng)搬計(jì)分析。鞍1基本分析和扒技術(shù)分析爸在股票市場(chǎng)上,版當(dāng)投資者考慮是敗否投資于股票或岸購(gòu)買什么股票時(shí)懊,一般可以運(yùn)用稗基本分析的方法澳對(duì)

5、股市和股票進(jìn)笆行分析;而在買白賣股票的時(shí)機(jī)把盎握上,一般可以胺運(yùn)用技術(shù)分析的埃方法4。安基本分析指的是埃通過(guò)對(duì)影響股票稗市場(chǎng)供求關(guān)系的擺基本因素(如宏柏觀政治經(jīng)濟(jì)形勢(shì)啊、金融政策、行伴業(yè)變動(dòng)、公司運(yùn)辦營(yíng)財(cái)務(wù)狀況等)把進(jìn)行分析,來(lái)確拜定股票的真正價(jià)案值,判斷未來(lái)股扮市走勢(shì),是長(zhǎng)期擺投資者不可或缺拜的有效分析手段霸。襖技術(shù)分析是完全扮根據(jù)股市行情變奧化而加以矮分析白的方法,它通過(guò)熬對(duì)歷史資料(成芭交價(jià)和成交量)笆進(jìn)行分析,來(lái)判襖斷大盤和個(gè)股價(jià)皚格的未來(lái)變化趨矮勢(shì),探討股市里艾投資行為的可能吧轉(zhuǎn)折,從而給投啊資者買賣股票的邦信號(hào),適合于投藹資者作短期投資霸。目前技術(shù)分析版常用的工具是各凹種各樣的走勢(shì)

6、圖擺(K線圖、分時(shí)敗圖)和技術(shù)指標(biāo)藹(MA、RSI把、OBV等)。艾2經(jīng)濟(jì)統(tǒng)計(jì)學(xué)笆分析把主要針對(duì)時(shí)間序稗列數(shù)據(jù)進(jìn)行數(shù)學(xué)扮建模和分析。傳佰統(tǒng)的時(shí)間序列數(shù)壩據(jù)分析已經(jīng)是一啊個(gè)發(fā)展得相當(dāng)成斑熟的學(xué)科,有著笆一整套分析理論阿和工具,是目前吧時(shí)間序列數(shù)據(jù)分昂析的主要方法,礙它主要俺用經(jīng)濟(jì)統(tǒng)計(jì)學(xué)的叭理論和方法對(duì)經(jīng)伴濟(jì)變量進(jìn)行描述靶、分析和推算。跋傳統(tǒng)阿時(shí)間胺序列數(shù)據(jù)分析的八研究目的在于拌5:敖俺分析特定的數(shù)據(jù)扒集合,建立數(shù)學(xué)吧模型,進(jìn)行模式頒結(jié)構(gòu)分析和實(shí)證捌研究;斑扮預(yù)測(cè)時(shí)間序列的哀未來(lái)發(fā)展情況。氨傳統(tǒng)的時(shí)間序列跋數(shù)據(jù)分析最基本啊的理論是40年拜代分別由Nor隘bor Wie吧ner和And斑rei Ko

7、l扒mogomor奧提出的。20世瓣紀(jì)70年代,G巴.P.Box和絆G.M.Jen隘kins發(fā)表專叭著時(shí)間序列分盎析:預(yù)測(cè)和控制八,對(duì)平穩(wěn)時(shí)間耙序列數(shù)據(jù)提出了澳自回歸滑動(dòng)平均皚模型(ARMA懊),以及一整套胺的建模、估計(jì)、靶檢驗(yàn)和控制方法奧,使得時(shí)序數(shù)據(jù)懊分析得以廣泛運(yùn)靶用于各種工程領(lǐng)扳域。其基本思想俺是根據(jù)各隨凹機(jī)變笆量間的依存關(guān)系拜或自相關(guān)性,從爸而由時(shí)間序列的懊過(guò)去值及現(xiàn)在值笆來(lái)預(yù)測(cè)出未來(lái)的佰值。該模型以證叭券市場(chǎng)為非有效艾市場(chǎng)為前提,當(dāng)斑期的股票價(jià)格變矮化不僅受當(dāng)期隨扮機(jī)因素的沖擊,般而且受前期影響澳。換句話說(shuō),就啊是歷史信息會(huì)對(duì)哀當(dāng)前的股票價(jià)格瓣產(chǎn)生一定程度的拌影響。采用的方霸法一般

8、是在連續(xù)靶的時(shí)間流中截取襖一個(gè)時(shí)間窗口(襖一個(gè)時(shí)間段),癌窗口內(nèi)的數(shù)據(jù)作熬為一個(gè)數(shù)據(jù)單元凹,然后讓這個(gè)時(shí)懊間窗口在時(shí)間流拔上滑動(dòng),以獲得俺建立模型所需要百的訓(xùn)練集6擺。般7基于股票壩時(shí)間序列是一種擺混沌時(shí)間序列的疤認(rèn)知,提出一種挨新穎的非線性時(shí)盎間序列預(yù)測(cè)模型佰,即滑動(dòng)窗口二板次自回歸(MW巴DAR)模型,巴該模型使用部分啊的歷史數(shù)據(jù)及其班二次項(xiàng)構(gòu)造自回按歸模型,模型參叭數(shù)用最小二乘法澳估計(jì)。其基本理敗論基礎(chǔ)是:一個(gè)啊線性模型不能描百述混沌時(shí)間序列捌的全局性特征,吧但在一個(gè)小的時(shí)芭間間隔內(nèi),系統(tǒng)挨的行為卻可以用拜某種線性模型近礙似。8則提哎出了一種基于嵌拔入理論和確定集靶上的預(yù)測(cè)誤差的爸混沌時(shí)

9、間序列預(yù)啊測(cè)方法,并探討哎了在股票價(jià)格預(yù)扒測(cè)上的應(yīng)用。拌可以看出,經(jīng)濟(jì)皚統(tǒng)計(jì)學(xué)為問(wèn)題的罷探索解決方案提埃供了有用而實(shí)際氨的框架;模型是矮經(jīng)濟(jì)統(tǒng)計(jì)學(xué)的核懊心,模型的選擇叭和計(jì)算往往被認(rèn)八為是次要的,是暗建立模型的枝節(jié)瓣。經(jīng)濟(jì)統(tǒng)計(jì)學(xué)本矮質(zhì)上是從事扒“伴確定性鞍”稗分析的,可以說(shuō)敗統(tǒng)暗計(jì)方佰法是敗“斑目標(biāo)驅(qū)動(dòng)稗”半的。但是,在大傲量數(shù)據(jù)集中往往癌存在一些未被人伴們預(yù)期到但又具傲有價(jià)值的信息,盎人們?yōu)榘l(fā)現(xiàn)大量胺數(shù)據(jù)中隱藏的規(guī)辦律和模式,就需埃要新的具有稗“哀探索性翱”班的分析工具。顯翱然,數(shù)據(jù)挖掘就般是這樣的一門工懊具。捌三數(shù)據(jù)挖掘技罷術(shù)應(yīng)用于股票時(shí)爸間序列分析的研把究現(xiàn)狀拌數(shù)據(jù)挖掘(DM把,Data

10、 M凹ining),把也稱為數(shù)據(jù)庫(kù)中安的知識(shí)發(fā)現(xiàn)(K芭DD,Know佰ledge D岸iscover板y in Da靶tabase)熬是數(shù)據(jù)庫(kù)技術(shù)和般機(jī)器學(xué)習(xí)等人工拜智能技術(shù)相結(jié)合笆的產(chǎn)物,是一門暗新興的數(shù)據(jù)智能芭分析技術(shù)9斑。20世紀(jì)80唉年代末,隨著數(shù)哀據(jù)庫(kù)、互聯(lián)愛(ài)網(wǎng)技板術(shù)的迅速發(fā)展以頒及管理信息系統(tǒng)?。∕IS)和網(wǎng)唉絡(luò)數(shù)據(jù)中心(I百DC)的推廣應(yīng)胺用,數(shù)據(jù)的存取拌、查詢、描述統(tǒng)稗計(jì)等技術(shù)已日臻奧完善,但高層次拜的決策分析、知頒識(shí)發(fā)現(xiàn)等實(shí)用技辦術(shù)還很不成熟,拌導(dǎo)致了版“隘信息爆炸哎”爸但跋“拌知識(shí)貧乏邦”拜的現(xiàn)象。到了9岸0年代,人們提翱出在數(shù)據(jù)庫(kù)基礎(chǔ)昂上建立數(shù)據(jù)倉(cāng)庫(kù)拜,應(yīng)用機(jī)器學(xué)習(xí)霸和統(tǒng)

11、計(jì)分析相結(jié)礙合的方法處理數(shù)爸據(jù),這兩者的結(jié)笆合促成了數(shù)據(jù)挖案掘技術(shù)的誕生。跋所謂數(shù)據(jù)挖掘,唉簡(jiǎn)單地說(shuō),就是藹從大量數(shù)據(jù)中提罷取或挖掘知識(shí)班2;詳細(xì)一點(diǎn)安可以描述為主要班利用某些特定的扳知識(shí)發(fā)現(xiàn)算法,扮在一定的運(yùn)算效跋率的限制下,從襖大量的數(shù)據(jù)中抽八取出潛在的、拔有價(jià)白值的知識(shí)(模型半、規(guī)則和趨勢(shì))版的過(guò)程稗。佰挖掘算法的好壞版直接影響到知識(shí)柏發(fā)現(xiàn)的質(zhì)量和效搬率,因此目前大百多數(shù)研究都集中百于數(shù)據(jù)挖掘算法埃及其應(yīng)用上。拌1相關(guān)技術(shù)介暗紹埃(1)關(guān)聯(lián)規(guī)則艾挖掘搬關(guān)聯(lián)規(guī)則是美國(guó)襖IBM Alm巴aden Re礙search 板Center的盎 Rakesh阿 Agrawa爸l等人于199扮3年首先提

12、出來(lái)扮的KDD研究的敗一個(gè)重要課題吧10。關(guān)聯(lián)規(guī)跋則挖掘本質(zhì)是從哀大量的數(shù)據(jù)中或暗對(duì)象間抽取關(guān)聯(lián)敖性,它可以揭示芭數(shù)據(jù)間的依賴關(guān)般系,根據(jù)這種關(guān)辦聯(lián)性就可以從某矮一數(shù)據(jù)對(duì)象的信擺息來(lái)推斷另一對(duì)皚象的信息。哎它可以做如下形懊式化定義:盎設(shè)笆I叭 皚=扳 埃i阿1案,敗i拔2柏,挨.唉,傲i班m頒胺是一組項(xiàng)的集合柏(例如一個(gè)商場(chǎng)俺的物品),班D瓣是一組事務(wù)集百(昂稱之為事務(wù)數(shù)據(jù)跋庫(kù)岸)罷。版D版中的每個(gè)事務(wù)胺T巴是項(xiàng)的集合,且按滿足拌T愛(ài)I俺。稱事務(wù)伴T胺支持物品集壩X百,如果拔X笆T矮。關(guān)聯(lián)規(guī)則是如巴下形式的一種蘊(yùn)拔含式澳:X絆頒Y搬,其中盎X百I擺,班Y巴I矮,且霸X拌按Y=班 矮。藹(1)愛(ài)

13、 稱關(guān)聯(lián)規(guī)則叭X扒稗Y懊在事務(wù)數(shù)據(jù)庫(kù)板D案中具有大小為昂s壩的支持度,如果板物品集藹X翱拔Y礙的支持度為芭s%扳,即suppo澳rt(俺X昂安Y扒)=P(X U爸 Y)。佰(2)柏 稱規(guī)則罷X扮澳Y昂在事務(wù)數(shù)據(jù)庫(kù)捌D拌中具有大小為辦c絆的可信度,如果傲D挨中支持物品集翱X阿的事務(wù)中有昂c暗%翱的事務(wù)同時(shí)也支班持物皚品集愛(ài)Y般,即confi般dence(頒X邦班Y罷)=P(Y|X氨)。岸從語(yǔ)義的角度來(lái)啊分析,規(guī)則的可熬信度表示這條規(guī)扒則的正確程度;骯支持度表示用這案條規(guī)則可以推出襖百分之幾的目標(biāo)昂,即這一規(guī)則對(duì)耙于整體數(shù)據(jù)的重絆要程度。用戶可芭以定義二個(gè)閾值懊,要求數(shù)據(jù)挖掘霸系統(tǒng)所生成的規(guī)阿則的

14、支持度和可敖信度都不小于給叭定的閾值。扳這樣,就用蘊(yùn)含埃式、支持度和可擺信度唯一標(biāo)識(shí)了罷每一個(gè)挖掘出來(lái)辦的關(guān)聯(lián)規(guī)則。吧已知事物數(shù)據(jù)庫(kù)敖D,關(guān)聯(lián)規(guī)則的暗挖掘問(wèn)題就是產(chǎn)捌生支持度與置信芭度分別大于用戶柏給定的最小閾值胺的所有關(guān)聯(lián)規(guī)則襖。該問(wèn)題分兩步艾來(lái)求解:第一步埃是找出事務(wù)數(shù)據(jù)唉庫(kù)跋D中所有滿足條盎件的具有背用戶辦指定最小支持度把的項(xiàng)目集。具有佰最小支持度的項(xiàng)啊目集稱為頻繁項(xiàng)辦集敗。第二步是從頻疤繁項(xiàng)集中構(gòu)造可稗信度不低于用戶敖要求的規(guī)則。形吧式地,對(duì)于每一版?zhèn)€頻繁項(xiàng)目集皚A,找出A的所礙有非空子集a,昂如果比率sup伴port(A)安/suppor版t(a)mi霸n暗_疤conf吧(可信度)敖

15、,就生成關(guān)聯(lián)規(guī)襖則a(A-a扒)。板識(shí)別或發(fā)現(xiàn)所有按的頻繁項(xiàng)集是關(guān)吧聯(lián)規(guī)則挖掘算法岸的核心,也是計(jì)岸算量最大的部分啊。目前已有不少按挖掘頻繁項(xiàng)集的傲方法,其中最著耙名的是R.Ag芭rawal和R挨.Srikan笆t提出的Apr唉iori算法頒11,其核心跋是利用這樣一個(gè)爸性質(zhì):頻繁項(xiàng)集安的所笆有非傲空子集都是頻繁斑的。基于這樣的佰先驗(yàn)知識(shí),Ap岸riori使用挨一種耙“瓣逐層搜索八“瓣的迭代方法,k版-項(xiàng)集用于探索懊(k+1)項(xiàng)集笆。首先找出頻繁搬1-項(xiàng)集,記作矮L1;用L1找吧頻繁2-項(xiàng)集L奧2;而L2用于矮找L3,如此下百去,直到不能找按到頻繁k-項(xiàng)集胺。霸雖然Aprio罷ri算法能最終芭

16、挖掘出所有的關(guān)把聯(lián)規(guī)則,但由于癌處理的數(shù)據(jù)量非隘常大,因而算法艾的效率顯得十分班重要。后來(lái)的一隘些研究人員對(duì)算搬法的連接和剪枝皚過(guò)程進(jìn)行各種優(yōu)骯化。凹如12提出跋了稱為Apri白o(hù)riTid的懊改進(jìn)算法,該算傲法提出了在每一班步(第一步除外癌)計(jì)算候選頻繁罷項(xiàng)集的支持度時(shí)暗不需要瓣瀏覽耙整個(gè)事務(wù)數(shù)據(jù)庫(kù)埃。它認(rèn)為不包含拌任何k-項(xiàng)集的敖事務(wù)不可能包含皚任何k+1項(xiàng)集背,這樣,這種事敖務(wù)在其后的考慮胺時(shí),可以加上標(biāo)藹記或刪除,因?yàn)榘蜑楫a(chǎn)生j-項(xiàng)集唉(jk),掃背描數(shù)據(jù)庫(kù)時(shí)不再辦需要它們。該算捌法的本質(zhì)是壓縮擺進(jìn)一步迭代掃描鞍的事務(wù)數(shù)。藹而13提出半的Aprior氨iPro算法,岸其基本思想與A挨p

17、rioriT稗id是一致的,爸也是減少對(duì)數(shù)據(jù)懊集的掃描,不同班的是Aprio熬riPro算法哎是通過(guò)在原有的芭數(shù)據(jù)集上增加一佰個(gè)屬性,通過(guò)這襖個(gè)屬性的取值來(lái)八減少對(duì)某些事務(wù)傲的掃描。霸14是結(jié)合熬Apriori斑和Aprior案iTid兩種算斑法,提出了頒一種疤混合挖掘算法A斑prioriH凹ybrid,其隘基本思想是在掃疤描的早期使用A癌priori算拌法,當(dāng)候選模式搬集中記錄條數(shù)小百到可以放進(jìn)內(nèi)存癌時(shí)就轉(zhuǎn)向Apr辦ioriTid跋算法。芭這些改進(jìn)算法雖疤然比Aprio擺ri算法在挖掘瓣效率上有一些提扮高,但本質(zhì)上沒(méi)八有什么區(qū)別,都擺要在挖掘過(guò)程中埃生成大量的候選霸模式集。襖“盎有沒(méi)有這樣的

18、算敖法,挖掘全部的案頻繁項(xiàng)集而不產(chǎn)柏生候選?佰”懊 1999年H岸an等人提出F背P-Growt愛(ài)h算法15哎,以及 Agr挨awal等人提襖出的樹投影(伴Tree Pr疤oject)耙16關(guān)聯(lián)規(guī)則爸挖掘算法就是這邦樣的算法,它們熬在霸性能辦上均獲得了突破搬,與Aprio暗ri算法相比,癌挖掘效率有了數(shù)巴量級(jí)的提高。利般用FP-Tre奧e 可以壓縮事吧務(wù)數(shù)據(jù)集,壓縮笆有的達(dá)到100板多倍;而樹投跋影方法從原理上扒講是適應(yīng)任何數(shù)搬據(jù)集的,無(wú)論其爸據(jù)量多大該算法礙都能有效運(yùn)行,芭從而使得關(guān)聯(lián)規(guī)邦則挖掘可以應(yīng)用版于海量數(shù)據(jù)的挖頒掘和稠密數(shù)據(jù)集敖的挖掘。藹除了上述關(guān)聯(lián)規(guī)叭則挖掘的經(jīng)典算氨法之外,人們著

19、搬重在以下幾個(gè)方絆面對(duì)關(guān)聯(lián)規(guī)則進(jìn)愛(ài)行了研究。胺(1)繼續(xù)通過(guò)按各種手段提高挖伴掘效率。這方面凹包括對(duì)原有算法鞍的進(jìn)一步改進(jìn)板17,18;背提出一些并行挖搬掘算法19,跋20、增量算拌法21以及罷帶約束的關(guān)稗聯(lián)規(guī)邦則挖掘策略(元扮規(guī)則制導(dǎo)關(guān)聯(lián)規(guī)靶則挖掘)22艾,23。傲(2)不同形式啊關(guān)聯(lián)規(guī)則的研究癌。關(guān)聯(lián)規(guī)則最早扳是由購(gòu)物籃分析敗開始的,但是隨耙著研究的擴(kuò)展和爸深入,關(guān)聯(lián)規(guī)則皚的應(yīng)用范圍不斷吧擴(kuò)大,因此出現(xiàn)岸了多種形式關(guān)聯(lián)唉規(guī)則的研究。由叭最簡(jiǎn)單的單維、骯單層、布爾關(guān)聯(lián)襖規(guī)則逐漸向復(fù)雜吧形式擴(kuò)展。在基隘本關(guān)聯(lián)規(guī)則的基稗礎(chǔ)上提出了布爾巴型加權(quán)關(guān)聯(lián)規(guī)則白和廣義模糊型加斑權(quán)關(guān)聯(lián)規(guī)則算法奧24,由單瓣

20、層的關(guān)聯(lián)規(guī)則擴(kuò)敗展為多層次關(guān)聯(lián)暗規(guī)則的研究2艾5等等。關(guān)聯(lián)爸規(guī)則形式的多樣唉化,反映了人們暗從不同角度認(rèn)識(shí)板同一事物的不同傲視點(diǎn),加深了對(duì)奧關(guān)聯(lián)規(guī)則的認(rèn)識(shí)稗與研究。拌(3)結(jié)合艾其它百理論(如軟計(jì)算稗理論)對(duì)關(guān)聯(lián)規(guī)瓣則進(jìn)行研究。引吧入粗糙集概念,般使關(guān)聯(lián)規(guī)則發(fā)現(xiàn)阿的模式具有較高皚的解釋能力和精奧確度26;矮通過(guò)引入神經(jīng)網(wǎng)班絡(luò)的概念,提出扒用相互激活與競(jìng)擺爭(zhēng)網(wǎng)絡(luò)來(lái)進(jìn)行數(shù)埃據(jù)庫(kù)中的關(guān)聯(lián)規(guī)百則的發(fā)現(xiàn)27?。贿€有基于遺伴傳算法的多維關(guān)唉聯(lián)規(guī)則挖掘2板8等??梢钥窗页鐾ㄟ^(guò)引入其他斑領(lǐng)域的先進(jìn)理論襖,豐富了關(guān)聯(lián)規(guī)隘則研究的內(nèi)容,扮提高了算法的有礙效性。翱(4)關(guān)聯(lián)規(guī)則盎的價(jià)值評(píng)判標(biāo)準(zhǔn)壩研究。如29疤背分別

21、討論了關(guān)聯(lián)愛(ài)規(guī)則的客觀評(píng)價(jià)叭指標(biāo)(支持度、拌可信度和相關(guān)強(qiáng)暗度)和主觀評(píng)價(jià)笆指標(biāo)(新穎性、佰用戶感興趣性和礙簡(jiǎn)潔性),在此骯基礎(chǔ)上給出了一瓣種關(guān)聯(lián)規(guī)澳則的拔綜合自動(dòng)評(píng)價(jià)方稗法。捌(5)關(guān)聯(lián)規(guī)則癌的應(yīng)用研究。理俺論從實(shí)踐中來(lái),拌但最終是為了指礙導(dǎo)實(shí)踐。關(guān)聯(lián)規(guī)哀則自提出以來(lái),佰經(jīng)過(guò)無(wú)數(shù)學(xué)者的昂研究努力,廣泛扒應(yīng)用于社會(huì)生產(chǎn)版和科研的各個(gè)方把面,產(chǎn)生了巨大稗的效益按30,31,3凹2,33敗。扮(2)序列模式按挖掘捌序列模式(Se半quentia八l Patte癌rn)挖掘最早佰也是由R.Ag拜rawal首先巴提出來(lái)的34半。設(shè)有一個(gè)交跋易數(shù)據(jù)庫(kù)D,每柏個(gè)顧客可在不同艾時(shí)間購(gòu)買不同物芭品,每次購(gòu)買活

22、般動(dòng)稱為交易(T稗r(nóng)ansact啊ion)。這里凹,顧客、交易時(shí)把間和所購(gòu)物品分癌別以Custo隘mer_ID、靶Transa柏ction_T扒ime和Ite頒mset標(biāo)識(shí)。襖如果以Cust霸omer_ID拔為第一關(guān)鍵字,白Transac拜tion_Ti凹me為第二關(guān)鍵癌字對(duì)數(shù)據(jù)庫(kù)D排哀序,那么,對(duì)每白一顧客而言,他擺進(jìn)行的所有交易絆是以交易時(shí)間的靶升序排列的,從壩而構(gòu)成一個(gè)序列哎,稱這種序列為頒顧客序列CS(絆Custome襖r Seque巴nce)。一般辦地,令某顧客的稗各次交易時(shí)間為昂t1,t2,t翱3,百敖,tn,該顧客白在交易時(shí)間ti皚購(gòu)買的物品集記伴為itemse阿t(i),于是斑

23、該顧客的CS序埃列為items把et(t1),拔 itemse哀t(t2), 拔itemset靶(t3),辦柏, 礙itemset藹(tn)。相應(yīng)拌地,可以認(rèn)為上熬述交易數(shù)據(jù)庫(kù)D埃已轉(zhuǎn)換為顧客序八列數(shù)據(jù)庫(kù)。如果隘某序列s包含在鞍某顧客的CS序捌列中,那么稱該癌顧客支持(Su暗pport)該耙序列s。某序列拌的支持度為支持安該序列的顧客數(shù)氨與顧客序列數(shù)據(jù)胺庫(kù)中顧客總數(shù)之巴比。序列模式就懊是在上述顧客序背列數(shù)據(jù)庫(kù)中滿足把用戶指定最小支胺持度的最長(zhǎng)序列頒。襖序列模式的問(wèn)題吧定義與關(guān)聯(lián)規(guī)則熬很相似,它們之疤間的區(qū)別可以用暗下列例子描述,藹關(guān)聯(lián)規(guī)則描述的扳是在一次購(gòu)物中耙所購(gòu)買物品之間百的關(guān)聯(lián)關(guān)系,而按

24、序貫?zāi)J絼t是描頒述同一顧客在不氨同次購(gòu)物所購(gòu)物絆品之間可能存在按的某種關(guān)聯(lián)關(guān)系案。換句話說(shuō),關(guān)芭聯(lián)規(guī)背則僅哎僅發(fā)現(xiàn)事務(wù)內(nèi)部稗(intra-啊transac昂tion)的模拔式,而序列模式伴則是發(fā)現(xiàn)事務(wù)之百間(inter凹-transa扮ction)的把模式。皚序列模式的發(fā)現(xiàn)啊方法與關(guān)聯(lián)規(guī)則伴的發(fā)現(xiàn)方法大致板相同,R.Ag疤rawal在A般priori算伴法的基礎(chǔ)上提出氨了三個(gè)盎序列模式的挖掘班算法Aprio耙riAll、A扒prioriS霸ome和Dyn骯amicSom搬e34頒。Aprior版iAll算法采巴用哈希樹儲(chǔ)存候跋選序列,將所有白的候選序列均儲(chǔ)案存在哈希樹的葉俺子節(jié)點(diǎn)中;將候礙選序

25、列的記數(shù)劃襖分為向前及向后哎兩階段:向前階稗段跳躍性地產(chǎn)生爸所有特定長(zhǎng)度的拜頻繁序柏列,襖而向后階段找出般在向前階段未考柏慮的頻繁序列。把 在3百536中氨提出了挖掘具有矮概念分層、滑動(dòng)翱時(shí)間窗口及最大板和最小時(shí)間約束唉的 GSP(挨General辦ized Se半quentia疤l Patte芭rns熬)算法。該算法岸也采用哈希樹存礙儲(chǔ)候選序列,仍胺將候選序列的記疤數(shù)分為向前及向矮后階段,但此法吧劃分向前階段與半向后階段的目的哀與實(shí)現(xiàn)均與 A藹prioriA愛(ài)ll 算法不同襖。笆 PSP阿(白Perfect埃ly Sequ扮ential 藹Pattern柏s疤)算法在37靶中提出,該算案法采

26、用了前綴樹哎結(jié)構(gòu)(而非哈希埃樹)存儲(chǔ)候選序唉列,靶從而敖導(dǎo)致該算法的候靶選序列集的產(chǎn)生挨和記數(shù)均不同與柏GSP算法; 絆同時(shí),由于前綴敖樹的每個(gè)節(jié)點(diǎn)只版存儲(chǔ)事務(wù)中的一骯項(xiàng),故與哈希樹傲結(jié)構(gòu)相比較大的隘節(jié)省了內(nèi)存空間昂。靶(3)敖軟計(jì)算方法邦軟計(jì)算(Sof挨t Compu艾ting)是方癌法論的集合,這板些方法集互相協(xié)耙作,并以一種形案式或其它某種形隘式為現(xiàn)實(shí)中的模敗糊情況提供靈活按信息處理功礙能38翱。它的目的是為疤了獲得易處理的愛(ài)、粗糙的、低成胺本的解決方法而隘對(duì)不確定的數(shù)據(jù)鞍進(jìn)行處理。遵從澳的原則是以追求敖近似解決模糊/絆精確問(wèn)題,并低辦成本地設(shè)計(jì)解決凹方案。軟計(jì)算方襖法主要包括模糊凹邏輯

27、、Roug暗h集、遺傳算法襖、盎神經(jīng)鞍網(wǎng)絡(luò)等。模糊邏疤輯是處理不確定伴性概念及其推理半機(jī)制的過(guò)程,R哀ough集和神搬經(jīng)網(wǎng)絡(luò)常被用來(lái)絆分類和規(guī)則抽取擺,遺傳算法包括吧最優(yōu)解和搜索過(guò)芭程,像問(wèn)題最優(yōu)隘解和樣本選擇。鞍針對(duì)時(shí)間序列挖傲掘,軟計(jì)算方法拜的應(yīng)用研究簡(jiǎn)要奧介紹如下:挨模糊邏輯是最早斑、應(yīng)用最廣泛的芭軟計(jì)算方法,模暗糊邏輯的發(fā)展導(dǎo)絆致了軟計(jì)算方法八的出現(xiàn)。39哎在挖掘時(shí)間序啊列數(shù)據(jù)時(shí)使用了般模糊語(yǔ)言概化;矮40邦針對(duì)商業(yè)銷售的皚智能分析需求,佰提出了一種基于半模糊集合的數(shù)據(jù)哀挖掘時(shí)間序列模艾式算法。柏神經(jīng)網(wǎng)絡(luò)是一個(gè)奧黑箱問(wèn)題,它先扮前被認(rèn)為不適合班應(yīng)用于數(shù)據(jù)挖掘熬,且在符號(hào)格式敖中,它并不

28、能獲氨得艾有用八信息,但卻適合百進(jìn)行解釋。近年扮來(lái),挖掘訓(xùn)練過(guò)敖的網(wǎng)絡(luò)中的嵌入愛(ài)知識(shí),已廣泛地柏應(yīng)用于數(shù)據(jù)挖掘瓣中。它對(duì)屬性或奧逐個(gè)或合并地進(jìn)奧行判別,這對(duì)于疤決策或分類是非俺常重要的。它對(duì)岸數(shù)據(jù)挖掘的貢獻(xiàn)背是在規(guī)則提取和敗自組織性上。版遺傳算法是可調(diào)把節(jié)的、魯棒的、昂有效率的搜索方拌法,它適應(yīng)于搜捌索大空間集。它矮相對(duì)數(shù)據(jù)挖掘的俺標(biāo)準(zhǔn)來(lái)優(yōu)化功能把,并達(dá)到搜索最瓣優(yōu)解的目的。挨41提出了一阿個(gè)基于小生境遺霸傳算法和模式緩擺存的時(shí)間序列中奧頻繁結(jié)構(gòu)模式的搬發(fā)現(xiàn)算法,該算板法具有輕便、靈藹活、可擴(kuò)展性好藹的特點(diǎn),可根據(jù)拔實(shí)際情況合理配叭置計(jì)算時(shí)間和所擺占用的內(nèi)存資源叭,可實(shí)現(xiàn)挖掘結(jié)岸果的耙實(shí)時(shí)盎動(dòng)

29、態(tài)更新輸出,疤并通過(guò)在在實(shí)際盎時(shí)間序列數(shù)據(jù)上礙的實(shí)驗(yàn)證明了該氨算法的有效性。癌 拔Rough集理頒論由波蘭邏輯學(xué)安家Pawlak佰教授在20世紀(jì)班80年代提出,俺是一種處理含糊唉和不確定問(wèn)題的辦新型數(shù)學(xué)工具,靶其出發(fā)點(diǎn)是根據(jù)唉目前已有的對(duì)給把定問(wèn)題的知識(shí)將罷問(wèn)題的論域進(jìn)行骯劃分,然后對(duì)劃奧分的每一部分確唉定其對(duì)某一概念鞍的支持程度:即伴肯定支持此概念跋,肯定不支持此愛(ài)概念和可能支持罷此概念,并分別傲用三個(gè)近似集合俺來(lái)表示為正域、哀負(fù)域和邊界。它半能有效地分析不八精確、不一致、盎不完整等各種不阿完備的信息,還奧可以對(duì)數(shù)據(jù)進(jìn)行矮分析和推理,從翱中發(fā)現(xiàn)隱含的知壩識(shí)和潛罷在的奧規(guī)律。同時(shí),R案ough

30、集理論哀在處理大數(shù)據(jù)量板,消除冗余信息氨等方面有著良好唉的效果,因此廣唉泛應(yīng)用于數(shù)據(jù)挖版掘的數(shù)據(jù)預(yù)處理挨(數(shù)據(jù)約簡(jiǎn))、耙規(guī)則生成等方面拌42,43霸。把股票時(shí)間序列擺挖掘拔股票市場(chǎng)高風(fēng)險(xiǎn)半和高收益并存,唉因此對(duì)于股票數(shù)背據(jù)知識(shí)發(fā)現(xiàn)的研扮究一直受到人們哎的關(guān)注。目前對(duì)啊股票時(shí)間序列的般數(shù)據(jù)挖掘方法大邦致集中在以下三暗個(gè)方面。翱(1)相似性的氨研究罷。爸該方法是在時(shí)間癌序列數(shù)據(jù)庫(kù)中找稗出與給定查詢序搬列最接近的數(shù)據(jù)哀序列,它包含了板全序列匹配和子班序列匹配兩種問(wèn)凹題。子序列匹配笆就是找出與給定啊模式序列相似的盎所有子序列,而安全序列匹配就是暗找出澳彼此皚間相似的序列。柏具體的操作時(shí)將扳時(shí)間窗口在時(shí)

31、間哎序列上滑動(dòng),通傲過(guò)距離計(jì)算從一氨個(gè)時(shí)間序列和多頒個(gè)時(shí)間序列中尋擺找相似的時(shí)間序伴列模式進(jìn)行聚類哎形成相似組群,氨當(dāng)有一個(gè)新的時(shí)跋間序列需要分析昂時(shí),可以從相似笆組群中尋找與它爸最相似的類來(lái)匹敗配。一般有兩個(gè)瓣研究方向,一種叭是將時(shí)間序列從罷時(shí)間域(tim靶e domai骯n)到頻率域(八frequen阿cy doma鞍in)后在進(jìn)行唉相似性匹配。至把于為什么要進(jìn)行拌這種數(shù)據(jù)變換,挨主要是基于許多白信號(hào)分析技術(shù)(罷如離散傅立葉變俺換DFT和離散擺小波變換DWT班)需要數(shù)據(jù)來(lái)自八頻率域2。斑另一種則是直接凹在時(shí)間域上研究愛(ài)。主斑要應(yīng)拔用是從股票數(shù)據(jù)哎中識(shí)別具有相似敗變化趨勢(shì)的模式背,以預(yù)測(cè)新數(shù)

32、據(jù)霸在未來(lái)的發(fā)展行班為。在時(shí)間序列阿相似性方面的研礙究文獻(xiàn)有44捌,45,46,百47。唉(2)趨勢(shì)分析翱與值預(yù)測(cè)研究礙。罷趨勢(shì)分析研究時(shí)澳間序列的變化趨懊勢(shì),其理論基礎(chǔ)唉是將時(shí)間序列視罷為一個(gè)動(dòng)力系統(tǒng)皚,認(rèn)為在其過(guò)去礙的波動(dòng)中蘊(yùn)涵有巴可用于預(yù)測(cè)未來(lái)岸的信息。給定一礙組值(Y白1挨,Y安2扳,Y埃3襖,氨盎),確定數(shù)據(jù)趨搬勢(shì)的方法通常有柏兩種2:一哎種是N階的移動(dòng)搬平均值,即 (岸)/n,(翱)/n,(吧)/n,澳百。移動(dòng)平均可以盎降低數(shù)據(jù)集中的安變化總量,用移瓣動(dòng)平均替代時(shí)序礙,可以減少不希澳望出現(xiàn)的波動(dòng),盎故它也稱為時(shí)序板的平滑。另一種澳是最小二乘法,昂即以最好的擬合熬曲線C作為最小阿二乘

33、曲線,即曲鞍線具有最小的柏,其中偏差或誤隘差d辦i佰是指點(diǎn)(x隘i笆,y氨i安)岸的值y爸i奧與對(duì)應(yīng)曲線C的頒值之間的差值。瓣趨勢(shì)分析可以用拌來(lái)值預(yù)測(cè),除此矮之外,用得較多柏的是神經(jīng)網(wǎng)絡(luò)稗48,49。疤這種預(yù)測(cè)方法由盎于是基于時(shí)間序鞍列的具體數(shù)值,伴而這些數(shù)據(jù)往往伴含有許多干擾數(shù)瓣據(jù),因此該值預(yù)搬測(cè)方法的抗干擾班能力較弱。板(3)時(shí)間序列版中關(guān)聯(lián)規(guī)則的抽捌取扮。案Gautam 傲Das等對(duì)從時(shí)扮間序列中發(fā)現(xiàn)關(guān)扮聯(lián)規(guī)則進(jìn)行了研暗究50,這艾里規(guī)則是對(duì)時(shí)間搬序列中不同模式辦間關(guān)系的一種描澳述,50的稗主要貢獻(xiàn)在于給把出了一個(gè)將原始愛(ài)時(shí)間序列轉(zhuǎn)換成霸有各個(gè)模式表示霸符組成的符號(hào)序背列的一般方案,拜該

34、方案由三部分案組成,即分割,壩聚類和符號(hào)替換把。然后采用序列案模式發(fā)現(xiàn)算法實(shí)絆現(xiàn)了符號(hào)序列中班規(guī)則的發(fā)現(xiàn)。敖針對(duì)股票時(shí)間序皚列的特殊性,許皚多學(xué)者在經(jīng)典關(guān)罷聯(lián)規(guī)則挖掘算法捌的基礎(chǔ)上,又提隘出了許多新的算邦法。1996年襖R.Strik扒ant給出了關(guān)邦系數(shù)據(jù)庫(kù)中數(shù)量骯關(guān)聯(lián)規(guī)則的挖掘佰算法鞍51;19辦98年H.Lu鞍對(duì)股票變動(dòng)的預(yù)昂測(cè)以及內(nèi)聯(lián)相關(guān)把性分析進(jìn)行了研拜究52;1吧999年M.G澳arofala背kis提出了具跋有約束限制的時(shí)壩序數(shù)據(jù)挖掘5稗3;2002哀年 Y.Che隘n對(duì)時(shí)序數(shù)據(jù)庫(kù)暗的多維回歸分析背進(jìn)行了研究5瓣4。國(guó)內(nèi)學(xué)者愛(ài)在這方面也做了八相當(dāng)?shù)难芯浚?5對(duì)股票時(shí)伴間序列的挖

35、掘,愛(ài)分別探討了一維笆和二維關(guān)聯(lián)規(guī)則礙的發(fā)現(xiàn);56哎通過(guò)一個(gè)具體礙的實(shí)例描述了從捌股票時(shí)間序列中暗挖掘一維關(guān)聯(lián)規(guī)班則的方法;5安7提出了延遲爸關(guān)聯(lián)規(guī)則的概念爸,并在股票時(shí)間凹序列上實(shí)現(xiàn)挖掘暗該規(guī)則的算法;巴58在時(shí)間凹序列中引入多重澳時(shí)間粒度胺,以模糊規(guī)則的白形式給出數(shù)據(jù)挖鞍掘的結(jié)果。哀Rough集理阿論在數(shù)據(jù)挖掘領(lǐng)笆域的應(yīng)用主要體爸現(xiàn)在數(shù)據(jù)約簡(jiǎn)和巴關(guān)聯(lián)規(guī)則的抽取辦上,這方面的研隘究已經(jīng)有了少量絆的文獻(xiàn)。59拔提出的一種基絆于Rough集擺的時(shí)間序列數(shù)據(jù)疤挖掘策略,顯然柏適用于股票時(shí)間敗序列的挖掘;凹60則提出將安正則化神經(jīng)網(wǎng)絡(luò)哀與Rough集埃理論相結(jié)合應(yīng)用巴于股票時(shí)間序列愛(ài)數(shù)據(jù)庫(kù)的挖掘。翱

36、該方法融合了正哀則神經(jīng)網(wǎng)絡(luò)優(yōu)良澳的泛化性能和R敖ough集理論吧的規(guī)則生成能力罷,充分展示了軟埃計(jì)算方法應(yīng)用于叭時(shí)間序列數(shù)據(jù)分?jǐn)[析的新穎性。四總結(jié)與展望伴從大的方面來(lái)說(shuō)霸,時(shí)間序列數(shù)據(jù)襖的挖掘技術(shù)可分凹為統(tǒng)計(jì)分胺析法和數(shù)據(jù)挖掘靶。眾所周知,統(tǒng)氨計(jì)學(xué)是數(shù)據(jù)挖掘靶的三大支柱之一礙(另兩種是數(shù)據(jù)柏庫(kù)和人工智能)俺;同時(shí),數(shù)據(jù)挖敗掘在統(tǒng)計(jì)學(xué)的基澳礎(chǔ)上另有擴(kuò)充和跋發(fā)展,這使得數(shù)岸據(jù)挖掘技術(shù)成為襖一種更具優(yōu)勢(shì)性辦的研究方法。統(tǒng)頒計(jì)學(xué)為問(wèn)題的探扒索解決方案提供版了有用而實(shí)際的佰框架;模型是現(xiàn)爸代統(tǒng)計(jì)學(xué)的核心背,模型的選擇和懊計(jì)算往往被認(rèn)為扳是次要的,是建扳立模型的枝節(jié)。皚統(tǒng)計(jì)學(xué)本質(zhì)上是哀從事骯“敗確定性斑”

37、藹分析的,可以說(shuō)熬統(tǒng)計(jì)方法是藹“稗目標(biāo)驅(qū)動(dòng)奧”耙的。但數(shù)據(jù)挖掘愛(ài)卻不同,它的核襖心是算法,當(dāng)然辦也考慮模型和可佰解釋性問(wèn)題,但拔算法及可實(shí)現(xiàn)性搬是第一位的。它板所強(qiáng)調(diào)的首先是佰發(fā)現(xiàn),其次才是絆解釋。數(shù)據(jù)挖掘皚,作為很多學(xué)科癌交叉的結(jié)果,繼扒承了機(jī)器學(xué)習(xí)的辦“岸冒險(xiǎn)俺”疤態(tài)度,比統(tǒng)計(jì)學(xué)爸更強(qiáng)調(diào)實(shí)踐性、奧探索性和靈活性柏。愛(ài)證券市場(chǎng)是國(guó)民矮經(jīng)濟(jì)的晴雨表,佰是政府主管部門艾、券商和廣大投凹資者的興趣中心稗。長(zhǎng)期以來(lái)各券埃商的交易系統(tǒng)一扳直走在IT技術(shù)伴應(yīng)用革新的前沿把,同時(shí)也積累了鞍大量的數(shù)據(jù);拔挖掘、開發(fā)和利板用這些數(shù)據(jù)一方敗面可以有效指導(dǎo)懊證券投資者的投傲資,另一方面可哎以使證券公司進(jìn)拔行最適合

38、的定位懊,從而使企業(yè)長(zhǎng)拜期的積累得以充凹分發(fā)揮,樹立競(jìng)埃爭(zhēng)優(yōu)勢(shì)扒。作為數(shù)據(jù)挖掘疤的主要組成部分扒之一,關(guān)聯(lián)規(guī)則板挖掘獲得了廣泛柏的研究,但從關(guān)跋聯(lián)規(guī)則的角度進(jìn)哀行股票時(shí)間序列扮分析,從學(xué)術(shù)上把來(lái)說(shuō)具罷有一定的新穎性鞍,其終極目標(biāo)是礙以極大的概率預(yù)安測(cè)股價(jià)的未來(lái)走安勢(shì)。股票的漲跌疤不是各自互不影芭響的,傳統(tǒng)意義頒上的扳“矮板塊聯(lián)動(dòng)板”骯就是極好的證明矮??疾旃善眱r(jià)格暗之間的漲跌關(guān)系啊,如能在傳統(tǒng)分襖析方法的基礎(chǔ)上壩,采用先進(jìn)的數(shù)笆據(jù)挖掘技術(shù),挖澳掘出股票之間的奧價(jià)格聯(lián)動(dòng)關(guān)聯(lián)規(guī)骯則,顯然具有十骯分重要的意義。啊Rough集理捌論是一種處理含把糊和不精確性問(wèn)胺題的新型數(shù)學(xué)工芭具,是采用精確稗的數(shù)學(xué)方

39、法分析矮不精確系統(tǒng)的一傲種理想方法。大胺量文獻(xiàn)已經(jīng)說(shuō)明翱Rough集理敖論是從數(shù)據(jù)集中笆提取關(guān)聯(lián)規(guī)則的岸有效方法,其中霸主要的原因應(yīng)歸柏功于Rough笆集理論強(qiáng)大的數(shù)笆據(jù)約簡(jiǎn)能力。應(yīng)瓣用R瓣ough集理論敖對(duì)股票時(shí)間序列笆數(shù)據(jù)進(jìn)行建模、白約簡(jiǎn)、規(guī)則抽取壩,顯然又是一個(gè)擺極具新穎和創(chuàng)新叭的研究領(lǐng)域。參考文獻(xiàn) 搬1 安鴻志凹,陳兆國(guó),杜金笆觀,潘一民. 瓣時(shí)間序列的分析巴與應(yīng)用. 科學(xué)按出版社 198邦3.盎2 Jia扳wei Han吧,Michel挨ine Kam八ber. 數(shù)據(jù)版挖掘: 概念與班技術(shù).北京:機(jī)埃械工業(yè)出版社2般001.36頒、27828敖5.罷3 貝政新骯,陳瑛. 證霸券投資通

40、論. 辦上海:復(fù)旦大學(xué)扒出版社,199哎8.百4 安妮.凹 股票投資技術(shù)靶方法與應(yīng)用. 擺深圳:海天出版哎社,199襖5.藹5 王耀動(dòng)疤,張德遠(yuǎn),張海白雄. 經(jīng)濟(jì)時(shí)間礙序列分析. 上藹海財(cái)經(jīng)大學(xué)出版安社 1996.盎6 李民,白邵建中,李俊平傲等. 用ARM案A模型預(yù)測(cè)深滬扮股市. 長(zhǎng)沙鐵愛(ài)道學(xué)院學(xué)報(bào),2啊002,18(啊1):788熬4.疤7 李愛(ài)國(guó)半,覃征. 滑動(dòng)壩窗口二次自回歸岸模型預(yù)測(cè)非線性皚時(shí)間序列. 計(jì)板算機(jī)學(xué)報(bào),第2襖7卷,第7期2拔004年7月.氨8 孫宏義把,朱梅. 混沌芭時(shí)間序列預(yù)測(cè)及笆在股票市場(chǎng)中的扮應(yīng)用. 安徽工半程科技學(xué)院學(xué)報(bào)盎,第18卷,第挨4期2003年邦12月.

41、瓣9 李菁菁邦,邵培基,黃亦鞍瀟. 數(shù)據(jù)挖掘壩在中國(guó)的現(xiàn)狀和伴發(fā)展研究.耙 管理工程學(xué)報(bào)艾 2004年第啊3期.傲10 R.唉Agrawal暗, T.Imi胺elinski爸, A.Swa疤mi. Min八ing Ass捌ociatio捌n Rules愛(ài) Betwee安n Sets 壩of Item隘s in La巴rge Dat岸abases唉C. Pro唉ceeding吧s of AC板M SIGMO霸D Int搬盎1 Conf.把 Manage俺ment of罷 Data, 靶Washing扮ton D.C盎., 1993搬.20721矮6. 柏11 R.敗Agrawal班, R.Sri

42、柏kant. F巴ast Alg盎ori皚thms fo翱r Minin翱g Assoc罷iation 把RulesJ扳. VLDB艾94, San礙tiago, 版Chile,1氨994:478瓣499.按12 Ma斑nnila H拌, Toivo霸nen, In按keri Ve瓣rkamo A凹. Effic邦ient al澳gorithm版s for d瓣iscover疤y assoc絆iation 熬rules. 伴In Proc凹eedings斑 of AAA盎I Works罷hop on 拜Knowled拜ge Disc巴overy i芭n datab敖ase. Ju凹ly 199

43、4哀.181瓣192.芭13 Ha白nnu Toi般vonen, 背Mika Kl凹emettin稗en, Pir敖j(luò)o Ronk扳aine et壩al. Pru稗ning an矮d group阿ing 芭discove昂red搬 associ扒ation r捌ules. I襖n Mlnet藹 worksh霸op on S捌tatisti挨cs, Mac百hing Le隘arning 敖and Dis絆covery 斑in Data擺base. H稗eraklio拌n, Rete般. April藹 1995.版14 Ag扳rawal R稗, Srika阿nt R. F辦ast Di疤scove

44、ry哎 of Ass巴ociatio敗n Rules伴. In Fa霸yyad.骯爸 1996.啊15 吧J.Han, 拜J.Pei. 拜Mining 伴Frequen擺t Patte捌rns Wit芭hout Ca盎ndidate斑 Genera跋tion阿.凹 In Pro敖c. 2000耙 阿ACM-SIG熬MOD Int辦l. Conf岸. on Ma哎nagemen背t of Da俺ta(SIGM昂OD2000拔) Dalla般s TX 20敗00芭,辦1板班12傲.搬16 俺R.Agarw藹al搬,八 C.Agga吧rwal癌,壩 V.Pras俺ad搬. 班A T哀ree Pro般

45、jection擺 Algori扒thm for襖 Genera芭tion of把 Freque胺nt班 懊Itemset霸s昂.笆 Journa白l of Pa把rallel 捌and Dis板tribute罷d Compu唉ting Sp凹ecial I版ssue on頒 High P哀erforma八nce翱 拌Data Mi巴ning 20傲01拜,半350-371凹.搬17拌 叭倪旻皚,斑徐曉飛捌,矮鄧勝春伴,凹趙政. 隘基于頻繁項(xiàng)目對(duì)按支持矩陣的唉Apriori骯優(yōu)化算法.小型按微型計(jì)算機(jī)系統(tǒng)把.班Vol.25 暗No.5澳, 百M(fèi)ay 200愛(ài)4岸.版18 唉鄧硯谷,王麗絆珍. 敗

46、對(duì)FP-Tre阿e頭表節(jié)點(diǎn)數(shù)據(jù)般結(jié)構(gòu)的改進(jìn)八.唉計(jì)算機(jī)工程與應(yīng)稗用. 2004按,25.啊19 盎R.Agraw把a(bǔ)l, J.S百hafer敗.埃 Parall絆el Mini擺ng of A扮ssociat耙ion Rul巴es啊. 笆IEEE Tr捌ans.On 版Knowled跋ge and氨 愛(ài)Data En拔gineer 壩1996,96礙2般皚969傲.般20 鞍張兆功,李建中俺,張艷秋.岸 頒海量數(shù)據(jù)上挖掘斑關(guān)聯(lián)規(guī)則的并行奧算法拌. 哈爾濱工業(yè)壩大學(xué)學(xué)報(bào),20翱04年05期埃.稗21百 盎朱紅蕾,李明.埃 拌一種高效維護(hù)關(guān)扮聯(lián)規(guī)則的增量算耙法拌.叭 計(jì)算機(jī)應(yīng)用研敗究,叭2004年

47、09皚期.扒22 捌M.Kambe背r,矮 把J.Han骯,罷 J.Y.Ch骯iang柏.扳 Metaru藹le-Guid藹ed Mini捌ng of M絆ulti-De翱mension笆al Asso擺ciation搬 案Rules U氨sing Da阿ta Cube班s In Pr斑oc.1997暗 Intl. 瓣Conf. K暗nowledg矮e Disco般very an敗d Data 斑M(jìn)inin K礙DD1997昂 半 Newpo稗r(nóng)t Beac案h CA. 1半997,207伴-210吧.俺23 程繼把華,郭建生,施罷鵬飛. 元規(guī)則盎指導(dǎo)的挨知識(shí)發(fā)現(xiàn)方法研埃究. 計(jì)算機(jī)工拌程與應(yīng)

48、用,19盎99年第10期哀.稗24 陸建絆江. 數(shù)據(jù)庫(kù)中奧布爾型及廣義模矮糊型加權(quán)關(guān)聯(lián)規(guī)啊則的挖掘癌.系統(tǒng)工程理論皚與實(shí)踐,200敖2,2:28絆32.哀25 程繼昂華,施鵬飛. 氨多層次關(guān)聯(lián)規(guī)則扳的有效挖掘算法案.軟件學(xué)昂報(bào),1998,巴9(12):9翱37941.板26 程 瓣巖,黃梯云.粗骯糙集中定量關(guān)聯(lián)昂規(guī)則的發(fā)現(xiàn)及其暗規(guī)則約簡(jiǎn)的方法班研究.管壩理工程學(xué)報(bào),2搬001,15(愛(ài)3):737澳7.擺27 倪志敗偉,蔡慶生,方艾瑾.用神經(jīng)網(wǎng)絡(luò)按來(lái)挖掘數(shù)據(jù)庫(kù)中敖的關(guān)聯(lián)規(guī)則擺.系統(tǒng)仿真學(xué)隘報(bào)爸,2000,1稗2(6):68翱5687.愛(ài)28 拌高堅(jiān). 靶基于免疫遺傳算凹法的多維關(guān)聯(lián)規(guī)霸則挖掘扮

49、. 計(jì)算機(jī)工程八與應(yīng)用. 20案03年32期.靶 斑29 蘇占扒東,游福成,楊版炳儒.辦 關(guān)聯(lián)規(guī)則的綜百合評(píng)價(jià)方法研究柏與實(shí)例驗(yàn)證計(jì)算吧機(jī)應(yīng)用. 20斑04年10期.埃30 李虹暗,蔡之華. 哀關(guān)聯(lián)規(guī)則在醫(yī)療斑數(shù)據(jù)分析中的應(yīng)稗用皚. 微機(jī)發(fā)展.愛(ài) 2003年0跋6期.扒31 胥桂跋仙,高旭,于紹澳娜. 爸關(guān)聯(lián)規(guī)則算法在哎中文文本挖掘中絆的應(yīng)用研究. 扳中央民族大學(xué)學(xué)氨報(bào)(自然科學(xué)版皚). 2004隘年04期.唉32白 敖姜南,唐曉青.艾 艾應(yīng)用關(guān)聯(lián)規(guī)則構(gòu)傲建質(zhì)罷量活動(dòng)鏈模型澳.背 瓣北京航空航天大壩學(xué)學(xué)報(bào),200礙4年05期. 安33搬 半普杰信,薛冰冰霸. 絆加權(quán)關(guān)聯(lián)規(guī)則在霸網(wǎng)絡(luò)入侵檢測(cè)系巴

50、統(tǒng)中的應(yīng)用. 俺2004年04案期.擺 熬34 Ag懊rawal R擺, Srika靶nt R. M板ining S頒equenti擺al Patt捌erns. I藹n Proc.暗95 Int扳擺1 Conf 鞍Data En哀gineeri襖ng, Tai按bei,Tai芭wan. Ma板rch,5,1岸995.敖35半 Tamakr罷ishnan 霸Srikant斑, Rakes柏h Agraw襖al襖.靶 Mining拌 Sequen熬tial Pa藹tterns:凹 扮General瓣ization壩s and傲 半 昂Perform暗ance Im鞍proveme八nts唉.盎36

51、 吧Ramakis熬hnan Sr胺ikant隘.巴 Fast A安lgorith按ms for 哎Mining 柏Associa翱tion Ru拔les and按 Sequen半tial Pa奧tterns八,斑 班 捌Chapter芭 5 Mini藹ng Sequ盎ential 班Pattern扒s p113-扒146版.凹37 柏F.Masse氨glia, F盎.Cathal藹a, P.Po隘ncelet伴.敖 The笆 PSP Ap白proach 挨for Min愛(ài)ing Seq八uential哎 Patter斑ns扒.捌38 L.辦 A. Zad傲eh. Fuz哀zy logi艾c,

52、 neur般al netw稗orks, a昂nd soft鞍 comput疤ing, 邦Commun.霸 ACM, V扒ol. 37,哀 pp. 77拔-84, 19芭99.矮39 昂D. A.Ch襖iang, L扮.R.Chow霸,Y.E.Wa邦ng皚.岸 Mining礙 time s敗eries d礙ata by 跋a fuzzy阿 lingui拜stic su扒mmary s笆ystem. 挨Fuzz百y Sets 背Syst. V拌ol. 112扮, pp.41斑9-432, 澳2002.爸40柏 吳煲寧,林天辦,孫志揮,汪曉半剛.懊 一種基于模糊八集的時(shí)間序列挖氨掘算法的設(shè)計(jì)與襖實(shí)現(xiàn)

53、. 計(jì)算機(jī)氨工程與應(yīng)用,2板002年20期按.吧 絆41 李斌扮,汪祖媛,高清背維,莊鎮(zhèn)泉. 巴基于遺傳算法的笆時(shí)間序列中頻繁敗結(jié)構(gòu)模式發(fā)現(xiàn)研敖究. 電路與系斑統(tǒng)學(xué)報(bào). 第九昂卷,第四期,2疤004年8月.挨42 拔劉清. Rou把gh集及Rou巴gh推理. 科挨學(xué)出版社,20辦01.罷43 韓中熬華,吳成東,劉霸海濤. 數(shù)據(jù)挖矮掘技術(shù)研究進(jìn)展哀. 工控智能化唉,2003(1拜0), pp.皚 18-23.稗44 Da壩s G, Gu扳nopulos胺 D. Fin疤ding si按milar t昂ime ser扳ies. In熬 Proc. 拌Of the 把Confere骯nce on 半Princip把les of 唉Knowled芭ge Disc壩overy a哀nd Data盎 Mining辦, Trond骯heim, N霸orway, 叭1997:12藹4-135. 佰45 Ea耙monn Ke啊ogh. A 叭Tutoria拔l on In昂dexing 扮and Min巴ing Tim挨e Serie按s Data.版

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論