Python金融數(shù)據(jù)分析與挖掘(微課版) 課件匯 黃恒秋 6-1.公司治理結(jié)構(gòu)數(shù)據(jù) - 11-3.月行業(yè)聯(lián)動(dòng)與輪動(dòng)分析_第1頁(yè)
Python金融數(shù)據(jù)分析與挖掘(微課版) 課件匯 黃恒秋 6-1.公司治理結(jié)構(gòu)數(shù)據(jù) - 11-3.月行業(yè)聯(lián)動(dòng)與輪動(dòng)分析_第2頁(yè)
Python金融數(shù)據(jù)分析與挖掘(微課版) 課件匯 黃恒秋 6-1.公司治理結(jié)構(gòu)數(shù)據(jù) - 11-3.月行業(yè)聯(lián)動(dòng)與輪動(dòng)分析_第3頁(yè)
Python金融數(shù)據(jù)分析與挖掘(微課版) 課件匯 黃恒秋 6-1.公司治理結(jié)構(gòu)數(shù)據(jù) - 11-3.月行業(yè)聯(lián)動(dòng)與輪動(dòng)分析_第4頁(yè)
Python金融數(shù)據(jù)分析與挖掘(微課版) 課件匯 黃恒秋 6-1.公司治理結(jié)構(gòu)數(shù)據(jù) - 11-3.月行業(yè)聯(lián)動(dòng)與輪動(dòng)分析_第5頁(yè)
已閱讀5頁(yè),還剩176頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第6章

金融數(shù)據(jù)基礎(chǔ)公司治理結(jié)構(gòu)數(shù)據(jù)概述公司治理結(jié)構(gòu)數(shù)據(jù)主要指標(biāo)解讀公司治理結(jié)構(gòu)數(shù)據(jù)概述第6章

公司治理結(jié)構(gòu),主要分為四個(gè)部分:基本信息、高管動(dòng)態(tài)、股東股本和會(huì)議情況?;拘畔⒎从沉斯局卫斫Y(jié)構(gòu)的基本內(nèi)容,包括公司基本情況、股本結(jié)構(gòu)是否變化、股東總數(shù)、前十大股東是否存在關(guān)聯(lián)、員工人數(shù)、離休職工人數(shù)、董事長(zhǎng)持股數(shù)量與持股比例、總經(jīng)理持股數(shù)量與持股比例、董事長(zhǎng)與總經(jīng)理是否兼任等;除此之外,還包括了董事、監(jiān)事和高管的年薪收入水平,公司的股權(quán)激勵(lì)和實(shí)施情況等。高管動(dòng)態(tài)反映了“董監(jiān)高”管理層的個(gè)人簡(jiǎn)歷信息、職務(wù)、年齡、教育背景、持股情況、激勵(lì)情況、活動(dòng)情況、參會(huì)情況和個(gè)人投資行為。股東股本反映了十大股東和十大流通股東的持股性質(zhì)、持股數(shù)量和持股比例,股本結(jié)構(gòu)(未流通股:國(guó)有股、法人股、內(nèi)部職工股、基金配售股、轉(zhuǎn)配股、優(yōu)先股、監(jiān)管層股、戰(zhàn)略投資者股等和流通股:A股、B股和H股)及其變動(dòng)情況會(huì)議情況反映了董事會(huì)、監(jiān)事會(huì)、股東大會(huì)、戰(zhàn)略委員會(huì)、審計(jì)委員會(huì)、薪酬與考核委員會(huì)、提名委員會(huì)相關(guān)會(huì)議情況。公司治理結(jié)構(gòu)數(shù)據(jù)主要指標(biāo)解讀第5章

公司高管,包括姓名、職務(wù)、學(xué)歷、年薪、持股情況等?;谶@些信息,可以衍生出一些諸如董事長(zhǎng)和總經(jīng)理是否兼任,獨(dú)立董事人數(shù),管理層學(xué)歷水平、專(zhuān)業(yè)能力水平、平均年齡、專(zhuān)業(yè)背景是否與公司業(yè)務(wù)相符、持股占比等指標(biāo),進(jìn)而研究公司管理層的管理能力等維度公司治理結(jié)構(gòu)數(shù)據(jù)主要指標(biāo)解讀第5章

高管增/減持股份,包括變動(dòng)日期、高管姓名、增/減持?jǐn)?shù)量、成交均價(jià)、交易方式等。高管作為最了解公司管理和經(jīng)營(yíng)狀況的知情人士,其一舉一動(dòng)都備受市場(chǎng)的關(guān)注,也是研究公司當(dāng)前發(fā)展境況的一個(gè)重要參考方面。如果大量高管通過(guò)市場(chǎng)競(jìng)價(jià)密集增持本公司股份,說(shuō)明可能看好公司發(fā)展或者有積極事件發(fā)生或能增加投資者信心。公司治理結(jié)構(gòu)數(shù)據(jù)主要指標(biāo)解讀第5章

股本結(jié)構(gòu)變動(dòng)情況,主要包括變動(dòng)日期、變動(dòng)原因、已流通股份和流通受限股份。事實(shí)上,為了確保公司的穩(wěn)定、持續(xù)經(jīng)營(yíng)和良好發(fā)展,公司控股股東或大股東(股份持有量較大者)、高管、戰(zhàn)略投資者等持有的股份及股權(quán)激勵(lì)股份和轉(zhuǎn)增股份,是受到一定的流通限制的,即獲得其股份之后,需經(jīng)過(guò)一定時(shí)間之后才能上市交易,可能是幾個(gè)月、一年或幾年。這些受到流通限制的股份,可能是低于市場(chǎng)價(jià)格獲得,而且一般是公司的管理和經(jīng)營(yíng)利益相關(guān)方或者戰(zhàn)略投資方,為了保護(hù)廣大投資者,不得不采取的措施公司治理結(jié)構(gòu)數(shù)據(jù)主要指標(biāo)解讀第5章

十大股東的信息,包括股東名次、股東名稱(chēng)、持股數(shù)量、持股比例和股份性質(zhì)。十大股東一般是公司經(jīng)營(yíng)管理決策的重要制定者、執(zhí)行者和受益者,對(duì)公司的發(fā)展起到?jīng)Q定性作用,其持有公司股份比例反映了股權(quán)的集中程度。公司治理結(jié)構(gòu)數(shù)據(jù)主要指標(biāo)解讀第5章

股東人數(shù)的變化情況,包括截止日期、股東人數(shù)、股東人數(shù)變動(dòng)幅度。股東人數(shù)的變化,可以直觀感受到公司的受歡迎程度、市場(chǎng)環(huán)境變化等,進(jìn)一步可以研究籌碼的分散程度第6章

金融數(shù)據(jù)基礎(chǔ)財(cái)務(wù)報(bào)表數(shù)據(jù)概述財(cái)務(wù)報(bào)表數(shù)據(jù)主要指標(biāo)解讀財(cái)務(wù)報(bào)表數(shù)據(jù)概述第6章

財(cái)務(wù)報(bào)表,主要包括上市公司資產(chǎn)負(fù)債表、利潤(rùn)表和現(xiàn)金流量表。資產(chǎn)負(fù)債表,是反映企業(yè)在某一特定日期(如月末、季末、年末)全部資產(chǎn)、負(fù)債和所有者權(quán)益情況的會(huì)計(jì)報(bào)表。資產(chǎn)又分為流動(dòng)資產(chǎn)和非流動(dòng)資產(chǎn),流動(dòng)資產(chǎn)為短期內(nèi)能變現(xiàn)的資產(chǎn),如貨幣資金、交易性金融資產(chǎn)、短期投資凈額、應(yīng)收票據(jù)、應(yīng)收賬款、合同資產(chǎn)等;非流動(dòng)資產(chǎn)為短期內(nèi)不能變現(xiàn)的資產(chǎn),比如債權(quán)投資、長(zhǎng)期應(yīng)收賬款凈額、投資性房地產(chǎn)凈額、固定資產(chǎn)凈額、在建工程凈額、工程物資、無(wú)形資產(chǎn)凈額、商譽(yù)凈額等。負(fù)債分為流動(dòng)負(fù)債和非流動(dòng)負(fù)債,流動(dòng)負(fù)債為短期內(nèi)需償還的負(fù)債,比如短期借款、應(yīng)付票據(jù)、應(yīng)付賬款、合同負(fù)債、應(yīng)付職工薪酬、應(yīng)交稅費(fèi)、應(yīng)交利息等;非流動(dòng)負(fù)責(zé)為短期內(nèi)無(wú)需償還的負(fù)債,如長(zhǎng)期借款、租賃負(fù)債、長(zhǎng)期應(yīng)付款等。所有者權(quán)益,即企業(yè)資產(chǎn)扣除負(fù)債后,由所有者享有的剩余權(quán)益。所有者權(quán)益,也稱(chēng)為股東權(quán)益,包括實(shí)收資本(或股本)、資本公積、盈余公積和未分配利潤(rùn)。財(cái)務(wù)報(bào)表數(shù)據(jù)概述第6章

財(cái)務(wù)報(bào)表,主要包括上市公司資產(chǎn)負(fù)債表、利潤(rùn)表和現(xiàn)金流量表。利潤(rùn)表,反映企業(yè)在一定會(huì)計(jì)期間經(jīng)營(yíng)成果的報(bào)表,主要包括收入、成本和費(fèi)用相關(guān)數(shù)據(jù)信息。營(yíng)業(yè)總收入=營(yíng)業(yè)收入+利息凈收入+其他業(yè)務(wù)收入。營(yíng)業(yè)總成本=營(yíng)業(yè)成本+稅金及附加+業(yè)務(wù)及管理費(fèi)+銷(xiāo)售費(fèi)用+管理費(fèi)用+財(cái)務(wù)費(fèi)用+研發(fā)費(fèi)用+其他業(yè)務(wù)成本。營(yíng)業(yè)利潤(rùn)=營(yíng)業(yè)總收入-營(yíng)業(yè)總成本+其他收益及利潤(rùn)。利潤(rùn)總額=營(yíng)業(yè)利潤(rùn)+營(yíng)業(yè)外收入-營(yíng)業(yè)外支出。除此之外,還有一些常用的指標(biāo),比如基本每股收益、歸屬于母公司所有者的凈利潤(rùn)等。財(cái)務(wù)報(bào)表數(shù)據(jù)概述第6章

財(cái)務(wù)報(bào)表,主要包括上市公司資產(chǎn)負(fù)債表、利潤(rùn)表和現(xiàn)金流量表?,F(xiàn)金流量表,反映在某固定期間內(nèi)(如每月或每季),企業(yè)現(xiàn)金(包含銀行存款)的增減變動(dòng)情況表。主要包括三大塊內(nèi)容:經(jīng)營(yíng)活動(dòng)產(chǎn)生的現(xiàn)金流量?jī)纛~、投資活動(dòng)產(chǎn)生的現(xiàn)金流量?jī)纛~和籌資活動(dòng)產(chǎn)生的現(xiàn)金流量?jī)纛~。現(xiàn)金流量作為企業(yè)的生命線,對(duì)企業(yè)的生存和發(fā)展起到?jīng)Q定性作用,也是研究公司行業(yè)地位、資產(chǎn)和利潤(rùn)質(zhì)量的有力數(shù)據(jù)支撐。事實(shí)上,資產(chǎn)負(fù)債表和利潤(rùn)表都是核算出來(lái)的,而現(xiàn)金流量表的數(shù)據(jù)是真實(shí)存在的銀行資金流水,做不得半點(diǎn)虛假。財(cái)務(wù)報(bào)表主要指標(biāo)解讀第5章

資產(chǎn)類(lèi)科目指標(biāo)主要有貨幣資金、流動(dòng)資產(chǎn)、非流動(dòng)資產(chǎn)和總資產(chǎn);負(fù)債類(lèi)科目指標(biāo)主要包括流動(dòng)負(fù)債、長(zhǎng)期借款、非流動(dòng)負(fù)債和總負(fù)債;股東權(quán)益類(lèi)科目指標(biāo)包括股本、未分配利潤(rùn)和所有者權(quán)益,其中所有者權(quán)益=總資產(chǎn)-總負(fù)債財(cái)務(wù)報(bào)表主要指標(biāo)解讀第5章

主要指標(biāo)包括營(yíng)業(yè)總收入、營(yíng)業(yè)總成本、營(yíng)業(yè)利潤(rùn)、利潤(rùn)總額、所得稅和歸屬母公司凈利潤(rùn)。這些指標(biāo)均不難理解,反應(yīng)的是上市公司經(jīng)營(yíng)成果,其中歸屬母公司凈利潤(rùn),就是歸屬上市公司所有者(股東)的凈利潤(rùn),上市公司凈利潤(rùn)也通常是指這個(gè)指標(biāo)。財(cái)務(wù)報(bào)表主要指標(biāo)解讀第5章

投資活動(dòng)包括實(shí)物投資(固定資產(chǎn)、在建工程等),也包括金融資產(chǎn)投資;籌資活動(dòng)包括企業(yè)資本構(gòu)成發(fā)生變化的活動(dòng),比如股本擴(kuò)張或股本溢價(jià)或股本結(jié)構(gòu)發(fā)生變化等,也包括債務(wù)結(jié)構(gòu)發(fā)生變化,比如對(duì)外舉債、向銀行貸款或發(fā)行債券等行為。除投資活動(dòng)和籌資活動(dòng)之外,就是經(jīng)營(yíng)活動(dòng)。第6章

金融數(shù)據(jù)基礎(chǔ)財(cái)務(wù)分析指標(biāo)數(shù)據(jù)概述財(cái)務(wù)分析數(shù)據(jù)主要指標(biāo)解讀財(cái)務(wù)分析指標(biāo)數(shù)據(jù)概述第6章

財(cái)務(wù)分析指標(biāo)數(shù)據(jù),屬于衍生指標(biāo),它們是基于財(cái)務(wù)報(bào)表數(shù)據(jù)和股票交易情況數(shù)據(jù),利用相關(guān)的專(zhuān)業(yè)公式或算法計(jì)算出來(lái)的。一般包括償債能力、運(yùn)營(yíng)能力、盈利能力、發(fā)展能力、每股指標(biāo)和相關(guān)主要考察指標(biāo)等。這里我們主要參考巨潮資訊網(wǎng)提供的財(cái)務(wù)分析指標(biāo)來(lái)進(jìn)行介紹,旨在一個(gè)拋磚引玉的作用財(cái)務(wù)分析主要指標(biāo)解讀第5章

主要指標(biāo)包括基本每股收益、每股凈資產(chǎn)、每股資本公積金、凈利潤(rùn)增長(zhǎng)率、營(yíng)業(yè)總收入增長(zhǎng)率和加權(quán)凈資產(chǎn)收益率。其中前三者屬于每股類(lèi)指標(biāo),其計(jì)算方法分別為期末的凈利潤(rùn)、所有者權(quán)益和資本公積金除以期末股本。凈利潤(rùn)增長(zhǎng)率和營(yíng)業(yè)總收入增長(zhǎng)率,屬于同比計(jì)算,即(本年度同期值-上年度同期值)/上年度同期值。凈資產(chǎn)收益率,其計(jì)算方法為凈利潤(rùn)除以加權(quán)平均股東權(quán)益,反映的是單位資產(chǎn)獲利能力。財(cái)務(wù)分析主要指標(biāo)解讀第5章

償還能力(也稱(chēng)償債能力)的主要指標(biāo),包括流動(dòng)比率、速動(dòng)比率和資產(chǎn)負(fù)債率。其中流動(dòng)比率=流動(dòng)資產(chǎn)/流動(dòng)負(fù)債,反應(yīng)的是短期內(nèi)能變現(xiàn)的資產(chǎn)與短期內(nèi)需償還的負(fù)債之間的比率。一般地,比率越大,企業(yè)資產(chǎn)變現(xiàn)能力越強(qiáng),償債能力亦越強(qiáng)。速動(dòng)比率=(流動(dòng)資產(chǎn)-存貨-預(yù)付賬款)/流動(dòng)負(fù)債。相比流動(dòng)比率,速動(dòng)比率進(jìn)一步扣除變現(xiàn)速度較慢的資產(chǎn)。資產(chǎn)負(fù)債率=總負(fù)債/總資產(chǎn),反映了公司進(jìn)行經(jīng)營(yíng)活動(dòng)的能力和債權(quán)人發(fā)放貸款的安全程度。財(cái)務(wù)分析主要指標(biāo)解讀第5章

運(yùn)營(yíng)能力的主要指標(biāo),包括應(yīng)收賬款周轉(zhuǎn)率、存貨周轉(zhuǎn)率、流動(dòng)資產(chǎn)周轉(zhuǎn)率、固定資產(chǎn)周轉(zhuǎn)率和總資產(chǎn)周轉(zhuǎn)率。其中應(yīng)收賬款周轉(zhuǎn)率=期末營(yíng)業(yè)收入/(應(yīng)收賬款期末余額+應(yīng)收賬款期初余額)*0.5;存貨周轉(zhuǎn)率=期末營(yíng)業(yè)成本/(存貨期末余額+存貨期初余額)*0.5;流動(dòng)資產(chǎn)周轉(zhuǎn)率=期末營(yíng)業(yè)收入/(流動(dòng)資產(chǎn)期末余額+流動(dòng)資產(chǎn)期初余額)*0.5;固定資產(chǎn)周轉(zhuǎn)率=期末營(yíng)業(yè)收入/(固定資產(chǎn)期末余額+固定資產(chǎn)期初余額)*0.5;總資產(chǎn)周轉(zhuǎn)率=營(yíng)業(yè)收入/(總資產(chǎn)期末余額+總資產(chǎn)期初余額)*0.5。周轉(zhuǎn)率是衡量公司資產(chǎn)管理效率的指標(biāo),一般周轉(zhuǎn)率越高越有利,越能反映公司的運(yùn)營(yíng)能力。這里從收賬、存貨、流動(dòng)資產(chǎn)、固定資產(chǎn)和總資產(chǎn)等幾個(gè)方面來(lái)進(jìn)行考察財(cái)務(wù)分析主要指標(biāo)解讀第5章

盈利能力和發(fā)展能力方面的主要指標(biāo),包括營(yíng)業(yè)利潤(rùn)率、凈利潤(rùn)率、毛利率、總資產(chǎn)報(bào)酬率和營(yíng)業(yè)收入增長(zhǎng)率、總資產(chǎn)增長(zhǎng)率、營(yíng)業(yè)利潤(rùn)增長(zhǎng)率、凈利潤(rùn)增長(zhǎng)率、凈資產(chǎn)增長(zhǎng)率;其中營(yíng)業(yè)利潤(rùn)率=營(yíng)業(yè)利潤(rùn)/營(yíng)業(yè)收入,凈利潤(rùn)率=凈利潤(rùn)/營(yíng)業(yè)收入,毛利率=(營(yíng)業(yè)收入-營(yíng)業(yè)成本)/營(yíng)業(yè)收入,總資產(chǎn)報(bào)酬率=(利潤(rùn)總額+利息支出)/(期末總資產(chǎn)+期初總資產(chǎn))*0.5,類(lèi)似地,總資產(chǎn)凈利潤(rùn)率=凈利潤(rùn)/(期末總資產(chǎn)+期初總資產(chǎn))*0.5。而發(fā)展能力方面的指標(biāo),主要是考察其增長(zhǎng)率,即(當(dāng)年同期指標(biāo)值-上年同期指標(biāo)值)/上年同期指標(biāo)值。第6章

金融數(shù)據(jù)基礎(chǔ)股票交易數(shù)據(jù)基本知識(shí)股票交易數(shù)據(jù)生產(chǎn)場(chǎng)景高頻數(shù)據(jù)(10檔行情)股票交易日頻數(shù)據(jù)和股票價(jià)格指數(shù)股票交易數(shù)據(jù)基本知識(shí)第6章

股票交易數(shù)據(jù)最主要是兩個(gè)方面:一個(gè)是價(jià),包括成交價(jià)、委托價(jià);一個(gè)是量,包括成交量、委托量;一般地,以日為單位的交易數(shù)據(jù)(統(tǒng)計(jì)當(dāng)天的交易情況,比如開(kāi)盤(pán)價(jià)、最高價(jià)、最低價(jià)、收盤(pán)價(jià)是多少,總成交量又是多少等),主要是成交價(jià)和成交量數(shù)據(jù),沒(méi)有委托價(jià)和量數(shù)據(jù)。以秒、分鐘為單位的交易數(shù)據(jù)(稱(chēng)為高頻數(shù)據(jù)),則更為詳細(xì),不僅包括成交價(jià)、成交量數(shù)據(jù),還包括委托量、委托價(jià)數(shù)據(jù)。股票交易數(shù)據(jù)基本知識(shí)第6章

我們以一個(gè)買(mǎi)賣(mài)白菜的市場(chǎng)為例,形象的解釋這些術(shù)語(yǔ)。為了公平起見(jiàn),我們對(duì)日常的白菜市場(chǎng)制定一些規(guī)則。首先,有賣(mài)白菜的,我們稱(chēng)為供應(yīng)方,或者是賣(mài)方;同樣的,也有買(mǎi)白菜的,我們稱(chēng)為需求方,或者是買(mǎi)方其次,這個(gè)菜市場(chǎng)有一個(gè)開(kāi)放時(shí)間,比如9:15-15:00,其中11:30-13:00休息。為了使買(mǎi)賣(mài)雙方都有一個(gè)公平的價(jià)格,它應(yīng)該由市場(chǎng)決定。9:15-9:25這10分鐘內(nèi),在場(chǎng)的買(mǎi)方都報(bào)出自己需要購(gòu)買(mǎi)的數(shù)量和單價(jià),賣(mài)方也報(bào)出自己能供應(yīng)的數(shù)量及單價(jià)。10分鐘結(jié)束后,不允許再報(bào)了,我們要找到這樣一個(gè)價(jià)格,使得成交量最大化,就是第一筆成交價(jià)格,稱(chēng)為開(kāi)盤(pán)價(jià),這個(gè)過(guò)程稱(chēng)為集合競(jìng)價(jià)。開(kāi)盤(pán)價(jià)是買(mǎi)賣(mài)雙方最早的集體博弈的結(jié)果,比較有意義,為了讓雙方都有一個(gè)短暫的消化時(shí)間,9:25-9:30這5分鐘內(nèi)不交易。9:30開(kāi)始繼續(xù)交易,交易價(jià)格的產(chǎn)生不再是通過(guò)集合競(jìng)價(jià),而是進(jìn)入連續(xù)競(jìng)價(jià)階段。股票交易數(shù)據(jù)基本知識(shí)第6章

連續(xù)競(jìng)價(jià)交易,即買(mǎi)賣(mài)雙方都可以隨時(shí)報(bào)出自己的數(shù)量和單價(jià),但又是如何促成交易的呢?這里有一個(gè)原則,即價(jià)格越優(yōu)的報(bào)單就越排在前面,如果價(jià)格都一樣,則先報(bào)的排在前面,即價(jià)格優(yōu)先、時(shí)間優(yōu)先原則。何為優(yōu)的報(bào)價(jià),對(duì)于買(mǎi)方,越高的報(bào)價(jià)就越優(yōu);對(duì)于賣(mài)方,越低的報(bào)價(jià)越優(yōu);這樣,只要符合買(mǎi)賣(mài)雙方的交易條件,就會(huì)連續(xù)成交,一直持續(xù)到結(jié)束。最后一筆交易的價(jià)格,即為收盤(pán)價(jià)。統(tǒng)計(jì)當(dāng)天所有的交易,價(jià)格最高的即為最高價(jià)、最低的即為最低價(jià)。當(dāng)然,交易也會(huì)產(chǎn)生交易量和交易金額等數(shù)據(jù)。最后,一天交易結(jié)束之后統(tǒng)計(jì)的數(shù)據(jù)稱(chēng)為日頻數(shù)據(jù),一天只有一條記錄,主要指標(biāo)數(shù)據(jù)是當(dāng)天的開(kāi)盤(pán)價(jià)、最高價(jià)、最低價(jià)、收盤(pán)價(jià)、總成交量、總成交金額。如果以秒或分鐘為頻率統(tǒng)計(jì)的數(shù)據(jù),稱(chēng)為高頻數(shù)據(jù),他們主要是統(tǒng)計(jì)截止當(dāng)前時(shí)間和相鄰兩個(gè)時(shí)間點(diǎn)產(chǎn)生的數(shù)據(jù)。高頻數(shù)據(jù)除了成交價(jià)格、成交量和金額之外,還有一些未成交的買(mǎi)賣(mài)雙方委托價(jià)格和委托量數(shù)據(jù)。如果把白菜比喻成股票等證券,白菜市場(chǎng)看成是證券交易所,買(mǎi)方和賣(mài)方看成投資者,產(chǎn)生的數(shù)據(jù)就是股票交易數(shù)據(jù)。股票交易數(shù)據(jù)生產(chǎn)場(chǎng)景第6章

我們可以想象這樣一個(gè)場(chǎng)景,一個(gè)投資者在券商的行情軟件提交委托訂單,而券商的行情軟件是與交易所交易系統(tǒng)聯(lián)網(wǎng)的,從而投資者的委托訂單被送達(dá)交易系統(tǒng),進(jìn)行撮合成交。目前市場(chǎng)上有數(shù)量眾多的投資者、券商和相關(guān)交易所,他們共同構(gòu)成了中國(guó)的證券期貨場(chǎng)內(nèi)交易市場(chǎng)這里有兩個(gè)微觀數(shù)據(jù):一個(gè)是投資者的委托訂單數(shù)據(jù),稱(chēng)為逐筆委托數(shù)據(jù);一個(gè)是交易所系統(tǒng)的成交數(shù)據(jù),稱(chēng)為逐筆成交數(shù)據(jù)。這兩個(gè)數(shù)據(jù)是時(shí)間序列數(shù)據(jù),時(shí)間精確到毫秒,詳細(xì)完整地記錄了每一位投資者每一筆委托訂單信息及交易系統(tǒng)每一筆交易的成交信息。高頻數(shù)據(jù)則是由這兩個(gè)微觀數(shù)據(jù)加工而成股票交易數(shù)據(jù)生產(chǎn)場(chǎng)景第6章

高頻數(shù)據(jù)分為兩種:一種是超高頻數(shù)據(jù),比如以上的逐筆委托數(shù)據(jù)和逐筆成交數(shù)據(jù),這是一類(lèi)比較特殊的高頻數(shù)據(jù);一種是通常意義上的高頻數(shù)據(jù),屬于等間隔取樣(或者等間隔的整數(shù)倍取樣,主要是因?yàn)槿拥臅r(shí)候,沒(méi)有對(duì)應(yīng)的委托數(shù)據(jù)或成交數(shù)據(jù),則順延至下一次取樣,直到取樣成功為止)。這里的取樣,是指截止當(dāng)前時(shí)間,統(tǒng)計(jì)匯總逐筆委托數(shù)據(jù)和逐筆成交數(shù)據(jù)而形成的行情數(shù)據(jù)(或稱(chēng)快照數(shù)據(jù))。匯總統(tǒng)計(jì)過(guò)程是由交易所完成的,我們只需接收交易所發(fā)送的行情數(shù)據(jù)即可。根據(jù)統(tǒng)計(jì)匯總的頻率高低和內(nèi)容的詳細(xì)程度不同,交易所分為基本行情(5檔)和深度行情(10檔和超高頻數(shù)據(jù))兩個(gè)品種。10檔高頻數(shù)據(jù)第6章

靜態(tài)字段:證券代碼、交易日期、昨收盤(pán)價(jià)時(shí)間字段:數(shù)據(jù)生成時(shí)間成交字段:(開(kāi)、高、低、最新)價(jià)、截止當(dāng)前總成交筆數(shù)、分筆期間成交筆數(shù)、

截止當(dāng)前總成交量、分筆期間成交量、截止當(dāng)前總成交額、分筆期間成交額委托字段:賣(mài)委托總量、賣(mài)委托加權(quán)平均價(jià)、委賣(mài)10至委賣(mài)01價(jià)、申賣(mài)量10至申賣(mài)量01、

買(mǎi)委托總量、買(mǎi)委托加權(quán)平均價(jià)、委買(mǎi)01至委買(mǎi)10、委買(mǎi)量01至委買(mǎi)量10.說(shuō)明:數(shù)據(jù)生成時(shí)間,其實(shí)就是統(tǒng)計(jì)截止時(shí)間,假設(shè)數(shù)據(jù)生成時(shí)間是0941.230,這個(gè)時(shí)間通常是某筆交易發(fā)生的時(shí)間,則統(tǒng)計(jì)[0925.000,0941.230]該時(shí)間段內(nèi)逐筆成交數(shù)據(jù)表的成交數(shù)據(jù),形成本條記錄的成交字段數(shù)據(jù),同時(shí)再統(tǒng)計(jì)[0915,0941.230]該時(shí)間段內(nèi)有效的逐筆委托數(shù)據(jù)(不包括撤單的記錄),形成本條記錄的委托字段數(shù)據(jù)。換言之,成交字段數(shù)據(jù),就是截止0941.230該時(shí)間點(diǎn),已經(jīng)成交的事實(shí),而委托字段數(shù)據(jù)則是可供選擇的有望在下一刻成交的總量和可能獲得的價(jià)格,為推斷未來(lái)成交情況提供基礎(chǔ)數(shù)據(jù)。10檔高頻數(shù)據(jù)第6章

10檔高頻數(shù)據(jù)第6章

10檔高頻數(shù)據(jù)第6章

10檔高頻數(shù)據(jù)第6章

以093013100這個(gè)數(shù)據(jù)生產(chǎn)時(shí)間的記錄為例,它表示的是平安銀行(代碼:000001)在20130301交易日(TRDDATE)內(nèi),截止093013100當(dāng)前時(shí)間(DATATIME)的最高成交價(jià)(HIGHPX)為22.930最低成交價(jià)(LOWPX)為22.820最近一次交易的價(jià)格(最新價(jià),LASTPX)為22.880,累計(jì)發(fā)生的總成交量(TOTALVOLUME)為1889900分筆期間的成交量(與上一條記錄之間的時(shí)間間隔發(fā)生的交易量,CQ)為10400可供購(gòu)買(mǎi)的總量(即賣(mài)方的總供應(yīng)量,TOTALOFFERQTY)為6470952其中賣(mài)方提供的最低價(jià)格(S01)為22.900賣(mài)方提供的最低價(jià)位上的供應(yīng)量(SV01)為372617……日頻數(shù)據(jù)第6章

日頻交易數(shù)據(jù),主要是統(tǒng)計(jì)當(dāng)天交易情況的數(shù)據(jù),上一節(jié)也提到,高頻交易10檔行情數(shù)據(jù)表最后一條記錄數(shù)據(jù)就是日頻交易數(shù)據(jù)的來(lái)源,字段包括股票代碼、交易日期、收盤(pán)價(jià)、成交量、成交金額、開(kāi)盤(pán)價(jià)、最高價(jià)、最低價(jià)等。StkcdTrddtClsprcDnshrtrdDnvaltrdOpnprcHiprcLoprcAdjprcwdAdjprcnd3000152017-05-1532.883314184107995576.532.432.8832.35244.9883236.32463000152017-05-1633.8474677915804871132.833.8832.5251.8433242.93713000152017-05-1733.31373243012511258333.5733.933.26248.1923239.41523000152017-05-1822.235758990128095499.322.0622.4921.89249.7941239.66663000152017-05-1922.46449048145514093.822.2722.9522.02251.7044241.49943000152017-05-2222.574798200107396565.522.4622.8522253.6146243.3322……………………………………………………由于分紅送股轉(zhuǎn)增股等行為,正常的收盤(pán)價(jià)是不具可比性的,基于投資者權(quán)益不變的原則(假設(shè)投資者在除權(quán)之前購(gòu)買(mǎi)了股票或者是一位長(zhǎng)期投資者,公司的送股、轉(zhuǎn)增股和分紅等權(quán)益均享有,即個(gè)人的資產(chǎn)權(quán)益不發(fā)生變化),需要對(duì)這個(gè)收盤(pán)價(jià)做出調(diào)整,于是衍生出了常見(jiàn)的兩個(gè)指標(biāo):考慮現(xiàn)金紅利再投資的收盤(pán)價(jià)可比價(jià)和不考慮現(xiàn)金紅利再投資的收盤(pán)價(jià)可比價(jià)股票價(jià)格指數(shù)第6章

股票價(jià)格指數(shù),反映多只股票或股票投資組合整體趨勢(shì)的指標(biāo),比如:反映上海證券交易所A股整體趨勢(shì)的上證A股指數(shù);反映深圳證券交易所A股主板、中小板和創(chuàng)業(yè)板各板塊整體趨勢(shì)的深證主板指數(shù)、中小板指數(shù)和創(chuàng)業(yè)板指數(shù);反映中國(guó)大陸A股市場(chǎng)整體趨勢(shì)的滬深300指數(shù)(從上海、深圳兩個(gè)證券交易所選取具有代表性的300只股票作為樣本進(jìn)行計(jì)算)。事實(shí)上,股票價(jià)格指數(shù)屬于衍生性指標(biāo),其基礎(chǔ)數(shù)據(jù)是個(gè)股交易數(shù)據(jù),其計(jì)算公式為:股票價(jià)格指數(shù)=指數(shù)所包含的股票總市值/指數(shù)所包含的股票基準(zhǔn)日總市值。這里的總市值一般為調(diào)整性總市值,即根據(jù)不同的規(guī)則約束和調(diào)整機(jī)制,選擇個(gè)股范圍,并對(duì)參與計(jì)算的個(gè)股賦予不同的權(quán)重。股票價(jià)格指數(shù)第6章

為了方便理解,我們基于深圳創(chuàng)業(yè)板的所有股票2017年個(gè)股交易數(shù)據(jù),自建一個(gè)指數(shù)。StkcdTrddtClsprcDnshrtrdDnvaltrdOpnprcHiprcLoprc3000012017-01-0317.428140604898570217.3617.5217.343000012017-01-0417.7548001088465166217.4117.8917.333000012017-01-0517.6533944986008666217.7517.8617.613000012017-01-0617.4130020605243240417.6417.6617.383000012017-01-0917.4424145834205844017.3717.5417.313000012017-01-1017.3520724093604314717.3917.4717.323000012017-01-1117.6877575881.37E+0817.3518.1617.123000012017-01-1218.05107386841.93E+0817.6918.1417.453000012017-01-1317.4158797771.05E+0817.9618.117.4…………………………………………字段依次表示股票代碼、交易日期、收盤(pán)價(jià)、交易量、交易金額、開(kāi)盤(pán)價(jià)、最高價(jià)和最低價(jià)。股票價(jià)格指數(shù)第6章

以2017年第一個(gè)交易日(2017-01-03)為基準(zhǔn)日,基點(diǎn)設(shè)為1000點(diǎn),其計(jì)算公式為:每日總市值/基準(zhǔn)日總市值*1000,進(jìn)一步地,我們還將其指數(shù)趨勢(shì)圖繪制出來(lái)importpandasaspdimportmatplotlib.pyplotaspltimportnumpyasnpplt.rcParams['font.sans-serif']='SimHei'df=pd.read_excel('創(chuàng)業(yè)板2017年個(gè)股交易數(shù)據(jù).xlsx')df1=df.groupby(['Trddt'])['Dnvaltrd'].sum()#分組統(tǒng)計(jì)每日總市值index=df1.values/df1.values[0]*1000#計(jì)算指數(shù)x=np.array(range(len(df1)))plt.figure(figsize=(8,6))plt.plot(x,index)plt.xticks(x[0:len(x):40],df1.index[0:len(x):40],rotation=45)plt.ylabel('指數(shù)')plt.title('2017年創(chuàng)業(yè)板自建指數(shù)走勢(shì)圖')plt.savefig('2017年創(chuàng)業(yè)板自建指數(shù)走勢(shì)圖')第7章

基礎(chǔ)案例案例介紹周最小最大交易日獲取股票價(jià)格指數(shù)周收益率計(jì)算案例介紹第7章

計(jì)算上證A股指數(shù)(代碼:000002)2017年的周收益率。周收益率=(周最大交易日收盤(pán)指數(shù)?周最小交易日收盤(pán)指數(shù))/周最小交易日收盤(pán)指數(shù)本案例使用了交易日歷表和指數(shù)日交易數(shù)據(jù)表MarkettypeClddtDaywkState12017-01-032O12017-01-043O12017-01-054O12017-01-065O12017-01-091O12017-01-102O12017-01-113O12017-01-124O12017-01-135O……………………IndexcdIdxtrd01Idxtrd050000022017-01-033283.450000022017-01-043307.450000022017-01-053314.390000022017-01-063302.790000022017-01-093320.530000022017-01-103310.490000022017-01-113284.370000022017-01-123266.040000022017-01-133259.27………………周最小和最大交易日獲取第7章

由于我們獲取的數(shù)據(jù)為日行情交易數(shù)據(jù),無(wú)法直接計(jì)算周收益率,需要對(duì)交易日歷數(shù)據(jù)進(jìn)行處理,即找出每周的最大交易日和最小交易日。從交易日歷表的星期(Daywk)字段可以看出,當(dāng)前星期值比下一個(gè)星期值大,其對(duì)應(yīng)的交易日即為本周的最大交易日,下一個(gè)星期值對(duì)應(yīng)的交易日即為下周的最小交易日。算法如下:輸入:交易日歷數(shù)據(jù)表date。輸出:周最小交易日和最大交易日列表list1和list2。Step1:定義空的列表list1和list2,將交易日歷表中的首個(gè)交易日添加到list1中。Step2:從第2個(gè)交易日開(kāi)始至倒數(shù)第2個(gè)交易日,如果其星期值大于下一個(gè)交易日的星期值,

則將其交易日添加到list2中,下一個(gè)交易日添加到list1中。Step3:將最后的交易日添加到list2中。周最小和最大交易日獲取第7章

importpandasaspdx=pd.read_excel('TRD_Cale.xlsx')list1=['2017-01-03']list2=[]fortinrange(1,len(x)-1):p=x.iloc[t-1,[2]][0]q=x.iloc[t,[2]][0]ifq<p:list1.append(x.iloc[t,[1]][0])list2.append(x.iloc[t-1,[1]][0])list2.append('2017-12-29')周收益率計(jì)算第7章

獲得每周的最小交易日列表list1和最大交易日列表list2后,可以通過(guò)循環(huán)的方式,依次取最大交易日和最小交易日對(duì)應(yīng)的收盤(pán)指數(shù),利用前面介紹的公式計(jì)算即可獲得周收益率指標(biāo)數(shù)據(jù)。data=pd.read_excel('IDX_Idxtrd.xlsx')importnumpyasnpr=np.zeros(len(list1))foriinrange(len(list1)):p1=data.loc[data['Idxtrd01'].values==list1[i],'Idxtrd05'].valuesp2=data.loc[data['Idxtrd01'].values==list2[i],'Idxtrd05'].valuesr[i]=(p2-p1)/p1第0周的最大交易日2017年1月6日對(duì)應(yīng)的收盤(pán)指數(shù)3302.76,減去第0周最小交易日2017年1月3日對(duì)應(yīng)的收盤(pán)指數(shù)3283.45,再除以第0周最小交易日2017年1月3日對(duì)應(yīng)的收盤(pán)指數(shù)3283.45,就可以得到周收益率指標(biāo)數(shù)據(jù)為:0.00589015。周收益率計(jì)算第7章

importpandasaspdA=pd.read_excel('IDX_Idxtrd.xlsx')A['Idxtrd01']=pd.to_datetime(A.iloc[:,1])A['month']=A['Idxtrd01'].dt.monthA['week']=A['Idxtrd01'].dt.isocalendar().weekA_w=A.iloc[:,[2,4]]A_m=A.iloc[:,[2,3]]p1=A_w.groupby(['week'])['Idxtrd05'].first().valuesp2=A_w.groupby(['week'])['Idxtrd05'].last().valuesw_r=(p2-p1)/p1可參考第3章中的時(shí)間元素提取和分組統(tǒng)計(jì)方法進(jìn)行計(jì)算,其方法更加簡(jiǎn)潔,但是結(jié)果可能存在一些差異。第7章

基礎(chǔ)案例案例介紹指標(biāo)計(jì)算案例介紹第7章

找出“計(jì)算機(jī)、通信和其他電子設(shè)備制造業(yè)”所有上市公司2015年~2017年連續(xù)3年凈利潤(rùn)增長(zhǎng)率都在40%以上的公司。當(dāng)期凈利潤(rùn)增長(zhǎng)率=(當(dāng)期凈利潤(rùn)?上期凈利潤(rùn))/上期凈利潤(rùn)。本案例使用的數(shù)據(jù)表包括:計(jì)算機(jī)、通信和其他電子設(shè)備制造業(yè)公司利潤(rùn)表和股票行業(yè)基本信息表StkcdAccperB0020001010000162014-12-3152623527.860000162015-12-31-12568193150000162016-12-3195673028.030000162017-12-3150570251560000202014-12-317687620.270000202015-12-31-4200845.61………………StkcdStknmeNnindnmae000016深康佳A計(jì)算機(jī)、通信和其他電子設(shè)備制造業(yè)000020深華發(fā)A計(jì)算機(jī)、通信和其他電子設(shè)備制造業(yè)000021深科技計(jì)算機(jī)、通信和其他電子設(shè)備制造業(yè)000045深紡織A計(jì)算機(jī)、通信和其他電子設(shè)備制造業(yè)000050深天馬A計(jì)算機(jī)、通信和其他電子設(shè)備制造業(yè)000063中興通訊計(jì)算機(jī)、通信和其他電子設(shè)備制造業(yè)000066中國(guó)長(zhǎng)城計(jì)算機(jī)、通信和其他電子設(shè)備制造業(yè)000068華控賽格計(jì)算機(jī)、通信和其他電子設(shè)備制造業(yè)………………指標(biāo)計(jì)算第7章

上市公司凈利潤(rùn)增長(zhǎng)率指標(biāo)計(jì)算的基本思路如下:首先需要選擇滿足2014年~2017年都存在利潤(rùn)數(shù)據(jù)的上市公司,不滿足條件的刪除。其方法是將data2.xlsx中的Stkcd列轉(zhuǎn)化為序列,采用值統(tǒng)計(jì)函數(shù)value_counts()即可實(shí)現(xiàn)篩選。其次對(duì)滿足條件的股票代碼,采用循環(huán)的方式,依次取得4年的凈利潤(rùn)數(shù)據(jù),將其轉(zhuǎn)化為Numpy數(shù)據(jù)組的形式,假設(shè)記為d,則3年的凈利潤(rùn)增長(zhǎng)率=(d[1:]-d[0:-1])/d[0:-1]。最后將結(jié)果整理為數(shù)據(jù)框的形式展現(xiàn)出來(lái)。指標(biāo)計(jì)算第7章

#1.數(shù)據(jù)準(zhǔn)備importpandasaspddt=pd.read_excel('data2.xlsx')code=dt['Stkcd'].value_counts()code=list(code[code==4].index)info=pd.read_excel('info.xlsx')S=pd.Series(info.iloc[:,1].values,index=info.iloc[:,0].values)#2.預(yù)定義列表,用于存放各年的凈利潤(rùn)增長(zhǎng)率,并賦值計(jì)算list1=[]list2=[]list3=[]list4=[]fortinrange(len(code)):d=dt.iloc[dt.iloc[:,0].values==code[t],2].values

r=(d[1:]-d[0:-1])/d[0:-1]iflen(r[r>0.4])==3:list1.append(S[code[t]])list2.append(r[0])list3.append(r[1])list4.append(r[2])#3.結(jié)果轉(zhuǎn)換為數(shù)據(jù)框D={'2015':list2,'2016':list3,'2017':list4}D=pd.DataFrame(D,index=list1)第7章

基礎(chǔ)案例案例介紹繪圖數(shù)據(jù)計(jì)算繪圖及圖形保存案例介紹第7章

本案例主要介紹股票日收盤(pán)價(jià)格、成交量的走勢(shì)圖以及月交易量分布餅圖的繪制技能,并進(jìn)一步介紹了子圖的繪制方法。股票代碼交易日期收盤(pán)價(jià)交易量6000002017-01-0316.3162371256000002017-01-0416.33296587346000002017-01-0516.3264376466000002017-01-0616.18171955986000002017-01-0916.2149087456000002017-01-1016.1979967566000002017-01-1116.169193332……………………(1)繪制股票代碼600000日期為2017年1月3日—2017年1月20日的收盤(pán)價(jià)格走勢(shì)圖。(2)繪制股票代碼600000日期為2017年1月3日—2017年1月24日的交易量柱狀圖。(3)計(jì)算股票代碼600000,2017年1月—11月的交易量,并繪制其餅圖。(4)將以上的價(jià)格走勢(shì)圖、柱狀圖、餅圖在同一個(gè)figure上以子圖的形式繪制出來(lái)。任務(wù)如下:繪圖數(shù)據(jù)計(jì)算第7章

importpandasaspdimportnumpyasnpimportmatplotlib.pyplotaspltdata=pd.read_excel('trd.xlsx')dt=data.loc[data['股票代碼']==600000,['交易日期','收盤(pán)價(jià)','交易量']]I1=dt['交易日期'].values>='2017-01-03'I2=dt['交易日期'].values<='2017-01-20'dta=dt.iloc[I1&I2,:]y1=dta['收盤(pán)價(jià)']x1=range(len(y1))I3=dt['交易日期'].values>='2017-01-03'I4=dt['交易日期'].values<='2017-01-24'dta=dt.iloc[I3&I4,:]y2=dta['交易量']x2=range(len(y2))D=np.zeros((11))list1=list()forminrange(11):m=m+1ifm<10:m1='2017-0'+str(m)+'-01'm2='2017-0'+str(m)+'-31'mon='0'+str(m)else:m1='2017-'+str(m)+'-01'm2='2017-'+str(m)+'-31'mon=str(m)I1=dt['交易日期'].values>=m1I2=dt['交易日期'].values<=m2D[m-1]=dt.iloc[I1&I2,[2]].sum()[0]list1.append(mon)繪圖及圖形保存第7章

1.股票價(jià)格走勢(shì)圖繪制plt.figure(1)plt.plot(x1,y1)plt.xlabel(u'日期',fontproperties='SimHei')plt.ylabel(u'收盤(pán)價(jià)',fontproperties='SimHei')plt.title(u'收盤(pán)價(jià)走勢(shì)圖',fontproperties='SimHei')plt.savefig('1')繪圖及圖形保存第7章

2.交易量分布柱狀圖plt.figure(2)plt.bar(x2,y2)plt.xlabel(u'日期',fontproperties='SimHei')plt.ylabel(u'交易量',fontproperties='SimHei')plt.title(u'交易量趨勢(shì)圖',fontproperties='SimHei')plt.savefig('2')繪圖及圖形保存第7章

3.月交易量分布餅圖plt.figure(3)plt.pie(D,labels=list1,autopct='%1.2f%%')#保留小數(shù)點(diǎn)后兩位plt.title(u'月交易量分布圖',fontproperties='SimHei')plt.savefig('3')繪圖及圖形保存第7章

4.收盤(pán)價(jià)走勢(shì)圖、交易量分布圖和月交易量餅圖組成的3×1子圖plt.figure(4)plt.figure(figsize=(14,6))plt.subplot(1,3,1)plt.plot(x1,y1)plt.xlabel(u'日期',fontproperties='SimHei')plt.ylabel(u'收盤(pán)價(jià)',fontproperties='SimHei')plt.title(u'收盤(pán)價(jià)走勢(shì)圖',fontproperties='SimHei')plt.subplot(1,3,2)plt.bar(x2,y2)plt.xlabel(u'日期',fontproperties='SimHei')plt.ylabel(u'交易量',fontproperties='SimHei')plt.title(u'交易量趨勢(shì)圖',fontproperties='SimHei')plt.subplot(1,3,3)plt.pie(D,labels=list1,autopct='%1.2f%%')#保留小數(shù)點(diǎn)后兩位plt.title(u'月交易量分布圖',fontproperties='SimHei')plt.savefig('4')第7章

基礎(chǔ)案例案例介紹圖像繪制案例介紹第7章

今有中小板股票002001~002020共20個(gè),以及2016年5月1日—2016年8月1日的交易數(shù)據(jù)StkcdTrddtClsprc0020012016-05-0320.990020012016-05-0420.420020012016-05-0520.490020012016-05-0618.70020012016-05-0918.670020012016-05-1019.07………………其中字段依次表示股票代碼、交易日期、收盤(pán)價(jià)。任務(wù)如下:(1)計(jì)算每只股票10日移動(dòng)平均收盤(pán)價(jià)格數(shù)據(jù)。(2)繪制每只股票收盤(pán)價(jià)走勢(shì)圖和移動(dòng)平均收盤(pán)價(jià)走勢(shì)圖,并用子圖的形式表示出來(lái)。案例介紹第7章

說(shuō)明:每個(gè)figure按照2×2劃分,即每個(gè)figure繪制4只股票的收盤(pán)價(jià)走勢(shì)圖和移動(dòng)平均價(jià)格走勢(shì)圖,20只股票則需要5個(gè)figure,使用循環(huán)的方式實(shí)現(xiàn)。提示:可以考慮使用Python中的取余運(yùn)算來(lái)實(shí)現(xiàn),取余符號(hào)為%,例如:0%4=01%4=12%4=23%4=34%4=05%4=16%4=27%4=38%4=09%4=1……凡是取余為0的時(shí)候都需要?jiǎng)?chuàng)建一個(gè)figure,在這個(gè)figure中繪制4個(gè)子圖。圖形繪制第7章

importpandasaspdimportnumpyasnpimportmatplotlib.pyplotasplttrd=pd.read_excel('trd.xlsx')#獲取股票代碼,并轉(zhuǎn)化為列表的形式c=trd['Stkcd'].value_counts()code=list(c.index)#動(dòng)態(tài)計(jì)算需要q個(gè)figure,#其中每個(gè)figure繪制4個(gè)子圖,每個(gè)子圖代表一個(gè)股票#初始值設(shè)置q=0q=0#循環(huán)對(duì)每一個(gè)股票繪制其圖形foriinrange(20):

#第i個(gè)股票的收盤(pán)價(jià)記為p,并計(jì)算其移動(dòng)平均價(jià)

#構(gòu)造繪圖的橫軸和縱軸坐標(biāo)值

p=trd.loc[trd['Stkcd'].values==code[i],'Clsprc']

avg_p=p.rolling(10).mean()

x1=np.arange(0,len(p))

y1=p.values

y2=avg_p[9:]

x2=np.arange(9,len(p))

#如果i與4整除,代表需要重新建一個(gè)figure(每個(gè)figure有4個(gè)子圖)

ifi%4==0:

q=q+1

plt.figure(q)

plt.figure(figsize=(8,6))

plt.subplot(2,2,i%4+1)

plt.tight_layout()#用于設(shè)置圖像外部邊緣自動(dòng)調(diào)整

plt.plot(x1,y1)

plt.plot(x2,y2)

plt.savefig(str(q))圖形繪制第7章

第7章

基礎(chǔ)案例案例介紹指標(biāo)計(jì)算模型求解案例介紹第7章

滬深300指數(shù)作為中國(guó)股票價(jià)格指數(shù)的代表,也是中國(guó)股指期貨的標(biāo)的指數(shù),對(duì)其走勢(shì)預(yù)測(cè)具有積極的現(xiàn)實(shí)意義與應(yīng)用價(jià)值。今有滬深300指數(shù)2014年的交易數(shù)據(jù)。IndexcdIdxtrd01Idxtrd02Idxtrd03Idxtrd04Idxtrd05Idxtrd060003002014-01-022323.432325.992310.652321.98451942.90003002014-01-032311.972314.842280.892290.78597826.50003002014-01-062286.372286.372229.332238.646630040003002014-01-072222.312246.792218.6522384375310003002014-01-082240.642262.582228.422241.91513488.50003002014-01-092236.972258.892220.82222.22559870.40003002014-01-102216.522224.492200.222204.85541692.90003002014-01-1322072222.072183.62193.68501227.70003002014-01-142192.842214.122179.912212.85540499.50003002014-01-152210.022215.92193.82208.94489624……………………………………字段依次表示指數(shù)代碼、交易日期、開(kāi)盤(pán)價(jià)、最高價(jià)、最低價(jià)、收盤(pán)價(jià)、成交量。案例介紹第7章

計(jì)算如下指標(biāo):A1(收盤(pán)價(jià)/均價(jià)):收盤(pán)價(jià)/過(guò)去10個(gè)交易日的移動(dòng)平均收盤(pán)價(jià)。A2(現(xiàn)量/均量):成交量/過(guò)去10個(gè)交易日的移動(dòng)平均成交量。A3(收益率):(當(dāng)日收盤(pán)價(jià)?前日收盤(pán)價(jià))/前日收盤(pán)價(jià)。A4(最高價(jià)/均價(jià)):最高價(jià)/過(guò)去10個(gè)交易日的移動(dòng)均平均收盤(pán)價(jià)。A5(最低價(jià)/均價(jià)):最低價(jià)/過(guò)去10個(gè)交易日的移動(dòng)平均收盤(pán)價(jià)。A6(極差):最高價(jià)?最低價(jià)(衡量波動(dòng)性)。A7(瞬時(shí)收益):收盤(pán)價(jià)?開(kāi)盤(pán)價(jià)。Y(決策變量):后交易日收盤(pán)價(jià)?當(dāng)前交易日收盤(pán)價(jià),如果大于0,記為1;如果小于等于0,記為?1。同時(shí)對(duì)指標(biāo)A1~A7做標(biāo)準(zhǔn)化處理:(當(dāng)前值?均值)/標(biāo)準(zhǔn)差,最終得到以下標(biāo)準(zhǔn)的數(shù)據(jù)結(jié)構(gòu)形式。IDA1A2A3A4A5A6A7Y123……取后30行數(shù)據(jù)作為測(cè)試樣本,剩下的數(shù)據(jù)作為訓(xùn)練樣本,分別利用神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、邏輯回歸模型進(jìn)行訓(xùn)練及測(cè)試,獲得對(duì)應(yīng)模型的準(zhǔn)確率和預(yù)測(cè)準(zhǔn)確率。指標(biāo)計(jì)算第7章

1.計(jì)算特征指標(biāo)X,即A1~A7importpandasaspdtd=pd.read_excel('index300.xlsx')A1=td['Idxtrd05']/td['Idxtrd05'].rolling(10).mean()A2=td['Idxtrd06']/td['Idxtrd06'].rolling(10).mean()A3=td['Idxtrd08']A4=td['Idxtrd03']/td['Idxtrd05'].rolling(10).mean()A5=td['Idxtrd04']/td['Idxtrd05'].rolling(10).mean()A6=td['Idxtrd03']-td['Idxtrd04']A7=td['Idxtrd05']-td['Idxtrd02']X={'A1':A1,'A2':A2,'A3':A3,'A4':A4,'A5':A5,'A6':A6,

'A7':A7}X=pd.DataFrame(X)X=X.iloc[9:-1,]#注意X從第10行數(shù)據(jù)開(kāi)始,至倒數(shù)第1行指標(biāo)計(jì)算第7章

2.計(jì)算決策變量Y#錯(cuò)位相減,獲得指數(shù)的漲跌額,即收盤(pán)指數(shù)序列中的第2個(gè)元素至最后一個(gè)元素對(duì)應(yīng)減去第1個(gè)元素至倒數(shù)第1個(gè)元素Y=td['Idxtrd05'].values[1:]-td['Idxtrd05'].values[:-1]#Y與X的下一個(gè)交易日對(duì)應(yīng),故Y的值從第11行數(shù)據(jù)開(kāi)始#由于錯(cuò)位相減是從第2行開(kāi)始的,故指標(biāo)從第10行開(kāi)始取Y=Y[9:]#走勢(shì)標(biāo)識(shí)設(shè)置Y[Y>0]=1Y[Y<=0]=-1#對(duì)應(yīng)的Y值Y=Y.reshape(len(Y),1)模型求解第7章

1.訓(xùn)練樣本與測(cè)試樣本的劃分x_train=X.iloc[:len(X)-30,:]Y_train=Y[:len(Y)-30]x_test=X.iloc[len(X)-30:,:]Y_test=Y[len(Y)-30:]2.模型訓(xùn)練與求解#支持向量機(jī)模型fromsklearnimportsvmclf=svm.SVC(kernel='rbf')clf.fit(x_train,Y_train)rv1=clf.score(x_train,Y_train);R=clf.predict(x_test)R=R.reshape(len(R),1)Z=R-Y_testRs1=len(Z[Z==0])/len(Z)第7章

基礎(chǔ)案例案例介紹案例分析及計(jì)算案例介紹第7章

以申萬(wàn)行業(yè)分類(lèi)表中“計(jì)算機(jī)”行業(yè)所有上市公司2015年的盈利能力指標(biāo)數(shù)據(jù)為基礎(chǔ)字段名稱(chēng)指標(biāo)名稱(chēng)說(shuō)明F050502B凈資產(chǎn)收益率B凈利潤(rùn)/股東權(quán)益平均余額(X1)F050102B資產(chǎn)報(bào)酬率B(利潤(rùn)總額+財(cái)務(wù)費(fèi)用)/平均資產(chǎn)總額(X2)F050202B總資產(chǎn)凈利潤(rùn)率B凈利潤(rùn)/總資產(chǎn)平均余額(X3)F051201B投入資本回報(bào)率(凈利潤(rùn)+財(cái)務(wù)費(fèi)用)/(資產(chǎn)總計(jì)?流動(dòng)負(fù)債+應(yīng)付票據(jù)+短期借款+一年內(nèi)到期的非流動(dòng)負(fù)債)(X4)F051501B營(yíng)業(yè)凈利率凈利潤(rùn)/營(yíng)業(yè)收入(X5)F053301B營(yíng)業(yè)毛利率(營(yíng)業(yè)收入?營(yíng)業(yè)成本)/營(yíng)業(yè)收入(X6)F051401B營(yíng)業(yè)利潤(rùn)率營(yíng)業(yè)利潤(rùn)/營(yíng)業(yè)收入(X7)F052101B成本費(fèi)用利潤(rùn)率(利潤(rùn)總額)/(營(yíng)業(yè)成本+銷(xiāo)售費(fèi)用+管理費(fèi)用+財(cái)務(wù)費(fèi)用)(X8)采用K-均值聚類(lèi)算法,將上市公司分為5類(lèi),并計(jì)算每類(lèi)公司當(dāng)年的總利潤(rùn)平均增長(zhǎng)率每類(lèi)公司當(dāng)年的總利潤(rùn)平均增長(zhǎng)率=(該類(lèi)公司當(dāng)年的總利潤(rùn)平均值-該類(lèi)公司上年的總利潤(rùn)平均值)/該類(lèi)公司上年的總利潤(rùn)平均值。每類(lèi)公司當(dāng)年的總利潤(rùn)平均值=(該類(lèi)別中所有公司當(dāng)年利潤(rùn)之和)/該類(lèi)別的公司數(shù)量案例分析及計(jì)算第7章

1.獲取2015年所有公司股票的財(cái)務(wù)指標(biāo)數(shù)據(jù)importpandasaspdimportnumpyasnpdata=pd.read_excel('財(cái)務(wù)指標(biāo)數(shù)據(jù).xlsx')data2=data.iloc[:,[0,2,3,4,5,6,7,8,9]]案例分析及計(jì)算第7章

2.對(duì)財(cái)務(wù)指標(biāo)數(shù)據(jù)進(jìn)行清洗#去掉小于0的指標(biāo)值和nan值data2=data2[data2>0]data2=data2.dropna()3.對(duì)財(cái)務(wù)指標(biāo)數(shù)據(jù)進(jìn)行異常值處理#數(shù)據(jù)轉(zhuǎn)化為Numpy數(shù)組的形式,同時(shí)每個(gè)大于其均值8倍的指標(biāo)視為異常值,并刪掉data2=data2.valuesforiinrange(1,9):data2=data2[data2[:,i]<8*np.mean(data2[:,i]),:]案例分析及計(jì)算第7章

4.選擇“計(jì)算機(jī)”行業(yè)所有上市公司的數(shù)據(jù)(本步驟可以通過(guò)內(nèi)連接關(guān)聯(lián)獲?。念A(yù)處理過(guò)的財(cái)務(wù)指標(biāo)數(shù)據(jù)中選擇申萬(wàn)行業(yè)分類(lèi)表中“計(jì)算機(jī)”行業(yè)所有上市公司的數(shù)據(jù)。其處理過(guò)程分兩步。(1)獲取申萬(wàn)行業(yè)分類(lèi)表中“計(jì)算機(jī)”行業(yè)所有上市公司的股票代碼。

dta=pd.read_excel('申萬(wàn)行業(yè)分類(lèi).xlsx')

#申萬(wàn)行業(yè)分類(lèi)表中“計(jì)算機(jī)”行業(yè)所有上市公司股票代碼

stkcd=dta.loc[dta['行業(yè)名稱(chēng)'].values=='計(jì)算機(jī)','股票代碼'].values案例分析及計(jì)算第7章

4.選擇“計(jì)算機(jī)”行業(yè)所有上市公司的數(shù)據(jù)執(zhí)行算法如下:Step1:獲取預(yù)處理過(guò)的財(cái)務(wù)指標(biāo)數(shù)據(jù)data2中的所有代碼,s=data2[:,0]。Step2:s循環(huán)地與申萬(wàn)行業(yè)分類(lèi)表中“計(jì)算機(jī)”行業(yè)所有上市公司股票代碼stkcd做存在性判斷。Step3:得到滿足判斷條件的邏輯數(shù)組I,以I作為邏輯索引,取data2表中的元素即可。s=data2[:,0]I=s==stkcd[0]foriinrange(1,len(stkcd)):I1=s==stkcd[i]I=I|I1ddata=data2[I,:]#申萬(wàn)行業(yè)分類(lèi)表中“計(jì)算機(jī)”行業(yè)所有上市公司股票代碼對(duì)應(yīng)的財(cái)務(wù)數(shù)據(jù)#提取申萬(wàn)行業(yè)分類(lèi)表中“計(jì)算機(jī)”行業(yè)所有上市公司股票碼對(duì)應(yīng)的財(cái)務(wù)指標(biāo)數(shù)據(jù)X,用來(lái)做主成分分析。X=ddata[:,1:](2)從預(yù)處理過(guò)的財(cái)務(wù)指標(biāo)數(shù)據(jù)中選擇滿足條件的數(shù)據(jù)。案例分析及計(jì)算第7章

5.對(duì)指標(biāo)數(shù)據(jù)X做標(biāo)準(zhǔn)化處理#這里采用極差法進(jìn)行標(biāo)準(zhǔn)化。fromsklearn.preprocessingimportMinMaxScalerscaler=MinMaxScaler()scaler.fit(X)X=scaler.transform(X)6.對(duì)標(biāo)準(zhǔn)化后的X做主成分分析fromsklearn.decompositionimportPCApca=PCA(n_components=0.95)#累計(jì)貢獻(xiàn)率為95%Y=pca.fit_transform(X)#提取的主成分tzxl=ponents_#返回特征向量gxl=pca.explained_variance_ratio_#返回主成分方差百分比(貢獻(xiàn)率)#對(duì)主成分Y做標(biāo)準(zhǔn)化處理(極差法)scaler=MinMaxScaler()scaler.fit(Y)Y=scaler.transform(Y)案例分析及計(jì)算第7章

Y1=0.3583×X1+0.3777×X2+0.4025×X3+0.4337×X4+0.375×X5+0.2696×X6+0.3205×X7+0.2508×X8Y2=0.3593×X1+0.1897×X2+0.1434×X4+0.4053×X4?0.3458×X5?0.658×X6?0.2331×X7?0.2076×X8Y3=0.0673×X1+0.0213×X2?0.0006×X3+0.32×X4?0.3328×X5+0.6801×X6?0.4713×X7?0.3118×X8Y1-綜合盈利能力因子;Y2-產(chǎn)品競(jìng)爭(zhēng)力因子;Y3-管理能力因子案例分析及計(jì)算第7章

7.K-均值聚類(lèi)分析fromsklearn.clusterimportKMeansmodel=KMeans(n_clusters=5,random_state=0,max_iter=1000)model.fit(Y)c=model.labels_#類(lèi)標(biāo)簽center=model.cluster_centers_#聚類(lèi)中心center=pd.DataFrame(center)center.columns=['Y1','Y2','Y3']案例分析及計(jì)算第7章

7.K-均值聚類(lèi)分析Fs=pd.Series(c,index=ddata[:,0])Fs=Fs.sort_values()co=pd.read_excel('公司基本信息表.xlsx')co1=pd.Series(co['Stknme'].values,index=co['Stkcd'].values)foriinrange(5):

q=co1[Fs[Fs==i].index]

q=pd.DataFrame(q)

q.to_excel('c'+str(i)+'.xlsx')類(lèi)別股票代碼0科遠(yuǎn)股份、合眾思?jí)?、易?lián)眾、初靈信息、數(shù)碼科技、御銀股份、長(zhǎng)亮科技、新國(guó)都、安碩信息、匯金股份、北信源、創(chuàng)業(yè)軟件、華平股份、久其軟件、華力創(chuàng)通、銀之杰、方直科技、美亞柏科、榕基軟件、東方通、英飛拓、新北洋、旋極信息、中威電子、科大訊飛、迪威迅、威創(chuàng)股份、新開(kāi)普、立思辰、任子行、輝煌科技、天璣科技、遠(yuǎn)光軟件1運(yùn)達(dá)科技、朗瑪信息、華銘智能、東方國(guó)信、捷成股份、兆日科技、二三四五、康拓紅外、聯(lián)絡(luò)互動(dòng)、思維列控、拓爾思、東方網(wǎng)力、世紀(jì)瑞爾2深科技、中科金財(cái)、太極股份、常山北明、浩豐科技、潤(rùn)和軟件、航天長(zhǎng)峰、高偉達(dá)、證通電子、川大智勝、寶信軟件、南天信息、皖通科技、金財(cái)互聯(lián)、四方精創(chuàng)、神州泰岳、萬(wàn)達(dá)信息、云賽智聯(lián)、索菱股份、飛利信、方正科技、京天利、同有科技、漢鼎宇佑、創(chuàng)意信息、達(dá)實(shí)智能、數(shù)字政通、達(dá)華智能、千方科技、紫光股份、漢邦高科、易華錄、石基信息、榮之聯(lián)、中遠(yuǎn)???、天源迪科、華勝天成、海蘭信、朗科科技、東軟集團(tuán)、榮科科技、同方股份、賽為智能、南威軟件、*ST中安3博彥科技、中科創(chuàng)達(dá)、久遠(yuǎn)銀海、金橋信息、華東電腦、華宇軟件、藍(lán)盾股份、浙大網(wǎng)新、浪潮軟件、真視通、捷順科技、航天信息、金證股份、銀信科技、浪潮信息、信息發(fā)展、飛天誠(chéng)信、佳都科技、聚龍股份、衛(wèi)士通、信雅達(dá)、神州信息、廣電運(yùn)通、浩云科技、新大陸、中科曙光、東華軟件、神思電子、衛(wèi)寧健康、恒華科技、漢得信息4贏時(shí)勝、廣聯(lián)達(dá)、超圖軟件、用友網(wǎng)絡(luò)、恒生電子、綠盟科技、四維圖新、啟明星辰案例分析及計(jì)算第7章

8.計(jì)算每類(lèi)公司2015年總利潤(rùn)平均值增長(zhǎng)率rd=pd.read_excel('利潤(rùn)數(shù)據(jù).xlsx')r_c=[]#預(yù)定義每個(gè)類(lèi)別總利潤(rùn)平均增長(zhǎng)率forninrange(5):#獲得第n類(lèi)股票代碼列表cn=list(Fs[Fs==n].index)#預(yù)定義第n類(lèi)股票2014年和2015年的總利潤(rùn)值r1_n=0r2_n=0#循環(huán)地對(duì)第n類(lèi)中的每個(gè)股票進(jìn)行計(jì)算fortincn:#第n類(lèi)股票中第t只股票I1=rd['Accper'].values=='2014-12-31'I2=rd['Accper'].values=='2015-12-31'I3=rd['Stkcd'].values==tindex1=I1&I3index2=I2&I3

#第n類(lèi)股票中第t只股票2014年的利潤(rùn)值r1=rd.loc[index1,'B002000101'].values#第n類(lèi)股票中第t只股票2015年的利潤(rùn)值r2=rd.loc[index2,'B002000101'].valuesiflen(r1)>0:r1_n=r1_n+r1iflen(r2)>0:r2_n=r2_n+r2#第n類(lèi)股票2015年的總利潤(rùn)平均值p2=r2_n/len(cn)#第n類(lèi)股票2014年的總利潤(rùn)平均值p1=r1_n/len(cn)#將總利潤(rùn)平均增長(zhǎng)率添加到r_c中r_c.append((p2-p1)/p1)#將每個(gè)類(lèi)別的總利潤(rùn)平均增長(zhǎng)率添加到聚類(lèi)中心后面列r_c=np.array(r_c)dt=np.hstack((center.values,r_c))dtt=pd.DataFrame(dt)dtt.columns=['Y1','Y2','Y3','r_c']案例分析及計(jì)算第7章

8.計(jì)算每類(lèi)公司2015年總利潤(rùn)平均值增長(zhǎng)率中r_c列為各類(lèi)公司的總利潤(rùn)平均增長(zhǎng)率。從圖7-21中可以看出,第2類(lèi)(index為1)上市公司的綜合盈利能力最強(qiáng),而且其產(chǎn)品競(jìng)爭(zhēng)力和管理能力也相對(duì)較好,最終結(jié)果也可以看出,當(dāng)年的總利潤(rùn)平均增長(zhǎng)率也最高第7章

基礎(chǔ)案例問(wèn)題描述數(shù)據(jù)預(yù)處理關(guān)聯(lián)規(guī)則挖掘問(wèn)題描述第7章

為了探討國(guó)際上主要股票價(jià)格指數(shù)之間的漲跌關(guān)聯(lián)情況,選取12個(gè)主要國(guó)家或者地區(qū)中具有代表性的股票價(jià)格指數(shù)交易數(shù)據(jù),數(shù)據(jù)表包括國(guó)際股票價(jià)格指數(shù)基本信息表和國(guó)際股票價(jià)格指數(shù)日交易數(shù)據(jù)表。IndexcdIdxnmeDJI美國(guó)道瓊斯工業(yè)指數(shù)FCHI法國(guó)CAC40指數(shù)FTSE英國(guó)富時(shí)100指數(shù)GDAXI德國(guó)DAX指數(shù)HSI中國(guó)香港恒生指數(shù)KS11韓國(guó)KOSPI指數(shù)MCIX俄羅斯Micex指數(shù)N225日本日經(jīng)225SENSEX印度孟買(mǎi)30指數(shù)STI富時(shí)新加坡海峽時(shí)報(bào)指數(shù)TWII中國(guó)臺(tái)灣加權(quán)指數(shù)000300中國(guó)滬深300指數(shù)IndexcdTrddtOpnidxHighidxLowidxClsidxDJI2010-01-0410430.6910604.9710430.6910583.96DJI2010-01-0510584.5610584.5610522.5210572.02DJI2010-01-0610564.7210594.9910546.5510573.68DJI2010-01-0710571.1110612.3710505.2110606.86DJI2010-01-0810606.410619.410554.3310618.19DJI2010-01-1110620.3110676.2310591.5910663.99DJI2010-01-1210662.8610663.0810568.8410627.26………………………………其中字段依次為指數(shù)代碼、交易日期、開(kāi)盤(pán)指數(shù)、最高指數(shù)、最低指數(shù)、收盤(pán)指數(shù)。數(shù)據(jù)區(qū)間從2010年1月至2019年8月。問(wèn)題:在一國(guó)或地區(qū)由于受某事件的影響造成其主要股票價(jià)格指數(shù)下跌幅度較大時(shí),另一國(guó)或地區(qū)的主要股票價(jià)格指數(shù)在同期是否也會(huì)有較大幅度的下跌?注意,這里下跌幅度較大定義為:跌幅大于等于0.5%。數(shù)據(jù)預(yù)處理第7章

(1)計(jì)算各指數(shù)的跌幅指標(biāo)數(shù)據(jù),其中跌幅計(jì)算公式為:

(當(dāng)日收盤(pán)指數(shù)?上日收盤(pán)指數(shù))/上日收盤(pán)指數(shù)為了便于關(guān)聯(lián)規(guī)則挖掘,我們將跌幅指標(biāo)數(shù)據(jù)轉(zhuǎn)化為0、1布爾值,即跌幅大于等于0.5%記為1,否則為0。圖中第一行代表了中國(guó)滬深300指數(shù)的跌幅數(shù)據(jù),其中2010年1月5日的值為0,表示跌幅沒(méi)有超過(guò)0.5%,而2010年1月6日的值為1,表示當(dāng)日跌幅超過(guò)了0.5%。數(shù)據(jù)預(yù)處理第7章

(2)各指數(shù)交易日期做一致化處理。事實(shí)上,不同國(guó)家或地區(qū)的交易日期并不完全相同,為了便于挖掘有意義的關(guān)聯(lián)規(guī)則,需要在所有指數(shù)交易日均相同的情況下進(jìn)行挖掘。這里以中國(guó)滬深300指數(shù)交易日為篩選基準(zhǔn)。顯示12個(gè)國(guó)際指數(shù),2010年1月至2019年8月的共同交易日一共1569個(gè),基于一致化的交易日期,就可以構(gòu)造關(guān)聯(lián)規(guī)則挖掘所需的布爾數(shù)據(jù)集了。數(shù)據(jù)預(yù)處理第7章

(3)構(gòu)造關(guān)聯(lián)規(guī)則挖掘所需的布爾值數(shù)據(jù)集,其結(jié)果如下。道瓊斯工業(yè)指數(shù)DJI在2010年1月15日的收盤(pán)指數(shù)跌幅在0.5%以上,中國(guó)滬深300指數(shù)當(dāng)日的收盤(pán)指數(shù)跌幅低于0.5%,而且12個(gè)國(guó)際指數(shù)交易日期也做了一致化處理,下面將基于該數(shù)據(jù)集挖掘關(guān)聯(lián)規(guī)則。關(guān)聯(lián)規(guī)則挖掘第7章

采用第5章介紹的一對(duì)一關(guān)聯(lián)規(guī)則挖掘算法,最小支持度設(shè)置為大于0.1,最小置信度為大于0.6。c=list(Data.columns)c0=0.6#最小置信度s0=0.1#最小支持度list1=[]#預(yù)定義定義列表list1,用于存放規(guī)則list2=[]#預(yù)定義定義列表list2,用于存放規(guī)則的支持度list3=[]#預(yù)定義定義列表list3,用于存放規(guī)則的置信度f(wàn)orkinrange(len(c)):forqinrange(len(c)):

#對(duì)第c[k]個(gè)項(xiàng)與第c[q]個(gè)項(xiàng)挖掘關(guān)聯(lián)規(guī)則

#規(guī)則的前件為c[k]

#規(guī)則的后件為c[q]

#要求前件和后件不相等ifc[k]!=c[q]:c1=Data[c[k]]c2=Data[c[q]]

I1=c1.values==1I2=c2.values==1

t12=np.zeros((len(c1)))t1=np.zeros((len(c1)))t12[I1&I2]=1t1[I1]=1sp=sum(t12)/len(c1)#支持度co=sum(t12)/sum(t1)#置信度

#取置信度大于等于c0的關(guān)聯(lián)規(guī)則ifco>=c0andsp>=s0:list1.append(c[k]+'--'+c[q])list2.append(sp)list3.append(co)#定義字典,用于存放關(guān)聯(lián)規(guī)則及其置信度、支持度

R={'rule':list1,'support':list2,'confidence':list3}#將字典轉(zhuǎn)化為數(shù)據(jù)框R=pd.DataFrame(R)#將結(jié)果導(dǎo)出到ExcelR.to_excel('rule1.xlsx')關(guān)聯(lián)規(guī)則挖掘第7章

IDrulesupportconfidence1DJI--FCHI0.13001910.682DJI--GDAXI0.12109620.6333333333FCHI--FTSE0.19184190.6644591614FCHI--GDAXI0.22498410.7792494485FTSE--FCHI0.19184190.7757731966FTSE--GDAXI0.18419380.7448453617GDAXI--FCHI0.22498410.8364928918GDAXI--FTSE0.18419380.6848341239KS11--HSI0.13957930.63662790710KS11--N2250.1389420.6337209311STI--HSI0.14404080.704049844一對(duì)一關(guān)聯(lián)規(guī)則挖掘結(jié)果如下:支持度在0.1以上、置信度在0.6以上的有11個(gè)關(guān)聯(lián)規(guī)則,其中置信度最高達(dá)83.65%,即德國(guó)DAX指數(shù)和法國(guó)CAC40指數(shù),其意義表示如果德國(guó)DAX指數(shù)下跌幅度大于等于0.5%,那么同期法國(guó)CAC40指數(shù)下跌幅度大于等于0.5%的可能性為83.65%。第8章

上市公司綜合評(píng)價(jià)指標(biāo)選擇、數(shù)據(jù)處理主成分分析與綜合排名投資組合收益率計(jì)算與量化投資策略設(shè)計(jì)基于總體規(guī)模與投資效率指標(biāo)的綜合評(píng)價(jià)(指標(biāo)選擇)第8章

字段名稱(chēng)字段中文名稱(chēng)字段說(shuō)明Stkcd股票代碼Accper會(huì)計(jì)年度2013-12-31、2014-12-31、2015-12-31、2016-12-31、2017-12-31B0011010

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論