版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第6章
金融數(shù)據(jù)基礎(chǔ)公司治理結(jié)構(gòu)數(shù)據(jù)概述公司治理結(jié)構(gòu)數(shù)據(jù)主要指標(biāo)解讀公司治理結(jié)構(gòu)數(shù)據(jù)概述第6章
公司治理結(jié)構(gòu),主要分為四個部分:基本信息、高管動態(tài)、股東股本和會議情況?;拘畔⒎从沉斯局卫斫Y(jié)構(gòu)的基本內(nèi)容,包括公司基本情況、股本結(jié)構(gòu)是否變化、股東總數(shù)、前十大股東是否存在關(guān)聯(lián)、員工人數(shù)、離休職工人數(shù)、董事長持股數(shù)量與持股比例、總經(jīng)理持股數(shù)量與持股比例、董事長與總經(jīng)理是否兼任等;除此之外,還包括了董事、監(jiān)事和高管的年薪收入水平,公司的股權(quán)激勵和實(shí)施情況等。高管動態(tài)反映了“董監(jiān)高”管理層的個人簡歷信息、職務(wù)、年齡、教育背景、持股情況、激勵情況、活動情況、參會情況和個人投資行為。股東股本反映了十大股東和十大流通股東的持股性質(zhì)、持股數(shù)量和持股比例,股本結(jié)構(gòu)(未流通股:國有股、法人股、內(nèi)部職工股、基金配售股、轉(zhuǎn)配股、優(yōu)先股、監(jiān)管層股、戰(zhàn)略投資者股等和流通股:A股、B股和H股)及其變動情況會議情況反映了董事會、監(jiān)事會、股東大會、戰(zhàn)略委員會、審計(jì)委員會、薪酬與考核委員會、提名委員會相關(guān)會議情況。公司治理結(jié)構(gòu)數(shù)據(jù)主要指標(biāo)解讀第5章
公司高管,包括姓名、職務(wù)、學(xué)歷、年薪、持股情況等。基于這些信息,可以衍生出一些諸如董事長和總經(jīng)理是否兼任,獨(dú)立董事人數(shù),管理層學(xué)歷水平、專業(yè)能力水平、平均年齡、專業(yè)背景是否與公司業(yè)務(wù)相符、持股占比等指標(biāo),進(jìn)而研究公司管理層的管理能力等維度公司治理結(jié)構(gòu)數(shù)據(jù)主要指標(biāo)解讀第5章
高管增/減持股份,包括變動日期、高管姓名、增/減持?jǐn)?shù)量、成交均價(jià)、交易方式等。高管作為最了解公司管理和經(jīng)營狀況的知情人士,其一舉一動都備受市場的關(guān)注,也是研究公司當(dāng)前發(fā)展境況的一個重要參考方面。如果大量高管通過市場競價(jià)密集增持本公司股份,說明可能看好公司發(fā)展或者有積極事件發(fā)生或能增加投資者信心。公司治理結(jié)構(gòu)數(shù)據(jù)主要指標(biāo)解讀第5章
股本結(jié)構(gòu)變動情況,主要包括變動日期、變動原因、已流通股份和流通受限股份。事實(shí)上,為了確保公司的穩(wěn)定、持續(xù)經(jīng)營和良好發(fā)展,公司控股股東或大股東(股份持有量較大者)、高管、戰(zhàn)略投資者等持有的股份及股權(quán)激勵股份和轉(zhuǎn)增股份,是受到一定的流通限制的,即獲得其股份之后,需經(jīng)過一定時(shí)間之后才能上市交易,可能是幾個月、一年或幾年。這些受到流通限制的股份,可能是低于市場價(jià)格獲得,而且一般是公司的管理和經(jīng)營利益相關(guān)方或者戰(zhàn)略投資方,為了保護(hù)廣大投資者,不得不采取的措施公司治理結(jié)構(gòu)數(shù)據(jù)主要指標(biāo)解讀第5章
十大股東的信息,包括股東名次、股東名稱、持股數(shù)量、持股比例和股份性質(zhì)。十大股東一般是公司經(jīng)營管理決策的重要制定者、執(zhí)行者和受益者,對公司的發(fā)展起到?jīng)Q定性作用,其持有公司股份比例反映了股權(quán)的集中程度。公司治理結(jié)構(gòu)數(shù)據(jù)主要指標(biāo)解讀第5章
股東人數(shù)的變化情況,包括截止日期、股東人數(shù)、股東人數(shù)變動幅度。股東人數(shù)的變化,可以直觀感受到公司的受歡迎程度、市場環(huán)境變化等,進(jìn)一步可以研究籌碼的分散程度第6章
金融數(shù)據(jù)基礎(chǔ)財(cái)務(wù)報(bào)表數(shù)據(jù)概述財(cái)務(wù)報(bào)表數(shù)據(jù)主要指標(biāo)解讀財(cái)務(wù)報(bào)表數(shù)據(jù)概述第6章
財(cái)務(wù)報(bào)表,主要包括上市公司資產(chǎn)負(fù)債表、利潤表和現(xiàn)金流量表。資產(chǎn)負(fù)債表,是反映企業(yè)在某一特定日期(如月末、季末、年末)全部資產(chǎn)、負(fù)債和所有者權(quán)益情況的會計(jì)報(bào)表。資產(chǎn)又分為流動資產(chǎn)和非流動資產(chǎn),流動資產(chǎn)為短期內(nèi)能變現(xiàn)的資產(chǎn),如貨幣資金、交易性金融資產(chǎn)、短期投資凈額、應(yīng)收票據(jù)、應(yīng)收賬款、合同資產(chǎn)等;非流動資產(chǎn)為短期內(nèi)不能變現(xiàn)的資產(chǎn),比如債權(quán)投資、長期應(yīng)收賬款凈額、投資性房地產(chǎn)凈額、固定資產(chǎn)凈額、在建工程凈額、工程物資、無形資產(chǎn)凈額、商譽(yù)凈額等。負(fù)債分為流動負(fù)債和非流動負(fù)債,流動負(fù)債為短期內(nèi)需償還的負(fù)債,比如短期借款、應(yīng)付票據(jù)、應(yīng)付賬款、合同負(fù)債、應(yīng)付職工薪酬、應(yīng)交稅費(fèi)、應(yīng)交利息等;非流動負(fù)責(zé)為短期內(nèi)無需償還的負(fù)債,如長期借款、租賃負(fù)債、長期應(yīng)付款等。所有者權(quán)益,即企業(yè)資產(chǎn)扣除負(fù)債后,由所有者享有的剩余權(quán)益。所有者權(quán)益,也稱為股東權(quán)益,包括實(shí)收資本(或股本)、資本公積、盈余公積和未分配利潤。財(cái)務(wù)報(bào)表數(shù)據(jù)概述第6章
財(cái)務(wù)報(bào)表,主要包括上市公司資產(chǎn)負(fù)債表、利潤表和現(xiàn)金流量表。利潤表,反映企業(yè)在一定會計(jì)期間經(jīng)營成果的報(bào)表,主要包括收入、成本和費(fèi)用相關(guān)數(shù)據(jù)信息。營業(yè)總收入=營業(yè)收入+利息凈收入+其他業(yè)務(wù)收入。營業(yè)總成本=營業(yè)成本+稅金及附加+業(yè)務(wù)及管理費(fèi)+銷售費(fèi)用+管理費(fèi)用+財(cái)務(wù)費(fèi)用+研發(fā)費(fèi)用+其他業(yè)務(wù)成本。營業(yè)利潤=營業(yè)總收入-營業(yè)總成本+其他收益及利潤。利潤總額=營業(yè)利潤+營業(yè)外收入-營業(yè)外支出。除此之外,還有一些常用的指標(biāo),比如基本每股收益、歸屬于母公司所有者的凈利潤等。財(cái)務(wù)報(bào)表數(shù)據(jù)概述第6章
財(cái)務(wù)報(bào)表,主要包括上市公司資產(chǎn)負(fù)債表、利潤表和現(xiàn)金流量表。現(xiàn)金流量表,反映在某固定期間內(nèi)(如每月或每季),企業(yè)現(xiàn)金(包含銀行存款)的增減變動情況表。主要包括三大塊內(nèi)容:經(jīng)營活動產(chǎn)生的現(xiàn)金流量凈額、投資活動產(chǎn)生的現(xiàn)金流量凈額和籌資活動產(chǎn)生的現(xiàn)金流量凈額?,F(xiàn)金流量作為企業(yè)的生命線,對企業(yè)的生存和發(fā)展起到?jīng)Q定性作用,也是研究公司行業(yè)地位、資產(chǎn)和利潤質(zhì)量的有力數(shù)據(jù)支撐。事實(shí)上,資產(chǎn)負(fù)債表和利潤表都是核算出來的,而現(xiàn)金流量表的數(shù)據(jù)是真實(shí)存在的銀行資金流水,做不得半點(diǎn)虛假。財(cái)務(wù)報(bào)表主要指標(biāo)解讀第5章
資產(chǎn)類科目指標(biāo)主要有貨幣資金、流動資產(chǎn)、非流動資產(chǎn)和總資產(chǎn);負(fù)債類科目指標(biāo)主要包括流動負(fù)債、長期借款、非流動負(fù)債和總負(fù)債;股東權(quán)益類科目指標(biāo)包括股本、未分配利潤和所有者權(quán)益,其中所有者權(quán)益=總資產(chǎn)-總負(fù)債財(cái)務(wù)報(bào)表主要指標(biāo)解讀第5章
主要指標(biāo)包括營業(yè)總收入、營業(yè)總成本、營業(yè)利潤、利潤總額、所得稅和歸屬母公司凈利潤。這些指標(biāo)均不難理解,反應(yīng)的是上市公司經(jīng)營成果,其中歸屬母公司凈利潤,就是歸屬上市公司所有者(股東)的凈利潤,上市公司凈利潤也通常是指這個指標(biāo)。財(cái)務(wù)報(bào)表主要指標(biāo)解讀第5章
投資活動包括實(shí)物投資(固定資產(chǎn)、在建工程等),也包括金融資產(chǎn)投資;籌資活動包括企業(yè)資本構(gòu)成發(fā)生變化的活動,比如股本擴(kuò)張或股本溢價(jià)或股本結(jié)構(gòu)發(fā)生變化等,也包括債務(wù)結(jié)構(gòu)發(fā)生變化,比如對外舉債、向銀行貸款或發(fā)行債券等行為。除投資活動和籌資活動之外,就是經(jīng)營活動。第6章
金融數(shù)據(jù)基礎(chǔ)財(cái)務(wù)分析指標(biāo)數(shù)據(jù)概述財(cái)務(wù)分析數(shù)據(jù)主要指標(biāo)解讀財(cái)務(wù)分析指標(biāo)數(shù)據(jù)概述第6章
財(cái)務(wù)分析指標(biāo)數(shù)據(jù),屬于衍生指標(biāo),它們是基于財(cái)務(wù)報(bào)表數(shù)據(jù)和股票交易情況數(shù)據(jù),利用相關(guān)的專業(yè)公式或算法計(jì)算出來的。一般包括償債能力、運(yùn)營能力、盈利能力、發(fā)展能力、每股指標(biāo)和相關(guān)主要考察指標(biāo)等。這里我們主要參考巨潮資訊網(wǎng)提供的財(cái)務(wù)分析指標(biāo)來進(jìn)行介紹,旨在一個拋磚引玉的作用財(cái)務(wù)分析主要指標(biāo)解讀第5章
主要指標(biāo)包括基本每股收益、每股凈資產(chǎn)、每股資本公積金、凈利潤增長率、營業(yè)總收入增長率和加權(quán)凈資產(chǎn)收益率。其中前三者屬于每股類指標(biāo),其計(jì)算方法分別為期末的凈利潤、所有者權(quán)益和資本公積金除以期末股本。凈利潤增長率和營業(yè)總收入增長率,屬于同比計(jì)算,即(本年度同期值-上年度同期值)/上年度同期值。凈資產(chǎn)收益率,其計(jì)算方法為凈利潤除以加權(quán)平均股東權(quán)益,反映的是單位資產(chǎn)獲利能力。財(cái)務(wù)分析主要指標(biāo)解讀第5章
償還能力(也稱償債能力)的主要指標(biāo),包括流動比率、速動比率和資產(chǎn)負(fù)債率。其中流動比率=流動資產(chǎn)/流動負(fù)債,反應(yīng)的是短期內(nèi)能變現(xiàn)的資產(chǎn)與短期內(nèi)需償還的負(fù)債之間的比率。一般地,比率越大,企業(yè)資產(chǎn)變現(xiàn)能力越強(qiáng),償債能力亦越強(qiáng)。速動比率=(流動資產(chǎn)-存貨-預(yù)付賬款)/流動負(fù)債。相比流動比率,速動比率進(jìn)一步扣除變現(xiàn)速度較慢的資產(chǎn)。資產(chǎn)負(fù)債率=總負(fù)債/總資產(chǎn),反映了公司進(jìn)行經(jīng)營活動的能力和債權(quán)人發(fā)放貸款的安全程度。財(cái)務(wù)分析主要指標(biāo)解讀第5章
運(yùn)營能力的主要指標(biāo),包括應(yīng)收賬款周轉(zhuǎn)率、存貨周轉(zhuǎn)率、流動資產(chǎn)周轉(zhuǎn)率、固定資產(chǎn)周轉(zhuǎn)率和總資產(chǎn)周轉(zhuǎn)率。其中應(yīng)收賬款周轉(zhuǎn)率=期末營業(yè)收入/(應(yīng)收賬款期末余額+應(yīng)收賬款期初余額)*0.5;存貨周轉(zhuǎn)率=期末營業(yè)成本/(存貨期末余額+存貨期初余額)*0.5;流動資產(chǎn)周轉(zhuǎn)率=期末營業(yè)收入/(流動資產(chǎn)期末余額+流動資產(chǎn)期初余額)*0.5;固定資產(chǎn)周轉(zhuǎn)率=期末營業(yè)收入/(固定資產(chǎn)期末余額+固定資產(chǎn)期初余額)*0.5;總資產(chǎn)周轉(zhuǎn)率=營業(yè)收入/(總資產(chǎn)期末余額+總資產(chǎn)期初余額)*0.5。周轉(zhuǎn)率是衡量公司資產(chǎn)管理效率的指標(biāo),一般周轉(zhuǎn)率越高越有利,越能反映公司的運(yùn)營能力。這里從收賬、存貨、流動資產(chǎn)、固定資產(chǎn)和總資產(chǎn)等幾個方面來進(jìn)行考察財(cái)務(wù)分析主要指標(biāo)解讀第5章
盈利能力和發(fā)展能力方面的主要指標(biāo),包括營業(yè)利潤率、凈利潤率、毛利率、總資產(chǎn)報(bào)酬率和營業(yè)收入增長率、總資產(chǎn)增長率、營業(yè)利潤增長率、凈利潤增長率、凈資產(chǎn)增長率;其中營業(yè)利潤率=營業(yè)利潤/營業(yè)收入,凈利潤率=凈利潤/營業(yè)收入,毛利率=(營業(yè)收入-營業(yè)成本)/營業(yè)收入,總資產(chǎn)報(bào)酬率=(利潤總額+利息支出)/(期末總資產(chǎn)+期初總資產(chǎn))*0.5,類似地,總資產(chǎn)凈利潤率=凈利潤/(期末總資產(chǎn)+期初總資產(chǎn))*0.5。而發(fā)展能力方面的指標(biāo),主要是考察其增長率,即(當(dāng)年同期指標(biāo)值-上年同期指標(biāo)值)/上年同期指標(biāo)值。第6章
金融數(shù)據(jù)基礎(chǔ)股票交易數(shù)據(jù)基本知識股票交易數(shù)據(jù)生產(chǎn)場景高頻數(shù)據(jù)(10檔行情)股票交易日頻數(shù)據(jù)和股票價(jià)格指數(shù)股票交易數(shù)據(jù)基本知識第6章
股票交易數(shù)據(jù)最主要是兩個方面:一個是價(jià),包括成交價(jià)、委托價(jià);一個是量,包括成交量、委托量;一般地,以日為單位的交易數(shù)據(jù)(統(tǒng)計(jì)當(dāng)天的交易情況,比如開盤價(jià)、最高價(jià)、最低價(jià)、收盤價(jià)是多少,總成交量又是多少等),主要是成交價(jià)和成交量數(shù)據(jù),沒有委托價(jià)和量數(shù)據(jù)。以秒、分鐘為單位的交易數(shù)據(jù)(稱為高頻數(shù)據(jù)),則更為詳細(xì),不僅包括成交價(jià)、成交量數(shù)據(jù),還包括委托量、委托價(jià)數(shù)據(jù)。股票交易數(shù)據(jù)基本知識第6章
我們以一個買賣白菜的市場為例,形象的解釋這些術(shù)語。為了公平起見,我們對日常的白菜市場制定一些規(guī)則。首先,有賣白菜的,我們稱為供應(yīng)方,或者是賣方;同樣的,也有買白菜的,我們稱為需求方,或者是買方其次,這個菜市場有一個開放時(shí)間,比如9:15-15:00,其中11:30-13:00休息。為了使買賣雙方都有一個公平的價(jià)格,它應(yīng)該由市場決定。9:15-9:25這10分鐘內(nèi),在場的買方都報(bào)出自己需要購買的數(shù)量和單價(jià),賣方也報(bào)出自己能供應(yīng)的數(shù)量及單價(jià)。10分鐘結(jié)束后,不允許再報(bào)了,我們要找到這樣一個價(jià)格,使得成交量最大化,就是第一筆成交價(jià)格,稱為開盤價(jià),這個過程稱為集合競價(jià)。開盤價(jià)是買賣雙方最早的集體博弈的結(jié)果,比較有意義,為了讓雙方都有一個短暫的消化時(shí)間,9:25-9:30這5分鐘內(nèi)不交易。9:30開始繼續(xù)交易,交易價(jià)格的產(chǎn)生不再是通過集合競價(jià),而是進(jìn)入連續(xù)競價(jià)階段。股票交易數(shù)據(jù)基本知識第6章
連續(xù)競價(jià)交易,即買賣雙方都可以隨時(shí)報(bào)出自己的數(shù)量和單價(jià),但又是如何促成交易的呢?這里有一個原則,即價(jià)格越優(yōu)的報(bào)單就越排在前面,如果價(jià)格都一樣,則先報(bào)的排在前面,即價(jià)格優(yōu)先、時(shí)間優(yōu)先原則。何為優(yōu)的報(bào)價(jià),對于買方,越高的報(bào)價(jià)就越優(yōu);對于賣方,越低的報(bào)價(jià)越優(yōu);這樣,只要符合買賣雙方的交易條件,就會連續(xù)成交,一直持續(xù)到結(jié)束。最后一筆交易的價(jià)格,即為收盤價(jià)。統(tǒng)計(jì)當(dāng)天所有的交易,價(jià)格最高的即為最高價(jià)、最低的即為最低價(jià)。當(dāng)然,交易也會產(chǎn)生交易量和交易金額等數(shù)據(jù)。最后,一天交易結(jié)束之后統(tǒng)計(jì)的數(shù)據(jù)稱為日頻數(shù)據(jù),一天只有一條記錄,主要指標(biāo)數(shù)據(jù)是當(dāng)天的開盤價(jià)、最高價(jià)、最低價(jià)、收盤價(jià)、總成交量、總成交金額。如果以秒或分鐘為頻率統(tǒng)計(jì)的數(shù)據(jù),稱為高頻數(shù)據(jù),他們主要是統(tǒng)計(jì)截止當(dāng)前時(shí)間和相鄰兩個時(shí)間點(diǎn)產(chǎn)生的數(shù)據(jù)。高頻數(shù)據(jù)除了成交價(jià)格、成交量和金額之外,還有一些未成交的買賣雙方委托價(jià)格和委托量數(shù)據(jù)。如果把白菜比喻成股票等證券,白菜市場看成是證券交易所,買方和賣方看成投資者,產(chǎn)生的數(shù)據(jù)就是股票交易數(shù)據(jù)。股票交易數(shù)據(jù)生產(chǎn)場景第6章
我們可以想象這樣一個場景,一個投資者在券商的行情軟件提交委托訂單,而券商的行情軟件是與交易所交易系統(tǒng)聯(lián)網(wǎng)的,從而投資者的委托訂單被送達(dá)交易系統(tǒng),進(jìn)行撮合成交。目前市場上有數(shù)量眾多的投資者、券商和相關(guān)交易所,他們共同構(gòu)成了中國的證券期貨場內(nèi)交易市場這里有兩個微觀數(shù)據(jù):一個是投資者的委托訂單數(shù)據(jù),稱為逐筆委托數(shù)據(jù);一個是交易所系統(tǒng)的成交數(shù)據(jù),稱為逐筆成交數(shù)據(jù)。這兩個數(shù)據(jù)是時(shí)間序列數(shù)據(jù),時(shí)間精確到毫秒,詳細(xì)完整地記錄了每一位投資者每一筆委托訂單信息及交易系統(tǒng)每一筆交易的成交信息。高頻數(shù)據(jù)則是由這兩個微觀數(shù)據(jù)加工而成股票交易數(shù)據(jù)生產(chǎn)場景第6章
高頻數(shù)據(jù)分為兩種:一種是超高頻數(shù)據(jù),比如以上的逐筆委托數(shù)據(jù)和逐筆成交數(shù)據(jù),這是一類比較特殊的高頻數(shù)據(jù);一種是通常意義上的高頻數(shù)據(jù),屬于等間隔取樣(或者等間隔的整數(shù)倍取樣,主要是因?yàn)槿拥臅r(shí)候,沒有對應(yīng)的委托數(shù)據(jù)或成交數(shù)據(jù),則順延至下一次取樣,直到取樣成功為止)。這里的取樣,是指截止當(dāng)前時(shí)間,統(tǒng)計(jì)匯總逐筆委托數(shù)據(jù)和逐筆成交數(shù)據(jù)而形成的行情數(shù)據(jù)(或稱快照數(shù)據(jù))。匯總統(tǒng)計(jì)過程是由交易所完成的,我們只需接收交易所發(fā)送的行情數(shù)據(jù)即可。根據(jù)統(tǒng)計(jì)匯總的頻率高低和內(nèi)容的詳細(xì)程度不同,交易所分為基本行情(5檔)和深度行情(10檔和超高頻數(shù)據(jù))兩個品種。10檔高頻數(shù)據(jù)第6章
靜態(tài)字段:證券代碼、交易日期、昨收盤價(jià)時(shí)間字段:數(shù)據(jù)生成時(shí)間成交字段:(開、高、低、最新)價(jià)、截止當(dāng)前總成交筆數(shù)、分筆期間成交筆數(shù)、
截止當(dāng)前總成交量、分筆期間成交量、截止當(dāng)前總成交額、分筆期間成交額委托字段:賣委托總量、賣委托加權(quán)平均價(jià)、委賣10至委賣01價(jià)、申賣量10至申賣量01、
買委托總量、買委托加權(quán)平均價(jià)、委買01至委買10、委買量01至委買量10.說明:數(shù)據(jù)生成時(shí)間,其實(shí)就是統(tǒng)計(jì)截止時(shí)間,假設(shè)數(shù)據(jù)生成時(shí)間是0941.230,這個時(shí)間通常是某筆交易發(fā)生的時(shí)間,則統(tǒng)計(jì)[0925.000,0941.230]該時(shí)間段內(nèi)逐筆成交數(shù)據(jù)表的成交數(shù)據(jù),形成本條記錄的成交字段數(shù)據(jù),同時(shí)再統(tǒng)計(jì)[0915,0941.230]該時(shí)間段內(nèi)有效的逐筆委托數(shù)據(jù)(不包括撤單的記錄),形成本條記錄的委托字段數(shù)據(jù)。換言之,成交字段數(shù)據(jù),就是截止0941.230該時(shí)間點(diǎn),已經(jīng)成交的事實(shí),而委托字段數(shù)據(jù)則是可供選擇的有望在下一刻成交的總量和可能獲得的價(jià)格,為推斷未來成交情況提供基礎(chǔ)數(shù)據(jù)。10檔高頻數(shù)據(jù)第6章
10檔高頻數(shù)據(jù)第6章
10檔高頻數(shù)據(jù)第6章
10檔高頻數(shù)據(jù)第6章
以093013100這個數(shù)據(jù)生產(chǎn)時(shí)間的記錄為例,它表示的是平安銀行(代碼:000001)在20130301交易日(TRDDATE)內(nèi),截止093013100當(dāng)前時(shí)間(DATATIME)的最高成交價(jià)(HIGHPX)為22.930最低成交價(jià)(LOWPX)為22.820最近一次交易的價(jià)格(最新價(jià),LASTPX)為22.880,累計(jì)發(fā)生的總成交量(TOTALVOLUME)為1889900分筆期間的成交量(與上一條記錄之間的時(shí)間間隔發(fā)生的交易量,CQ)為10400可供購買的總量(即賣方的總供應(yīng)量,TOTALOFFERQTY)為6470952其中賣方提供的最低價(jià)格(S01)為22.900賣方提供的最低價(jià)位上的供應(yīng)量(SV01)為372617……日頻數(shù)據(jù)第6章
日頻交易數(shù)據(jù),主要是統(tǒng)計(jì)當(dāng)天交易情況的數(shù)據(jù),上一節(jié)也提到,高頻交易10檔行情數(shù)據(jù)表最后一條記錄數(shù)據(jù)就是日頻交易數(shù)據(jù)的來源,字段包括股票代碼、交易日期、收盤價(jià)、成交量、成交金額、開盤價(jià)、最高價(jià)、最低價(jià)等。StkcdTrddtClsprcDnshrtrdDnvaltrdOpnprcHiprcLoprcAdjprcwdAdjprcnd3000152017-05-1532.883314184107995576.532.432.8832.35244.9883236.32463000152017-05-1633.8474677915804871132.833.8832.5251.8433242.93713000152017-05-1733.31373243012511258333.5733.933.26248.1923239.41523000152017-05-1822.235758990128095499.322.0622.4921.89249.7941239.66663000152017-05-1922.46449048145514093.822.2722.9522.02251.7044241.49943000152017-05-2222.574798200107396565.522.4622.8522253.6146243.3322……………………………………………………由于分紅送股轉(zhuǎn)增股等行為,正常的收盤價(jià)是不具可比性的,基于投資者權(quán)益不變的原則(假設(shè)投資者在除權(quán)之前購買了股票或者是一位長期投資者,公司的送股、轉(zhuǎn)增股和分紅等權(quán)益均享有,即個人的資產(chǎn)權(quán)益不發(fā)生變化),需要對這個收盤價(jià)做出調(diào)整,于是衍生出了常見的兩個指標(biāo):考慮現(xiàn)金紅利再投資的收盤價(jià)可比價(jià)和不考慮現(xiàn)金紅利再投資的收盤價(jià)可比價(jià)股票價(jià)格指數(shù)第6章
股票價(jià)格指數(shù),反映多只股票或股票投資組合整體趨勢的指標(biāo),比如:反映上海證券交易所A股整體趨勢的上證A股指數(shù);反映深圳證券交易所A股主板、中小板和創(chuàng)業(yè)板各板塊整體趨勢的深證主板指數(shù)、中小板指數(shù)和創(chuàng)業(yè)板指數(shù);反映中國大陸A股市場整體趨勢的滬深300指數(shù)(從上海、深圳兩個證券交易所選取具有代表性的300只股票作為樣本進(jìn)行計(jì)算)。事實(shí)上,股票價(jià)格指數(shù)屬于衍生性指標(biāo),其基礎(chǔ)數(shù)據(jù)是個股交易數(shù)據(jù),其計(jì)算公式為:股票價(jià)格指數(shù)=指數(shù)所包含的股票總市值/指數(shù)所包含的股票基準(zhǔn)日總市值。這里的總市值一般為調(diào)整性總市值,即根據(jù)不同的規(guī)則約束和調(diào)整機(jī)制,選擇個股范圍,并對參與計(jì)算的個股賦予不同的權(quán)重。股票價(jià)格指數(shù)第6章
為了方便理解,我們基于深圳創(chuàng)業(yè)板的所有股票2017年個股交易數(shù)據(jù),自建一個指數(shù)。StkcdTrddtClsprcDnshrtrdDnvaltrdOpnprcHiprcLoprc3000012017-01-0317.428140604898570217.3617.5217.343000012017-01-0417.7548001088465166217.4117.8917.333000012017-01-0517.6533944986008666217.7517.8617.613000012017-01-0617.4130020605243240417.6417.6617.383000012017-01-0917.4424145834205844017.3717.5417.313000012017-01-1017.3520724093604314717.3917.4717.323000012017-01-1117.6877575881.37E+0817.3518.1617.123000012017-01-1218.05107386841.93E+0817.6918.1417.453000012017-01-1317.4158797771.05E+0817.9618.117.4…………………………………………字段依次表示股票代碼、交易日期、收盤價(jià)、交易量、交易金額、開盤價(jià)、最高價(jià)和最低價(jià)。股票價(jià)格指數(shù)第6章
以2017年第一個交易日(2017-01-03)為基準(zhǔn)日,基點(diǎn)設(shè)為1000點(diǎn),其計(jì)算公式為:每日總市值/基準(zhǔn)日總市值*1000,進(jìn)一步地,我們還將其指數(shù)趨勢圖繪制出來importpandasaspdimportmatplotlib.pyplotaspltimportnumpyasnpplt.rcParams['font.sans-serif']='SimHei'df=pd.read_excel('創(chuàng)業(yè)板2017年個股交易數(shù)據(jù).xlsx')df1=df.groupby(['Trddt'])['Dnvaltrd'].sum()#分組統(tǒng)計(jì)每日總市值index=df1.values/df1.values[0]*1000#計(jì)算指數(shù)x=np.array(range(len(df1)))plt.figure(figsize=(8,6))plt.plot(x,index)plt.xticks(x[0:len(x):40],df1.index[0:len(x):40],rotation=45)plt.ylabel('指數(shù)')plt.title('2017年創(chuàng)業(yè)板自建指數(shù)走勢圖')plt.savefig('2017年創(chuàng)業(yè)板自建指數(shù)走勢圖')第7章
基礎(chǔ)案例案例介紹周最小最大交易日獲取股票價(jià)格指數(shù)周收益率計(jì)算案例介紹第7章
計(jì)算上證A股指數(shù)(代碼:000002)2017年的周收益率。周收益率=(周最大交易日收盤指數(shù)?周最小交易日收盤指數(shù))/周最小交易日收盤指數(shù)本案例使用了交易日歷表和指數(shù)日交易數(shù)據(jù)表MarkettypeClddtDaywkState12017-01-032O12017-01-043O12017-01-054O12017-01-065O12017-01-091O12017-01-102O12017-01-113O12017-01-124O12017-01-135O……………………IndexcdIdxtrd01Idxtrd050000022017-01-033283.450000022017-01-043307.450000022017-01-053314.390000022017-01-063302.790000022017-01-093320.530000022017-01-103310.490000022017-01-113284.370000022017-01-123266.040000022017-01-133259.27………………周最小和最大交易日獲取第7章
由于我們獲取的數(shù)據(jù)為日行情交易數(shù)據(jù),無法直接計(jì)算周收益率,需要對交易日歷數(shù)據(jù)進(jìn)行處理,即找出每周的最大交易日和最小交易日。從交易日歷表的星期(Daywk)字段可以看出,當(dāng)前星期值比下一個星期值大,其對應(yīng)的交易日即為本周的最大交易日,下一個星期值對應(yīng)的交易日即為下周的最小交易日。算法如下:輸入:交易日歷數(shù)據(jù)表date。輸出:周最小交易日和最大交易日列表list1和list2。Step1:定義空的列表list1和list2,將交易日歷表中的首個交易日添加到list1中。Step2:從第2個交易日開始至倒數(shù)第2個交易日,如果其星期值大于下一個交易日的星期值,
則將其交易日添加到list2中,下一個交易日添加到list1中。Step3:將最后的交易日添加到list2中。周最小和最大交易日獲取第7章
importpandasaspdx=pd.read_excel('TRD_Cale.xlsx')list1=['2017-01-03']list2=[]fortinrange(1,len(x)-1):p=x.iloc[t-1,[2]][0]q=x.iloc[t,[2]][0]ifq<p:list1.append(x.iloc[t,[1]][0])list2.append(x.iloc[t-1,[1]][0])list2.append('2017-12-29')周收益率計(jì)算第7章
獲得每周的最小交易日列表list1和最大交易日列表list2后,可以通過循環(huán)的方式,依次取最大交易日和最小交易日對應(yīng)的收盤指數(shù),利用前面介紹的公式計(jì)算即可獲得周收益率指標(biāo)數(shù)據(jù)。data=pd.read_excel('IDX_Idxtrd.xlsx')importnumpyasnpr=np.zeros(len(list1))foriinrange(len(list1)):p1=data.loc[data['Idxtrd01'].values==list1[i],'Idxtrd05'].valuesp2=data.loc[data['Idxtrd01'].values==list2[i],'Idxtrd05'].valuesr[i]=(p2-p1)/p1第0周的最大交易日2017年1月6日對應(yīng)的收盤指數(shù)3302.76,減去第0周最小交易日2017年1月3日對應(yīng)的收盤指數(shù)3283.45,再除以第0周最小交易日2017年1月3日對應(yīng)的收盤指數(shù)3283.45,就可以得到周收益率指標(biāo)數(shù)據(jù)為:0.00589015。周收益率計(jì)算第7章
importpandasaspdA=pd.read_excel('IDX_Idxtrd.xlsx')A['Idxtrd01']=pd.to_datetime(A.iloc[:,1])A['month']=A['Idxtrd01'].dt.monthA['week']=A['Idxtrd01'].dt.isocalendar().weekA_w=A.iloc[:,[2,4]]A_m=A.iloc[:,[2,3]]p1=A_w.groupby(['week'])['Idxtrd05'].first().valuesp2=A_w.groupby(['week'])['Idxtrd05'].last().valuesw_r=(p2-p1)/p1可參考第3章中的時(shí)間元素提取和分組統(tǒng)計(jì)方法進(jìn)行計(jì)算,其方法更加簡潔,但是結(jié)果可能存在一些差異。第7章
基礎(chǔ)案例案例介紹指標(biāo)計(jì)算案例介紹第7章
找出“計(jì)算機(jī)、通信和其他電子設(shè)備制造業(yè)”所有上市公司2015年~2017年連續(xù)3年凈利潤增長率都在40%以上的公司。當(dāng)期凈利潤增長率=(當(dāng)期凈利潤?上期凈利潤)/上期凈利潤。本案例使用的數(shù)據(jù)表包括:計(jì)算機(jī)、通信和其他電子設(shè)備制造業(yè)公司利潤表和股票行業(yè)基本信息表StkcdAccperB0020001010000162014-12-3152623527.860000162015-12-31-12568193150000162016-12-3195673028.030000162017-12-3150570251560000202014-12-317687620.270000202015-12-31-4200845.61………………StkcdStknmeNnindnmae000016深康佳A計(jì)算機(jī)、通信和其他電子設(shè)備制造業(yè)000020深華發(fā)A計(jì)算機(jī)、通信和其他電子設(shè)備制造業(yè)000021深科技計(jì)算機(jī)、通信和其他電子設(shè)備制造業(yè)000045深紡織A計(jì)算機(jī)、通信和其他電子設(shè)備制造業(yè)000050深天馬A計(jì)算機(jī)、通信和其他電子設(shè)備制造業(yè)000063中興通訊計(jì)算機(jī)、通信和其他電子設(shè)備制造業(yè)000066中國長城計(jì)算機(jī)、通信和其他電子設(shè)備制造業(yè)000068華控賽格計(jì)算機(jī)、通信和其他電子設(shè)備制造業(yè)………………指標(biāo)計(jì)算第7章
上市公司凈利潤增長率指標(biāo)計(jì)算的基本思路如下:首先需要選擇滿足2014年~2017年都存在利潤數(shù)據(jù)的上市公司,不滿足條件的刪除。其方法是將data2.xlsx中的Stkcd列轉(zhuǎn)化為序列,采用值統(tǒng)計(jì)函數(shù)value_counts()即可實(shí)現(xiàn)篩選。其次對滿足條件的股票代碼,采用循環(huán)的方式,依次取得4年的凈利潤數(shù)據(jù),將其轉(zhuǎn)化為Numpy數(shù)據(jù)組的形式,假設(shè)記為d,則3年的凈利潤增長率=(d[1:]-d[0:-1])/d[0:-1]。最后將結(jié)果整理為數(shù)據(jù)框的形式展現(xiàn)出來。指標(biāo)計(jì)算第7章
#1.數(shù)據(jù)準(zhǔn)備importpandasaspddt=pd.read_excel('data2.xlsx')code=dt['Stkcd'].value_counts()code=list(code[code==4].index)info=pd.read_excel('info.xlsx')S=pd.Series(info.iloc[:,1].values,index=info.iloc[:,0].values)#2.預(yù)定義列表,用于存放各年的凈利潤增長率,并賦值計(jì)算list1=[]list2=[]list3=[]list4=[]fortinrange(len(code)):d=dt.iloc[dt.iloc[:,0].values==code[t],2].values
r=(d[1:]-d[0:-1])/d[0:-1]iflen(r[r>0.4])==3:list1.append(S[code[t]])list2.append(r[0])list3.append(r[1])list4.append(r[2])#3.結(jié)果轉(zhuǎn)換為數(shù)據(jù)框D={'2015':list2,'2016':list3,'2017':list4}D=pd.DataFrame(D,index=list1)第7章
基礎(chǔ)案例案例介紹繪圖數(shù)據(jù)計(jì)算繪圖及圖形保存案例介紹第7章
本案例主要介紹股票日收盤價(jià)格、成交量的走勢圖以及月交易量分布餅圖的繪制技能,并進(jìn)一步介紹了子圖的繪制方法。股票代碼交易日期收盤價(jià)交易量6000002017-01-0316.3162371256000002017-01-0416.33296587346000002017-01-0516.3264376466000002017-01-0616.18171955986000002017-01-0916.2149087456000002017-01-1016.1979967566000002017-01-1116.169193332……………………(1)繪制股票代碼600000日期為2017年1月3日—2017年1月20日的收盤價(jià)格走勢圖。(2)繪制股票代碼600000日期為2017年1月3日—2017年1月24日的交易量柱狀圖。(3)計(jì)算股票代碼600000,2017年1月—11月的交易量,并繪制其餅圖。(4)將以上的價(jià)格走勢圖、柱狀圖、餅圖在同一個figure上以子圖的形式繪制出來。任務(wù)如下:繪圖數(shù)據(jù)計(jì)算第7章
importpandasaspdimportnumpyasnpimportmatplotlib.pyplotaspltdata=pd.read_excel('trd.xlsx')dt=data.loc[data['股票代碼']==600000,['交易日期','收盤價(jià)','交易量']]I1=dt['交易日期'].values>='2017-01-03'I2=dt['交易日期'].values<='2017-01-20'dta=dt.iloc[I1&I2,:]y1=dta['收盤價(jià)']x1=range(len(y1))I3=dt['交易日期'].values>='2017-01-03'I4=dt['交易日期'].values<='2017-01-24'dta=dt.iloc[I3&I4,:]y2=dta['交易量']x2=range(len(y2))D=np.zeros((11))list1=list()forminrange(11):m=m+1ifm<10:m1='2017-0'+str(m)+'-01'm2='2017-0'+str(m)+'-31'mon='0'+str(m)else:m1='2017-'+str(m)+'-01'm2='2017-'+str(m)+'-31'mon=str(m)I1=dt['交易日期'].values>=m1I2=dt['交易日期'].values<=m2D[m-1]=dt.iloc[I1&I2,[2]].sum()[0]list1.append(mon)繪圖及圖形保存第7章
1.股票價(jià)格走勢圖繪制plt.figure(1)plt.plot(x1,y1)plt.xlabel(u'日期',fontproperties='SimHei')plt.ylabel(u'收盤價(jià)',fontproperties='SimHei')plt.title(u'收盤價(jià)走勢圖',fontproperties='SimHei')plt.savefig('1')繪圖及圖形保存第7章
2.交易量分布柱狀圖plt.figure(2)plt.bar(x2,y2)plt.xlabel(u'日期',fontproperties='SimHei')plt.ylabel(u'交易量',fontproperties='SimHei')plt.title(u'交易量趨勢圖',fontproperties='SimHei')plt.savefig('2')繪圖及圖形保存第7章
3.月交易量分布餅圖plt.figure(3)plt.pie(D,labels=list1,autopct='%1.2f%%')#保留小數(shù)點(diǎn)后兩位plt.title(u'月交易量分布圖',fontproperties='SimHei')plt.savefig('3')繪圖及圖形保存第7章
4.收盤價(jià)走勢圖、交易量分布圖和月交易量餅圖組成的3×1子圖plt.figure(4)plt.figure(figsize=(14,6))plt.subplot(1,3,1)plt.plot(x1,y1)plt.xlabel(u'日期',fontproperties='SimHei')plt.ylabel(u'收盤價(jià)',fontproperties='SimHei')plt.title(u'收盤價(jià)走勢圖',fontproperties='SimHei')plt.subplot(1,3,2)plt.bar(x2,y2)plt.xlabel(u'日期',fontproperties='SimHei')plt.ylabel(u'交易量',fontproperties='SimHei')plt.title(u'交易量趨勢圖',fontproperties='SimHei')plt.subplot(1,3,3)plt.pie(D,labels=list1,autopct='%1.2f%%')#保留小數(shù)點(diǎn)后兩位plt.title(u'月交易量分布圖',fontproperties='SimHei')plt.savefig('4')第7章
基礎(chǔ)案例案例介紹圖像繪制案例介紹第7章
今有中小板股票002001~002020共20個,以及2016年5月1日—2016年8月1日的交易數(shù)據(jù)StkcdTrddtClsprc0020012016-05-0320.990020012016-05-0420.420020012016-05-0520.490020012016-05-0618.70020012016-05-0918.670020012016-05-1019.07………………其中字段依次表示股票代碼、交易日期、收盤價(jià)。任務(wù)如下:(1)計(jì)算每只股票10日移動平均收盤價(jià)格數(shù)據(jù)。(2)繪制每只股票收盤價(jià)走勢圖和移動平均收盤價(jià)走勢圖,并用子圖的形式表示出來。案例介紹第7章
說明:每個figure按照2×2劃分,即每個figure繪制4只股票的收盤價(jià)走勢圖和移動平均價(jià)格走勢圖,20只股票則需要5個figure,使用循環(huán)的方式實(shí)現(xiàn)。提示:可以考慮使用Python中的取余運(yùn)算來實(shí)現(xiàn),取余符號為%,例如:0%4=01%4=12%4=23%4=34%4=05%4=16%4=27%4=38%4=09%4=1……凡是取余為0的時(shí)候都需要創(chuàng)建一個figure,在這個figure中繪制4個子圖。圖形繪制第7章
importpandasaspdimportnumpyasnpimportmatplotlib.pyplotasplttrd=pd.read_excel('trd.xlsx')#獲取股票代碼,并轉(zhuǎn)化為列表的形式c=trd['Stkcd'].value_counts()code=list(c.index)#動態(tài)計(jì)算需要q個figure,#其中每個figure繪制4個子圖,每個子圖代表一個股票#初始值設(shè)置q=0q=0#循環(huán)對每一個股票繪制其圖形foriinrange(20):
#第i個股票的收盤價(jià)記為p,并計(jì)算其移動平均價(jià)
#構(gòu)造繪圖的橫軸和縱軸坐標(biāo)值
p=trd.loc[trd['Stkcd'].values==code[i],'Clsprc']
avg_p=p.rolling(10).mean()
x1=np.arange(0,len(p))
y1=p.values
y2=avg_p[9:]
x2=np.arange(9,len(p))
#如果i與4整除,代表需要重新建一個figure(每個figure有4個子圖)
ifi%4==0:
q=q+1
plt.figure(q)
plt.figure(figsize=(8,6))
plt.subplot(2,2,i%4+1)
plt.tight_layout()#用于設(shè)置圖像外部邊緣自動調(diào)整
plt.plot(x1,y1)
plt.plot(x2,y2)
plt.savefig(str(q))圖形繪制第7章
第7章
基礎(chǔ)案例案例介紹指標(biāo)計(jì)算模型求解案例介紹第7章
滬深300指數(shù)作為中國股票價(jià)格指數(shù)的代表,也是中國股指期貨的標(biāo)的指數(shù),對其走勢預(yù)測具有積極的現(xiàn)實(shí)意義與應(yīng)用價(jià)值。今有滬深300指數(shù)2014年的交易數(shù)據(jù)。IndexcdIdxtrd01Idxtrd02Idxtrd03Idxtrd04Idxtrd05Idxtrd060003002014-01-022323.432325.992310.652321.98451942.90003002014-01-032311.972314.842280.892290.78597826.50003002014-01-062286.372286.372229.332238.646630040003002014-01-072222.312246.792218.6522384375310003002014-01-082240.642262.582228.422241.91513488.50003002014-01-092236.972258.892220.82222.22559870.40003002014-01-102216.522224.492200.222204.85541692.90003002014-01-1322072222.072183.62193.68501227.70003002014-01-142192.842214.122179.912212.85540499.50003002014-01-152210.022215.92193.82208.94489624……………………………………字段依次表示指數(shù)代碼、交易日期、開盤價(jià)、最高價(jià)、最低價(jià)、收盤價(jià)、成交量。案例介紹第7章
計(jì)算如下指標(biāo):A1(收盤價(jià)/均價(jià)):收盤價(jià)/過去10個交易日的移動平均收盤價(jià)。A2(現(xiàn)量/均量):成交量/過去10個交易日的移動平均成交量。A3(收益率):(當(dāng)日收盤價(jià)?前日收盤價(jià))/前日收盤價(jià)。A4(最高價(jià)/均價(jià)):最高價(jià)/過去10個交易日的移動均平均收盤價(jià)。A5(最低價(jià)/均價(jià)):最低價(jià)/過去10個交易日的移動平均收盤價(jià)。A6(極差):最高價(jià)?最低價(jià)(衡量波動性)。A7(瞬時(shí)收益):收盤價(jià)?開盤價(jià)。Y(決策變量):后交易日收盤價(jià)?當(dāng)前交易日收盤價(jià),如果大于0,記為1;如果小于等于0,記為?1。同時(shí)對指標(biāo)A1~A7做標(biāo)準(zhǔn)化處理:(當(dāng)前值?均值)/標(biāo)準(zhǔn)差,最終得到以下標(biāo)準(zhǔn)的數(shù)據(jù)結(jié)構(gòu)形式。IDA1A2A3A4A5A6A7Y123……取后30行數(shù)據(jù)作為測試樣本,剩下的數(shù)據(jù)作為訓(xùn)練樣本,分別利用神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、邏輯回歸模型進(jìn)行訓(xùn)練及測試,獲得對應(yīng)模型的準(zhǔn)確率和預(yù)測準(zhǔn)確率。指標(biāo)計(jì)算第7章
1.計(jì)算特征指標(biāo)X,即A1~A7importpandasaspdtd=pd.read_excel('index300.xlsx')A1=td['Idxtrd05']/td['Idxtrd05'].rolling(10).mean()A2=td['Idxtrd06']/td['Idxtrd06'].rolling(10).mean()A3=td['Idxtrd08']A4=td['Idxtrd03']/td['Idxtrd05'].rolling(10).mean()A5=td['Idxtrd04']/td['Idxtrd05'].rolling(10).mean()A6=td['Idxtrd03']-td['Idxtrd04']A7=td['Idxtrd05']-td['Idxtrd02']X={'A1':A1,'A2':A2,'A3':A3,'A4':A4,'A5':A5,'A6':A6,
'A7':A7}X=pd.DataFrame(X)X=X.iloc[9:-1,]#注意X從第10行數(shù)據(jù)開始,至倒數(shù)第1行指標(biāo)計(jì)算第7章
2.計(jì)算決策變量Y#錯位相減,獲得指數(shù)的漲跌額,即收盤指數(shù)序列中的第2個元素至最后一個元素對應(yīng)減去第1個元素至倒數(shù)第1個元素Y=td['Idxtrd05'].values[1:]-td['Idxtrd05'].values[:-1]#Y與X的下一個交易日對應(yīng),故Y的值從第11行數(shù)據(jù)開始#由于錯位相減是從第2行開始的,故指標(biāo)從第10行開始取Y=Y[9:]#走勢標(biāo)識設(shè)置Y[Y>0]=1Y[Y<=0]=-1#對應(yīng)的Y值Y=Y.reshape(len(Y),1)模型求解第7章
1.訓(xùn)練樣本與測試樣本的劃分x_train=X.iloc[:len(X)-30,:]Y_train=Y[:len(Y)-30]x_test=X.iloc[len(X)-30:,:]Y_test=Y[len(Y)-30:]2.模型訓(xùn)練與求解#支持向量機(jī)模型fromsklearnimportsvmclf=svm.SVC(kernel='rbf')clf.fit(x_train,Y_train)rv1=clf.score(x_train,Y_train);R=clf.predict(x_test)R=R.reshape(len(R),1)Z=R-Y_testRs1=len(Z[Z==0])/len(Z)第7章
基礎(chǔ)案例案例介紹案例分析及計(jì)算案例介紹第7章
以申萬行業(yè)分類表中“計(jì)算機(jī)”行業(yè)所有上市公司2015年的盈利能力指標(biāo)數(shù)據(jù)為基礎(chǔ)字段名稱指標(biāo)名稱說明F050502B凈資產(chǎn)收益率B凈利潤/股東權(quán)益平均余額(X1)F050102B資產(chǎn)報(bào)酬率B(利潤總額+財(cái)務(wù)費(fèi)用)/平均資產(chǎn)總額(X2)F050202B總資產(chǎn)凈利潤率B凈利潤/總資產(chǎn)平均余額(X3)F051201B投入資本回報(bào)率(凈利潤+財(cái)務(wù)費(fèi)用)/(資產(chǎn)總計(jì)?流動負(fù)債+應(yīng)付票據(jù)+短期借款+一年內(nèi)到期的非流動負(fù)債)(X4)F051501B營業(yè)凈利率凈利潤/營業(yè)收入(X5)F053301B營業(yè)毛利率(營業(yè)收入?營業(yè)成本)/營業(yè)收入(X6)F051401B營業(yè)利潤率營業(yè)利潤/營業(yè)收入(X7)F052101B成本費(fèi)用利潤率(利潤總額)/(營業(yè)成本+銷售費(fèi)用+管理費(fèi)用+財(cái)務(wù)費(fèi)用)(X8)采用K-均值聚類算法,將上市公司分為5類,并計(jì)算每類公司當(dāng)年的總利潤平均增長率每類公司當(dāng)年的總利潤平均增長率=(該類公司當(dāng)年的總利潤平均值-該類公司上年的總利潤平均值)/該類公司上年的總利潤平均值。每類公司當(dāng)年的總利潤平均值=(該類別中所有公司當(dāng)年利潤之和)/該類別的公司數(shù)量案例分析及計(jì)算第7章
1.獲取2015年所有公司股票的財(cái)務(wù)指標(biāo)數(shù)據(jù)importpandasaspdimportnumpyasnpdata=pd.read_excel('財(cái)務(wù)指標(biāo)數(shù)據(jù).xlsx')data2=data.iloc[:,[0,2,3,4,5,6,7,8,9]]案例分析及計(jì)算第7章
2.對財(cái)務(wù)指標(biāo)數(shù)據(jù)進(jìn)行清洗#去掉小于0的指標(biāo)值和nan值data2=data2[data2>0]data2=data2.dropna()3.對財(cái)務(wù)指標(biāo)數(shù)據(jù)進(jìn)行異常值處理#數(shù)據(jù)轉(zhuǎn)化為Numpy數(shù)組的形式,同時(shí)每個大于其均值8倍的指標(biāo)視為異常值,并刪掉data2=data2.valuesforiinrange(1,9):data2=data2[data2[:,i]<8*np.mean(data2[:,i]),:]案例分析及計(jì)算第7章
4.選擇“計(jì)算機(jī)”行業(yè)所有上市公司的數(shù)據(jù)(本步驟可以通過內(nèi)連接關(guān)聯(lián)獲?。念A(yù)處理過的財(cái)務(wù)指標(biāo)數(shù)據(jù)中選擇申萬行業(yè)分類表中“計(jì)算機(jī)”行業(yè)所有上市公司的數(shù)據(jù)。其處理過程分兩步。(1)獲取申萬行業(yè)分類表中“計(jì)算機(jī)”行業(yè)所有上市公司的股票代碼。
dta=pd.read_excel('申萬行業(yè)分類.xlsx')
#申萬行業(yè)分類表中“計(jì)算機(jī)”行業(yè)所有上市公司股票代碼
stkcd=dta.loc[dta['行業(yè)名稱'].values=='計(jì)算機(jī)','股票代碼'].values案例分析及計(jì)算第7章
4.選擇“計(jì)算機(jī)”行業(yè)所有上市公司的數(shù)據(jù)執(zhí)行算法如下:Step1:獲取預(yù)處理過的財(cái)務(wù)指標(biāo)數(shù)據(jù)data2中的所有代碼,s=data2[:,0]。Step2:s循環(huán)地與申萬行業(yè)分類表中“計(jì)算機(jī)”行業(yè)所有上市公司股票代碼stkcd做存在性判斷。Step3:得到滿足判斷條件的邏輯數(shù)組I,以I作為邏輯索引,取data2表中的元素即可。s=data2[:,0]I=s==stkcd[0]foriinrange(1,len(stkcd)):I1=s==stkcd[i]I=I|I1ddata=data2[I,:]#申萬行業(yè)分類表中“計(jì)算機(jī)”行業(yè)所有上市公司股票代碼對應(yīng)的財(cái)務(wù)數(shù)據(jù)#提取申萬行業(yè)分類表中“計(jì)算機(jī)”行業(yè)所有上市公司股票碼對應(yīng)的財(cái)務(wù)指標(biāo)數(shù)據(jù)X,用來做主成分分析。X=ddata[:,1:](2)從預(yù)處理過的財(cái)務(wù)指標(biāo)數(shù)據(jù)中選擇滿足條件的數(shù)據(jù)。案例分析及計(jì)算第7章
5.對指標(biāo)數(shù)據(jù)X做標(biāo)準(zhǔn)化處理#這里采用極差法進(jìn)行標(biāo)準(zhǔn)化。fromsklearn.preprocessingimportMinMaxScalerscaler=MinMaxScaler()scaler.fit(X)X=scaler.transform(X)6.對標(biāo)準(zhǔn)化后的X做主成分分析fromsklearn.decompositionimportPCApca=PCA(n_components=0.95)#累計(jì)貢獻(xiàn)率為95%Y=pca.fit_transform(X)#提取的主成分tzxl=ponents_#返回特征向量gxl=pca.explained_variance_ratio_#返回主成分方差百分比(貢獻(xiàn)率)#對主成分Y做標(biāo)準(zhǔn)化處理(極差法)scaler=MinMaxScaler()scaler.fit(Y)Y=scaler.transform(Y)案例分析及計(jì)算第7章
Y1=0.3583×X1+0.3777×X2+0.4025×X3+0.4337×X4+0.375×X5+0.2696×X6+0.3205×X7+0.2508×X8Y2=0.3593×X1+0.1897×X2+0.1434×X4+0.4053×X4?0.3458×X5?0.658×X6?0.2331×X7?0.2076×X8Y3=0.0673×X1+0.0213×X2?0.0006×X3+0.32×X4?0.3328×X5+0.6801×X6?0.4713×X7?0.3118×X8Y1-綜合盈利能力因子;Y2-產(chǎn)品競爭力因子;Y3-管理能力因子案例分析及計(jì)算第7章
7.K-均值聚類分析fromsklearn.clusterimportKMeansmodel=KMeans(n_clusters=5,random_state=0,max_iter=1000)model.fit(Y)c=model.labels_#類標(biāo)簽center=model.cluster_centers_#聚類中心center=pd.DataFrame(center)center.columns=['Y1','Y2','Y3']案例分析及計(jì)算第7章
7.K-均值聚類分析Fs=pd.Series(c,index=ddata[:,0])Fs=Fs.sort_values()co=pd.read_excel('公司基本信息表.xlsx')co1=pd.Series(co['Stknme'].values,index=co['Stkcd'].values)foriinrange(5):
q=co1[Fs[Fs==i].index]
q=pd.DataFrame(q)
q.to_excel('c'+str(i)+'.xlsx')類別股票代碼0科遠(yuǎn)股份、合眾思壯、易聯(lián)眾、初靈信息、數(shù)碼科技、御銀股份、長亮科技、新國都、安碩信息、匯金股份、北信源、創(chuàng)業(yè)軟件、華平股份、久其軟件、華力創(chuàng)通、銀之杰、方直科技、美亞柏科、榕基軟件、東方通、英飛拓、新北洋、旋極信息、中威電子、科大訊飛、迪威迅、威創(chuàng)股份、新開普、立思辰、任子行、輝煌科技、天璣科技、遠(yuǎn)光軟件1運(yùn)達(dá)科技、朗瑪信息、華銘智能、東方國信、捷成股份、兆日科技、二三四五、康拓紅外、聯(lián)絡(luò)互動、思維列控、拓爾思、東方網(wǎng)力、世紀(jì)瑞爾2深科技、中科金財(cái)、太極股份、常山北明、浩豐科技、潤和軟件、航天長峰、高偉達(dá)、證通電子、川大智勝、寶信軟件、南天信息、皖通科技、金財(cái)互聯(lián)、四方精創(chuàng)、神州泰岳、萬達(dá)信息、云賽智聯(lián)、索菱股份、飛利信、方正科技、京天利、同有科技、漢鼎宇佑、創(chuàng)意信息、達(dá)實(shí)智能、數(shù)字政通、達(dá)華智能、千方科技、紫光股份、漢邦高科、易華錄、石基信息、榮之聯(lián)、中遠(yuǎn)???、天源迪科、華勝天成、海蘭信、朗科科技、東軟集團(tuán)、榮科科技、同方股份、賽為智能、南威軟件、*ST中安3博彥科技、中科創(chuàng)達(dá)、久遠(yuǎn)銀海、金橋信息、華東電腦、華宇軟件、藍(lán)盾股份、浙大網(wǎng)新、浪潮軟件、真視通、捷順科技、航天信息、金證股份、銀信科技、浪潮信息、信息發(fā)展、飛天誠信、佳都科技、聚龍股份、衛(wèi)士通、信雅達(dá)、神州信息、廣電運(yùn)通、浩云科技、新大陸、中科曙光、東華軟件、神思電子、衛(wèi)寧健康、恒華科技、漢得信息4贏時(shí)勝、廣聯(lián)達(dá)、超圖軟件、用友網(wǎng)絡(luò)、恒生電子、綠盟科技、四維圖新、啟明星辰案例分析及計(jì)算第7章
8.計(jì)算每類公司2015年總利潤平均值增長率rd=pd.read_excel('利潤數(shù)據(jù).xlsx')r_c=[]#預(yù)定義每個類別總利潤平均增長率forninrange(5):#獲得第n類股票代碼列表cn=list(Fs[Fs==n].index)#預(yù)定義第n類股票2014年和2015年的總利潤值r1_n=0r2_n=0#循環(huán)地對第n類中的每個股票進(jìn)行計(jì)算fortincn:#第n類股票中第t只股票I1=rd['Accper'].values=='2014-12-31'I2=rd['Accper'].values=='2015-12-31'I3=rd['Stkcd'].values==tindex1=I1&I3index2=I2&I3
#第n類股票中第t只股票2014年的利潤值r1=rd.loc[index1,'B002000101'].values#第n類股票中第t只股票2015年的利潤值r2=rd.loc[index2,'B002000101'].valuesiflen(r1)>0:r1_n=r1_n+r1iflen(r2)>0:r2_n=r2_n+r2#第n類股票2015年的總利潤平均值p2=r2_n/len(cn)#第n類股票2014年的總利潤平均值p1=r1_n/len(cn)#將總利潤平均增長率添加到r_c中r_c.append((p2-p1)/p1)#將每個類別的總利潤平均增長率添加到聚類中心后面列r_c=np.array(r_c)dt=np.hstack((center.values,r_c))dtt=pd.DataFrame(dt)dtt.columns=['Y1','Y2','Y3','r_c']案例分析及計(jì)算第7章
8.計(jì)算每類公司2015年總利潤平均值增長率中r_c列為各類公司的總利潤平均增長率。從圖7-21中可以看出,第2類(index為1)上市公司的綜合盈利能力最強(qiáng),而且其產(chǎn)品競爭力和管理能力也相對較好,最終結(jié)果也可以看出,當(dāng)年的總利潤平均增長率也最高第7章
基礎(chǔ)案例問題描述數(shù)據(jù)預(yù)處理關(guān)聯(lián)規(guī)則挖掘問題描述第7章
為了探討國際上主要股票價(jià)格指數(shù)之間的漲跌關(guān)聯(lián)情況,選取12個主要國家或者地區(qū)中具有代表性的股票價(jià)格指數(shù)交易數(shù)據(jù),數(shù)據(jù)表包括國際股票價(jià)格指數(shù)基本信息表和國際股票價(jià)格指數(shù)日交易數(shù)據(jù)表。IndexcdIdxnmeDJI美國道瓊斯工業(yè)指數(shù)FCHI法國CAC40指數(shù)FTSE英國富時(shí)100指數(shù)GDAXI德國DAX指數(shù)HSI中國香港恒生指數(shù)KS11韓國KOSPI指數(shù)MCIX俄羅斯Micex指數(shù)N225日本日經(jīng)225SENSEX印度孟買30指數(shù)STI富時(shí)新加坡海峽時(shí)報(bào)指數(shù)TWII中國臺灣加權(quán)指數(shù)000300中國滬深300指數(shù)IndexcdTrddtOpnidxHighidxLowidxClsidxDJI2010-01-0410430.6910604.9710430.6910583.96DJI2010-01-0510584.5610584.5610522.5210572.02DJI2010-01-0610564.7210594.9910546.5510573.68DJI2010-01-0710571.1110612.3710505.2110606.86DJI2010-01-0810606.410619.410554.3310618.19DJI2010-01-1110620.3110676.2310591.5910663.99DJI2010-01-1210662.8610663.0810568.8410627.26………………………………其中字段依次為指數(shù)代碼、交易日期、開盤指數(shù)、最高指數(shù)、最低指數(shù)、收盤指數(shù)。數(shù)據(jù)區(qū)間從2010年1月至2019年8月。問題:在一國或地區(qū)由于受某事件的影響造成其主要股票價(jià)格指數(shù)下跌幅度較大時(shí),另一國或地區(qū)的主要股票價(jià)格指數(shù)在同期是否也會有較大幅度的下跌?注意,這里下跌幅度較大定義為:跌幅大于等于0.5%。數(shù)據(jù)預(yù)處理第7章
(1)計(jì)算各指數(shù)的跌幅指標(biāo)數(shù)據(jù),其中跌幅計(jì)算公式為:
(當(dāng)日收盤指數(shù)?上日收盤指數(shù))/上日收盤指數(shù)為了便于關(guān)聯(lián)規(guī)則挖掘,我們將跌幅指標(biāo)數(shù)據(jù)轉(zhuǎn)化為0、1布爾值,即跌幅大于等于0.5%記為1,否則為0。圖中第一行代表了中國滬深300指數(shù)的跌幅數(shù)據(jù),其中2010年1月5日的值為0,表示跌幅沒有超過0.5%,而2010年1月6日的值為1,表示當(dāng)日跌幅超過了0.5%。數(shù)據(jù)預(yù)處理第7章
(2)各指數(shù)交易日期做一致化處理。事實(shí)上,不同國家或地區(qū)的交易日期并不完全相同,為了便于挖掘有意義的關(guān)聯(lián)規(guī)則,需要在所有指數(shù)交易日均相同的情況下進(jìn)行挖掘。這里以中國滬深300指數(shù)交易日為篩選基準(zhǔn)。顯示12個國際指數(shù),2010年1月至2019年8月的共同交易日一共1569個,基于一致化的交易日期,就可以構(gòu)造關(guān)聯(lián)規(guī)則挖掘所需的布爾數(shù)據(jù)集了。數(shù)據(jù)預(yù)處理第7章
(3)構(gòu)造關(guān)聯(lián)規(guī)則挖掘所需的布爾值數(shù)據(jù)集,其結(jié)果如下。道瓊斯工業(yè)指數(shù)DJI在2010年1月15日的收盤指數(shù)跌幅在0.5%以上,中國滬深300指數(shù)當(dāng)日的收盤指數(shù)跌幅低于0.5%,而且12個國際指數(shù)交易日期也做了一致化處理,下面將基于該數(shù)據(jù)集挖掘關(guān)聯(lián)規(guī)則。關(guān)聯(lián)規(guī)則挖掘第7章
采用第5章介紹的一對一關(guān)聯(lián)規(guī)則挖掘算法,最小支持度設(shè)置為大于0.1,最小置信度為大于0.6。c=list(Data.columns)c0=0.6#最小置信度s0=0.1#最小支持度list1=[]#預(yù)定義定義列表list1,用于存放規(guī)則list2=[]#預(yù)定義定義列表list2,用于存放規(guī)則的支持度list3=[]#預(yù)定義定義列表list3,用于存放規(guī)則的置信度forkinrange(len(c)):forqinrange(len(c)):
#對第c[k]個項(xiàng)與第c[q]個項(xiàng)挖掘關(guān)聯(lián)規(guī)則
#規(guī)則的前件為c[k]
#規(guī)則的后件為c[q]
#要求前件和后件不相等ifc[k]!=c[q]:c1=Data[c[k]]c2=Data[c[q]]
I1=c1.values==1I2=c2.values==1
t12=np.zeros((len(c1)))t1=np.zeros((len(c1)))t12[I1&I2]=1t1[I1]=1sp=sum(t12)/len(c1)#支持度co=sum(t12)/sum(t1)#置信度
#取置信度大于等于c0的關(guān)聯(lián)規(guī)則ifco>=c0andsp>=s0:list1.append(c[k]+'--'+c[q])list2.append(sp)list3.append(co)#定義字典,用于存放關(guān)聯(lián)規(guī)則及其置信度、支持度
R={'rule':list1,'support':list2,'confidence':list3}#將字典轉(zhuǎn)化為數(shù)據(jù)框R=pd.DataFrame(R)#將結(jié)果導(dǎo)出到ExcelR.to_excel('rule1.xlsx')關(guān)聯(lián)規(guī)則挖掘第7章
IDrulesupportconfidence1DJI--FCHI0.13001910.682DJI--GDAXI0.12109620.6333333333FCHI--FTSE0.19184190.6644591614FCHI--GDAXI0.22498410.7792494485FTSE--FCHI0.19184190.7757731966FTSE--GDAXI0.18419380.7448453617GDAXI--FCHI0.22498410.8364928918GDAXI--FTSE0.18419380.6848341239KS11--HSI0.13957930.63662790710KS11--N2250.1389420.6337209311STI--HSI0.14404080.704049844一對一關(guān)聯(lián)規(guī)則挖掘結(jié)果如下:支持度在0.1以上、置信度在0.6以上的有11個關(guān)聯(lián)規(guī)則,其中置信度最高達(dá)83.65%,即德國DAX指數(shù)和法國CAC40指數(shù),其意義表示如果德國DAX指數(shù)下跌幅度大于等于0.5%,那么同期法國CAC40指數(shù)下跌幅度大于等于0.5%的可能性為83.65%。第8章
上市公司綜合評價(jià)指標(biāo)選擇、數(shù)據(jù)處理主成分分析與綜合排名投資組合收益率計(jì)算與量化投資策略設(shè)計(jì)基于總體規(guī)模與投資效率指標(biāo)的綜合評價(jià)(指標(biāo)選擇)第8章
字段名稱字段中文名稱字段說明Stkcd股票代碼Accper會計(jì)年度2013-12-31、2014-12-31、2015-12-31、2016-12-31、2017-12-31B0011010
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024-2030年中國嬰幼兒營養(yǎng)米粉行業(yè)營銷模式及未來5發(fā)展趨勢報(bào)告
- 2024-2030年中國地鐵廣告行業(yè)趨勢研究與投資價(jià)值分析報(bào)告
- 2024年度健身房裝修設(shè)計(jì)合同范本6篇
- 2024年物聯(lián)網(wǎng)平臺建設(shè)合同
- 眉山藥科職業(yè)學(xué)院《冶金資源綜合利用》2023-2024學(xué)年第一學(xué)期期末試卷
- 2024年版礦物材料交易合同
- 2024年標(biāo)準(zhǔn)版噴漿作業(yè)人員勞動協(xié)議一
- 閱讀是一個專門的領(lǐng)域
- 四川省樂山市2019-2020學(xué)年高二下學(xué)期期末考試化學(xué)試題(解析版)
- 2024停薪留職員工技能提升與職業(yè)發(fā)展合同范本3篇
- 2024年高考英語作文預(yù)測:倡議書(附答案解析)
- 安徽省2023-2024學(xué)年七年級上學(xué)期期末數(shù)學(xué)試題(原卷版)
- 2024年人教版八年級生物(上冊)期末試卷及答案(各版本)
- 農(nóng)作物病蟲害防治的社會經(jīng)濟(jì)效益分析考核試卷
- 2023年全國職業(yè)院校技能大賽-商務(wù)數(shù)據(jù)分析賽項(xiàng)規(guī)程
- 第五單元 大單元教學(xué)設(shè)計(jì)-【大單元教學(xué)】2024-2025學(xué)年七年級語文上冊同步備課系列(統(tǒng)編版2024)
- 《林火生態(tài)與管理》實(shí)驗(yàn)報(bào)告
- 【課件】紀(jì)念與象征-空間中的實(shí)體藝術(shù)+課件-高中美術(shù)人美版(2019)美術(shù)鑒賞
- JB∕T 11864-2014 長期堵轉(zhuǎn)力矩電動機(jī)式電纜卷筒
- SL352水工混凝土試驗(yàn)規(guī)程
- 2024年云南中考?xì)v史試卷試題答案解析及備考指導(dǎo)課件(深度解讀)
評論
0/150
提交評論