從網(wǎng)絡(luò)結(jié)構(gòu)模型識(shí)別“中心資產(chǎn)”_第1頁(yè)
從網(wǎng)絡(luò)結(jié)構(gòu)模型識(shí)別“中心資產(chǎn)”_第2頁(yè)
從網(wǎng)絡(luò)結(jié)構(gòu)模型識(shí)別“中心資產(chǎn)”_第3頁(yè)
從網(wǎng)絡(luò)結(jié)構(gòu)模型識(shí)別“中心資產(chǎn)”_第4頁(yè)
從網(wǎng)絡(luò)結(jié)構(gòu)模型識(shí)別“中心資產(chǎn)”_第5頁(yè)
已閱讀5頁(yè),還剩8頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、正文目錄 HYPERLINK l _TOC_250010 金融市場(chǎng)的層級(jí)結(jié)構(gòu)特性 3 HYPERLINK l _TOC_250009 網(wǎng)絡(luò)結(jié)構(gòu)模型 3 HYPERLINK l _TOC_250008 設(shè)定鄰接矩陣 3 HYPERLINK l _TOC_250007 基于互信息率的節(jié)點(diǎn)關(guān)系度量 4 HYPERLINK l _TOC_250006 基于時(shí)間動(dòng)態(tài)規(guī)整的節(jié)點(diǎn)關(guān)系度量 4 HYPERLINK l _TOC_250005 網(wǎng)絡(luò)結(jié)構(gòu)優(yōu)化 5 HYPERLINK l _TOC_250004 基于中心性的網(wǎng)絡(luò)分析 6 HYPERLINK l _TOC_250003 基于網(wǎng)絡(luò)中心度的選股因子 7

2、HYPERLINK l _TOC_250002 中心度的時(shí)序分析 8 HYPERLINK l _TOC_250001 中心度因子在選股上的應(yīng)用 10 HYPERLINK l _TOC_250000 參考文獻(xiàn) 13圖表目錄圖 1:20 只股票的全連接樹(shù)與最小生成樹(shù)示例 6圖 2:2020 年 12 月與 2019 年 12 月滬深 300 成分股的最小生成樹(shù) 8圖 3:2015 年 12 月與 2010 年 12 月滬深 300 成分股的最小生成樹(shù) 8圖 4:滬深 300 成分股的度中心性均值與波動(dòng)率 9圖 5:滬深 300 成分股的緊密中心性均值與波動(dòng)率 9圖 6:滬深 300 成分股的介數(shù)中

3、心性均值與波動(dòng)率 9圖 7:滬深 300 成分股的度中心性均值與波動(dòng)率 10圖 8:滬深 300 成分股的緊密中心性均值與波動(dòng)率 10圖 9:滬深 300 成分股中心度等權(quán)得分因子頭尾分組測(cè)試 11圖 10:滬深 300 成分股中心度加權(quán)得分因子頭尾分組測(cè)試 11圖 11:滬深 300 成分股中心度得分因子五分組測(cè)試 11表 1:滬深 300 成分股中心度得分因子分組測(cè)試績(jī)效指標(biāo) 12金融市場(chǎng)的層級(jí)結(jié)構(gòu)特性金融市場(chǎng)是高度復(fù)雜的系統(tǒng),宏觀經(jīng)濟(jì)形勢(shì)、中觀行業(yè)景氣度和微觀企業(yè)經(jīng)營(yíng)的變動(dòng)都在系統(tǒng)內(nèi)部實(shí)現(xiàn)信息交互,并影響參與者的決策與博弈進(jìn)而反映在資產(chǎn)價(jià)格上。長(zhǎng)期來(lái)看,在合理的觀察視角下,金融市場(chǎng)是動(dòng)態(tài)

4、均衡的,均衡性反映在觀察維度與客觀規(guī)律的匹配,動(dòng)態(tài)性反映在短期收益風(fēng)險(xiǎn)和長(zhǎng)期收益風(fēng)險(xiǎn)的取舍。例如,股票市場(chǎng)的長(zhǎng)期增速取決于一國(guó)經(jīng)濟(jì)的增長(zhǎng)水平,盡管一國(guó)經(jīng)濟(jì)長(zhǎng)期低迷時(shí)股票市場(chǎng)難有上佳的表現(xiàn),但短期流動(dòng)性刺激會(huì)引起風(fēng)險(xiǎn)偏好提升,市場(chǎng)估值中樞會(huì)產(chǎn)生偏離。那些基于短期流動(dòng)性視角的投資者相對(duì)盈利驅(qū)動(dòng)的投資者容易捕獲這一收益。然而,對(duì)市場(chǎng)參與者而言,尋找到一個(gè)長(zhǎng)期有效的觀察視角是十分困難的,從多個(gè)局部有效的觀察視角去研判和決策也面臨著權(quán)重分配問(wèn)題。經(jīng)典的周期分析、多維打分、因子擇時(shí)等方法都或多或少在試圖解決這一問(wèn)題。特別地,在 2020 年市場(chǎng)經(jīng)歷疫情初期的大幅下挫后,受益刺激政策和復(fù)蘇預(yù)期,一眾核心資產(chǎn)

5、大幅上漲,市場(chǎng)“二八”分化明顯,滬深 300 指數(shù)相對(duì)中證 500 指數(shù)跑贏明顯,IF 和 IC 明顯差異的升貼水結(jié)構(gòu)也表明投資者對(duì)“大而美”的偏好。盡管在 2021 年初,不少“明星公司”出現(xiàn)了一定的獲利回吐,但長(zhǎng)期資金的配置性流入使得整體估值水平并未下挫,白馬公司依然是市場(chǎng)關(guān)注的焦點(diǎn)。在一致的審美預(yù)期下,“抱團(tuán)組合”內(nèi)部呈現(xiàn)明顯的聯(lián)動(dòng)性,而與邊緣資產(chǎn)的關(guān)聯(lián)性相對(duì)弱化,即呈現(xiàn)出一定的層級(jí)結(jié)構(gòu)特性。學(xué)術(shù)研究也表明,金融系統(tǒng)通常具有層級(jí)結(jié)構(gòu)的屬性(Simon, 1962),網(wǎng)絡(luò)模型作為層級(jí)結(jié)構(gòu)模型的代表,與金融系統(tǒng)內(nèi)部相互作用的特點(diǎn)具有匹配性。抽象而言,一些股票具有相似的風(fēng)險(xiǎn)偏好屬性,而一些股票

6、價(jià)格波動(dòng)上幾乎毫無(wú)關(guān)聯(lián)。因此,我們?cè)噲D從股票之間非線性關(guān)聯(lián)性的視角,結(jié)合網(wǎng)絡(luò)結(jié)構(gòu)模型的建模思想和網(wǎng)絡(luò)理論的工程工具,識(shí)別具有超配價(jià)值的“中心資產(chǎn)”。網(wǎng)絡(luò)結(jié)構(gòu)模型網(wǎng)絡(luò)模型最基本的數(shù)據(jù)結(jié)構(gòu)是圖 = (, ),其中代表節(jié)點(diǎn),代表邊。對(duì)應(yīng)在股票市場(chǎng)上,我們用圖結(jié)構(gòu)里的節(jié)點(diǎn)來(lái)表示某一股票池中的股票,用邊來(lái)表示股票之間的關(guān)系。假如兩兩股票之間存在某種關(guān)聯(lián),則兩者所表示的節(jié)點(diǎn)之間有邊相連,若兩兩股票之間沒(méi)有關(guān)聯(lián),則相應(yīng)節(jié)點(diǎn)之間不存在邊連接。在此基礎(chǔ)上,我們可以對(duì)任意兩個(gè)節(jié)點(diǎn)間的邊賦予權(quán)重(即節(jié)點(diǎn)的距離或者邊的長(zhǎng)度),以表示節(jié)點(diǎn)所代表的股票之間關(guān)聯(lián)性的強(qiáng)弱。對(duì)于互相沒(méi)有關(guān)聯(lián)性的股票,邊的權(quán)重為零和不存在邊相連

7、是完全等價(jià)的。通過(guò)選擇不同的賦權(quán)方法,并設(shè)置一定的規(guī)則來(lái)優(yōu)化結(jié)構(gòu),就可以得到目標(biāo)的網(wǎng)絡(luò)結(jié)構(gòu)模型。由此,我們將網(wǎng)絡(luò)模型的構(gòu)建拆解成鄰接矩陣設(shè)定和網(wǎng)絡(luò)結(jié)構(gòu)優(yōu)化兩個(gè)步驟。設(shè)定鄰接矩陣設(shè)定邊的權(quán)重是構(gòu)建鄰接矩陣時(shí)最核心的部分,它直接影響網(wǎng)絡(luò)的性能。其物理含義就是如何更好地刻畫(huà)股票之間的相關(guān)性。常用的皮爾遜相關(guān)性系數(shù)(Pearson Correlation)只適合用于量化線性的相關(guān)性,斯皮爾曼相關(guān)性系數(shù)雖有捕獲部分非線性關(guān)系的能力,但并沒(méi)有改變計(jì)算原理,且損失了原有分布的信息。然而,隨著研究的深入,人們?cè)桨l(fā)意識(shí)到單純的線性關(guān)系很難完全描述復(fù)雜的金融系統(tǒng)內(nèi)部事物的關(guān)系?;诨バ畔⒙实墓?jié)點(diǎn)關(guān)系度量針對(duì)股票的

8、收益率序列,我們首先考慮使用互信息率這一指標(biāo)來(lái)描述兩兩之間的關(guān)系。由于收益率之間的相關(guān)性函數(shù)是未知的,互信息率這類非參數(shù)指標(biāo)就非常適用。簡(jiǎn)單來(lái)說(shuō)互信息率可以量化兩個(gè)隨機(jī)變量之間共享了多少信息,從而很好地捕捉到隨機(jī)變量間的線性和非線性關(guān)系。互信息率是從信息理論中熵的概念而來(lái),表達(dá)形式如下:() = () ()其中是隨機(jī)變量的概率密度函數(shù)。此時(shí),若有另一隨機(jī)變量,令,為和的聯(lián)合概率密度函數(shù),那么和的聯(lián)合熵為:() = ,(, ),(, )那么我們可以用熵的表達(dá)式來(lái)定義互信息率: (, ) = () + () (, )即: (, ) = ,(, )(, ), ()()通過(guò)以上方式計(jì)算所得互信息率是非

9、負(fù)的,當(dāng)且僅當(dāng)和相互獨(dú)立時(shí)為 0。在此基礎(chǔ)上,我們將互信息率進(jìn)行歸一化,并轉(zhuǎn)換為節(jié)點(diǎn)的距離。我們期望越接近于 0 時(shí)表示兩個(gè)變量間關(guān)系緊密,當(dāng)越接近于 1 時(shí)表示兩個(gè)變量間關(guān)系疏遠(yuǎn)。因此,可以表示為:(, ) = 1 1 (2(, )應(yīng)當(dāng)注意的是,我們多數(shù)時(shí)候?qū)⒐善笔找媛市蛄幸暈檫B續(xù)變量,直接計(jì)算兩兩股票的互信息或許并不合意,Meyer(2012)等學(xué)者研究表明對(duì)在計(jì)算資產(chǎn)收益率相關(guān)變量的互信息時(shí)需要進(jìn)行一定的離散化處理,如等頻率分割收益率區(qū)間。實(shí)際上,我們?cè)谘芯窟^(guò)程中同樣發(fā)現(xiàn)離散化處理后計(jì)算的距離有更明顯的區(qū)分度。基于時(shí)間動(dòng)態(tài)規(guī)整的節(jié)點(diǎn)關(guān)系度量盡管使用互信息率可以捕獲股票收益率序列之間共享的

10、信息量,但是它忽視了時(shí)間序列本身的特性。同時(shí),我們?cè)谟?jì)算互信息率時(shí)依然需要對(duì)收益率序列進(jìn)行離散化處理,這也損失了一定的信息量。因此,我們引入動(dòng)態(tài)時(shí)間規(guī)整這一算法來(lái)幫助我們更好地度量節(jié)點(diǎn)關(guān)系。動(dòng)態(tài)時(shí)間規(guī)整算法(Dynamic Time Warping)最早由日本學(xué)者 Itakura 在上世紀(jì) 70 年代提出的,在處理非等長(zhǎng)時(shí)間序列相似性上具有廣泛的應(yīng)用,如孤立詞語(yǔ)音識(shí)別等模板匹配任務(wù)。非等長(zhǎng)時(shí)間序列并不是絕對(duì)的長(zhǎng)度意義,而是重點(diǎn)應(yīng)對(duì)局部存在分形、時(shí)間軸扭曲的問(wèn)題。例如,即使兩段內(nèi)容完全相同的語(yǔ)音序列,但因個(gè)別詞語(yǔ)上存在抑揚(yáng)頓挫的區(qū)別,反映在時(shí)間軸上就存在非對(duì)齊的問(wèn)題。同樣,在金融市場(chǎng)上,相同行業(yè)

11、的兩只股票通常具有長(zhǎng)期的相關(guān)性,但在局部序列上,股票 A 因行業(yè)事件率先上漲,而股票 B 相對(duì)滯后但逐步跟隨,形成前后峰。由于 K 線本身是等時(shí)間劃分的,在這一情形下傳統(tǒng)歐式距離度量相關(guān)性方法都難以納入錯(cuò)位和分形的影響。令 P 和 Q 分別代表 T 的時(shí)間序列(n 個(gè)點(diǎn))。兩者的歐式距離(Euclidean Distance)可以表示為:(, ) = ( )2=1顯然,ED 在處理序列時(shí)采取一對(duì)一的模式。而 DTW 可以處理一對(duì)多的模式,它實(shí)際上轉(zhuǎn)化成了一個(gè)優(yōu)化問(wèn)題:構(gòu)建一個(gè)(n,n)的矩陣 M,其中,表示和的歐式距離。從起點(diǎn)1,1到終點(diǎn),的路徑中,搜索具有最小矩陣元素之和的路徑。該路徑元素的

12、總和就是 DTW 距離。DTW 核心在于搜索最優(yōu)路徑,動(dòng)態(tài)規(guī)劃涉及到較高的計(jì)算復(fù)雜度,在處理多變量時(shí)間序列匹配時(shí)候存在迭代計(jì)算開(kāi)銷過(guò)大的問(wèn)題,可根據(jù)需要選擇合適的加速算法。由于我們研究輸入序列 P 和 Q 是收益率轉(zhuǎn)化而來(lái)的凈值序列,不需要特殊的加速算法。網(wǎng)絡(luò)結(jié)構(gòu)優(yōu)化利用上述方法度量?jī)蓛晒?jié)點(diǎn)之間的關(guān)系,我們可以得到所有元素大于等于 0 的鄰接矩陣,即我們可以構(gòu)建出一個(gè)完全連接的網(wǎng)絡(luò)模型。然而,一個(gè)節(jié)點(diǎn)的完全連接網(wǎng)絡(luò)擁有( 1)/2條邊,假如我們以滬深 300 的成分股來(lái)建模,此時(shí)我們需要計(jì)算 44850 條邊,這對(duì)我們后續(xù)評(píng)估網(wǎng)絡(luò)中節(jié)點(diǎn)的重要性或中心度產(chǎn)生了極大的困難。另外,如此量級(jí)的邊數(shù)本身

13、具有取舍性,對(duì)一些相關(guān)性微弱的股票,我們完全有理由基于一定的規(guī)則進(jìn)行剔除,以實(shí)現(xiàn)優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu)的目標(biāo)。最直接的方法是,我們?cè)?2.1 計(jì)算得到邊的權(quán)重(節(jié)點(diǎn)距離)時(shí),將超過(guò)一定閾值的邊刪除。例如,當(dāng)某兩只股票的距離超過(guò) 0.8 時(shí),對(duì)應(yīng)節(jié)點(diǎn)刪除邊。優(yōu)化的方法是根據(jù)該網(wǎng)絡(luò)所有的邊的橫截面分布進(jìn)行右尾截?cái)?,如刪除距離超過(guò) 90%分位數(shù)的邊。以閾值刪除邊的好處是極大節(jié)省了計(jì)算時(shí)間,但其優(yōu)化目標(biāo)并不明確。因此,我們考慮使用非監(jiān)督學(xué)習(xí)中的最小生成樹(shù)算法。最小生成樹(shù)算法通過(guò)把高度連接的網(wǎng)絡(luò)合理剪枝,在舍棄一部分連接的同時(shí)最大限度保留網(wǎng)絡(luò)的有效結(jié)構(gòu),從而獲得一個(gè)樹(shù)狀結(jié)構(gòu)的網(wǎng)絡(luò)。這一方法是網(wǎng)絡(luò)分析中降低模型冗余

14、的常用做法。我們據(jù)此獲得的樹(shù)狀模型的每個(gè)節(jié)點(diǎn)還是能通過(guò)其他節(jié)點(diǎn)互相連接的,而節(jié)點(diǎn)與節(jié)點(diǎn)之間的距離之和是我們能獲得的最小值。我們簡(jiǎn)要介紹最小生成樹(shù)的數(shù)學(xué)表達(dá)。依然用圖 = (, )表示一個(gè)完全連接的網(wǎng)絡(luò),其中是頂點(diǎn),是邊,是邊的權(quán)重(距離)。此時(shí)我們要找到一個(gè)新的生成樹(shù) = (, ) 使頂點(diǎn)與頂點(diǎn)間的總距離最小, 對(duì)應(yīng)為一個(gè)優(yōu)化問(wèn)題: . = 1 | 1 , , , (,) 0,1, 其中第二個(gè)約束條件的(, )表示所有的邊,|表示的基數(shù),其含義是生成樹(shù)不能有閉環(huán)。為了更直觀對(duì)比最小生成樹(shù)算法對(duì)網(wǎng)絡(luò)結(jié)構(gòu)的優(yōu)化,我們利用 networkx 包提供的網(wǎng)絡(luò)建模工具,隨機(jī)產(chǎn)生 20 只股票構(gòu)建全連接網(wǎng)絡(luò)

15、,隨機(jī)賦予權(quán)重后并使用 Prim 算法求解最小生成樹(shù)。圖 1:20 只股票的全連接樹(shù)與最小生成樹(shù)示例資料來(lái)源:Wind;基于中心性的網(wǎng)絡(luò)分析在前兩節(jié),我們探討了如何針對(duì)某一股票池構(gòu)建出最小生成樹(shù),這些抽象有助于我們從網(wǎng)絡(luò)結(jié)構(gòu)的視角去探尋復(fù)雜系統(tǒng)中各個(gè)標(biāo)的關(guān)聯(lián)性,但我們最終目標(biāo)是篩選出有超配價(jià)值的標(biāo)的,即找到那些特殊的節(jié)點(diǎn)。因此,我們很自然地需要尋找一些關(guān)于節(jié)點(diǎn)的量化指標(biāo)幫助我們達(dá)成這一目的。在網(wǎng)絡(luò)分析中,最常用的一類量化指標(biāo)就是中心性。中心性描述的是給定節(jié)點(diǎn)相對(duì)于其他節(jié)點(diǎn)的中心程度,通常周邊連接了越多節(jié)點(diǎn)的節(jié)點(diǎn)其中心性越高,而位置越靠邊緣的節(jié)點(diǎn)中心性越低。引申到股票網(wǎng)絡(luò)里來(lái),我們可以認(rèn)為中心性

16、衡量的是給定股票對(duì)整個(gè)系統(tǒng)的重要程度。中心性越高說(shuō)明該股票對(duì)整個(gè)系統(tǒng)的重要性越大,因此我們可以稱這類中心性高的股票為“中心資產(chǎn)”。反之,所處位置越邊緣,對(duì)系統(tǒng)的影響程度越小,我們可以認(rèn)為這類股票為“邊緣資產(chǎn)”。結(jié)合網(wǎng)絡(luò)分析領(lǐng)域?qū)W者們的經(jīng)典研究(Borgatti, 2005),這里我們選取了如下三個(gè)指標(biāo)以度量節(jié)點(diǎn)的中心性:度中心性度中心性是最常用的中心性,它衡量的是一個(gè)節(jié)點(diǎn)與其他節(jié)點(diǎn)發(fā)生直接聯(lián)系的程度。如果一個(gè)節(jié)點(diǎn)與其他很多節(jié)點(diǎn)發(fā)生直接聯(lián)系,那么這個(gè)節(jié)點(diǎn)就處于中心地位。即節(jié)點(diǎn)的關(guān)系越廣,相鄰節(jié)點(diǎn)越多,那么節(jié)點(diǎn)也就越重要。標(biāo)準(zhǔn)化計(jì)算方法是每個(gè)頂點(diǎn)的度除以途中可能的最大度數(shù),即 1,令()為頂點(diǎn)的度

17、,表達(dá)式如下:() =() 1緊密中心性緊密中心性反應(yīng)的是某個(gè)節(jié)點(diǎn)與其他節(jié)點(diǎn)之間的接近程度。如果一個(gè)節(jié)點(diǎn)離 其他節(jié)點(diǎn)越近,那么它影響其他節(jié)點(diǎn)的能力就越強(qiáng)。這個(gè)點(diǎn)的緊密中心性基 于該點(diǎn)到網(wǎng)絡(luò)中其他所有節(jié)點(diǎn)的最短路徑之和。如果進(jìn)行歸一化,那么就是 求這個(gè)節(jié)點(diǎn)到其他所有節(jié)點(diǎn)的平均最短距離。一個(gè)節(jié)點(diǎn)的平均最短距離越小,那么該節(jié)點(diǎn)的緊密中心性越大,令(, )為節(jié)點(diǎn)和節(jié)點(diǎn)之間的最短路徑長(zhǎng)度,則平均最短距離的倒數(shù)定義為該節(jié)點(diǎn)的緊密中心性,表達(dá)式如下: 1() = (, )介數(shù)中心性介數(shù)中心性是指某節(jié)點(diǎn)出現(xiàn)在其他節(jié)點(diǎn)之間的最短路徑的個(gè)數(shù)。如果這個(gè)節(jié)點(diǎn)的介數(shù)中心性高,那么它對(duì)整個(gè)網(wǎng)絡(luò)結(jié)構(gòu)的轉(zhuǎn)移會(huì)有很大的影響,考

18、察的是節(jié)點(diǎn)對(duì)其他節(jié)點(diǎn)信息傳播的控制能力。介數(shù)中心性的求解過(guò)程可以分為三個(gè)部分:計(jì)算每對(duì)節(jié)點(diǎn)(, )之間的最短路徑,以及記錄該路徑所經(jīng)歷的節(jié)點(diǎn);對(duì)每個(gè)節(jié)點(diǎn)判斷出現(xiàn)在上一步中(, )間的最短路徑集合中的次數(shù)占最短路徑總數(shù)的比例;最后對(duì)所有節(jié)點(diǎn)累加節(jié)點(diǎn)在上一步的比例從而獲得節(jié)點(diǎn) 的介數(shù)中心性,為了方便和其他中心性對(duì)比以及之后的計(jì)算,歸一化后的表達(dá)式如下: () = ,() 2基于網(wǎng)絡(luò)中心度的選股因子, 1在本章節(jié),我們根據(jù)上一節(jié)中介紹的方法論來(lái)實(shí)證構(gòu)建選股因子。我們選擇滬深 300月度更新的動(dòng)態(tài)成分股作為股票池,回溯期自 2009 年 1 月至 2020 年 12 月。在每個(gè)成分股更新的月度截面,我

19、們采集股票池中所有股票之前 T 個(gè)交易日的收益率序列作為觀察樣本,即一個(gè)形狀為300, 252, 1的矩陣,分別使用互信息和時(shí)間動(dòng)態(tài)規(guī)整來(lái)構(gòu)建鄰接矩陣。在使用互信息率時(shí),我們采取收益率橫截面 n 等分的離散化標(biāo)記。在使用動(dòng)態(tài)時(shí)間規(guī)整時(shí),我們將收益率序列轉(zhuǎn)化為凈值序列。在某些截面,新進(jìn)成分股的歷史數(shù)據(jù)較少,我們對(duì)數(shù)據(jù)缺失超過(guò) 20%的節(jié)點(diǎn)剔除。我們首先取 T=252,即回溯一年的日收益率序列,對(duì)收益率序列按 5 日均值平滑,隨后橫截面離散化處理十等分。在優(yōu)化網(wǎng)絡(luò)時(shí),我們?cè)O(shè)置 P95 的權(quán)重閾值,隨后使用 Prim算法剪枝,得到了圖 2 和圖 3 所示的歷史月份滬深 300 成分股最小生成樹(shù)。圖

20、2:2020 年 12 月與 2019 年 12 月滬深 300 成分股的最小生成樹(shù)資料來(lái)源:Wind;。注:左圖為 2020 年 12 月,右圖為 2019 年 12 月。圖 3:2015 年 12 月與 2010 年 12 月滬深 300 成分股的最小生成樹(shù)資料來(lái)源:Wind;。注:左圖為 2015 年 12 月,右圖為 2010 年 12 月。中心度的時(shí)序分析盡管剪枝后的滬深 300 成分股網(wǎng)絡(luò)依然有較高的復(fù)雜度,各月度截面的差異并不容易觀察,但直觀來(lái)看,在每個(gè)月度截面上,一些股票位于網(wǎng)絡(luò)的中心位置,與其他股票的關(guān)聯(lián)性更強(qiáng),位于網(wǎng)絡(luò)邊緣的股票只有稀疏的連接,這表明中心性這一類型的指標(biāo)有助

21、于我們?cè)跈M截面實(shí)現(xiàn)個(gè)股網(wǎng)絡(luò)重要性的排序。通過(guò)時(shí)序分析我們發(fā)現(xiàn),滬深 300 成分股的中心性表現(xiàn)出很強(qiáng)的“頭部效應(yīng)”,即中心性最強(qiáng)的前 20%股票的平均中心性要遠(yuǎn)遠(yuǎn)高于剩下的 80%,而剩下中心性較弱的 80%股票的平均中心性相差不大。圖 4:滬深 300 成分股的度中心性均值與波動(dòng)率資料來(lái)源:Wind;。節(jié)點(diǎn)關(guān)系利用互信息率計(jì)算。圖 5:滬深 300 成分股的緊密中心性均值與波動(dòng)率資料來(lái)源:Wind;。節(jié)點(diǎn)關(guān)系利用互信息率計(jì)算。圖 6:滬深 300 成分股的介數(shù)中心性均值與波動(dòng)率資料來(lái)源:Wind;。節(jié)點(diǎn)關(guān)系利用互信息率計(jì)算。從圖 4 至圖 6 可以看出,三大中心性指標(biāo)均呈現(xiàn)出顯著的頭尾差異性

22、,特別是在節(jié)點(diǎn)度和介數(shù)中心性度量下,TOP20%的股票組合中心程度遠(yuǎn)遠(yuǎn)高于其余 80%的股票,且保持了明顯的平穩(wěn)性。為了進(jìn)一步佐證這一現(xiàn)象,我們分別對(duì)回看窗口、收益率離散化等分區(qū)間和節(jié)點(diǎn)關(guān)系度量方法進(jìn)行了修改和多組測(cè)試。實(shí)驗(yàn)發(fā)現(xiàn)在不同的參數(shù)和方法組合下,網(wǎng)絡(luò)和節(jié)點(diǎn)的上述統(tǒng)計(jì)特性相對(duì)一致。不過(guò),在動(dòng)態(tài)時(shí)間規(guī)整算法下,滬深 300 成分股頭尾組合的中心性呈現(xiàn)出一定的波動(dòng)聚集性。在 2010 年初、2015 年中和 2020 年末等時(shí)段,個(gè)股中心性集體趨強(qiáng),網(wǎng)絡(luò)聯(lián)系整體趨向緊密,同期市場(chǎng)確實(shí)出現(xiàn)了集體性沖高和一定程度的泡沫化,隨后市場(chǎng)進(jìn)入了快速的調(diào)整。這一發(fā)現(xiàn)與 Hakan Kaya 學(xué)者在海外資產(chǎn)

23、上類似研究的發(fā)現(xiàn)具有相似性,其認(rèn)為資產(chǎn)池網(wǎng)絡(luò)中心性系統(tǒng)性增強(qiáng)可以預(yù)示系統(tǒng)性風(fēng)險(xiǎn)的積聚,具有一定的擇時(shí)效應(yīng)。當(dāng)然,對(duì)擇時(shí)效應(yīng)的研究并不在本文的討論范圍內(nèi),但從物理現(xiàn)實(shí)的對(duì)應(yīng)程度來(lái)說(shuō),基于動(dòng)態(tài)時(shí)間規(guī)整算法構(gòu)建出的股票網(wǎng)絡(luò)模型比基于互信息率的網(wǎng)絡(luò)模型更貼近市場(chǎng)。圖 7 和圖 8 分別展示了基于動(dòng)態(tài)時(shí)間規(guī)整算法構(gòu)建網(wǎng)絡(luò)的滬深 300 個(gè)股度中心性、緊密中心性序列。圖 7:滬深 300 成分股的度中心性均值與波動(dòng)率資料來(lái)源:Wind;。節(jié)點(diǎn)關(guān)系利用動(dòng)態(tài)時(shí)間規(guī)整計(jì)算。圖 8:滬深 300 成分股的緊密中心性均值與波動(dòng)率資料來(lái)源:Wind;。節(jié)點(diǎn)關(guān)系利用動(dòng)態(tài)時(shí)間規(guī)整計(jì)算。中心度因子在選股上的應(yīng)用在上一節(jié)中,

24、我們注意到基于動(dòng)態(tài)時(shí)間規(guī)整算法構(gòu)建出的滬深 300 成分股網(wǎng)絡(luò)模型更符合市場(chǎng)規(guī)律,我們以此模型進(jìn)一步分析中心度是否具有對(duì)股票未來(lái)一段時(shí)間的收益 率具有解釋性。由于股票網(wǎng)絡(luò)在每個(gè)月末會(huì)重新生成,我們將標(biāo)簽自然地設(shè)置為未來(lái)一個(gè)月的收益率。我們先沿用“二八法則”進(jìn)行分組,即每期中心性 Top20%的組合和 Bottom80%的組合,分別用上述指標(biāo)按等權(quán)打分和加權(quán)打分進(jìn)行測(cè)試。在不考慮換倉(cāng)手續(xù)費(fèi)的情況 下,得到如圖 9 和圖 10 所示的回測(cè)結(jié)果。而后,我們對(duì)中心度得分五等分進(jìn)行分組測(cè)試,設(shè)置雙邊千三的手續(xù)費(fèi),得到如圖 11 的回測(cè)結(jié)果??梢钥吹?,股票中心度得分高的組合在未來(lái)一個(gè)月具有更高的收益率,T

25、op20%代表的“中心資產(chǎn)”在過(guò)去 10 年間穩(wěn)健跑贏 Bottom80%代表的“邊緣資產(chǎn)”,具有顯著的超額收益。在考慮換倉(cāng)手續(xù)費(fèi)后,中心性較高的 G01 和 G02 組相對(duì)滬深 300 指數(shù)依然取得一定的超額收益,因子單調(diào)區(qū)分性明顯,G01 組信息比率達(dá)到 0.43 也表明超配“中心資產(chǎn)”對(duì)組合表現(xiàn)的提升是有效的。事實(shí)上,在使用互信息率進(jìn)行建模時(shí),我們并沒(méi)有找到穩(wěn)健的超額收益分組,這也說(shuō)明動(dòng)態(tài)時(shí)間規(guī)整算法在刻畫(huà)時(shí)間序列相關(guān)性時(shí)表現(xiàn)更優(yōu)。圖 9:滬深 300 成分股中心度等權(quán)得分因子頭尾分組測(cè)試資料來(lái)源:Wind;。左圖為簡(jiǎn)單平均收益率,右圖為加權(quán)平均收益率。圖 10:滬深 300 成分股中心

26、度加權(quán)得分因子頭尾分組測(cè)試資料來(lái)源:Wind;。左圖為簡(jiǎn)單平均收益率,右圖為加權(quán)平均收益率。圖 11:滬深 300 成分股中心度得分因子五分組測(cè)試資料來(lái)源:Wind;。左圖為簡(jiǎn)單平均收益率,右圖為加權(quán)平均收益率。表 1:滬深 300 成分股中心度得分因子分組測(cè)試績(jī)效指標(biāo)組合年化收益率(%)年化波動(dòng)率(%)夏普比率最大回撤(%)超額收益率(%)超額收益波動(dòng)率(%)信息比率勝率(%)超額收益最大回撤(%)基準(zhǔn)3.6123.360.1540.550G015.9922.720.2636.982.295.290.4354.6114.75G025.0824.540.2040.081.416.070.235

27、0.0014.69G031.8725.400.0750.91-1.677.48-0.2248.4626.16G042.0025.570.0755.95-1.5510.65-0.1446.9236.90G05-0.1125.92-0.00458.11-3.607.66-0.4746.1539.13資料來(lái)源:Wind;值得注意的是,在 2019 年 4 月至 2020 年 7 月這段時(shí)間,中心度因子出現(xiàn)了一段明顯的回撤。通過(guò)持倉(cāng)分析,我們發(fā)現(xiàn)在該區(qū)間 Top20%組合中出現(xiàn)頻次較高的個(gè)股大量來(lái)自銀行保險(xiǎn)、能源鋼鐵等低估值行業(yè),如平安銀行、寧波銀行、寶鋼股份、國(guó)電電力、杭州銀行、中國(guó)平安等個(gè)股均上榜

28、近 10 次。在前 30 高持倉(cāng)頻次的個(gè)股中,僅有三一重工、海大集團(tuán)、美的集團(tuán)、正泰電器、云南白藥、同仁堂 7 只個(gè)股來(lái)自其它行業(yè)。這一偏向順周期和傳統(tǒng)價(jià)值風(fēng)格的持倉(cāng)組合在極致的科技成長(zhǎng)風(fēng)格下確實(shí)表現(xiàn)乏力。當(dāng)然,自 2020年 9 月以來(lái),市場(chǎng)風(fēng)格的再度轉(zhuǎn)換也使得中心度因子結(jié)束回撤期,“中心資產(chǎn)”組合進(jìn)入新的表現(xiàn)階段??偨Y(jié)而言,通過(guò)構(gòu)建股票網(wǎng)絡(luò)模型計(jì)算而來(lái)的中心度得分因子具有不錯(cuò)的截面選股能力和一定的時(shí)序穩(wěn)健性,但它在特定市場(chǎng)風(fēng)格下的表現(xiàn)與價(jià)值、估值因子具有一定的相關(guān)性,更像是一類統(tǒng)計(jì)意義上的風(fēng)險(xiǎn)因子。這一因子是否具有 alpha 屬性、能否作為價(jià)值大類因子的組成、是對(duì)什么風(fēng)險(xiǎn)的補(bǔ)償是我們后續(xù)深入的研究方向。風(fēng)險(xiǎn)提示結(jié)論基于量化模型及歷史數(shù)據(jù),模型存在失效風(fēng)險(xiǎn)。參考文獻(xiàn)Mantegna, R. N. 1999. “Hierarchical Structure in Financial Markets.” The European Physi

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論