




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、正文目錄 HYPERLINK l _TOC_250012 本文研究導(dǎo)讀 4 HYPERLINK l _TOC_250011 行業(yè)拆分實(shí)證 5 HYPERLINK l _TOC_250010 個股收益分化度刻畫 5 HYPERLINK l _TOC_250009 基本面分化度刻畫 8 HYPERLINK l _TOC_250008 行業(yè)拆分方案 10 HYPERLINK l _TOC_250007 行業(yè)拆分方案評估 17 HYPERLINK l _TOC_250006 個股收益同質(zhì)性檢驗(yàn) 17 HYPERLINK l _TOC_250005 基本面同質(zhì)性檢驗(yàn) 18 HYPERLINK l _TO
2、C_250004 行業(yè)聚類實(shí)證 19 HYPERLINK l _TOC_250003 聚類分析方法 19 HYPERLINK l _TOC_250002 聚類分析結(jié)果 20 HYPERLINK l _TOC_250001 總結(jié) 23 HYPERLINK l _TOC_250000 風(fēng)險提示 23圖表目錄圖表 1: 本文研究框架 4圖表 2: 收益分化度刻畫 5圖表 3: 各行業(yè)個股收益分化度排名均值排序(排名越靠前,分化度越大) 6圖表 4: 蒙特卡洛模擬各行業(yè)個股收益分化度排名均值 6圖表 5: 各主題基金數(shù)量統(tǒng)計(jì)(2020-02-25) 7圖表 6: 基本面分化度刻畫 8圖表 7: 各行業(yè)
3、基本面指標(biāo)分化度排名 9圖表 8: 行業(yè)拆分方案與標(biāo)準(zhǔn) 10圖表 9: 初篩行業(yè)概覽(截至 020-02-25) 11圖表 10: 醫(yī)藥子行業(yè)價格走勢 12圖表 11: 醫(yī)藥子行業(yè)相關(guān)系數(shù) 12圖表 12: 醫(yī)藥子行業(yè)的估值走勢 12圖表 13: 醫(yī)藥子行業(yè)的凈利率走勢 12圖表 14: 交通運(yùn)輸子行業(yè)價格走勢 13圖表 15: 交通運(yùn)輸子行業(yè)相關(guān)系數(shù) 13圖表 16: 交通運(yùn)輸子行業(yè)估值(PB_LF)走勢 13圖表 17: 交通運(yùn)輸子行業(yè) ROA 走勢 13圖表 18: 有色金屬子行業(yè)價格走勢 14圖表 19: 有色金屬子行業(yè)相關(guān)系數(shù) 14圖表 20: 有色金屬子行業(yè)毛利率走勢 14圖表 2
4、1: 有色金屬子行業(yè) ROE 走勢 14圖表 22: 食品飲料子行業(yè)價格走勢 15圖表 23: 食品飲料子行業(yè)相關(guān)系數(shù) 15圖表 24: 食品飲料子行業(yè) ROE 走勢 15圖表 25: 食品飲料子行業(yè)毛利率走勢 15圖表 26: 非銀行金融子行業(yè)價格走勢 16圖表 27: 非銀行金融子行業(yè)相關(guān)系數(shù) 16圖表 28: 非銀行金融子行業(yè) ROE 走勢 16圖表 29: 非銀行金融子行業(yè)凈利率走勢 16圖表 30: 拆分前后行業(yè)內(nèi)外平均相關(guān)收益系數(shù)(近 10 年) 17圖表 31: 拆分前后行業(yè)內(nèi)外平均相關(guān)收益系數(shù)(近 5 年) 17圖表 32: 拆分前后行業(yè)內(nèi)外平均相關(guān)收益系數(shù)(近 3 年) 17
5、圖表 33: 聯(lián)合方差檢驗(yàn)結(jié)果 18圖表 34: 聚類分析方法 20圖表 35: 基于最大權(quán)值邊構(gòu)建的行業(yè)關(guān)聯(lián)網(wǎng)絡(luò) 20圖表 36: 基于最大生成樹構(gòu)建的行業(yè)關(guān)聯(lián)網(wǎng)絡(luò) 21圖表 37: 板塊聚類結(jié)果 22圖表 38: 聚類結(jié)果圖示 22本文研究導(dǎo)讀基本面輪動系列報告主要聚焦于中觀層面行業(yè)輪動研究,本文作為系列研究開篇報告,主要目的是確立研究對象,核心工作是開展行業(yè)拆分與聚類實(shí)證。通常而言,投資者習(xí)慣采用中信一級行業(yè)或申萬一級行業(yè)作為行業(yè)輪動研究對象,無論哪種劃分方式,其核心理念都是將上市公司按照某種特性進(jìn)行歸類:從產(chǎn)業(yè)研究的角度,同一行業(yè)內(nèi)的公司經(jīng)營結(jié)構(gòu)、盈利來源類似,其基本面走勢應(yīng)該趨同;從
6、投資實(shí)務(wù)的角度,同一行業(yè)內(nèi)公司具有比價效應(yīng),其股票價格漲跌規(guī)律也應(yīng)該相近。然而在投資實(shí)踐中,我們發(fā)現(xiàn)部分一級行業(yè)內(nèi)個股基本面和價格走勢的分化度較大,行業(yè)劃分不夠純粹,需要進(jìn)行適當(dāng)?shù)牟鸱帧A硪环矫?,基于自上而下的研究視角,投資者通常會從經(jīng)濟(jì)結(jié)構(gòu)、產(chǎn)業(yè)鏈出發(fā)將各個細(xì)分行業(yè)進(jìn)行歸并,便于研究宏觀環(huán)境對大類板塊的影響,以及產(chǎn)業(yè)鏈上下游之間的傳導(dǎo)規(guī)律。鑒于此,我們還需要對拆分后的行業(yè)劃分體系進(jìn)行聚類研究。綜上,全文內(nèi)容主要分為兩大塊,第一部分聚焦于行業(yè)拆分研究,主要解答如下問題:如何評估行業(yè)內(nèi)個股基本面和個股走勢的分化度,進(jìn)而確定該行業(yè)是否需要拆分;如何在保持靈活性和可跟蹤性的基礎(chǔ)上,對分化度大的行業(yè)進(jìn)
7、行拆分;如何定量評估拆分后的行業(yè)劃分體系和原方案孰優(yōu)孰劣;第二部分聚焦于行業(yè)聚類研究,我們結(jié)合蒙特卡洛模擬和最大生成樹算法構(gòu)建了穩(wěn)健的聚類方案,最終將拆分后的行業(yè)體系聚類成了周期、消費(fèi)、金融、成長、穩(wěn)定五大風(fēng)格,以及上游資源、中游材料、中游制造、可選消費(fèi)、必須消費(fèi)、大金融、TMT、公共產(chǎn)業(yè)八大主題板塊。圖表1: 本文研究框架資料來源:華泰證券研究所行業(yè)拆分實(shí)證無論是中信一級行業(yè)還是申萬一級行業(yè),其核心理念都是將上市公司按照主營業(yè)務(wù)收入或利潤來源進(jìn)行歸類:從產(chǎn)業(yè)研究的角度,同一行業(yè)內(nèi)的公司經(jīng)營結(jié)構(gòu)、盈利來源類似,其基本面走勢應(yīng)該趨同;從投資實(shí)務(wù)的角度,同一行業(yè)內(nèi)公司具有比價效應(yīng),其股票價格漲跌規(guī)
8、律也應(yīng)該相近。然而在投資實(shí)踐中,我們發(fā)現(xiàn)部分一級行業(yè)內(nèi)個股基本面和價格走勢的分化度較大,行業(yè)劃分不夠純粹,需要進(jìn)行適當(dāng)?shù)牟鸱帧1竟?jié)內(nèi)容將以中信一級行業(yè)作為研究對象,從價格和基本面兩個角度刻畫行業(yè)內(nèi)個股的分化度,在兼顧靈活度和可跟蹤性的前提下,對分化度大的行業(yè)進(jìn)行適當(dāng)拆分,而拆分的核心目的是期望各行業(yè)內(nèi)部股票價格和基本面走勢盡可能趨同,行業(yè)劃分更加純粹。個股收益分化度刻畫本文采用如下三種方式刻畫行業(yè)內(nèi)的個股收益分化度多空累計(jì)收益:將行業(yè)內(nèi)可投資個股(剔除 ST 股、停牌股等)按當(dāng)日收益率從高到低排序分為 5 層,第 1 層為多頭組合,第 5 層為空頭組合,層內(nèi)取個股收益率中位數(shù)作為組合收益率,計(jì)
9、算日內(nèi)多空收益,并匯總考察區(qū)間內(nèi)的多空累計(jì)收益,多空累計(jì)收益越高,說明行業(yè)內(nèi)股票價格走勢的分化越大?;貧w擬合優(yōu)度:建立個股收益率對行業(yè)指數(shù)收益率的線性回歸模型,計(jì)算行業(yè)內(nèi)個股擬合優(yōu)度2均值,2均值越大,說明個股走勢和行業(yè)指數(shù)走勢越一致,分化度越小。為了保證統(tǒng)計(jì)口徑上的一致性,以1 2均值作為分化度,也即值越大,分化度越大。平均相關(guān)系數(shù):建立行業(yè)內(nèi)個股收益率相關(guān)系數(shù)矩陣,計(jì)算相關(guān)系數(shù)平均值,越大,說明行業(yè)內(nèi)個股漲跌越一致,分化度越低。同樣,為了保證統(tǒng)計(jì)口徑上的一致性,以1 作為分化度,值越大,分化度越高。在實(shí)證過程中,為了避免統(tǒng)計(jì)結(jié)果受到特定考察區(qū)間的影響,針對每個指標(biāo),我們都進(jìn)行了 1000
10、次模擬。每次模擬都會隨機(jī)設(shè)置起止日期(為了避免短期噪音影響,每次考察區(qū)間的長度都超過 750 天),然后根據(jù)分化度指標(biāo)計(jì)算結(jié)果在行業(yè)間進(jìn)行排序。進(jìn)一步,對1000 次排序結(jié)果取平均,得到最終的行業(yè)分化度排序。圖表2: 收益分化度刻畫資料來源:華泰證券研究所實(shí)證結(jié)果表明,三種分化度刻畫算法在高趨同型行業(yè)(分化度排名靠后)上的結(jié)論是相似的,主要集中在銀行、非銀行金融、煤炭、鋼鐵、交通運(yùn)輸?shù)刃袠I(yè),其中銀行、非銀行金融和煤炭在三種算法下都是趨同度最高的三個行業(yè),屬于典型的金融和強(qiáng)周期風(fēng)格。而對于分化度較高的行業(yè),三類算法的結(jié)果有所區(qū)別,其中,多空累計(jì)收益視角下分化度排名靠前的主要是計(jì)算機(jī)、通信、電子、
11、傳媒等成長型行業(yè);回歸擬合優(yōu)度和平均相關(guān)系數(shù)視角下分化度排名靠前的行業(yè)主要是食品飲料、輕工制造、家電等消費(fèi)型行業(yè)。圖表3: 各行業(yè)個股收益分化度排名均值排序(排名越靠前,分化度越大)排名多空累計(jì)收益分化度平均排名擬合優(yōu)度分化度平均排名相關(guān)系數(shù)分化度平均排名1計(jì)算機(jī) 2.8食品飲料 2.1輕工制造 2.82通信 2.9家電 2.3食品飲料 3.73電子 4.9建筑 3.8傳媒 6.04傳媒 5.7機(jī)械 6.9基礎(chǔ)化工 6.35建材 5.9輕工制造 7.4建筑 6.46機(jī)械 8.1石油石化 8.1機(jī)械 6.57石油石化 8.4傳媒 8.5家電 7.58基礎(chǔ)化工 9.9汽車 9.0紡織服裝 8.69
12、輕工制造 10.0基礎(chǔ)化工 9.8汽車 10.510農(nóng)林牧漁 10.3通信 10.8電子 10.911家電 11.3電子 10.9農(nóng)林牧漁 11.312建筑 11.5建材 12.4建材 13.113電力設(shè)備及新能源 11.6紡織服裝 13.8電力設(shè)備及新能源 13.514汽車 13.3房地產(chǎn) 14.0醫(yī)藥 13.815有色金屬 13.7農(nóng)林牧漁 14.1通信 14.516國防軍工 14.6醫(yī)藥 14.3房地產(chǎn) 15.817食品飲料 15.9電力設(shè)備及新能源 15.1電力及公用事業(yè) 16.018紡織服裝 16.1電力及公用事業(yè) 16.9石油石化 16.019房地產(chǎn) 17.6計(jì)算機(jī) 18.2商貿(mào)零
13、售 18.720消費(fèi)者服務(wù) 19.3消費(fèi)者服務(wù) 18.9有色金屬 19.021醫(yī)藥 19.4商貿(mào)零售 19.8計(jì)算機(jī) 19.222商貿(mào)零售 22.0交通運(yùn)輸 20.4消費(fèi)者服務(wù) 19.223鋼鐵 22.1有色金屬 21.6交通運(yùn)輸 19.924電力及公用事業(yè) 23.6鋼鐵 23.2鋼鐵 22.425交通運(yùn)輸 24.8國防軍工 24.4國防軍工 24.226煤炭 25.9非銀行金融 24.5非銀行金融 25.727非銀行金融 26.3銀行 27.2銀行 27.028銀行 28.0煤炭 27.5煤炭 27.5資料來源:Wind,華泰證券研究所圖表4: 蒙特卡洛模擬各行業(yè)個股收益分化度排名均值多空收
14、益擬合優(yōu)度相關(guān)系數(shù)30252015105石油石化煤炭有色金屬電力及公用事業(yè)鋼鐵基礎(chǔ)化工建筑建材輕工制造機(jī)械 電力設(shè)備及新國防軍工汽車商貿(mào)零售 消費(fèi)者服務(wù)家電紡織服裝醫(yī)藥食品飲料農(nóng)林牧漁銀行非銀行金融房地產(chǎn)交通運(yùn)輸電子通信 計(jì)算機(jī)傳媒0資料來源:Wind,華泰證券研究所各行業(yè)內(nèi)個股收益的分化可以從主題基金的分布中得到印證。我們按照 Wind 開放式基金分類,統(tǒng)計(jì)了不同類別下消費(fèi)、醫(yī)藥、TMT、周期、金融地產(chǎn)五類主題基金的個數(shù),其中,主題劃分主要根據(jù)基金名稱中的關(guān)鍵字匹配確定,具體而言:消費(fèi)類關(guān)鍵詞:消費(fèi)、食品、白酒、飲料。醫(yī)藥類關(guān)鍵詞:醫(yī)藥、醫(yī)療、健康、衛(wèi)生。TMT 類關(guān)鍵詞:TMT、電子、傳媒
15、、計(jì)算機(jī)、通信、互聯(lián)網(wǎng)、信息、大數(shù)據(jù)。周期類關(guān)鍵詞:周期、資源、原材料、鋼鐵、煤炭、有色、石油、化工、建材。金融地產(chǎn)類關(guān)鍵詞:金融、地產(chǎn)、銀行、非銀、證券、保險。統(tǒng)計(jì)結(jié)果顯示,主題類基金在所有基金中的占比偏低,絕大多數(shù)基金仍然以滬深 300 等寬基指數(shù)作為業(yè)績比較基準(zhǔn),選股范圍并非限定在某一特定的行業(yè)板塊。但主題基金數(shù)量結(jié)構(gòu)上的分化仍然反映出一些有意思的結(jié)論:在普通股票型、增強(qiáng)指數(shù)型、偏股混合型等偏向于主動管理的基金中,消費(fèi)、醫(yī)藥、 TMT 類基金的數(shù)量要顯著多于周期和金融地產(chǎn)類,這一方面是因?yàn)榍叭叻辖?jīng)濟(jì)結(jié)構(gòu)轉(zhuǎn)型的需要,更加受到投資者青睞;另一方面是因?yàn)檫@些行業(yè)內(nèi)部個股收益分化度較大,可以
16、充分發(fā)揮基金經(jīng)理的 alpha 獲取能力。在被動指數(shù)型基金中,周期和金融地產(chǎn)類主題基金的數(shù)量大幅提升,這兩類行業(yè)內(nèi)個股收益趨同度較高,通過主動管理獲取 alpha 較為困難,所以主要作為 beta 收益獲取渠道(被動指數(shù)型基金具有成本優(yōu)勢)。綜上,主題類基金的數(shù)量分布和前文收益分化度的統(tǒng)計(jì)結(jié)果是可以相互印證的,這也為 FOF 投資帶來一個具有實(shí)操價值的結(jié)論:對于消費(fèi)、醫(yī)藥、TMT 類收益分化度比較大的行業(yè),應(yīng)該側(cè)重于基金優(yōu)選來獲取更高的相對收益,適合長期持有;對于周期、金融地產(chǎn)類收益趨同度較高的行業(yè),應(yīng)該側(cè)重于大勢研判獲取絕對收益,適合波段操作。圖表5: 各主題基金數(shù)量統(tǒng)計(jì)(2020-02-2
17、5)總數(shù)消費(fèi)類醫(yī)藥類TMT 類周期類金融地產(chǎn)普通股票型基金42230332595增強(qiáng)指數(shù)型基金16912000被動指數(shù)型基金8842337583086偏股混合型基金1066423513135靈活配置型基金1917273528915匯總445812314212461111資料來源:Wind,華泰證券研究所基本面分化度刻畫本文主要從財(cái)務(wù)指標(biāo)維度衡量個股的基本面分化:估值維度,包含市盈率 PE_TTM 和市凈率 PB_LF。估值水平是股票定價的基礎(chǔ),同一行業(yè)內(nèi)不同公司的經(jīng)營結(jié)構(gòu)和盈利來源類似,估值應(yīng)該具有可比性,否則套利資金的存在會抹平估值溢價。盈利維度,包含凈資產(chǎn)收益率 ROE、總資產(chǎn)收益率 RO
18、A、資本回報率 ROIC、凈利率、毛利率。同一行業(yè)內(nèi)不同公司的景氣驅(qū)動因素類似,理論上應(yīng)該是一榮俱榮、一損俱損,分化過大意味著盈利結(jié)構(gòu)差別較大。營運(yùn)維度,包含資產(chǎn)負(fù)債率、總資產(chǎn)周轉(zhuǎn)率、存貨周轉(zhuǎn)率,主要考察同一行業(yè)內(nèi)不同公司的資本結(jié)構(gòu)、償債能力等營運(yùn)狀況的差異。上述指標(biāo)計(jì)算過程中,為了剔除季節(jié)性影響,凡是流量類數(shù)據(jù)(也即利潤表、現(xiàn)金流量表中的數(shù)據(jù))均采用 TTM 方式構(gòu)建。此外,資本回報率(ROIC)定義如下:ROIC = 息前稅后利潤期初期末全部投入資本均值該指標(biāo)通常可用于直觀評估某公司的價值創(chuàng)造能力,其中息前稅后利潤為:息前稅后利潤 = 息稅前利潤 稅收全部投入資本按如下方式計(jì)算:全部投入資
19、本 = 股東權(quán)益+ 短期借款+ 應(yīng)付票據(jù)+ 應(yīng)付利息+ 一年內(nèi)到期的非流動負(fù)債+ 長期借款+ 應(yīng)付債券在實(shí)證過程中,針對每個指標(biāo),進(jìn)行如下處理:蒙特卡洛模擬生成隨機(jī)考察區(qū)間,為了避免結(jié)論受到短期噪聲沖擊的影響,考察區(qū)間的長度至少為 3 年,也即 12 個季度。針對考察區(qū)間內(nèi)每個財(cái)報季,計(jì)算個股的財(cái)務(wù)指標(biāo),統(tǒng)計(jì)行業(yè)內(nèi)成分股的方差來刻畫行業(yè)分化度,這里為了剔除極端值的影響,只保留成分股中財(cái)務(wù)指標(biāo)值處于5%,95%分位數(shù)之間的樣本。對考察區(qū)間內(nèi)每個截面的方差求中位數(shù),作為該行業(yè)在考察區(qū)間內(nèi)的分化度衡量,不同行業(yè)間按照分化度從大到小排序。以上步驟重復(fù) 1000 次,取 1000 次排序結(jié)果的平均值作為
20、最終的行業(yè)分化度排序。圖表6: 基本面分化度刻畫資料來源:華泰證券研究所實(shí)證結(jié)果表明,不同基本面指標(biāo)給出的分化度結(jié)果排序并不一致:PB 維度分化度最大的三個行業(yè)是醫(yī)藥、有色金屬、傳媒;PE 維度分化度最大的三個行業(yè)是國防軍工、有色金屬、農(nóng)林牧漁;ROA 維度分化度最大的三個行業(yè)是食品飲料、醫(yī)藥、基礎(chǔ)化工;ROE 維度分化度最大的三個行業(yè)是食品飲料、鋼鐵、房地產(chǎn);ROIC 維度分化度最大的三個行業(yè)是非銀行金融、食品飲料、醫(yī)藥;凈利率維度分化度最大的三個行業(yè)是非銀行金融、交通運(yùn)輸、房地產(chǎn);毛利率維度分化度最大的三個行業(yè)是醫(yī)藥、交通運(yùn)輸、食品飲料;資產(chǎn)負(fù)債率維度分化度最大的三個行業(yè)是石油石化、基礎(chǔ)化
21、工、有色金屬;總資產(chǎn)周轉(zhuǎn)率維度分化度最大的三個行業(yè)是石油石化、商貿(mào)零售、有色金屬;存貨周轉(zhuǎn)率維度分化度最大的三個行業(yè)是交通運(yùn)輸、傳媒、消費(fèi)者服務(wù);如果以至少三項(xiàng)指標(biāo)排名前三作為高分化度標(biāo)準(zhǔn),那么基本面分化度最為顯著的行業(yè)包括有色金屬、食品飲料、醫(yī)藥、交通運(yùn)輸。對于非銀行金融行業(yè),由于其財(cái)務(wù)數(shù)據(jù)中一般沒有營業(yè)成本項(xiàng),所以無法計(jì)算毛利率和存貨周轉(zhuǎn)率指標(biāo),而剩余八項(xiàng)指標(biāo)中,ROIC 和凈利率分化度均排名第一,因此將非銀行金融行業(yè)也列入基本面分化度較高的行業(yè)中。圖表7: 各行業(yè)基本面指標(biāo)分化度排名PBPEROAROEROIC凈利率毛利率資產(chǎn)負(fù)債率總資產(chǎn)周轉(zhuǎn)率存貨周轉(zhuǎn)率石油石化2051916222116
22、117煤炭27208410141026138有色金屬22961615143312電力及公用事業(yè)192422222861219254鋼鐵25181622123259416基礎(chǔ)化工181738121718 21813建筑17252624202626201610建材126171119162042218輕工制造98510171921102320機(jī)械1591813151217122425電力設(shè)備及新能源13162023251819132023國防軍工11 12527272515142124汽車6101396222411914商貿(mào)零售231523171828222325消費(fèi)者服務(wù)2211102087622
23、83家電2123115424237721紡織服裝1644147208151522醫(yī)藥12221235151019食品飲料8141129325611農(nóng)林牧漁143675101116515銀行282828282327-2828-非銀行金融2427272611-2727-房地產(chǎn)472432439182626交通運(yùn)輸262621252622611 1電子1012121591313171417通信5131418141178179計(jì)算機(jī)719721138524196傳媒3211519114421122注:銀行和銀行金融行業(yè)的財(cái)務(wù)數(shù)據(jù)中一般沒有營業(yè)成本一項(xiàng),所以毛利率和存貨周轉(zhuǎn)率無法計(jì)算資料來源:Wind,
24、華泰證券研究所整體來看,在收益分化度中比較突出的成長類行業(yè)(計(jì)算機(jī)、電子、傳媒、通信),其基本面分化度并不突出(除了傳媒行業(yè)在個別指標(biāo)上分化度較高);與之對應(yīng)的,在收益分化度中并不突出的醫(yī)藥行業(yè),基本面分化度卻非常明顯(PB、ROA、ROIC、毛利四項(xiàng)指標(biāo)中分化度均排名前三);而食品飲料行業(yè)則是在收益分化度和基本面分化度中均排名靠前,是重點(diǎn)考察對象。行業(yè)拆分方案總結(jié)前文,我們從收益和基本面出發(fā),對各行業(yè)內(nèi)個股的分化情況進(jìn)行了定量梳理。從收益分化角度,初步篩選計(jì)算機(jī)、通信、電子、食品飲料、家電、建筑、輕工制造作為研究對象;從基本面分化角度,初步篩選有色金屬、食品飲料、醫(yī)藥、非銀行金融、交通運(yùn)輸、
25、傳媒作為研究對象。本節(jié)內(nèi)容主要討論如何在保持靈活性和可跟蹤性的基礎(chǔ)上,對部分行業(yè)進(jìn)行拆分。拆分的核心目的是期望新的行業(yè)劃分體系具有“高內(nèi)聚、低耦合”的特征,也即行業(yè)之間的分化度應(yīng)該盡可能大,而行業(yè)內(nèi)的分化度應(yīng)該盡可能小。行業(yè)拆分一般有兩種思路:1、直接提取一級行業(yè)成分股,按照個股收益和基本面的相似程度進(jìn)行聚類,該方法的好處是能保證拆分后行業(yè)的純粹性,缺點(diǎn)是聚類結(jié)果動態(tài)變化,不利于跟蹤,而且需要先驗(yàn)指定聚類個數(shù),主觀性較強(qiáng);2、直接將一級行業(yè)拆分成二級行業(yè),該方法的好處是數(shù)據(jù)來源透明,易于跟蹤,缺點(diǎn)是難以保證拆分后行業(yè)體系的“高內(nèi)聚、低耦合”特性,也即拆分出來的二級行業(yè)之間可能分化并不大,但二級
26、行業(yè)內(nèi)部卻仍然存在較大的分化。從定量模型構(gòu)建的角度,數(shù)據(jù)來源的公開、透明、一致性應(yīng)該是第一考量要素,因此本文采用了方案二的思路,也即將分化度較大的一級行業(yè)直接拆分成相應(yīng)的二級行業(yè)。展開具體討論之前,還需要明確一下拆分標(biāo)準(zhǔn):充分考慮行業(yè)當(dāng)前發(fā)展階段:根據(jù)產(chǎn)業(yè)生命周期理論,行業(yè)的生命發(fā)展周期包括幼稚期、成長期、成熟期、衰退期。不同階段下,行業(yè)內(nèi)部的競爭格局、增長潛力相差較大,分析時不能一概而論。一般而言,處于成長期的行業(yè),市場需求快速增長,競爭格局尚不穩(wěn)定,內(nèi)部多元性和不確定性較強(qiáng),根據(jù)當(dāng)前狀態(tài)做的行業(yè)劃分很難適應(yīng)未來一段時間的變化;對應(yīng)地,處于成熟期、衰退期的行業(yè),經(jīng)過市場的優(yōu)勝劣汰之后,內(nèi)部競
27、爭格局已經(jīng)相對穩(wěn)定,未來很難出現(xiàn)大的變化,拆分時應(yīng)該重點(diǎn)考慮這些行業(yè)。充分考慮行業(yè)間的市值均衡:從量化研究來看,行業(yè)劃分體系是市場中性策略中控制偏離的標(biāo)準(zhǔn),因此各行業(yè)之間的市值不應(yīng)差距過大;從投資實(shí)務(wù)的角度,如果拆分后的行業(yè)總市值過低、股票數(shù)目過少、流動性不足,也沒有跟蹤的必要。充分考慮子行業(yè)間的分化程度:一般而言,行業(yè)內(nèi)個股高分化是子行業(yè)高分化的必要條件,但非充分條件。因此,為了保證拆分結(jié)果的“高內(nèi)聚、低耦合”特性,還需要檢查子行業(yè)間的分化程度。圖表8: 行業(yè)拆分方案與標(biāo)準(zhǔn)資料來源:華泰證券研究所圖表9: 初篩行業(yè)概覽(截至 020-02-25)一級行業(yè)總市值(億)自由流通市值(億)成份股個
28、數(shù)二級行業(yè)總市值(億)自由流通市值(億)成份股個數(shù)有色金屬144546936103貴金屬3337165112工業(yè)金屬5195242952稀有金屬5921285539建筑137915734126 建筑施工建筑裝修建筑設(shè)計(jì)及服務(wù)1207611545614937490306832815輕工制造80573268116造紙 包裝印刷家居文娛輕工其他輕工15722773245997427977011588943451022238361010家色家電黑色家電小家電照明電工及其他廚房電器8921128217291891663592256143973129710918306醫(yī)藥5109
29、322753310化學(xué)制藥 中藥生產(chǎn) 生物醫(yī)藥其他醫(yī)藥醫(yī)療154928268837118962753337903993743797734298食品飲料3810315455102酒類飲料食品26754292584251050720522895381648非銀行金融606792374465證券 保險 多元金融2794029541319812982988587745713交通運(yùn)輸251046777123公路鐵路物流航運(yùn)港口航空機(jī)場7973545260625617148617841534197438373513電子5513223950241 半導(dǎo)體 元器件 光學(xué)光電消費(fèi)電子其他電子零組件1602585
30、571462813901202161643767634167699094839547228通信211858274114電信運(yùn)營 通信設(shè)備制造增值服務(wù) 通訊工程服務(wù)191817133136676955265087934213851115計(jì)算機(jī)3686917779235計(jì)算機(jī)設(shè)備計(jì)算機(jī)軟件云服務(wù)產(chǎn)業(yè)互聯(lián)網(wǎng)94921852343034551470895801869162269142186傳媒163787293143媒體廣告營銷文化娛樂375128817344240116931587316484939315815互聯(lián)網(wǎng)媒體資料來源:Wind,華泰證券研究所按照前述標(biāo)準(zhǔn),初篩行業(yè)中,建筑、輕工制造、家電
31、三個行業(yè)內(nèi)子行業(yè)間的市值分布極不均勻,基本上呈現(xiàn)出一家獨(dú)大的格局,因此本文不予拆分。而電子、通信、計(jì)算機(jī)、傳媒四個行業(yè)均屬于典型的成長風(fēng)格,目前還處于高速增長期,內(nèi)部競爭格局尚未穩(wěn)定,個股間收益和基本面的分化呈現(xiàn)出短期性、暫時性、階段性的特點(diǎn),在經(jīng)濟(jì)結(jié)構(gòu)轉(zhuǎn)型和產(chǎn)業(yè)升級的大背景下,未來不確定性較大,為了保證劃分體系的靈活性,本文暫不予拆分。綜上,后文中我們主要考察有色金屬、醫(yī)藥、食品飲料、非銀行金融、交通運(yùn)輸五個行業(yè)。醫(yī)藥:子行業(yè)間收益趨同性高,不予拆分醫(yī)藥行業(yè)下轄化學(xué)制藥、中藥生產(chǎn)、生物醫(yī)藥、其他醫(yī)藥醫(yī)療 4 個子行業(yè):1、從走勢來看,四個子行業(yè)間趨同度較高,相關(guān)系數(shù)均在 0.9 左右;2、從
32、基本面來看,生物制藥子行業(yè)由于高投入,高風(fēng)險,高回報的特點(diǎn),近年來估值溢價更高,而且凈利率水平也要顯著高于其他三個子行業(yè);而其他醫(yī)藥醫(yī)療子行業(yè)以醫(yī)療服務(wù)和醫(yī)療器械為主,屬于重資產(chǎn)行業(yè),折舊損耗較大,所以凈利率水平比其他三個子行業(yè)低。整體而言,醫(yī)藥子行業(yè)間的基本面分化較為明顯,但是收益分化度較低,換言之,該行業(yè)可以通過優(yōu)選個股獲得較高的超額回報,但是子行業(yè)間輪動效應(yīng)不明顯,因此本文不予拆分。圖表10: 醫(yī)藥子行業(yè)價格走勢25,00020,00015,00010,0005,000200420052006200720082009201020112012201320142015201620172018
33、20190化學(xué)制藥中藥生產(chǎn)生物醫(yī)藥其他醫(yī)藥醫(yī)療資料來源:Wind,華泰證券研究所圖表11: 醫(yī)藥子行業(yè)相關(guān)系數(shù)化學(xué)制藥中藥生產(chǎn)生物醫(yī)藥其他醫(yī)藥醫(yī)療化學(xué)制藥 1中藥生產(chǎn)0.93 1生物醫(yī)藥0.910.89 1其他醫(yī)藥醫(yī)療0.920.900.90 1資料來源:Wind,華泰證券研究所圖表12: 醫(yī)藥子行業(yè)的估值走勢圖表13: 醫(yī)藥子行業(yè)的凈利率走勢140120100806040202005200620072008200920102011201220132014201520162017201820192020030%25%20%15%10%5%2005200620072008200920102011
34、201220132014201520162017201820190%-5%化學(xué)制藥中藥生產(chǎn)生物醫(yī)藥其他醫(yī)藥醫(yī)療-10%其他醫(yī)藥醫(yī)療化學(xué)制藥 中藥生產(chǎn)生物醫(yī)藥資料來源:Wind,華泰證券研究所資料來源:Wind,華泰證券研究所交通運(yùn)輸:拆分能提升“高內(nèi)聚”,但會破壞“低耦合”,綜合考慮后不予拆分交通運(yùn)輸行業(yè)下轄公路鐵路、物流、航運(yùn)港口、航空機(jī)場 4 個子行業(yè):1、從走勢來看,四個子行業(yè)間物流行業(yè)彈性較大,其他三個子行業(yè)的趨同度較高;2、從基本面來看,物流行業(yè)受益于近年來電子商務(wù)的發(fā)展,未來前景可期,兼具成長屬性,估值溢價更高;航運(yùn)港口、航空機(jī)場子行業(yè)的業(yè)績波動較大,受經(jīng)濟(jì)周期的影響更顯著;公路鐵
35、路子行業(yè)的業(yè)績穩(wěn)定性較高,是典型的防御型行業(yè)。整體而言,交通運(yùn)輸子行業(yè)間的基本面分化較為明顯,而收益分化度適中。拆分的好處是能夠提升“高內(nèi)聚”,也即各子行業(yè)內(nèi)部的核心驅(qū)動因素更為純粹,壞處是破壞了“低耦合”,因?yàn)椴鸱趾笮碌玫降暮竭\(yùn)港口和航空機(jī)場行業(yè)之間,收益和基本面的分化度都偏低。權(quán)衡利弊后,本文暫不拆分交通運(yùn)輸行業(yè)。圖表14: 交通運(yùn)輸子行業(yè)價格走勢14,00012,00010,0008,0006,0004,0002,00020042005200620072008200920102011201220132014201520162017201820190公路鐵路物流航運(yùn)港口航空機(jī)場資料來源:W
36、ind,華泰證券研究所圖表15: 交通運(yùn)輸子行業(yè)相關(guān)系數(shù)公路鐵路物流航運(yùn)港口航空機(jī)場公路鐵路 1物流0.79 1航運(yùn)港口0.820.82 1航空機(jī)場0.770.720.76 1資料來源:Wind,華泰證券研究所圖表16: 交通運(yùn)輸子行業(yè)估值(PB_LF)走勢圖表17: 交通運(yùn)輸子行業(yè) ROA 走勢1220%1015%810%65%40%200520062007200820092010201120122013201420152016201720182019220052006200720082009201020112012201320142015201620172018201920200-5%公路
37、鐵路物流航運(yùn)港口航空機(jī)場-10%公路鐵路物流航運(yùn)港口航空機(jī)場資料來源:Wind,華泰證券研究所資料來源:Wind,華泰證券研究所有色金屬:拆分能提升“高內(nèi)聚”,但會破壞“低耦合”,綜合考慮后不予拆分有色金屬行業(yè)下轄貴金屬、工業(yè)金屬、稀有金屬 3 個子行業(yè):1、從走勢來看,三個子行業(yè)間工業(yè)金屬和稀有金屬的趨同度較高,相關(guān)系數(shù)高達(dá) 0.91,貴金屬的走勢則相對獨(dú)立; 2、從基本面來看,工業(yè)金屬的業(yè)績波動較大,受經(jīng)濟(jì)周期的影響顯著,是典型的周期類行業(yè);而稀有金屬的業(yè)績波動雖大,但作為新能源汽車產(chǎn)業(yè)鏈的上游,近年來景氣度向好,毛利率顯著高于其他兩個行業(yè),有一定的成長屬性;而貴金屬行業(yè)中,以黃金為代表的
38、品種兼具貨幣屬性、商品屬性、金融屬性,定價機(jī)制較為復(fù)雜,基本面走勢顯著易于其他兩個行業(yè)。整體而言,無論是走勢還是基本面,工業(yè)金屬和稀有金屬的趨同度較高,而貴金屬則相對獨(dú)立,拆與不拆同樣是在“高內(nèi)聚”和“低耦合”之間取舍,為了保持處理口徑上的一致性,本文暫不拆分有色金屬行業(yè)。圖表18: 有色金屬子行業(yè)價格走勢18,00016,00014,00012,00010,0008,0006,0004,0002,0002004200520062007200820092010201120122013201420152016201720180貴金屬工業(yè)金屬稀有金屬資料來源:Wind,華泰證券研究所圖表19: 有
39、色金屬子行業(yè)相關(guān)系數(shù)貴金屬工業(yè)金屬稀有金屬貴金屬 1工業(yè)金屬0.70 1稀有金屬0.660.91 1資料來源:Wind,華泰證券研究所圖表20: 有色金屬子行業(yè)毛利率走勢圖表21: 有色金屬子行業(yè) ROE 走勢35%30%25%20%15%10%5%2005200620072008200920102011201220132014201520162017201820190%貴金屬工業(yè)金屬稀有金屬30%25%20%15%10%5%2005200620072008200920102011201220132014201520162017201820190%-5%-10% 貴金屬工業(yè)金屬稀有金屬資料來源
40、:Wind,華泰證券研究所資料來源:Wind,華泰證券研究所食品飲料:價格和基本面走勢均分化較大,需要拆分食品飲料行業(yè)下轄酒類、飲料、食品 3 個子行業(yè):1、從走勢來看,酒類行業(yè)的彈性顯著大于飲料和食品行業(yè),是近幾年表現(xiàn)最好的行業(yè)之一,三個子行業(yè)間相關(guān)系數(shù)均低于 0.8,相較而言趨同度并不高;2、從 ROE 來看,酒類行業(yè)的業(yè)績波動更大,屬于可選消費(fèi)風(fēng)格,具備一定的周期特性;而食品行業(yè)受上游豬肉價格的影響明顯,2010 年以前業(yè)績波動較大,但近年來相對穩(wěn)定;對比之下,飲料行業(yè)的業(yè)績最為穩(wěn)定;3、從毛利率來看,三個子行業(yè)間存在明顯的層次分化,酒類最高,飲料次之,食品最低。整體而言,無論是走勢還是
41、基本面,酒類、飲料、食品三個子行業(yè)的分化度均較為明顯,驅(qū)動邏輯各不相同,需要進(jìn)行拆分。圖表22: 食品飲料子行業(yè)價格走勢50,00045,00040,00035,00030,00025,00020,00015,00010,0005,0002004200520062007200820092010201120122013201420152016201720180酒類飲料食品資料來源:華泰證券研究所圖表23: 食品飲料子行業(yè)相關(guān)系數(shù)酒類飲料食品酒類 1飲料0.71 1食品0.660.78 1資料來源:Wind,華泰證券研究所圖表24: 食品飲料子行業(yè) ROE 走勢圖表25: 食品飲料子行業(yè)毛利率走勢
42、40%30%20%10%2005200620072008200920102011201220132014201520162017201820190%-10%90%80%70%60%50%40%30%20%10%2005200620072008200920102011201220132014201520162017201820190%-20%酒類飲料食品酒類飲料食品資料來源:Wind,華泰證券研究所資料來源:Wind,華泰證券研究所非銀行金融:價格和基本面走勢均分化較大,需要拆分非銀行金融行業(yè)下轄證券、保險、多元金融 3 個子行業(yè):1、從走勢來看,證券行業(yè)的彈性顯著大于保險和多元金融行業(yè),三個子
43、行業(yè)間相關(guān)系數(shù)均低于 0.75,其中保險和多元金融行業(yè)的相關(guān)系數(shù)只有 0.5 左右,趨同度較低;2、從 ROE 來看,證券行業(yè)的業(yè)績波動更大,是典型的周期風(fēng)格;而保險行業(yè)業(yè)績也有一定的周期波動特征,其周期性主要體現(xiàn)在投資收益的波動上,但同時我們注意到,2016 年以來,保險行業(yè)的盈利能力(ROE)是在逐步攀升的,有研究表明,隨著人均 GDP 提升,保費(fèi)支出也呈現(xiàn)出加速增長的態(tài)勢,因而保險行業(yè)兼具一定的成長性;3、從凈利率來看,保險行業(yè)的波動中樞顯著低于證券和多元金融行業(yè)。整體而言,無論是走勢還是基本面,證券、保險、多元金融三個子行業(yè)的分化度均較為明顯,驅(qū)動邏輯各不相同,需要進(jìn)行拆分。圖表26:
44、 非銀行金融子行業(yè)價格走勢20,00018,00016,00014,00012,00010,0008,0006,0004,0002,0002004200520062007200820092010201120122013201420152016201720180證券保險多元金融資料來源:Wind,華泰證券研究所圖表27: 非銀行金融子行業(yè)相關(guān)系數(shù)證券保險多元金融證券 1保險0.71 1多元金融0.700.54 1資料來源:Wind,華泰證券研究所圖表28: 非銀行金融子行業(yè) ROE 走勢圖表29: 非銀行金融子行業(yè)凈利率走勢50%40%30%20%10%200520062007200820092
45、0102011201220132014201520162017201820190%-10%-20%證券保險多元金融70%60%50%40%30%20%10%2005200620072008200920102011201220132014201520162017201820190%-10%-20%-30%-40%證券保險多元金融資料來源:Wind,華泰證券研究所資料來源:Wind,華泰證券研究所行業(yè)拆分方案評估總結(jié)前文,我們在綜合考慮個股分化和子行業(yè)分化后,決定將食品飲料拆分成酒類、飲料、食品三個子行業(yè),將非銀行金融拆分成證券、保險、多元金融三個子行業(yè)。本節(jié)將通過定量手段,證明新的行業(yè)劃分體系相
46、比于原一級行業(yè)劃分體系更加純粹,“高內(nèi)聚、低耦合”特性更加顯著,也即行業(yè)間的分化更大,而行業(yè)內(nèi)的分化更小。個股收益同質(zhì)性檢驗(yàn)對于特定行業(yè)分類方案,可以通過檢驗(yàn)行業(yè)內(nèi)個股相關(guān)系數(shù)是否顯著高于行業(yè)間個股相關(guān)系數(shù)來判定該分類方案是否把收益趨同性高的股票歸到同一個行業(yè)。具體而言,針對行業(yè),假設(shè)行業(yè)內(nèi)個股集合為,行業(yè)外個股集合為,行業(yè)內(nèi)個股的平均相關(guān)系數(shù)記為: = (, ) , 而行業(yè)間的平均相關(guān)系數(shù)記為: = (, ) , 假設(shè)對于任意行業(yè),均有 ,則說明行業(yè)分類方案有效的將收益趨同性高的個股歸為了一類。實(shí)證過程中,新方案和舊方案的對比,可以通過被拆分行業(yè)在拆分前后行業(yè)內(nèi)外平均相關(guān)系數(shù)的差異進(jìn)行判斷。
47、圖表30: 拆分前后行業(yè)內(nèi)外平均相關(guān)收益系數(shù)(近 10 年)拆分前行業(yè)內(nèi)行業(yè)外差異拆分后行業(yè)內(nèi)行業(yè)外差異食品飲料0.310.280.03酒類0.440.300.13飲料0.320.290.04食品0.270.270.00非銀行金融0.490.310.18證券0.600.330.28保險0.530.260.27多元金融0.310.270.04資料來源:Wind,華泰證券研究所圖表31: 拆分前后行業(yè)內(nèi)外平均相關(guān)收益系數(shù)(近 5 年)拆分前行業(yè)內(nèi)行業(yè)外差異拆分后行業(yè)內(nèi)行業(yè)外差異食品飲料0.320.290.03酒類0.450.320.13飲料0.330.300.03食品0.270.270.00非銀行
48、金融0.520.330.19證券0.630.350.29保險0.520.250.27資料來源:華泰證券研究所多元金融0.360.30 0.06圖表32: 拆分前后行業(yè)內(nèi)外平均相關(guān)收益系數(shù)(近 3 年)食品飲料0.290.25 0.04酒類0.410.260.15飲料食品0.310.250.260.240.040.01非銀行金融0.530.31 0.23證券保險0.650.560.330.220.320.34多元金融0.370.270.10資料來源:Wind,華泰證券研究所拆分前行業(yè)內(nèi)行業(yè)外差異拆分后行業(yè)內(nèi)行業(yè)外差異實(shí)證結(jié)果表明,兩個被拆分行業(yè)在拆分后,行業(yè)內(nèi)個股收益同質(zhì)性都有一定改善。對于食品
49、飲料行業(yè),拆分前行業(yè)內(nèi)外的收益分化度并不顯著,而拆分后酒類子行業(yè)的個股收益趨同性顯著提升;對于非銀行金融行業(yè),拆分前個股的收益趨同性就比較高,行業(yè)內(nèi)平均相關(guān)系數(shù)要顯著高于行業(yè)間平均相關(guān)系數(shù),而拆分后,證券和保險子行業(yè)內(nèi)個股收益的趨同度進(jìn)一步提升?;久嫱|(zhì)性檢驗(yàn)對于特定行業(yè)劃分方案,其行業(yè)內(nèi)個股的基本面同質(zhì)性可以通過財(cái)務(wù)指標(biāo)的聯(lián)合方差表征,因此不同行業(yè)劃分體系的優(yōu)劣可以通過聯(lián)合方差檢驗(yàn)進(jìn)行判定。具體而言,對于行業(yè)分類和行業(yè)分類,在財(cái)務(wù)指標(biāo)下,分別計(jì)算每個行業(yè)分類的聯(lián)合方差: ( 1)2 = =1=1( 1)其中,表示方案中分成的行業(yè)個數(shù),表示方案中第個行業(yè)中股票數(shù)量,表示方案中第個行業(yè)中各個成
50、分股財(cái)務(wù)指標(biāo)的方差。對于兩個行業(yè)劃分方案和,其關(guān)于財(cái)務(wù)指標(biāo)的同質(zhì)性可以通過計(jì)算檢驗(yàn)統(tǒng)計(jì)量表征:22 = ( 1, 1)其中及分別表示行業(yè)劃分方案和中的行業(yè)個數(shù)。對于任何兩種行業(yè)劃分方案和,可分別計(jì)算各財(cái)務(wù)指標(biāo)對應(yīng)的行業(yè)聯(lián)合方差及檢驗(yàn)統(tǒng)計(jì)量。若顯著大于1,則說明方案中股票關(guān)于財(cái)務(wù)指標(biāo)的方差更大,其同質(zhì)性低于方案,也即個股基本面趨同度更低;反之則說明其同質(zhì)性高于方案。在實(shí)證中,記新的行業(yè)拆分體系為(剔除綜合后一共有 33 個行業(yè)),原一級行業(yè)劃分體系記為(剔除綜合后一共有 29 個行業(yè)),分別利用 2010 年至 2018 年的年報數(shù)據(jù)計(jì)算聯(lián)合方差統(tǒng)計(jì)量。結(jié)果表明,拆分后的行業(yè)體系相比于原一級行業(yè)
51、體系基本面同質(zhì)性更高,接近 70%的場景下 F 檢驗(yàn)統(tǒng)計(jì)量都小于 1,尤其是在 ROIC、毛利率等盈利指標(biāo)下,拆分后的行業(yè)劃分體系中,個股基本面趨同度更顯著。圖表33: 聯(lián)合方差檢驗(yàn)結(jié)果201020112012201320142015201620172018ROA0.99010.97360.97211.00341.00320.99670.99130.99560.9979ROE0.98370.97620.98371.00331.01500.99820.99630.99520.9983ROIC0.78470.81590.67360.59160.69900.79450.70380.98330.928
52、1凈利率0.98660.97540.98741.00371.03351.02720.97000.96380.9922毛利率0.97910.96520.96670.96660.97300.97140.96760.97010.9515資產(chǎn)周轉(zhuǎn)率1.00641.00181.00241.00220.99701.00300.99861.00301.0038資產(chǎn)負(fù)債率0.99900.99750.99930.99961.00111.00251.00150.99810.9981存貨周轉(zhuǎn)率1.00221.00201.00091.00081.00160.94200.05560.99440.1410資料來源:Win
53、d,華泰證券研究所行業(yè)聚類實(shí)證基于自上而下的研究視角,投資者通常會從經(jīng)濟(jì)結(jié)構(gòu)、產(chǎn)業(yè)鏈出發(fā)將各個細(xì)分行業(yè)進(jìn)行歸并,便于研究宏觀環(huán)境對大類板塊的影響,以及產(chǎn)業(yè)鏈上下游之間的傳導(dǎo)規(guī)律。鑒于此,我們還需要對拆分后的行業(yè)劃分體系進(jìn)行聚類研究。聚類分析方法聚類是一種常見的數(shù)據(jù)分析工具, 其目的是把大量數(shù)據(jù)點(diǎn)的集合分成若干類, 使得歸于同一類的數(shù)據(jù)之間相似性盡可能大, 而歸于不同類別的數(shù)據(jù)之間差異性盡可能大。K-means算法作為一種經(jīng)典的基于距離的聚類方法,邏輯清晰,計(jì)算效率高,在實(shí)證中得到廣泛應(yīng)用,其基本步驟為:根據(jù)先驗(yàn)知識事先確定需要聚類的簇的個數(shù);在樣本中隨機(jī)選取個對象,每個對象初始地代表了一個簇的
54、中心;對剩余的每個對象,根據(jù)其與各簇中心的距離,將它賦給最近的簇;計(jì)算每個簇的平均值,作為新的簇中心;判定:若簇中心不再發(fā)生變動或達(dá)到迭代次數(shù),結(jié)束,否則返回第 2 步,不斷重復(fù)??梢姡琄-means 算法的核心思想是采用距離作為相似性的評價指標(biāo),即認(rèn)為兩個對象的距離越近,其相似度就越大。然而實(shí)證過程中我們發(fā)現(xiàn),該算法的聚類結(jié)果對先驗(yàn)設(shè)定的簇個數(shù),以及隨機(jī)選取的初始點(diǎn)非常敏感。換言之,對于不同的值,同樣的兩個行業(yè)是否歸為同一類結(jié)論可能不同;即便是固定值,以及輸入數(shù)據(jù),結(jié)論也會因?yàn)槌跏贾档碾S機(jī)性而不固定,尤其是在樣本較大的時候,算法容易陷入局部最優(yōu)解。為了解決值敏感性,需要結(jié)合先驗(yàn)知識進(jìn)行合理設(shè)
55、定,中信行業(yè)劃分體系在三級行業(yè)的基礎(chǔ)上構(gòu)建了周期、金融、消費(fèi)、成長、穩(wěn)定五大風(fēng)格板塊,因而本文實(shí)證中統(tǒng)一設(shè)置簇個數(shù)為 5;為了解決單次運(yùn)行中的初值敏感問題,我們采用了多次模擬求概率的方法,具體而言,針對目標(biāo)區(qū)間的行業(yè)收益率序列,執(zhí)行如下步驟:基于收益率序列之間的歐式距離刻畫行業(yè)的遠(yuǎn)近程度,并進(jìn)行 K-means 聚類,對于任意兩個行業(yè),如果他們被歸為一類,則記錄為 1,否則記為 0;由于拆分后一共存在 33 個行業(yè)(剔除綜合),所以一共有 1089 個行業(yè)配對關(guān)系;上述流程重復(fù)執(zhí)行 1000 次,計(jì)算每兩個行業(yè)被歸為一類的次數(shù)占比,占比越高,說明這兩個行業(yè)的相似性越強(qiáng)。得到每兩個行業(yè)被歸為一類
56、的概率占比之后,可以通過最大生成樹算法構(gòu)建最終的行業(yè)關(guān)聯(lián)關(guān)系,并梳理出聚類結(jié)果。簡單來說,假設(shè)一共有個節(jié)點(diǎn),最大生成樹就是找到 1條邊將所有節(jié)點(diǎn)連接起來,并且使得這 1條邊的權(quán)值之和達(dá)到最大,具體而言,我們可以通過每兩個行業(yè)之間被歸為一類的概率統(tǒng)計(jì)結(jié)果構(gòu)建無向圖 = (, ),其中,代表所有的節(jié)點(diǎn)集合(本例中就是各個行業(yè)),代表了所有的連接邊集合,每條邊的權(quán)重就是其所連接的兩個行業(yè)被歸為一類的概率。若存在一個無回路的子集, 是 的子集,它連接了所有的節(jié)點(diǎn),并且使得() = (, )(,)達(dá)到最大,則稱為的最大生成樹。在實(shí)現(xiàn)過程中一般采用 Kruskal 算法,原理如下:將所有的邊按照權(quán)重大?。?/p>
57、本例中就是兩個節(jié)點(diǎn)被歸為一類的概率)遞減排序;選擇最大權(quán)重的邊,判斷是否在當(dāng)前的生成樹中形成了一個環(huán)路,如果環(huán)路沒有形成,則將該邊加入最大生成樹中,否則放棄;重復(fù)步驟 2,直到有 1 條邊在最大生成樹中??梢姡畲笊蓸涫且环N剪枝算法,它把那些距離較遠(yuǎn),權(quán)值較低的邊去掉,而剩下的邊就是我們要重點(diǎn)關(guān)注的行業(yè)關(guān)聯(lián)關(guān)系。圖表34: 聚類分析方法資料來源:華泰證券研究所聚類分析結(jié)果首先考察基于最大權(quán)值邊構(gòu)建的簡單網(wǎng)絡(luò),也即針對每個行業(yè),只保留它與外界連接的邊中權(quán)值最大的那一條。結(jié)果表明,所有行業(yè)被拆分成相對獨(dú)立的多個類別,比如以銀行、證券、保險為核心的金融風(fēng)格;以計(jì)算機(jī)、傳媒、電子、通信為核心的成長風(fēng)格;以家電、汽車為核心的可選消費(fèi)品風(fēng)格;以醫(yī)藥、紡織服裝為核心的必須消費(fèi)品風(fēng)格;以有色、煤炭、鋼鐵、石油石化為核心的強(qiáng)周期風(fēng)格。整體來看,各類別的劃分結(jié)果與定性認(rèn)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 曲柄連桿機(jī)構(gòu)的運(yùn)動優(yōu)化考核試卷
- 文化用品租賃業(yè)務(wù)成本控制考核試卷
- 化工產(chǎn)品批發(fā)商市場營銷策略評估與優(yōu)化考核試卷
- 酵素浴培訓(xùn)課件
- 蔬菜大棚出售合同范本
- 環(huán)衛(wèi)運(yùn)營合同范本
- 培訓(xùn)課件經(jīng)典案例
- 小學(xué)生講紀(jì)律課件
- 房屋修繕賠償合同范本
- 湖南省招投標(biāo)培訓(xùn)課件
- 小學(xué)音樂-《龍里格龍》教學(xué)設(shè)計(jì)學(xué)情分析教材分析課后反思
- 《兒科學(xué)》課件第15章第四節(jié) 先天性甲狀腺功能減退癥
- 安全管理組織結(jié)構(gòu)分工圖
- GB/T 2965-2023鈦及鈦合金棒材
- 六西格瑪(6Sigma)詳解及實(shí)際案例分析
- 短視頻與直播電商運(yùn)營高職PPT完整全套教學(xué)課件
- 哲學(xué)的基本問題 【備課精講精研】 高中政治統(tǒng)編版必修四哲學(xué)與文化
- 新聞采訪與寫作課件第八章采訪的準(zhǔn)備
- 工程公司“十四五”發(fā)展戰(zhàn)略規(guī)劃(專業(yè)完整模板)
- 部編版三年級下冊語文全冊教案表格版
- 70歲以上老年人考駕照三力測試題
評論
0/150
提交評論