




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、內(nèi)容目錄 HYPERLINK l _TOC_250012 一、綜述 3 HYPERLINK l _TOC_250011 二、行業(yè)內(nèi)因子篩選 4 HYPERLINK l _TOC_250010 基礎(chǔ)因子 6 HYPERLINK l _TOC_250009 特質(zhì)因子 10 HYPERLINK l _TOC_250008 2.2.1 銀行 10 HYPERLINK l _TOC_250007 2.2.2 券商 11 HYPERLINK l _TOC_250006 2.2.3 地產(chǎn) 11 HYPERLINK l _TOC_250005 2.2.4 其他 12 HYPERLINK l _TOC_2500
2、04 2.3 匯總 14 HYPERLINK l _TOC_250003 三、組合構(gòu)建 14 HYPERLINK l _TOC_250002 四、總結(jié)、思考與展望 20 HYPERLINK l _TOC_250001 五、參考文獻(xiàn) 21 HYPERLINK l _TOC_250000 風(fēng)險提示 21圖表目錄圖表 1:各行業(yè)樣本數(shù) 4圖表 2:因子列表 5圖表 3:因子無效行業(yè) 6圖表 4:周期行業(yè)yoy_np_q 因子與 sue 因子ICIR 值對比 6圖表 5:單季度營收增長因子測試 7圖表 6:存貨周轉(zhuǎn)率變化因子測試 8圖表 7:應(yīng)收賬款占比與應(yīng)收賬款周轉(zhuǎn)率變化因子表現(xiàn) 9圖表 8:應(yīng)收賬
3、款周轉(zhuǎn)率變化因子測試 9圖表 9:凈息差因子分組超額收益 10圖表 10:撥備覆蓋率因子第一組超額收益 11圖表 11:券商估值因子第一組超額收益 11圖表 12:地產(chǎn)行業(yè)成長因子第一組超額收益 12圖表 13:流動負(fù)債增長因子第一組超額收益 12圖表 14:商譽占比因子IC 累計值 13圖表 15:各行業(yè)研發(fā)強(qiáng)度第一組超額收益 13圖表 16:各行業(yè)選取因子匯總 14圖表 17:模型表現(xiàn)對比 15圖表 18:全市場模型和行業(yè)選股模型相關(guān)系數(shù) 16圖表 19:各模型表現(xiàn) 16圖表 20:各模型表現(xiàn)對比 17圖表 21:300 增強(qiáng)策略凈值 18圖表 22:300 增強(qiáng)結(jié)果對比 18圖表 23:
4、300 增強(qiáng)歸因分析 18圖表 24:500 增強(qiáng)策略凈值 19圖表 25:500 增強(qiáng)結(jié)果對比 19圖表 26:500 增強(qiáng)歸因分析 19一、綜述隨著全市場基本面 alpha 增量信息的挖掘變得越來越困難,行業(yè)內(nèi)選股模型開始備受關(guān)注。一方面是因為有很多因子只在某一行業(yè),或者某些特定行業(yè)有效,而全市場建模無法方便的加入這些信息。另一方面,由于不同行業(yè)的屬性不同,細(xì)分行業(yè)建??赡鼙热袌鼋nA(yù)測的更加準(zhǔn)確?;谏鲜鰞蓚€原因,我們嘗試構(gòu)建行業(yè)內(nèi)選股模型,期望該方法能夠?qū)υ械娜袌瞿P陀兴倪M(jìn)。目前市場上對行業(yè)內(nèi)選股的研究已經(jīng)有很多,我們將其分為三類:第一類是純測試的方法。給定一個標(biāo)準(zhǔn),例如 IC
5、 或者 ICIR 的閾值,然后滾動篩選出每個行業(yè)滿足該篩選標(biāo)準(zhǔn)的因子,分行業(yè)進(jìn)行預(yù)測,最后合起來構(gòu)建組合。通過回測,我們發(fā)現(xiàn)此方法最終的策略表現(xiàn)相對于原來的全市場策略并沒有增強(qiáng),即使是全樣本篩選因子而不是滾動篩選,在可能過擬合的情況下,該方法也并沒有顯著的好于原策略。究其原因,我們認(rèn)為有兩點:不同行業(yè)應(yīng)該有不同的篩選標(biāo)準(zhǔn)。由于不同行業(yè)的股票數(shù)量相差較大,對不同行業(yè)有相同預(yù)測能力的因子,在股票數(shù)量少的行業(yè),其穩(wěn)定性即 ICIR 也會較低。過嚴(yán)的篩選標(biāo)準(zhǔn)會使得某些行業(yè)沒有有效因子,而過松的篩選標(biāo)準(zhǔn)會使得某些行業(yè)加入過多的噪聲。而對不同行業(yè)使用不同篩選標(biāo)準(zhǔn),則會增加大量的參數(shù)而導(dǎo)致模型容易過擬合。行
6、業(yè)內(nèi)股票數(shù)量過少,盡管篩選出來的因子可能更加符合行業(yè)特征,使得預(yù)測的偏差更小,但是由于行業(yè)樣本少,預(yù)測的方差會增大??紤]一種特殊情況,假設(shè)某行業(yè)股票收益的預(yù)測函數(shù)與全市場股票完全一致。那么行業(yè)內(nèi)選股是用該行業(yè)(50 只股票)的歷史數(shù)據(jù)進(jìn)行訓(xùn)練來預(yù)測該行業(yè)股票收益,而全市場模型是用 3000 只股票的歷史數(shù)據(jù)來進(jìn)行預(yù)測,顯然后者的預(yù)測會更加準(zhǔn)確。在實驗中我們也發(fā)現(xiàn)像綜合行業(yè)的樣本內(nèi)選股收益總是要弱于全市場選股的。第二類是純邏輯的方法。即先有行業(yè)的邏輯,再根據(jù)邏輯構(gòu)造因子。這個方法是最為理想的方法,我們也嘗試通過行業(yè)研究的邏輯來尋找因子,但遇到了一些困難:行業(yè)研究的精力集中在對公司業(yè)務(wù)的拆解,通過
7、對子行業(yè)發(fā)展或者公司業(yè)務(wù)的發(fā)展的分析來預(yù)測公司未來的營收以及凈利潤,這種基于公司業(yè)務(wù)的邏輯較難形成選股因子。例如對于凈利率和毛利率這兩個因子,在每個行業(yè)都是有用的基本面指標(biāo),但如果去測試,會發(fā)現(xiàn)不同行業(yè)毛利率和凈利率的因子表現(xiàn)相差巨大。行業(yè)研究和因子選股的是兩種思路,不管是毛利率還是凈利率,都只是研究員對公司未來盈利預(yù)測時需要考慮的變量之一,除此之外,他們更加關(guān)心的是公司業(yè)務(wù)或者所屬子行業(yè)的發(fā)展,實地調(diào)研的結(jié)果等。而從因子選股的角度來說,對于基本面因子,我們是需要該變量有預(yù)測公司未來基本面的能力,從而才可能預(yù)測股票未來的收益。行業(yè)研究的邏輯較為微觀,一個細(xì)分領(lǐng)域的可比公司可能只有不到十家,這與
8、我們量化選股要求廣度的思路相違背。第三類是測試和邏輯相結(jié)合的方法,即先測試每個行業(yè)每個因子的表現(xiàn),然后從中找到一些行業(yè)邏輯。這類方法較為方便,但十分容易找到偽邏輯,從而陷入過擬合。例如我們在交運行業(yè)測試因子,發(fā)現(xiàn)資產(chǎn)周轉(zhuǎn)率增長表現(xiàn)很好,在所有測試的因子中 ICIR 排名第一,我們認(rèn)為這是由于交運行業(yè)較為重視公司的周轉(zhuǎn)率,于是將該因子納入交運行業(yè)的因子池,但這顯然是靠測試得到的邏輯,有很高的過擬合的概率。因為資產(chǎn)周轉(zhuǎn)率的提升在每個行業(yè)都代表著公司運營效率的提升,按照這個邏輯,資產(chǎn)周轉(zhuǎn)率增長因子應(yīng)該在每個行業(yè)都表現(xiàn)較好,但事實是只有部分行業(yè)中該因子有選股能力。因此如果我們沒有找到為何資產(chǎn)周轉(zhuǎn)率在不
9、同行業(yè)表現(xiàn)不同的核心邏輯,那么我們在交運行業(yè)中就不該選入資產(chǎn)周轉(zhuǎn)率增長這一因子。對于這類邏輯在各個行業(yè)都通用的傳統(tǒng)財務(wù)因子,我們需要進(jìn)行行業(yè)間的橫向比較,從而找出因子適用的行業(yè)。對于純邏輯的方法,我們目前還沒有找到一個有效的構(gòu)建選股因子或者模型的方法。因此,在本篇報告中,我們還是使用測試和邏輯相結(jié)合的方法來構(gòu)建行業(yè)內(nèi)模型。那么對于這個方法,最需要注意的就是其過擬合的可能性,我們在研究中盡量避免這一問題,使得模型在樣本外有較好的表現(xiàn)。本報告的研究主要分為兩部分,第一部分是行業(yè)內(nèi)因子的選取,第二部分是如何將各行業(yè)的預(yù)測結(jié)合起來最后形成投資組合。由于行業(yè)內(nèi)選股是偏基本面的策略,因此本文只采用線性加權(quán)
10、的方式進(jìn)行預(yù)測,我們將重點放在第一部分,即尋找各個行業(yè)適用的因子。二、行業(yè)內(nèi)因子篩選由于行業(yè)內(nèi)的樣本過少,當(dāng)前成分股最多的行業(yè)也只有不到 300 只股票,而最少的只有30 只左右,在我們樣本區(qū)間的早期,大部分行業(yè)成分股的樣本數(shù)量都不到 100 只。因此在選取行業(yè)內(nèi)因子時,我們必須找到因子的邏輯。圖表 1:各行業(yè)樣本數(shù)2009 年 1 月2019 年 6 月機(jī)械86328基礎(chǔ)化工109273醫(yī)藥105270電子元器件62207計算機(jī)29191汽車61173電力及公用事業(yè)67150電力設(shè)備47149房地產(chǎn)108134傳媒15132通信30118建筑31117輕工制造31103交通運輸66101有色
11、金屬5097食品飲料3795商貿(mào)零售7991紡織服裝5584建材4183農(nóng)林牧漁4876家電2365國防軍工1956石油石化1845鋼鐵4044證券839綜合2338煤炭2834餐飲旅游2030銀行1426多元金融217保險36資料來源: ,Wind我們將因子分為兩類,之所以這樣分類,是因為我們認(rèn)為對于這兩類因子,我們尋找邏輯的方式是不同的:基礎(chǔ)因子:這類因子基本都是各行業(yè)適用的傳統(tǒng)財務(wù)指標(biāo),全市場有效,但在不同行業(yè)的表現(xiàn)不同。這類因子由于已經(jīng)通過全市場的驗證,在大樣本下證明了其有效性,且一般來說都有一個較為合理的全市場邏輯,因此不會存在過擬合的可能。對于這類因子,我們的假設(shè)是這些因子在不同行
12、業(yè)表現(xiàn)不同,從而通過行業(yè)的橫向比較,尋找到哪些行業(yè)更適用的邏輯,并在這些行業(yè)使用該因子。特質(zhì)因子:這類因子是只有某些特定行業(yè)邏輯的因子,一般來說全市場無效,只在少數(shù)幾個行業(yè)有效,例如研發(fā)、商譽、經(jīng)營類、杠桿類因子等。這類因子是最需要注意過擬合風(fēng)險的。對于一個因子,分二十多個樣本測試一遍,幾乎總可能找到顯著的子樣本。那么對于這類因子,必須要先有邏輯,然后再進(jìn)行測試?;蛘呤窃撘蜃幼銐蝻@著,能夠通過多重檢驗。為了避免過擬合,我們選取盡可能少的,邏輯清晰的因子作為我們的基礎(chǔ)因子池。圖表 2:因子列表類別指標(biāo)含義1估值ep市盈率倒數(shù)2估值bp市凈率倒數(shù)3成長yoy_np_q單季度凈利潤增長4成長yoy_
13、or_q單季度營收增長5成長roe_q_delta單季度 roe 變化6盈利roe_q單季度 roe7盈利netmargin_ratio_q單季度凈利率8盈利grossmargin_ratio_q單季度毛利率9盈利netmargin_ratio_q_delta單季度凈利率變化10盈利grossmargin_ratio_q_delta單季度毛利率變化11運營inv_turnover_q_delta單季度存貨周轉(zhuǎn)率變化12運營asset_turnover_q_delta單季度資產(chǎn)周轉(zhuǎn)率變化13運營acct_rcv_q_delta單季度應(yīng)收賬款周轉(zhuǎn)率變化14特質(zhì)nim銀行業(yè)凈息差15特質(zhì)npc銀行業(yè)
14、撥備覆蓋率16特質(zhì)ep_12m券商月報數(shù)據(jù)構(gòu)建的 ep17特質(zhì)sp_12m券商月報數(shù)據(jù)構(gòu)建的 sp18特質(zhì)adv_to_sales房地產(chǎn)行業(yè)業(yè)績保證系數(shù)19特質(zhì)yoy_cur_liab流動負(fù)債增長20特質(zhì)rd_or研發(fā)強(qiáng)度21特質(zhì)goodwill_to_bv商譽占比資料來源: ,Wind下面我們分別對這些因子進(jìn)行測試以及分析,以下測試中剔除了綜合行業(yè)以及金融行業(yè)。我們首先對所有因子進(jìn)行異常值處理,然后分別在行業(yè)內(nèi)對市值進(jìn)行中性化。由于 12 年之前的股票數(shù)量過少,我們的樣本從 13 年開始。不同行業(yè)的股票數(shù)量不一樣,其 ICIR的大小不具備可比性,對于不滿足硬性標(biāo)準(zhǔn)(ICIR0.6)的因子,我
15、們還會綜合考慮該因子在行業(yè)內(nèi)的相對表現(xiàn)?;A(chǔ)因子在基礎(chǔ)因子中,經(jīng)過測試我們發(fā)現(xiàn)其中有幾個因子幾乎在所有行業(yè)中的有效??梢钥吹?,這幾個因子都與公司的凈利潤相關(guān),這也是公司基本面最核心的因素。同時這幾個指標(biāo)分別代表了公司的三的方面,估值,盈利能力,以及成長性。圖表 3:因子無效行業(yè)指標(biāo)無效行業(yè)roe_q餐飲旅游ep餐飲旅游yoy_np_q餐飲旅游,零售,農(nóng)林牧漁roe_q_delta家電,農(nóng)林牧漁,餐飲旅游資料來源: 我們發(fā)現(xiàn)餐飲旅游行業(yè),這些最基本的因子都沒有效果。我們認(rèn)為可能有兩點原因。第一是餐飲旅游行業(yè)的股票數(shù)量過少,截止目前只有 30 只左右,因子中包含的噪聲較多。同時其子行業(yè)又分旅行社、
16、景區(qū)、酒店、餐飲,成分股之間差異較大,題材頻出,因此市場表現(xiàn)可能會與基本面有較大的偏離。對于餐飲旅游行業(yè),我們將不進(jìn)行單獨的行業(yè)內(nèi)預(yù)測。在農(nóng)林牧漁行業(yè),成長因子凈利潤增長和 roe 變化并沒有效果。但我們測試農(nóng)林牧漁行業(yè)的其他因子,會發(fā)現(xiàn) sue 因子表現(xiàn)很好,這可能是由于農(nóng)林牧漁行業(yè)的凈利潤波動性較大,單季度的凈利潤增長可能是由于周期性原因?qū)е?,并不代表公司過去業(yè)績的穩(wěn)定增長。因此使用 sue 能夠幫助我們過濾掉利潤波動大的公司。這一邏輯在可能在其他周期性的行業(yè)中也同樣適用,我們比較了周期性行業(yè) sue 與 yoy_np_q 的 ICIR 值,在周期性行業(yè)中,sue 確實要穩(wěn)定好于單季度凈利
17、潤的增長。圖表 4:周期行業(yè)yoy_np_q 因子與 sue 因子 ICIR 值對比yoy_np_qsue基礎(chǔ)化工1.3322.085電力設(shè)備1.2351.430機(jī)械0.9581.199鋼鐵0.7441.109建材0.6751.027有色金屬0.8810.916輕工制造0.6290.901石油石化0.7640.864農(nóng)林牧漁0.6000.829建筑工程0.4210.590煤炭0.5940.569資料來源: ,Wind除了上述四個因子之外,其他因子基本上都只在半數(shù)行業(yè)顯著。對于這類因子,我們根據(jù)測試結(jié)果提出猜想,然后尋找行業(yè)的邏輯,且在有邏輯的行業(yè)使用他們。需要注意的是我們不可能找到所有表現(xiàn)好的
18、行業(yè)的邏輯,一些行業(yè)因子表現(xiàn)較好可能剛好是隨機(jī)樣本造成的,其表現(xiàn)并不可持續(xù)。因此,我們盡可能找到一些簡單直觀的邏輯,并只在有邏輯的行業(yè)中使用他們。yoy_or_q:營收增長按道理在每個行業(yè)都是較為重要的指標(biāo),但是在很多行業(yè)中,其并沒有選股效果例如煤炭,農(nóng)林牧漁,軍工,食品飲料,輕工,公用,石油石化,紡織服裝,建材。這些行業(yè)并沒有明顯的共性。但是在 TMT 行業(yè),營收增長因子效果非常好,排在所有行業(yè)的前列。這可能的原因是在 TMT 行業(yè)中,有較多公司或者項目尚未盈利,但其未來成長性較好,因此在評價公司成長性時會更加重視公司的營收增長。圖表 5:單季度營收增長因子測試ICICIR通信0.0531.
19、368計算機(jī)0.0481.575傳媒0.0450.856商貿(mào)零售0.0421.320餐飲旅游0.0420.684電力設(shè)備0.0371.007基礎(chǔ)化工0.0371.439機(jī)械0.0351.042醫(yī)藥0.0351.091有色金屬0.0310.950電子元器件0.0311.026建筑0.0310.751家電0.0300.671鋼鐵0.0290.611石油石化0.0290.495汽車0.0260.874交通運輸0.0260.746建材0.0250.567紡織服裝0.0230.535國防軍工0.0210.313輕工制造0.0210.470食品飲料0.0180.452電力及公用事業(yè)0.0160.488農(nóng)林
20、牧漁0.0080.196煤炭-0.002-0.041資料來源: ,Windbp: 按照邏輯我們應(yīng)該在強(qiáng)周期行業(yè)中使用 bp 指標(biāo),這是由于強(qiáng)周期行業(yè)在不同時期市盈率波動較大,而企業(yè)的凈資產(chǎn)相對于盈利來說周期性并不強(qiáng),因此 bp 是一個較為有效的指標(biāo)。我們在金融和周期板塊中測試了該因子,均有不錯的表現(xiàn)。inv_turnover_q_delta:Alan 等(2014)研究了存貨周轉(zhuǎn)率在零售行業(yè)的表現(xiàn),他們認(rèn)為存貨周轉(zhuǎn)率的提升代表著企業(yè)效率的提升,其未來的營收和利潤也會有所增加,而這一因子并不能被市場及時的定價。之所以在零售行業(yè)分析是因為零售行業(yè)的主要業(yè)務(wù)就是直接進(jìn)行商品的買賣,其存貨周轉(zhuǎn)率對盈利
21、有較大的影響。其他消費類行業(yè)例如食品飲料,家電與此有類似的邏輯。我們在這些行業(yè)測試了存貨周轉(zhuǎn)率因子,除了紡服行業(yè),都有較好的表現(xiàn)。圖表 6:存貨周轉(zhuǎn)率變化因子測試ICICIR通信0.0421.094交通運輸0.0381.174食品飲料0.0350.819電力設(shè)備0.0331.008醫(yī)藥0.0331.298石油石化0.0300.696基礎(chǔ)化工0.0291.116家電0.0280.695商貿(mào)零售0.0260.817汽車0.0250.845有色金屬0.0240.725鋼鐵0.0220.536煤炭0.0220.434建材0.0220.538電子元器件0.0190.792電力及公用事業(yè)0.0160.56
22、0計算機(jī)0.0130.482建筑0.0110.294機(jī)械0.0090.405紡織服裝0.0070.189國防軍工0.0070.140農(nóng)林牧漁-0.009-0.215輕工制造-0.010-0.291傳媒-0.015-0.351資料來源: ,Windacct_rcv_turnover_q_delta:應(yīng)收賬款周轉(zhuǎn)率增長代表企業(yè)的回款速度變快,也代表著企業(yè)面對下游供應(yīng)更加強(qiáng)勢。但在許多行業(yè)中,應(yīng)收賬款并不是問題,例如上游資源型行業(yè),石油石化,煤炭等,應(yīng)收賬款占總營收比率不到 5。而在一些行業(yè),例如機(jī)械,建筑,應(yīng)收賬款比例非常高達(dá)到 20甚至 30。這是由于這些行業(yè)很多時候都是賒賬進(jìn)行購買。例如機(jī)械行
23、業(yè),對于一些零售端客戶,會使用分期付款的方式進(jìn)行促銷,導(dǎo)致該行業(yè)應(yīng)收賬款占比較高。而對于這些行業(yè),應(yīng)收賬款周轉(zhuǎn)率的變化顯得非常重要。我們將各行業(yè)應(yīng)收賬款占比與因子表現(xiàn)進(jìn)行回歸,回歸系數(shù)非常顯著。因此我們在較為重視應(yīng)收賬款的機(jī)械,建筑,電力設(shè)備,計算機(jī)行業(yè)使用該因子。圖表 7:應(yīng)收賬款占比與應(yīng)收賬款周轉(zhuǎn)率變化因子表現(xiàn)資料來源: ,Wind圖表 8:應(yīng)收賬款周轉(zhuǎn)率變化因子測試應(yīng)收賬款占比ICICIR電力設(shè)備0.3830.0230.663國防軍工0.3530.0360.687機(jī)械0.3240.0190.812計算機(jī)0.3190.0210.613電子元器件0.2510.0150.592醫(yī)藥0.2500
24、.0130.567傳媒0.1990.0340.854建筑0.1960.0290.821通信0.1910.0330.800電力及公用事業(yè)0.175-0.001-0.044輕工制造0.1490.0020.048建材0.1310.0120.374基礎(chǔ)化工0.1260.0160.758紡織服裝0.1260.0170.418汽車0.1220.0230.823家電0.0990.0060.164交通運輸0.0700.0230.767餐飲旅游0.0650.0120.248煤炭0.060-0.005-0.085農(nóng)林牧漁0.059-0.015-0.475有色金屬0.0470.0120.377商貿(mào)零售0.0360.
25、0140.423食品飲料0.0330.0060.176鋼鐵0.0310.0090.168石油石化0.0300.0250.487資料來源: ,Wind還有一些因子,例如 asset_turnover_q_delta,netmargin_ratio_q 等,盡管它們有很強(qiáng)的全市場邏輯以及全市場表現(xiàn),但是我們在測試中發(fā)現(xiàn)只有半數(shù)行業(yè)這些因子有顯著的選股效果,我們并沒有找到在哪些行業(yè)這些因子更加適用的邏輯,也有可能該因子在不同行業(yè)的表現(xiàn)本身并沒有顯著的差異,我們測試的結(jié)果是由于歷史樣本造成的,因此我們不在模型中加入他們。而對于上述找到邏輯的因子,由于因子和股票未來收益的邏輯并不是那么直接,我們基本上都
26、是通過尋找子樣本的方法來尋找邏輯,這一方法在學(xué)術(shù)研究中也非常常見,例如 Titman(2004)通過尋找子樣本因子表現(xiàn)的方法來證明過度投資是導(dǎo)致超額資本支出和股票收益負(fù)相關(guān)的原因。但由于上述的一些因子我們是先測試再尋找的邏輯,我們不排除該方法存在過擬合的可能性。特質(zhì)因子特質(zhì)因子由于只在某些行業(yè)里面有特定的邏輯,因此不需要進(jìn)行行業(yè)的橫向比較。對于這類因子,最好是自上而下的尋找行業(yè)的邏輯,然后再進(jìn)行測試。而對于先測試出來的結(jié)果,我們需要謹(jǐn)慎對待。因為盡管某個因子全市場無效,但分 29 個樣本測試,在其中一個樣本有效的概率也較大,對于這類因子,我們需要進(jìn)行多重檢驗。由于財務(wù)指標(biāo)例如運營效率類指標(biāo),負(fù)
27、債類指標(biāo)大多都是各行業(yè)均較為適用的指標(biāo),因此行業(yè)內(nèi)特質(zhì)的財報因子并不多,下面我們列出了一些常見的行業(yè)特質(zhì)因子。銀行通過參考我們前期的報告銀行行業(yè)基本面量化選股與擇時,我們選取了凈息差和和撥備覆蓋率兩個因子。其中凈息差代表了銀行的盈利能力,凈息差越高,說明銀行單位生息資產(chǎn)的盈利能力。因此凈息差越高的公司,未來營收和凈利潤的增長也會越快。圖表 9:凈息差因子分組超額收益資料來源: ,Wind撥備覆蓋率本來是一個衡量銀行風(fēng)險的因子,指貸款損失準(zhǔn)備對不良貸款的比率,主要反映商業(yè)銀行對貸款損失的彌補(bǔ)能力和對貸款風(fēng)險的防范能力。但是這個指標(biāo)經(jīng)常被銀行作為調(diào)節(jié)利潤的工具。例如某銀行資產(chǎn)規(guī)模和營收同步增長,對
28、應(yīng)的不良資產(chǎn)也同比例增長,如果要維持前期的撥備覆蓋率,就要計提更多的減值準(zhǔn)備,從而使得凈利潤的增長降低。有些銀行會選擇不計提,保持較高的報表凈利潤增速,但使得撥備覆蓋率降低。因此維持一個較高的撥備覆蓋率代表公司對其當(dāng)前以及未來盈利有足夠的信心。但這個因子未來有失效的可能,這是由于新政策規(guī)定銀行的撥備覆蓋率不得高于 2,使得銀行無法通過提高減值準(zhǔn)備的計提來隱藏利潤。圖表 10:撥備覆蓋率因子第一組超額收益資料來源: ,Wind券商估值因子是券商行業(yè)最有效的因子。由于券商行業(yè)每個月會及時的發(fā)布其上月的經(jīng)營情況,我們根據(jù)最新的月報數(shù)據(jù)構(gòu)造估值因子 ep、bp、sp,并與使用財務(wù)報表構(gòu)建的估值因子相比
29、較。盡管 IC 和 ICIR 上與原因子沒有顯著差別,但是 ep,sp 因子的單調(diào)性變好,第一組的收益有略微提升,bp 幾乎沒有差別。圖表 11:券商估值因子第一組超額收益資料來源: ,Wind地產(chǎn)受“預(yù)售制”的影響,房企利潤表通常為歷史項目的現(xiàn)實確認(rèn),因此利潤表科目是滯后于企業(yè)當(dāng)前的經(jīng)營狀況的,我們需要從另外兩張報表來尋找地產(chǎn)企業(yè)當(dāng)前的增長情況?,F(xiàn)金流量表相比利潤表更能反映地產(chǎn)公司目前的經(jīng)營狀況,但是銷售商品提供勞務(wù)獲得的現(xiàn)金流增長這一指標(biāo)最近幾年表現(xiàn)一般。我們使用業(yè)績保障系數(shù)=預(yù)收賬款/營業(yè)收入 TTM 來作為房地產(chǎn)公司增長的代理指標(biāo)。預(yù)收賬款代表著企業(yè)當(dāng)前的銷售情況,而營業(yè)收入代表這過去
30、,業(yè)績保障系數(shù)越大,代表企業(yè)未來年度的業(yè)績更有保障。圖表 12:地產(chǎn)行業(yè)成長因子第一組超額收益資料來源: ,Wind另外,流動負(fù)債和總負(fù)債增長因子在地產(chǎn)行業(yè)有較好的表現(xiàn)。這是由于房地產(chǎn)行業(yè)為高杠桿經(jīng)營的行業(yè),發(fā)債是其主要的融資渠道。負(fù)債的增長能夠側(cè)面反映公司的業(yè)務(wù)的擴(kuò)張,能夠預(yù)測其未來營收的增長。但隨著宏觀去杠桿的進(jìn)行,該因子在 18 年之后表現(xiàn)一般,其未來的表現(xiàn)需要進(jìn)一步的觀察。圖表 13:流動負(fù)債增長因子第一組超額收益資料來源: ,Wind其他傳媒行業(yè)近年來最受關(guān)注的便是商譽因子。我們測了商譽占凈資產(chǎn)比例這一因子,發(fā)現(xiàn)其效果較好。但這個因子更多的是一個負(fù)向因子,即商譽占比最高的一組,幾乎穩(wěn)
31、定跑輸市場。圖表 14:商譽占比因子IC 累計值資料來源: ,Wind電子,計算機(jī),醫(yī)藥行業(yè),研發(fā)強(qiáng)度因子均有較好的表現(xiàn)。圖表 15:各行業(yè)研發(fā)強(qiáng)度第一組超額收益資料來源: ,Wind除此之外,對于那些并不是行業(yè)特有的邏輯,而是在測試中發(fā)現(xiàn)的特質(zhì)因子,我們需要使用多重檢驗來排除過擬合的可能。尤其是一些經(jīng)營類因子,或者杠桿類因子,由于其全市場并沒有穩(wěn)定的 alpha,只是在某些行業(yè)測出來好,因此很容易得出某行業(yè)較為重視該方面的經(jīng)營效率或者杠桿風(fēng)險這樣的偽邏輯而陷入過擬合。從純測試的角度來說,我們對一個因子在所有行業(yè)內(nèi)的測試結(jié)果進(jìn)行多重檢驗,采用 BHY調(diào)整,發(fā)現(xiàn)大部分原本在少數(shù)兩三個行業(yè)中有效的
32、因子,經(jīng)過調(diào)整之后變得都不顯著了。這可能是由于財務(wù)因子顯著性相對于價量因子不是特別高,在多重檢驗下,我們通過單純的測試得到的財務(wù)因子基本上都不能通過檢驗。因此通過純測試的方法得到的因子我們需要謹(jǐn)慎考慮其過擬合的可能性。匯總圖表 16:各行業(yè)選取因子匯總在上述的分析中,我們盡可能的從邏輯出發(fā),針對因子在不同行業(yè)的適用性,以及一些行業(yè)的特質(zhì)邏輯,選取了每個行業(yè)適用的因子。因子最少的行業(yè)只有 3 個因子,而因子最多的行業(yè)也只有 8 個因子。雖然我們選取的因子不多且都是一些常見的因子,但是基本能夠保證這些因子在行業(yè)內(nèi)是有邏輯的,其因子表現(xiàn)是可以持續(xù)的。如果今后能夠再找到某些因子的行業(yè)邏輯,我們可以對該
33、因子列表進(jìn)行持續(xù)的填充。行業(yè)因子交通運輸ep、yoy_np_q、roe_q_delta、roe_q證券bp、ep_12m、sp_12m有色金屬ep、yoy_np_q、roe_q_delta、roe_q、bp醫(yī)藥ep、yoy_np_q、roe_q_delta、roe_q、rd_or、inv_turnover_q_delta銀行bp、ep、yoy_or_q、yoy_np_q、roe_q_delta、roe_q、nim、npc通信食品飲料ep、yoy_np_q、roe_q_delta、roe_q、yoy_or_qep、yoy_np_q、roe_q_delta、roe_q、inv_turnover_q
34、_delta石油石化ep、yoy_np_q、roe_q_delta、roe_q、bp商貿(mào)零售ep、yoy_or_q、roe_q_delta、roe_q、inv_turnover_q_delta汽車ep、yoy_np_q、roe_q_delta、roe_q、inv_turnover_q_delta輕工制造ep、yoy_np_q、roe_q_delta、roe_q農(nóng)林牧漁煤炭ep、bp、sue1ep、yoy_np_q、roe_q_delta、roe_q、bp建筑ep、yoy_np_q、roe_q_delta、roe_q、bp、acct_rcv_turnover_q_delta建材ep、yoy_np
35、_q、roe_q_delta、roe_q、bp計算機(jī)ep、yoy_np_q、roe_q_delta、roe_q、yoy_or_q、acct_rcv_turnover_q_delta、rd_or家電ep、yoy_np_q、roe_q、inv_turnover_q_delta基礎(chǔ)化工機(jī)械ep、yoy_np_q、roe_q_delta、roe_qep、yoy_np_q、roe_q_delta、roe_q、bp、acct_rcv_turnover_q_delta國防軍工ep、yoy_np_q、roe_q_delta、roe_q鋼鐵ep、yoy_np_q、roe_q_delta、roe_q、bp房地產(chǎn)b
36、p、cur_liab_yoy、adv_to_sales紡織服裝ep、yoy_np_q、roe_q_delta、roe_q電子元器件電力設(shè)備ep、yoy_np_q、roe_q_delta、roe_q、yoy_or_q、rd_orep、yoy_np_q、roe_q_delta、roe_q、acct_rcv_turnover_q_delta傳媒ep、yoy_np_q、roe_q_delta、roe_q、yoy_or_q、goodwill_to_bv電力及公用事業(yè)ep、yoy_np_q、roe_q_delta、roe_q資料來源: 三、組合構(gòu)建得到每個行業(yè)適用的指標(biāo)之后,我們嘗試構(gòu)建行業(yè)內(nèi)的選股模型。
37、我們將因子分為估值,成長,盈利和其他四類,然后在小類中等權(quán)合成,再將大類因子用 ICIR 加權(quán)。由于行業(yè)中樣本過少,ICIR 較為不穩(wěn)定,這里我們使用過去 24 個月的 ICIR 值作為權(quán)重。得到各行業(yè)內(nèi)的組合之后,我們將其和全市場選股的模型進(jìn)行對比。圖表 17:模型表現(xiàn)對比第二節(jié)中提到餐飲旅游行業(yè)的股票過少,而且常見的因子對其也沒有預(yù)測能力,因此我們不對餐飲旅游行業(yè)進(jìn)行行業(yè)內(nèi)預(yù)測。綜合行業(yè)沒有特定的行業(yè)邏輯,我們也不對其進(jìn)行行業(yè)內(nèi)的預(yù)測。對于銀行券商行業(yè),全市場模型幾乎沒有預(yù)測能力。其他行業(yè)中,建筑,國防,石油石化等行業(yè),行業(yè)內(nèi)模型是要略好于全市場模型的,但是電力設(shè)備,建材等行業(yè),行業(yè)模型要
38、略差于全市場模型。全市場選股行業(yè)內(nèi)選股年化收益年化波動IR最大回撤年化收益年化波動IR最大回撤銀行0.000.060.010.170.080.061.430.04證券0.010.070.180.260.090.071.290.10建筑0.090.081.150.110.110.081.450.10國防軍工0.040.080.560.110.060.080.750.12石油石化0.070.080.860.160.090.081.170.07汽車0.060.070.790.100.100.051.950.04有色金屬0.060.061.030.120.070.061.190.07紡織服裝0.030
39、.070.620.090.050.050.960.08計算機(jī)0.080.061.190.050.080.061.240.07房地產(chǎn)0.030.050.580.140.060.051.150.09交通運輸0.070.060.990.090.060.070.820.08家電0.040.080.570.140.050.090.570.22食品飲料0.080.081.080.190.110.061.690.05輕工制造0.090.081.170.070.110.071.500.08傳媒0.060.080.680.120.080.080.870.12電力及公用事業(yè)0.060.061.100.080.08
40、0.071.170.12商貿(mào)零售0.050.070.800.100.080.061.330.06醫(yī)藥0.090.051.870.050.100.042.230.02煤炭0.100.071.290.090.090.071.310.13電子元器件0.100.061.620.050.100.051.860.04農(nóng)林牧漁0.090.081.140.100.070.051.150.05通信0.110.071.420.080.090.071.320.05鋼鐵0.110.110.960.100.080.100.830.11基礎(chǔ)化工0.100.051.840.040.100.051.960.02機(jī)械0.100
41、.042.230.030.080.041.850.05建材0.120.091.240.100.100.081.140.09電力設(shè)備0.120.062.150.030.100.061.710.03資料來源: ,Wind由上表我們發(fā)現(xiàn),即使我們按照行業(yè)的邏輯選取了因子,我們也很難做到在所有行業(yè)中都能夠跑贏全市場模型。我們認(rèn)為這也是做行業(yè)選股一個常見的誤區(qū),就是希望每個行業(yè)我們都能做的較好,戰(zhàn)勝全市場模型。可能從理論上,這個結(jié)論就無法實現(xiàn)。在綜述中我們提到,行業(yè)股票的數(shù)量是制約行業(yè)選股效果最重要的原因。盡管我們能夠選取出行業(yè)適用的因子,但是由于行業(yè)樣本量太少,我們的對行業(yè)內(nèi)股票收益的估計仍然可能不太
42、準(zhǔn)確。這其實對應(yīng)著機(jī)器學(xué)習(xí)中的 bias variance trade off。行業(yè)內(nèi)選股減小了 bias,但是增加了 variance,因此最后的結(jié)果不一定比原來高 bias 低 variance 的全市場模型好。另一方面,我們在行業(yè)模型中加入的因子信息較少,這是由于很多因子沒有典型的行業(yè)邏輯,例如薪酬類,分析師類因子,以及我們前一部分沒有找到邏輯的財務(wù)因子。因此我們發(fā)現(xiàn)盡管我們有針對性的對每個行業(yè)選取了因子,還是有很多行業(yè)的行業(yè)內(nèi)模型要弱于全市場模型。行業(yè)內(nèi)選股模型的 alpha 的整體 IC 要低于全市場模型(圖表 18)從邏輯上來講,我們認(rèn)為券商,銀行,地產(chǎn)這三個行業(yè)行業(yè)內(nèi)選股模型預(yù)測
43、的會更加準(zhǔn)確,因為其行業(yè)邏輯與其他行業(yè)有較大差別。而綜合,餐飲旅游這兩個行業(yè)由于股票數(shù)量過少,且沒有共同的行業(yè)內(nèi)邏輯,我們使用全市場模型。對于其他行業(yè),我們無法從邏輯出發(fā)來判定哪個模型會更好。但值得注意的是,兩個模型的預(yù)測值相關(guān)度較低,平均只有 0.4 左右。因此對于其他行業(yè),一個更好的方法就是將兩個預(yù)測結(jié)合起來從而進(jìn)一步提高模型預(yù)測的準(zhǔn)確性。圖表 18:全市場模型和行業(yè)選股模型相關(guān)系數(shù)資料來源: ,Wind我們分別測試兩種結(jié)合預(yù)測的方法:在每個行業(yè)內(nèi),將兩個預(yù)測按其過去兩年 ICIR 進(jìn)行加權(quán),如果其中一個模型過去兩年無效,即 ICIR 為負(fù),則使用另外一個預(yù)測,如果兩個模型都無效,則等權(quán)加
44、權(quán)。 2)不區(qū)分行業(yè),直接用全截面過去兩年的表現(xiàn)進(jìn)行加權(quán),其他細(xì)節(jié)與方法一一致。圖表 19:各模型表現(xiàn)第一組年化收益第一組年化波動信息比ICICIR全市場選股0.0840.0282.8960.0633.443行業(yè)內(nèi)選股0.0950.0214.4430.0553.741方法一0.0990.0243.9740.0704.186方法二0.1030.0254.0470.0704.135資料來源: ,Wind盡管行業(yè)內(nèi)選股模型的 IC 值要低于全市場選取模型,但是將二者結(jié)合之后,alpha 信號的 IC 以及其 ICIR 都有顯著的提高。但是對于結(jié)合方法,方法一和方法二并無顯著的差別。圖表 20:各模型
45、表現(xiàn)對比方法二合成行業(yè)內(nèi)選股全市場模型合成模型-全市場模型年化收益IC年化收益IC年化收益IC收益差值IC 差值石油石化0.1360.0950.0940.0810.0700.0660.0660.028傳媒0.1100.0600.0750.0470.0610.0490.0490.011計算機(jī)0.1180.0670.0840.0570.0780.0520.0400.015輕工制造0.1250.0820.1160.0690.0910.0660.0350.016食品飲料0.1050.0950.1000.0840.0820.0810.0230.014基礎(chǔ)化工0.1210.0800.0910.0620.1
46、000.0790.0210.001建材0.1390.1030.0970.0690.1180.0910.0210.012汽車0.0760.0660.0980.0680.0560.0540.0210.012建筑0.1050.0790.1100.0880.0850.0530.0190.027通信0.1260.0830.0760.0670.1070.0780.0190.005鋼鐵0.1270.0900.0810.0690.1100.0810.0170.009國防軍工0.0600.0620.0610.0730.0430.0490.0160.014有色金屬0.0710.0640.0670.0610.059
47、0.0510.0120.012家電0.0540.0550.0430.0530.0440.0490.0100.006商貿(mào)零售0.0600.0530.0750.0510.0510.0510.0080.002醫(yī)藥0.1000.0770.0930.0680.0920.0730.0080.003煤炭0.1030.0990.0830.0790.0960.0860.0070.013電力及公用事業(yè)0.0670.0680.0750.0600.0610.0590.0060.009電子元器件0.1090.0780.0980.0690.1060.0790.002-0.001交通運輸0.0690.0610.0590.0
48、540.0690.0470.0010.014機(jī)械0.0980.0720.0780.0600.0970.0770.001-0.005電力設(shè)備0.1200.0840.0970.0630.1210.094-0.001-0.009紡織服裝0.0220.0400.0460.0450.0330.035-0.0110.004農(nóng)林牧漁0.0780.0560.0600.0420.0920.052-0.0140.004資料來源: ,Wind分行業(yè)來看,合成后的預(yù)測模型不管是從 IC 的角度還是從分組收益的角度,基本在所有行業(yè)都優(yōu)于全市場模型。但只在少數(shù)行業(yè)有顯著的提升,大部分行業(yè)提升較少,分組收益和 IC 都僅在
49、 1%左右。我們用上述兩個方法分別構(gòu)建 500 增強(qiáng)和 300 增強(qiáng)組合,結(jié)果如下圖表 21:300 增強(qiáng)策略凈值資料來源: ,Wind圖表 22:300 增強(qiáng)結(jié)果對比全市場模型行業(yè)內(nèi)模型方法一方法二年化收益0.0770.0980.1000.109年化波動0.0530.0480.0500.051IR1.4522.0612.0172.140最大回撤0.0610.0460.0480.041資料來源: ,Wind圖表 23:300 增強(qiáng)歸因分析資料來源: ,Wind圖表 24:500 增強(qiáng)策略凈值資料來源: ,Wind圖表 25:500 增強(qiáng)結(jié)果對比全市場模型行業(yè)內(nèi)模型方法一方法二年化收益0.175
50、0.0950.1790.171年化波動0.0610.0540.0580.058IR2.8801.7773.0962.928最大回撤0.0550.0510.0550.051資料來源: ,Wind圖表 26:500 增強(qiáng)歸因分析資料來源: ,Wind從測試結(jié)果來看,行業(yè)內(nèi)選股模型對 300 增強(qiáng)有較為顯著的提升作用,但通過歸因,我們發(fā)現(xiàn)超額收益的來源主要是銀行和券商兩個行業(yè)。由于全市場模型對這兩個行業(yè)沒有任何超額收益,行業(yè)內(nèi)模型對這個行業(yè)有較為顯著的提升。另一方面,銀行和券商占 300指數(shù)的權(quán)重較大,因此 300 增強(qiáng)模型提升較為顯著。而對于 500 增強(qiáng)模型,我們發(fā)現(xiàn)行業(yè)內(nèi)選股基本上沒有任何的提升,從歸因結(jié)果來看,也是一半行業(yè)變好,一半行業(yè)變差。這可能是由于 500 的權(quán)重行業(yè)例如醫(yī)藥、電子等,我們并沒有找到很多的特質(zhì)因子,因此增量信息并不多,另一方面,500 的行業(yè)權(quán)重較為分散,如果想要有顯著的提升,可能需要對大部分行業(yè)都要有比較明顯的提升。四、總結(jié)、思考與展望如何將行業(yè)內(nèi)的信息納入進(jìn)傳統(tǒng)的多因子模型是大家一直較為關(guān)心的問題。本報告對行業(yè)內(nèi)選股模型進(jìn)行了初步的探索,試圖尋找到行業(yè)內(nèi)選股的有效解決辦法。通過閱讀已有的報告和結(jié)論,我們放棄了純測試的方法。但在試圖通過純邏輯的方法去尋找有效因子時,總是會跟隨著行業(yè)研究的思路把邏輯拆的越來越細(xì),從而很難形成
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 學(xué)生安全責(zé)任規(guī)定
- 2025年武漢市事業(yè)單位招聘考試綜合類專業(yè)能力測試試卷(財務(wù)類)
- 物流運輸行業(yè)工作表現(xiàn)證明書(6篇)
- 一個特別的節(jié)日記事作文(6篇)
- 2025年儲能技術(shù)多元化在電力系統(tǒng)中的應(yīng)用與市場前景分析報告
- ?學(xué)前教育信息化在幼兒園家長工作中的應(yīng)用現(xiàn)狀與改進(jìn)策略
- 2025年裝配式建筑部品部件市場潛力與技術(shù)創(chuàng)新研究報告
- 面向2025年工業(yè)互聯(lián)網(wǎng)平臺入侵檢測系統(tǒng)的網(wǎng)絡(luò)安全防護(hù)與優(yōu)化創(chuàng)新001
- 財務(wù)管理財務(wù)報表分析題
- 歷史文化古代文明演變知識考點
- 農(nóng)業(yè)企業(yè)資產(chǎn)重組方案
- 幼兒園食堂舉一反三自查報告
- 患者發(fā)生窒息的應(yīng)急
- 《環(huán)氧樹脂生產(chǎn)工藝》課件
- 冶金員工安全培訓(xùn)
- 合理雅思學(xué)習(xí)計劃
- 腹股溝疝護(hù)理新進(jìn)展
- 機(jī)修工2025年上半年工作總結(jié)范文
- 食品標(biāo)準(zhǔn)操作規(guī)程
- 《人民法院》課件
- 青海大學(xué)《普通化學(xué)》2022-2023學(xué)年第一學(xué)期期末試卷
評論
0/150
提交評論