




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
研究導(dǎo)讀目前市場(chǎng)上的基金投資者主要根據(jù)基金的收益類指標(biāo)風(fēng)險(xiǎn)類指標(biāo)績(jī)效評(píng)價(jià)標(biāo)準(zhǔn)化標(biāo)來(lái)選擇基金,而基金定期披露的基金基本信息,例如基金規(guī)模、基金費(fèi)用率、基金運(yùn)作時(shí)間基金經(jīng)理任期等指標(biāo)鮮有關(guān)注。其原因主要是因?yàn)橐陨匣鸹拘畔⑼鹞磥?lái)收益的關(guān)系不夠直觀,線性相關(guān)性較弱,簡(jiǎn)單運(yùn)用以上指標(biāo)難以預(yù)測(cè)基金的未來(lái)收益。然而線性相關(guān)性較弱并不意味著基金基本信息與基金未來(lái)收益無(wú)關(guān)二者可能存在非性的相關(guān)關(guān)系考慮到非線性相關(guān)性難以求解我們將使用決策樹(shù)挖掘基金基本信息與基金未來(lái)收益的相關(guān)關(guān)系。在此基礎(chǔ)上,為了提高預(yù)測(cè)精度,避免過(guò)擬合,我們將通過(guò)隨機(jī)森林集成決策樹(shù)的預(yù)測(cè)結(jié)果。在本文的第一部分我將使基金定期披露的基本信息通過(guò)決策樹(shù)與隨機(jī)森林算法,預(yù)測(cè)基金的未來(lái)收益,逐期篩選出優(yōu)質(zhì)基金,構(gòu)建投資組合。通過(guò)對(duì)比組合與基準(zhǔn)收益,探討通過(guò)基金基本信息能否有效選基。在本文的第二部分,在基金基本特征的基礎(chǔ)上,我們將在模型中加入常用于量化選基線性相關(guān)性較強(qiáng)的特征,以期進(jìn)一步提升模型的選基性能。標(biāo)簽及特征構(gòu)建在標(biāo)簽與特征的選擇上我們借鑒了MililBzgls與Sat()的思路與方法,共選用6個(gè)基金基本特征來(lái)預(yù)測(cè)基金收益??紤]到部分基金基本信息僅基金中報(bào)與基金年報(bào)中披露,為充分利用基金特征信息,降低換倉(cāng)成本,我們采用雙報(bào)季調(diào)倉(cāng)策略,每年僅在中報(bào)與年報(bào)披露截止日期后進(jìn)行調(diào)倉(cāng)。針對(duì)不同披露頻率的數(shù)據(jù),根據(jù)不同頻率的調(diào)倉(cāng)策略,需要對(duì)數(shù)據(jù)進(jìn)行調(diào)頻。為方便后續(xù)調(diào)頻與說(shuō)明,以下數(shù)據(jù)均以月度數(shù)據(jù)為例。倘若數(shù)據(jù)僅在季報(bào)、中報(bào)、年報(bào)中披露更新則根據(jù)對(duì)應(yīng)披露截止日期向后填充為月度數(shù)據(jù)。標(biāo)簽由于我們的目標(biāo)是通過(guò)預(yù)測(cè)基金未來(lái)收益,從而篩選優(yōu)質(zhì)基金,故我們選用基金未來(lái)一個(gè)月的收益率 作為訓(xùn)練的標(biāo)簽。特征根據(jù)基金定期披露的基本信息,我們一共生成了6個(gè)特征用來(lái)預(yù)測(cè)基金的未來(lái)收益其中個(gè)別特征的計(jì)算方法需要特別說(shuō)明?;鹳Y金流入率基金在 月的基金凈現(xiàn)金流計(jì)算方法如下:(1)其中為基金當(dāng)月凈資產(chǎn)為基金當(dāng)月凈值增長(zhǎng)率該指標(biāo)主要用來(lái)衡量剔除基金持有證券市場(chǎng)價(jià)值變動(dòng)的情況下,基金資金流入的比率。超額收α我們將基金在 月的超額收益 定義為FmaFch5因子模(Fma&Fc,)超額收益:()其中, 代表無(wú)風(fēng)險(xiǎn)收益率,代表因子收益率,代表殘差。我們使用6個(gè)月滾動(dòng)窗口,通過(guò)S估計(jì)參數(shù),計(jì)算基金的月度超額收益。價(jià)值增量基金在 月的基金凈現(xiàn)金流計(jì)算公式如下:(3)其中,為上述基金月度超額收益,代表基金費(fèi)用率,即總費(fèi)用除以基金凈資產(chǎn)價(jià)值增量用來(lái)衡量在不考慮基金運(yùn)作費(fèi)用的情況下基金在一段時(shí)間內(nèi)取得的超額價(jià)值其它特征為方便查閱,我們將訓(xùn)練決策樹(shù)模型所需的全部特征羅列如下,共計(jì)6個(gè)訓(xùn)練特征。除基金凈值每日更新以,計(jì)算其特征原始數(shù)據(jù)均來(lái)自基金定期報(bào)告基金費(fèi)用相關(guān)數(shù)據(jù)僅在中報(bào)與年報(bào)中詳細(xì)披露,需根據(jù)對(duì)應(yīng)的報(bào)告期進(jìn)行調(diào)整;其它數(shù)據(jù)均在基金季報(bào)更新表1:訓(xùn)練特征明細(xì)特征定義α通過(guò)公式()計(jì)算得到的基金超額收益fw通過(guò)公式()計(jì)算得到的基金資金流入率ved通過(guò)公式()計(jì)算得到的基金價(jià)值增量vyffwfw的標(biāo)準(zhǔn)差A(yù)基金凈資產(chǎn)基金費(fèi)用率,基金總費(fèi)用除以基金凈資產(chǎn)基金運(yùn)作時(shí)間特征定義rre基金在任基金經(jīng)理平均任期rvrro基金換手,賣出股票總收入與買入股票總支出的較小值與基金凈資產(chǎn)之比a-starch5模型中,超額收益α的t統(tǒng)計(jì)量T-starch5模型中,市場(chǎng)因子收益率的t統(tǒng)計(jì)量W-starch5模型中,盈利因子收益率的t統(tǒng)計(jì)量A-starch5模型中,投資因子收益率的t統(tǒng)計(jì)量B-starch5模型中,規(guī)模因子收益率的t統(tǒng)計(jì)量L-starch5模型中,價(jià)值因子收益率的t統(tǒng)計(jì)量2arch5模型的可決系數(shù)RN,整理決策樹(shù)與隨機(jī)森林決策樹(shù)型根據(jù)決策樹(shù)預(yù)測(cè)輸出結(jié)果的不同決策樹(shù)可以分為分類樹(shù)和回歸樹(shù)兩類。當(dāng)我們預(yù)測(cè)結(jié)果為類別時(shí),需要使用分類樹(shù);當(dāng)我們預(yù)測(cè)的結(jié)果為一個(gè)實(shí)數(shù)時(shí),需要使用回歸樹(shù)。決策樹(shù)模型的核心邏輯是根據(jù)度量標(biāo)準(zhǔn),從樹(shù)根開(kāi)始,選擇最優(yōu)特征逐級(jí)分裂,遞推成一顆完整的決策樹(shù)。以分類樹(shù)為例,分裂遵循以下兩條停止條件:某個(gè)分支中的所有樣均屬一類;已無(wú)可供繼續(xù)分裂的特征。業(yè)界目前大多會(huì)使用以下三種度量指標(biāo)作為分裂標(biāo)準(zhǔn):信息增益:對(duì)應(yīng)算法稱第3代迭代二叉樹(shù);信息增益比:對(duì)應(yīng)算法稱第.5代分類樹(shù)(.;基尼系數(shù):對(duì)應(yīng)算法稱回歸分類樹(shù)(A只有回歸分類樹(shù)(A)既可以解決分類問(wèn)題又可以解決回歸問(wèn)題,由于我們的目是通過(guò)基金基本特征預(yù)測(cè)基金未來(lái)收益,在此我們著介紹AT回歸樹(shù)。ART回歸樹(shù)采用最小化平方殘差(Seofsidl)作為分裂標(biāo)準(zhǔn)。我們可以簡(jiǎn)單地將一個(gè)回歸樹(shù)模型表示為:其中, 代表任意一組特征取值;整個(gè)數(shù)據(jù)空間被劃分成共 單元,每個(gè)單上都有一個(gè)固定的輸出值 。圖1:T回歸樹(shù)數(shù)據(jù)來(lái)源整理在此基礎(chǔ)上,給定特征取值,模型預(yù)測(cè)輸出值與真實(shí)值的總誤差為:為了最小化預(yù)測(cè)誤差,需要在每個(gè)單元上尋找合適的 ,易知當(dāng) 取對(duì)應(yīng)單元所有真實(shí)值的平均值時(shí),預(yù)測(cè)誤差最小,即為了構(gòu)造一棵完整的回歸樹(shù),我們還需要明白如何劃分?jǐn)?shù)據(jù)空間。我們?nèi)稳√卣髯鳛榍蟹肿兞?,特征的取值作為切分點(diǎn),由此我們將得到兩個(gè)區(qū)域:給定和,我們要尋找兩個(gè)區(qū)域的代表值 和 另各自區(qū)間上的平方差最?。何覀冎?, 取各自區(qū)間上真實(shí)值的平均值就可以最小化預(yù)測(cè)誤差,即那么實(shí)際上只要給定特征我們就可以遍歷特征所有的切分點(diǎn)計(jì)算每個(gè)切分點(diǎn)對(duì)應(yīng)的最小預(yù)測(cè)誤差從而找到最優(yōu)切分點(diǎn);在此基礎(chǔ)上,我們可以遍歷所有的特征,計(jì)算每個(gè)特征最優(yōu)切分點(diǎn)下的最小預(yù)測(cè)誤差從而找到最優(yōu)切分特征。這樣我們就可以得到最優(yōu)分特征與最優(yōu)切分點(diǎn)及其對(duì)應(yīng)的最優(yōu)切分。重復(fù)以上步驟直至節(jié)點(diǎn)中的樣本個(gè)數(shù)小于預(yù)定閾值,或樣本集平方誤差小于預(yù)定閾值或沒(méi)有更多特征可供分裂,我們就可以生成一棵完整的AT回歸樹(shù)。隨機(jī)森集成算法與其它機(jī)器學(xué)習(xí)模型一樣,決策樹(shù)也可能出現(xiàn)欠擬合或過(guò)擬合問(wèn)題。本文中我們將過(guò)隨機(jī)森林mFst)集成算法來(lái)規(guī)避這一問(wèn)題。隨機(jī)森林的核心邏輯是通過(guò)重置抽樣的方式隨機(jī)采樣隨機(jī)構(gòu)造多個(gè)樣本在每個(gè)樣本上生成決策樹(shù)最終將隨機(jī)森林中每顆決策樹(shù)的預(yù)測(cè)結(jié)果通過(guò)等權(quán)的方式合成形成最預(yù)測(cè)結(jié)論。圖2:隨機(jī)森林集成算法數(shù)據(jù)來(lái)源整理由于隨機(jī)采樣的過(guò)程保證了隨機(jī)性,隨機(jī)森林中既有預(yù)測(cè)能力極強(qiáng)的強(qiáng)樹(shù)(過(guò)擬合也有預(yù)測(cè)能力較弱的弱樹(shù)(欠擬合,當(dāng)隨機(jī)森林中的樹(shù)足夠多時(shí),過(guò)擬合與欠擬合的預(yù)結(jié)果相互抵消,從而保證了最終預(yù)測(cè)結(jié)果的穩(wěn)定。為了降低隨機(jī)樹(shù)之間的相關(guān)性提高模型的預(yù)測(cè)性能我們需要提高隨機(jī)樣本的隨機(jī)性因此在進(jìn)行重置抽樣時(shí)我們既要在樣本上隨(行采樣即我們從含有個(gè)原始樣本的樣本集中以重置抽樣的方式自助采樣出一個(gè)新的含有個(gè)樣本的樣本集;我們也要在特征上隨機(jī)(列采樣,即在全部的個(gè)特征中,每次自助采樣只隨機(jī)選擇其中的個(gè)特征。實(shí)證檢驗(yàn)樣本期為//31至2//,基金池為全部普通股票基金與偏股混合基金。考慮到實(shí)際交易因素,我們剔除了C類、B類、O類、H類、R類的基金;與此同時(shí),由于我們需要通過(guò)6個(gè)月滾動(dòng)窗口估計(jì)基金在FF5因子模型下的超額收益我們也剔除了運(yùn)作不滿6個(gè)月的權(quán)益基金。由于采用雙報(bào)季調(diào)倉(cāng)策略每年僅在中報(bào)與年報(bào)披露截止日期后進(jìn)行調(diào)倉(cāng)因此需要月頻數(shù)據(jù)做變頻處理其中標(biāo)簽使用基金雙報(bào)披露截止日期之間的累計(jì)收益;特征超額收α通過(guò)雙報(bào)披露截止日期之間的月度數(shù)據(jù)加總求和變頻;基金資金流入率lw與價(jià)值增量lueded通過(guò)雙報(bào)披露截止日期之間的月度數(shù)據(jù)求解平均值變頻;其它特征均使用雙報(bào)披露截止日期當(dāng)月月度數(shù)據(jù)進(jìn)行變頻。特征相性分析為考察特征與標(biāo)簽之間的線性相關(guān)性,我們計(jì)算了標(biāo)簽與特征間的相關(guān)系數(shù)矩陣如下從矩陣的左邊第一列可以得出,基于FF5模型計(jì)算的基金超額收益、基金凈資產(chǎn)、基金運(yùn)作時(shí)間、超額收益的t統(tǒng)計(jì)量跟基金未來(lái)收益的線性相關(guān)性較強(qiáng),而基金資金流入率、價(jià)值增量、資金流入波動(dòng)率、基金費(fèi)用率、在任基金經(jīng)理的平均任期、換手率以及FF5型中各因子收益率的t統(tǒng)計(jì)量與可決系數(shù)與基金未來(lái)一期的收益線性相關(guān)性較低。表2:相關(guān)系數(shù)矩陣標(biāo)簽與特征rαowaeaddedoaiiyofowAERageaagereeoeraioapasatKTsatWsatCAsatSBsatLsatr-α005-000005-e000054003-iyf001000077000-TNA008017003046002-000012010009000022-004004005002005024008-aaerteure001014003011003020010040-r001004003001006010026009006-alhat-tat006089005047000011011005013003-MTt-tat002017004013002005006005009004013-RWt-sat002018001011001008005003000002021006-CAt-tat001017003008001006004004002002017004035-SBt-sat000009002001000003004001004000010033023022-HL-stt001007001002000000001000004000008011013047054-000012005011002005004006009004008076004019012003萬(wàn)得整理回溯測(cè)試在訓(xùn)練模型前,對(duì)標(biāo)簽及全部特征在截面上進(jìn)行標(biāo)準(zhǔn)化處理,缺失值均以0填充。每期我們選用過(guò)去5年的歷史數(shù)據(jù),通過(guò)重置抽樣,每次從6個(gè)特征中隨機(jī)選擇9特征訓(xùn)練AT回歸樹(shù),構(gòu)造包含0棵隨機(jī)樹(shù)的隨機(jī)森林,最終根據(jù)當(dāng)期特征取值,預(yù)測(cè)基金未來(lái)一期的收益??紤]到需要通過(guò)6個(gè)月滾動(dòng)窗口估計(jì)FF5模型下基金的超額收益與因子收益率并且每期我們還需使用過(guò)去5年的歷史數(shù)據(jù)訓(xùn)練模型因此我們首次預(yù)測(cè)基金未來(lái)收益并以此基礎(chǔ)進(jìn)行調(diào)倉(cāng)的時(shí)刻為//。預(yù)測(cè)穩(wěn)定性在模型回測(cè)的過(guò)程中我們最關(guān)注的是模型的泛化能力即模型在訓(xùn)練樣本外的預(yù)測(cè)力,我們可以通過(guò)包外估計(jì)驗(yàn)證模型的泛化能力。對(duì)樣本數(shù)量為的數(shù)據(jù)集通過(guò)重置抽樣進(jìn)行自助采樣,如果采樣集的樣本數(shù)量也為那么沒(méi)有被選到的樣本約占 ,當(dāng)很大時(shí),有以下極限這意味著,每做一次自助采樣,初始訓(xùn)練集中約有.%的數(shù)據(jù)被選作訓(xùn)練數(shù)據(jù)剩余.%沒(méi)有被選入的數(shù)據(jù)就可以作為驗(yàn)證數(shù)據(jù)。根據(jù)驗(yàn)證數(shù)據(jù),我們就可以計(jì)算模型在樣本外的預(yù)測(cè)誤差,從而考察模型的泛化能力。為了考察模型預(yù)測(cè)的穩(wěn)定性我們繪制了隨機(jī)森林中隨機(jī)樹(shù)的數(shù)量同包外預(yù)測(cè)誤差之間的變化示意圖(以//322//31為例。如圖所示,伴隨著隨機(jī)樹(shù)數(shù)量的逐步增加,模型包外誤差逐步降低至收斂。這意味著,選用0棵隨機(jī)樹(shù)構(gòu)筑隨機(jī)森林足以保證模型預(yù)測(cè)的穩(wěn)定性。圖3:隨機(jī)樹(shù)數(shù)量與模型包外預(yù)測(cè)誤差變化示意圖050505050 0 0 0 0 0 0 0 0 0 包外預(yù)測(cè)誤差萬(wàn)得整理分組檢驗(yàn)選用過(guò)去五年歷史數(shù)據(jù)進(jìn)行滾動(dòng)預(yù)測(cè),可以逐期得到模型預(yù)測(cè)的基金收益率為了考察模型的選基性能,我們對(duì)模型預(yù)測(cè)的基金收益率進(jìn)行了分組檢驗(yàn),根據(jù)預(yù)測(cè)收益率的大小將基金平均分為5組,分別逐期計(jì)算組內(nèi)平均收益,樣本期內(nèi)各組累計(jì)凈值如下。圖4:分組檢驗(yàn)累計(jì)凈值0 0 0 0 0 0 0 0 0 0 01 2 組3 4 5數(shù)據(jù)來(lái)源萬(wàn)得整理如圖所示,組1到組,伴隨著模型預(yù)測(cè)收益率的逐步增大除組2與組3的累計(jì)凈值出現(xiàn)交錯(cuò)以外,各組累計(jì)凈值呈現(xiàn)出顯著的單調(diào)性,組1與組5多空收益顯著表明模型測(cè)收益對(duì)基金未來(lái)實(shí)際收益有較好的區(qū)分作用。信息系數(shù)分析為了進(jìn)一步考察模型預(yù)測(cè)收益的有效性我們對(duì)其進(jìn)行了信息系數(shù)分析。信息系數(shù)是指當(dāng)期收益預(yù)測(cè)值與下期基金實(shí)際收益之間的Sman相關(guān)系數(shù),C越大,模型對(duì)基金下期收益率的預(yù)測(cè)作用也就越強(qiáng)。信息系數(shù)分析的結(jié)果見(jiàn)下表。表3:信息系數(shù)分析結(jié)果C均值C標(biāo)準(zhǔn)差t統(tǒng)計(jì)量C與均值同向的比例預(yù)測(cè)基金收益*7%5數(shù)據(jù)來(lái)源萬(wàn)得整理在樣本期內(nèi)模型預(yù)測(cè)基金收益的kC均值為.在置信水平%上強(qiáng)烈拒絕C均值為0的原假設(shè),C與均值同向的比例高達(dá).4,IR比率(C均值除以標(biāo)準(zhǔn)差)為.根據(jù)信息系數(shù)分析的結(jié)果我們可以判斷模型對(duì)基金下期收益具備較強(qiáng)的預(yù)測(cè)作用。為了進(jìn)一步展示樣本期內(nèi)模型的預(yù)測(cè)表現(xiàn)我們繪制了模型預(yù)測(cè)基金收益的累計(jì)信息數(shù)變化示意圖。28642186420數(shù)據(jù)來(lái)源萬(wàn)得整理如圖所示在樣本期上除//31期累計(jì)信息系數(shù)出現(xiàn)回撤模型預(yù)測(cè)收益累計(jì)保持相對(duì)穩(wěn)定的速度持續(xù)增長(zhǎng),表明樣本期內(nèi)模型預(yù)測(cè)表現(xiàn)穩(wěn)定。324選基策略根據(jù)模型逐期的預(yù)測(cè)結(jié)果,每期選擇預(yù)測(cè)收益最高的0只基金構(gòu)建多頭組合,以等方式計(jì)算組合收益。由于基金池為普通股票型基金與偏股混合型基金,選擇普通股票基金指數(shù)偏股混合基金指數(shù)、滬深0指數(shù)作為比較基準(zhǔn)樣本期內(nèi)策略多頭組合同各比較基準(zhǔn)的收益表現(xiàn)如下表所示。表4:多頭組合收益表現(xiàn)收益評(píng)價(jià)指標(biāo)策略多頭普通股票型基金偏股混合型基金滬深平均月收益率%%%%年化收益率%%%%re比率5最大回撤率%%%%月勝率%%%%數(shù)據(jù)來(lái)源萬(wàn)得整理策略多頭組合年化收益率.9,最大回撤率.6,Shre比率.,月勝率.0各類收益評(píng)價(jià)指標(biāo)顯著優(yōu)于普通股票型基金指數(shù)偏股混合型基金指數(shù)滬深指數(shù)。同比普通股票型基金指數(shù),年化超額收益率為.。樣本期內(nèi)策略多頭相較于三大基準(zhǔn)指數(shù)凈值變化如下所示。圖6:策略多頭累計(jì)凈值8.57.56.55.54.53.52.51.50.5頭 型 型 300如圖所示,自//30至0//3,策略多頭實(shí)現(xiàn)凈值.,顯著優(yōu)于普通股票型基金指數(shù)(.、偏股混合型基金指數(shù)(.、滬深0指數(shù)(.特征重性分析線性模型可以通過(guò)相關(guān)系數(shù)的大小判斷特征的重要性而非線性模型判斷特征的重要相對(duì)困難隨機(jī)森林雖然是非線性模型但隨機(jī)森林的一大優(yōu)勢(shì)就是可以通過(guò)置換檢驗(yàn)判特征對(duì)預(yù)測(cè)的重要性。置換檢驗(yàn)的核心思想是:如果特征是重要特征,那么將特征替換為白噪聲后,模的預(yù)測(cè)誤差會(huì)上升,模型的性能會(huì)下降。前文提到每次通過(guò)重置抽樣自助取樣時(shí),約有/3的數(shù)據(jù)入選訓(xùn)練數(shù)據(jù)用來(lái)生成隨機(jī)樹(shù),仍有/3的包外B數(shù)據(jù)未被選入,我們既然可以通過(guò)B數(shù)據(jù)計(jì)算包外預(yù)測(cè)誤差來(lái)判斷模型的泛用性,那么我們也可以通過(guò)計(jì)算B數(shù)據(jù)置換前后隨機(jī)樹(shù)的預(yù)測(cè)誤差來(lái)評(píng)估特征的重要性。假設(shè)我們的隨機(jī)森林中共有棵隨機(jī)樹(shù),特征重要性的計(jì)算公式為其中,代表隨機(jī)樹(shù)的預(yù)測(cè)誤差,代表包外數(shù)據(jù),代表置換為白噪聲的外數(shù)據(jù)。如果將特征替換為白噪聲后,模型的預(yù)測(cè)誤差大幅增加,說(shuō)明特征對(duì)模型的測(cè)結(jié)果非常關(guān)鍵,那么特征就是一個(gè)重要特征。通過(guò)置換檢驗(yàn),我們逐期計(jì)算了6個(gè)特征對(duì)預(yù)測(cè)基金收益的重要性,將重要性逐期疊加作為整個(gè)樣本期的特征重要性。我們也計(jì)算了樣本期內(nèi)6個(gè)特征與基金下期收益的相關(guān)系數(shù)(絕對(duì)值)作為可比對(duì)象。圖7:隨機(jī)森林特征重要性 圖8:線性模型特征重要性500000500000..
Radomorest
.9 .8.7.6.5.4.3.2.1.0Correlaion(Abs)如圖所示盡管每期各個(gè)特征的重要性有所差別但從整個(gè)樣本期來(lái)看,在隨機(jī)森林型中,6個(gè)特征對(duì)模型的預(yù)測(cè)結(jié)果均有顯著影響,這意味著6個(gè)特征均與基金的未來(lái)收益息息相關(guān),使用隨機(jī)森林預(yù)測(cè)基金的未來(lái)收益將會(huì)充分利用6個(gè)特征中所蘊(yùn)含的信息;其中基金資金流入波動(dòng)率基金凈資產(chǎn)基金費(fèi)用率基金運(yùn)作時(shí)間在任基金經(jīng)理平均任期、換手率是對(duì)預(yù)測(cè)相對(duì)來(lái)講最重要的6個(gè)特征。相反,在線性模型中僅有基金超額收益基金凈資產(chǎn)基金運(yùn)作時(shí)間基金超額收益的t統(tǒng)計(jì)量與基金未來(lái)收益有明顯的相關(guān)關(guān)系,其它特征,例如價(jià)值增量、基金費(fèi)用率、換手率、FF5模型可決系數(shù)在線性模型中難以發(fā)揮預(yù)測(cè)作用。為了進(jìn)一步考察線性相關(guān)性較低的基金特征能否有效選基在模型中我們剔除了基金超額收益、基金凈資產(chǎn)、基金超額收益的t統(tǒng)計(jì)量,重新訓(xùn)練模型,預(yù)測(cè)基金的下期收益。我們對(duì)模型預(yù)測(cè)的基金收益再次進(jìn)行了信息系數(shù)分析以同樣的方式我們?cè)俅螛?gòu)建多頭策略信息系數(shù)分析的結(jié)果與樣本期內(nèi)策略多頭凈值變化情況如下所示。表5:剔除線性特征信息系數(shù)分析結(jié)果C均值C標(biāo)準(zhǔn)差t統(tǒng)計(jì)量C與均值同向的比例預(yù)測(cè)基金收益*0%3圖9:剔除線性變量策略多頭累計(jì)凈值 4.53.52.51.50.5策略多頭 普通股票型 偏股混合型 滬深剔除線性相關(guān)性較強(qiáng)的特征后,盡管模型的性能有所下降,但依舊擁有顯著的基金篩選能力因此我們可以得出結(jié)論線性相關(guān)性較低的基金特征與基金未來(lái)的收益依舊密切相關(guān)通過(guò)隨機(jī)森林模型,使用線性相關(guān)性較低的基金特征依舊可以有效選基。4模型完善前面我們已經(jīng)證明了通過(guò)非線性特征與決策樹(shù)隨機(jī)森林模型可以有效選基然而決策模型與隨機(jī)森林算法中既可以有線性特征也可以包含非線性特征在模型中引入與基金未來(lái)收益線性或非線性相關(guān)性更強(qiáng)的特征可以進(jìn)一步提升模型的選基性能。我們將部分常用于量化選基的線性特征引入模型并根據(jù)特征的重要性對(duì)部分非線性征進(jìn)行了調(diào)整,最終模型涵蓋的訓(xùn)練特征明細(xì)如下所示。表6:線性特征明細(xì)特征定義α通過(guò)公式()計(jì)算得到的基金超額收益A基金凈資產(chǎn)xp基金近6月最大漲幅xwn基金近1年最大回撤m基金過(guò)去1年收益動(dòng)量R基金近1年信息比率t基金份額萬(wàn)得整理表7:非線性特征明細(xì)特征定義fw通過(guò)公式()計(jì)算得到的基金資金流入率ved通過(guò)公式()計(jì)算得到的基金價(jià)值增量vyffwfw的標(biāo)準(zhǔn)差基金費(fèi)用率,基金總費(fèi)用除以基金凈資產(chǎn)基金運(yùn)作時(shí)間rvrro基金換手,賣股票收入買入股票總支出的較小值與基金凈資產(chǎn)之比T-starch5模型中,市場(chǎng)因子收益率的t統(tǒng)計(jì)量W-starch5模型中,盈利因子收益率的t統(tǒng)計(jì)量B-starch5模型中,規(guī)模因子收益率的t統(tǒng)計(jì)量L-starch5模型中,價(jià)值因子收益率的t統(tǒng)計(jì)量RN,整理類似的,每期我們選用過(guò)去5年的歷史數(shù)據(jù),通過(guò)重置抽樣,每次從特征中隨機(jī)選擇0個(gè)特征訓(xùn)練ART回歸樹(shù)構(gòu)造包含0棵隨機(jī)樹(shù)的隨機(jī)森林最終根據(jù)當(dāng)期特征取值,預(yù)測(cè)基金未來(lái)一期的收益。模型預(yù)測(cè)基金收益信息系數(shù)分析結(jié)果如下所示。表8:引入線性特征模型信息系數(shù)分析結(jié)果C均值C標(biāo)準(zhǔn)差t統(tǒng)計(jì)量C與均值同向的比例預(yù)測(cè)基金收益*5%1在樣本期內(nèi),模型預(yù)測(cè)基金收益的kC均值為.,在置信水平%上強(qiáng)烈拒絕C均值為0的原假設(shè),C與均值同向的比例高達(dá).%,R比率為.。根據(jù)預(yù)測(cè)基金收益,逐期選擇表現(xiàn)最好的5只基金構(gòu)建多頭組合,樣本期內(nèi)策略凈值表現(xiàn)如下。圖10:引入線性特征策略多頭累計(jì)凈值10.59.58.57.56.55.54.53.52.51.50.5策略多頭 普通股票型 偏股混合型 滬深表9:引入線性特征模型多頭組合收益表現(xiàn)收益評(píng)價(jià)指標(biāo)策略多頭普通股票型基金偏股混合型基金滬深平均月收益率%%%%年化收益率%%%%re比率1最大回撤率%%%%月勝率%%%%策略多頭組合年化收益率.7,最大回撤率.0,Shre比率.,月勝率.8。同比普通股票型基金指數(shù),年化超額收益率為.5。引入線性特征后,模型選基能力顯著提升??偨Y(jié)與展望本文立足于基金基本面,一共構(gòu)造了6個(gè)特征,通過(guò)決策樹(shù)模型與隨機(jī)森林算法,測(cè)基金下期收益。在樣本期(//12//,模型預(yù)測(cè)基金收益的C均值為.,在置信水平%上強(qiáng)烈拒絕C均值為0的原假設(shè),C與均值同向的比例高達(dá).4,R比率(C均值除以標(biāo)準(zhǔn)差)為.,模型預(yù)測(cè)基金收益具備顯著的選基能力。以此為基礎(chǔ)我們基于模型預(yù)測(cè)基金收益構(gòu)建了選基策略并對(duì)策略進(jìn)行了回測(cè)。在樣本期內(nèi),策略多頭組合年
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 消防安全生產(chǎn)合同責(zé)任狀
- 合同范本:?jiǎn)挝欢ㄆ诖鎲钨|(zhì)押貸款
- 度勞動(dòng)和社會(huì)保障合同代理協(xié)議
- 債權(quán)資產(chǎn)買賣合同
- 度標(biāo)準(zhǔn)工廠租賃合同
- 雇傭勞動(dòng)合同模板合同
- 股票基金權(quán)益分配合同范本
- 寵物收養(yǎng)家庭寵物養(yǎng)護(hù)與寵物友好公共設(shè)施考核試卷
- 地震勘探儀器在復(fù)雜地質(zhì)條件下的應(yīng)用考核試卷
- 鉛筆筆芯安全課件下載
- 2025年全國(guó)高考體育單招政治時(shí)事填空練習(xí)50題(含答案)
- 2025教科版一年級(jí)科學(xué)下冊(cè)教學(xué)計(jì)劃
- 中華人民共和國(guó)學(xué)前教育法-知識(shí)培訓(xùn)
- 2023年新高考(新課標(biāo))全國(guó)2卷數(shù)學(xué)試題真題(含答案解析)
- 事業(yè)單位工作人員獎(jiǎng)勵(lì)審批表
- 山東省技能大賽青島選拔賽-世賽選拔項(xiàng)目52樣題(平面設(shè)計(jì)技術(shù))
- 城市社會(huì)學(xué)課件
- 人教版六年級(jí)美術(shù)下冊(cè)全冊(cè)課件【完整版】
- GB/T 9788-1988熱軋不等邊角鋼尺寸、外形、重量及允許偏差
- 教科版三年級(jí)下冊(cè)科學(xué)全冊(cè)完整課件
- 護(hù)理工作質(zhì)量標(biāo)準(zhǔn)及考核細(xì)則
評(píng)論
0/150
提交評(píng)論