




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
目錄一、言 1二、金向似性 2金向似圖義 2在金向似系個(gè)的益相性析 3三、金向似在型訓(xùn)中應(yīng)用 6于金向似的衍因構(gòu)建 6生子合練 6型練驗(yàn)置結(jié)果析 7四、金向似圖在圖經(jīng)絡(luò)的用 13型紹 13型構(gòu)實(shí)設(shè)計(jì) 14型果估 15組試 17型關(guān)分及次集成 20五、合化指增強(qiáng) 23六、結(jié)展望 25七、險(xiǎn)示 25圖表目錄圖表1:關(guān)型據(jù)用框架 1圖表2:關(guān)型據(jù)例 2圖表3:資流圖似性義 2圖表4:全本資向相性系譜有聯(lián)的股收率關(guān)數(shù)統(tǒng)計(jì) 3圖表5:個(gè)在樣資金同出本的益率關(guān)數(shù)布 4圖表6:個(gè)在樣大單金同出本的收率關(guān)數(shù)布 4圖表7:個(gè)在樣中小資共流樣下的益相系分布 5圖表8:多譜練案 7圖表9:滾模訓(xùn)意圖 7圖表10:疊各圖聯(lián)合練案市型IC、rankIC 8圖表個(gè)譜方案IC量計(jì) 9圖表12:疊圖訓(xùn)方案型IC(各數(shù)分) 9圖表13:疊圖訓(xùn)方案層試果(市場) 10圖表14:疊圖訓(xùn)方案層試果(指成分股) 圖表15:疊圖數(shù)方案組益對(duì)模型量計(jì) 圖表16:基資流關(guān)系圖經(jīng)絡(luò)型構(gòu)及數(shù)明 14圖表17:各圖聯(lián)訓(xùn)練案市型IC、rankIC 15圖表18:各圖訓(xùn)方案IC量計(jì) 15圖表19:各譜練案型IC、rankIC(各成分股) 16圖表20:譜練案層測結(jié)果全場) 17圖表21:各譜練案的額益計(jì)量全市場) 17圖表22:各譜練案方的層試果(指數(shù)分股) 18圖表23:各圖訓(xùn)方案額益計(jì)量 19圖表24:各模集方案組試果 20圖表25:疊各單譜的XGBOOST型系數(shù) 21圖表26:單譜間的關(guān)性 22圖表27:疊各單譜的XGBOOST型圖譜的關(guān)性 22圖表28:各集方之間相性 22圖表29:指增回結(jié)果 23圖表30:疊圖數(shù)方案額益量計(jì) 24一、引言隨著存儲(chǔ)、算力、模型方法的迭代更新為量化投資研究大規(guī)模積累有效因子提供了基礎(chǔ),投研中所涉及的存量因子從幾百到幾千不等,資產(chǎn)定價(jià)、因子選股步入高緯度時(shí)代。在多因子量化選股場景中,因子的角色逐步從信號(hào)轉(zhuǎn)變?yōu)楸姸嗟奶卣?,?duì)因子的評(píng)估逐步從單因子有效性轉(zhuǎn)變?yōu)橄鄬?duì)于存量因子的邊際增量。尤其在機(jī)器學(xué)習(xí)、人工智能這類非線性模型廣泛應(yīng)用于因子合成環(huán)節(jié)之后,即便單因子與存量因子在線性維度上能保證低相關(guān)性、克服多重共線性,但是在非線性建模場景下能帶來的邊際貢獻(xiàn)也未必可觀。新數(shù)據(jù)、新因子、新信量顯得更加重要。關(guān)系型圖譜數(shù)據(jù)在因子挖掘場景的應(yīng)用的研究逐漸受到關(guān)注,已有學(xué)術(shù)文獻(xiàn)論證了供應(yīng)鏈、分析師共同覆-圖表1:關(guān)系型數(shù)據(jù)的應(yīng)用框架資料來源:在早期報(bào)告中,本系列先后探究了供應(yīng)鏈關(guān)系、分析師共同覆蓋、新聞共同報(bào)道在因子建模場景的應(yīng)用,通過構(gòu)建形成表征公司間相關(guān)關(guān)聯(lián)特征的關(guān)系矩陣,以此對(duì)原因子庫進(jìn)行特征工程衍生,在模型訓(xùn)練和分組測試上,加入各類關(guān)系圖譜衍生因子后帶來模型輸出的IC值和組合構(gòu)建上的增量。6種表征股票之間的資金流向相似性的矩陣,在存量因子庫的基礎(chǔ)上,通過批量衍生訓(xùn)練傳向相似性對(duì)收益預(yù)測帶來增強(qiáng)效果。二、資金流向相似性圖表2:關(guān)系型數(shù)據(jù)示例資料來源:資金流向相似性圖譜定義股票和股票之間的資金流向相似性刻畫了資金層面推動(dòng)股價(jià)走勢的交易行為的相似性,也反應(yīng)的交易行為背后資金方對(duì)股票價(jià)格的預(yù)期的共性。資金流入、流出的一致性更強(qiáng)的兩個(gè)股票潛在具有更強(qiáng)的關(guān)聯(lián)性。與早期報(bào)告中對(duì)供應(yīng)鏈、分析師共同覆蓋、新聞共同報(bào)道關(guān)系的建模方式類似,本報(bào)告通過鄰接矩陣來描述股票兩兩之間基于資金共同流向的關(guān)聯(lián)關(guān)系,進(jìn)而構(gòu)建六種資金流向相似性圖譜。資金流向數(shù)據(jù)基于level2高頻行情數(shù)據(jù)進(jìn)行衍生,根據(jù)委托、成交的資金量、成交類型等信息區(qū)分資金類型、成交類型和資金流向。圖表3為構(gòu)建資金流向相似性圖譜的具體細(xì)節(jié)圖表3:資金流向圖譜相似性定義數(shù)據(jù)來源:,資金類型:根據(jù)訂單成交金額大小,分為小單(散戶,<4萬元)、中單(中戶,4萬-20萬)、大單(大戶,20-100萬)、特大單(機(jī)構(gòu),>100萬)成交類型:根據(jù)成交訂單對(duì)應(yīng)買賣雙方的委托時(shí)間先后,將先來的委托訂作為被動(dòng)方、后來的為多訂單作為主動(dòng)方,從而將成交價(jià)>=賣價(jià)的成交稱為主動(dòng)買入、成交價(jià)<=買入訂單價(jià)格的成交稱為主動(dòng)賣出。當(dāng)日的資金凈流入=當(dāng)日主動(dòng)買入成交額-當(dāng)日主動(dòng)賣出成交額。凈流入大于0為資金凈流入,反之為資金凈流出。根據(jù)某天資金凈流入、流出的情況,可以計(jì)算股票兩兩之間資金聯(lián)動(dòng)的一致性情況。以資金共同流入圖譜為例,具體構(gòu)建步驟細(xì)節(jié)為:22個(gè)交易日內(nèi),兩個(gè)股票共同出現(xiàn)資金凈流入的交易日數(shù)量接矩陣中兩兩股票的對(duì)應(yīng)位置里填入資金共同凈流入的交易日數(shù)量對(duì)所有股票重復(fù)上述步驟,最終的鄰接矩陣的數(shù)值表示兩只股票共同出現(xiàn)資金凈流入的交易日數(shù)量1的股票作為圖譜上的鄰居基于資金流向相似性圖譜,最終可以構(gòu)建新的關(guān)系矩陣????,用以表征股票之間的資金共同流向關(guān)聯(lián),即? ????=[????21 ? ??????1
? ? ?????2??? ?????????其中,????????表示第??個(gè)股票與第??個(gè)股票的資金共同流向關(guān)聯(lián)度,即兩個(gè)股票原始資金共同流向交易日天數(shù)類似地,根據(jù)不同資金類型、流入流出情況依次構(gòu)建6種圖譜及其對(duì)應(yīng)鄰接矩陣矩陣。存在資金流向相似關(guān)系個(gè)股的收益率相關(guān)性分析2018年-2021年,以每半年的A645、6。圖表4:全樣本與資金流向相似性關(guān)系圖譜上有關(guān)聯(lián)的個(gè)股的收益率相關(guān)系數(shù)統(tǒng)計(jì)數(shù)據(jù)來源:,注:數(shù)據(jù)截至2021/12/31報(bào)告類型六個(gè)關(guān)系圖中,資金共同流出、大單資金共同流出、中小單資金共同流出三種流出類圖譜上存在的關(guān)聯(lián)個(gè)股之間的相關(guān)系數(shù)分布相比于全市場有明顯的增量。三種資金流出類樣本的收益率相關(guān)系數(shù)的均值和各個(gè)分位1%-5%上相對(duì)于全市場有不同程度的右移動(dòng)。圖表5:個(gè)股在全樣本與資金共同流出樣本下的收益率相關(guān)系數(shù)分布數(shù)據(jù)來源:,注:數(shù)據(jù)截至2021/12/31圖表6:個(gè)股在全樣本與大單資金共同流出樣本下的收益率相關(guān)系數(shù)分布數(shù)據(jù)來源:,注:數(shù)據(jù)截至2022/06/30圖表7:個(gè)股在全樣本與中小單資金共同流出樣本下的收益率相關(guān)系數(shù)分布數(shù)據(jù)來源:,注:數(shù)據(jù)截至2022/06/30三、資金流向相似性在模型訓(xùn)練中的應(yīng)用基于資金流向相似性的衍生因子構(gòu)建本報(bào)告進(jìn)一步對(duì)利用前文所述的資金流向相似性關(guān)系矩陣Mc,對(duì)因子進(jìn)行處理,首先對(duì)各個(gè)元素除以其所在行之和,得到權(quán)重矩陣Mw。特定因子F為各個(gè)股票對(duì)應(yīng)的特定因子值,是一個(gè)n×1的向量(下稱原有因子),即1F1F1F=[?]Fn其中,F(xiàn)i表示第i個(gè)股票的因子值。對(duì)于上述因子向量F進(jìn)行如下運(yùn)算,可以得到對(duì)應(yīng)的衍生因子Fc:Fc=Mw?F其中,F(xiàn)c為集成了資金流向相關(guān)股票的衍生因子值,也是一個(gè)n×1的向量(下稱衍生因子)。對(duì)于某只特定股票i,其原有因子值為Fi,則衍生因子值為Fci=∑nMwijFi。衍生因子的因子值代表了對(duì)于每個(gè)股票而言,其在資金流向相似性關(guān)系網(wǎng)上有關(guān)系的個(gè)股的因子值根據(jù)他們之間的關(guān)聯(lián)度進(jìn)行加權(quán)求和的結(jié)果。衍生因子聯(lián)合訓(xùn)練在模型訓(xùn)練中,在模型訓(xùn)練環(huán)節(jié),對(duì)于給定的原始樣本特征X=[FT,FT,...,FT],根據(jù)因子圖譜衍生方法得1 2 M到衍生特征維度Xw=Mw?X=[Mw?FT,Mw?FT,...,Mw?FT]。然而進(jìn)一步將原始樣本特征和衍生的特征維1 2 M度拼接后作為新的樣本特征???=X,w]=FT,FT,...,FT,Mw?FT,Mw?FT,...,Mw?FT]1 2 M 1 2 M對(duì)于某個(gè)交易日上股票,其對(duì)應(yīng)的樣本Xi代表了該股票自身信息在樣本空間的特征,???代表了在資金流[XXc]作為樣本特征進(jìn)行模型訓(xùn)練和預(yù)測,意味著利用股票自身信息以及與其有資金流向相似性關(guān)聯(lián)的個(gè)股的信息來聯(lián)合i的收益率。在模型訓(xùn)練中,圖譜集成方案分為單圖譜方案和多圖譜方案:單圖譜將利用原始特征X訓(xùn)練得到的模型y=g(X)作為基準(zhǔn),考察聯(lián)合訓(xùn)練模型與原始模型的集成y()+(????)的增量。8。圖表8:多圖譜訓(xùn)練方案資料來源:模型訓(xùn)練實(shí)驗(yàn)設(shè)置及結(jié)果分析本小節(jié)基于給定存量因子庫的因子,平行對(duì)比存量因子庫的單獨(dú)應(yīng)用、疊加資金流向相似性圖譜聯(lián)合訓(xùn)練的多種方案,評(píng)估資金流向相似性圖譜的衍生因子在傳統(tǒng)機(jī)器學(xué)習(xí)建模過程種為存量因子帶來的增量。模型訓(xùn)練實(shí)驗(yàn)設(shè)置XGBOOST10個(gè)交易日訓(xùn)練一次模型,用于1022個(gè)交易日計(jì)算得到的資金流向相似性圖譜進(jìn)行因子衍生9:圖表9:滾動(dòng)模型訓(xùn)練示意圖模型類型XGBOOSTbooster:gbtreecolsample_bytree:0.7learning_rate:0.1超參數(shù)
max_depth:7min_child_weight:10n_estimators:100 subsample:0.6 標(biāo)簽 收益率 因子:截面winsorize左右5%縮尾、標(biāo)準(zhǔn)化預(yù)處理標(biāo)簽:取rank分位數(shù)資料來源:
樣本集:剔除缺失值比例大于20%的樣本每10個(gè)交易日重新訓(xùn)練一次模型訓(xùn)練設(shè)置每次使用300個(gè)交易日的樣本作為訓(xùn)練集每次使用最近22個(gè)交易日計(jì)算得到的資金流向相似性圖譜進(jìn) 造 為了評(píng)估資金流向相似性關(guān)系信息對(duì)因子庫、模型和策略帶來的增量,本文采取以下平行對(duì)照實(shí)驗(yàn):RawModel:每次訓(xùn)練將根據(jù)上述流程使用原始因子作為個(gè)股的樣本特征。疊加圖譜信息進(jìn)行訓(xùn)練:每次訓(xùn)練在原始因子基礎(chǔ)上,逐一利用每種資金流向相似性關(guān)系提取的矩陣進(jìn)行+2用于個(gè)股的收益率預(yù)測。疊加衍生因子模型輸出的有效性分析圖表10展示了各個(gè)圖譜的訓(xùn)練方案在中證全指成分股上與未來10日收益率的IC、rankIC情況:IC9.38%~9.52%,相對(duì)原始因子模0.1~0.2%IC,rankIC均有不同程度的增量IC9.60%~9.68%,相對(duì)原始因子模型輸出提升0.3%左右。圖表11展示了各個(gè)方案相對(duì)原始模型的IC增量累計(jì)曲線:單圖譜方案在2020年前有較為穩(wěn)定的IC2020年后IC累計(jì)增量出現(xiàn)集體失效且不同方案出現(xiàn)分化。資金共同流出、大單資金共同流出圖譜的增強(qiáng)效果在整個(gè)測試周期內(nèi)較為穩(wěn)健。大單資金共同流入圖譜在2022年7月之前累計(jì)增強(qiáng)效果最強(qiáng),但之后其增量出現(xiàn)失效,在周期內(nèi)增強(qiáng)效果不穩(wěn)定。LRITRUIC圖表10:疊加各個(gè)圖譜聯(lián)合訓(xùn)練方案全市場模型IC、rankIC數(shù)據(jù)來源:,注:數(shù)據(jù)截至2022/12/30圖表11:各個(gè)圖譜訓(xùn)練方案IC增量累計(jì)數(shù)據(jù)來源:,注:數(shù)據(jù)截至2023/05/30疊加圖譜模型輸出對(duì)各成分股的有效性分析IC、rankIC提升,IC、rankIC300IC8005001000增量漸弱。不同類型的圖譜在各個(gè)指數(shù)成分股上增強(qiáng)效果的相對(duì)強(qiáng)弱的差異可能來源于:市值較大的股票的資金共同流向來源于確定性的驅(qū)動(dòng)因素,因此股價(jià)走勢的聯(lián)動(dòng)性和資金流向相似性的關(guān)系更緊密。市值較小的股票的資金共同流向有更多的隨機(jī)性。圖表12:疊加圖譜訓(xùn)練方案模型IC(各指數(shù)成分股)數(shù)據(jù)來源:,注:數(shù)據(jù)截至2023/05/30模型輸出分組測試10(剔ST和停牌的股票),2017/06/01-2023/05/3010組、市值加權(quán)、100.15%10T+0日-T+910個(gè)子組合的收益求平均后作為最終該分組的收益。分層測試結(jié)果見錯(cuò)誤!未找到引用源。圖表13:疊加圖譜訓(xùn)練方案分層測試結(jié)果(全市場)數(shù)據(jù)來源:,注:數(shù)據(jù)截至2023/05/30原始因子分別疊加三個(gè)資金共同流入圖譜的關(guān)系后,頭部組合在年化超額收益、夏普比率均有不同程度改善。三個(gè)資金共同流入圖譜在TOP組年化超額、超額夏普上均有提升,資金共同流入圖譜為模型訓(xùn)練帶來2.26%的超額提升、夏普增量0.1。原始因子分別疊加三個(gè)資金共同流入圖譜的關(guān)系后,多空組合在年化收益、夏普比率等指標(biāo)均有不同程度5.31%的年化收益增量。三個(gè)資金共同流出圖譜在全市場范圍選股的多空組年化收益、夏普幾乎沒有增量。2.74%、2.9%3.12%,TRUTOP30050080010003種多圖譜模型輸出的效果,結(jié)果14、15:圖表14:疊加圖譜訓(xùn)練方案分層測試結(jié)果(各指數(shù)成分股)數(shù)據(jù)來源:,注:數(shù)據(jù)截至2023/05/30圖表15:疊加圖譜數(shù)據(jù)方案TOP組收益相對(duì)原始模型增量累計(jì)10001000300500中證800成分股累計(jì)收益增量數(shù)據(jù)來源:,注:數(shù)據(jù)截至2023/05/30800TOP組超額提升幅度TRI3.5%3003%500、中證10002%左右。2)多空收益上中證1000800成分股增量5%-6%500上增量2300上增量4.56.5%。rankICICTOP1000TOP20179月后一直呈現(xiàn)穩(wěn)定持續(xù)的增量;滬深300TOP2019月之前幾乎沒有增量,11500TOP2020920217月之間出現(xiàn)失效,20217800TOP201920211月-7月出現(xiàn)不同程度的分化。四、資金流向相似性圖譜在圖神經(jīng)網(wǎng)絡(luò)上的應(yīng)用模型介紹(一)基于注意力機(jī)制的圖神經(jīng)網(wǎng)絡(luò)是圖中所有節(jié)點(diǎn)的集合,在本研究中表示企業(yè),EGraphAttentionNetwork模型來學(xué)習(xí)圖結(jié)構(gòu),使得節(jié)點(diǎn)可以在聚合過程中考慮到不同關(guān)聯(lián)企業(yè)的重要性差異。GraphAttention1 2 N 1∈1 2 N 2、注意力α計(jì)算:通過計(jì)算節(jié)點(diǎn)對(duì)之間的注意力權(quán)重,確定節(jié)點(diǎn)對(duì)當(dāng)前節(jié)點(diǎn)的重要性。ijijα=softmax(eij)=ij
exp(LeakyRelu(?aT[W??i||W??j]))i∑k∈Nexp(LeakyReluTi||k]))i其中,eijijsoftmax∈R2F′和共享權(quán)重矩陣W∈RF′×F進(jìn)行參數(shù)化。Niii的鄰接節(jié)點(diǎn)計(jì)算注意力系數(shù)。3、特征聚合:使用注意力權(quán)重對(duì)相鄰節(jié)點(diǎn)的特征進(jìn)行加權(quán)聚合,得到當(dāng)前節(jié)點(diǎn)的表示。′i=σ(∑αijj)j∈Ni其中,′i即為輸出的高階特征,維度為’。4、輸出預(yù)測:通過進(jìn)一步的層級(jí)結(jié)構(gòu)和激活函數(shù),對(duì)聚合后的節(jié)點(diǎn)表示進(jìn)行預(yù)測或分類。(二)隱式圖學(xué)習(xí)已有學(xué)術(shù)文獻(xiàn)論證了供應(yīng)鏈、分析師共同覆蓋、行業(yè)等企業(yè)間關(guān)系型數(shù)據(jù)在股票市場中的有效性,但是實(shí)際場景中,企業(yè)間關(guān)系類型并非單一,根據(jù)先驗(yàn)知識(shí),將預(yù)定義好的關(guān)系圖數(shù)據(jù)作為模型的輸入很難捕獲所有BarraCNE5風(fēng)格因子+LeakyRelu。ti與企業(yè)j之間的潛在關(guān)系表示為:Rt=LeakyReLU(sTW[vt||vt])i,j r ri j其中,vt和vt分別是企業(yè)i和企業(yè)j的因子特征,維度為D,將兩者連接起來,使用一個(gè)維度為(D’,2D)i j的矩陣WrD’D’維的向量srWr和向量sr進(jìn)行參數(shù)化,由此,可以得到隱式圖的鄰接矩陣,即為一個(gè)元素為Ri,jN×N矩陣。模型結(jié)構(gòu)及實(shí)驗(yàn)設(shè)計(jì)MLP如下圖所示,輸入分別為因子數(shù)據(jù)和資金流向相似性圖譜鄰接矩陣。圖表16:基于資金流向關(guān)系的圖神經(jīng)網(wǎng)絡(luò)模型架構(gòu)及參數(shù)說明資料來源:為了評(píng)估關(guān)系圖譜對(duì)因子庫、模型和策略帶來的增量,本文采取以下平行對(duì)照實(shí)驗(yàn):MLP12864,輸出維度1。MLP1MLP11)MLP結(jié)報(bào)告類型構(gòu)完全相同。Ens_GAT:CashOut、MedSmallCoInAct、ExNLargeCoInAct三個(gè)圖譜訓(xùn)練結(jié)果進(jìn)行集成。模型結(jié)果評(píng)估為了衡量經(jīng)過資金流向相關(guān)性矩陣相對(duì)于基準(zhǔn)模型的提升,研究評(píng)估了引入圖神經(jīng)網(wǎng)絡(luò)所訓(xùn)練模型在測試(MP10日收益率的IC和raI。ICMLP模型輸出提升0.16~1.18%IC8.01%MLP1.24%ICRankIC均有不同程度的增量。20182022ICIC圖表17:各個(gè)圖譜聯(lián)合訓(xùn)練方案全市場模型IC、rankIC數(shù)據(jù)來源:, 注:數(shù)據(jù)截至2023/5/30圖表18:各個(gè)圖譜訓(xùn)練方案IC增量累計(jì)數(shù)據(jù)來源:,注:數(shù)據(jù)截至2023/05/30引入資金流向相似性圖譜所訓(xùn)練模型,在各指數(shù)成分股內(nèi)均能帶來不同程度的IC、rankIC提升,并且IC、rankIC波動(dòng)性降低:300IC0.76~2.09%,和疊加資金流向相似性的衍生因1000MLP模型輸出IC0.98%~1.36%5000.39%~1.61%8000.51%~1.79%從單個(gè)圖譜來看,在不同指數(shù)成份股中,資金共同流出和大單共同流入關(guān)系圖的提升效果最優(yōu);多圖譜集成方案(Ens_GAT)對(duì)在此基礎(chǔ)上能有進(jìn)一步增量圖表19:各圖譜訓(xùn)練方案模型IC、rankIC(各指數(shù)成分股)數(shù)據(jù)來源:,注:數(shù)據(jù)截至2022/12/30分組測試全市場除了中小單資金共同流出(MedSmallCoOutAct)模型相MLP3.79%0.177。4.39%2.19%。TOPMLP的累計(jì)增量整體呈現(xiàn)穩(wěn)定增長的趨勢,2023年達(dá)到頂峰后出現(xiàn)一定程度分化。圖表20:譜訓(xùn)練方案分層測試結(jié)果(全市場)數(shù)據(jù)來源:, 注:數(shù)據(jù)截至2023/05/30圖表21:各圖譜訓(xùn)練方案的超額收益累計(jì)增量(全市場)數(shù)據(jù)來源:, 注:數(shù)據(jù)截至2023/05/30除了資金共同流入和中小單資金共同流出關(guān)系圖,引入資金共同流出、中小單共同流入、大單共同流入和流出圖譜關(guān)系后,多空組合在年化收益、夏普比率等指標(biāo)均有不同程度改善。特別是中小單共同流入關(guān)系圖為模型帶來了6.57%的年化收益增量。I、rankIC的增量沒有體現(xiàn)在頭部、尾部組合的區(qū)分度上。相較于單圖,多圖譜集成的方案對(duì)于多空組年化收益和夏普比率的提升更大,分別為8.35%和0.313。各指數(shù)成分股MLP組中,10004.36%800300,提升最大的800MLP3.91%,3004.21%。圖表22:各圖譜訓(xùn)練方案方案的分層測試結(jié)果(各指數(shù)成分股)數(shù)據(jù)來源:,注:數(shù)據(jù)截至2023/05/30100010.08%800300,提升最大的是大單共同流入關(guān)系圖,提升幅度分別為5.26%和4.84%。圖表23:各個(gè)圖譜訓(xùn)練方案超額收益累計(jì)增量數(shù)據(jù)來源:, 注:數(shù)據(jù)截至2023/05/30模型相關(guān)性分析及二次集成XGBOOST圖表24:各個(gè)模型集成方案分組測試結(jié)果數(shù)據(jù)來源:,注:數(shù)據(jù)截至2023/05/30XGBOOSTIC、rankIC相比于XGBOOSTXGBOOST0.2%~0.3%,ICrankIC300rankIC0.78%800rankIC0.5%500rankIC0.6%1000rankIC0.5%~0.6%300增量較小,其他指數(shù)成分股頭部超額相比于XGBOOST集成方案增量均在1%以上,相比于原始XGBOOST模型增量最高5.84%(中證全指),超額夏普增量0.26多空收益方面,LRI_Ens_GAT60.82%3.407,相比于原始XGBOOST16%0.32XGBOOST多圖譜集成(LRI)0.2300IC、rankIC均有增量,但是在頭部超額上增量甚微,多空收益上沒有提升分別考察各個(gè)單圖譜訓(xùn)練、多圖譜模型集成方案的相關(guān)性,得到以下結(jié)論:XGBOOST90%將圖譜數(shù)據(jù)應(yīng)用到模型訓(xùn)練過程中,各圖譜訓(xùn)練的模型之間75%-85%之間XGBOOST65%以下,從而為兩類模型集成帶來增量空間各個(gè)集成方案之間相關(guān)性普遍較高圖表25:疊加各個(gè)單圖譜的XGBOOST模型相關(guān)系數(shù)數(shù)據(jù)來源:,注:數(shù)據(jù)截至2023/05/30圖表26:單圖譜GAT之間的相關(guān)性數(shù)據(jù)來源:,注:數(shù)據(jù)截至2023/05/30圖
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 通信工程衛(wèi)星導(dǎo)航技術(shù)考試題集
- 制定語文教學(xué)工作計(jì)劃(30篇)
- 食品科學(xué)與工程基礎(chǔ)知識(shí)測試題
- 北京燃?xì)夤P試題庫及答案
- 軟件測試工程師職業(yè)規(guī)劃建議試題及答案
- 計(jì)算機(jī)三級(jí)數(shù)據(jù)庫能力提升試題及答案
- 機(jī)修外包合同協(xié)議書
- 計(jì)算機(jī)四級(jí)考試改革的影響與反思試題及答案
- 自動(dòng)化測試與手動(dòng)測試的比較試題及答案
- 基于需求的嵌入式設(shè)計(jì)試題及答案
- 2025年電氣試驗(yàn)高級(jí)工考試題庫
- 組織執(zhí)法類面試題及答案
- 人教部編版道德與法治八年級(jí)下冊(cè):2.2 《加強(qiáng)憲法監(jiān)督 》聽課評(píng)課記錄
- 煤礦主通風(fēng)機(jī)電控系統(tǒng)變頻改造裝置安裝方案
- 持續(xù)葡萄糖監(jiān)測臨床應(yīng)用專家共識(shí)2024解讀
- 《人工智能發(fā)展史》課件
- T-CMES 04001-2020 機(jī)床裝備制造成熟度評(píng)價(jià)規(guī)范
- 電力工程委托維護(hù)合同樣本
- 合成生物學(xué)行業(yè)未來三年發(fā)展洞察及預(yù)測分析報(bào)告
- JJF 2168-2024 鹽霧試驗(yàn)箱校準(zhǔn)規(guī)范
- 新概念英語第二冊(cè)-lesson-77-A-Successful-Operation
評(píng)論
0/150
提交評(píng)論