因子選股系列之一:DFQ-FactorVAE-pro:加入特征選擇與環(huán)境變量模塊的FactorVAE模型_第1頁
因子選股系列之一:DFQ-FactorVAE-pro:加入特征選擇與環(huán)境變量模塊的FactorVAE模型_第2頁
因子選股系列之一:DFQ-FactorVAE-pro:加入特征選擇與環(huán)境變量模塊的FactorVAE模型_第3頁
因子選股系列之一:DFQ-FactorVAE-pro:加入特征選擇與環(huán)境變量模塊的FactorVAE模型_第4頁
因子選股系列之一:DFQ-FactorVAE-pro:加入特征選擇與環(huán)境變量模塊的FactorVAE模型_第5頁
已閱讀5頁,還剩87頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

DFQ-FactorVAE模型回顧l在前期報告中,我們給出了DFQ-FactorVAE模型。模型在傳統(tǒng)的端到端礎(chǔ)上,融合了變分自編碼器與概率動態(tài)因子模型的思想,創(chuàng)新性地提出了“先驗-后驗”學(xué)習(xí)方法,建立股票收益率預(yù)測模型,學(xué)習(xí)輸入特征和標簽之間的關(guān)系。lFactorVAE模型架構(gòu)拓展?jié)摿^大,模型所得選股因子的中的多頭表現(xiàn)十分突出。本次我們對原模型進行了多方面的升級l金融數(shù)據(jù)中普遍存在較高的噪聲和冗余,因此,特征選擇在模型開發(fā)中至關(guān)重要。特征選擇的目的是減少無關(guān)或冗余的特征,提升模型的訓(xùn)練效率和預(yù)測準確性,同時避免過擬合。因此我們在FactorVAE模型中添加特征選擇模塊,引入特征選征重構(gòu)器,由網(wǎng)絡(luò)實現(xiàn)自動特征選擇,同時保證篩選后特征信息的完整l端到端神經(jīng)網(wǎng)絡(luò)模型的輸入一般是股票特征,通常忽略了市場整體信息的作用,但實際股票收益也會受到當(dāng)時所處的市場環(huán)境的影響。因此我們重構(gòu)了FactorVAE模型,在訓(xùn)練階段加入日期環(huán)境變量特征來協(xié)同對股票收益定價,而在預(yù)測時摒棄環(huán)境變量的部分,以此提升模型的收益預(yù)測泛化能力。lDFQ-FactorVAE-pro模型,以DFQ-FactorVAE模型為基礎(chǔ),添加加日期環(huán)境變量,使用協(xié)同訓(xùn)練方式進行訓(xùn)練。并在特征提取器處理、樣本外預(yù)測方式、輸入標簽數(shù)據(jù)處理方式上進行了多方面的改進。l在中證全指股票池中,因子多頭表現(xiàn)優(yōu)異,多頭超額收益夏普和最大回撤均為各模型中最優(yōu),分組單調(diào)性較好。測試集上IC達到12.09%,RANKIC達到15.08%,l因子進行了行業(yè)和市值中性化后表現(xiàn)依然優(yōu)異,模型受行業(yè)市值風(fēng)格影響較小。原始神經(jīng)網(wǎng)絡(luò)模型相比,在市值上的負暴露更小,在beta風(fēng)格上基本無暴露,在低估值上的正暴露更大,在非線性市值上的負暴露更小。指數(shù)增強組合表現(xiàn)lDFQ-FactorVAE-pro模型所得到的合成因子在大盤指增組合中表現(xiàn)十分突出。l中證A500指增:2020年以來信息比1.98,年化對沖收益12.97%,跟蹤誤差6.28%,2024年超額收益為4.31%。楊怡玲yangyiling@執(zhí)業(yè)證書編號:S08605230400ABCM:基于神經(jīng)網(wǎng)絡(luò)的alpha因子和beta因子協(xié)同挖掘模型:——因子選股系列之一一〇相對定價類基本面因子挖掘:——因子選股系列之一〇九KD-Ensemble:基于知識蒸餾的alpha因子挖掘模型:——因子選股系列之一〇八DFQ-XGB:基于樹模型的alpha預(yù)測方案:——因子選股系列之一〇七基于風(fēng)險注意力的因子挖掘模型:——因子選股系列之一〇六非線性市值風(fēng)控全攻略:——因子選股系列之一〇五融合基本面信息的ASTGNN因子挖掘模型:——因子選股系列之一〇四DFQ-FactorVAE:融合變分自編碼器和概率動態(tài)因子模型的alpha預(yù)測方案:——因子選股系列之一〇三基本面因子的重構(gòu):——因子選股系列之一〇二自適應(yīng)時空圖網(wǎng)絡(luò)周頻alpha模型:——因子選股系列之一〇一DFQ-HIST:添加圖信息的選股因子挖掘系統(tǒng):——因子選股系列之一百2024-12-032024-10-112024-08-192024-08-152024-05-292024-05-272024-05-272024-05-142024-03-212024-02-282024-02-07有關(guān)分析師的申明,見本報告最后部分。其他重要信息披露見分析師申明之后部分,或請與您的投資代表聯(lián)系。并請閱讀本證券研究報告最后一頁的免責(zé)申明。2目錄 7 71.1.2概率動態(tài)因子模型1.1.3“先驗-后驗”學(xué)習(xí)方法 9 10 2.2.2特征重構(gòu)器 132.3.1添加特征選擇模塊的效果2.3.2添加重構(gòu)損失的效果2.3.3特征保留情況 14 143.2.1直接作為特征加入3.2.2注意力機制融合 16 18 19 19有關(guān)分析師的申明,見本報告最后部分。其他重要信息披露見分析師申明之后部分,或請與您的投資代表聯(lián)系。并請閱讀本證券研究報告最后一頁的免責(zé)申明。3 21 21 21 22 23 24 24 29 33 34 37 37 39 41 有關(guān)分析師的申明,見本報告最后部分。其他重要信息披露見分析師申明之后部分,或請與您的投資代表聯(lián)系。并請閱讀本證券研究報告最后一頁的免責(zé)申明。4 8 9 10圖5:FactorVAEmaskmodel 13 132024.09.30) 142024.09.30) 142024.09.30) 15圖10:不同共用方案下的模型績效表現(xiàn)( 16 16圖12:不同協(xié)同方式下的模型績效表現(xiàn)( 17 18(2020.01.01-2024.12.31) 20 212024.12.31) 212024.12.31) 22 22 22 23 23有關(guān)分析師的申明,見本報告最后部分。其他重要信息披露見分析師申明之后部分,或請與您的投資代表聯(lián)系。并請閱讀本證券研究報告最后一頁的免責(zé)申明。5 23 23(2020.01.01-2024.12.31) 23 24 24圖31:中證全指股票池各模型因子績效表現(xiàn) 25 252024.12.31) 25 26 262024.12.31) 26 27 272024.12.31) 27 28 282024.12.31) 28圖43:中證全指股票池各模型分年績效表現(xiàn) 29 30 31 32圖47:中證全指股票池各模型中性化因子績 33圖48:滬深300股票池各模型中性化因子 33圖49:中證500股票池各模型中性化因子 33 34 風(fēng)格因子列表................................................圖52:中證全指股票池各模型多頭組的因子相對暴露均值(2 35 35 35 35 35有關(guān)分析師的申明,見本報告最后部分。其他重要信息披露見分析師申明之后部分,或請與您的投資代表聯(lián)系。并請閱讀本證券研究報告最后一頁的免責(zé)申明。6 36圖59:中證全指股票池各模型多頭組的cubicsize 36圖60:中證全指股票池各模型多頭組的trend因子 36 36 362024.12.31) 372024.12.31) 38(2020.1.1-2024.12.31) 382024.12.31) 382024.12.31) 392024.12.31) 39(2020.1.1-2024.12.31) 402024.12.31) 402024.12.31) 412024.12.31) 41(2020.1.1-2024.12.31) 422024.12.31) 42有關(guān)分析師的申明,見本報告最后部分。其他重要信息披露見分析師申明之后部分,或請與您的投資代表聯(lián)系。并請閱讀本證券研究報告最后一頁的免責(zé)申明。7在前期報告《DFQ-FactorVAE:融合變分自編碼器和概率動態(tài)因子模型的alpha預(yù)測方案》中,我們提出了DFQ-FactorVAE模型。FactorVAE模型架構(gòu)拓展?jié)摿^大,模型的穩(wěn)定性、在滬深300股票池中的多頭表現(xiàn)十分突出。本次我們進一步的升級優(yōu)化1)金融數(shù)據(jù)中普遍存在較高的噪聲和冗余,因此,特征選擇在模型開發(fā)中至關(guān)重要。特征選擇的目的是減少無關(guān)或冗余的特征,提升模型的訓(xùn)練效率和預(yù)測準確性,同時避免過擬合。(2)端到端神經(jīng)網(wǎng)絡(luò)模型的輸入一般是股票特征,通常忽略了市場整體信息的作用,但實際股票收益也會受到當(dāng)時所處的市場環(huán)境的影響。因而,本次我們在原模型基礎(chǔ)上,加入特征選擇與環(huán)境變量模塊,構(gòu)建DFQ-FactorVAE-pro模型,所得新模型在各個股票池里的整體表現(xiàn)都有進一步提升。一、DFQ-FactorVAE模型回顧1.1FactorVAE模型架構(gòu)AutoencoderforPredictingCross-sectiona),),F(xiàn)actorVAE模型,在傳統(tǒng)的端到端神經(jīng)網(wǎng)絡(luò)基礎(chǔ)上,融合了變分自編碼器與概率動態(tài)因子模型的思想,創(chuàng)新性地提出了“先驗-后驗”學(xué)習(xí)方法,建立股票收益率預(yù)測模型,學(xué)習(xí)輸入特征和FactorVAE模型采用VAE的編碼器-解碼器的分布結(jié)構(gòu),由解碼器從潛在變量分布中學(xué)習(xí)股票收益率的分布,最后從股票收益率分布中采樣來得到股票收益率預(yù)測數(shù)據(jù)。a.學(xué)習(xí)數(shù)據(jù)分布結(jié)構(gòu),提升樣本外泛化能力:VAE架構(gòu)學(xué)習(xí)的是輸入數(shù)據(jù)對布結(jié)構(gòu),而不僅僅是學(xué)習(xí)從輸入到輸出的直接映射關(guān)系,因此可以更好地泛化到新的、未見過的數(shù)據(jù)上。在股票市場應(yīng)用中,這意味著能夠?qū)ξ磥淼氖袌鰲l件做出更準確的預(yù)測,即使這些條件b.訓(xùn)練引入隨機采樣,對抗過擬合:VAE模型學(xué)習(xí)的不每只股票收益率的分布結(jié)構(gòu),從分布中采樣來得到訓(xùn)練過程中的股票收益率預(yù)測數(shù)據(jù)。在訓(xùn)練過FactorVAE模型創(chuàng)新性地在傳統(tǒng)的VA型中,每只股票的輸入數(shù)據(jù)會通過編碼器映射到潛在空間,模型會為每只股票學(xué)習(xí)到一個潛在變量的分布。也就是說,每只股票都會有自己獨立的潛在變量分布,表示該股票的潛在因子。而因子模型的思想是,股票之間可能共享一些潛在因子(例如市場風(fēng)險、行業(yè)風(fēng)險等不同股票的 潛在變量不是完全獨立的。FactorVAE模型將股票間的公共因子作為VAE模型中的潛在變量,有關(guān)分析師的申明,見本報告最后部分。其他重要信息披露見分析師申明之后部分,或請與您的投資代表聯(lián)系。并請閱讀本證券研究報告最后一頁的免責(zé)申明。8每只股票的輸入數(shù)據(jù)會通過編碼器映射到潛在空間,模型會為所有股票學(xué)習(xí)到一些公共因子的分布。此外,傳統(tǒng)的因子模型通常依賴于預(yù)定義的因子(例如市場因子、行業(yè)因子等FactorVAE模型采用了端到端訓(xùn)練的方式來聯(lián)合優(yōu)化,讓模型自適應(yīng)地選擇合適的潛在因子,不同時間點學(xué)習(xí)到的潛在因子可能不同。結(jié)合因子模型的優(yōu)勢如下:a.提高模型對低信噪比數(shù)據(jù)的魯棒性:在面對低信噪比的金融數(shù)據(jù)時,因子模型能夠通過學(xué)b.對抗過擬合與提升預(yù)測穩(wěn)定性:在傳統(tǒng)的VAE模型中,每個股票的潛在變量是獨立學(xué)習(xí)的,可能會導(dǎo)致每只股票模型過擬合,尤其是在股票數(shù)量非常大的時候。而學(xué)習(xí)共享因子,能夠有效降低模型的過擬合問FactorVAE模型創(chuàng)新性地設(shè)計了一種“先驗-后驗”的訓(xùn)練方法,使用標簽收益率作為輔助信息,指導(dǎo)模型提取有效因子。模型會利用編碼器結(jié)構(gòu),提取出兩類潛在變量,也就是公共因子,一類是先驗因子,一類是后驗因子。先驗因子是僅根據(jù)股票特征信息生成的,沒有用到未來信息。后驗因子是利用股票特征信息標簽收益率信息共同生成的,用到了未來信息。在損失函數(shù)中,最小化由后驗因子收益率解碼出的股票收益率和標簽收益率的差距,將后驗因子優(yōu)化為最優(yōu)因子。再通過損失函數(shù)的引導(dǎo),使得先驗因子收益率逼近后驗因子收益率。在預(yù)測階段,僅使用先驗因使用“先驗-后驗”結(jié)構(gòu)訓(xùn)練,相比于僅使用先驗路a.利用標簽信息提升因子學(xué)習(xí)精度:通過引入后驗因子,能夠更好地利用標簽收益率(未來股票收益)輔助訓(xùn)練。幫助模型學(xué)習(xí)到更為精確的潛在因子,使?jié)撛谝蜃幽軌蚋_地捕捉到股b.提升對噪聲的魯棒性:金融市場數(shù)據(jù)通常包含較高的噪聲和較低的信噪比,傳統(tǒng)模型可能難以直接從股票特征數(shù)據(jù)中提取有用信息。FactorVAE模型通過引入后驗因子,利用未來收益信息引導(dǎo)因子的學(xué)習(xí)過程,從而能夠更好地從復(fù)雜的市場數(shù)據(jù)中提取出有意義的信號,提升預(yù)測的數(shù)據(jù)來源:東方證券研究所&AAAI-22有關(guān)分析師的申明,見本報告最后部分。其他重要信息披露見分析師申明之后部分,或請與您的投資代表聯(lián)系。并請閱讀本證券研究報告最后一頁的免責(zé)申明。91.2FactorVAE模型訓(xùn)練和預(yù)測過程Step1:特征提取器(FeatureExtractor,φfeat從輸入的股票特征歷史序列x中提取股票Step2:因子編碼器(FactorEncoder,φenc從標簽中的未來股票收益率y和潛在特征中提取后驗因子zpost的分布。編碼器扮演了一個神諭的角色,利用未來信息提取后驗因子。Step3:因子解碼器(FactorDecoder,φdec使用后驗因子和潛在特征得到重構(gòu)的股票收益rec。Step4:因子預(yù)測器(FactorPredictor,φpred從股票潛在特征中提取先驗因子zprior的(1)訓(xùn)練最優(yōu)的后驗因子,減少后驗因子模型的重建誤差:使用重Step1:特征提取器:從輸入的股票特征歷史序列x中提取股票的潛在特征。Step2:因子預(yù)測器:從股票潛在特征中提取先驗因子zprior的分布。Step3:因子解碼器:使用先驗因子和潛在特征得到預(yù)測的股票收益pred。在預(yù)測階段,模型只通過預(yù)測器和解碼器來預(yù)測股票收益率,沒有編碼器的參與,因而沒有數(shù)據(jù)來源:東方證券研究所&AAAI-22有關(guān)分析師的申明,見本報告最后部分。其他重要信息披露見分析師申明之后部分,或請與您的投資代表聯(lián)系。并請閱讀本證券研究報告最后一頁的免責(zé)申明。1.3DFQ-FactorVAE模型問題在前期報告《DFQ-FactorVAE:融合變分自編碼器和概率動態(tài)因子模型的alpha預(yù)測方案》中,我們給出的DFQ-FactorVAE模型,是在原論文FactorVAE模型的基礎(chǔ)上進行復(fù)現(xiàn)修改的,這次我們發(fā)現(xiàn)模型有幾次處理細節(jié)需要改進:包括14個分鐘特征和46個日度&l2特征的分布預(yù)測,而后進行了隨機采樣得出最終預(yù)測值。這樣會導(dǎo)致樣本外預(yù)測值不穩(wěn)定。我們改為直接用股票收益率預(yù)測的均值作為預(yù)測值,采樣僅在訓(xùn)練過程中使用,樣本外不(3)輸入的標簽數(shù)據(jù)處理方式:DFQ-FactorVAE模型先填我們改成對于訓(xùn)練集和驗證集的標簽數(shù)據(jù),1.24,20分組多頭日度超額年化收益率達到24.60%,中證全指股票池60特征20日標簽factorvae基礎(chǔ)模型IC_IRrankICrankIC_IR多頭月度勝率多頭日超額收益夏普比多頭日度超額年化收益多頭日度超額收益最大回撤多頭日均單邊換手率2020.01.01-2024.09.3011.58%1.1214.22%1.2482.46%2.8624.60%-8.85%77.43%202011.37%1.1114.00%1.2975.00%2.2516.60%-5.14%81.45%202111.80%1.2414.77%1.2475.00%2.6825.94%-5.21%74.68%202213.35%1.6115.90%2.0391.67%3.9727.55%-2.93%78.17%202310.85%1.0214.74%1.3883.33%4.4523.00%-2.93%77.35%2024(截至09.30)10.35%0.8010.98%0.7088.89%0.1418.53%-8.85%74.86%數(shù)據(jù)來源:東方證券研究所&Wind資訊有關(guān)分析師的申明,見本報告最后部分。其他重要信息披露見分析師申明之后部分,或請與您的投資代表聯(lián)系。并請閱讀本證券研究報告最后一頁的免責(zé)申明。二、特征選擇金融數(shù)據(jù)中普遍存在較高的噪聲和冗余,因此,特征選擇在模型開發(fā)中至關(guān)重要。特征選擇的目的是減少無關(guān)或冗余的特征,提升模型的訓(xùn)練效率和預(yù)測準確性,同時避免過擬合。通過有效的特征選擇,我們可以確保模型聚焦于最有價值的信息,從而提高其泛化能力。在傳統(tǒng)的端到端神經(jīng)網(wǎng)絡(luò)訓(xùn)練中,常見的特征選擇可以分為顯式(明確特征選擇)和隱式(通過模型訓(xùn)練間接選擇)兩大類:(3)基于樹模型的特征選擇:利用決策樹或基于樹的集成模型(如隨機森林、梯度提升樹)(3)Attention機制:利用注意力機制(如Transformer中的Self-At),每個特征與其他特征的相似度,自適應(yīng)地分配特征(4)特征層的重要性權(quán)重分析:在模型訓(xùn)練后選擇模塊,引入特征掩碼,通過網(wǎng)絡(luò)學(xué)習(xí)每個特征的權(quán)重,由網(wǎng)絡(luò)自動選擇預(yù)測能力更優(yōu)的特征,實現(xiàn)自動調(diào)整特征選擇。2.2特征選擇模塊特征選擇器φmask:從輸入的股票特征歷史序列中,由網(wǎng)絡(luò)提取股票特征的二值掩碼mask。輸出變量維度與原始輸入的股票特征序列完全有關(guān)分析師的申明,見本報告最后部分。其他重要信息披露見分析師申明之后部分,或請與您的投資代表聯(lián)系。并請閱讀本證券研究報告最后一頁的免責(zé)申明。征的時序窗口長度,f為輸入特征個數(shù)。特征提取器旨在從原始特征中,過濾掉冗余特征,只保1.線性變換層(Linear):將輸入特征進行線性變換,將輸入特征映射到指定的輸出維度線性擬合能力,并解決了常規(guī)ReLU在輸入為負值時可):的變體,提高了網(wǎng)絡(luò)對長序列的建模能力,具有參數(shù)數(shù)量少、計算效率高、靈活性強和征會生成兩類值(即二值化操作)。而后reshape為四維,輸出變量維度為n*seqle5.直通估計:將softmax結(jié)果轉(zhuǎn)化為二值掩碼。由于二值掩碼不可微,不能直接計算,使用直通估計技術(shù)來估計梯度,在反向傳播過程中確保梯度的流動。這樣做使得特征重構(gòu)器φrecon:將特征選擇器輸出的mask變量與原始特征相乘,得到調(diào)整后的股票特原始輸入的股票特征序列完全一致,為n*s度,f為輸入特征個數(shù)。特征重構(gòu)器旨在從特征選擇器篩選后的剩余特征中重建復(fù)原始輸入特征,從而確保篩選后的特征中仍然包含足夠的信息來恢復(fù)原2.第二層:另一個+LeakyReLU激3.第三層:最后一個線性變換層(Linear)。將在模型訓(xùn)練中,重構(gòu)任務(wù)通常作為一個訓(xùn)練的輔助目標,在損失函數(shù)中疊加一個MSE損失項,計算特征重構(gòu)器輸出的特征與原始輸入特征間的差異,度量重構(gòu)損失。特征選擇器和特征重構(gòu)器是一個整體,共同構(gòu)成特征選擇模塊。如果特征選擇器未能保留所有重要特征,那么特征重構(gòu)器也將無法很好地重建輸入特征。因而,添加重構(gòu)損失項之后,可以在訓(xùn)練過程中同時對特征選擇器和特征重構(gòu)器施加約束,共同優(yōu)化。在樣本外預(yù)測時,則不需要有關(guān)分析師的申明,見本報告最后部分。其他重要信息披露見分析師申明之后部分,或請與您的投資代表聯(lián)系。并請閱讀本證券研究報告最后一頁的免責(zé)申明。2.3效果分析我們比較了FactorVAE基礎(chǔ)模型,和疊加了特征選擇模塊后的新模型的因子效果,結(jié)果顯此外我們對比了二值掩碼和加權(quán)掩碼兩種不同的特征選擇方式,發(fā)現(xiàn)整體模型性能非常接近。使用二值掩碼生成的掩碼是二值化的(0或1明確地選擇或剔除特定的特征,能夠更明確地聚焦于那些最重要的特征,從而避免噪聲特征對最終預(yù)中證全指股票池60特征20日標簽2020.01.01-2024.09.30rankICrankIC_IR多頭月度勝率多頭日超額收益夏普比多頭日度超額年化收益多頭日度超額收益最大回撤多頭日均單邊換手率factorvae基礎(chǔ)模型11.58%1.1214.22%1.2482.46%2.8624.60%-8.85%77.43%factorvae0-1mask模型12.02%1.1114.74%1.2482.46%3.0328.92%-9.45%76.51%factorvaeweightedmask模型11.97%1.1214.61%1.2484.21%3.1628.09%-8.63%75.85%數(shù)據(jù)來源:東方證券研究所&Wind資訊我們比較了重構(gòu)損失項加入前后的因子效果,結(jié)果顯示:去掉重構(gòu)損失后,因子效果明顯下也不再有效,篩選出的因子無法有效捕捉輸入數(shù)據(jù)的全部關(guān)鍵特征,導(dǎo)致生成的因子可能過于專注于優(yōu)化訓(xùn)練集上的特定任務(wù),樣本外泛化ICICIC_IRrankICrankIC_IR多頭月度勝率多頭日超額收益夏普比多頭日度超額年化收益多頭日度超額收益最大回撤多頭日均單邊換手率中證全指股票池60特征20日標簽2020.01.01-2024.09.30factorvae基礎(chǔ)模型factorvae0-1mask模型11.58%14.22%14.74%82.46%82.46%2.8624.60%28.92%-8.85%-9.45%77.43%76.51%factorvae0-1mask模型無recon_loss12.04%1.1714.32%1.3275.44%2.5023.34%-7.88%70.00%數(shù)據(jù)來源:東方證券研究所&Wind資訊左右,說明設(shè)計的特征絕大部分還是有效的。尤其是在有重構(gòu)損失引導(dǎo)的情況,為了不損失過多信息,特征保留的概率會更大。(2)level2特征的保留概率更大(90%其次是分鐘特征Trainloader特征保留情況adjcloseadjprecloseadjopenadjlowadjvwapadjvolume84.78%97.99%99.98%99.86%99.35%lnvwapret90.51%99.66%88.10%81.57%99.22%48.77%98.78%92.36%82.50%ex_lnretex_lnopenretex_lnlowretcitic1index_lnret99.83%99.60%85.82%41.77%91.48%99.98%99.73%citic2index_lnretcitic3index_lnret99.95%99.43%99.44%98.03%99.89%99.13%99.28%78.48%99.31%rvolsqrvol98.95%98.76%99.61%98.72%99.64%99.67%89.68%96.54%93.17%81.93%vvolapbarppcvpctovpctcret97.85%99.23%70.21%91.53%99.24%86.01%99.49%99.07%98.85%數(shù)據(jù)來源:東方證券研究所&Wind資訊有關(guān)分析師的申明,見本報告最后部分。其他重要信息披露見分析師申明之后部分,或請與您的投資代表聯(lián)系。并請閱讀本證券研究報告最后一頁的免責(zé)申明。三、環(huán)境變量端到端神經(jīng)網(wǎng)絡(luò)模型的輸入一般是股票特征,通常忽略了市場整體信息的作用,但實際股票收益也會受到當(dāng)時所處的市場環(huán)境的影響。此次我們嘗試在輸入中添加環(huán)境變量。所謂環(huán)境變量,是反映市場整體的信息,也就是可能橫截面同一日期的所有股票取值相同。小盤成長指數(shù)、小盤價值指數(shù)、大盤成長指數(shù)、2.日期變量:選擇每個樣本所在的年份和月份,構(gòu)造虛擬變量,刻畫日歷效應(yīng)。但需要注意的是1)日期變量只能是虛擬變量形式。日期對股票收益的影響并沒有遞增或遞減的關(guān)系;(2)日期變量僅能出現(xiàn)在訓(xùn)練過程中,用來指導(dǎo)模型訓(xùn)練,不可直接作為預(yù)測模型的輸入。樣本內(nèi)外數(shù)據(jù)涉及的年份不同,年份虛擬變量含義不一致,直接采用樣本內(nèi)的日期變量進行樣本外預(yù)測,無法引入有效信息,會影響模型的泛化能力。3.2環(huán)境變量引入方法直接作為特征加入是最直觀最簡單的方式,將環(huán)境變量直接作為額外的輸入特征與股票的其他特征一起輸入到神經(jīng)網(wǎng)絡(luò)中。我們嘗試在疊加了特征選擇模塊后的FactorVAEmaskmodel模factorvae0-1mask模型60特征82.46%28.92%76.51%factorvae0-1mask模型60特征+env1178.95%27.02%75.53%數(shù)據(jù)來源:東方證券研究所&Wind資訊由于環(huán)境變量與股票特征指標的信息差異性,在融合時我們分別使用兩個不同的GRU網(wǎng)絡(luò)去提取,而后通過交叉注意力機制的方法進行融合。我們嘗試在疊加了特征選擇模塊后的數(shù)據(jù)來源:東方證券研究所&Wind資訊有關(guān)分析師的申明,見本報告最后部分。其他重要信息披露見分析師申明之后部分,或請與您的投資代表聯(lián)系。并請閱讀本證券研究報告最后一頁的免責(zé)申明。最后,我們參考InvariantStock環(huán)境變量特征來協(xié)同對股票收益定價,而在預(yù)測時摒棄環(huán)境變量的部分,以此提升模型的收益預(yù)具體做法是:以前文提到的FactorVAEmaskmodel模型作為基環(huán)境變量。訓(xùn)練時兩模塊共同參與,樣本外預(yù)測時只使用無環(huán)境變量的VAE模塊。訓(xùn)練損失函數(shù)設(shè)計為:特征選擇模塊的重構(gòu)損失+VAE模塊的損失(VAEloss)+EnvVAE模塊的損失塊。這種做法的關(guān)鍵思想有三點:):果都好的特征選擇方案,確保模型對特征的選擇不受環(huán)境變量變化的影響,也就是找到不變特征;):子生成方案,確保不論在訓(xùn)練時是否加入環(huán)境變量,模型生成的隱變量因子都能保持一致,也就(3)協(xié)同訓(xùn)練:兩個模塊同時訓(xùn)練,通過共同優(yōu)化損失函數(shù),確保環(huán)境變量與股票個性特在樣本外預(yù)測時,只使用特征選擇器和VAE模塊(即不包含環(huán)境變量的VAE模塊)進行預(yù)測,也就是只用到特征選擇器、無環(huán)境變量模塊下的特征提取器和因子預(yù)測四個模塊。前兩者在訓(xùn)練時,都獲得了環(huán)境變量的引導(dǎo),因子解碼器兩模塊可以共用。這樣即使在沒有環(huán)境變量的情況下,模型仍然能夠利用訓(xùn)練時獲得的特征選擇方案和先驗因子,生成樣本我們嘗試在疊加了特征選擇模塊后的FactorVAEmaskmodel模方法,加入環(huán)境變量進行訓(xùn)練。從結(jié)果來看1)加入市場狀態(tài)指標作為環(huán)境變量,模型效果(如各種股票指數(shù))間可能存在高度的相關(guān)性,導(dǎo)致信息冗余,未能提供額外的預(yù)測價值。此外,市場狀態(tài)指標通常反映的是宏觀市場趨勢,這些趨勢可能已被現(xiàn)有股票特征(如價格動態(tài)、成交量等)所包含,因此這些環(huán)境變量的加入可能沒有帶來新的增量。(2)日期變量日期變量能夠幫助模型捕捉到市場的周期性和季節(jié)性變化。例如,某些特定的時間段,比如季度財報季、年底或重要政策發(fā)布的時期,通常會對市場產(chǎn)生顯著影響,而這些變化并不一定能通過常規(guī)的股票個性特征(如價格、成交量等)直接反映出來。日期變量能夠幫助模型識別這些時間上的特定模式,從而改善預(yù)測能力。數(shù)據(jù)來源:東方證券研究所&Wind資訊有關(guān)分析師的申明,見本報告最后部分。其他重要信息披露見分析師申明之后部分,或請與您的投資代表聯(lián)系。并請閱讀本證券研究報告最后一頁的免責(zé)申明。3.3協(xié)同訓(xùn)練細節(jié)分析Q1.VAE和EnvVAE兩個模塊的特征提取器、因輸入維度不同。特征提取器處理的是原始輸入,因而兩模塊的特征提取器無法公用,需要分開優(yōu)化。剩下的因子編碼器、因子預(yù)測器、因子解碼器理論上可以共用也可以分開。我們對比了三種因子解碼器均公用3)因子編碼器、因子預(yù)測器、因子解碼器均獨立。這說明1)共享解碼器提高一致性和魯棒性:因子解碼器的作用是將提取的因子映射回股票的預(yù)期收益率,這是模型的最終輸出。共享因子解碼器能夠保證兩個模塊在預(yù)測時的一致性,避免因為因子編碼器和預(yù)測器的差異而導(dǎo)致輸出的預(yù)測結(jié)果不穩(wěn)定。此外,解碼器的共享有助于提升模型的魯棒性,減少因不同輸入數(shù)據(jù)導(dǎo)致的過擬合或模型偏差。這種做法確保了最終輸出的穩(wěn)定性,使得無論是股票特征還是加入環(huán)境變量的數(shù)據(jù),最終都能通過相同的解碼器進行統(tǒng)一的處理,保證了模型的一致性。(2)獨立的因子編碼器和預(yù)測器提高靈活性:因為兩個模塊的輸入信息源不同,獨立的因子編碼器和預(yù)測器能夠根據(jù)各自輸入數(shù)據(jù)的特點進行靈活調(diào)整,從而更好 地挖掘不同輸入類型的潛在信息,避免了共享因子編碼器和預(yù)測器可能帶來的不必要約束或信息數(shù)據(jù)來源:東方證券研究所&Wind資訊益率接近3)兩模塊先驗因子的kl散度+兩模塊后驗因子收益率的mse損失。輸出的精確度,可能導(dǎo)致模型在不同輸入條件下產(chǎn)生不同的隱因子表示,從而影響泛化能力。因子分布可以相對接近,這有助于模型學(xué)習(xí)到一致的潛在表示,從而提高了泛化能力,也避免過度依賴具體的收益率預(yù)測。(3)KL散度可以起到正則化的作用:避免模型學(xué)習(xí)到不合理或過于復(fù)雜的隱因子表示,限制模型過度擬合訓(xùn)練數(shù)數(shù)據(jù)來源:東方證券研究所&Wind資訊有關(guān)分析師的申明,見本報告最后部分。其他重要信息披露見分析師申明之后部分,或請與您的投資代表聯(lián)系。并請閱讀本證券研究報告最后一頁的免責(zé)申明。我們對比了兩種方案1)三個模塊的損失函數(shù)直接合并,最終合成一個統(tǒng)一的損失函數(shù)進行優(yōu)化。訓(xùn)練的損失函數(shù)設(shè)計為:特征選擇模塊的重構(gòu)損失+VAEloss+EnvVAEloss+兩模塊先驗因子的kl散度,同時優(yōu)化特征選擇模塊、VAE模塊、EnvVAEepoch僅訓(xùn)練一個其中模塊,每個模塊順序依次從結(jié)果來看,直接合并三個模塊的損失函數(shù)(方案一)效果優(yōu)于分階段訓(xùn)練(方案二)??赡艿脑蛉缦?)模塊間協(xié)同學(xué)習(xí)與相互約束:在方案一中,三個模塊(特征選擇、VAE和EnvVAE)在同一梯度更新的驅(qū)動下進行學(xué)習(xí),同步優(yōu)化和更新參數(shù)。這使得它們能夠相互影響,實時調(diào)整,從而共同學(xué)習(xí)到最佳的參數(shù)組合。通過直接合并損失函數(shù),模塊之間不僅優(yōu)化各自的目標,還能夠確保它們朝著一致的全局目標收斂,避免了單個模塊過擬合或者偏離整體目標,確保了模型的全局一致性。(2)訓(xùn)練過程的穩(wěn)定性:方案二中,每個模塊獨立訓(xùn)練,可能導(dǎo)致訓(xùn)練過程中某個模塊的優(yōu)化忽略了其他模塊的影響。這種不一致可能引起訓(xùn)練的不穩(wěn)定,無法充分發(fā)揮模塊間的協(xié)同作用。而方案一中,通過將所有模塊的損失合并,三個模塊的更新是同步的,避免了不必要的訓(xùn)練波動,使得訓(xùn)練過程更加平穩(wěn),factorvae0-1mask模型協(xié)同訓(xùn)練(1path)85.96%factorvae0-1mask模型協(xié)同訓(xùn)練(3path)84.21%數(shù)據(jù)來源:東方證券研究所&Wind資訊有關(guān)分析師的申明,見本報告最后部分。其他重要信息披露見分析師申明之后部分,或請與您的投資代表聯(lián)系。并請閱讀本證券研究報告最后一頁的免責(zé)申明。四、DFQ-FactorVAE-pro模型說明基于前面的嘗試,我們構(gòu)建了DFQ-FactorVAE-pro模型,以factorVAE模型為基礎(chǔ),添加特征選擇模塊,添加日期環(huán)境變量,使用協(xié)同訓(xùn)練方式進行訓(xùn)練。DFQ-FactorVAE-pro模型結(jié)構(gòu)設(shè)計如下,其中綠色區(qū)域代表特征選擇模塊,包括一個特征數(shù)據(jù)來源:東方證券研究所&arXivStep1:特征選擇器(FeatureMask):對輸入的股票特征歷史序列(不包括環(huán)境變量)data[…,:-env_size]進行特征篩選,得到股票特征的二值掩碼mask。將mask變量):Step4:Env_FactorVAE模塊:包括單獨的特征提取器、單獨的因子編碼器、碼器、單獨的因子預(yù)測器。輸入new_features+env,輸出envvaeloss、先驗因子均值env_pred_mu,先驗因子標準差env有關(guān)分析師的申明,見本報告最后部分。其他重要信息披露見分析師申明之后部分,或請與您的投資代表聯(lián)系。并請閱讀本證券研究報告最后一頁的免責(zé)申明。(3)有環(huán)境變量模塊預(yù)測性能好:envvaeloss。Step1:特征選擇器(FeatureMask):對輸入的股票特征歷史序列(不包括環(huán)境變量)data[…,:-env_size]進行特征篩選,得到股票特征的二值掩碼mask。將mask變量Step2:FactorVAE模塊:包括特征提取器、因4.2數(shù)據(jù)說明(3)測試集2020.01.01—2024.09.30。數(shù)據(jù)集中額外的分割間隙是有意引入的,以避免特征和標簽的泄露。訓(xùn)練集用于迭代訓(xùn)練模型,通過反向傳播算法計算損失函數(shù)關(guān)于模型參數(shù)的梯度,然后按照梯度方向更新模型參數(shù)。驗證集用于在模型訓(xùn)練過程中評估模型的性能,便于選擇最優(yōu)的模型和參數(shù)。測試集用于觀察模型樣本外的表現(xiàn),在模型開發(fā)完成后評估模型的泛化性能。4.3模型輸入特征我們嘗試了四種輸入來源:量價特征、基本面特征、風(fēng)險因子、寬基成分股屬性特征。2000、是否萬得微盤股指數(shù)成分股5個0-1分類變量。幫助模型捕我們嘗試了多種輸入特征結(jié)合方式,結(jié)果都沒有明顯提高,仍是只輸入60個量價特征效果最好。這說明量價特征可能已經(jīng)在很大程度上捕捉了市場的主要變動和價格動態(tài),這些特征對模型的預(yù)測能力貢獻最大。其他特征可能與量價特征高度相關(guān)或提供的信息與已有的量價特征重疊,有關(guān)分析師的申明,見本報告最后部分。其他重要信息披露見分析師申明之后部分,或請與您的投資代表聯(lián)系。并請閱讀本證券研究報告最后一頁的免責(zé)申明。中證全指股票池20日標簽factorvae0-1mask模型env17協(xié)同訓(xùn)練2020.01.01-2024.12.31rankIC_IR多頭月度勝率多頭日超額收益夏普比多頭日度超額年化收益多頭日度超額收益最大回撤多頭日均單邊換手率12.09%15.08%85.00%29.77%-5.36%77.55%60量價特征+5寬基成分股屬性特征直接合并輸入11.98%14.39%83.33%26.97%-8.67%76.94%60量價特征+10基本面特征直接合并輸入12.01%14.43%81.67%26.49%-12.62%72.46%60量價特征gru,10risk(+env17)mlp12.35%14.74%83.33%27.75%-10.96%72.20%60量價特征gru,10基本面(+env17)mlp12.20%14.38%83.33%31.06%-10.65%71.74%60量價特征gru,10基本面(+env17)gru12.41%14.34%81.67%30.45%-7.61%73.60%數(shù)據(jù)來源:東方證券研究所&Wind資訊(2)特征平均的保留概率為80%左右,失引導(dǎo)的情況,為了不損失過多信息,特征保留的概率會更大。這也反映出模型的設(shè)計是為了維(3)level2特征的保留概率更大(90%),其次是分鐘特征(80%),日線特征的保留概率的相關(guān)性較低或者在模型中的信息重疊較多(即與其他特征高度相關(guān)),從而在特征選擇過程中不同訓(xùn)練集內(nèi)不同特征保留情況匯總9量價特征24日內(nèi)特征Trainloader(2014.1.1-2018.11.30)·68.05%77.86%78.16%86.66%Validloader(2019.1.1-2019.11.30)68.30%78.94%79.96%88.31%Testloader(2020.1.1-2024.12.31)68.28%78.98%80.24%88.56%數(shù)據(jù)來源:東方證券研究所&Wind資訊Trainloader特征保留情況特征1-10adjcloseadjprecloseadjopenadjlowadjhighadjvwapadjtwapadjvolumeamountlntwapret保留比率100.00%98.96%85.34%1.00%99.40%0.00%30.54%98.17%99.03%42.74%特征11-20sqretamihudlnretlnopenretlnhighretlnlowretlnvwapretlncoretlnhlret保留比率98.08%99.59%88.61%3.90%91.99%94.85%99.15%84.60%36.06%43.56%特征21-30ex_lnretex_lnopenretex_lnhighretex_lnlowretswingcitic1index_lnretwinnerlosertouchup保留比率98.20%2.47%88.20%41.42%95.42%83.06%99.41%98.42%97.77%84.48%特征31-40touchdowncitic2index_lnretcitic3index_lnretl2c4l2c8l2c9l2c10l2c11l2c12l2c13保留比率98.02%99.29%99.35%88.13%0.00%99.54%87.64%88.23%97.22%96.82%特征41-50l2c14l2c15l2c16l2c18l2c19l2c20rvolsqrvolrskewsqrskew保留比率99.05%90.95%99.77%98.75%80.71%99.74%98.50%30.77%98.91%99.58%特征51-60rkurtsqrkurtvhhivvolrjumpapbarppcvpctovpctcret90.57%90.62%保留比率0.00%99.20%91.98%11.85%990.57%90.62%保留比率0.00%99.20%91.98%11.85%98.50%99.67%85.79%98.34%數(shù)據(jù)來源:東方證券研究所&Wind資訊有關(guān)分析師的申明,見本報告最后部分。其他重要信息披露見分析師申明之后部分,或請與您的投資代表聯(lián)系。并請閱讀本證券研究報告最后一頁的免責(zé)申明。4.4模型預(yù)測標簽到6個因子打分,測試樣本外20日調(diào)倉后,模型表現(xiàn)有一定提升。2020.01.01-2024.12.3183.33%27.75%-6.91%86.98%81.67%30.50%-9.93%79.77%85.00%30.08%-7.69%79.00%85.00%29.77%-5.36%77.55%86.67%30.78%-5.99%77.12%83.33%27.80%-5.75%73.76%多標簽?zāi)P痛蚍謽藴驶葯?quán)合成12.79%1.2215.11%1.3486.67%數(shù)據(jù)來源:東方證券研究所&Wind資訊4.5模型參數(shù)參數(shù)類型參數(shù)符號參數(shù)設(shè)置參數(shù)解釋數(shù)據(jù)參數(shù)seq_len每次前向傳播的數(shù)據(jù)結(jié)構(gòu)為過去30天訓(xùn)練參數(shù)n_epochs200進行200次訓(xùn)練,不斷迭代更新模型參數(shù)early_stop若20步驗證集IC無提高,則提前停止學(xué)習(xí)訓(xùn)練max_steps_per_epoch每次訓(xùn)練按批次進行,一個epoch共訓(xùn)練100個批次batch_size每批次訓(xùn)練輸入一個交易日的batchsmooth_steps5設(shè)置雙端隊列params_list的最大長度,用于存儲模型的最近狀態(tài)(參數(shù)和緩存),用于后續(xù)的參數(shù)平均或其他處理3.00E-04優(yōu)化模型的adam算法的學(xué)習(xí)率seed隨機種子模型參數(shù)feat_dim潛在特征數(shù)量env_size環(huán)境變量num_portfolio投資組合個數(shù)num_factor48先驗和后驗因子個數(shù)hidden_size隱藏層的大小num_layers1神經(jīng)網(wǎng)絡(luò)的層數(shù)數(shù)據(jù)來源:東方證券研究所我們嘗試換用余弦退火(CosineAnnealing)學(xué)習(xí)率調(diào)節(jié)器來訓(xùn)行調(diào)整學(xué)習(xí)率,旨在幫助模型跳出局部最小值。在高學(xué)習(xí)率階段,模型能夠探索新的參數(shù)空間;在低學(xué)習(xí)率階段,模型則能夠在當(dāng)前區(qū)域細致優(yōu)化。從結(jié)果來看,學(xué)習(xí)率調(diào)節(jié)器對模型的影響很小,可以忽略不計。中證全指股票池20日標簽factorvae0-1mask模型協(xié)同訓(xùn)練2020.01.01-2024.12.31rankICrankIC_IR多頭月度勝率多頭日超額收益夏普比多頭日度超額年化收益多頭日度超額收益最大回撤多頭日均單邊換手率60特征信息輸入env17協(xié)同訓(xùn)練固定lr12.09%15.08%85.00%3.4829.77%-5.36%77.55%60特征信息輸入env17協(xié)同訓(xùn)練學(xué)習(xí)率scheduler12.14%1.0914.99%1.2586.67%3.5830.10%-5.76%76.79%數(shù)據(jù)來源:東方證券研究所&Wind資訊4.6對抗過擬合神經(jīng)網(wǎng)絡(luò)模型容易過擬合,DFQ-FactorVAE-pro模型采取以下措施來降低過擬合風(fēng)險:有關(guān)分析師的申明,見本報告最后部分。其他重要信息披露見分析師申明之后部分,或請與您的投資代表聯(lián)系。并請閱讀本證券研究報告最后一頁的免責(zé)申明。我們分別對比了不加驗證集和不加早停這2種訓(xùn)練方式下的模型績效,可以看到驗證集的存在是有必要的,但早??梢匀サ簟_@說明,模型訓(xùn)練可能較少受到過擬合的影響,即使不使用早中證全指股票池20日標簽factorvae0-1mask模型協(xié)同訓(xùn)練2020.01.01-2024.12.31rankICrankIC_IR多頭月度勝率多頭日超額收益夏普比多頭日度超額年化收益多頭日度超額收益最大回撤多頭日均單邊換手率60特征信息輸入env17協(xié)同訓(xùn)練valid+earlystop12.09%15.08%85.00%3.4829.77%-5.36%77.55%60特征信息輸入env17協(xié)同訓(xùn)練no_valid12.15%14.42%85.00%3.1026.29%-5.71%80.67%60特征信息輸入env17協(xié)同訓(xùn)練no_earlystop12.45%15.56%86.67%3.6329.58%-6.76%78.05%數(shù)據(jù)來源:東方證券研究所&Wind資訊4.7隨機種子的影響我們測試了5種不同隨機種子下,DFQ-FactorVAE-pro模型的績效表現(xiàn)和相關(guān)性到,隨機種子模型結(jié)果有一定影響1)不同種子下,模型績效表現(xiàn)有所不同,但相差不大。多種子模型打分等權(quán)合成后,模型效果略有提升2)不同路徑下得到的模型因子值相關(guān)系數(shù)85.00%85.00%85.00%數(shù)據(jù)來源:東方證券研究所&Wind資訊數(shù)據(jù)來源:東方證券研究所&Wind資訊數(shù)據(jù)來源:東方證券研究所&Wind數(shù)據(jù)來源:東方證券研究所&Wind資訊有關(guān)分析師的申明,見本報告最后部分。其他重要信息披露見分析師申明之后部分,或請與您的投資代表聯(lián)系。并請閱讀本證券研究報告最后一頁的免責(zé)申明。不穩(wěn)定性:在FactorVAE模型中,訓(xùn)練過程中的預(yù)測收益率是通過從先驗分布到的。即使不同種子生成的潛在因子分布相同,每次采樣得到的預(yù)測值也會有差異,從而導(dǎo)致不同隨機種子下的模型產(chǎn)生不同的預(yù)測結(jié)果。(2)訓(xùn)練分下界(ELBO)來對隱因子進行估計,這一過程本身包含一定的隨機性,導(dǎo)致在不同的訓(xùn)練路徑中模型學(xué)習(xí)到的因子值不一致。訓(xùn)練過程的隨機性有可能會提升模型泛化能力,使得樣本外表現(xiàn)更好,但也會帶來一定的路徑依賴問題,需要權(quán)衡。數(shù)據(jù)來源:東方證券研究所&Wind資訊數(shù)據(jù)來源:東方證券研究所&Wind數(shù)據(jù)來源:東方證券研究所&Wind資訊數(shù)據(jù)來源:東方證券研究所&Wind資訊數(shù)據(jù)來源:東方證券研究所&Wind資訊4.8滾動訓(xùn)練期環(huán)境變量,增量訓(xùn)練時需要在前一次訓(xùn)練的模型基礎(chǔ)上繼續(xù)訓(xùn)練,因此每年訓(xùn)練時訓(xùn)練集涉及的年份數(shù)量必須固定。從結(jié)果來看,滾動增量訓(xùn)練優(yōu)于滾動獨立訓(xùn)練,但仍不如單次訓(xùn)練。中證全指股票池60特征信息輸入20日標簽env17協(xié)同訓(xùn)練2020.01.01-2024.12.31IC_IRrankICrankIC_IR多頭月度勝率多頭日超額收益夏普比多頭日度超額年化收益多頭日度超額收益最大回撤多頭日均單邊換手率單次訓(xùn)練12.09%1.0915.08%1.2485.00%3.4829.77%-5.36%77.55%滾動獨立訓(xùn)練11.27%1.1912.13%1.1568.33%1.6516.73%-12.25%75.96%滾動增量訓(xùn)練11.58%1.1813.19%1.2376.67%2.3123.39%-10.60%77.13%數(shù)據(jù)來源:東方證券研究所&Wind資訊有關(guān)分析師的申明,見本報告最后部分。其他重要信息披露見分析師申明之后部分,或請與您的投資代表聯(lián)系。并請閱讀本證券研究報告最后一頁的免責(zé)申明。五、DFQ-FactorVAE-pro模型結(jié)果上升趨勢,模型未出現(xiàn)明顯過擬合。avg_env_lossavg_self_pred_lossavg_kl_diff_lossavg50.250.280000.20.1560000.150.140000.10.0520000.050001471013161922252831343740434649525558616467147101316192225283134371471013161922252831343740434649525558616467數(shù)據(jù)來源:東方證券研究所&Wind資訊數(shù)據(jù)來源:東方證券研究所&Wind數(shù)據(jù)來源:東方證券研究所&Wind資訊5.2因子整體績效表現(xiàn)),深300、中證500、中證1000四個股票池中的表現(xiàn),并與前期報告《基于機構(gòu)持倉析》中的基于機構(gòu)持倉分域的線性多因子模型dfqfactor、《DFQ遺傳規(guī)劃價量因子挖掘系統(tǒng)》中的遺傳規(guī)劃合成因子gp、《DFQ強化學(xué)習(xí)因子組合挖掘系統(tǒng)》中的強化學(xué)習(xí)合成因子rl、《DFQ-TRA:多交易模式學(xué)習(xí)因子挖掘系統(tǒng)》中的TRA因子、《DFQ-HIST:添加圖信息的選股因子挖掘系統(tǒng)》中的HIST因子、《DFQ-XGB:基于樹模型的alpha預(yù)測方案》中的子進行對比。分組數(shù)為20。(3)多頭組合月頻調(diào)倉,績效依次展示:日度超額比、日度超額收益最大回撤、月度勝率、月均單邊換手。此處的多頭計算不考慮交易成本,但匯結(jié)果顯示:在各個股票池中,DFQ-FactorVAE-pro模型表現(xiàn)都較好,尤其在大盤股中表現(xiàn)有關(guān)分析師的申明,見本報告最后部分。其他重要信息披露見分析師申明之后部分,或請與您的投資代表聯(lián)系。并請閱讀本證券研究報告最后一頁的免責(zé)申明。1.09,RANKIC達到15.08%,RANKICIR達到1.24。20分組多頭日度超額年化收益率達到中證全指股票池2020.01.01-2024.12.31rankICrankIC_IR多頭月度勝率多頭日超額收益夏普比多頭日度超額年化收益多頭日度超額收益最大回撤多頭日均單邊換手率dfq4.08%0.586.26%0.7660.00%6.42%-11.41%32.94%gp7.74%0.8011.27%71.67%2.1015.36%-8.95%68.11%rl9859.92%0.8313.75%75.00%2.6122.32%-7.20%74.34%tra10.38%0.8015.38%76.67%2.4324.46%-10.93%56.91%11.97%16.56%88.33%3.2231.06%-6.42%74.67%xgb12.46%14.81%86.67%3.2928.13%-7.44%76.79%factorvae_new12.09%15.08%85.00%29.77%-5.35%77.55%數(shù)據(jù)來源:東方證券研究所&Wind資訊數(shù)據(jù)來源:東方證券研究所&Wind資訊數(shù)據(jù)來源:東方證券研究所&Wind資訊有關(guān)分析師的申明,見本報告最后部分。其他重要信息披露見分析師申明之后部分,或請與您的投資代表聯(lián)系。并請閱讀本證券研究報告最后一頁的免責(zé)申明。滬深300股票池2020.01.01-2024.12.31rankICrankIC_IR多頭月度勝率多頭日超額收益夏普比多頭日度超額年化收益多頭日度超額收益最大回撤多頭日均單邊換手率dfq2.57%0.223.43%0.2955.00%0.794.19%-10.52%22.97%gp2.46%0.203.19%0.2656.67%0.191.07%-15.41%48.94%rl9857.05%0.399.63%0.5261.67%11.04%-11.78%50.33%tra7.11%0.3110.00%0.4351.67%0.747.82%-19.86%26.64%9.32%0.4711.44%0.5566.67%9.70%-14.59%50.69%xgb7.63%0.408.90%0.4365.00%0.889.23%-16.28%49.03%factorvae_new9.27%0.5011.15%0.5865.00%12.35%-10.78%49.97%數(shù)據(jù)來源:東方證券研究所&Wind資訊數(shù)據(jù)來源:東方證券研究所&Wind資訊數(shù)據(jù)來源:東方證券研究所&Wind資訊有關(guān)分析師的申明,見本報告最后部分。其他重要信息披露見分析師申明之后部分,或請與您的投資代表聯(lián)系。并請閱讀本證券研究報告最后一頁的免責(zé)申明。(3)在中證500股票池中,DFQ-FactorVAE-pro模型所得因子表現(xiàn)十分優(yōu)異,各項指標基中證500股票池2020.01.01-2024.12.31rankICrankIC_IR多頭月度勝率多頭日超額收益夏普比多頭日度超額年化收益多頭日度超額收益最大回撤多頭日均單邊換手率dfq3.25%0.294.98%0.4250.00%0.854.46%-11.18%25.45%gp3.42%0.326.19%0.6355.00%0.763.73%-6.71%47.42%rl9856.32%0.4010.05%0.6161.67%8.59%-8.97%50.05%tra5.97%0.349.94%0.5556.67%0.676.02%-23.26%39.62%7.86%0.4811.47%0.6868.33%14.95%-9.25%53.78%xgb7.80%0.519.62%0.5965.00%12.70%-14.46%55.37%factorvae_new8.51%0.5611.38%0.7570.00%2.0515.20%-6.49%54.25%數(shù)據(jù)來源:東方證券研究所&Wind資訊數(shù)據(jù)來源:東方證券研究所&Wind資訊圖39:中證500股票池factorvae數(shù)據(jù)來源:東方證券研究所&Wind資訊有關(guān)分析師的申明,見本報告最后部分。其他重要信息披露見分析師申明之后部分,或請與您的投資代表聯(lián)系。并請閱讀本證券研究報告最后一頁的免責(zé)申明。多頭日超額收益夏普比3.05,多頭日中證1000股票池2020.01.01-2024.12.31rankICrankIC_IR多頭月度勝率多頭日超額收益夏普比多頭日度超額年化收益多頭日度超額收益最大回撤多頭日均單邊換手率dfq4.51%0.436.02%0.5258.33%0.815.76%-15.98%30.32%gp7.20%0.689.93%0.9958.33%8.20%-6.97%58.62%rl9859.59%0.6812.30%0.8265.00%14.47%-9.88%65.38%tra9.21%0.6212.62%0.7970.00%11.92%-21.24%57.93%11.32%0.8514.43%76.67%2.6925.01%-9.86%69.03%xgb11.28%0.9512.30%75.00%2.2317.53%-9.77%71.23%factorvae_new11.55%0.9713.49%86.67%22.55%-5.92%69.63%數(shù)據(jù)來源:東方證券研究所&Wind資訊數(shù)據(jù)來源:東方證券研究所&Wind資訊數(shù)據(jù)來源:東方證券研究所&Wind資訊有關(guān)分析師的申明,見本報告最后部分。其他重要信息披露見分析師申明之后部分,或請與您的投資代表聯(lián)系。并請閱讀本證券研究報告最后一頁的免責(zé)申明。5.3因子分年績效表現(xiàn)中證全指股票池dfqrankICrankIC_IR多頭月度勝率多頭日超額收益夏普比多頭日度超額年化收益多頭日度超額收益最大回撤多頭日均單邊換手率20206.51%1.299.80%1.7475.00%2.2714.41%-4.22%34.78%20212.45%0.455.18%0.9050.00%0.190.85%-7.92%34.28%20223.75%0.555.12%0.6958.33%1.135.96%-5.59%33.85%20234.57%0.747.09%1.0658.33%0.281.05%-5.59%31.83%20243.24%0.314.10%0.3358.33%1.109.16%-11.41%29.94%gprankICrankIC_IR多頭月度勝率多頭日超額收益夏普比多頭日度超額年化收益多頭日度超額收益最大回撤多頭日均單邊換手率20207.29%0.6911.73%1.1650.00%0.613.10%-4.90%73.52%20215.76%0.6811.41%1.2875.00%3.1018.24%-1.71%71.71%20229.33%1.2011.56%1.9466.67%2.4516.28%-2.67%66.31%20239.05%0.8913.33%1.6591.67%2.9320.64%-2.26%61.43%20247.44%0.718.16%0.6675.00%1.7016.27%-8.95%67.60%rl985rankICrankIC_IR多頭月度勝率多頭日超額收益夏普比多頭日度超額年化收益多頭日度超額收益最大回撤多頭日均單邊換手率202010.50%0.9214.83%1.1766.67%1.249.58%-7.20%74.60%20219.06%0.8914.31%1.1266.67%1.8716.99%-6.19%73.67%202211.86%1.1614.97%1.4983.33%3.9030.47%-2.89%74.13%20238.57%0.5713.53%0.8466.67%2.0112.73%-5.59%72.31%20249.81%0.8111.06%0.7991.67%4.1239.76%-4.40%76.98%trarankICrankIC_IR多頭月度勝率多頭日超額收益夏普比多頭日度超額年化收益多頭日度超額收益最大回撤多頭日均單邊換手率20208.92%0.7114.13%0.9975.00%2.1415.83%-7.81%59.12%202110.01%0.7816.52%1.1766.67%2.4824.47%-4.92%57.52%202212.20%1.2616.17%1.6775.00%2.9926.63%-3.30%56.02%202313.30%0.9220.06%1.4483.33%3.2722.91%-4.65%54.94%20247.43%0.529.66%0.5383.33%2.0227.67%-10.93%56.96%rankICrankIC_IR多頭月度勝率多頭日超額收益夏普比多頭日度超額年化收益多頭日度超額收益最大回撤多頭日均單邊換手率202011.92%0.9916.51%1.1983.33%3.3425.72%-4.88%75.46%202112.04%1.1417.37%1.3183.33%2.9028.13%-5.72%74.40%202214.02%1.5018.04%2.00100.00%4.2936.52%-2.97%70.52%202310.89%0.7917.41%1.2383.33%3.3922.11%-3.39%71.75%202411.07%0.8413.32%0.8191.67%2.8836.75%-6.42%76.22%xgbrankICrankIC_IR多頭月度勝率多頭日超額收益夏普比多頭日度超額年化收益多頭日度超額收益最大回撤多頭日均單邊換手率202013.00%1.2715.29%1.3975.00%2.5318.26%-5.59%80.86%202112.12%1.4415.46%1.4883.33%3.2228.57%-7.44%77.75%202214.03%1.6915.59%2.0391.67%5.2539.30%-2.75%79.38%202311.69%0.9616.22%1.3383.33%1.196.75%-4.64%70.91%202411.53%0.9911.28%0.85100.00%4.0745.66%-5.80%75.04%factorvae_newrankICrankIC_IR多頭月度勝率多頭日超額收益夏普比多頭日度超額年化收益多頭日度超額收益最大回撤多頭日均單邊換手率202011.67%1.0614.61%1.2683.33%3.2523.89%-4.01%79.74%202112.30%1.1915.55%1.2175.00%3.0628.92%-4.62%74.88%202214.07%1.5416.84%1.9891.67%4.9135.58%-2.27%78.84%202311.33%0.9115.91%1.2983.33%4.1620.76%-2.74%76.30%202411.19%0.9212.37%0.8791.67%3.1133.90%-5.35%78.01%數(shù)據(jù)來源:東方證券研究所&Wind資訊有關(guān)分析師的申明,見本報告最后部分。其他重要信息披露見分析師申明之后部分,或請與您的投資代表聯(lián)系。并請閱讀本證券研究報告最后一頁的免責(zé)申明。滬深300股票池dfqrankICrankIC_IR多頭月度勝率多頭日超額收益夏普比多頭日度超額年化收益多頭日度超額收益最大回撤多頭日均單邊換手率20206.70%0.868.27%0.9583.33%3.3217.85%-3.73%22.64%20211.08%0.113.00%0.3058.33%0.180.88%-5.55%24.31%20220.82%0.090.84%0.0958.33%1.578.22%-3.55%23.75%20232.29%0.202.89%0.2533.33%-0.29-1.44%-5.49%20.97%20241.98%0.112.09%0.1341.67%-0.77-3.92%-10.14%23.19%gprankICrankIC_IR多頭月度勝率多頭日超額收益夏普比多頭日度超額年化收益多頭日度超額收益最大回撤多頭日均單邊換手率20204.98%0.477.22%0.7675.00%1.397.75%-5.12%56.25%2021-0.29%-0.031.99%0.1833.33%-0.40-3.46%-8.16%50.69%2022-1.60%-0.14-1.83%-0.1533.33%-1.26-7.86%-10.74%48.47%20233.56%0.352.93%0.2783.33%0.974.93%-3.18%40.00%20245.89%0.385.76%0.3958.33%0.754.66%-3.86%49.31%rl985rankICrankIC_IR多頭月度勝率多頭日超額收益夏普比多頭日度超額年化收益多頭日度超額收益最大回撤多頭日均單邊換手率20203.86%0.235.92%0.3266.67%1.057.67%-6.72%52.78%20215.87%0.389.46%0.5833.33%-0.03-0.66%-6.94%45.14%20228.06%0.539.72%0.5966.67%2.5019.95%-5.86%49.31%20237.53%0.3812.18%0.6866.67%1.368.28%-4.17%51.25%202410.14%0.4810.94%0.4875.00%1.4519.14%-11.78%53.19%trarankICrankIC_IR多頭月度勝率多頭日超額收益夏普比多頭日度超額年化收益多頭日度超額收益最大回撤多頭日均單邊換手率20205.52%0.348.44%0.5150.00%1.3412.24%-8.04%28.47%20216.04%0.2910.45%0.5241.67%0.524.44%-12.06%30.14%20227.12%0.309.03%0.3650.00%1.1010.83%-9.69%29.58%2

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論