下載本文檔
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
探討量化投資新手在執(zhí)行回測(cè)和建立量化模型時(shí)應(yīng)時(shí)刻注意的七個(gè)“大坑”。其中,有些誤區(qū)可能很常見,但其影響力卻往往被人忽略,有些誤區(qū)可能在學(xué)術(shù)界和實(shí)踐者的研究中司空見慣,通常我們也把他們視為理所當(dāng)然。1、幸存者偏差(Survivorshipbias)幸存者偏差是投資者面對(duì)的最普遍問題之一,而且很多人都知道幸存者偏差的存在,但很少人重視它所產(chǎn)生的效果。我們?cè)诨販y(cè)的時(shí)候傾向于只使用當(dāng)前尚存在的公司,這就意味我們剔除了那些因?yàn)槠飘a(chǎn)、重組而退市的公司的所產(chǎn)生的影響。在對(duì)歷史數(shù)據(jù)進(jìn)行調(diào)整時(shí),一些破產(chǎn)、退市、表現(xiàn)不佳的股票定期都會(huì)被剔除。而這些被剔除的股票沒有出現(xiàn)在你策略的股票池里,也就是說(shuō)對(duì)過去做了回測(cè)時(shí)只利用了現(xiàn)在成分股的信息,剔除了那些在未來(lái)因?yàn)闃I(yè)績(jī)或者股價(jià)表現(xiàn)不好而被剔除出成分股中股票的影響。也就是說(shuō)當(dāng)我們使用過去30年中表現(xiàn)較好的那些公司進(jìn)行回測(cè)時(shí),即便一些公司當(dāng)時(shí)的信用風(fēng)險(xiǎn)高,當(dāng)你知道誰(shuí)會(huì)幸存下來(lái)時(shí),于是在信用風(fēng)險(xiǎn)高或者陷入困境時(shí)買入,收益非常高。若考慮進(jìn)那些破產(chǎn)、退市、表現(xiàn)不佳的股票后,結(jié)論則會(huì)完全相反,投資高信用風(fēng)險(xiǎn)企業(yè)的收益率長(zhǎng)期遠(yuǎn)低于信用穩(wěn)健的企業(yè)。2、前視偏差(Look-aheadbias)前視偏差,也被稱為前瞻性偏差或Look-aheadbias,是一種常見于研究和模擬過程中的偏差。當(dāng)研究或模擬依賴于在研究期間尚未獲得的數(shù)據(jù)信息時(shí),就可能發(fā)生這種偏差。例如,在量化投資策略的回測(cè)中,如果使用了回測(cè)當(dāng)時(shí)還不可用或者還沒有公開的數(shù)據(jù),就可能導(dǎo)致前視偏差的產(chǎn)生。前視偏差可以導(dǎo)致研究或模擬的結(jié)果不準(zhǔn)確,這是因?yàn)樗赡苁雇顿Y者對(duì)過去的成分股的影響力過大,從而影響投資高信用風(fēng)險(xiǎn)企業(yè)的收益率和預(yù)測(cè)力。此外,這種偏差還可能在訓(xùn)練模型以訪問將來(lái)的數(shù)據(jù)時(shí)引起,進(jìn)而影響模型的性能和真實(shí)性。在我們進(jìn)行回測(cè)的時(shí)間點(diǎn),終值往往尚無(wú)可知,只能使用初始值進(jìn)行分析。可能有些人認(rèn)為微小的修正并不會(huì)影響結(jié)論,但實(shí)際情況顯示:很多宏觀數(shù)據(jù)根據(jù)初值進(jìn)行回歸結(jié)果并不顯著,公司財(cái)務(wù)數(shù)據(jù)的調(diào)整將對(duì)選股結(jié)果產(chǎn)生直接影響。3、講故事(Thesinofstorytelling)一些人喜歡沒有任何數(shù)據(jù)就開始講故事,做量化的人喜歡拿著數(shù)據(jù)和結(jié)果講故事。兩種情況有很多類似之處,擅長(zhǎng)講故事的人或者說(shuō)擅長(zhǎng)解釋數(shù)據(jù)結(jié)果的人往往在得到數(shù)據(jù)之前,內(nèi)心已經(jīng)存在既定的腳本,只需要找到數(shù)據(jù)支撐即可?;仡?997年-2000年和2000年-2002年兩段時(shí)間的美國(guó)科技成分股和Russell3000指數(shù),我們會(huì)發(fā)現(xiàn)一個(gè)截然相反的結(jié)論。從1997-2000年間的美國(guó)科技成分股來(lái)看,利潤(rùn)率是一個(gè)很好的因子,且回測(cè)結(jié)果也十分可信,然而如果拉長(zhǎng)時(shí)間區(qū)間到2002年,我們會(huì)發(fā)現(xiàn)利潤(rùn)率指標(biāo)不再是一個(gè)好的因子。但從Russell3000指數(shù)的市場(chǎng)表現(xiàn)來(lái)看,我們卻得到了相反的結(jié)論,利潤(rùn)率指標(biāo)仍然是一個(gè)有效的因子,可見,股票池的選取和回測(cè)的時(shí)間長(zhǎng)短對(duì)因子的有效性判斷影響非常大。所以講故事的人并不能得到正確的結(jié)論。市場(chǎng)中每天都在發(fā)現(xiàn)新的“好因子”,尋找永動(dòng)機(jī)。能夠發(fā)布出來(lái)的策略都是回測(cè)表現(xiàn)良好的。雖然講故事的人對(duì)歷史的解釋非常動(dòng)聽,但其對(duì)未來(lái)的預(yù)測(cè)幾乎沒用。金融經(jīng)濟(jì)中的相關(guān)性和因果性往往很難弄得清楚明白,所以,當(dāng)我們做出和常識(shí)相?;蚴呛驮瓉?lái)判斷相符的結(jié)果時(shí),最好不要去做一名講故事的人。4、數(shù)據(jù)挖掘(Datamininganddatasnooping)數(shù)據(jù)挖掘可以說(shuō)是目前備受關(guān)注的領(lǐng)域,基于海量的數(shù)據(jù)與計(jì)算機(jī)的算力支持,人們往往希望能夠得到難以察覺的“好因子”。但是原有的金融數(shù)據(jù)還未及海量,且交易數(shù)據(jù)并不滿足“低噪音”的數(shù)據(jù)前提。有時(shí)數(shù)據(jù)挖掘幾乎是無(wú)效的。例如,我們對(duì)標(biāo)普500指數(shù)采用兩種不同的因子加權(quán)算法建模,選擇2009-2014年數(shù)據(jù)進(jìn)行回測(cè)。結(jié)果顯示,采用2009-2014年數(shù)據(jù)篩選出6個(gè)表現(xiàn)較好的因子,使用等權(quán)重算法進(jìn)行回測(cè)的結(jié)果非常完美,而采用歷史數(shù)據(jù)進(jìn)行樣本外回測(cè)的結(jié)果卻是一條直線。5、信號(hào)衰減、換手率、交易成本信號(hào)衰減是指一個(gè)因子產(chǎn)生后對(duì)未來(lái)股票回報(bào)的預(yù)測(cè)能力,其持續(xù)時(shí)間的長(zhǎng)短是一個(gè)重要指標(biāo)。換手率和信號(hào)衰減之間存在密切的關(guān)系,一般來(lái)說(shuō),換手率越高,信號(hào)衰減的速度越快。不同的股票選擇因子具有不同的信息衰減特征。那些越快衰減的信號(hào),往往需要更高的換手率去獲取收益。然而,這并非沒有代價(jià)。較高的換手率可能會(huì)帶來(lái)較高的交易成本,對(duì)于一些量化信號(hào)表現(xiàn)強(qiáng)勁但換手率高的策略來(lái)說(shuō),由于交易成本過高,可能根本無(wú)法盈利。交易成本包括傭金、過戶費(fèi)等費(fèi)用。例如,大部分券商的傭金起征點(diǎn)是5元,在傭金率為萬(wàn)2.5的前提下,單筆委托的最低門檻為2萬(wàn)元。此外,現(xiàn)在已取消上交所1000股1元的最低過戶費(fèi),統(tǒng)一為十萬(wàn)分之2,即在單筆大于2萬(wàn)元時(shí),買入交易成本為萬(wàn)2.7。因此,投資者在進(jìn)行量化投資時(shí),不僅需要考慮信號(hào)衰減和換手率對(duì)策略的影響,也需要充分認(rèn)識(shí)到交易成本的重要性。6、異常值(Outliers)異常值,也被稱為離群值,是指在數(shù)據(jù)集中偏離其他觀測(cè)值的數(shù)值。具體來(lái)說(shuō),如果一組測(cè)定值中與平均值的偏差超過兩倍標(biāo)準(zhǔn)差,或者與平均值的偏差超過三倍標(biāo)準(zhǔn)差的測(cè)定值,那么這些測(cè)定值就被稱為異常值或高度異常的異常值。異常值可能會(huì)影響數(shù)據(jù)分析的結(jié)果,因此在進(jìn)行數(shù)據(jù)分析時(shí),需要對(duì)異常值進(jìn)行檢測(cè)和處理。處理方法通常包括刪除、視為缺失值和平均值修正等。此外,也有一些常見的異常值檢測(cè)方法,如NumericOutlier、Z-Score、DBSCAN和IsolationForest等。然而,需要注意的是,并不是所有的異常值都是無(wú)效的或錯(cuò)誤的,有時(shí)候它們可能包含有
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025購(gòu)銷合同書下載范文
- 2025機(jī)械(設(shè)備)租賃合同
- 二零二五年度全新托管班教學(xué)質(zhì)量監(jiān)控合同3篇
- 2025年度公司設(shè)立前股東共同管理細(xì)則協(xié)議3篇
- 二零二五年度委托監(jiān)護(hù)與協(xié)議監(jiān)護(hù)生活照料安全保障全面服務(wù)合同2篇
- 二零二五年度農(nóng)產(chǎn)品市場(chǎng)開拓與推廣合同3篇
- 二零二五年度加油站防火門定期檢查與快速更換服務(wù)協(xié)議3篇
- 2025年度公司與施工隊(duì)基礎(chǔ)設(shè)施建設(shè)項(xiàng)目施工合同3篇
- 2025年度保險(xiǎn)公司與災(zāi)害應(yīng)急救援合作保障協(xié)議3篇
- 二零二五年度養(yǎng)殖場(chǎng)養(yǎng)殖技術(shù)研發(fā)用工合同3篇
- 2024-2025學(xué)年 數(shù)學(xué)二年級(jí)上冊(cè)冀教版期末測(cè)試卷(含答案)
- 2024年1月遼寧省普通高中學(xué)業(yè)水平合格性考試物理試題(含答案解析)
- 期末測(cè)試卷(試題)-2024-2025學(xué)年四年級(jí)上冊(cè)數(shù)學(xué)滬教版
- 初次申領(lǐng)《南京市建筑業(yè)企業(yè)信用管理手冊(cè)(電子版)》辦事
- 某冶金機(jī)械修造廠總降壓變電所及配電系統(tǒng)設(shè)計(jì)
- 中國(guó)移動(dòng)呼叫中心運(yùn)營(yíng)管理指標(biāo)體系
- 泰安市生育保險(xiǎn)待遇申報(bào)表
- 5WHY分析報(bào)告模板-改進(jìn)版
- 移動(dòng)式虹吸管防汛搶險(xiǎn)設(shè)備(移動(dòng)式虹吸搶險(xiǎn)泵)
- 魯教版選修《將軍族》原文閱讀
- FAF、PAF型電站動(dòng)葉可調(diào)軸流式送風(fēng)機(jī)、一次風(fēng)機(jī)安裝和使用維護(hù)說(shuō)明書B本(1)
評(píng)論
0/150
提交評(píng)論