七大量化策略的幾大誤區(qū)_第1頁(yè)
七大量化策略的幾大誤區(qū)_第2頁(yè)
七大量化策略的幾大誤區(qū)_第3頁(yè)
七大量化策略的幾大誤區(qū)_第4頁(yè)
七大量化策略的幾大誤區(qū)_第5頁(yè)
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

探討量化投資新手在執(zhí)行回測(cè)和建立量化模型時(shí)應(yīng)時(shí)刻注意的七個(gè)“大坑”。其中,有些誤區(qū)可能很常見,但其影響力卻往往被人忽略,有些誤區(qū)可能在學(xué)術(shù)界和實(shí)踐者的研究中司空見慣,通常我們也把他們視為理所當(dāng)然。1、幸存者偏差(Survivorshipbias)幸存者偏差是投資者面對(duì)的最普遍問題之一,而且很多人都知道幸存者偏差的存在,但很少人重視它所產(chǎn)生的效果。我們?cè)诨販y(cè)的時(shí)候傾向于只使用當(dāng)前尚存在的公司,這就意味我們剔除了那些因?yàn)槠飘a(chǎn)、重組而退市的公司的所產(chǎn)生的影響。在對(duì)歷史數(shù)據(jù)進(jìn)行調(diào)整時(shí),一些破產(chǎn)、退市、表現(xiàn)不佳的股票定期都會(huì)被剔除。而這些被剔除的股票沒有出現(xiàn)在你策略的股票池里,也就是說(shuō)對(duì)過去做了回測(cè)時(shí)只利用了現(xiàn)在成分股的信息,剔除了那些在未來(lái)因?yàn)闃I(yè)績(jī)或者股價(jià)表現(xiàn)不好而被剔除出成分股中股票的影響。也就是說(shuō)當(dāng)我們使用過去30年中表現(xiàn)較好的那些公司進(jìn)行回測(cè)時(shí),即便一些公司當(dāng)時(shí)的信用風(fēng)險(xiǎn)高,當(dāng)你知道誰(shuí)會(huì)幸存下來(lái)時(shí),于是在信用風(fēng)險(xiǎn)高或者陷入困境時(shí)買入,收益非常高。若考慮進(jìn)那些破產(chǎn)、退市、表現(xiàn)不佳的股票后,結(jié)論則會(huì)完全相反,投資高信用風(fēng)險(xiǎn)企業(yè)的收益率長(zhǎng)期遠(yuǎn)低于信用穩(wěn)健的企業(yè)。2、前視偏差(Look-aheadbias)前視偏差,也被稱為前瞻性偏差或Look-aheadbias,是一種常見于研究和模擬過程中的偏差。當(dāng)研究或模擬依賴于在研究期間尚未獲得的數(shù)據(jù)信息時(shí),就可能發(fā)生這種偏差。例如,在量化投資策略的回測(cè)中,如果使用了回測(cè)當(dāng)時(shí)還不可用或者還沒有公開的數(shù)據(jù),就可能導(dǎo)致前視偏差的產(chǎn)生。前視偏差可以導(dǎo)致研究或模擬的結(jié)果不準(zhǔn)確,這是因?yàn)樗赡苁雇顿Y者對(duì)過去的成分股的影響力過大,從而影響投資高信用風(fēng)險(xiǎn)企業(yè)的收益率和預(yù)測(cè)力。此外,這種偏差還可能在訓(xùn)練模型以訪問將來(lái)的數(shù)據(jù)時(shí)引起,進(jìn)而影響模型的性能和真實(shí)性。在我們進(jìn)行回測(cè)的時(shí)間點(diǎn),終值往往尚無(wú)可知,只能使用初始值進(jìn)行分析。可能有些人認(rèn)為微小的修正并不會(huì)影響結(jié)論,但實(shí)際情況顯示:很多宏觀數(shù)據(jù)根據(jù)初值進(jìn)行回歸結(jié)果并不顯著,公司財(cái)務(wù)數(shù)據(jù)的調(diào)整將對(duì)選股結(jié)果產(chǎn)生直接影響。3、講故事(Thesinofstorytelling)一些人喜歡沒有任何數(shù)據(jù)就開始講故事,做量化的人喜歡拿著數(shù)據(jù)和結(jié)果講故事。兩種情況有很多類似之處,擅長(zhǎng)講故事的人或者說(shuō)擅長(zhǎng)解釋數(shù)據(jù)結(jié)果的人往往在得到數(shù)據(jù)之前,內(nèi)心已經(jīng)存在既定的腳本,只需要找到數(shù)據(jù)支撐即可?;仡?997年-2000年和2000年-2002年兩段時(shí)間的美國(guó)科技成分股和Russell3000指數(shù),我們會(huì)發(fā)現(xiàn)一個(gè)截然相反的結(jié)論。從1997-2000年間的美國(guó)科技成分股來(lái)看,利潤(rùn)率是一個(gè)很好的因子,且回測(cè)結(jié)果也十分可信,然而如果拉長(zhǎng)時(shí)間區(qū)間到2002年,我們會(huì)發(fā)現(xiàn)利潤(rùn)率指標(biāo)不再是一個(gè)好的因子。但從Russell3000指數(shù)的市場(chǎng)表現(xiàn)來(lái)看,我們卻得到了相反的結(jié)論,利潤(rùn)率指標(biāo)仍然是一個(gè)有效的因子,可見,股票池的選取和回測(cè)的時(shí)間長(zhǎng)短對(duì)因子的有效性判斷影響非常大。所以講故事的人并不能得到正確的結(jié)論。市場(chǎng)中每天都在發(fā)現(xiàn)新的“好因子”,尋找永動(dòng)機(jī)。能夠發(fā)布出來(lái)的策略都是回測(cè)表現(xiàn)良好的。雖然講故事的人對(duì)歷史的解釋非常動(dòng)聽,但其對(duì)未來(lái)的預(yù)測(cè)幾乎沒用。金融經(jīng)濟(jì)中的相關(guān)性和因果性往往很難弄得清楚明白,所以,當(dāng)我們做出和常識(shí)相?;蚴呛驮瓉?lái)判斷相符的結(jié)果時(shí),最好不要去做一名講故事的人。4、數(shù)據(jù)挖掘(Datamininganddatasnooping)數(shù)據(jù)挖掘可以說(shuō)是目前備受關(guān)注的領(lǐng)域,基于海量的數(shù)據(jù)與計(jì)算機(jī)的算力支持,人們往往希望能夠得到難以察覺的“好因子”。但是原有的金融數(shù)據(jù)還未及海量,且交易數(shù)據(jù)并不滿足“低噪音”的數(shù)據(jù)前提。有時(shí)數(shù)據(jù)挖掘幾乎是無(wú)效的。例如,我們對(duì)標(biāo)普500指數(shù)采用兩種不同的因子加權(quán)算法建模,選擇2009-2014年數(shù)據(jù)進(jìn)行回測(cè)。結(jié)果顯示,采用2009-2014年數(shù)據(jù)篩選出6個(gè)表現(xiàn)較好的因子,使用等權(quán)重算法進(jìn)行回測(cè)的結(jié)果非常完美,而采用歷史數(shù)據(jù)進(jìn)行樣本外回測(cè)的結(jié)果卻是一條直線。5、信號(hào)衰減、換手率、交易成本信號(hào)衰減是指一個(gè)因子產(chǎn)生后對(duì)未來(lái)股票回報(bào)的預(yù)測(cè)能力,其持續(xù)時(shí)間的長(zhǎng)短是一個(gè)重要指標(biāo)。換手率和信號(hào)衰減之間存在密切的關(guān)系,一般來(lái)說(shuō),換手率越高,信號(hào)衰減的速度越快。不同的股票選擇因子具有不同的信息衰減特征。那些越快衰減的信號(hào),往往需要更高的換手率去獲取收益。然而,這并非沒有代價(jià)。較高的換手率可能會(huì)帶來(lái)較高的交易成本,對(duì)于一些量化信號(hào)表現(xiàn)強(qiáng)勁但換手率高的策略來(lái)說(shuō),由于交易成本過高,可能根本無(wú)法盈利。交易成本包括傭金、過戶費(fèi)等費(fèi)用。例如,大部分券商的傭金起征點(diǎn)是5元,在傭金率為萬(wàn)2.5的前提下,單筆委托的最低門檻為2萬(wàn)元。此外,現(xiàn)在已取消上交所1000股1元的最低過戶費(fèi),統(tǒng)一為十萬(wàn)分之2,即在單筆大于2萬(wàn)元時(shí),買入交易成本為萬(wàn)2.7。因此,投資者在進(jìn)行量化投資時(shí),不僅需要考慮信號(hào)衰減和換手率對(duì)策略的影響,也需要充分認(rèn)識(shí)到交易成本的重要性。6、異常值(Outliers)異常值,也被稱為離群值,是指在數(shù)據(jù)集中偏離其他觀測(cè)值的數(shù)值。具體來(lái)說(shuō),如果一組測(cè)定值中與平均值的偏差超過兩倍標(biāo)準(zhǔn)差,或者與平均值的偏差超過三倍標(biāo)準(zhǔn)差的測(cè)定值,那么這些測(cè)定值就被稱為異常值或高度異常的異常值。異常值可能會(huì)影響數(shù)據(jù)分析的結(jié)果,因此在進(jìn)行數(shù)據(jù)分析時(shí),需要對(duì)異常值進(jìn)行檢測(cè)和處理。處理方法通常包括刪除、視為缺失值和平均值修正等。此外,也有一些常見的異常值檢測(cè)方法,如NumericOutlier、Z-Score、DBSCAN和IsolationForest等。然而,需要注意的是,并不是所有的異常值都是無(wú)效的或錯(cuò)誤的,有時(shí)候它們可能包含有

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論