ai時代我們在金融投資方面做了這些嘗試…_第1頁
ai時代我們在金融投資方面做了這些嘗試…_第2頁
ai時代我們在金融投資方面做了這些嘗試…_第3頁
ai時代我們在金融投資方面做了這些嘗試…_第4頁
ai時代我們在金融投資方面做了這些嘗試…_第5頁
全文預覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、AI時代,我們在金融投資方面做了這些嘗試金融科技的到來,不僅代表著技術(shù)上的飛躍,更是對金 融服務(wù)模式的顛覆和創(chuàng)新。 隨著AI的發(fā)展和普及,量化交易 也步入了智能交易的新高度。金融投資的核心在于追求收益, 而人工智能的分析和預測能力恰如其分地滿足了投資的要 求。讓我們就AI在金融投資方面的應用進行設(shè)想:證券長 短期價格區(qū)間的預測量化策略模型的研發(fā)(高/低頻)證券的擇股和擇時的優(yōu)化大類資產(chǎn)的配置證券投資組合的 優(yōu)化證券風險特征識別機器學習分為淺層機器學習和深度學習,傳統(tǒng)的淺層學習中 決策樹、樸素貝葉斯、支持向量機和淺層神經(jīng)網(wǎng)絡(luò)等等也都 是金融工程中常用的一些方法。作為金融科技的開拓者,恒 生研究院

2、就人工智能在量化交易領(lǐng)域進行了一系列的創(chuàng)新 嘗試。基于小波神經(jīng)網(wǎng)絡(luò)對時間序列進行預測人工智能有監(jiān) 督機器學習的模式中,有兩大類學習模型:分類和回歸預測, 而在金融投資或者說量化交易中,對于時間序列的預測最為 直觀。小波分析是指通過高低頻通道來將時序數(shù)據(jù)分解為高頻部 分和低頻部分,進行多尺度細化分析,目前對于時序/頻域的 預測已經(jīng)取得了一些有意義的成果。將小波分析和神經(jīng)網(wǎng)絡(luò)結(jié)合起來,構(gòu)建小波神經(jīng)網(wǎng)絡(luò)( Wavelet Neural Network , WNN),可以對時序數(shù)據(jù)進行預測分析。WNN是將神經(jīng)網(wǎng)絡(luò)隱節(jié)點的激活函數(shù)由小波函數(shù)來替代,相應的輸入層到隱 含層的權(quán)值及隱含層的閾值分別由小波函數(shù)

3、的尺度伸縮因 子和時間平移因子所代替,這是應用最廣泛的緊致型結(jié)合。如下圖所示我們用小波神經(jīng)網(wǎng)絡(luò)做的HS300的預測,使用2010.12015.8 滬深300指數(shù)的日行情數(shù)據(jù)進行模型訓練, 使用2015.92016.8的日行情數(shù)據(jù)進行測試驗證。有監(jiān)督的學習要取得較好的應用效果,具和機器學習的訓練過程直接 相關(guān)。這一過程中還是要投資者較深地介入數(shù)據(jù)的預處理, 進行培訓數(shù)據(jù)樣本的特征標簽標定或?qū)τ柧氁?guī)則給由方向 性指引。通常量化交易的團隊資源要更深入地去發(fā)掘更好的 特征。因此,人工設(shè)計樣本特征,不是一個容易的可擴展的 途徑。上面我們判別市場短期走勢的案例中,所定義的特征 是否合適?我們也比較難評判,

4、也許會有更好的特征可以刻 畫證券市場的走勢。 讓機器學習幫我們找到合適的量化策略市場千變?nèi)f化,很難找到合適的特征去進行機器學習,那么 是否我們能通過機器學習的方法去尋找合適的量化策略,替 代自己總結(jié)的方式呢?技術(shù)指標千差萬別,股票市場價、量、時、空的數(shù)據(jù)也是海 量的,在這樣龐大的數(shù)據(jù)基礎(chǔ)上,尋找和優(yōu)化量化技術(shù)指標也是比較困難的?;谶M化理論的遺傳算法可以較好地針對 預定問題,用解決全局最優(yōu)解的方式尋找性能瓶頸,在對傳 統(tǒng)技術(shù)指標因子和基本面因子進行交易信號的整合上,也可 以發(fā)揮很好的作用。通過遺傳算法可以獲得在訓練集上較好 表現(xiàn)的量化技術(shù)模型,雖然遺傳算法得到的是類似黑箱的量 化技術(shù)模型,但模

5、型背后隱含著關(guān)于時間序列的深刻的數(shù)學 含義。上面這個就是機器通過遺傳規(guī)劃的方法,尋找由來的 模型。訓練集我們采用了 20062010的數(shù)據(jù)一一深100ETF , 通過機器訓練,系統(tǒng)能夠找到勝率在 70%、盈虧比接近6的 策略,策略的年化夏普率超過了1.5。為了考察策略的泛化能力,我們采用2014.12016.8的深100ETF數(shù)據(jù)進行測試驗證。下圖是在20142016的測試集 上的效果,發(fā)現(xiàn)測試能力還是具備一定的可驗證性。在測試 集上的年化夏普率甚至超過了2。為了進一步考察模型的泛化能力,我們使用 50ETF的數(shù)據(jù) 進行驗證,50和深100在走勢上還是有較大的差異的。上面是50ETF的測試效果

6、,雖然比 100ETF要差,但還是 可以接受的一種模型。后續(xù),我們希望將“遺傳算法在量化技術(shù)指標的優(yōu)化”這一應 用成果形成智能策略服務(wù)平臺,為廣大投資者提供適合自己 投資風格的量化技術(shù)模型。從圖像中識別證券發(fā)展趨勢圖形屬于非結(jié)構(gòu)化數(shù)據(jù),傳統(tǒng)的金融工程很難運用非結(jié)構(gòu)數(shù) 據(jù)。利用圖像識別的方法,將圖形數(shù)據(jù)應用于 CNN學習網(wǎng) 絡(luò)是否是一個可行的量化分析方法?盤感好的高手可以通 過看K線圖,用較難量化的模糊模式識別由證券未來的走勢 可能。圍棋為什么難?因為它需要人類通過直觀判斷盤面而進行 行動,和投資者根據(jù) K線圖進行投資行為很相像。那么,是 否也可以通過 CNN的方法,讓機器自己從這張圖中提取由

7、有用的特征?為此,我們應用了標普500從1962年到現(xiàn)在的13768個日K線數(shù)據(jù),生成120根K線加20、60、120、 240的均線,和成交量的1366張圖片以及20根K加各均線 的6000多張圖片,對 CNN進行訓練。最終,120天K線 數(shù)據(jù)圖片識別未來10日收益率的10分類勝率只有30%左 右,20天較短周期的K線圖識別勝率在40%左右。雖然top5 的勝率是接近95% 了,但如果簡單做成2分類,目前看沒有 比傳統(tǒng)的金融工程方法更優(yōu),或許幾千張圖片對于深度學習 來說數(shù)據(jù)量也還是欠缺。心得:那些在機器學習訓練中的技 巧人工智能應用于預測和分類中最棘手的問題就是對于歷史 數(shù)據(jù)的“過擬合”?!?/p>

8、過擬合”的表現(xiàn)是模型在訓練集上表現(xiàn)得非 常好,但在不同于訓練集的測試數(shù)據(jù)上則表現(xiàn)較差。如果把 模型在訓練集和測試集上的模型精度畫一個圖,會發(fā)現(xiàn)隨著模型訓練的迭代,在訓練集上的精度會不斷提高,但在測試 集上的精度是先逐漸提高,后來卻隨著訓練的進展而不斷下 降。解決模型訓練的過擬合,首先就是early stopping ,即在每一個epoch結(jié)束時計算測試集的模型精度,當精度不再提高時,就停止訓練。這是很自然的做法,因為精度不再提高, 訓練下去也沒用;其次是數(shù)據(jù)的擴充,避免過擬合最根本的還是需要海量的 訓練數(shù)據(jù),數(shù)據(jù)能夠覆蓋各種各樣的場景。并通過隨機洗牌 來減少數(shù)據(jù)之間的自相關(guān)性。當然海量數(shù)據(jù)本身

9、的獲取和特 征化提取,也是一個非常困難的事情;再者是模型連接和懲罰項參數(shù)的調(diào)整,如正則化和DropOut/Drop Connect ,這兩者其實本質(zhì)上是簡化深度神經(jīng)網(wǎng)絡(luò) 模型的復雜程度,為使模型具備一定的稀疏性,刻意地將代 價函數(shù)加上懲罰項,以及減少深度神經(jīng)網(wǎng)絡(luò)模型的連接。通 過簡化機器學習的模型,的確可以避免模型過分依賴于訓練 集上的數(shù)據(jù)表現(xiàn);最后則是學習速率和梯度下降參數(shù)。關(guān)于梯度下降,這方 面有Momentum、NAG、AdaGrad 等各種優(yōu)化模型,實踐 中基本采用Mini-Batch的隨機梯度下降方法。另外,怎么粗略地確定一個比較好的學習速率呢?好像也只能通過嘗試??梢韵劝褜W習速率設(shè)置為較小值,然后觀察training cost的走向,如果cost在減小,那你可以逐步地調(diào)大學習速率,如果cost在增大,那就得減小學習速率。經(jīng)過一番嘗試之后, 可以大概確定學習速率的合

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論