基本面量化系列:基于機構(gòu)調(diào)研問答文本的行業(yè)輪動策略_第1頁
基本面量化系列:基于機構(gòu)調(diào)研問答文本的行業(yè)輪動策略_第2頁
基本面量化系列:基于機構(gòu)調(diào)研問答文本的行業(yè)輪動策略_第3頁
基本面量化系列:基于機構(gòu)調(diào)研問答文本的行業(yè)輪動策略_第4頁
基本面量化系列:基于機構(gòu)調(diào)研問答文本的行業(yè)輪動策略_第5頁
已閱讀5頁,還剩36頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

2022/8/252022/9/252022/10/252022/11/252022/12/252023/1/252023/2/252023/3/252023/4/252023/5/252023/6/252023/7/252023/82022/8/252022/9/252022/10/252022/11/252022/12/252023/1/252023/2/252023/3/252023/4/252023/5/252023/6/252023/7/252023/8/25證券研究報告·策略深度基于機構(gòu)調(diào)研問答文本的行業(yè)輪動策略核心結(jié)論機構(gòu)調(diào)研文本蘊含了機構(gòu)投資者和上市公司的關(guān)注點和情緒,能揭示市場的熱點、關(guān)注焦點和投資趨勢。本文首先對機構(gòu)調(diào)研問題文本和回答文本進行了描述性統(tǒng)計,接著介紹了如何從文本到詞匯再到頻率,一步步地構(gòu)建行業(yè)的熱度時間序列,從而反映出行業(yè)的熱度變化。最后,本文基于行業(yè)熱度構(gòu)建了行業(yè)輪動策略,年化超額收益為6.84%,信息比率為0.88。策略在今年上半年配置了通信和傳媒行業(yè),識別出了最新GPT技術(shù)的進步所引發(fā)的行業(yè)熱度變化。投資者對市場焦點的關(guān)注度不斷提高,機構(gòu)調(diào)研問答明細日益詳盡機構(gòu)調(diào)研問答明細是指調(diào)研機構(gòu)在深入調(diào)研上市公司時,所提出的問題以及被調(diào)研公司的回答,這些問答明細對于評估公司的經(jīng)營狀況和財務(wù)健康提供了重要依據(jù)。值得注意的是,調(diào)研文本長度保持著穩(wěn)定上升的趨勢,產(chǎn)生的非結(jié)構(gòu)化數(shù)據(jù)量巨大,如何利用這些大規(guī)模文本數(shù)據(jù)挖掘隱藏的關(guān)鍵信息和市場趨勢,以構(gòu)建有效的投資策略,成為投資者亟需解決的問題?;跈C構(gòu)調(diào)研問答文本量化行業(yè)詞匯熱度本文基于機構(gòu)調(diào)研問答文本,旨在挖掘投資者與上市公司的關(guān)注焦點,找出適應(yīng)熱點變化的有效投資信號。通過量化分析的路徑,我們將從文本中提取關(guān)鍵詞,進而計算詞頻和熱度值,最終建立行業(yè)熱度時間序列?;跈C構(gòu)調(diào)研問答文本的行業(yè)輪動策略本文基于2012年12月31日至2023年8月11日中所有交易日的中國A股機構(gòu)調(diào)研問答明細,構(gòu)建了行業(yè)輪動策略。通過對熱度時間序列進行平均化、相對化、平滑降噪,以周度差的形式構(gòu)建了最終的回測因子。在數(shù)據(jù)處理后,回測區(qū)間為2013年3月15日至8月11日,以全行業(yè)等權(quán)作為業(yè)績基準,行業(yè)輪動策略的年化超額收益為6.84%,信息比率為0.88,并且今年上半年的幾個月里配置了通信和傳媒行業(yè),有效反映了近期GPT技術(shù)的進步所帶來的行業(yè)熱度變化。風險提示:模型統(tǒng)計均基于歷史數(shù)據(jù)、歷史規(guī)律可能失效。王程暢hangcsccomcn821601研究助理:徐建華anhuacsccomcn日本報告由中信建投證券股份有限公司在中華人民共和國(僅為本報告目的,不包括香港、澳門、臺灣)提供。在遵守適用的法律法規(guī)情況下,本報告亦可能由中信建投(國際)證券有限公司在香港提供。同時請務(wù)必閱讀正文之后的免責條款和聲明。市市場表現(xiàn)%0%-5%-10%-15% 萬得全A相關(guān)研究報告研對行業(yè)輪動和選股的啟示基于低頻擁擠度規(guī)避高景氣行業(yè)下行風險數(shù)據(jù)的行業(yè)輪動策略基本面數(shù)據(jù)的行業(yè)輪動策略8.10.08.241策策略研究告一)前言 3 二)機構(gòu)調(diào)研文本數(shù)據(jù)統(tǒng)計分析 4 三)機構(gòu)調(diào)研文本的關(guān)鍵詞提取 7四)基于機構(gòu)調(diào)研文本的股票因子與指數(shù)因子構(gòu)造 8五)基于機構(gòu)調(diào)研問答明細的行業(yè)輪動策略 9 六)總結(jié) 19七)模型風險分析 19圖表1:調(diào)研問題類型占比及變化情況(數(shù)據(jù)截止至2023年8月) 3 圖表3:機構(gòu)調(diào)研問答文本的總體長度分布-問題文本長度(左)&回答文本長度(右)(數(shù)據(jù)截止至2023年8月) 5圖表4:機構(gòu)調(diào)研被提問次數(shù)排行前十個股(數(shù)據(jù)截止至2023年8月) 5圖表5:機構(gòu)調(diào)研文本長度的中位數(shù)-問題文本(上)&回答文本(下)(數(shù)據(jù)截止至2023年8月)6........................................................................................................7圖表7:剔除停用詞后的問題詞云圖(左)&回答詞云圖(右)(數(shù)據(jù)從2023年1月1日至2023年8月11日) 7 圖表14:二次平滑后的相對熱度曲線-非中心的平滑(左)&余弦加權(quán)平滑(中)&高斯加權(quán)平滑(右) 圖表16:策略回測-一周周度差,年化超額收益(左)&信息比率(中)&換手率(右) 122策策略研究告圖表17:策略回測-四周周度差,年化超額收益(左)&信息比率(中)&換手率(右) 12圖表18:凈值曲線-策略1至3(上)&策略4至6(下) 13 圖表20:分年分月收益-策略1至2(從上至下) 14圖表21:分年分月收益-策略3至6(從上至下) 15圖表22:分行業(yè)表現(xiàn)-策略1至3(上)&策略4至6(下) 16圖表23:六種策略2023年的持倉行業(yè)明細(數(shù)據(jù)從2023年1月1日至2023年8月11日) 17圖表24:敏感性測試1-除以成分股被調(diào)研次數(shù),不取對數(shù)求周度差,年化超額收益(左)&換手率 (右) 183生產(chǎn)經(jīng)營其他行業(yè)狀況股權(quán)并購重組融資生產(chǎn)經(jīng)營其他行業(yè)狀況股權(quán)并購重組融資人力資源管理層重大事項0.72%1.05%%2.09%0.46%3.09%5.29%26.59%59.51%策策略研究告一)前言近年來,市場上機構(gòu)投資者數(shù)量不斷增加,對機構(gòu)調(diào)研信息的重視程度也與日俱增。機構(gòu)調(diào)研是指各類機構(gòu)通過實地參觀、分析師會議、業(yè)績說明會等方式對上市公司進行深入調(diào)研。這些調(diào)研活動能夠反映機構(gòu)投資者對特定公司的興趣程度,并成為評估公司基本面和財務(wù)狀況的重要依據(jù)。為了利用機構(gòu)調(diào)研信息更好地進行行業(yè)輪動策略,我們借助機構(gòu)調(diào)研問答明細數(shù)據(jù),并運用文本熱詞挖掘方法,構(gòu)建了行業(yè)熱度指標,通過跟蹤熱詞和熱度的變化,有助于捕捉行業(yè)熱點的轉(zhuǎn)移趨勢。問題文本是指機構(gòu)調(diào)研過程中提出的問題,涵蓋公司業(yè)務(wù)、財務(wù)狀況和行業(yè)競爭等關(guān)注點。這些問題揭示了機構(gòu)投資者對特定公司的關(guān)注,以及市場對行業(yè)熱點問題的關(guān)心和擔憂?;卮鹞谋臼巧鲜泄緦C構(gòu)調(diào)研問題的回答。公司管理層會詳細解釋問題,闡述業(yè)務(wù)發(fā)展戰(zhàn)略和潛在風險等信息。此外,公司還能提供有關(guān)運營狀況、未來計劃和風險管理等方面的洞察。這些回答一定程度上反映了行業(yè)的動態(tài)。不同類型的問題及其對應(yīng)的回答,反映了調(diào)研機構(gòu)關(guān)注的重點和關(guān)注點的變化,機構(gòu)調(diào)研文本可根據(jù)問題類型進行劃分:生產(chǎn)經(jīng)營,行業(yè)狀況,股權(quán),并購重組,融資,人力資源,管理層,重大事項和其他。各問題類型情況統(tǒng)計如下,調(diào)研機構(gòu)的提問主要集中在公司的生產(chǎn)經(jīng)營上,每年都處于高位,表明調(diào)研機構(gòu)對于公司的商業(yè)模式和盈利能力非常關(guān)注;“其他”類型是調(diào)研機構(gòu)次關(guān)心的,主要是關(guān)于公司自身特點的提問,涉及特定領(lǐng)域或細節(jié);而占比最少的是“重大事項”,每年發(fā)生的可能性也很小。圖表1:調(diào)研問題類型占比及變化情況(數(shù)據(jù)截止至2023年8月)年 資料來源:Wind、中信建投4策策略研究告本文以機構(gòu)調(diào)研的問答文本為基礎(chǔ),旨在挖掘機構(gòu)投資者與上市公司的關(guān)注焦點,找出有效的投資信號,并構(gòu)建行業(yè)輪動策略以應(yīng)對行業(yè)中的熱點變化。具體的研究工作包括以下幾個方面:1.針對機構(gòu)調(diào)研的問題文本和回答文本,我們進行了分詞處理,并提取關(guān)鍵特征,保留得分較高的詞匯。同時,移除一些無意義的停用詞,從而得到文本的關(guān)鍵詞列表。2.我們按照不同行業(yè)統(tǒng)計關(guān)鍵詞在文本中的詞頻,并加權(quán)平均處理。然后,我們將兩個時期的詞頻進行比較和計算,得到每個關(guān)鍵詞的熱度值。通過篩選排名靠前的關(guān)鍵詞,我們確定了熱詞。3.將熱詞與被調(diào)研的公司及其所屬行業(yè)進行關(guān)聯(lián),我們得到了各行業(yè)的熱度時間序列。這樣,我們可以追蹤行業(yè)熱度的變化趨勢。4.為了進一步構(gòu)建行業(yè)輪動策略,我們對原始的熱度序列進行了數(shù)據(jù)預(yù)處理,以便更好地分析和應(yīng)對行業(yè)二)機構(gòu)調(diào)研文本數(shù)據(jù)統(tǒng)計分析本文使用的機構(gòu)調(diào)研數(shù)據(jù)來源于WIND數(shù)據(jù)庫的AShareISQA(中國A股機構(gòu)調(diào)研問答明細),主要的變量下圖所示。資料來源:wind、中信建投5策策略研究告在過去十年里,統(tǒng)計機構(gòu)調(diào)研問答明細所有交易日的問題和回答文本數(shù)據(jù)情況。對于問題內(nèi)容,其文本長度呈現(xiàn)右偏趨勢,存在一些內(nèi)容詳盡的長問題,但問題文本長度主要集中在10-20區(qū)間上,說明大部分的問題都是簡潔、概括的。對于回答內(nèi)容,公司往往會提供較為詳實的答復(fù),從而使得回答文本長度也呈右偏,存在大量長文本數(shù)據(jù),但主要集中在50-100區(qū)間上。問題文本雖然長度小,能提取的關(guān)鍵詞較少,但也說明出現(xiàn)關(guān)鍵詞的比例大,而且機構(gòu)調(diào)研者的提問往往也是抓重心的;問題文本長度大,可能會提取到一些非關(guān)鍵詞,但也正因為其數(shù)據(jù)量大,才能盡可能多地挖掘出關(guān)鍵詞。圖表3:機構(gòu)調(diào)研問答文本的總體長度分布-問題文本長度(左)&回答文本長度(右)(數(shù)據(jù)截止至2023年8月)問題文本長度25000020000015000010000050000040000035000030000025000問題文本長度2500002000001500001000005000004000003500003000002500002000001500001000005000050000035000004500000資料來源:Wind、中信建投2.3、機構(gòu)調(diào)研個股被提問次數(shù)排名個股層面,公司被提問次數(shù)多可能是由于被調(diào)研次數(shù)多或者每次調(diào)研都有較多的提問,一定程度上能說明被調(diào)研公司的受關(guān)注程度。圖表4:機構(gòu)調(diào)研被提問次數(shù)排行前十個股(數(shù)據(jù)截止至2023年8月)年第一名第二名第三名第四名第五名第六名第七名第八名第九名第十名2013比亞迪ST摩登金風科技長安汽車中海達泰和新材亞太科技安居寶匯川技術(shù)銀之杰2014比亞迪長安汽車亞太科技匯川技術(shù)深天馬A美亞柏科浙江永強上海新陽海格通信滄州明珠2015滄州明珠福瑞股份深天馬A匯川技術(shù)美亞柏科泰和新材川發(fā)龍蟒中穎電子融捷股份得潤電子2016新寶股份匯川技術(shù)泰和新材溫氏股份滄州明珠云海金屬中穎電子比亞迪麗江股份深天馬A2017金風科技廣汽集團中穎電子榮泰健康泰和新材大族激光新寶股份京東方A深天馬A比亞迪2018泰和新材大族激光金風科技老板電器盈趣科技深天馬A石基信息順絡(luò)電子樂歌股份美亞柏科2019深南電路泰和新材順絡(luò)電子金風科技偉星新材光威復(fù)材石基信息蘇州科達中穎電子安車檢測2020華潤微美迪西凱賽生物珠江啤酒公元股份杰普特大族激光瀾起科技偉星新材一心堂2021歐科億瀾起科技咸亨國際四方光電東威科技美迪西佳禾食品皓元醫(yī)藥科博達萊伯泰科2022歐科億匯川技術(shù)東威科技埃斯頓華潤三九美迪西四方光電泰和新材瀾起科技偉星股份2023歐科億山外山泰和新材海正藥業(yè)埃斯頓航宇科技珠海冠宇英威騰匯川技術(shù)神州細胞-U資料來源:wind、中信建投6201301042013041220130712201310112014011020140411201301042013041220130712201310112014011020140411201407112014101020150109201504102015071020151009201601082016041520160715201610212017012020170421201707212017102720180126201804272018072720181102201902012019051020190809201911082020021420200515202008142020111320210210202105142021081320211112202202182022052020220819202211252023030320230602201301042013041220130712201310112014011020140411201407112014101020150109201504102015071020151009201601082016041520160715201610212017012020170421201707212017102720180126201804272018072720181102201902012019051020190809201911082020021420200515202008142020111320210210202105142021081320211112202202182022052020220819202211252023030320230602策策略研究告從2013年至今,每年被提問次數(shù)排在前十的個股如下表所示:近三年,歐科億始終是被調(diào)研機構(gòu)提問最多的上市公司,其所屬中信一級行業(yè)為機械??紤]到文本長度存在一些極大值,所以以中位數(shù)來分析每周文本長度的情況,這里每周指的是交易周的周一至周五。由圖可知,每周問題文本的中位數(shù)長度大致在15-30之間波動,保持著緩慢上升的趨勢;而每周回答文本的中位數(shù)長度大致在50-150之間波動,并且表現(xiàn)出顯著的上升趨勢。圖表5:機構(gòu)調(diào)研文本長度的中位數(shù)-問題文本(上)&回答文本(下)(數(shù)據(jù)截止至2023年8月)0資料來源:Wind、中信建投這種上升趨勢可能來源于:一方面,機構(gòu)調(diào)研者對被調(diào)研公司的情況愈加關(guān)注,并希望通過更長的問題來獲取更全面、更詳細的信息,并且隨著調(diào)研的深入,問題也會涉及到更多復(fù)雜的細節(jié),需要更多的文字來表達出清晰的問題需求。另一方面,公司信息披露意愿在不斷提高,通過更詳盡的回答來展現(xiàn)公司全貌,滿足大眾的關(guān)注度,并且隨著問題變得更加復(fù)雜,被調(diào)研公司需要用心準備并花費更多的篇幅來解釋說明,通過更長的7策策略研究告回答也能確保涵蓋所有關(guān)鍵方面,并提供適當?shù)谋尘靶畔⒑团e例,以便提問人能夠更好地理解回答。三)機構(gòu)調(diào)研文本的關(guān)鍵詞提取讀取每日的“中國A股機構(gòu)調(diào)研問答明細”數(shù)據(jù),匯總得到一周的問答記錄。如果一周的問題或回答內(nèi)容長度為0,則判斷本周未進行機構(gòu)調(diào)研或者數(shù)據(jù)缺失,不使用這周數(shù)據(jù)。問題內(nèi)容或回答內(nèi)容存在缺失值的,也需要剔除,以免接下來的分詞出錯。調(diào)研類型調(diào)研日期特定對象調(diào)研特定對象調(diào)研特定對象調(diào)研地資料來源:wind、中信建投得到關(guān)鍵詞后,仍有可能混入一些停用詞,為了提高分詞的準確性和有效性,考慮人工剔除停用詞。圖表7:剔除停用詞后的問題詞云圖(左)&回答詞云圖(右)(數(shù)據(jù)從2023年1月1日至2023年8月11日)資料來源:Wind、中信建投針對2023年1月1日至2023年8月11日期間的數(shù)據(jù),我們進行了關(guān)鍵詞提取,并剔除其中的停用詞,分別繪制問題和回答的詞云圖。在詞云圖中,詞語的大小代表了其得分的高低。通過觀察詞云圖,我們可以發(fā)現(xiàn)8熱度4.7153.3033.093910910熱度4.7153.3033.093910910910737737730710709679570527466wind詞度湖微微微相寓滇西北酒店業(yè)精煤煤炭資源策策略研究告一些具有典型行業(yè)性質(zhì)的詞匯,如在問題詞云圖中的"光伏"、"AI"、"ChatGPT"、"AIGC",以及在回答詞云圖中的"AI"、"車載"、"醫(yī)保"、"雙碳"。這說明關(guān)鍵詞的提取是有效的。然而,一些具有較高得分的詞語可能并不具有實際意義,在后續(xù)的熱度計算過程中,我們需要對這些詞語進行過濾,以提高熱度計算的準確性和可靠性。我們選擇了方法3作為詞語頻率的計算方法,作為進一步計算詞語熱度的基礎(chǔ)。詞語過去四周頻率本周頻率瀘沽湖小微相寓爭得0滇西北0酒店業(yè)0精煤0非煤0煤炭資源0儲罐市場價演藝華斯0分布式息差資料來源:wind、中信建投熱度本身含有相對的概念,某個詞語在這段時間出現(xiàn)的概率顯著地比過去高了,從感覺上就可以認為這個詞語屬于熱詞,具有較高的熱度。我們通過對兩段時間的詞語頻率進行比較,定義熱度指標將其量化,從而識別出熱詞。四)基于機構(gòu)調(diào)研文本的股票因子與指數(shù)因子構(gòu)造在構(gòu)造股票因子時,可以根據(jù)每周的熱詞和熱度值去尋找熱詞相關(guān)的文本。文本與股票一一對應(yīng),從而可以將熱度值對應(yīng)到相應(yīng)股票上,得到每只股票的周熱度。wind詞度儲罐儲罐儲罐市場價分布式分布式分布式分布式資料來源:wind、中信建投9熱詞熱度行業(yè)代碼瀘沽湖熱詞熱度行業(yè)代碼瀘沽湖小微小微小微相寓滇西北爭得酒店業(yè)精煤非煤煤炭資源儲罐儲罐儲罐……策策略研究告在構(gòu)造指數(shù)因子時,可以借鑒股票因子的構(gòu)造方法。具體而言,搜尋熱詞所屬文本,文本與股票Wind代碼相匹配,然后將股票Wind代碼與行業(yè)代碼對應(yīng),最終將熱詞對應(yīng)的熱度值賦予到每個行業(yè)上,得到每個行業(yè)每周的熱度。指數(shù)簡稱熱度加總指數(shù)簡稱熱度加總石油石化家電煤炭紡織服裝有色金屬電力及公用事業(yè)食品飲料鋼鐵農(nóng)林牧漁基礎(chǔ)化工銀行建筑非銀行金融建材房地產(chǎn)輕工制造交通運輸機械子電力設(shè)備及新能源通信國防軍工計算機汽車傳媒商貿(mào)零售綜合消費者服務(wù)綜合金融資料來源:wind、中信建投五)基于機構(gòu)調(diào)研問答明細的行業(yè)輪動策略基于機構(gòu)調(diào)研問答明細生成的周頻指數(shù)因子,代表了每周各個行業(yè)的熱度值,可以被用來評估不同行業(yè)的關(guān)注度水平。隨著時間的推移,不同行業(yè)的熱度值會發(fā)生變化,從而反映出機構(gòu)調(diào)研對行業(yè)的興趣度發(fā)生了變化,并間接地反映了市場的動向。由于在計算熱度指標時,用到了本周的調(diào)研數(shù)據(jù),為避免在回測過程中用到未來信息,我們在計算各行業(yè)的機構(gòu)調(diào)研熱度因子時,會將數(shù)據(jù)向前平移一期,即在本周回測時,使用的是上周的熱度值。本文的最終回測因子是基于2012年12月31日-2023年8月11日所有交易日的機構(gòu)調(diào)研問答明細構(gòu)建的,但由于熱度是基于前四周的對比,最早的四周無法計算熱度,并且在數(shù)據(jù)處理過程中采用了滾動窗口、平移等操作,實際上的回測區(qū)間為2013年3月15日-2023年8月11日。步驟一:計算綜合熱度。在上述的指數(shù)因子中,我們分別得到了來自問題文本和回答文本的熱度,為了觀察何種文本內(nèi)容更能反映行業(yè)熱度,考慮將問題熱度和回答熱度按比例相加,并在后續(xù)的回測結(jié)果中進行觀察。的效果更佳;當k=0.5時,說明綜合兩者會有較好的結(jié)果。綜合熱度=k×問題熱度+(1?k)×回答熱度步驟二:對熱度進行平均化處理。考慮到各行業(yè)的成分股個數(shù)不同,以及各行業(yè)每周被調(diào)研的公司數(shù)量存在差異,成分股多的行業(yè)由于被調(diào)研頻率較高可能導(dǎo)致行業(yè)熱度偏大,因而需要對熱度平均化處理。通過平均化處理,可以消除行業(yè)規(guī)模和被調(diào)研頻率對行業(yè)熱度的影響,使各行業(yè)之間更具可比性。行業(yè)一周總計調(diào)研次數(shù)通信2基礎(chǔ)化工1傳媒2計算機1建材1建筑1行業(yè)一周總計調(diào)研次數(shù)通信2基礎(chǔ)化工1傳媒2計算機1建材1建筑1策策略研究告方法1:將每個行業(yè)的熱度值除以行業(yè)成分股的個數(shù),得到平均熱度。石油石化煤炭有色金屬……判斷熱度日期所處范圍1093011231203312063020930212313033130630資料來源:wind、中信建投方法2:將每個行業(yè)的熱度值除以成分股被調(diào)研的次數(shù)和,得到平均熱度。匯總每周被調(diào)研的WIND代碼及所屬行業(yè),得到每周各行業(yè)被調(diào)研的總次數(shù)。日期星期被調(diào)研公司所屬行業(yè)20230605周一300081.SZ300299.SZ通信傳媒20230606周二300081.SZ002717.SZ300541.SZ通信建筑計算機20230607周三002671.SZ建材20230608周四002984.SZ基礎(chǔ)化工20230609周五000156.SZ傳媒資料來源:wind、中信建投20230605-20230609步驟三:計算相對熱度,并對相對熱度進行平滑處理。由于計算得到的熱度是一系列離散的數(shù)據(jù)點,而實際上的熱度是連續(xù)變化的,不會突然出現(xiàn)或消失。石油石化煤炭消費者服務(wù)食品飲料農(nóng)林牧漁銀行非銀行金融房地產(chǎn)通信傳媒350300250200150100500資料來源:wind、中信建投策策略研究告步驟四:對熱度進行再次平滑處理。在發(fā)現(xiàn)單次平滑處理后,熱度曲線仍然不夠光滑且振動頻率較大的情況下,我們考慮進行再一次平滑處理,進一步減小熱度曲線中的波動,并提取更加平滑和連續(xù)的趨勢信息。這次平滑處理考慮了三種方法:方法1:非中心的52周平滑方法2:余弦加權(quán)的52周平滑方法3:高斯加權(quán)的52周平滑,標準差參數(shù)設(shè)置為10。圖表14:二次平滑后的相對熱度曲線-非中心的平滑(左)&余弦加權(quán)平滑(中)&高斯加權(quán)平滑(右) 通信傳媒 通信傳媒0000資料來源:wind、中信建投步驟五:求相關(guān)系數(shù)。首先計算行業(yè)指數(shù)的相對凈值,我們使用兩次平滑后的相對熱度和相對凈值這兩組時間序列,采用滾動窗口的方式來計算相關(guān)系數(shù)。煤炭有色金屬鋼鐵輕工制造家電醫(yī)藥食品飲料農(nóng)林牧漁計算機綜合10-0.5資料來源:wind、中信建投步驟六:計算最終回測因子。為了識別熱度處于增長勢態(tài)的行業(yè),我們采用了熱度的周度差因子,以評估年化超額持倉行業(yè)數(shù)135問題年化超額持倉行業(yè)數(shù)135問題熱度的比例k01信息比率持倉行業(yè)數(shù)135問題熱度的比例k01年化超額持倉行業(yè)數(shù)135問題熱度的比例k01信息比率持倉行業(yè)數(shù)135問題熱度的比例k01策策略研究告行業(yè)熱度的變化情況。當差值大于0時,表示熱度增長,而小于0則表示熱度下降。我們對中信一級行業(yè)進行回測;在回測參數(shù)上,對周度差跨度、問題熱度的比例k、持倉行業(yè)個數(shù)這三個參數(shù)進行測試和分析。其中周度差跨度設(shè)定為一周周度差、四周周度差;問題熱度的比例k設(shè)定為0.0到1.0,步長為0.1;行業(yè)持倉個數(shù)設(shè)定為1個、3個、5個。業(yè)績基準為全行業(yè)等權(quán),回測結(jié)果如下:圖表16:策略回測-一周周度差,年化超額收益(左)&信息比率(中)&換手率(右)換手率(年均)持倉行業(yè)數(shù)135問題熱度的比例k01資料來源:wind、中信建投當使用一周周度差時,可以看到策略大部分取得正向超額收益。整體來看,在問題熱度比率為1、持倉行業(yè)個數(shù)為3時,取得了最高的年化超額收益,達到了7.43%,且信息比率為0.74。位于第二的年化超額收益為6.84%,選擇的問題熱度比率為0.9、持倉行業(yè)個數(shù)為5,達到了最高的信息比率0.88,此時年均換手率為11.31圖表17:策略回測-四周周度差,年化超額收益(左)&信息比率(中)&換手率(右)換手率(年均)持倉行業(yè)數(shù)135問題熱度的比例k01資料來源:wind、中信建投當使用四周周度差時,可以看到策略也大部分取得了正向超額收益。整體來看,在問題熱度比例為0到0.6且持倉行業(yè)個數(shù)為1時,都有較好的年化超額收益,其中最高為9.73%,其信息比率為0.53,年均換手率為7.24倍。在只用問題熱度、持倉3個行業(yè)時,也有較高的年化超額收益7.47%,并且有較高的信息比率0.73。綜合年化超額收益、信息比率和年均換手率,我們選擇了六種策略:策策略研究告策略1:一周周度差,k=1,持倉行業(yè)個數(shù)3。策略2:一周周度差,k=0.9,持倉行業(yè)個數(shù)5。四周周度差,k=1,持倉行業(yè)個數(shù)3。四周周度差,k=0,持倉行業(yè)個數(shù)1。策略5:四周周度差,k=0.1,持倉行業(yè)個數(shù)1。策略6:四周周度差,k=0.2,持倉行業(yè)個數(shù)1。圖表18:凈值曲線-策略1至3(上)&策略4至6(下)資料來源:wind、中信建投從凈值曲線可以看出,策略4-6只持倉一個行業(yè),在收益能力上表現(xiàn)更佳,尤其是策略6的策略凈值最高,但是它們在近兩年表現(xiàn)出回撤的趨勢,波動性也較大。從相對凈值來看,選擇多行業(yè)持倉的策略1-3的穩(wěn)定性更好,且保持著持續(xù)上升的趨勢。從回測參數(shù)上來看,相對于只持倉一個行業(yè),增加持倉數(shù)量可以獲得相對穩(wěn)定的凈值曲線,并且使用單一熱度要比綜合問答的熱度更能反映出行業(yè)熱點的變化情況。統(tǒng)計六種策略的業(yè)績指標。年化超額收益方面:策略1為7.43%,策略2為6.84%,策略3為7.47%,策略4為7.87%,策略5為8.22%,策略6為9.73%;年化超額波動方面:策略1為10.11%,策略2為7.80%,策略3為10.29%,策略4為18.29%,策略5為18.33%,策略6為18.43%;超額最大回撤方面:策略1為15.10%,策策略研究告策略2為9.01%,策略3為19.26%,策略4為33.71%,策略5為32.36%,策略6為27.26%;信息比率方面:策略1為0.74,策略2為0.88,策略3為0.73,策略4為0.43,策略5為0.45,策略6為0.53;換手率方面:策略1為年均12.57倍,策略2為年均11.31倍,策略3為年均9.02倍,策略4為年均8.38倍,策略5為年均7.81倍,策略6為年均7.24倍。綜合考慮各項指標,策略2在多項上取得了較好的表現(xiàn)。年化收益(%)基準收益(%)超額收益(%)年化波動(%)年化超額波動(%)最大回撤(%)超額最大回撤(%)夏普比率信息比率勝率(%)換手率(年均)策略116.018.397.4327.4610.1155.5715.100.580.7453.2112.57策略215.788.396.8425.437.8051.019.010.620.8853.0211.31策略316.098.397.4727.4310.2955.4019.260.590.7352.649.02策略416.278.397.8731.9718.2957.5633.710.510.4351.518.38策略516.688.398.2231.9318.3357.5632.360.520.4551.707.81策略618.388.399.7331.7418.4357.5627.260.580.5352.457.24資料來源:wind、中信建投計算六種策略的分年分月的收益指標,首先看六種策略的分月超額收益,策略1和策略3都在2013年7月獲得了最高單月超額14.52%,策略2同樣也在該月取得最高單月超額10.43%,查看持倉明細可以知道這個月策略共同配置了醫(yī)藥、傳媒、計算機這三個行業(yè),這三個行業(yè)在7月份均呈現(xiàn)出上漲趨勢。策略4-6都在2022年3月獲得了最高的單月超額16.90%,查看持倉明細發(fā)現(xiàn)這個月都只配置了煤炭這一個行業(yè),煤炭在3月呈上漲趨勢,漲幅約8.18%。對于分年指標,可以看到策略1在回測區(qū)間的11年內(nèi)有8年都獲得了正向的年化超額收益,最高的一年年化超額收益為43.42%。策略2有7年獲得了正向的年化超額收益,年化超額收益最高一年為23.72%。策略3有8年獲得了正向的年化超額收益,年化超額收益最高一年為42.00%。策略4-6都有7年獲得了正向的年化超額收益,年化超額收益最高一年都為39.51%,但是波動較大。策略1-3的超額收益差不多,雖比策略4-6低一些,但更加穩(wěn)定,從年化超額波動、超額最大回撤、信息比率來看,策略2更勝一籌。略1至2(從上至下)份超額信息比率大手率全樣本平均份超額信息比率大手率全樣本平均資料來源:wind、中信建投策策略研究告略3至6(從上至下)份超額信息比率大手率全樣本平均份超額信息比率大手率全樣本平均份超額信息比率大手率全樣本平均份超額信息比率大手率全樣本平均資料來源:wind、中信建投統(tǒng)計六種策略的分行業(yè)表現(xiàn),策略1在配置過的29個行業(yè)中有16個行業(yè)達到了50%的正相對收益勝率,占比55.17%;正相對收益勝率最高的行業(yè)是計算機,達到了67.50%;勝率最低的行業(yè)是基礎(chǔ)化工、房地產(chǎn)和有色金屬,分別配置了1次、11次和62次,勝率在0%-40%之間;其中汽車在回測中沒有被配置過。策略2在配置過的30個行業(yè)中有18個行業(yè)達到了50%的正相對收益勝率,占比60%;正相對收益勝率最高的行業(yè)是非銀行金融,達到了66.67%,配置次數(shù)為3;勝率最低的行業(yè)是綜合金融、房地產(chǎn)和有色金屬,分別配置了61次、37次和73次,勝率在35%-45%之間。策略3在配置過的28個行業(yè)中有15個行業(yè)達到了50%的正相對收益勝率,占比53.57%;正相對收益勝率最高的行業(yè)是家電,達到了69.23%;勝率最低的行業(yè)是非銀行金融、房地產(chǎn)和農(nóng)林牧漁,分別配置了1次、10次和9次,勝率在0%-35%之間;其中汽車和基礎(chǔ)化工在回測中沒有被配置過。策略4在配置過的18個行業(yè)中有10個行業(yè)達到了50%的正相對收益勝率,占比55.56%;正相對收益勝率最高的行業(yè)是房地產(chǎn)和商貿(mào)零售,達到了100%,都只配置了1次;勝率最低的行業(yè)是建材、綜合金融和機械,業(yè)數(shù)數(shù)業(yè)數(shù)數(shù)數(shù)率率石化炭屬業(yè)鐵6239312業(yè)數(shù)數(shù)數(shù)率率石化炭屬業(yè)鐵0000006446994310052955000000000000600000000096220000000000000000000000006336116600000021100094000000000723000000000000000000000000211100策策略研究告分別配置了1次、8次和19次,勝率在0%-35%之間;其中電力及公用事業(yè)、基礎(chǔ)化工、建筑、電力設(shè)備及新能源、汽車、醫(yī)藥、食品飲料、農(nóng)林牧漁、非銀行金融、交通運輸、通信、計算機在回測中沒有被配置過。策略5在配置過的15個行業(yè)中有8個行業(yè)達到了50%的正相對收益勝率,占比53.33%;正相對收益勝率最高的行業(yè)是輕工制造,達到了68.18%;勝率最低的行業(yè)是綜合金融、有色金屬和紡織服裝,分別配置了6次、16次和6次,勝率在15%-35%之間;相比策略4,其未配置行業(yè)還增加了房地產(chǎn)、商貿(mào)零售和建材。策略6在配置過的16個行業(yè)中有9個行業(yè)達到了50%的正相對收益勝率,占比56.25%;正相對收益勝率最高的行業(yè)是輕工制造,達到了66.67%;勝率最低的行業(yè)是綜合金融、機械、有色金屬,分別配置了1次、13次和18次,勝率在0%-35%之間;相比策略5,其配置的行業(yè)還增加了建筑。從分行業(yè)來看,策略2取得了更好的表現(xiàn)。圖表22:分行業(yè)表現(xiàn)-策略1至3(上)&策略4至6(下)業(yè)數(shù)數(shù)數(shù)率率石化炭屬業(yè)鐵100000667332116395500000000011060000001118954000000000000111000000000744832資料來源:wind、中信建投綜合各方面的測試結(jié)果,我們選擇最佳策略為:策略2,即一周周度差、k=0.9、持倉行業(yè)個數(shù)5。策策略研究告統(tǒng)計各策略在2023年的持倉行業(yè)明細,可以看到六個策略主要選擇了煤炭、紡織服裝、傳媒、通信、電力及公用事業(yè)、非銀行金融以及交通運輸?shù)刃袠I(yè)作為持倉對象。值得注意的是,在最近的幾個月里,策略1-3均選擇了配置通信和傳媒行業(yè),這可能與最新的GPT技術(shù)進步引發(fā)的行業(yè)變革有關(guān)。說明策略具有較好的效果,能夠識別出行業(yè)熱度的轉(zhuǎn)變。月1日至2023年8月11日)用事業(yè)織服裝用事業(yè)織服裝房地產(chǎn)合金融用事業(yè)織服裝用事業(yè)織服裝用事業(yè)織服裝房地產(chǎn)合金融用事業(yè)織服裝用事業(yè)織服裝用事業(yè)織服裝房地產(chǎn)合金融用事業(yè)織服裝用事業(yè)房地產(chǎn)用事業(yè)售織服裝房地產(chǎn)用事業(yè)織服裝用事業(yè)房地產(chǎn)用事業(yè)售織服裝房地產(chǎn)用事業(yè)房地產(chǎn)用事業(yè)房地產(chǎn)用事業(yè)售織服裝房地產(chǎn)用事業(yè)房地產(chǎn)用事業(yè)織服裝用事業(yè)織服裝房地產(chǎn)用事業(yè)織服裝織服裝房地產(chǎn)用事業(yè)織服裝房地產(chǎn)織服裝房地產(chǎn)織服裝房地產(chǎn)用事業(yè)售織服裝房地產(chǎn)織服裝房地產(chǎn)織服裝房地產(chǎn)用事業(yè)售織服裝房地產(chǎn)織服裝房地產(chǎn)織服裝房地產(chǎn)用事業(yè)售織服裝房地產(chǎn)織服裝房地產(chǎn)織服裝房地產(chǎn)售織服裝房地產(chǎn)織服裝房地產(chǎn)售織服裝售織服裝房地產(chǎn)織服裝房地產(chǎn)織服裝機械售織服裝織服裝織服裝機械售織服裝織服裝織服裝機械售織服裝織服裝織服裝機械織服裝織服裝織服裝機械織服裝織服裝織服裝機械織服裝織服裝織服裝織服裝通運輸織服裝織服裝機械織服裝織服裝織服裝機械織服裝織服裝織服裝石化織服裝織服裝織服裝織服裝織服裝織服裝織服裝織服裝通運輸消費者服務(wù)通運輸銀行金融通運輸銀行金融通運輸通運輸銀行金融通運輸消費者服務(wù)織服裝銀行金融通運輸銀行金融通運輸銀行金融通運輸消費者服務(wù)銀行金融通運輸銀行金融通運輸資料來源:wind、中信建投在這里我們展示其余方法參數(shù)下較好的回測結(jié)果,即使用不同的平均化方法、二次平滑方法對超額收益和1135問題熱度的比例k01135問題熱度的比例k01135問題熱度的比例k01135問題熱度的比例k01策策略研究告換手率進行概述,比較不同方法的差異??梢钥吹?,如下四種策略基本都能取得正向超額收益,最高的年化超額收益分別為7.03%、7.23%、6.65%和7.05%,年均換手率分別為4.83、5.71、5.14、5.52,都低于6倍。從回測參數(shù)上來看,當k值偏向于問題熱度并且持倉3個行業(yè)時,會取得較高的超額收益;在二次平滑中,相對熱度做高斯平滑的效果要優(yōu)于余弦平滑;一周周度差與四周周度差的回測效果差異不大。圖表24:敏感性測試1-除以成分股被調(diào)研次數(shù),不取對數(shù)求周度差,年化超額收益(左)&換手率(右)135問題熱度的比例k01135問題熱度的比例k01135問題熱度的比例k01135問題熱度的比例k01資料來源:Wind、中信建

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論