【社交媒體情緒對股市價格的影響實證探析11000字(論文)】_第1頁
【社交媒體情緒對股市價格的影響實證探析11000字(論文)】_第2頁
【社交媒體情緒對股市價格的影響實證探析11000字(論文)】_第3頁
【社交媒體情緒對股市價格的影響實證探析11000字(論文)】_第4頁
【社交媒體情緒對股市價格的影響實證探析11000字(論文)】_第5頁
已閱讀5頁,還剩15頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

社交媒體情緒對股市價格的影響實證分析摘要 3一、 前言 5二、 文獻回顧 6三、 基于NLP技術和Python數(shù)據挖掘的投資者情緒指標構建 83.1數(shù)據來源 83.2數(shù)據處理 83.2.1文本預處理 83.2.2情感詞典匹配 9四、 投資者社交媒體情緒與股票市場價格波動之間的關系。 104.1.樣本數(shù)據來源 104.2變量選取 114.3投資者情緒指標的統(tǒng)計 164.3.1發(fā)帖數(shù)量的描述性統(tǒng)計 164.3.2發(fā)帖內容的描述性統(tǒng)計 174.3.3投資者情緒影響股價的機理 184.4假設與假設 184.5構建模型 184.6變量間的Pearson相關性分析(括號內為P統(tǒng)計量) 194.7回歸分析 204.7.1對于假設1的回歸分析 204.7.2對于假設2的回歸分析: 20五、 結論與展望 225.1結論 225.2政策與展望 22

摘要行為金融學(BehaviorFinance)是一門與社會學、心理學等結合的金融學科。作為一門新興學科,行為金融學的一大重要理論就是投資者情緒理論(InvestorSentimentTheory)。行為金融學結合心理學的認知,相對于傳統(tǒng)金融學里的“理性人”,行為金融學提出了“社會人”這一假設?!袄硇匀恕奔僭O認為,人總是追求利益最大化的,所以行為都有理可循。但是“社會人”假設認為,并非所有人的行為都是理性的。因此,為了解釋市場中存在的一些反常現(xiàn)象,一些學者開始提出“投資者情緒“這一概念。隨著信息時代的到來,網絡對證券市場的影響逐步被發(fā)掘出來。相關的研究也開始出現(xiàn),在提取了相關數(shù)據之后,一些研究表明:論壇上的信息可以影響投資者情緒,并通過影響投資者情緒,來影響投資者的投資行為。計算機相關技術和語言學、心理學的相關知識也被應用于這一領域。在進行了文獻回顧之后,決定結合計算機相關知識,來對投資者情緒這一主題進行研究。本文基于選取的幾只股票,利用Python爬蟲技術(Webcrawler),爬取時間跨度為2020年1月1日到2020年12月31日的東方財富網股吧(股票網絡論壇)的用戶評論等相關數(shù)據。在清洗爬取的數(shù)據后,利用情感詞典技術進行文本挖掘,從而提取出文本中蘊含的投資者情緒。之后基于數(shù)據對東方財富網股吧中提取的投資者情緒對股市收益率的影響進行實證的研究。研究結果表明:開放論壇中的投資者情緒能夠顯著的影響股市的價格。具體表現(xiàn)在:投資者情緒越高昂,與之對應的股票收益率也就越高。投資者情緒越低落,相應的股票收益率也就越低。同時,通過兩種不同類型的數(shù)據對比,我們發(fā)現(xiàn):投資者情緒指數(shù)的影響力要遠遠大于投資者信心指數(shù)的影響力。這也說明了文本型,非結構化的數(shù)據的解釋力度要比數(shù)值型,結構化的解釋力度要好。以文本為藍本的研究要比以數(shù)值為藍本的研究更具有說服力。因此本文中采取的研究辦法是具有其現(xiàn)實意義的。關鍵詞:股票收益率;個人投資者情緒;文本挖掘;前言1.1研究背景隨著互聯(lián)網技術的發(fā)展,迅速發(fā)展的社交媒體逐漸占據了信息傳播的高地。與此同時,大數(shù)據的廣泛應用使得社交媒體得以實現(xiàn)信息的快速傳播。4G時代的到來也使得微博、微信、短視頻平臺等進入到了人們的生活中,改變了每個人的生活方式。據中國互聯(lián)網絡信息中心(CNNIC)第41次研究報告數(shù)據顯示,在2020年12月,中國會在網上購買理財產品的網民數(shù)量高達1.7億左右,相比于2020年3月增長了700萬人。2020年,新冠疫情的影響使得人們轉換了投資渠道,不再僅僅通過傳統(tǒng)的理財方式,如銀行存款等來進行理財。投資的渠道從線上轉換到線下,極大的豐富了投資模式,提高了社會財富的利用率。然而,互聯(lián)網在給我們帶來的便利的同時,也不免給我們帶來了各種負面影響。通過網絡上的信息來進行投資理財也不一定是永遠正確的。尤其是在這個有著大量信息的時代,有價值的信息往往被淹沒在茫茫大海中,諸多真假難辨的信息極大的影響了人們的判斷。目前網絡空間里的主流討論地主要分為財經網站和財經論壇,財經網站里的信息缺乏監(jiān)管,大量的假新聞充斥著網站。而財經論壇由于其開放性導致任何人都可以發(fā)表自己的觀點,極大的影響了投資者的情緒。從來源來說,一部分假信息源于個人的判斷力不足,而另一部分則源于利益。一些人甚至故意發(fā)布虛假的信息以誘導人們做出非理性的行為,從而使自己獲利。也就是常說的“割韭菜”。由于每個人的年齡,性別,投資經驗,受教育程度,本金數(shù)量都不同,如果相信了虛假的信息,個人就會做出錯誤的決策,從而導致整個市場的混亂,在整個市場里,作為多數(shù)人最先接觸,也是風險最小的市場,基金無疑是最值得研究的一個部分。1.2研究意義囿于研究技術的限制,早期的研究大多缺乏定量性質。早期的研究人員度量情緒的方法過于籠統(tǒng),沒有多少研究能夠綜合的構建出這個指標。隨著研究技術和研究方法的進步和發(fā)展,投資者情緒這一指標也有了更好的衡量標準。由于這是當代研究的一個熱點問題,在此之前的國內外學者已經提出了各種各樣的衡量投資者情緒指數(shù)的方法。其中最經典也是最具代表性的無疑是Baker和Wurgler(2006)所構建的BW指數(shù),并已成為常用的投資者情緒指數(shù)之一。該指數(shù)主要包括六個投資者情緒指標,分別是封閉式基金折價率、股票周轉率、IPO數(shù)量已經IPO第一天的平均回報率。之后使用主成分分析的辦法,將這些指標整合為BW指數(shù)。但是,技術限制導致了該研究的局限性。散戶最集中的金融網站和金融論壇的數(shù)據沒有被收錄進去。近年來,人們開始慢慢發(fā)掘這一領域,將步伐從結構化的數(shù)據邁向了非結構化的數(shù)據,例如貼吧、論壇等。這些數(shù)據可以幫助解決以往數(shù)據解決不了的問題,填補之前結構化數(shù)據所留下來的空白。盡管大部分網絡空間里的信息不值得參考,但是這些信息如何影響投資者從而影響整個市場依然是一個值得研究的課題。同時,研究一個開放的虛擬空間里的言論如何去影響真實的市場也有著其社會學意義。個人在面對駁雜的信息的時候的表現(xiàn)有著相當集中的特征,先人的經驗也可以幫助后人了解這方面的信息,而不是一味的聽信論壇里真真假假的消息。本文的研究為個人投資者提供了參考,同時幫助了他們進行投資。文獻回顧2.1理論基礎1952年,馬科維茨提出了資產投資組合理論。緊接著,金融資產定價模型和套利定價模型補充了其他部分。傳統(tǒng)金融理論開始逐步建立起來。之后,傳統(tǒng)金融理論在資本資產的定價和指導投資者投資方面發(fā)揮了重要作用。傳統(tǒng)金融理論主要包括兩個內容:首先是理性人假說,另一個則是有效市場假說。理性人假設認為,投資者是完全理性的,在投資過程中可以依照所有的有效信息做到規(guī)避投資的風險。這與經濟學中的經濟人假設有相似之處。兩者都是假設,人可以實現(xiàn)效用最大化。有效市場假說則認為:市場中的股票價格是隨機波動的,股票收益呈正態(tài)分布,市場最終處于均衡狀態(tài)。有效市場假說在三個逐漸放松的假說的基礎上證明,市場是有效的。首先,投資者是絕對理性的,并且可以高效的處理信息,市場也是高效的。第二,在一些非理性的投資者的推動下,單筆交易的成交與否,對股票價格的影響也是隨機的,這些影響相互抵消,因此很難影響股票價格。最后,即使非理性行為會對股價產生一定的影響,這一影響也無法持續(xù)很久。因為市場中的套利者會立刻發(fā)現(xiàn)這一影響并利用這一機會,從而使股價回歸正常水平。但是隨著研究的深入,這一理論的局限性也越來越明顯。一月效應和特殊現(xiàn)象(如股權溢價之謎)對這一理論提出了挑戰(zhàn)。這兩者受到越來越多研究人員的質疑,他們嘗試在這一框架之外理解這些問題,從而催生了行為金融學。2.2投資者情緒定義與度量與此同時,不同于傳統(tǒng)金融理論,重視投資者情緒的資產定價理論逐漸開始形成。作為對傳統(tǒng)資產定價理論的補充。根據在非理性形式下,實際金融市場中的投資者可能是受噪聲,認知偏見或投資者情緒的影響。并提出了噪聲交易者模型來說明該影響。此外,一些學者開始通過心理學來建立偏見交易者模型,認為投資者的認知偏見對資產有重要影響。這兩種類型的模型的缺點是噪聲和心理偏見難以辨認并且不能被衡量;因此,無法僅僅憑經驗來證明它們。Baker和WurglerBakerM,WurglerJ.InvestorSentimentintheStockMarket[J].JournalofEconomicPerspectives,2007,21(2):129-152.在2006年發(fā)表的文章發(fā)現(xiàn)了投資者情緒對于投資的重大影響。上文中已經提到了該指數(shù)的構建辦法,BW指數(shù)是研究投資者的情緒指標與收益率之間的關系的重要指數(shù)之一。研究表明:小公司股票、新發(fā)行股票、高波動性股票、虧損企業(yè)的股票、不分紅企業(yè)股票、高速成長企業(yè)股票、困境企業(yè)股票,如果投資者情緒較低,后來的投資收益率相對較高;如果投資者情緒高漲時,則將獲得較低的投資回報。與噪聲和心理偏見因子相比,投資者情緒可以定量衡量,因此近年來,投資者情緒的系統(tǒng)性作用一直是熱點問題。BakerM,WurglerJ.InvestorSentimentintheStockMarket[J].JournalofEconomicPerspectives,2007,21(2):129-152.許多實證分析和理論研究都表明了研究投資者情緒的意義。不僅僅在股價方面,投資者情緒對資產定價也有著系統(tǒng)性影響。Baker,M.,Wurgler,J.,2006.Investorsentimentandthecross-sectionofstockreturns.JournalofFinance61(4),1645–1680.有些學者提出了基于情緒的資產定價模型以強調投資者情緒在資產定價中的系統(tǒng)性作用。例如,YangandYan(2011)建立了情感資產定價模型。Yang,C.,Yan,W.,2011.Dosehighsentimentcausenegativeexcessreturn?InternationalJournalofDigitalContentTechnologyandItsApplication5(12),211–217提出了不同的投資者情緒導致不同的定價。Baker,M.,Wurgler,J.,2006.Investorsentimentandthecross-sectionofstockreturns.JournalofFinance61(4),1645–1680.Yang,C.,Yan,W.,2011.Dosehighsentimentcausenegativeexcessreturn?InternationalJournalofDigitalContentTechnologyandItsApplication5(12),211–217 囿于時代的限制,投資者的網絡情緒對于股票市場的影響則只是從2000年左右才開始漸漸的進入公眾視野。一開始的研究主要以數(shù)字為主。Wysocki在1999年發(fā)表的文章中著重研究了發(fā)帖量這一指標對于公司股價的影響。WysockiP.CheapTalkontheWeb:TheDeterminantsofPostingsonStockMessageBoards[J].SsrnElectronicJournal,1999.Da等(2011)則以羅素3000指數(shù)為指標,分析了每個公司的股票代碼在Google中被搜索的次數(shù)與其之間的關系。DaZ,EngelbergJ,GaoP.InternetSearchandMomentum[J].SocialScienceElectronicPublishing,2011.然而這些價值很低的數(shù)據并不能完全反映市場中的信息,要了解投資者的情緒,還得從新技術入手。Antweiler與Frank(2004)提取了150萬條文本,并將其分類為樂觀、悲觀、中性等三種類型。AntweilerW,FrankMZ.DoesTalkMatter?EvidenceFromaBroadCrossSectionofStocks[J].UniversityofBritishColumbiaWorkingPaper,2004.最后發(fā)現(xiàn)了其中的規(guī)律。這一研究意義深遠。很快,國內也陸續(xù)有了學者對這個問題進行研究。WysockiP.CheapTalkontheWeb:TheDeterminantsofPostingsonStockMessageBoards[J].SsrnElectronicJournal,1999.DaZ,EngelbergJ,GaoP.InternetSearchandMomentum[J].SocialScienceElectronicPublishing,2011.AntweilerW,FrankMZ.DoesTalkMatter?EvidenceFromaBroadCrossSectionofStocks[J].UniversityofBritishColumbiaWorkingPaper,2004.基于NLP技術和Python數(shù)據挖掘的投資者情緒指標構建3.1數(shù)據來源目前投資者發(fā)布相關信息的載體主要有微信、短視頻平臺、微博、支付寶評論區(qū)、財經軟件評論區(qū)與財經論壇等。本文中僅用文本進行研究,因此短視頻平臺被排除在外。微信、微博雖然討論熱度高,但是信息的針對性不強。關于投資客體的信息少之又少,大部分信息是低質量而且對研究無幫助的。聚焦于投資主體的特點使得對這兩個平臺的研究難上加難。相比而言,論壇的討論更具有專業(yè)度,各大股吧的討論區(qū)熱度也大抵和股票的表現(xiàn)重合。如果經常逛論壇,我們就會發(fā)現(xiàn):股票價格表現(xiàn)穩(wěn)定的時候,論壇里冷冷清清,一天都看不到什么人發(fā)帖。但是如果是牛市或者熊市,論壇的熱度瞬間上升幾個等級,在論壇里面可謂是有著人間百態(tài)。從這種現(xiàn)象出發(fā),本文中將假設論壇里的發(fā)帖語言體現(xiàn)了投資者對于股票的預期,源于股票表現(xiàn)又影響著股票的表現(xiàn)。3.2數(shù)據處理3.2.1文本預處理首先進行數(shù)據清洗,將標點符號和重復贅余的數(shù)據進行刪除。詞語是句子的基本單位,也是能獨立表現(xiàn)情感的部分之一。通常來說,詞語本身足以反映句子的情感傾向。利用知網的詞典表,當需要對一個句子進行分詞時,首先將句子拆分成多個部分,并將每一個部分與字典一一對應,如果該詞語在詞典中,分詞成功,否則繼續(xù)拆分匹配直到成功。大致按照以下流程運作:圖3.1文本處理流程示意圖3.2.2情感詞典匹配基于詞典的文本匹配算法相對簡單。對分詞后的語句中的詞語進行逐個比對,,如果詞語與詞典中的部分一致,則賦予其權重。正面詞權重為加法,負面詞權重為減法,否定詞權重取相反數(shù),程度副詞權重則和它修飾的詞語權重相乘。圖3.2文本分類程序框圖謝楊易自然語言處理情感分析【EB/OL】本文所用的情感詞典是由《知網》發(fā)布的《情感分析用詞語集》,作為我國應用最廣且地位最高的一部情感詞典,其中包括“正面情感”詞語,如:愛,贊賞,快樂,感同身受,好奇,喝彩,魂牽夢縈,嘉許...“負面情感”詞語,如:哀傷,半信半疑,鄙視,不滿意,不是滋味兒,后悔,大失所望...“正面評價”詞語,如:不可或缺,部優(yōu),才高八斗,沉魚落雁,催人奮進,動聽,對勁兒...“負面評價”詞語,如:丑,苦,超標,華而不實,荒涼,混濁,畸輕畸重,價高,空洞無物...“程度級別”詞語與“主張”詞語...由于python技術已經相當成熟而且具有相應的包下載,下文中將主要采用python作為數(shù)據分析工具。本文對挖掘之后的帖子進行以上的操作,并將否定詞的權重賦為-1,程度副詞按照相應的程度賦為相應的等級,最后求和。最后的和為正值代表為積極情感,負值代表為消極情感。投資者社交媒體情緒與股票市場價格波動之間的關系。4.1.樣本數(shù)據來源 本文選取了東方財富股吧作為研究對象。在國內的財經論壇中,東方財富股吧無疑是資格最老、活躍人數(shù)最多的那一個。下面抓取了幾大主流論壇的活躍量(2020.8-2020.9),從日均發(fā)帖量、日均閱讀量和日均活躍用戶三個維度進行評估。圖4.1四個論壇數(shù)據對比從圖中可以看出,東方財富股吧在三個方面無疑都對其他論壇有著壓倒性的優(yōu)勢。因此本文選用該論壇作為數(shù)據來源。作為股票市場的重要組成部分,創(chuàng)業(yè)板市場有其獨特特點。相較于主板來說,創(chuàng)業(yè)板市場在成立時間、股本規(guī)模、中長期表現(xiàn)這三方面要求更加寬松,也因此吸引力大量新興企業(yè)。由于創(chuàng)業(yè)板市場上市企業(yè)大多趨向于創(chuàng)業(yè)型企業(yè),所以將其命名為創(chuàng)業(yè)板。在創(chuàng)業(yè)板市場上市的公司是高科技公司,因此具有較大的成長空間,但是,這些公司往往成立時間較短,規(guī)模較小??梢哉f,創(chuàng)業(yè)板市場是一個門檻低、風險大、監(jiān)管嚴格的股票市場,也是科技型、成長型企業(yè)的溫床。相比于其他板,創(chuàng)業(yè)板體量較小,也更容易受到輿情的影響。同時,機構投資者也很少涉足創(chuàng)業(yè)板的事務。對于我們的主題來說,創(chuàng)業(yè)板股票無疑是完美的樣本。為了保證數(shù)據的可靠性,本文選擇各分類中最具關注的5只股票進行研究。分類參考深交所的行業(yè)分類,選取了各分類中股吧帖子數(shù)量最多的5只股票進行研究。4.2變量選取 (1)股票日收益率。本文的研究對象就是投資者情緒對股價的影響,使用股票兩日之間的收益率差值來進行衡量。為了方便統(tǒng)計,對兩者之間的差值取對數(shù)。計算公式如下:Reti,t=ln(Pi,t-pi,t-1)(4.1)Reti,t代表著i股票在t日收盤時候的日收益率。Pi,t代表著t股在i日時候的收盤價格,pi,t-1代表著t股在i-1日時候的收盤價格。 (2)股票換手率。換手率也稱“周轉率”,指在一定時間內市場中股票轉手買賣的頻率。如果投資者情緒出現(xiàn)波動,股票的買賣勢必受到影響。因此本文使用股票換手率作為一個衡量消費者情緒變化影響的因變量。計算公式如下:Tri,t=voli,t/tri,t(4.2)Tri,t指的是i股票在t日的換手率,voli,tl指的是i股票在t日時候的交易量,tri,t指的是i股票在t日時候的流通股本。 (3)投資者信心指數(shù),即CICSI。由國內學者以封閉式基金折價(DCEF)、交易量(TURN)、IPO數(shù)量(IPON)以及上市首日收益(IOPR)、新增投資者開戶數(shù)(NIA)、消費者信心指數(shù)(CCI)這六個變量為藍本,構建出一個包含著12個變量的投資者情緒指數(shù)(cicsit),并加入宏觀經濟變量的影響進行回歸之后的一個指數(shù)。相對于我們之前的工作來說,這個指數(shù)偏重于結構化的數(shù)據。兩者相結合才能更好反映出整個市場的情況。易志高,茅寧.中國股市投資者情緒測量研究:CICSI的構建[J].金融研究,2009,000(011):174-184.易志高,茅寧.中國股市投資者情緒測量研究:CICSI的構建[J].金融研究,2009,000(011):174-184. (4)波動率。股票的波動率指的是該股票在當天的收盤價與當天開盤價之比,如果一只股票的波動率較大,證明消費者情緒變化較大,同時為了方便計算,取對數(shù)后得:Volat=ln(pht-plt)/(pt-1)(4.3)Volat指的是此股票在第t天的波動率,pht為股票在第t日的最高價,plt指的是股票在第t日的最低價,pt-1所指的則是該股票在第t-1日的收盤價格。 (5)發(fā)帖量(Num)。本文中所指的是五家公司在東方財富吧平臺上發(fā)表的帖子數(shù)量。發(fā)帖量在一定程度上體現(xiàn)了網民對于公司的關注度,同時也體現(xiàn)了網民的投資傾向性。 (6)投資者情緒指標。目前常見的衡量辦法如下表所示:表4.1指標種類指標名稱指標由來以及含義單一直接指標投資者智能指數(shù)投資者智能指數(shù)(InvestorsIntelligence:)II指數(shù)是基于對一百多個報紙股評者的調查編制的。各評論被分類為看漲、看跌和看平三種。II指數(shù):看漲百分比數(shù)與看跌百分比數(shù)之差。美國個體投資者協(xié)會指數(shù)AAII美國散戶投資人情緒指數(shù)由美國散戶協(xié)會(TheAmericanAssociationofIndividualInvestors,簡稱AAII)所調查制成,于每周四發(fā)布結果。其調查方式只詢問AAII會員投資人一個問題:是否認為未來六個月的股市方向是向上(看多),沒有變化(持平)或下降(看空)。AAII于1987年開始進行投資人情緒調查,原先透過明信片郵寄方式,目前則是利用網絡投票。封閉式基金折價率封閉式基金折價率(Closed-endFundDiscountCEFD)封閉式基金折價:基金的交易價格小于其單位資產凈值(NAV)的情況。該數(shù)據可由每周公布的NAV得到。封閉式基金折價率計算公式:CEFD=(NAV-Price)/NAV一般認為,如果折價率上升,則意味著投資者情緒悲觀,由于封閉式基金大都由個體投資者持有,所以該指標可以衡量個體投資者情緒換手率詳見上文新開戶數(shù)量如果消費者對于整個交易市場的看法是樂觀的,新開戶數(shù)量就會顯著增多。單一間接指標BW情緒指數(shù)Baker和Wurgler在2006年發(fā)表的文章發(fā)現(xiàn)了投資者情緒對于投資的重大影響。文章選擇了封閉式基金折價率、股票換手率、IPO數(shù)量、IPO首日平均收益率等六個投指標基于主成分分析法構建了一個復合情緒指數(shù),以此來研究投資者的情緒指標與收益率之間的關系。復合指標由表可知,即使是目前,大多數(shù)的投資者的情緒指標也是相當主觀的。形式大多止于問卷調查或者當前市場的交易數(shù)據,而并非集中于投資者本身。而要想真正了解投資者,我們就必須深入到投資者中去。東方財富網股吧就給我們提供了一個這樣的數(shù)據樣本。在股吧里發(fā)言的都是真正的投資者,有著強烈的情緒和最真實的情感。在進行數(shù)據清洗之后,得到投資者情緒指數(shù):E=(?1)n×adv×emo其中E所表達的即為消費者情緒。正值代表著情緒為積極的,負值則為消極情緒。n為否定詞個數(shù),adv為程度副詞對應的分值,emo為情緒副詞對應的分值。(7)每股收益率(EPS):指的是稅后利潤與股本總數(shù)的比率。該指標反映了企業(yè)的經營能力,并用來衡量企業(yè)的獲利能力以及風險。是投資者用來了解企業(yè)的盈利能力,預測企業(yè)將來的發(fā)展前景的重要指標之一。(8)創(chuàng)業(yè)板指數(shù)日收益率(GDRR):為了排除大環(huán)境對研究結果的影響,本文使用創(chuàng)業(yè)板指數(shù)日收益率作為控制變量之一。公式表示為:Ret=ln(P公式中的Ret表示創(chuàng)業(yè)板指數(shù)日收益率,Pt指該只股票在第t天的收盤價,Pt-1指的該只股票在第t-1天的收盤價。表4.2變量含義變量名計算公式股票日收益率(Ret)Reti,t=ln(Pi,t-pi,t-1)換手率(Tr)Tri,t=voli,t/tri,t投資者信心指數(shù)(CICSI)來源于數(shù)據庫波動率(Vola)Volat=ln(pht-plt)/(pt-1)發(fā)帖量(Num)來源于抓取的數(shù)據投資者情緒指標(E)E=每股收益率(EPS)稅后利潤與股本總數(shù)的比值創(chuàng)業(yè)板指數(shù)日收益率(GDRR)Ret=4.3投資者情緒指標的統(tǒng)計4.3.1發(fā)帖數(shù)量的描述性統(tǒng)計 如圖所示,這是五個公司股吧數(shù)據的描述性統(tǒng)計。表4.3樣本統(tǒng)計來自東方財富、華誼兄弟、愛爾眼科、開元教育以及機器人的樣本數(shù)據統(tǒng)計樣本總量提問貼數(shù)量16.1708萬提問貼以及回答貼數(shù)量86.804萬起始日期-結束日期2020年1月1日至2020年12月31日總日數(shù)360每日平均發(fā)帖提問量107.2每貼平均閱讀量4.73由圖可知,作為最大的財經媒體之一,東方財富網網站的股吧擁有著眾多的擁護者,社區(qū)的氛圍非常良性,大部分的發(fā)帖都能得到回答。如此大的樣本已經能代表這個行業(yè)概況了。4.3.2發(fā)帖內容的描述性統(tǒng)計由于無法一一枚舉,下文中將以幾個例子來說明這個問題。通過python將文本內容分詞,去掉停用詞之后和情緒字典進行比對,最后得出結果。正如上文所說的那樣,作為情感的重要載體,正面的詞匯反映了正面的情緒,中性詞匯則反映了投資者的中性情緒,而負面詞匯則反映了投資者的負面情緒。以下是幾個具有代表性的帖子的表格:表4.3發(fā)帖內容示例類別言論舉例正面情緒哈哈哈哈哈哈,這天天爽是遇上財神了,謝謝老板給飯吃,是不是百分之九十漲停,是不是,第一次拉升落袋再進。福氣十足?中性情緒看了減持公告的評論,真的佩服某些啥散的智商,說什么完了,趕緊跑吧,請問你炒股不動腦子么?沒有腦子吵什么股?!減持主體,成本891,進來的,換成是你,你會虧著錢跑?現(xiàn)在行情這么好,啥13么?其次,他只減持4000萬股,還有百分之五的股份,德陽不知道他這個公告的殺傷力么?如果股價下跌,德陽剩下百分之五的股份豈不是虧得更多?這是他想看到的結果?這4000萬股,散戶接的住么?肯定接不住,那股價豈不是十個八個跌停?德陽得虧多少?!所以,這4000萬肯定有人接!無非就是制造短期利空,把傻散嚇出去,繼續(xù)洗盤!頂多兩三個跌停!傻散如果想制造恐慌,那你們趕緊掛單走,別在這拖后腿!

今天你跑了,以后別想回來!這里不歡迎墻頭草!負面情緒能走的時候不走,明天又搶著跑!我的判斷基本差不多,沒有死守的決心,還是見好就收比較好,免得最后狼狽離開,受盡煎熬,反復打臉,心態(tài)失衡!為了客觀的、定量的描述投資者的情緒,我們將引入情感詞典進行處理。對于每句話而言,其情緒指數(shù)可以由否定詞、程度副詞、情感詞來定義。首先將爬取出來的帖子進行數(shù)據清洗。進行分詞操作,找出帖子里的情感用詞、程度副詞以及否定詞。之后進行判斷,情感詞之前是否有程度副詞和否定詞?基于否定詞的個數(shù)將情感指數(shù)賦權,奇數(shù)個否定詞為-1,偶數(shù)個為1。同時基于程度副詞的強弱等級將情感指數(shù)賦權,強弱等級的判斷參見上文。最后將結果求和,如果為正數(shù),代表著帖子的態(tài)度是積極的。如果為負數(shù),代表著帖子的態(tài)度是消極的。4.3.3投資者情緒影響股價的機理 從直觀的角度來看,投資者情緒反應的就是投資者對于該股票的預期,即當投資者對股票市場抱有積極期望時,投資者情緒樂觀,此時相應股票的價格將會上漲。當投資者對股票市場持消極期望,他們的情緒是悲觀的,此時相應的股票的價格將會下跌。如今,在21世紀,隨著各種互聯(lián)網技術的不斷發(fā)展與壯大,互聯(lián)網的覆蓋率越來越高。因此,互聯(lián)網用戶可以通過互聯(lián)網更好地表達自己的感受,在線媒體已成為研究投資者情緒對股票價格影響的重要組成部分。4.4假設與假設 根據以上信息,我們可以提出幾個假設。假設一:股票收益率的絕對變化值與發(fā)帖量正相關。一般來說,投資者的情緒狀態(tài)也就代表了對股票走勢的預期。當股票走勢好的時候,投資者情緒高漲,進而表現(xiàn)在股吧帖子數(shù)量激增,繼續(xù)激發(fā)其他股民對于股票的信心。這兩者相互作用,促進股票的收益率增長。同時,當股票走勢差的時候,投資者情緒低迷,進而表現(xiàn)在股票帖子數(shù)量上升,導致其他股民對于股票更加悲觀,從而導致股票的收益率下降。因此,我們合理猜測:股票收益率變化的絕對值和發(fā)帖量是正相關的。假設二:發(fā)帖量的提高與換手率正相關,投資者信心指數(shù)與投資者情緒指數(shù)與換手率正相關。發(fā)帖量代表著股票在網絡上的受關注程度。因此,發(fā)帖量越大,股票價格波動越大,換手率也就越高。同時,換手率也反映了股票的流通程度。因此,兩個代表著投資者信心的指標越高,換手率也就越高。4.5構建模型 Cheung(1992)、Fama(1996)等研究表明,公司價值也對股票價格有著重要的影響。因此,本文中引入每股收益(EPS)作為回歸的控制變量之一。同時,由于股市有著大小年之分,我們不能排除市場收益率對股價的影響。為了說明股價的變化是源于消費者情緒的變化而非整體變化,本文中引入創(chuàng)業(yè)板指數(shù)日收益率(GDRR)作為另一個控制變量。 針對以上假設,本文將建立回歸模型來進行研究。首先是假設一:Ret=β0+β1NUM+β2GDRR+??(4.6)上述自變量和因變量含義參見前文,同時??為隨機誤差項。其次是假設二:TR=β0+β1NUM++β4EPS+β5GDRR+??(4.7)TR=β0+β1CICSI++β4EPS+β5GDRR+??(4.8)TR=β0+β1E++β4EPS+β5GDRR+??(4.9)4.6變量間的Pearson相關性分析(括號內為P統(tǒng)計量)表4.4變量間的Pearson相關性分析變量名NumRetTrVolaCICSIEEPSGDRRNum1Ret0.097(0.156)1Tr-0.053(0.226)0.008(0.378)1Vola0.003(0.056)0.012(0.134)0.215(0.006)1CICSI0.717(0.037)0.657(0.146)-0.443(0.013)0.237(0.002)1E0.917(0.002)0.567(0.010)-0.345(0.176)-0.115(0.023)0.871(0.002)1Eps0.145(0.001)0.756(0.008)-0.234(0.012)0.013(0.023)0.124(0.005)-0.078(0.003)1Gdrr0.126(0.326)0.879(0.001)0.004(0.918)-0.012(0.328)0.113(0.021)0.278(0.034)0.468(0.023)1從表中可以看出,發(fā)帖量與投資者情緒指標的相關性系數(shù)高達0.917,而且顯著性水平僅為0.002,我們可以認為兩者之間有著顯著的相關性。但是,發(fā)帖量和換手率之間的關系則沒有那么明顯,我們姑且可以認為這個相關性不存在。而我們本文著重研究的兩個指標,即消費者信心指數(shù)與消費者情緒指數(shù)則與換手率有著不小的正面影響。這也證明了假設二。而發(fā)帖量和波動性之間的關系則沒有那么顯著。同時,Eps和Gdrr與消費者情緒的兩個指標相關性較小,因此可以作為合格的控制變量。4.7回歸分析根據上述數(shù)據,我們對這幾家公司的數(shù)據利用spss軟件進行回歸分析。以下為數(shù)據分析結果:4.7.1對于假設1的回歸分析表4.5關于假設1的回歸分析結果匯總自變量因變量(股票日收益率)系數(shù)&T統(tǒng)計量截距項.218(7.12)***Num.014(4.18)***Gdrr1.175(2.67)**EPS.212(7.31)***調整后的R方0.217樣本量1825注:*,**,***分別表示在10%,5%,1%的水平下顯著。由此可見,方程的常數(shù)項β0為0.218且t值對應的顯著性水平小于0.05,因此該常數(shù)項具有顯著性。自變量來看:發(fā)帖量的顯著性較高,且與收益率正相關。這表明了假設1的正確性。4.7.2對于假設2的回歸分析:表4.6對于假設2的回歸分析結果匯總自變量因變量(換手率)系數(shù)&T統(tǒng)計量截距項1.378(4.21)***Num.018(2.176)**Gdrr.276(3.247)***EPS3.146(0.018)調整后的R方0.315樣本量1825自變量因變量(換手率)系數(shù)&T統(tǒng)計量截距項.079(6.24)***E3.186(6.168)***Gdrr.835(2.932)***EPS4.528(1.141)**調整后的R方0.587樣本量1825自變量因變量(換手率)系數(shù)&T統(tǒng)計量截距項12.128(1.34)**CICSI3.213(6.117)***Gdrr2.129(3.912)**EPS.954(0.124)調整后的R方0.496樣本量1825注:*,**,***分別表示在10%,5%,1%的水平下顯著。由此可見,方程的常數(shù)項t值對應的顯著性水平小于0.05,因此該常數(shù)項具有顯著性。自變量來看:雖然發(fā)帖量的顯著性水平較高,但是系數(shù)較低。發(fā)帖量變化一個單位僅對收益率產生0.018的影響,因此暫且認為,發(fā)帖量的影響較小。除此之外,CICSI、投資者情緒指數(shù)均存在著顯著的正面影響。具體數(shù)據囿于數(shù)據的特殊性無法估算,但是顯著性水平是非常高的。結論與展望5.1結論本文利用了python爬蟲技術,從開放式的網絡平臺里提取出相應的數(shù)據后,通過python的nlp包做出情感分類從而構造出了投資者情緒指數(shù),研究投資者情緒與股票市場的關系。具體研究結論如下:第一,研究結果表明,開放論壇中的投資者情緒能夠顯著的影響股市的價格。投資者情緒越高昂,相應的股票收益率也就越高。投資者情緒越低落,相應的股票收益率也就越低。同時,通過兩種不同類型的數(shù)據對比,我們發(fā)現(xiàn):投資者情緒指數(shù)的顯著程度要遠遠大于投資者信心指數(shù)的顯著程度。這也說明了文本型,非結構化的數(shù)據的解釋力度要比數(shù)值型,結構化的解釋力度要好。以文本為藍本的研究要比以數(shù)值為藍本的研究更具有說服力。本文中采取的研究辦法是具有現(xiàn)實意義的。同時,從我們的研究結果來看,發(fā)帖量與股市價格的相關性雖然很高,但是影響力卻很小,在兩個回歸方程中的系數(shù)均很低。如果從發(fā)帖量來判斷股票市場的價格,會造成誤導,從而導致投資的失敗。第二,根據研究結果來看,投資者情緒指數(shù)、投資者信心指數(shù)均對個股換手率有正面影響。而情緒指標的相關性更好,這說明非結構性數(shù)據仍是一片尚待開發(fā)的藍海。根據回歸結果分析,發(fā)帖量對股票的換手率的影響不是很大,所以交易平臺中的投資者,即東方股吧中的股民多數(shù)還是相對理性的。5.2政策與展望大數(shù)據時代的到來,使得我們對技術的依賴性不斷增加,信息技術對我們的日常生活產生著越來越大的影響。我們在網絡論壇上表達自己情緒的同時,也影響著其他的投資者。由于網絡的特性,這些意見會被放大,影響著越來越多的人。我們的言

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論