版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、網(wǎng)絡(luò)新聞評論的情感傾向?qū)墒惺找媛实挠绊懱骄客醅幣逡噪S著股市的不斷發(fā)展,各種股市理論研究層出不窮,從最初由Bachelier(1900)隨即漫步理論(RandomWalkTheoryRWT)和samuelson(1960's)有效市場理論(EfficientMarketHypothesisEMH),認(rèn)為市場是隨即有效不可預(yù)測的,到如今運(yùn)用逐漸完善的基本面分析方法和技術(shù)分析方法,對股市的運(yùn)行進(jìn)行了科學(xué)的闡釋。如今基本面分析方法和技術(shù)分析方法仍是股市分析的主流方法。但是,自Kahneman和Tversky通過研究人們的非理性決策進(jìn)而提出前景理論(ProspectTheory),并于200
2、2年獲得諾貝爾經(jīng)濟(jì)學(xué)獎以來,投資者情緒與市場的關(guān)系越來越受到學(xué)術(shù)界的關(guān)注。學(xué)者們基于認(rèn)知心理學(xué)發(fā)展的最新研究成果,從行為金融學(xué)的視角,進(jìn)行理論和實(shí)證兩方面研究,試圖以全新的視角來揭示股票市場收益與波動內(nèi)在原因。目前國內(nèi)外學(xué)者更多的基于BakerM和WurglerJ.(2006)1提出的六個(gè)代理變量:封閉式基金折價(jià)、股票換手率、IPO數(shù)量和上市首日平均收益率、股權(quán)融資的比例股利升水等間接指標(biāo)來探究情緒對股市的影響,本文希望運(yùn)用更貼近直接情感的評論的中情感傾向來探究對股市收益率的影響,本文的研究是基于RobertP.Schumaker(2012)1BakerM,WurglerJ.Inveester
3、sentimentandthecrosssectionofstockreturnJ.JournalofFinance,2006,61(4);1645-1680,-C,一、,.一,一,一,l,RobertPSchumakera,?,YuleiZhangb,Chun-NengHuangc,HsinchunChend,Evaluatingsentimentinfinancialnewsarticles,DecisionSupportSystems53(2012)458464研究方法,并有所改進(jìn)。數(shù)據(jù)的預(yù)處理互聯(lián)網(wǎng)新聞情感分析模型架構(gòu)預(yù)處理主客觀分析訓(xùn)練分詞處理期據(jù)去噪網(wǎng)絡(luò)財(cái)經(jīng)新聞詞性標(biāo)注分類器H情感
4、分類器褒貶分析訓(xùn)練特征選取優(yōu)化參教融感典金情詞在本文中,我們借鑒PaganandSossounov(2003)的非參數(shù)法,適當(dāng)調(diào)整其中的牛、熊市判別標(biāo)準(zhǔn),通過尋找股價(jià)變化的波峰和波谷,診斷股票市場的牛、熊周期。60004000刈2011.042012.05改口2010.072011.122015.06二才W-二忘-匚0號(m2T?寸=b寸“巴母二S2E二£0禽HUEHimT3尊H寸孑e晟一國N二弓I鼾I一三昴一-Hwa-o-叫人早QH中國Qo2013.07但是后來我們發(fā)現(xiàn)其實(shí)從2013年7月到2014年10月上證綜指的漲跌幅不超過3%,于是,我們在原先的定義基礎(chǔ)上增加了大家常提到的“
5、猴市”,也就是震蕩市,最終,本文選取2014年5月-2014年7月的數(shù)據(jù)作為猴市樣本,2014年8月到2014年10月的數(shù)據(jù)作為牛市樣本,2015年8月-2015年10月的數(shù)據(jù)作為熊市樣本,略過股災(zāi)期,互聯(lián)網(wǎng)新聞評論來自東方財(cái)富網(wǎng)。情感指標(biāo)與初步模型Bt,MtfMtbuyMtsellbuysellMt=MtMtSent=Btln(1Mt)本文采用WernerAntweilerandMurrayZ.Frank(2004)的情感指標(biāo)作為研究對象,目前大多數(shù)研究采用一天作為時(shí)間窗口,本文采用RobertP.Schumaker(2012)的20min作為時(shí)間窗口來探索一天內(nèi)影響的情況。Rt=C、;Se
6、n;(RtRt1Rtj)/j=C八'Sent;股市的收益率,本文采用上證綜指的20min的漲跌幅作為研究對象實(shí)驗(yàn)過程三個(gè)時(shí)間段的數(shù)據(jù)處理過程類似,僅以熊市數(shù)據(jù)為例首先引入數(shù)據(jù)LibnameProject研一SASFinalproject'PROCIMPORTOUT=Project.stockbearDATAFILE=研一熊市數(shù)據(jù).txt"DBMS=TABREPLACE;GETNAMES=YES;DATAROW=2;RUN;引入數(shù)據(jù)后,因?yàn)榍楦兄笖?shù)和股市收益率都是時(shí)間序列數(shù)據(jù),為了防止“偽回歸”的出現(xiàn),需要對sent和R進(jìn)彳TADF單位根檢驗(yàn)procautoregdat
7、a=Project.stockbear;modelreturn=/stationarity=(adf=3);run;結(jié)果如下:AUTOREG過程sent增廣Dickey-Fuller單位根檢驗(yàn)滯后RhoPr<RhoTauPr<TauFPr>F零均值3-168.7811<.0001-8.0059<.0001單均值3-169.3343<.0001-8.0047<.000132.0383<.0010趨勢3-176.1743<.0001-8.1545<.000133.2709<.0010AUTOREG過程Return增廣Dickey-F
8、uller單位根檢驗(yàn)滯后RhoPr<RhoTauPr<TauFPr>F零均值3-647.5513<.0001-12.2758<.0001單均值3-654.8968<.0001-12.2971<.000175.6091<.0010趨勢3-654.9962<.0001-12.2870<.000175.4865<.0010可以看出在1%的顯著水平下,sent和R是平穩(wěn)的,沒有單位根,然后又進(jìn)行了滯后1階、2階,4階的檢驗(yàn),P-Value均小于0.001,所以可以認(rèn)為sent和R是平穩(wěn)的。然后,為數(shù)據(jù)集增加新的變量sent1為sentt
9、-1,以此類推sent2,sent3,sent_4,sent_5,sent_6,分別為sent的t-2至t-6項(xiàng)。本文希望探究時(shí)隔多久情感因素對股市的影響最大,影響持續(xù)的時(shí)間會有多長。AVGR新兩期收益的平均值,用于檢驗(yàn)時(shí)間窗口的長度是否會影響情感變量的選取和顯著程度dataProject.stockbearl;|setProject.stockbear;|AVGR2=(return+lag(return)/2;sent_1=lag(sent);sent_2=lag(sent_1);sent_3=lag(sent_2);sent_4=lag(sent_3);sent_5=lag(sent_4)
10、;sent_6=lag(sent_5);run;生成新的數(shù)據(jù)集后,首先本文對各個(gè)變量進(jìn)行了Pearson相關(guān)性分析:Pearson相關(guān)果散Prob>IdunderHO:Rho=0觀測數(shù)sentsent_1sent_2seni_3seni_4sent_5seni_6Returnsent1.00000S4S44178c.000151S0.25687<00015170126780.00395170138700.0016S16012&4500041512018731c.00015120.2586&<0001S451D.4417&<000151&1
11、.000005440.442i4<0001517026687<00315170/12&870,00395160138910001B5150.12649.0041512O.OOWQ6447S44sent_2026587<00015170.44234<.0001517h000000.U234<.00015170.25590<,00015150.124985,0D4S5150.13B510.0016515FQ350904144543sent_3D.1267800039517Q.25687<00015V0.44234<00015171.00000
12、543044234<.0001517D.26S90<00015160.124960045515-0.057730.1752543sent_4D.1387D00016SI6D126870039516D.265WSU0.44234£00015171O(XM)DS4204416&<ooai516D.2659Dc.00015160.0432fi0.3138542sent_5D.1264900D41512Q138910.00165150.124M0004.5515026590<0001516044166<.00015161oooaoS410.441&
13、;6<00015160.083190.0531541sent_60.10731v.00015120J25490.00415120.13351D.D0165150.1249SQ.G0455150253go5160.44166<00015151.000005410.095440.0264541Return02湖50001545000B4209447544-00350904144543-0U5773017S2543D043JB0.313554206319005315410095440.02&45411.DQ0CX)574可以看出在各個(gè)自變量之間的相關(guān)性并不強(qiáng),可能出現(xiàn)多重共線性的
14、可能性小,回歸時(shí)我們選用逐步回歸法,將sent和sent的一階至六階滯后項(xiàng)都做為自變量進(jìn)行回歸。方差分析模型30.002514130.02800校正合計(jì)4160.03051源自由度平方和均方F值Pr>0.0008361012.33<.00010.00006781均方根誤差0.00823R方0.0822因變量均值-0.00025283調(diào)整R方0.0755變異系數(shù)-3256.92892參數(shù)估計(jì)變量自由度參數(shù)標(biāo)準(zhǔn)誤差t值Pr>|t|容差力差膨脹Intercept1-0.000319710.00040373-0.790.4289.0sent10.002640.000450775.85
15、<.00010.817011.22398sent_11-0.000832480.00046614-1.790.07480.776061.28857sent_31-0.000790900.00042327-1.870.06240.927971.07762共線性診斷個(gè)數(shù)特征值條件指數(shù)偏差比例Interceptsentsent_1sent_311.582791.000000.005760.185290.207870.1212720.995171.261140.991950.001420.006300.000600560.869521.349190.000161720.225490.019240
16、.7867440.552521.692540.002140.587790.766590.09139結(jié)果分析:根據(jù)方差分析我們可以看出在1%的顯著性水平下從方程的整體的整體擬合效果是顯著,從各個(gè)自變量來看,在其他變量不變的情況下,sent增加一個(gè)單位,因變量hrearn增加約0.00264個(gè)單位,其他變量的解釋原理相同,但在5%勺顯著水平下根據(jù)多重共線性診斷可以看出vif值小于10,且在1附近不存在嚴(yán)重多重共線性。問題R-square較小,說明還有很多影響股市收益率的因素未考慮在內(nèi),但是在只考慮情感因素的前提下,R-square能達(dá)到8流右,足以說明,情感因素在股市收益率的變動過程中起到了不可替
17、代的作用。同理,對猴市數(shù)據(jù)和牛市數(shù)據(jù)進(jìn)行相同的分析。其ADF檢驗(yàn),相關(guān)系數(shù)分析與前者類似。以下只對回歸結(jié)果進(jìn)行分析猴市結(jié)果如下:方差分析源自由度平方和F值Pr>F模型10.000013040.000013044.660.0315誤差424校正合計(jì)4250.001190.001200.00000280均方根誤差0.00167R方0.0109因變量均值0.00007034調(diào)整R方0.0085變異系數(shù)2378.74944參數(shù)估計(jì)變量自由度參數(shù)標(biāo)準(zhǔn)誤差t值Pr>|t|容差力差膨脹Intercept1-0.000053460.00009931-0.540.5907.0sent_610.000
18、204680.000094852.160.03151.000001.00000共線性診斷個(gè)數(shù)特征值條件偏差比例指數(shù)Interceptsent_611.577681.000000.211160.2111620.422321.932790.788840.78884牛市結(jié)果如下:方差分析源自由度平方和均方F值Pr>F模型10.000046340.000046348.460.0040方差分析源自由度平方和誤差2450.00134校正合計(jì)2460.00139均方F值Pr>F0.00000548均方根誤差0.00234R方0.0334因變量均值0.00014452調(diào)整R方0.0294變異系數(shù)1
19、619.54926參數(shù)估計(jì)變量自由度參數(shù)標(biāo)準(zhǔn)誤差t值Pr>|t|容差力差膨脹Intercept1-0.000102310.00017140-0.600.5511.0sent10.000527660.000181412.910.00401.000001.00000共線性診斷個(gè)數(shù)特征值條件指數(shù)偏差比例Interceptsent1.495081.000000.252460.252460.504921.720770.747540.74754比較三個(gè)結(jié)果可以看出:在猴市熊市和牛市中,首先共同點(diǎn),在情感對股市收益率都有正向影響,且都顯著;受情感因素影響最大的是熊市時(shí)期,其次是牛市,再者是猴市;熊市和
20、牛市受當(dāng)期情感因素的影響,且影響時(shí)間較短,而熊市則受到6期前的影響更大。最后為了檢驗(yàn)三市劃分的合理性,本文對三個(gè)時(shí)間段的數(shù)據(jù)進(jìn)行了合并與分組,進(jìn)行了方差齊性檢驗(yàn)。dataProject.stockmonkey2;|setProject.stockmonkey;|group=1;run;dataProject.stockbull2;|setProject.stockbull;group=2;run;dataProject.stockbear2;|setProject.stockbear;|group=3;run;datastock;mergeProject.stockmonkey2Project
21、.stockbull2Project.stockbear2;bygroup;run;procanovadata=stock;classgroup;modelsent=group;meansgroup/duncan;run;因變量:sent源自由度平方和模型271.34145019461526.480136校正合計(jì)19481597.821586均方F值Pr>F35.67072545.47<.00010.784419R方變異系數(shù)均方根誤差sent均值0.044649266.22390.8856750.332680源自由度Anova平方和均方F值Pr>Fgroup271.34145
22、01635.6707250845.47<.0001在1%的顯著性水平在三個(gè)時(shí)期的情感的組內(nèi)均值有顯著性差異,所以分組分析是合理的附件1SAW序LibnameProject研一SASFinalproject'PROCIMPORTOUT=Project.stockmonkeyDATAFILE=研一猴市數(shù)據(jù).txt"DBMS=TABREPLACE;GETNAMES=YES;DATAROW=2;RUN;procautoregdata=Project.stockmonkey;modelsent=/stationarity=(adf=3);run;procautoregdata=P
23、roject.stockmonkey;modelreturn=/stationarity=(adf=3);run;dataProject.stockmonkey1;|setProject.stockmonkey;|AVGR2=(return+lag(return)/2;sent_1=lag(sent);sent_2=lag(sent_1);sent_3=lag(sent_2);sent_4=lag(sent_3);sent_5=lag(sent_4);sent_6=lag(sent_5);run;proccorrdata=Project.stockmonkey1;varsentsent_1se
24、nt_2sent_3sent_4sent_5sent_6return;run;proccorrdata=Project.stockmonkey1;varsentsent_1sent_2sent_3sent_4sent_5sent_6AVGR2;run;procregdata=Project.stockmonkey1;modelReturn=sentsent_1sent_2sent_3sent_4sent_5sent_6/tolvifcollinselection=stepwiser;run;procregdata=Project.stockmonkey1;modelAVGR2=sentsent
25、_1sent_2/tolvifcollinselection=stepwiserrun;LibnameProject研一SASFinalproject'PROCIMPORTOUT=Project.stockbullDATAFILE=研一牛市數(shù)據(jù).txt"DBMS=TABREPLACE;GETNAMES=YES;DATAROW=2;RUN;procautoregdata=Project.stockbull;modelsent=/stationarity=(adf=3);run;procautoregdata=Project.stockbull;modelreturn=/stat
26、ionarity=(adf=3);run;dataProject.stockbull1;|setProject.stockbull;|AVGR2=(return+lag(return)/2;sent_1=lag(sent);sent_2=lag(sent_1);sent_3=lag(sent_2);sent_4=lag(sent_3);sent_5=lag(sent_4);sent_6=lag(sent_5);run;proccorrdata=Project.stockbull1;varsentsent_1sent_2sent_3sent_4sent_5sent_6return;run;pro
27、ccorrdata=Project.stockbull1;varsentsent_1sent_2sent_3sent_4sent_5sent_6AVGR2;run;procregdata=Project.stockbull1;|modelReturn=sentsent_1sent_2sent_3sent_4sent_5sent_6/tolvifcollinselection=stepwiser;run;procregdata=Project.stockbull1;|modelAVGR2=sentsent_1sent_2sent_3sent_4/tolvifcollinselection=stepwiser;run;LibnameProject研一SASFinalproject'PROCIMPORTOUT=Project.stockbearDATAFILE=研一熊市數(shù)據(jù).txt"DBMS=TABREPLACE;GETNAMES=YES;DATAROW=2;RUN;procautoregdata=Project.stockbear;modelsent=/stationarity=(adf=3);run;procautoregdata=Project.stockbear;modelreturn=/stationarity=(adf=1);run;
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 小學(xué)數(shù)學(xué)二年級100以內(nèi)連加連減口算題卡
- 2025年中考語文文言文總復(fù)習(xí)-學(xué)生版-專題02:文言文閱讀之虛詞意義和用法(練習(xí))
- 廣東省汕頭市2023-2024學(xué)年高三上學(xué)期普通高中畢業(yè)班期末調(diào)研測試英語試題
- 建筑設(shè)計(jì)銷售工作總結(jié)
- 家具店衛(wèi)生消毒標(biāo)準(zhǔn)
- 美容美發(fā)店前臺工作體會
- 《親子上網(wǎng)樂》課件
- 《尿路癥狀的鑒別》課件
- 體育行業(yè)賽事組織管理總結(jié)
- 醫(yī)療行業(yè)護(hù)理師培訓(xùn)總結(jié)
- 《業(yè)務(wù)員銷售技巧》課件
- 《汽車涂裝》2024-2025學(xué)年第一學(xué)期工學(xué)一體化課程教學(xué)進(jìn)度計(jì)劃表
- 水廠安全管理培訓(xùn)
- 江西省贛州市2023-2024學(xué)年高一上學(xué)期期末考試化學(xué)試題 附答案
- 消化道出血護(hù)理常規(guī)課件
- 2024年物流運(yùn)輸公司全年安全生產(chǎn)工作計(jì)劃例文(4篇)
- 二零二四年度軟件開發(fā)合同:凈水器智能控制系統(tǒng)定制開發(fā)協(xié)議3篇
- 貴州省銅仁市2023-2024學(xué)年高二上學(xué)期期末質(zhì)量監(jiān)測試題 地理 含答案
- 糖尿病肌少癥
- 期末卷(一)-2023-2024學(xué)年高一年級地理上學(xué)期高頻考題期末測試卷(江蘇專用)(原卷版)
- 山東師范大學(xué)《古代文學(xué)專題(一)》期末復(fù)習(xí)題
評論
0/150
提交評論