




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、“數(shù)理統(tǒng)計”課程綜合作業(yè)作業(yè)要求為了考核同學(xué)們綜合運用統(tǒng)計方法解決實際問題的過程,請同學(xué)們結(jié)合當(dāng)前社會生活實際中的問題,自己擬定一個研究題目,并應(yīng)用參數(shù)估計、假設(shè)檢驗、回歸分析、方差分析、正交設(shè)計(這些方法中至少選擇兩個)對其進行分析。要求:(一) 內(nèi)容必須涵蓋以下幾個方面:1.題目;2.研討的問題是什么;3.相關(guān)的數(shù)據(jù)及來源;4.建立的統(tǒng)計模型和統(tǒng)計問題是什么,樣本數(shù)據(jù)是什么;5.使用的統(tǒng)計方法是什么?使用的統(tǒng)計分析軟件是什么?5.計算過程(若統(tǒng)計軟件,其計算結(jié)果是什么)6.對計算結(jié)果的說明或解釋。(二) 格式 包括報告題目、摘要、正文、參考文獻和附錄五個部分。正文內(nèi)容一般包括問題描述、數(shù)據(jù)
2、描述、模型建立、統(tǒng)計方法選擇和問題求解、結(jié)果分析等內(nèi)容。報告用Word 文本格式,中文字使用宋體、小四號字,英文用Roman 字體5 號字,數(shù)學(xué)符號用MathType 輸入。題 目(黑體,三號)摘要:(200-400字)(黑體,小四)正文(正文標(biāo)題:宋體,粗體,小四)一、問題提出。(正文內(nèi)容:宋體,五號)二、數(shù)據(jù)描述(用表格表達數(shù)據(jù)信息,指出數(shù)據(jù)來源或提供原始數(shù)據(jù))三、建立統(tǒng)計模型四、統(tǒng)計方法設(shè)計和方法使用的條件,計算工具的選擇。五、計算過程和計算結(jié)果。六、結(jié)果分析。參考資料(標(biāo)題:宋體,粗體,小四,內(nèi)容:宋體,五號)附錄(標(biāo)題:宋體,粗體,小四,內(nèi)容:宋體,五號)(三) 課外作業(yè)提交形式紙質(zhì)
3、材料和電子文檔注意:紙質(zhì)材料打印內(nèi)容從封面開始,包括作業(yè)要求,直至作業(yè)的所有內(nèi)容。電子文檔:先提交給班長,再由班長將壓縮文件提交給老師。特別注意電子文檔的名稱,按如下模板寫: 2011級某班“數(shù)理統(tǒng)計”綜合作業(yè)姓名,學(xué)號。(四) 課外作業(yè)提交時間參加課程考試那天上午提交紙質(zhì)材料,當(dāng)天班長提交電子文檔給老師。請注意:不能復(fù)制現(xiàn)有成果,同學(xué)之間也不能相互復(fù)制內(nèi)容。 股票市場中變量之間的關(guān)系摘要: 在經(jīng)濟飛速發(fā)展的當(dāng)代,金融市場占據(jù)著半壁江山,而在金融市場中股票作為公司籌資的重要來源,它占據(jù)著重要的地位,我接下來就是要研究股票市場中變量之間的關(guān)系,通過統(tǒng)計分析方法還原大數(shù)據(jù)時代海量數(shù)據(jù)所反映的事實,
4、以及數(shù)據(jù)之間的規(guī)律性。 首先用統(tǒng)計中的參數(shù)估計的方法對所得數(shù)據(jù)進行分析建立模型Y=X+,對搜集到的數(shù)據(jù)做參數(shù)估計,即最小二乘估計。然后對數(shù)據(jù)建立回歸預(yù)測的模型,用回歸分析的方法對搜集到的中證100股指的數(shù)據(jù)建立線性模型,用R軟件編程進行求解,最后求出的估計值并用R軟件畫出殘差圖并與實際走勢相比較。最后對所得結(jié)果進行分析,聯(lián)系實際的K線圖,檢驗預(yù)測的效果,對R軟件中得出的異常點進行分析,用三種不同的方法得到的結(jié)果進行比較,分析此次分析對實際問題的實用性。中證100指數(shù)的回歸分析1 問題的提出生活在21世紀(jì),這個信息的海洋里,每天都面對著海量的數(shù)據(jù),而與我們并不遙遠(yuǎn)的金融市場更是信息的集中體,股票
5、期權(quán)等每秒都有上億的數(shù)據(jù)信息量,面對如此多的數(shù)據(jù)信息,如何才能從眾多的股票中選出優(yōu)質(zhì)股進行投資成為人們爭奪的熱點,其實我們可以用統(tǒng)計的方法來解決這些問題。下面便針對這種現(xiàn)象提出如下的問題:請搜集有關(guān)股票數(shù)據(jù)并對其變量用統(tǒng)計方法進行分析。2 數(shù)據(jù)描述在大智慧軟件上搜集中證100的指數(shù),并對中證100支成分股搜集15分鐘k線的收盤價,共352組樣本數(shù)據(jù)得到如下數(shù)據(jù):(具體見附錄) 三.建立統(tǒng)計模型對搜集到的數(shù)據(jù)進行建模,因為影響因變量中證100收盤價Y的共有100支股票,設(shè)這一百只股票分別為X1,X2,X3.X99,X100.這100個變量與Y有如下相關(guān)關(guān)系:Y=+x+.+其中 N(0,) 且co
6、v()=0,ij.即建立了線性模型: Y=X+ E=0,cov()=I參數(shù)估計: 對上述建立的模型進行參數(shù)估計,設(shè)=()為的估計量,則稱為線性回歸方程,殘差平方和為給定觀測數(shù)據(jù)()i=1,2,3.100就是的最優(yōu)解即 (1)的解由(1)式可知為正規(guī)方程 rank()=rank(X)=p+1所以得到的LS 估計為即4、 統(tǒng)計方法設(shè)計和方法使用的條件,計算工具的選擇。 用用R軟件對所搜集的數(shù)據(jù)進行用回歸分析的方法對最小二乘估計進行計算,并用回歸分析建立回歸模型,首先把數(shù)據(jù)中缺失的即停盤的股票刪去,并將缺失的補齊,另存為Csv文件,下面在R軟件中編程進行解答。下面是程序DA=read.csv(fil
7、e=file.choose(),head=T)> library(nnls)> x=as.matrix(DA,2:101)> y=as.vector(DA,1)> a=2:101> b=0.000373465> D=data.frame(a,b)> b0=as.vector(D,2)> y1=y-x%*%b0> nnr<-nnls(x,y1)> nnr> coef<- coef(nnr)+0.000373465> coef五、計算過程和計算結(jié)果。對數(shù)據(jù)做正回歸分析得出結(jié)果:coef(提取系數(shù)向量的估計值) 1
8、1.986219993 45.724918486 14.346167164 0.000373465 2.901370739 6.540717465 0.114566603 9.684098103 36.471730436 0.682356715 0.000373465 12 0.000373465 0.835485658 0.000373465 3.471582198 0.000373465 1.488914287 1.500925835 0.000373465 0.000373465 0.000373465 0.000373465 23 0.000373465 0.000373465 14.
9、426982052 31.705891305 0.000373465 0.000373465 0.000373465 18.460676674 0.000373465 0.000373465 0.000373465 34 0.000373465 0.000373465 0.000373465 0.000373465 5.243724570 12.354343316 0.000373465 0.000373465 0.000373465 0.000373465 0.000373465 45 0.000373465 0.000373465 0.671666765 0.000373465 0.000
10、373465 0.000373465 1.631742836 0.000373465 0.000373465 0.000373465 29.402227896 56 3.856391237 0.000373465 0.000373465 4.298749228 0.000373465 0.000373465 0.000373465 0.000373465 0.000373465 0.000373465 0.000373465 67 0.000373465 1.425965346 0.000373465 0.000373465 0.000373465 11.102420742 0.0003734
11、65 0.000373465 0.000373465 0.000373465 0.000373465 78 1.044591680 0.000373465 0.000373465 0.000373465 6.580593133 0.000373465 0.000373465 0.000373465 0.000373465 0.799960901 0.000373465 89 0.000373465 23.851547917 17.240759376 0.000373465 0.000373465 0.000373465 0.000373465 0.000373465 3.079589529 0
12、.000373465 0.000373465100 0.000373465x estimates: 1.985847 45.72455 14.34579 0 2.900997 6.540344 0.1141931 9.683725 36.47136 0.6819832 0 0 0.8351122 0 3.471209 0 1.488541 1.500552 0 0 0 0 0 0 14.42661 31.70552 0 0 0 18.4603 0 0 0 0 0 0 0 5.243351 12.35397 0 0 0 0 0 0 0 0.6712933 0 0 0 1.631369 0 0 0
13、 29.40185 3.856018 0 0 4.298376 0 0 0 0 0 0 0 0 1.425592 0 0 0 11.10205 0 0 0 0 0 1.044218 0 0 0 6.58022 0 0 0 0 0.7995874 0 0 23.85117 17.24039 0 0 0 0 0 3.079216 0 0 0 residual sum-of-squares: 9190由X的估計值得到下列回歸方程:Y=1.985847x1+45.72455x2+14.34579x3+2.900997x5+6.540344x6+0.1141931x7+9.683725 x8+36.47
14、136x9+0.6819832x10+0.835112x13+3.471209x15+1.488541x17+1.500552x18+14.42661x25+.+3.079216x98.可以看到殘差平方和為9190X的估計值系數(shù)也均為正的回歸系數(shù)殘差圖如下實際走勢與預(yù)測效果圖如下:從上圖可以看出此次回歸預(yù)測與實際走勢基本吻合。六、結(jié)果分析。下面對結(jié)果進行分析:分析方法:正態(tài)性檢驗此次檢驗選用了較為簡單的QQ圖進行檢驗分析,在R軟件中輸入以下的程序:DA=read.csv(file=file.choose(),head=T)lm.sz=lm(YX1+X2+X3+X4+X5+X6+X7+X8+X9
15、+X10+X11+X12+X13+X14+X15+X16+X17+X18+X19+X20+X21+X22+X23+X24+X25+X26+X27+X28+X29+X30+X31+X32+X33+X34+X35+X36+X37+X38+X39+X40+X41+X42+X43+X44+X45+X46+X47+X48+X49+X50+X51+X52+X53+X54+X55+X56+X57+X58+X59+X60+X61+X62+X63+X64+X65+X66+X67+X68+X69+X70+X71+X72+X73+X74+X75+X76+X77+X78+X79+X80+X81+X82+X83+X84
16、+X85+X86+X87+X88+X89+X90+X91+X92+X93+X94+X95+X96+X97+X98+X99+X100,data=DA)summary(lm.sz)plot(lm.sz,2)#對數(shù)正態(tài)QQ殘差圖#條件數(shù)的計算XX<-cor(DA3:101)#變量相關(guān)系數(shù)矩陣kappa(XX,exact=TRUE)#求矩陣的條件數(shù) 條件數(shù)1 2610739eigen(XX)#求矩陣的特征值得到如下的QQ圖:從圖中可以看出第139,321,76組的數(shù)據(jù)異常下面對數(shù)據(jù)異常點進行診斷分析:程序為:p=1n=nrow(DA)d1=dffits(lm.sz)cf=1:ncfabs(d1)
17、>2*sqrt(p+1)/n)#庫克距離計算infl=lm.influence(lm.sz,do.coef=FALSE)D=cooks.distance(lm.sz,infl=lm.influence(lm.sz,do.coef=FALSE),rs=weighted.residuals(lm.sz),sd=sqrt(deviance(lm.sz)/df.residual(lm.sz),hat=infl$hat)sort(D)#按從小到大的順序排列#協(xié)方差比診斷D=abs(1-covratio(lm.sz, infl=lm.influence(lm.sz, do.coef = FALSE)
18、,res = weighted.residuals(lm.sz)sort(D)最后得出的結(jié)果是:1.由WK距離共有28個異常點2.用庫克距離診斷知:距離最大的是322和333.即2013年10月23號 10:45和15:00的數(shù)據(jù),但是距離值僅為0.0594和0.0544,在大智慧中23號的走勢如下3:002:3010:45從圖中可以看出在異常點10:45時股票價格達到了最大,此時是拋售股票的最佳時機,之后股票價格大幅下跌,而在異常點2:30和3:00中軌線和下軌線經(jīng)歷了一段時間的穩(wěn)定狀態(tài)后開始復(fù)蘇,到3:15時收盤價遠(yuǎn)遠(yuǎn)低于開盤價,所以異常點指導(dǎo)股民在3:00之前一定要拋售,否則將面臨更加大的虧損.因此,分析表明異常點為股票出現(xiàn)漲?;虻5念A(yù)示,給股民一定的指導(dǎo)意義,很
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度老舊小區(qū)改造施工安全免責(zé)及物業(yè)管理協(xié)議
- 2025年度股權(quán)贈與及公司治理結(jié)構(gòu)優(yōu)化協(xié)議
- 二零二五年度抑郁癥患者心理危機干預(yù)服務(wù)合同
- 2025年度新能源設(shè)備購銷戰(zhàn)略框架協(xié)議
- 二零二五年度知識產(chǎn)權(quán)侵權(quán)代理解除協(xié)議書范文
- 二零二五年度科技創(chuàng)新貸款共同還款協(xié)議
- 二零二五年度創(chuàng)業(yè)團隊股份分配保密協(xié)議
- 2025年度設(shè)備拆除安全應(yīng)急預(yù)案編制與演練合同
- 二零二五年度辦公樓租賃及稅收優(yōu)惠政策協(xié)議
- 二零二五年度生態(tài)保護區(qū)拆遷居民安置協(xié)議
- 【道法】做自信的人課件 2024-2025學(xué)年統(tǒng)編版道德與法治七年級下冊
- 高一英語完形填空專項訓(xùn)練100(附答案)及解析
- 設(shè)計報告001模擬通信系統(tǒng)的SIMULINK建模仿真
- 橫河氧量變送器標(biāo)定及檢修
- 沉降觀測常用表格
- 建設(shè)工程規(guī)劃放線、驗線申請表
- 績效考核 五金廠績效考核
- 金合極思打板與放碼系統(tǒng)幫助目錄
- 勵磁系統(tǒng)檢修規(guī)程
- WE-100B300B600B1000B型萬能材料試驗機使用說明書
- 相聲《治病》
評論
0/150
提交評論