“數(shù)理統(tǒng)計(jì)”綜合作業(yè)_第1頁(yè)
“數(shù)理統(tǒng)計(jì)”綜合作業(yè)_第2頁(yè)
“數(shù)理統(tǒng)計(jì)”綜合作業(yè)_第3頁(yè)
“數(shù)理統(tǒng)計(jì)”綜合作業(yè)_第4頁(yè)
“數(shù)理統(tǒng)計(jì)”綜合作業(yè)_第5頁(yè)
已閱讀5頁(yè),還剩6頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、 “數(shù)理統(tǒng)計(jì)”課程綜合作業(yè)作業(yè)要求為了考核同學(xué)們綜合運(yùn)用統(tǒng)計(jì)方法解決實(shí)際問(wèn)題的過(guò)程,請(qǐng)同學(xué)們結(jié)合當(dāng)前社會(huì)生活實(shí)際中的問(wèn)題,自己擬定一個(gè)研究題目,并應(yīng)用參數(shù)估計(jì)、假設(shè)檢驗(yàn)、回歸分析、方差分析、正交設(shè)計(jì)(這些方法中至少選擇兩個(gè))對(duì)其進(jìn)行分析。要求:(一) 內(nèi)容必須涵蓋以下幾個(gè)方面:1.題目;2.研討的問(wèn)題是什么;3.相關(guān)的數(shù)據(jù)及來(lái)源;4.建立的統(tǒng)計(jì)模型和統(tǒng)計(jì)問(wèn)題是什么,樣本數(shù)據(jù)是什么;5.使用的統(tǒng)計(jì)方法是什么?使用的統(tǒng)計(jì)分析軟件是什么?5.計(jì)算過(guò)程(若統(tǒng)計(jì)軟件,其計(jì)算結(jié)果是什么)6.對(duì)計(jì)算結(jié)果的說(shuō)明或解釋。(二) 格式 包括報(bào)告題目、摘要、正文、參考文獻(xiàn)和附錄五個(gè)部分。正文內(nèi)容一般包括問(wèn)題描述、數(shù)

2、據(jù)描述、模型建立、統(tǒng)計(jì)方法選擇和問(wèn)題求解、結(jié)果分析等內(nèi)容。報(bào)告用Word 文本格式,中文字使用宋體、小四號(hào)字,英文用Roman 字體5 號(hào)字,數(shù)學(xué)符號(hào)用MathType 輸入。題 目(黑體,三號(hào))摘要:(200-400字)(黑體,小四)正文(正文標(biāo)題:宋體,粗體,小四)一、問(wèn)題提出。(正文內(nèi)容:宋體,五號(hào))二、數(shù)據(jù)描述(用表格表達(dá)數(shù)據(jù)信息,指出數(shù)據(jù)來(lái)源或提供原始數(shù)據(jù))三、建立統(tǒng)計(jì)模型四、統(tǒng)計(jì)方法設(shè)計(jì)和方法使用的條件,計(jì)算工具的選擇。五、計(jì)算過(guò)程和計(jì)算結(jié)果。六、結(jié)果分析。參考資料(標(biāo)題:宋體,粗體,小四,內(nèi)容:宋體,五號(hào))附錄(標(biāo)題:宋體,粗體,小四,內(nèi)容:宋體,五號(hào))(三) 課外作業(yè)提交形式紙

3、質(zhì)材料和電子文檔注意:紙質(zhì)材料打印內(nèi)容從封面開(kāi)始,包括作業(yè)要求,直至作業(yè)的所有內(nèi)容。電子文檔:先提交給班長(zhǎng),再由班長(zhǎng)將壓縮文件提交給老師。特別注意電子文檔的名稱,按如下模板寫: 2011級(jí)某班“數(shù)理統(tǒng)計(jì)”綜合作業(yè)姓名,學(xué)號(hào)。(四) 課外作業(yè)提交時(shí)間參加課程考試那天上午提交紙質(zhì)材料,當(dāng)天班長(zhǎng)提交電子文檔給老師。請(qǐng)注意:不能復(fù)制現(xiàn)有成果,同學(xué)之間也不能相互復(fù)制內(nèi)容。 股票市場(chǎng)中變量之間的關(guān)系摘要: 在經(jīng)濟(jì)飛速發(fā)展的當(dāng)代,金融市場(chǎng)占據(jù)著半壁江山,而在金融市場(chǎng)中股票作為公司籌資的重要來(lái)源,它占據(jù)著重要的地位,我接下來(lái)就是要研究股票市場(chǎng)中變量之間的關(guān)系,通過(guò)統(tǒng)計(jì)分析方法還原大數(shù)據(jù)時(shí)代海量數(shù)據(jù)所反映的事實(shí)

4、,以及數(shù)據(jù)之間的規(guī)律性。 首先用統(tǒng)計(jì)中的參數(shù)估計(jì)的方法對(duì)所得數(shù)據(jù)進(jìn)行分析建立模型Y=X+,對(duì)搜集到的數(shù)據(jù)做參數(shù)估計(jì),即最小二乘估計(jì)。然后對(duì)數(shù)據(jù)建立回歸預(yù)測(cè)的模型,用回歸分析的方法對(duì)搜集到的中證100股指的數(shù)據(jù)建立線性模型,用R軟件編程進(jìn)行求解,最后求出的估計(jì)值并用R軟件畫(huà)出殘差圖并與實(shí)際走勢(shì)相比較。最后對(duì)所得結(jié)果進(jìn)行分析,聯(lián)系實(shí)際的K線圖,檢驗(yàn)預(yù)測(cè)的效果,對(duì)R軟件中得出的異常點(diǎn)進(jìn)行分析,用三種不同的方法得到的結(jié)果進(jìn)行比較,分析此次分析對(duì)實(shí)際問(wèn)題的實(shí)用性。 中證100指數(shù)的回歸分析1 問(wèn)題的提出生活在21世紀(jì),這個(gè)信息的海洋里,每天都面對(duì)著海量的數(shù)據(jù),而與我們并不遙遠(yuǎn)的金融市場(chǎng)更是信息的集中體,

5、股票期權(quán)等每秒都有上億的數(shù)據(jù)信息量,面對(duì)如此多的數(shù)據(jù)信息,如何才能從眾多的股票中選出優(yōu)質(zhì)股進(jìn)行投資成為人們爭(zhēng)奪的熱點(diǎn),其實(shí)我們可以用統(tǒng)計(jì)的方法來(lái)解決這些問(wèn)題。下面便針對(duì)這種現(xiàn)象提出如下的問(wèn)題:請(qǐng)搜集有關(guān)股票數(shù)據(jù)并對(duì)其變量用統(tǒng)計(jì)方法進(jìn)行分析。2 數(shù)據(jù)描述在大智慧軟件上搜集中證100的指數(shù),并對(duì)中證100支成分股搜集15分鐘k線的收盤價(jià),共352組樣本數(shù)據(jù)得到如下數(shù)據(jù):(具體見(jiàn)附錄) 三.建立統(tǒng)計(jì)模型對(duì)搜集到的數(shù)據(jù)進(jìn)行建模,因?yàn)橛绊懸蜃兞恐凶C100收盤價(jià)Y的共有100支股票,設(shè)這一百只股票分別為X1,X2,X3.X99,X100.這100個(gè)變量與Y有如下相關(guān)關(guān)系:Y=+x+.+其中 N(0,) 且

6、cov()=0,ij.即建立了線性模型: Y=X+ E=0,cov()=I參數(shù)估計(jì): 對(duì)上述建立的模型進(jìn)行參數(shù)估計(jì),設(shè)=()為的估計(jì)量,則稱為線性回歸方程,殘差平方和為給定觀測(cè)數(shù)據(jù)()i=1,2,3.100就是的最優(yōu)解即 (1)的解由(1)式可知為正規(guī)方程 rank()=rank(X)=p+1所以得到的LS 估計(jì)為即4、 統(tǒng)計(jì)方法設(shè)計(jì)和方法使用的條件,計(jì)算工具的選擇。 用用R軟件對(duì)所搜集的數(shù)據(jù)進(jìn)行用回歸分析的方法對(duì)最小二乘估計(jì)進(jìn)行計(jì)算,并用回歸分析建立回歸模型,首先把數(shù)據(jù)中缺失的即停盤的股票刪去,并將缺失的補(bǔ)齊,另存為Csv文件,下面在R軟件中編程進(jìn)行解答。下面是程序DA=read.csv(f

7、ile=file.choose(),head=T) library(nnls) x=as.matrix(DA,2:101) y=as.vector(DA,1) a=2:101 b=0.000373465 D=data.frame(a,b) b0=as.vector(D,2) y1=y-x%*%b0 nnr nnr coef coef五、計(jì)算過(guò)程和計(jì)算結(jié)果。對(duì)數(shù)據(jù)做正回歸分析得出結(jié)果:coef(提取系數(shù)向量的估計(jì)值) 1 1.986219993 45.724918486 14.346167164 0.000373465 2.901370739 6.540717465 0.114566603 9.

8、684098103 36.471730436 0.682356715 0.000373465 12 0.000373465 0.835485658 0.000373465 3.471582198 0.000373465 1.488914287 1.500925835 0.000373465 0.000373465 0.000373465 0.000373465 23 0.000373465 0.000373465 14.426982052 31.705891305 0.000373465 0.000373465 0.000373465 18.460676674 0.000373465 0.00

9、0373465 0.000373465 34 0.000373465 0.000373465 0.000373465 0.000373465 5.243724570 12.354343316 0.000373465 0.000373465 0.000373465 0.000373465 0.000373465 45 0.000373465 0.000373465 0.671666765 0.000373465 0.000373465 0.000373465 1.631742836 0.000373465 0.000373465 0.000373465 29.402227896 56 3.856

10、391237 0.000373465 0.000373465 4.298749228 0.000373465 0.000373465 0.000373465 0.000373465 0.000373465 0.000373465 0.000373465 67 0.000373465 1.425965346 0.000373465 0.000373465 0.000373465 11.102420742 0.000373465 0.000373465 0.000373465 0.000373465 0.000373465 78 1.044591680 0.000373465 0.00037346

11、5 0.000373465 6.580593133 0.000373465 0.000373465 0.000373465 0.000373465 0.799960901 0.000373465 89 0.000373465 23.851547917 17.240759376 0.000373465 0.000373465 0.000373465 0.000373465 0.000373465 3.079589529 0.000373465 0.000373465100 0.000373465 x estimates: 1.985847 45.72455 14.34579 0 2.900997

12、 6.540344 0.1141931 9.683725 36.47136 0.6819832 0 0 0.8351122 0 3.471209 0 1.488541 1.500552 0 0 0 0 0 0 14.42661 31.70552 0 0 0 18.4603 0 0 0 0 0 0 0 5.243351 12.35397 0 0 0 0 0 0 0 0.6712933 0 0 0 1.631369 0 0 0 29.40185 3.856018 0 0 4.298376 0 0 0 0 0 0 0 0 1.425592 0 0 0 11.10205 0 0 0 0 0 1.044

13、218 0 0 0 6.58022 0 0 0 0 0.7995874 0 0 23.85117 17.24039 0 0 0 0 0 3.079216 0 0 0 residual sum-of-squares: 9190由X的估計(jì)值得到下列回歸方程:Y=1.985847x1+45.72455x2+14.34579x3+2.900997x5+6.540344x6+0.1141931x7+9.683725 x8+36.47136x9+0.6819832x10+0.835112x13+3.471209x15+1.488541x17+1.500552x18+14.42661x25+.+3.0792

14、16x98.可以看到殘差平方和為9190X的估計(jì)值系數(shù)也均為正的回歸系數(shù)殘差圖如下實(shí)際走勢(shì)與預(yù)測(cè)效果圖如下:從上圖可以看出此次回歸預(yù)測(cè)與實(shí)際走勢(shì)基本吻合。六、結(jié)果分析。下面對(duì)結(jié)果進(jìn)行分析:分析方法:正態(tài)性檢驗(yàn)此次檢驗(yàn)選用了較為簡(jiǎn)單的QQ圖進(jìn)行檢驗(yàn)分析,在R軟件中輸入以下的程序:DA=read.csv(file=file.choose(),head=T)lm.sz=lm(YX1+X2+X3+X4+X5+X6+X7+X8+X9+X10+X11+X12+X13+X14+X15+X16+X17+X18+X19+X20+X21+X22+X23+X24+X25+X26+X27+X28+X29+X30+X3

15、1+X32+X33+X34+X35+X36+X37+X38+X39+X40+X41+X42+X43+X44+X45+X46+X47+X48+X49+X50+X51+X52+X53+X54+X55+X56+X57+X58+X59+X60+X61+X62+X63+X64+X65+X66+X67+X68+X69+X70+X71+X72+X73+X74+X75+X76+X77+X78+X79+X80+X81+X82+X83+X84+X85+X86+X87+X88+X89+X90+X91+X92+X93+X94+X95+X96+X97+X98+X99+X100,data=DA)summary(lm.sz

16、)plot(lm.sz,2)#對(duì)數(shù)正態(tài)QQ殘差圖#條件數(shù)的計(jì)算XX2*sqrt(p+1)/n)#庫(kù)克距離計(jì)算infl=lm.influence(lm.sz,do.coef=FALSE)D=cooks.distance(lm.sz,infl=lm.influence(lm.sz,do.coef=FALSE),rs=weighted.residuals(lm.sz),sd=sqrt(deviance(lm.sz)/df.residual(lm.sz),hat=infl$hat)sort(D)#按從小到大的順序排列#協(xié)方差比診斷D=abs(1-covratio(lm.sz, infl=lm.infl

17、uence(lm.sz, do.coef = FALSE),res = weighted.residuals(lm.sz)sort(D)最后得出的結(jié)果是:1.由WK距離共有28個(gè)異常點(diǎn)2.用庫(kù)克距離診斷知:距離最大的是322和333.即2013年10月23號(hào) 10:45和15:00的數(shù)據(jù),但是距離值僅為0.0594和0.0544,在大智慧中23號(hào)的走勢(shì)如下3:002:3010:45從圖中可以看出在異常點(diǎn)10:45時(shí)股票價(jià)格達(dá)到了最大,此時(shí)是拋售股票的最佳時(shí)機(jī),之后股票價(jià)格大幅下跌,而在異常點(diǎn)2:30和3:00中軌線和下軌線經(jīng)歷了一段時(shí)間的穩(wěn)定狀態(tài)后開(kāi)始復(fù)蘇,到3:15時(shí)收盤價(jià)遠(yuǎn)遠(yuǎn)低于開(kāi)盤價(jià),所以異常點(diǎn)指導(dǎo)股民在3:00之前一定要拋售,否則將面臨更加大的虧損.因此,分析表明異常點(diǎn)為股票出現(xiàn)漲?;虻5念A(yù)示,給股民一定的指導(dǎo)意義,很好的預(yù)測(cè)出股票的走勢(shì)異常時(shí)點(diǎn)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論