《python金融大數(shù)據(jù)分析》課件-第三章 數(shù)值特征及其應(yīng)用_第1頁
《python金融大數(shù)據(jù)分析》課件-第三章 數(shù)值特征及其應(yīng)用_第2頁
《python金融大數(shù)據(jù)分析》課件-第三章 數(shù)值特征及其應(yīng)用_第3頁
《python金融大數(shù)據(jù)分析》課件-第三章 數(shù)值特征及其應(yīng)用_第4頁
《python金融大數(shù)據(jù)分析》課件-第三章 數(shù)值特征及其應(yīng)用_第5頁
已閱讀5頁,還剩64頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第三章數(shù)值特征及其應(yīng)用知識目標1.掌握均值、方差、峰度、偏度和分布特征的含義2.熟悉收益率數(shù)據(jù)的各統(tǒng)計量代表的經(jīng)濟含義。技能目標能夠利用軟件進行收益率時間序列的描述性統(tǒng)計分析,并判斷收益率序列的特征、分布類型以及進行區(qū)間估計。學(xué)習(xí)目標目

錄CONTENTS任務(wù)要求1必備知識2任務(wù)實施3任務(wù)小結(jié)41

任務(wù)要求 任務(wù)要求利用軟件,對左表上證50指數(shù)的收益率數(shù)據(jù)進行描述性統(tǒng)計分析,并對均值進行區(qū)間估計?交易日期指數(shù)回報率2019-01-03-1.32172019-01-040.28512019-01-072.00082019-01-08-0.0142......2

必備知識 期望收益(均值)1風(fēng)險(方差)2峰度和偏度3收益率的統(tǒng)計特征一均值是統(tǒng)計中用于描述數(shù)據(jù)集中位置的統(tǒng)計量,是描述集中趨勢統(tǒng)計特征中最具代表性的數(shù)值。若收益率序列為則期望收益率的計算公式為:r

r1,r2

,.

.,rt

,1期望收益(均值)

期望收益(均值)在Python的pandas庫中,求均值的函數(shù)為mean,用法是:DataFrame.mean(axis=0/1)其中參數(shù)axis=0或缺省,表示對各列求均值;如果axis=1,表示對各行求均值。以滬深300指數(shù)(CSI300)的收益率數(shù)據(jù)為例,計算收益率的均值,代碼如下:#導(dǎo)入pandas庫importpandasaspd#導(dǎo)入滬深300日收益率數(shù)據(jù)csi300=pd.read_excel('文件路徑’,sheet_name=2)

csi300_means=csi300.mean() #計算日收益率print("日平均收益率:",csi300_means)輸出結(jié)果如下,可以看出2018年到2021年四年滬深300指數(shù)平均日收益率約為0.0281%日平均收益率:0.000280568859863107341期望收益(均值)1如何才能知道每一年的滬深300指數(shù)回報率呢?年份平均回報率2018年2019年2020年2021年期望收益(均值)以滬深300指數(shù)(CSI300)的收益率數(shù)據(jù)為例,計算每年收益率的均值,代碼如下:#導(dǎo)入所需庫importpandasaspdimportdatetimeasdt#導(dǎo)入數(shù)據(jù)csi300=pd.read_excel(‘路徑/滬深300收益率.xlsx',sheet_name=2)pandas.read_excel(io,sheet_name,header,names=None,index_col=None,usecols=None,squeeze=False,dtype=None,...),從Excel中讀入數(shù)據(jù)框,其中:io:文件路徑;sheet_name:獲取的數(shù)據(jù)表;names:要使用的列名列表index_col:指定列為索引列,默認None列(0索引)用作DataFrame的行標簽。usecols:int或list,默認為None。如果為None則解析所有列,如果為int則表示要解析的最后一列,如果為int列表則表示要解析的列號列表,如果字符串則表示以逗號分隔的Excel列字母和列范圍列表(例如“A:E”或“A,C,E:F”)。1期望收益(均值)1以滬深300指數(shù)(CSI300)的收益率數(shù)據(jù)為例,計算每年收益率的均值,代碼如下:#查看csi300的數(shù)據(jù)信息print(())():查看數(shù)據(jù)框的策略基本信息輸出結(jié)果:<class‘pandas.core.frame.DataFrame’>數(shù)據(jù)類型:數(shù)據(jù)框RangeIndex:972entries,0to971索引行數(shù):972行Datacolumns(total2columns):列數(shù):2列#ColumnNon-NullCountDtype表格的列名,是否為空值和列字段類型----------------------------0日期972non-nulldatetime64[ns]1收益率972non-nullfloat64dtypes:datetime64[ns](1),float64(1)數(shù)據(jù)框包含的字段類型及數(shù)量memoryusage:15.3KB表格所占空間期望收益(均值)1以滬深300指數(shù)(CSI300)的收益率數(shù)據(jù)為例,計算每年收益率的均值,代碼如下:#查看csi300的數(shù)據(jù)print(csi300.head(5))df.head():查看數(shù)據(jù)框df數(shù)據(jù)前幾行df.tail():查看數(shù)據(jù)框df數(shù)據(jù)后幾行輸出結(jié)果:日期收益率02018-01-030.00586912018-01-040.00423722018-01-050.00240732018-01-080.00517342018-01-090.00700552018-01-100.004418期望收益(均值)以滬深300指數(shù)(CSI300)的收益率數(shù)據(jù)為例,計算2018-2021年滬深300指數(shù)平均收益率,代碼和結(jié)果如下:#計算過去幾年平均收益率csi300_mean=csi300['收益率'].mean()#將結(jié)果打印在屏幕上print(‘2018-2021年滬深300平均收益率為:',csi300_mean)輸出結(jié)果:2018-2021年滬深300平均收益率為:0.000280568859863107341期望收益(均值)以滬深300指數(shù)(CSI300)的收益率數(shù)據(jù)為例,計算每年收益率的均值,代碼和結(jié)果如下:##首先使用dt模塊獲取日期中的年,在csi300數(shù)據(jù)框中生產(chǎn)一個新列‘年’csi300['年']=csi300['日期'].dt.year##查看csi300數(shù)據(jù)框變化print(csi300.head(5))日期收益率年02018-01-030.005869201812018-01-040.004237201822018-01-050.002407201832018-01-080.005173201842018-01-090.00700520181期望收益(均值)以滬深300指數(shù)(CSI300)的收益率數(shù)據(jù)為例,計算每年收益率的均值,代碼和結(jié)果如下:##按年進行分組csi300_year=csi300.groupby(‘年’)##查看每組的數(shù)據(jù)量print('每年的數(shù)據(jù)量分別為:',csi300_year.size())輸出結(jié)果:每年的數(shù)據(jù)量分別為:2018242201924420202432021243dtype:int641期望收益(均值)以滬深300指數(shù)(CSI300)的收益率數(shù)據(jù)為例,計算每年收益率的均值,代碼和結(jié)果如下:##查看每組的信息print(csi300_year.get_group(2021).head())輸出結(jié)果:日期收益率年7292021-01-040.01082820217302021-01-050.01913220217312021-01-060.00915920217322021-01-070.01771820217332021-01-08-0.00330620211期望收益(均值)以滬深300指數(shù)(CSI300)的收益率數(shù)據(jù)為例,計算每年收益率的均值,代碼和結(jié)果如下:#計算每一年的收益率csi300_year_mean=csi300_year['收益率'].mean()print('2018-2021年每年滬深300的平均收益率:',csi300_year_mean)輸出結(jié)果:2018-2021年每年滬深300的平均收益率:2018-0.00117220190.00134120200.0010942021-0.000151Name:收益率,dtype:float641期望收益(均值)也可以使用Excel軟件完成前面的分析,步驟如下:打開csi300收益率表一、計算2018-2021年滬深300的平均收益率有三種方法:1.鼠標點取‘收益率’這一列數(shù)據(jù),Excel右下方即可出現(xiàn)數(shù)據(jù)序列相關(guān)統(tǒng)計指標。2.利用函數(shù)average()3.使用數(shù)據(jù)分析工具(1)調(diào)取數(shù)據(jù)分析工具文件-選項-加載項-分析工具庫-轉(zhuǎn)到-勾選‘分析工具庫’(2)使用數(shù)據(jù)分析工具數(shù)據(jù)-數(shù)據(jù)分析-描述統(tǒng)計1期望收益(均值)也可以使用Excel軟件完成前面的分析,步驟如下:打開csi300收益率表二、計算2018-2021年每年的滬深300的平均收益率1.生成分組變量‘年’在C1單元格輸入變量名稱‘年’,C2單元格輸入公式”=year(A2)”,用此公式向下填充,提取出每一個‘日期’中的‘年份’。2.分類匯總選中‘收益率’和‘年’兩列數(shù)據(jù),點擊“分類匯總”,設(shè)置“分類字段”為‘年’,‘匯總方式為“平均值”,“選定匯總項”勾選‘收益率’,繼續(xù)勾選“替換當前分類匯總”、“每組數(shù)據(jù)分頁”和“匯總結(jié)果顯示在下方”,點擊“確定”。3.查看結(jié)果點擊Excel左上角生成的層級標簽,1級為總平均數(shù),2級為分組平均數(shù)。1Python代碼實現(xiàn)DataFrame.var(axis=None,skipna=

None)axis:axis=0或缺省,對列求方差;

axis=1,對行求方差。skipna:排除空值。方差在統(tǒng)計學(xué)中是用于衡量一組數(shù)據(jù)離散程度的統(tǒng)計量,它描述了一組數(shù)據(jù)對其均值的偏離程度。

風(fēng)險(方差)

2風(fēng)險(方差)##計算計算過去幾年的總方差csi300_var=csi300['收益率'].var()print('2018-2021年滬深300收益率的方差為:',csi300_var)輸出結(jié)果:2018-2021年滬深300收益率的方差為:0.00017076871994312025例如:對滬深300指數(shù)的日收益率數(shù)據(jù)計算方差,編輯如下代碼:可見滬深300指數(shù)的日收益率偏離期望收益的幅度約為0.000171,波動不大。2風(fēng)險(方差)##計算每年的方差csi300_year_vars=csi300_year['收益率'].var()print('2018-2021年每年滬深300收益率的方差如下:',csi300_year_var)輸出結(jié)果:2018-2021年每年滬深300收益率的方差如下:20180.00018220190.00015620200.00020620210.000137Name:收益率,dtype:float64例如:計算2018-2021年每年滬深300指數(shù)的日收益率方差,代碼和結(jié)果如下:2偏度和峰度峰度偏度分布特征分析正態(tài)性檢驗數(shù)據(jù)的分布形狀3數(shù)學(xué)公式:偏度又稱偏態(tài)或偏態(tài)系數(shù),是用于衡量數(shù)據(jù)分布非對稱性的數(shù)字特征。求均值一組序列r

的均值r

的標準差Erμ

偏度和峰度3

偏度(1)偏度Skew<0:呈現(xiàn)左偏偏度Skew=0:分布相對均勻偏度Skew>0:呈現(xiàn)右偏偏度和峰度3偏度(1)##計算過去幾年總偏度csi300_skew=csi300['收益率'].skew()print('2018-2021年滬深300收益率的偏度為:',csi300_skew)例如:使用滬深300指數(shù)的日收益率數(shù)據(jù)計算偏度,編輯如下代碼:輸出結(jié)果如下:2018-2021年滬深300收益率的偏度為:-0.3310587332573665skipna:排除空值。如果整個行/列均為空值,則結(jié)果為NA。0或缺省:對各列求偏度1:對各行求偏度偏度的P

y

t

h

o

n

實現(xiàn)DataFrame.skew(axis=None,skipna=None)偏度和峰度3偏度(1)##計算過去幾年總偏度csi300_year_skew=csi300_year['收益率'].skew()print(‘2018-2021年每年滬深300收益率的偏度為\n:',csi300_year_skew)例如:使用滬深300指數(shù)的日收益率數(shù)據(jù)計算每年的偏度,編輯如下代碼:2018-2021年每年滬深300收益率的偏度為:年2018-01699522020-0.8433382021-0.335569Name:收益率,dtype:float64偏度的P

y

t

h

o

n

實現(xiàn)偏度和峰度3偏度(1)Kurt=3,此時是正態(tài)分布,也稱為常峰態(tài)。Kurt>3,尖峰態(tài),相較于正態(tài)分布而言具有

較高的峰部和更長的尾部。Kurt<3,低峰態(tài),相較于正態(tài)分布而言具有

較平坦的峰部和更短更細的尾部。峰度(

Kur

tosis)是衡量數(shù)據(jù)離群度的指標,也是對概率分布形狀的刻畫。數(shù)學(xué)公式是:

偏度和峰度3峰度(2)

DataFrame.kurt(axis=None,skipna=None)skipna:排除空值。如果整個行/列均為空值,則結(jié)果為NA。0或缺?。簩Ω髁星蠓宥?:對各行求峰度偏度和峰度3峰度(2)峰度的Python實現(xiàn)##計算峰度csi300_kurt=csi300['收益率’].kurt()print(‘2018-2021年滬深300收益率的峰度為:',csi300_kurt)輸出結(jié)果如下:2018-2021年滬深300收益率的峰度為:3.052222865645297例如:使用滬深300指數(shù)的日收益率數(shù)據(jù)計算峰度,代碼和結(jié)果如下:1.偏度和峰度的聯(lián)系與區(qū)別:偏度和峰度都是用于描述分布形狀特征的變量,差別在于偏度刻畫的是分布的對稱性,而峰度刻畫的是分布的峰峭性。2.峰度和方差之間的關(guān)系緊密,區(qū)別微妙。峰度和方差的不同在于,方差衡量了隨機變量偏離均值的分布狀況,而峰度衡量了隨機變量大幅偏離均值的可能性。方差較大,意味著隨機變量分布較為分散,并沒有聚集在均值附近。在給定方差情況下,峰度值較大意味著方差貢獻主要是來自少數(shù)的極值,而不是偏離程度較為溫和的數(shù)值。偏度和峰度3正態(tài)分布1二正態(tài)分布的統(tǒng)計檢驗2收益率的分布特征t

分布31正態(tài)分布其中,μ,σ2(σ>0)分別為X的均值和方差。稱X服從參數(shù)為μ,σ2的正態(tài)分布,記為X~N(μ,σ2)。[μ-σ,μ+σ]68.3%[μ-2σ,μ+2σ]95.4%[μ-3σ,μ+3σ]99.7%對稱軸:均值μ1正態(tài)分布智商誤差身高體重工資當均值μ=0,方差σ=1時,正態(tài)分布稱為標準正態(tài)分布。公式如下:

正態(tài)分布具有很多良好的特性,許多概率分布可以用它來近似:Seaborn.distplot(a,hist=True,kde=True,label=None)a:是待分析的一維數(shù)組變量。hist:

默認為True,代表顯示為條形圖kde:默認為True,代表直方圖高度顯示為密度而非計數(shù)。label:控制圖像中的圖例標簽顯示內(nèi)容,只能顯示英文形式。參數(shù)說明如下:直方圖/

概率密度圖的P

y

t

h

o

n

實現(xiàn)1正態(tài)分布import

seaborn

as

snsimportmatplotlib.pyplot

as

pltplt.rcParams[‘a(chǎn)xes.unicode_minus’]=False

sns.set(font=‘SimHei’,style=‘white’

)

sns.distplot(csi300[‘收益率’])plt.xlabel("收益率")

plt.ylabel("概率密度")plt.show()例如:對滬深300指數(shù)的日收益率數(shù)據(jù)(csi300)繪制直方圖,代碼如下:1正態(tài)分布輸出結(jié)果:1正態(tài)分布可以看到,滬深300指數(shù)的收益率序列近似于均值為

0

的正態(tài)分布。但圖形觀察過于主觀,

因此還需要使用統(tǒng)計檢驗方法判斷數(shù)據(jù)是否服從正態(tài)分布。偏度峰度尖峰厚尾K-S檢驗偏度=-

0.

331059峰度=3.

0522233

σ區(qū)間外仍分布了許多數(shù)據(jù)可能不服從正態(tài)分布,

用K-

S統(tǒng)計檢驗的方式進一步驗證1正態(tài)分布根據(jù)計算出的滬深300指數(shù)的日收益率數(shù)據(jù)為例,通過偏度和峰度來檢驗正態(tài)性,可以得到:2正態(tài)分布的統(tǒng)計檢驗樣本數(shù)據(jù)的分布函數(shù)樣本數(shù)據(jù)的理想分布函數(shù)樣本數(shù)據(jù)分布與指定分布之間的最大距離K-S檢驗用以檢驗一個分布與其理想分布是否相同D<臨界值,分布相近D>臨界值,分布不接近原假設(shè)p

-

v

a

l

u

e

<

5

%

,不成立p

-

v

a

l

u

e

>

5

%

,成立樣本數(shù)據(jù)的分布與理想分布無顯著差異。K-S原假設(shè)原假設(shè)為真時樣本觀察結(jié)果出現(xiàn)的概率p-value2正態(tài)分布的統(tǒng)計檢驗scipy.stats庫中的kstest函數(shù):1.rvs:指定要統(tǒng)計的數(shù)據(jù)(隨機變量樣本)。2.cdf:指定利用哪個概率分布對數(shù)據(jù)/變量進行分布擬合優(yōu)度檢驗。當cdf=“norm”時,要檢驗的是正態(tài)分布;cdf=“chi2”時,檢驗卡方分布;當cdf=“t”時,檢驗t分布;當cdf=“f”時,檢驗F分布等。3.args:輸入當rvs或cdf是字符串或引用對象時使用,輸入形式為元組、序列。當cdf=“norm”時,args=(rvs.mean(),rvs.std()),即待檢驗數(shù)據(jù)的均值和方差。該函數(shù)會返回兩個值[KStest

statistic,p],一個是KS檢驗統(tǒng)計量,另一個是p-value值。K

-

S

正態(tài)檢驗的P

y

t

h

o

n

實現(xiàn)kstest(rvs,cdf,args)參數(shù)說明如下:2正態(tài)分布的統(tǒng)計檢驗例:滬深300指數(shù)的日收益率數(shù)據(jù)(csi300)進行K-S檢驗,代碼如下:#導(dǎo)入庫包from

scipy.stats

importkstest ks_results

=

kstest(csi300_returns['收益率'],

"norm",(csi300_mean,csi300[收益率].std()))

print(ks_results)輸出結(jié)果如下,可見K—S檢驗的p-value值小于0.05,可以拒絕原假設(shè)。statistic=0.051351784709457615,

pvalue=0.0114554958010557532正態(tài)分布的統(tǒng)計檢驗不服從正態(tài)分布拒絕原假設(shè)p-value<0.052t分布t分布χ2分布正態(tài)分布t服從自由度為n的t分布Y

服從自由度為n的卡方分布X

服從正態(tài)分布XY

/

nt

t分布與正態(tài)分布主要區(qū)別在于,t分布用小樣本來估計呈正態(tài)分布且方差未知的分布。2t分布t分布的形態(tài)主要與自由度相關(guān)t分布曲線越平坦自由度越小t分布曲線越接近正態(tài)分布曲線自由度越大t分布曲線為標準正態(tài)分布曲線自由度n→∞2t分布scipy

庫中提供了用于擬合t分布的函數(shù)stats.t.fitstats.t.fit(樣本數(shù)據(jù))kstest(rvs,“t”,(df,loc,scale)):kstest可對數(shù)據(jù)進行K-St分布檢驗待檢驗的樣本數(shù)據(jù)t分布檢驗t分布擬合時獲取的自由度、位置、尺度參數(shù)自由度(df)位置(loc)尺度(scale)結(jié)果2t分布fromscipy

import

stats#對收益率進行t分布擬合,以獲取kstest-T檢驗的參數(shù)ks

=

stats.t.fit(csi300

['收益率'])

print(ks)

輸出結(jié)果如下:(4.396340919043949,0.00044715260547665246,0.009816190534862565)例:對滬深300指數(shù)的日收益率數(shù)據(jù)(csi300)進行KS檢驗,檢驗其分布是否符合t分布。代碼如下:自由度(df)位置(loc)尺度(scale)2t分布#傳入T分布擬合的參數(shù),對收益率數(shù)據(jù)進行t分布的KS統(tǒng)計檢驗ks_t_results=kstest(csi300['收益率'],"t",(ks[0],ks[1],ks[2]))

print(ks_t_results)輸出結(jié)果如下:KstestResult(statistic=0.012459043343644893,pvalue=0.9977835431725136)pvalue>0.05結(jié)論:經(jīng)過K-S檢驗后,得到的p-value值約為0.9978值明顯大于0.05,即認為滬深300指數(shù)收益率序列分布與t分布沒有顯著差異的概率為99.78%。所以不能拒絕原假設(shè),接受收益率服從t分布的假設(shè)。

例:對滬深300指數(shù)的日收益率數(shù)據(jù)(csi300)進行KS檢驗,檢驗其分布是否符合t分布。代碼如下:收益率均值的區(qū)間估計三1

標準差

σ

已知2標準差

σ

未知收益率均值的區(qū)間估計置信區(qū)間區(qū)間估計95%估計方法置信度確保一定概率下總體均值的真實值所在的區(qū)間范圍稱為置信區(qū)間,

而估計置信區(qū)間的方法稱為區(qū)間估計工資的區(qū)間?投資收益的區(qū)間?(0.2,0.3)2標準差已知設(shè)樣本數(shù)據(jù)X的總體期望為μ,方差為σ2設(shè)α為置信度,當總體標準差已知時,總體均值近似1-α的可信度,分布在以下置信區(qū)間內(nèi):標準正態(tài)概率分布上側(cè)面積為α/2時的z值。

/

nZ

x

樣本均值近似服從正態(tài)分布

stats.norm.isf(q,loc,scale)Python的scipy庫中norm.isf函數(shù)可以用于計算z值可選項,尺度參數(shù)正態(tài)分布上側(cè)面積為q可選項,位置參數(shù)2標準差已知例:滬深300指數(shù)收益率序列中隨機抽取50個樣本,對2018年到2021年總體收益率的均值進行區(qū)間估計。假設(shè)收益率序列服從正態(tài)分布,總體方差已知。具體如下:#導(dǎo)入庫包importnumpyasnp#

抽樣函數(shù)所在庫包fromscipyimportstats#

擬合z值包N=50;α=0.05#樣本量為50;顯著性水平為0.05sample300=

np.random.choice(csi300['收益率'],size=n)x_bar

=

sample300.mean() #樣本均值z_a2

=

stats.norm.isf(a/2) #

計算

z_a2left

=

x_bar

-

z_a2*(csi300['收益率'].std()/np.sqrt(n))

right

=

x_bar

+

z_a2*(csi300['收益率'].std()/np.sqrt(n))print(

"該收益率序列95%的置信區(qū)間為",(left,right))

#注意為抽樣統(tǒng)計,一般每次運行結(jié)果不一樣

2標準差已知平均日收益為[-0.6505%,0.0739%]輸出結(jié)果如下:該收益率序列95%的置信區(qū)間為(-0.006505291316666556,0.000739022345919538)2標準差已知2標準差未知設(shè)數(shù)據(jù)X總體期望為μ,方差未知。總體均值的區(qū)間以自由度為n-1的t分布為依據(jù)進行估計。總體均值以近似1-α的可信度,分布在以下置信區(qū)間內(nèi):概率分布上側(cè)面積為α/2時的t值。s/

nt

x

樣本均值近似服從自由度為n-1的t分布n

2

x

t (n

1) S ,

x

t (n

1) S

n

2

2標準差未知Python的scipy庫中t.isf函數(shù)可以用于計算t值stats.t.isf(q,loc,scale)可選項,尺度參數(shù)t分布上側(cè)面積為q可選項,位置參數(shù)2標準差未知例:滬深300指數(shù)收益率序列中隨機抽取20個樣本,對2018年到2021年總體收益率的均值進行區(qū)間估計。假設(shè)收益率序列服從t分布,總體方差未知。具體如下:importnumpyasnp#

抽樣函數(shù)所在庫包fromscipyimportstats#

擬合t值包n=20;a=0.05#樣本量為20;顯著性水平為0.05sample300=

np.random.choice(csi300['收益率'],size=n)x_bar

=

sample300.mean() #樣本均值sigma=sample300.std()#樣本標準差t_a2=

stats.t.isf(a/2,n-1) #

計算

t_a2left

=

x_bar

-

t_a2*(sigma/np.sqrt(n))

right

=

x_bar

+

t_a2*(sigma/np.sqrt(n))print(

"該收益率序列95%的置信區(qū)間為",(left,right))

#注意為抽樣統(tǒng)計,一般每次運行結(jié)果不一樣

2標準差未知平均日收益為[-0.2348%,1.0330%]輸出結(jié)果如下:該收益率序列95%的置信區(qū)間為(-0.0023480565364275086,0.010329832917166628)3

任務(wù)實施 “任務(wù)要求”環(huán)節(jié)給出了上證50指數(shù)日收益率數(shù)據(jù)表,現(xiàn)在結(jié)合本任務(wù)所學(xué)的知識來進行任務(wù)實施。1.用描述性統(tǒng)計分析的方法計算均值、方差、峰度和偏度;2.繪制出時序圖進行觀察來進一步探索判斷收益率序列是服從正態(tài)分布還是t分布;3.假設(shè)收益率序列服從正態(tài)分布,總體方差未知,大樣本(構(gòu)建t樞軸量)來對收益率的均值進行區(qū)間估計。任務(wù)實施1收益率的統(tǒng)計特征交易日期 收益率2019-01-03-0.0168392019-01-04-0.0029822019-01-070.0338642019-01-08-0.0072392019-01-090.003780導(dǎo)入上證50

指數(shù)數(shù)據(jù),將“日期”列設(shè)為index

列,并查看數(shù)據(jù)。代碼如下:import

pandas

as

pd

import

numpy

as

npsse50_returns

=

pd.read_excel('上證50指數(shù).xlsx',index_col=0) #

導(dǎo)入數(shù)據(jù)print(sse50_returns.head())輸出結(jié)果如下:1收益率的統(tǒng)計特征計算收益率的均值、方差、偏度和峰度,代碼如下:輸出結(jié)果如下:收益率的均值:0.000513799126335761收益率的方差:0.0001601916003140642收益率的偏度:-0.03805182

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論