OK盧瑜-期貨從業(yè)-期貨投資分析-精講-第三章(美工版2013420)_第1頁
OK盧瑜-期貨從業(yè)-期貨投資分析-精講-第三章(美工版2013420)_第2頁
OK盧瑜-期貨從業(yè)-期貨投資分析-精講-第三章(美工版2013420)_第3頁
OK盧瑜-期貨從業(yè)-期貨投資分析-精講-第三章(美工版2013420)_第4頁
OK盧瑜-期貨從業(yè)-期貨投資分析-精講-第三章(美工版2013420)_第5頁
已閱讀5頁,還剩181頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

期貨從業(yè)期貨投資分析精講班主講老師:盧瑜第三章數理方法一、概率與隨機變量(一)事件和概率隨機試驗——試驗時,會出現(xiàn)什么結果,是不確定的。樣本點——每一種可能的結果。樣本空間——全體樣本點集合。事件——樣本空間子集。第一節(jié)概率基礎1.集合、事件與概率。概率——對某個事件發(fā)生可能性的度量。事件運算——子事件、事件并(和)、事件交(積)、事件補(余事件)。(1)概率主觀定義。依據各自的經驗和自信,三人分別對于事件A發(fā)生的可能性有不同的看法,分別給出的估計概率。第一節(jié)概率基礎

(2)概率的公理化定義。樣本空間s上的概率測度P滿足以下概率公理:①對于任意的事件A屬于S,0≤P(A)≤1,表示一個事件的概率必定在0和1之間;②P(S)=1,表示樣本空間s包含所有可能的結果,事件s的概率應該為1;③如果對于任意的i≠j,Ai∩Ai=Φ那么P(A1∪A2∪…)=P(A1)+P(A2)+…,表示如果事件A和事件B不相交,那么它們并集的概率等于兩個事件概率和。第一節(jié)概率基礎2.條件概率與事件獨立。在給定事件B已經發(fā)生的條件下事件A發(fā)生的概率記為P(A/B)。在給定事件B已經發(fā)生的條件下事件A發(fā)生的概率為:

如果說事件A和事件B是相互獨立的,則P(A/B)=P(A),表示事件B的發(fā)生對事件A發(fā)生的機會不產生任何影響。如果P(A∩B)=P(A/B)P(B)=P(A)P(B),我們說事件A和事件B是相互獨立的。否則,我們說事件A和事件B是相互依賴的。第一節(jié)概率基礎例題:考慮擲骰子的試驗。樣本空間S是六個樣本點,出現(xiàn)點數為1的概率,記為集合A={1},則P(A)=1/6。但是,如果考慮奇數點出現(xiàn)的條件下點數1出現(xiàn)的概率,則在給定信息影響下,使得樣本空間從S={1,2,3,4,5,6}縮小到B={1,3,5},此條件概率記為P(A丨B)=1/3。第一節(jié)概率基礎(二)隨機變量和概率分布隨機變量——從樣本空間到實數集的一個函數,一般我們用大寫字母表示它,它的取值用小寫字母表示。1.離散隨機變量及其概率分布函數。設隨機變量X取值為有限個或者可數多個值,則:P(X=xi)=pii=i,2,…,n稱為隨機變量X的(概率)分布。第一節(jié)概率基礎2.連續(xù)隨機變量與概率密度函數。概率分布函數——隨機變量取值范圍在一個區(qū)間或者整個實數軸。設X是隨機變量,其值小于等于x的事件{X≤x}發(fā)生概率用F(x)表示,我們稱F(x)=P(X≤x)為隨機變量X的分布函數。某個連續(xù)的隨機變量X的概率密度函數滿足的三條性質:(1)對于所有的x∈R,有f(x)≥0;(2)第一節(jié)概率基礎(3)對于任何兩個實數a、b,-∞<a<b<∞有:P(a≤X≤b)=連續(xù)的隨機變量X的累計分布函數為:F(x)=P(X≤x)=并且第一節(jié)概率基礎3.常用分布。二項分布、正態(tài)分布、對數正態(tài)分布、t分布和F分布。(1)二項式分布。B(n,P)。其中n和P是兩個參數,n是正整數,0≤p≤1??紤]一個僅有兩個結果的試驗,比如價格上漲或下跌,隨機變量X的值為0或1。隨機變量X服從貝努利分布的假設為P(X=1)=p,P(X=0)=1-p,這里0≤p≤1如果X1,X2,...,Xn是相互獨立,且服從貝努利分布,那么是一個取值為0,1,2,…,n的離散的隨機變量。第一節(jié)概率基礎假定所有的X1是同一個隨機試驗的隨機變量,并且取值為1表示成功,那么X的值就表示在這n試驗中成功的次數。它的概率密度函數為:第一節(jié)概率基礎小概率概念——一個事件發(fā)生概率小于0.05假定小概率事件在一次實驗中不會發(fā)生,如果該事件發(fā)生,說明該事件發(fā)生的前提不對。第一節(jié)概率基礎例題:在著名的心靈感應試驗中,兩個試驗者A、B分在兩個房間,裁判給A分發(fā)了4紅4黑的8張撲克牌,每發(fā)一張,要求B說出什么顏色的牌,B只知道共發(fā)了4紅4黑的8張牌。問題:①如果一次試驗中,乙至少說對了6張牌,B是否有心靈感應?②如果10次試驗,至少有5次乙說對了6或6張以上的牌,是否有心靈感應?③如果10次試驗,至少有6次乙說對了6或6張以上的牌,是否有心靈感應?第一節(jié)概率基礎分析:①如果A與B沒有心靈感應B說對6張的有利場合為B說對8張(全部猜對)的有利場合為1種合計為17種全部發(fā)4紅和4黑的8張牌的構成70種不同順序B猜對6或8張的概率P=17/70=0.243。說明了沒有心靈感應,B猜對6或8張的概率近1/4,這完全可以用隨機性解釋,因此不能說A和B有心靈感應。第一節(jié)概率基礎②如果獨立重復10次,以X表示乙猜對6或8張的次數,在沒有心靈感應的前提下,隨機變量X服從二項分布B(10,0.243),故:說明有超過6%的概率猜對5次以上,不能說明A與B有心靈感應.第一節(jié)概率基礎③如果猜對了6次以上,則概率為:說明不到2%的概率猜對6次以上,A與B沒有心靈感應的假定是有問題的,可以說明A與B有心靈感應。第一節(jié)概率基礎(2)正態(tài)分布。連續(xù)的隨機變量X的概率密度函數為:分位點——對于給定的概率P(如5%),使得P≤F(XP)=成立的最小實數xp稱為隨機變量X的p-分位點。第一節(jié)概率基礎(三)隨機變量的數字特征(隨機變量的矩)1.數學期望。一般地,如果X是一個離散的隨機變量,它的分布為P(X=xi)=pi,i=1,2,…n…,它的期望值為E[X]=

第一節(jié)概率基礎如果X是一個連續(xù)的隨機變量,它的概率密度函數為f(x),那么它的期望值為:第一節(jié)概率基礎數學期望的結論:第一節(jié)概率基礎2、矩一個隨機變量X的r階原點矩陣定義為E[Xr]記為則所以x的數學期望就是它的一階原點矩。簡單地記它為μ。一個隨機變量X的r階中心矩被定義為E[(X-μ)r]

記為μr第一節(jié)概率基礎3.方差與標準差。如果r=2,E[(X-μ)2]被稱為X的分布的方差或x的方差。常常記它為σ2或var(X)。σ2的正平方根σ被稱為x的標準差,反映了隨機變量波動程度的量。關于方差,常用公式:第一節(jié)概率基礎例題:計算貝努利分布和二項分布的均值與方差。對于貝努利分布,很容易獲得E[X]=p,var(X)=p(1-P)。對于二項分布,也容易得到:如果X服從二項分布,一個相關的隨機變量是y=X/n,它的值表示在這n試驗中成功的次數占總試驗次數的比例。它的均值和方差分E[Y]=p,var(Y)=P(1-p)/n。第一節(jié)概率基礎例題:正態(tài)分布的基本性質如下:(1)隨機變量X服從均值為μ,方差為σ2的正態(tài)分布。記為X~N(μ,σ2)(2)正態(tài)分布關于參數μ對稱,其中μ是位置參數,σ是刻度參數。(3)一個正態(tài)隨機變量的線性函數仍然服從正態(tài)分布,也即是如果X~N(μ,σ2)

,Y=aX+b,a≠0,b是常數,那么Y~N(aμ+b,a2σ2)(4)如果X~N(μ,σ2),特別地我們稱z是一個標準正態(tài)隨機變量。第一節(jié)概率基礎4.偏度與峰度。(1)偏度。衡量分布是否有偏(用來描述隨機變量的對稱程度),如果X的概率密度函數關于期望值是對稱的,比如正態(tài)分布,μ3=E[X—E(X)]3=0是無偏的,對于u3>0,說明分布是正偏或者右偏,反之為負偏或者左偏。第一節(jié)概率基礎偏度系數:負的偏度系數,揭示了分布有很長的左尾(概率),反映了出現(xiàn)大負值的概率高。如果組合資產的收益率分布是負(左)偏的,則出現(xiàn)巨額損失的概率增加。第一節(jié)概率基礎(2)峰度。衡量分布在均值附近的陡峭程度,如果x取值在概率上集中在均值附近,則u4

將傾向于小,否則就傾向于大。峰度系數為β2=u4/u22超額峰度=β2-3正態(tài)分布的峰度=3正態(tài)隨機變量的超額峰度=0。第一節(jié)概率基礎厚尾——分布有正的超額峰度,分布在其支撐的尾部有比正態(tài)分布更多的“質量”。意味著來自于這樣一個分布的隨機樣本會有更多的極端值,故稱這樣的分布為尖峰的。輕尾——具有負的超額峰度的分布,也稱為低峰的。第一節(jié)概率基礎5.契比雪夫定理(不等式)。隨機變量和它的均值的差的絕對值超過它的標準差K倍的概率小于1/K2

該定理給出了任一隨機變量取值的界限。在判斷程序化投機(趨勢)交易或者價差(套利)交易中觸發(fā)條件的發(fā)生概率較為有效。第一節(jié)概率基礎例題:下列關于正態(tài)分布的結論哪個是不正確的?A.峰度為3.B.偏度為1.C.整個分布特性可由均值和方差描述。D.正態(tài)分布的密度函數表示如下:

答案:B第一節(jié)概率基礎二、多元分布函數(一)聯(lián)合分布第一節(jié)概率基礎第一節(jié)概率基礎聯(lián)合累計分布函數:X和Y是相互獨立的,當且僅當:f(x,y)=g(x)h(y)第一節(jié)概率基礎第一節(jié)概率基礎第一節(jié)概率基礎(二)協(xié)方差、相關關系和協(xié)方差矩陣1.協(xié)方差。σXY,或COV(X,Y)σXY=E[(X-EX)(Y-EY)]=E[XY]-E[X]E[Y]

X于Y相關的一個測度。如果X和Y是相互獨立的,那么cov(X,Y)=0。第一節(jié)概率基礎2.相關關系。第一節(jié)概率基礎3.協(xié)方差矩陣。一個隨機向量的期望值等于它的各個分量的期望值組成的向量第一節(jié)概率基礎隨機向量X的協(xié)方差矩陣如下第一節(jié)概率基礎例題:給定隨機變量X、Y,常數a、b、c、d,下列哪個結論是錯誤的。A.若x和Y是相關的,則E(ax+by+c)=aE(x)+bE(y)+cB.若x和Y是相關的,則Var(ax+by+c)=Var(ax+6y)+cC.若x和Y是相關的,則Cov(ax+by,cx+dy)=acVar(X)+bdVar(Y)+(ad+bc)Coy(x,Y)D.若x和Y是不相關的,則Var(x—Y)=Var(x+y)=Var(x)+Var(y)答案:B第一節(jié)概率基礎三、隨機變量的函數1.隨機變量的線性組合。對于以人民幣計價的投資組合中現(xiàn)金為1000萬元,組合中美元資產為1000萬美元,美元匯率為X,其均值為0.01,標準差為0.001,這個組合可以被表示為Y=a+bX,其期望、方差和標準差分別為:E(a+bX)=a+bE(X),var(a+bX)=b2var(X),

第一節(jié)概率基礎y的均值:E(Y)=E(1+1000X)=1+1000×0.01=11y的標準差=1000×0.001=1第一節(jié)概率基礎第一節(jié)概率基礎例題:已知:Cov(X,Y)=3,Var(X)=9,Var(Y)=4,求Var(2X-Y)。

VAR(ax+by)=a^2Var(x)+b^2Var(y)-2abcov(x,y)

Var(2X-Y)=Var(2X)+Var(Y)-2Cov(2X,Y)=4Var(x)+Var(Y)-4Cov(X,Y)=4*4+9+4*3=37第一節(jié)概率基礎2、隨機變量的加權和隨機變量乘積Y=X1Y2,其期望為:E(X1X2)=E(X1)E(X2)+Cov(X1,X2)當這些變量相互獨立時,乘積期望就是均值的積。4.隨機變量變換(函數)的分布。假設X是一個連續(xù)隨機變量,概率密度函數為f(x),g(x)是一個單調函數,那么Y=g(X)是一個新的隨機變量。我們把x表述成y的函數為X=W(y),那么y的概率密度函數h(y)為:第一節(jié)概率基礎例題:對于債券價格因素包含了債券收益率的概率分布信息中,對于某一零息債券的市場價值V為:V=100/(1+r)T其中,r是收益率。其逆函數為:V=100/V1/T-1如果我們希望能夠估測債券價格低于收盤價V=40元的概率。對于一個20年期的零息債,其收益率r=(100/40)1/20-1=4.688%。收盤價低于40元德爾概率表示為:P(V≤40)=P(r≥4.668%)第一節(jié)概率基礎四、幾個重要分布(一)對數正態(tài)分布與三大統(tǒng)計分布1.對數正態(tài)分布。如果一個隨機變量x的對數形式Y=ln(X)是正態(tài)分布,則可以稱這一變量服從對數正態(tài)分布。第一節(jié)概率基礎例題:下列哪個結論描述正態(tài)分布與對數正態(tài)分布間的關系?A.對數正態(tài)分布是正態(tài)分布的對數B.如果隨機變量X的自然對數是對數正態(tài)分布的,則X是正態(tài)分布C.如果X是對數正態(tài)分布的,則X的自然對數是正態(tài)分布D.這兩種分布相互之間毫無關系答案:C第一節(jié)概率基礎對數正態(tài)分布的密度函數如下表示:則X的均值和方差分別為:第一節(jié)概率基礎例題:對于一個服從對數正態(tài)分布的隨機變量X,ln(X)是一個均值為0,標準差為0.5的正態(tài)分布。下面哪個是X的期望值和方差?A.1.025和0.187B.1.126和0.217C.1.133和0.365D.1.203和0.399答案:C第一節(jié)概率基礎如果資產的對數收益率是獨立同分布,且都正態(tài)分布,那么在此假定下,簡單收益率是獨立同分布的對數正態(tài)分布的隨機變量,均值和方差分別為:第一節(jié)概率基礎反之,假設簡單收益率Rt服從對數正態(tài)分布,均值為m1,方差為m2,則對應的對數收益率rt的均值和方差分別為:第一節(jié)概率基礎2.卡方(χ2)分布。一個標準正態(tài)隨機變量的平方服從自由度為1的χ2分布。即如果Z~N(0,1),那么Z2~χ2(1)。如果Z1,Z2,…,Zn是相互獨立的標準正態(tài)分布,那么第一節(jié)概率基礎T的概率密度函數可通過變量替換方法得到,基本性質如下:(1)它是關于0對稱的;(3)當r趨于無窮大時,T的分布趨于標準正態(tài)分布。第一節(jié)概率基礎第一節(jié)概率基礎例題:有著相同均值和標準差的正態(tài)分布和t分布,下列哪個結論正確?A.它們有著相同的偏度和峰度B.t分布有著更大的偏度和峰度C.隨著自由度增加,t分布的峰度逐漸收斂到正態(tài)分布峰度D.當自由度相對較小的時候,對t分布而言,正態(tài)分布是一個較好的近似估計答案:C第一節(jié)概率基礎(二)尾概率分布特點

1.尾分布。極值理論(EVT)——x超過某個閥值點U的極限分布服從以下分布族:F(y)=1-exp(-y),ξ=0當y=(x-u)/β時。簡單而言就是通過刻度(Scale)參考β和形狀(Shape)參數ξ確定,其中參數ξ決定了尾概率中尾巴趨于零(消失)的速度第一節(jié)概率基礎正態(tài)分布對應于ξ=0,則尾巴概率以指數速度消失(趨于0)。但是,經典的金融數據,基本都有ξ>0,這就是著名的厚尾(肥尾或者重尾)現(xiàn)象。第一節(jié)概率基礎統(tǒng)計推斷——由總體抽取一個樣本(樣本大小為n)來推知總體的某一性質??尚哦葐栴}——有多大把握說明統(tǒng)計推斷結論精度——在區(qū)間估計中可信度依賴區(qū)間的長度影響統(tǒng)計推斷的基本因素包括:樣本大小、總體的波動規(guī)律(分布)、我們希望的可靠程度(置信水平)。第二節(jié)統(tǒng)計基礎一、總體、樣本和統(tǒng)計量總體——研究對象的全體,稱為X個體——組成總體的每個成員總體分布函數——x的分布函數抽樣——依照一定的規(guī)則抽取n個個體,對個體進行測試或觀察得到一組數據x1,x2,…,xn。樣本——隨機向量(X1,X2…,Xn)。樣本容量——n。樣本觀測值——(x1,x2,…,xn)第二節(jié)統(tǒng)計基礎2.統(tǒng)計量。(1)樣本均值:用來估計總體的均值:μ第二節(jié)統(tǒng)計基礎(2)樣本方差:用于估計總體方差:σ2

第二節(jié)統(tǒng)計基礎例題:關于市場回報的隨機游走假設的基本前提是認為一期回報與下一期回報在統(tǒng)計上是獨立的。這一假設暗含著:A.從一期到下一期回報是不可能相等的B.從一期到下一期回報是不相關的C.有關一期回報的信息對預測下一期回報是沒有幫助的D.上述B和C都是正確的。答案:D第二節(jié)統(tǒng)計基礎例題:考慮一只日回報率服從隨機游走的股票。其年波動率為34%。假設一年有52周,估計該股票的周波動率:A.6.80%B.5.83%C.4.85%D.4.71%答案:D解析:由于是隨機游走的情況,我們可以使用時間規(guī)則的平方跟。其周波動率為第二節(jié)統(tǒng)計基礎例題:考慮一個40%投資于X資產和60%投資于Y的投資組合。資產X回報率的均值和方差分別為0和25,資產Y回報率的均值和方差分別為1和12.1,x和y相關系數為0.3.下面哪一個值最接近該組合的波動率?A.9.51B.8.60C.13.38D.7.45答案:D

解析:組合的方差=(0.4)2x25+(0.6)2×121+2×0.4×0.6×0.3×=55.48。其波動率為7.45。第二節(jié)統(tǒng)計基礎二、統(tǒng)計推斷之參數估計(點估計、區(qū)間估計和假設檢驗)(一)點估計——使用樣本數據以及一些非樣本的先驗信息為未知參數提供一個估計值。設(X1,X2,…,Xn。)是來自總體x的樣本,

θ是總體的未知參數,若用一個統(tǒng)計量第二節(jié)統(tǒng)計基礎點估計方法——矩估計和最大似然估計1.矩估計法。——用樣本的各階原點矩去估計對應的各階總體的原點矩第二節(jié)統(tǒng)計基礎第二節(jié)統(tǒng)計基礎稱在所有的g(θ)無偏估計中,方差最小的那一個為一致最小方差無偏估計。第二節(jié)統(tǒng)計基礎(二)區(qū)間估計

1.區(qū)間估計中的統(tǒng)計思想。以總體均值為例,一般以點估計為中心的一個區(qū)間

,d是估計的精度,對于給定的小正數α,比如5%,1%等(顯著性),1-α

是置信水平(置信度),我們希望:第二節(jié)統(tǒng)計基礎我們稱

為總體均值μ的(1-α)×100%的置信區(qū)間。第二節(jié)統(tǒng)計基礎第二節(jié)統(tǒng)計基礎第二節(jié)統(tǒng)計基礎2.區(qū)間估計的數學定義。設X1,···,Xn是來自總體f(x,θ)的樣本,θ∈Θ未知,對于任意θ<α<1,若統(tǒng)計量第二節(jié)統(tǒng)計基礎3.求置信區(qū)間的一般步驟:(1)先求出θ的一個點估計(通常為最大似然估計)第二節(jié)統(tǒng)計基礎第二節(jié)統(tǒng)計基礎4.給定α及d時,樣本大小的確定。在區(qū)間估計中,我們知道置信度和精度是一對矛盾,如果在保證置信度的前提下還要滿足精度的要求,我們只能增加樣本大小n。由于一般σ2可以通過前一階段數據的積累來估計,即用s估計σ。由這一公式,就可以由給定的置信度和精度給出最小的樣本大小n以同時滿足置信度和精度的要求。第二節(jié)統(tǒng)計基礎【例3-15】正態(tài)總體下參數估計置信區(qū)間設X1,···,Xn是取自正態(tài)總體N(μ,σ2)的一個樣本,置信水平為1-α,第二節(jié)統(tǒng)計基礎第二節(jié)統(tǒng)計基礎第二節(jié)統(tǒng)計基礎例題:百分比的估計。由中心極限定理(或正態(tài)逼近定理)一個二項分布隨機變量x~B(n,P)的分布,當n充分大(通常為n>30)時,可以用正態(tài)分布來近似。因此百分比的估計

的分布也可以用正態(tài)分布N(p,p(1-p)/n)來近似,這里n為樣本大小,r為n次試驗中事件發(fā)生的次數。由此可以得到百分比的近似區(qū)間估計:第二節(jié)統(tǒng)計基礎例題:考慮一只初始股價為100元的股票。其一年后的股價由公式S=100·exp(r)所決定,其中收益率r表現(xiàn)為均值為0.1,標準差為0.2的正態(tài)分布。考慮95%的置信區(qū)間,四舍五人后,S將會處于哪個區(qū)間:A.67.57和147.99B.70.80和149.20C.74.68和163.56D.102.18和119.53答案:C第二節(jié)統(tǒng)計基礎三、統(tǒng)計推斷之假設檢驗(一)假設檢驗基本概念1.假設檢驗問題與假設檢驗的處理思路。(1)假設檢驗問題提出。H0

原假設(也稱為零假設)H1對立假設或備擇假設(2)假設檢驗基本思路。先假定原假設成立,如果導致觀察數據的表現(xiàn)與此假定矛盾,則否定原假設。第二節(jié)統(tǒng)計基礎2.兩類錯誤概率。第一類錯誤(概率)即原假設成立,而錯誤地加以拒絕(的棄真概率);第二類錯誤(概率)即原假設不成立,而錯誤地接受它(的取偽概率)。3.顯著水平。理想的檢驗規(guī)則是使得棄真概率和取偽概率都很小

Neyman—Pearson原則:在控制棄真概率的條件下,使得取偽概率盡量小,有時把原則簡化為控制第一類錯誤的概率α(也稱為“顯著性水平”)。第二節(jié)統(tǒng)計基礎在原假設成立條件下,樣本落入拒絕域的概率不超過事先設定的,則稱該拒絕域所代表的檢驗為顯著水平α的檢驗,而α稱為顯著水平。第二節(jié)統(tǒng)計基礎4.假設檢驗的數學概念。假設檢驗需要顯著性水平(定義的小概率),依據這個小概率,確定否定H0的空間——拒絕域,利用樣本計算的統(tǒng)計量落在了拒絕域,就說明小概率事件發(fā)生了,這時對于H0的否決就是顯著的。P[第Ⅰ類型的錯誤]=P[拒絕H0丨H0為真]≤α第Ⅱ類型的錯誤是指H1為真時而接受了H0。所以,如果θ∈Ω1,P[第Ⅱ類型的錯誤]=P[接受H0丨H0為真]=1-Π(θ)第二節(jié)統(tǒng)計基礎第二節(jié)統(tǒng)計基礎由于上述規(guī)則,對給定的一個很小的數α(稱為顯著性水平,一般為查表方便起見α=0.1,0.05,0.01等),要求:第二節(jié)統(tǒng)計基礎第二節(jié)統(tǒng)計基礎第二節(jié)統(tǒng)計基礎2.參數檢驗的步驟。對于上述的σ2已知時,單正態(tài)總體均值的參數檢驗步驟如下:(1)列出問題,即明確原假設和備選假設。先設σ2已知,檢驗:H0:μ=μ0?H1:μ≠μ0其中,μ0已知。Z滿足如下要求:①在H0下,Z的分布完全已知,此處Z~N(0,1);②由Z可誘導出與H0背離的準則,此處當︱Z︱偏大時與H0背離。(3)對給定水平α,構造水平α檢驗的拒絕域:W1={(χ1,…,χn):︱Z︱>uα/2}其中,ua為標準正態(tài)分布的a分位點。

第二節(jié)統(tǒng)計基礎(4)基于數據,算出z的觀察值2,如z∈Wl則拒絕H0,否則只能接受H0.因此,檢驗使用統(tǒng)計量Z,稱之為Z-檢驗。3.σ2未知,單正態(tài)總體參數μ檢驗??傮wX~N(μ,σ2)時,單正態(tài)總體均值μ檢驗。當σ2未知時,改檢驗統(tǒng)計量Z為:其中,S*為修正樣本標準差。相應的拒絕域為:W1={(χ1,…,χn):︱T︱>tα/2(n-1)}tα(n-1)為自由度n-1的t分布的α-分位點。其他的檢驗步驟相同。例題:假設檢驗在5%顯著性水平意味著()。A.P(接受H0丨H0為真)=0.05%B.P(接受H0丨H0為假)=0.05%C.P(拒絕H0丨H0為真)=0.05%D.P(拒絕H0丨H0為假)=0.05%答案:C

第二節(jié)統(tǒng)計基礎例題:下面哪個關于假設檢驗的論述是不正確的?A.第二類錯誤指在原假設錯誤時,未能拒絕原假設的錯誤B.假設檢驗是依據來自某總體的樣本計算的統(tǒng)計量,推斷總體參數C.在其他條件相同的時候,降低犯第一類錯誤的代價是增加犯第二類錯誤的概率D.對于P值決策規(guī)則,就是說如果p值大于顯著性水平,則拒絕原假設答案:D解析:當所觀察到的p值低于(不高于)顯著性水平時,我們可以拒絕原假設。第二節(jié)統(tǒng)計基礎步驟:(1)理論模型設計(2)對模型的參數進行估計。(3)回歸方程、參數估計顯著性檢驗,確定模型的有效性。(4)利用回歸方程進行分析、預測。第三節(jié)回歸分析(一)模型基本假定與OLS估計1.模型假定。

只有一個因變量和一個自變量的線性回歸模型,叫一元線性回歸模型。一元線性回歸模型可表示為y=0+1

x+y是x的線性函數(部分)加上誤差項第三節(jié)回歸分析+E(yi)=α+βxiYi~N(α+βxi

,σu

2)第三節(jié)回歸分析2.回歸參數的0LS估計。1)散點圖:描述變量之間關系的一種直觀方法,從相關圖中大體上可以看出變量之間的關系形態(tài)及關系強度。線性相關——變量之間的關系近似地表現(xiàn)為一條直線非線性相關或者曲線相關——變量之問的關系近似地表現(xiàn)為一條曲線完全相關——如果一個變量的取值完全依賴于另一個變量,各個觀測點落在一條直線上,相無相關關系——兩個變量的觀測點很分散,無任何規(guī)律。第三節(jié)回歸分析正相關——在線性相關關系中,若兩個變量的變動方向相同,一個變量的數值增加(減少),另一個變量數值也隨之增加(減少);負相關——若兩個變量的變動方向相反,一個變量數值增加(減少),另一個變量數值隨之減少(增加)。第三節(jié)回歸分析散點圖圖例:完全正線性相關完全負線性相關正線性相關負線性相關零相關第三節(jié)回歸分析滬銅與LME三月期銅價格散點圖第三節(jié)回歸分析LME三月期銅價格美元/噸滬銅連續(xù)合約價格元/噸LME三月期銅價格與美元指數散點圖第三節(jié)回歸分析LME三月期銅價格美元/噸美元指數LME三月期銅價格與美元指數散點圖主要運用EXCELL軟件生成散點圖,再根據散點圖分析變量間存在怎樣的相關關系第三節(jié)回歸分析LME三月期銅價格美元/噸美元指數例題:從下圖可以看出,滬銅期貨價格與3月份倫銅表現(xiàn)出較強的()。A.負向相關關系B.負向線性相關關系C.零相關性D.正向線性相關性答案:D滬銅期貨價格第三節(jié)回歸分析第三節(jié)回歸分析回歸線殘差可以看作量ui的估計量,而εi完全由樣本數據,yi和xi構成,是可以計算的,因此,我們可以用εi的方差來估計ui的方差

。便有的無偏估計量:

第三節(jié)回歸分析例題:關于回歸方程

,下列說法錯誤的是(

)A.如果β1=0,表明因變量不依賴于自變量,兩個變量之間沒有線性關系B.如果β1≠0,即可得出兩個變量之間存在線性關系的結論C.回歸系數β1,檢驗是常用的檢驗方法是正態(tài)分布下的t檢驗方法D.在檢驗回歸系數β1的顯著性時,t的正負并不重要,關注t的絕對值答案:B第三節(jié)回歸分析例題:一般地,在作一元線性回歸復習過程中,回歸分析是建立一系列假設的基礎上的,這些假設為()。A.回歸模型因變量y與自變量x之間具有線性關系B.在重復抽樣中,自變量x的取值是固定的C.誤差項ε的均值為零D.誤差項ε是獨立隨機變量且服從正態(tài)分布,誤差項ε的分差為常數答案:ABCD第三節(jié)回歸分析(二)回歸參數顯著性檢驗和回歸參數區(qū)間估計

1.回歸參數的t檢驗得到回歸方程后,還需要對回歸系數進行顯著性檢驗:◎以確認自變量x對因變量y的影響是否顯著◎如果r=0,回歸直線是條水平線,表明因變量與自變量無線性關系;◎如果反之,兩個變量之間可能存在線性關系,還需進行統(tǒng)計的顯著性檢驗。第三節(jié)回歸分析★回歸系數的檢驗步驟(正態(tài)分布下的t檢驗法)1.

提出假設–H0:β1=0(沒有線性關系)–H1:β1≠0(有線性關系)2.

計算檢驗的統(tǒng)計量3.

確定顯著性水平α,并進行計算丨t丨>ta/2,拒絕H0;丨t丨<ta/2,不拒絕H02.回歸參數的區(qū)間估計。(三)回歸方程顯著性檢驗與擬合優(yōu)度1.總離差平方和分解。因變量y的取值是不同的,y取值的這種波動稱為變差。變差來源于兩個方面①由于自變量x的取值不同造成的②除x以外的其他因素(如x對y的非線性影響、測量誤差等)的影響對一個具體的觀測值來說,變差的大小可以通過該實際觀測值與其均值之差來表示。第三節(jié)回歸分析(xi;yi)總平方和(SST)=回歸平方和(SSR)+殘差平方和(SSE)★總平方和(SST):反映因變量的n個觀察值與其均值的總離差★回歸平方和(SSR):反映自變量x的變化對因變量y取值變化的影響,或者說,是由于x與y之間的線性關系引起的y的取值變化,也稱為可解釋的平方和★殘差平方和(SSE):反映除x以外的其他因素對y取值的影響,也稱為不可解釋的平方和或剩余平方和第三節(jié)回歸分析2.擬合優(yōu)度(樣本決定系數)?!颮2——回歸平方和占總離差平方和的比例★反映回歸直線的擬合程度★取值范圍在[0,1]之間★R21,說明回歸方程擬合的越好;R20,說明回歸方程擬合的越差★判定系數等于相關系數的平方,即R2=r2第三節(jié)回歸分析例題:滬銅現(xiàn)貨價格對滬銅期貨價格的回歸方程為y=2231.051+0.944410x。下列說法正確的是()。A.當︱t︱=14.12166>t0.025(25),滬銅現(xiàn)貨價格對滬銅期貨價格有顯著影響B(tài).當︱t︱=14.12166>t0.025(25),滬銅現(xiàn)貨價格對滬銅期貨價格沒有影響C.當︱t︱=14.12166<t0.025(25),滬銅現(xiàn)貨價格對滬銅期貨價格有顯著影響D.當R2=1-=0.8886,說明滬銅現(xiàn)貨價格對滬銅期貨價格有著較強的線性關系AD第三節(jié)回歸分析3.回歸方程的顯著性F檢驗——判斷回歸方程的解釋變量x對于被解釋變量Y的影響的顯著性,實際上是對于回歸方程擬合優(yōu)度的檢驗。

第三節(jié)回歸分析步驟:(1)設定假設H0:β=0,備擇假設H0:β≠0。(2)構造統(tǒng)計量第三節(jié)回歸分析(3)當風成立時,F(xiàn)~F(1,n-2)。(4)給定顯著性水平α,確定臨界值Fα(5)判定方程顯著性:①若F>Fa,則拒絕假設H0,即解釋變量總體對于Y的影響是顯著的,方程可靠。②若F<Fa,則接受假設H0,說明解釋變量對于Y的影響不顯著,方程估計不可靠。第三節(jié)回歸分析F與R2成正比,擬合優(yōu)度越大,F(xiàn)值越大,總體的F檢驗越顯著。第三節(jié)回歸分析方差分析表:

離差名稱

平方和自由度

均方差F值

回歸

(因素x)1

剩余(隨機因素)

n-2

總計

n-1第三節(jié)回歸分析(四)利用模型進行預測預測——通過自變量x的取值來預測因變量y的取值,分為點預測與區(qū)間預測。(一)點預測點預測就是將x的一個特定值x0代入樣本回歸方程,計算得出就是對應y0的點預測值。第三節(jié)回歸分析【例】根據教材上面例子中,滬銅期貨價格與滬銅現(xiàn)貨價格一元線性回歸方程,當銅現(xiàn)貨報價為60000元/噸時,預測滬銅期貨價格的季度收盤價。將x0=60000帶入樣本回歸方程yi=2213.051+0.9441xi,即得到滬銅期貨季度收盤價格預測結果:=2213.051+0.9441×60000=58859.051(元/噸)第三節(jié)回歸分析

(二)區(qū)間預測1、預測的潛在誤差:(1)均值誤差。不會等于樣本均值(2)斜率誤差。在總體真正的回歸系數β與擬合直線斜率β之間也存在一些誤差。(3)隨機誤差。即使已知真正的總體回歸直線,仍然會產生誤差。

第三節(jié)回歸分析

2、區(qū)間預測——在給定顯著性水平α的條件下,找到一個區(qū)間(T1,T2),使對應于特定x0的y0包含在這個區(qū)間(T1,T2)的概率為1-α。用式子表示為:P(T1<y0<T2)=1-α預測值的標準誤差由下式得出:

第三節(jié)回歸分析

在置信水平為1-α的置信區(qū)間為:其中,s為估計的標準誤差。由上式可知,x0越靠近,越小,置信區(qū)間的長度越小,預測精度越高。因此,在預測時要注意預測點‰與估計模型時用的樣本x1,x2,…,x0的距離,如果x0與所估計模型的樣本偏離太大,預測效果會很差。一般地:第三節(jié)回歸分析

(1)樣本容量n越大,預測精度越高,反之預測精度越低;(2)樣本容量一定時,置信區(qū)間的寬度在x均值處最小,預測點x0離x均值越小精度越高;越遠精度越低。當x0=時,的置信區(qū)間為:

第三節(jié)回歸分析【例】由上述滬銅期貨價格與現(xiàn)貨價格回歸分析例子,如果要預測x0=60000時,顯著性水平α=0.05下的置信區(qū)間。由前面計算的結果知:

=2213.051+0.9441×60000=58859.051n=27,x=46462.37,s=5639.879,查t分布表得到:t0.025(27-2)=2.0639,則:第三節(jié)回歸分析滬銅期貨價格95%的預測區(qū)間為:58859.051±2.0639×5639.879×=58859.051±12938.43即:的預測區(qū)間為(45920.62,71797.49)第三節(jié)回歸分析例題:滬銅期貨價格對滬銅期貨價格的回歸方程為y=2213.051+0.944410X,如果要預測x0=60000時,顯著水平α=0.05下的置信區(qū)間,下列計算過程錯誤的是()A.=2213.051+0.9441×60000=58859.051B.當n=27,=46462.37,s=5639.879,查t分布表得到:t0.025(27-2)=2.0639C.滬銅期貨價格95%的預測區(qū)間為:58859.051±2.0639×5639.879×=58859.051±12938.43D.的預測區(qū)間為(0,58859.051)或(58859.051,71797.49)答案:D二、多元線性回歸模型多元線性回歸方程——簡單線性回歸方程的擴展,主要描述因變量與兩個或兩個以上自變量之間的線性關系?;貧w方程——線性方程Z=5x+2y+1非線性方程Z=x2+4y2

,Z=㏒x+㏒y第三節(jié)回歸分析(一)多元線性回歸模型假定1.模型:y=β1x1+β2x2+…+βkxk+μ描述被解釋變量y的期望值與解釋變量x1,x2,…,xk線性關系的方程為:

βi:偏回歸系數——如果所有其他自變量保持不變,xi中的單位變化引起因變量y的變化。殘差——因變量的觀測值yi與擬合值間的差額,它包括除x1,x2,…,xk影響之外的其他因素對因變量y的影響。第三節(jié)回歸分析2.模型假定。(1)被解釋變量和解釋變量之間具有一種線性關系。(2)解釋變量之間不存在線性關系。(3)隨機擾動條件在觀察值X上的期望值為零,也即是E[εi|X]=0表明所有的x的觀察值都不能為隨機擾動的期望值提供任何信息。(4)關于隨機擾動的方差和協(xié)方差的。假設:(5)xi是非隨機的?;騲是一個T×K的常數矩陣。第三節(jié)回歸分析(二)參數估計——最小二乘法(借助統(tǒng)計分析軟件估計)1、參數β0,β1,β2,…βk是未知的,需要用樣本數據去估計估計的多元線性回歸方程,一般形式如下:是參數β0,β1,β2,…βk的估計值,是因變量y的估計值2.估計參數σ2和b的協(xié)方差矩陣第三節(jié)回歸分析【例】實際研究中,發(fā)現(xiàn)國內銅期貨價格受英國倫敦LME銅期貨價格X1、美元指數X2、道瓊斯工業(yè)指數X3、原油期貨價格X4、國內銅現(xiàn)貨價格X5影響較大,擬建立多元線性回歸方程對國內銅期貨價格進行分析。仍然采用例6-1中數據。以下采用統(tǒng)計分析軟件Eviews得到輸出結果,其他統(tǒng)計軟件輸出結果基本類似。具體結果見表6-9。第三節(jié)回歸分析表6-9應用Eviews輸出結果第三節(jié)回歸分析續(xù)表多元線性回歸方程為:=-44822.6032+7.644x1+447.4331x2+1.0967x3-45.8511x4+0.0946x5第三節(jié)回歸分析(三)解釋度與預測1、預測問題利用給定的自變量,求出因變量均值的置信區(qū)間及個別值的預測區(qū)間,完全依賴于計算機已有的統(tǒng)計軟件。但是必須學習統(tǒng)計軟件的使用,考試不會涉及軟件的使用題目,但實際工作中必須掌握

第三節(jié)回歸分析2、擬合優(yōu)度和決定系數(與一元線性回歸大致相同)(1)總平方和分解SST=SSR+SSE(2)R2

與修正的R2

R2——多元線性回歸方程的擬合優(yōu)度多元樣本可決系數R2R2=1最好0最差第三節(jié)回歸分析調整的R2——用樣本量與自變量的個數去調整R2,避免增加自變量而高估R2修正的R2第三節(jié)回歸分析例題:國內銅期貨價格受英國倫敦LME銅期貨價格x1、美元指數x2、道瓊斯工業(yè)指數x3,原油期貨價格x4,國內銅現(xiàn)貨價格x5影響較大,采用統(tǒng)計分析軟件Eviews得到線性回歸方程為:

=-44822.6032+7.6444x1+447.4331x2+1.0967x3-45.8511x5+0.0946x5,針對該方程,下列說法正確的是()A.回歸方程中的參數是根據最小二乘法估計出來的B.回歸方程除Eviews外,還可利用SPSS,SAS,Excel軟件C.國內銅期貨價格受英國倫敦LME銅期貨價格,美元指數,道瓊斯工業(yè)指數,國內銅現(xiàn)貨價格的影響為正影響D.判定系數R2=0.9889=98.89%,實際意義實在滬銅期貨價格的變差中,能被英國倫敦LME銅期貨價格、美元指數、道瓊斯工業(yè)指數、原油期貨價格、國內銅現(xiàn)貨價格的多元線性回歸方程所解釋的比例為98.89%答案:ABCD三、非線性模型的線性化——通過變量的替換,轉化為線性的回歸模型處理。第三節(jié)回歸分析【例3—21】可以線性化的模型有y=α+β/X+ε,這個例子中,只要將z=1/x代人變換即可線性化?!纠?—22】y=α+βlnx+ε是可以線性化的模型。典型的對數線性模型是我們經常用的一個模型,它的表達式為:兩邊取自然對數可得:lny=β1+β2lnX2+β3lnX3+...+βklnXk+ε第三節(jié)回歸分析四、回歸模型常見問題及處理(一)多重共線性1.多重共線性概念與產生原因。多重共線性——解釋變量之間存在嚴格或近似的線性關系。多重共線性產生的原因:自變量之間有相同和相反的趨勢;數據取樣過少;自變量之間具有某種類型的近似線性關系等

第三節(jié)回歸分析2.多重共線性后果★參數估計值不精確不穩(wěn)定。樣本觀測值稍微變化,增加或者減少解釋變量等都會使參數估計值產生較大的變化?!锕烙嬃康姆讲詈艽蟆飔檢驗失效;估計量的方差很大,相應標準差增大,進行t檢驗時,接受零假設的可能性增大,從而舍去對被解釋變量有顯著影響的解釋變量?!飬^(qū)間估計預測精度降低

第三節(jié)回歸分析3.多重共線性的判別?!讲顢U大因子法、特征根分析法等。(1)多重共線性是否存在問題。①對兩個解釋變量的模型,采用簡單相關系數法。相關系數r,若lrl接近l,則說明兩變量存在較強的多重共線性②對多個解釋變量的模型,采用綜合統(tǒng)計檢驗法多元線性回歸方程的R2值較大,F(xiàn)值較大,但t檢驗值較小,回歸系數在統(tǒng)計上幾乎均不顯著,說明存在多重共線性。

第三節(jié)回歸分析(2)判明存在多重共線性的范圍。①判定系數檢驗法。每一個解釋變量分別以其余解釋變量為解釋變量進行回歸,并計算相應的擬合優(yōu)度。Xji=α1X1i+α2X2i+...+αkXki回歸的判定系數較大,說明Xj與其他x間存在共線性第三節(jié)回歸分析②逐步回歸法。以y為被解釋變量,逐個引入解釋變量,構成回歸模型,進行模型估計。根據擬合優(yōu)度的變化決定新引入的變量是否獨立。如果擬合優(yōu)度變化顯著,則說明新引入的變量是一個獨立解釋變量;如果擬合優(yōu)度變化很不顯著,則說明新引入的變量與其他變量之問存在共線性關系。第三節(jié)回歸分析4.消除多重共線性影響的方法。(1)剔除一些不重要的解釋變量,使用逐步回歸法找出引起多重共線性的解釋變量,將它排除;(2)差分法。對于時間序列數據,將原模型變換為差分模型:ΔYi=β1ΔX1i+β2ΔX2i+...+βkΔXki+Δεi(3)增加樣本容量;

第三節(jié)回歸分析(二)異方差問題。1、異方差的概念和后果異方差:由于實際問題是錯綜復雜的,因而建立的回歸分析模型偶爾也會出現(xiàn)某一因素或者一些因素隨著解釋變量觀測值的變化而對解釋變量產生不同的影響,導致隨機誤差項產生不同的方差。異方差的出現(xiàn)會降低回歸方程的可靠性。第三節(jié)回歸分析異方差的后果:(1)參數估計量非有效:OLS估計量仍然具有無偏性,但不具有有效性(2)變量的顯著性檢驗失去意義(3)模型的預測失效:當模型出現(xiàn)異方差性時,參數OLS估計值的變異程度增大,從而造成對y的預測誤差變大,降低預測精度,預測功能失效。第三節(jié)回歸分析

2.異方差的檢驗方法。(1)散點圖判斷。同方差與異方差散點圖:第三節(jié)回歸分析用X-ε2殘差圖判斷異方差性,看是否形成一斜率為零的直線第三節(jié)回歸分析(2)統(tǒng)計檢驗方法

G—Q檢驗的思想:先將樣本一分為二,對子樣①和子樣②分別作回歸,然后利用兩個子樣的殘差平方和之比構造統(tǒng)計量進行異方差檢驗。該統(tǒng)計量服從F分布,因此假如存在遞增的異方差,則F遠大于1;反之,就會等于1(同方差)或小于1(遞減方差)。第三節(jié)回歸分析G—Q檢驗的步驟:①將n對樣本觀察值(Xi,Yi)按觀察值墨的大小排隊。②將序列中間的c=n/4個觀察值除去,并將剩下的觀察值劃分為較小與較大的相同的兩個子樣本,每個子樣樣本容量均為(n—c)/2第三節(jié)回歸分析③對每個子樣分別進行OLS回歸,并計算各自的殘差平方和;分別和用和表示較大和較小的樣本殘差平方和。④在同方差性假定下,構造如下滿足F分布的統(tǒng)計量:⑤給定顯著性水平α,確定臨界值Fα(v1,v2),若F>Fα(v=,v2)則拒絕同方差性假設,表明存在異方差第三節(jié)回歸分析3、異方差的處理對回歸模型存在異方差問題的主要處理方法:有加權最小二乘法與改變模型的數學形式兩種方法。①加權最小二乘法。對原模型加權,使之變成一個新的不存在異方差性的模型,然后采用普通最小二乘法估計其參數。②改變模型的數學形式。改變模型的數學表達形式可以有效改善異方差問題。比如將線性模型改為對數線性模型,異方差的情況將有所改善。第三節(jié)回歸分析(三)序列相關性問題1.自相關概念及后果。自相關——模型的誤差項間存在相關性。自相關的來源①經濟變量的慣性。如國民生產總值、固定資產投資、國民消費、物價指數、股票收益率等隨時間緩慢地變化,從而建立模型時導致誤差項自相關。第三節(jié)回歸分析②回歸模型的形式設定存在錯誤。比如平均成本與產量呈拋物線關系,當用線性回歸模型擬合時,誤差項必存在自相關。③回歸模型中漏掉了重要解釋變量。④因對數據加工整理而導致誤差項之間產生自相關。比如對季度數據的消除季節(jié)性影響的處理,有時會帶來序列的自相關陛。

第三節(jié)回歸分析后果:①不影響參數估計量的線性和無偏性,但是參數估計量失去有效性;②變量的顯著性檢驗失去意義;③模型的預測失效。第三節(jié)回歸分析2.序列相關的檢驗。(1)檢驗思路和常用方法。首先采用0LS對模型做估計,獲得隨機干擾項的近似估計量。然后,通過分析這些“近似估計量”之間的相關性,以判斷隨機誤差項是否具有序列相關性。圖示法、回歸檢驗法、杜賓一瓦森(Durbin—Watson)檢驗法、拉格朗日乘數(LagrangeMultiplier)檢驗

第三節(jié)回歸分析圖示法:用隨機項的近似估計量的變化圖判斷隨機項的序列相關性。第三節(jié)回歸分析(2)DW檢驗。DW統(tǒng)計量——德賓一沃森統(tǒng)計量,是檢驗模型是否存在自相關的一種簡單有效的方法,其公式

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論