




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
深圳大學管理學院商務管理專業(yè)2003級顧云飛第一章數據的整理和描述數據的分類:?按照描述的事物分類:分類型數據:描述事物的品質特征,本質表現是文字形式(一般不能相加);數量型數據:描述事物的數量特征,用數值形式表示(通常可以相加);日期和時間。?按照被描述的對象與時間的關系分類:截面數據:描述事物在某一時刻的變化情況(也叫橫向數據);時間序列數據:描述事物在一定的時間范圍內的變化情況(也叫縱向數據);平行數據:截面數據與時間序列數據的組合。數據的整理和圖表顯示:?數據的整理1.單值分組法:數據中不同數據的個數不多時用.2.組距分組法:找出最大值max和最小值min;適當取a<min,b>max;1)定數據范圍:2)分組定組距:分成m組,組距c=(b-a)/m;3)定各組界限:確定每組的上、下限;4)唱票記頻數;5)算出組頻率,組中值;6)制作頻數(率)表。?數據的圖表顯示餅形圖:用來描述和表現各成分或某一成分占全部的百分比。注意,成分份額總和必須是100%;比例必須與扇形區(qū)域的面積比例一致。條形圖:用來對各項信息進行比較。(當各項信息的標識(名稱)較長時,宜用條形圖)。柱形圖:橫軸表示時間,縱軸表示數據大小(常用于時間序列數據)。它可以直觀地看出事物隨時間變化的情況。折線圖:明顯表示趨勢的圖示方法。簡單、容易理解。曲線圖:用光滑曲線連接各點,形成一條整體光滑的曲線。散點圖:用來表現兩個變量之間的相互關系,以及數據變化的趨勢。莖葉圖:把數據分成莖與葉兩個部分,按一定規(guī)律排列。它既保留了所有原始數據,又直觀地顯示出數據的分布。數據集中趨勢的度量:?平均數:n個數據的算術平均數n個數據的算術平均數=全體數據的和
數據的個數(組中值x(組中值x頻數)的和分組數據的加權平均數-—頻數的和y牝1i其中m為組數,y.為第i組組中值,v.為第i組頻數。平均數容易理解,計算;它不偏不倚地對待每一個數據;是數據集的“重心”;缺點是它對極端值十分敏感。?中位數:將數據按從小到大順序排列,處在中間位置上的一個數或最中間兩個數的平均數。中位數對極端值不像平均數那么敏感,因此,如果數據含有極端值,用中位數來描述集中趨勢比用平均數更為恰當。?眾數:數據中出現次數最多的數。它反映了數據中最常見的數值,不僅對數量型數據(數值)有意義,對分類型數據也有意義;它能夠告訴我們最普遍、最流行的款式、尺寸、色彩等產品特征。缺點是一組數據可能沒有眾數,也可能眾數不唯一。四.數據離散趨勢的度量:?極差R=max-min。?四分位極差=Q3-Q1。第2四分位點q2=全體數據的中位數;第1四分位點Q1=數據中所有WQ2的那些數據的中位數;第3四分位點Q3=數據中所有NQ2的那些數據的中位數。四分位極差不像極差R那樣容易受極端值的影響,但是仍然存在著沒有充分地利用數據所有信息的缺點。?方差:反映數據離開平均數遠近的偏離程度。EV'',一、,〉一C、.n(X-x)2=+(乙X2一nx2)分組數據的方差。2=+Zm(y,—y)2七=+(Zmy;七—ny2)其中m,y「vi同上,n=2nvi是數據的個數,y是分組數據的加權平均數。?標準差:。=兵(方差的算術平方根,與原來數據的單位相同)?變異系數:v=奪(%)(反映數據相對于其平均數的分散程度)X兩組數據的平均數不同或兩組數據的單位不同時用。第二章隨機事件及其概率隨機試驗與隨機事件:?隨機試驗:可以在相同的條件下重復進行;試驗的結果不止一個,但所有可能的結果在試驗之前都知道;每次試驗之前,不知道這次試驗出現哪個結果。?樣本空間Q:隨機試驗中每個可能的結果,稱為一個基本事件(或樣本點);基本事件的全體所組成的集合稱為樣本空間(是必然事件);若干個樣本點組成的集合(即樣本空間的子集),稱為隨機事件(簡稱事件);事件A發(fā)生。A中一個樣本點出現;只含一個樣本點的事件是基本事件,不含任何樣本點的事件是不可能事件0。?樣本空間的表示方法:列舉法,描述法。事件的關系和運算?事件的關系:包含關系:若A發(fā)生,則B一定發(fā)生(或事件A的樣本點都包含在B中),則稱事件A含于B(或B包含A),記作AuB(或BdA)。相等關系:若事件A,B所含樣本點相同,則稱事件A與B相等,記作A=B。?事件的運算
并AUB:A發(fā)生或B發(fā)生(或A,B至少有一個發(fā)生)的事件,常記作A+B。交AHB:A,B同時發(fā)生的事件,常記作AB。差A-B:A發(fā)生,但B不發(fā)生的事件。互斥事件:事件A,B中若有一個發(fā)生,另一個一定不發(fā)生(即AB=0),則稱事件A,B互斥,否則稱A,B相容。對立事件:若事件A,B互斥,且AUB是樣本空間(即AB=0,A+B=Q),則稱事件A,B對立(或互逆)。A的對立事件記作A(即AA=0,A+A=Q)。?一個常用的等式:A-B=A-AB=AB?運算律:交換律:A+B=B+A,AB=BA;結合律:(A+B)+C=A+(B+C),(AB)C=A(BC);分配律:(A+B)C=AC+BC,(AB)+C=(A+C)(B+C);對偶律:A+B=AB,~AB=A+B。概率的定義:(統計)事件A發(fā)生的頻率的穩(wěn)定值稱為A的概率,記作P(A)(0WP(A)W1)。(古典)若隨機試驗的樣本空間只含有限個樣本點,且每個樣本點發(fā)生的可能性相同,mA所含樣本點個數則P(A)=樣本點總數一。(幾何)設質點落在Q內任何一點的可能性相同,AuQ,則質點落在A內(記作事件A)的概率A的面積P(A)=A的面積P(A)=Q的面積(=1)=A的面積。?兩個基本原理加法原理:做一件事,有兩類辦法,第一類有m種方法,第二類有n種方法,則做完這件事,共有m+n種方法(可以推廣到有多類辦法的情況);乘法原理:做一件事,分兩步來做,第一步有m種方法,第二步有n種方法,則做完這件事,共有mXn種方法(可以推廣到多個步驟的情況)。排列:從n個不同元素中任取r個,按照一定的順序排成一列,稱為從n個不同元素中任取r個的一個排列。所有排列的個數,稱為從n個不同元素中任取r個的排列數,記作Pn。組合:從n個不同元素中任取r個,不管怎樣的順序合成一組,稱為從n個不同元素中任取r個的一個組合。所有組合的個數,稱為從n個不同元素中任取r個的組合數,記作Cr。顯然Pi=Ci=n,Cn=1。"概率的性質:0MPn(A)W1「P(0)=O,P(Q)=1。條件概率:在事件B(假定P(B)>0)發(fā)生的條件下,事件A發(fā)生的概率稱為A對B的條件概率,記作P(AIB)。計算公式P(AIB)=3);P(B)概率公式:
互逆概率:對任意事件A,P(A)+P(A)=1;加法公式:P(A+B)=P(A)+P(B)-P(AB)可以推廣到有限個事件的并的情形,如:P(A+B+C)=P(A)+P(B)+P(C)-P(AB)-P(AC)-P(BC)+P(ABC)減法公式:P(A-B)=P(A)-P(AB)特別地,當AoB時,P(A-B)=P(A)-P(B);乘法公式:P(AB)=P(A)P(BIA),P(A)/0;全概公式:設事件A1,%,???,An兩兩互斥,A1+-+An=fi,且P(A1)>0,…,P(An)>0,則對任意事件B,有P(B)=P(A1)P(BIA1)+P(A2)P(BIA2)+?+P(An)P(BIAn);貝葉斯公式:條件同上,則對任意事件B(P(B)>0),有P(A.IB)=PAB=p(氣)p(BI氣),i=1,2,…,n,(分母中的P(B)用全概公式求)。iP(B)P(B)第三章隨機變量及其分布取值帶有隨機性,但取值具有概率規(guī)律的變量稱為隨機變量。離散型隨機變量:取值可以逐個列出。?數學期望:定義:性質:EX=£xipiEc?數學期望:定義:性質:EX=£xipiEc=cE(aX)=aEXE(aX+b)=aEX+bXx1x2…pp1p2…(以概率為權數的加權平均數);(常數期望是本身)(常數因子提出來)(一項一項分開算)?方差:定義:性質:DX=E(X?方差:定義:性質:DX=E(X-EX)2=£(xi-EX)2pi;Dc=0D(aX)=a2DXD(aX+b)=a2DX(常數方差等于0)(常數因子平方提)(一項一項分開算)DX=E(X2)-(EX)2(方差=平方的期望-期望的平方);3.公式:?常用離散型隨機變量:(0-1)分布:隨機變量(0-1)分布:隨機變量X只能取0,1這兩個值;X?B(1,p);EX=p,DX=p(1-p)二項分布:分布律:P(X=k)=Ckpk(1-p)n-k,k=0,1,2,…,n;nX?B(n,p);EX=np,DX=np(1-p)4)適用:隨機試驗有兩個可能的結果(A或A),且P(A)=p,將該試驗獨立重復n次。泊松分布:分布律:P(X=k)=血項,k=0,1,2,…,入>0;k!X?P(入);EX=入,DX=入;適用:在指定時間段(或指定范圍)內某事件發(fā)生的次數。三.連續(xù)型隨機變量:取某個范圍內的一切實數。?X的密度函數f(x):對任意實數x,f(x)N0;對任意實數a<b,P(a<XWb)是密度曲線y=f(x)下方,[a,b]區(qū)間上方圖形的面積。?設X是連續(xù)型隨機變量:期望EX=大量重復試驗結果的算術平均數的穩(wěn)定值(常記作u);方差DX=E(X-EX)2=E(X2)-(EX)2(方差=平方的期望一期望的平方);標差方差的算術平方根。?常用連續(xù)型隨機變量:名稱密度函數記法EXDX均勻分布f⑴=〕a<x<bX?U[a,b]a+b(b一a)2、0,其他212指數分布f⑴=■人e-兀,0x>0,入>0x<0X?E(入)1力1人2正態(tài)分布p(x)=:-e-4x-u422ct2,b>0X?N(u,。2)u。2,■2兀Q標準正態(tài)x2一分布'(x)=士e一2L2KX?N(0,1)01?正態(tài)分布的密度曲線y=p(x)是一條關于直線x=u的對稱的鐘形曲線,在x=u處最高,兩側迅速下降,無限接近x軸;。越小(大),曲線越尖(扁)。?標準正態(tài)分布的密度曲線y=e(x)是關于y軸對稱的鐘形曲線。?隨機變量的標準化XTX-EX(減去期望除標差)?!鯠X?標準化定理:設X?N(u,。2),則Z=\丁?N(0,1)。二維隨機變量:?用兩個隨機變量合在一起(X,Y)描述一個隨機試驗,(X,Y)的取值帶有隨機性,但取值具有概率規(guī)律,則稱(X,Y)為二維隨機變量。?X,Y的協方差:cov(X,Y)=E[(X-EX)(Y-EY)]=E(XY)-EXXEY協方差cov(X,Y)的正負反映X,Y之間相關關系的方向。cov(X,Y)>0表示X與Y之間存在一定程度的正相關關系;cov(X,Y)<0表示X與Y之間存在一定程度的負相關關系;cov(X,Y)=0稱作X與Y不相關。?X,Y的相關系數:rXY=心A(-1WrXYW1)XYDX.、DY又丫相關系數rXY反映X,Y之間的線性相關的程度。rXY越接近1,表明X,Y之間的正線性相關程度越強;rXY越接近-1,表明X,Y之間的負線性相關程度越強;rXY=0,X與Y不相關。?隨機變量的線性組合:E(aX+bY)=aEX+bEYD(aX+bY)=a2DX+2abcov(X,Y)+b2DY決策準則與決策樹:?對不確定的因素進行估計,從幾個方案中選擇一個,這個過程稱為決策;?決策三準則:極大極小原則:將各種方案的最壞結果(極小收益)進行比較,選擇極小收益最大的方案;最小期望損失原則:選擇期望損失最小的方案;最大期望收益原則:選擇期望收益最大的方案。?決策樹:把不確定因素下的決策過程用圖解的形式表示出來,簡單、直觀。第四章抽樣方法與抽樣分布一、抽樣基本概念:總體:研究對象的全體;個體:組成總體的每一個個體;抽樣:從總體中抽取一部分個體的過程;有放回抽樣(各次抽取相互獨立),不放回抽樣(各次抽取不相互獨立)。樣本:從總體中抽出的一部分個體構成的集合;樣本值:在一次試驗或觀察以后得到一組確定的值;隨機樣本:①個體被抽到的可能性相同;②相互獨立;③同分布。二、抽樣方法:?簡單隨機抽樣:總體中有n個個體,從中抽取r個個體作為樣本,使得所有可能的樣本都有同樣的機會被抽中(r稱為樣本容量)。有放回抽樣的樣本個數為nr;無放回抽樣的樣本個數為史。?系統抽樣(等距抽樣):將總體中的個體按照某種順序排列,按照規(guī)則確定一個起點,然后每隔一定的間距抽取個體作為樣本。?分層抽樣:在抽樣之前將總體劃分為互不交叉重疊的若干層,然后從各個層中獨立地抽取一定數量的個體作為樣本。?整群抽樣:在總體中由若干個個體自然或人為地組成的群體稱為群,抽樣時以群為抽樣單位,對抽中的各群的所有個體進行觀察。三、抽樣中經常遇到的三個問題:抽樣框選取不當;無回答:處理無回答常用的方法:注意調查問卷的設計和加強調查員的培訓;進行多次訪問;替換無回答的樣本單元;對存在無回答的結果進行調整。抽樣本身的誤差。1)抽樣誤差(樣本指標與被估計的總體相應指標的差)與抽樣標準誤差(抽樣誤差的標準差);2)非抽樣誤差與偏差。四、抽樣分布與中心極限定理:?不含任何未知參數的樣本的函數稱作統計量。?常用的統計量樣本均值:X=+z^x;樣本方差:S2=六£;(X"X)2;(注意是除以n-1,其中n是樣本容量)樣本標差:S=.、§。?統計量的分布叫做抽樣分布。?樣本均值的期望與方差:設隨機變量X],…,Xn獨立同分布,且EX尸u,DX=。2,i=1,2,…,n,X=+^^^X^,則EX=E(士£"X)=+£-EX=+-職=u;DX=D(七£nX)=+D(£nX)=+£nDX=+-n。2=gn1in21in211n2n即,樣本均值的期望=總體均值,樣本均值的方差=總體方差/樣本容量。?中心極限定理:設隨機變量X],…,Xn獨立同分布,且EX廣…=EXn=u,DX廣…=DXn=。2,X=+£nX貝gX近似N。即,大樣本(樣本容量nN30),*論原來總體服從什么分布,樣本均值都近似服從正態(tài)分布。五、常用的抽樣分布樣本均值的分布:總體分布樣本容量樣本均值的分衫N(u,°2)任意X?N(p,吁)非正態(tài)分布大樣本X?似N(R,&2)n樣本均值的期望與方差總體抽樣方式EXDX有放回抽樣有限總體■^2n不放回抽樣uN-n無限總體任意n當有限總體不放回抽樣n<5%時,修正系數N-nR1,樣本均值的方差可以簡化為艮。N2.樣本比例的分布:P'?N(p,NW)n樣本比例的期望與方差N-1n總體抽樣方式EPDP有放回抽樣有限總體p(1-p)n不放回抽樣PP(l-P)--N-n-無限總體任意P(1-P)n
。未矢小樣本s代。當有限總體不放回抽樣n<5%時,修正系數。未矢小樣本s代。六、名稱統計量記法上a分位點X2分布X],…,Xn?N(0,]),獨立x2=X:+???+X2x2?x2(n)P[x2>xa2(n)]=at分布X?N(0,]),Y?x2(n),獨立.t=X/<ynt?t(n)P[t>t(n)]=aF分布U?x2(m),V?x2(n),獨立.F=5V/nF?F(m,n)P[F>F(m,n)]=a七、幾種重要統計量的分布:設X?N?,02),X],…,Xn是X的樣本,樣本均值X,樣本方差S2:].t分布:X?N(R,砰)標TL?N(0,1)n朽ny?.?X2分布:乙阡疽)=(nj)^?*2(n一]);設X],…,Xm;%…,Yn分別是N?],。^),N(u2,o22)的樣本,且相互獨立,則:X-V?N(旦—旦,嚀+哼)標驊X-Y-W廣叩?N(0,1)
mn■.4+略mnX-V-(七-七
S"I+:)?tX-V-(七-七
S"I+:)?t(m+n—2)口S2=+£m(X—X)2S2=+£n(V-Y)2,S2=(m-1)S2+(n-1)S2n-12n-1]iS2=+£m(X—X)2n-1一、參數的點估計?設總體分布中含有未知參數。,從總體中抽取一個樣本X],…,Xn,用來估計未知參數。的統計量°(X],…,Xn)稱為。的一個估計量。若X],…,xn是樣本的一組觀察值,則稱°(X],…,xn)為參數。的一個點估計值。?估計量的評價標準:無偏性:設°是總體未知參數。的估計量,若E°=°則稱°是。的無偏估計量。樣本均值X是總體均值U的無偏估計量:EX=U;樣本方差S2是總體方差。2的無偏估計量:ES2=02;樣本比例P是總體比例p的無偏估計量:EP=p。有效性:。的方差最小的無偏估計量稱為。的有效估計量。正態(tài)總體的樣本均值X是總體均值u的有效估計量。
一致性:若樣本容量增大時,估計量0的值越來越接近未知參數。的真值,則稱0是。的一致估計量。樣本均值是總體均值的一致估計量;樣本方差是總體方差的一致估計量;樣本比例是總體比例的一致估計量。二、參數的區(qū)間估計:?設。是總體分布中的未知參數,X1,…,Xn是總體的一個樣本,若對給定的a(0<a<1),存在兩個估計量0(X,…,X)和0(X|,…,X),使P(0<°<°)=1—a,則稱隨機區(qū)間]'1n21n12(01,02)為參數。的置信度為1—a的置信區(qū)間,°a稱為顯著水平。?意義:隨機區(qū)間(01,02)包含°真值的概率是l—a。三、總體均值的置信區(qū)間標準化T置信度1-a待估參數:總體均值h樣本勻”,A估計量X?N(h,b2)—bX+Z—a/2x'nnb已知Z=IZh?N(0,1)置信區(qū)間或大樣本f'nSX土t(n—1)—a/25。未知,小樣本,X—^置信區(qū)間—t=標準化T置信度1-a—bX+Z—a/2x'nSX土t(n—1)—a/25總體分布樣本量。已知。未知S代。大樣本正態(tài)分布非正態(tài)分布小樣本nZa/2寫X土ta〃(n—1)?十S代。大樣本.nP—P2土P—P2土Z樣本量抽樣方式置信區(qū)間大樣本有放回抽樣P+Zv:P1—P)a/2*n不放回抽樣p土za/2jpup)-N—n五、兩個總體均值之差的置信區(qū)間(置信度1-a)總體分布樣本量。已知。未知大樣本S1代。1,S2代。2正態(tài)分布小樣本X—Y+Z寸嚀+哼X—Y土ta/2(m+n—2)-S合?寸+++非正態(tài)分布大樣本S1代。1,,2代。2六、兩個總體比例之差p1—p2的置信區(qū)間(置信度1—a):'】~~\;P^+P^—P^a/2'mn七、樣本容量的確定抽樣方式置信區(qū)間(置信度1—a)絕對誤差樣本容量有放回抽樣(或抽樣比<5%)總體均值X+有放回抽樣(或抽樣比<5%)總體均值X+Za/2-總體比例P土七/2?線冒△=z?a/2■■n△=z(P^P)
a/2n(zb)2n=a/2I△J不放回抽樣總體均值iX+Z/2千Nn△=Za/2,-&■-?'N-nn'"I先算出有放回抽樣的樣本容量n,然后:總體比例c,rI△=Z\*;P(1-P)-N-n0n=—P±Z寸P(1-P)-N~na/2'bnN-11+的Nn=z&2P(1")第六章假設檢驗一、假設檢驗的基本概念:?小概率原理:小概率事件在一次試驗中很難發(fā)生(但并不意味著絕對不會發(fā)生)。?對總體參數的取值所作的假設,稱為原假設(或零假設),記作H0;原假設的對立假設稱為備選假設(備擇假設),記作H1O?犯“H0成立,但拒絕H0”這種錯誤稱為第一類錯誤(棄真錯誤),犯第一類錯誤的概率a稱為顯著水平;犯“H0不成立,但接受H0”這種錯誤稱為第二類錯誤(取偽錯誤),犯第二類錯誤的概率記作B。?用來判斷是否接受原假設的統計量稱為檢驗統計量。?當檢驗統計量取某個范圍D內的值時,我們拒絕原假設H0,這時D稱為拒絕域。?拒絕域的邊界點稱為臨界點。?假設檢驗的基本思想:先假定H0成立,在這個前提下用樣本數據進行推導、計算,如果導致小概率事件發(fā)生,則拒絕H0,否則就接受H0。?當檢驗統計量H0:u=u0H1:u#u0(雙側檢驗)拒絕域:IZI^z/2a/2H0:u=u0H1:u>u0(右側檢驗)拒絕域:Z3zH0:u=u——0—u<u0——(左側檢驗)拒絕域:ZW-za?假設檢驗的五個步驟:提出原假設與備選假設。原則:1)把含有等號的式子作為原假設;2)把從樣本作出猜測而希望證實的問題作為備選假設。選取統計量。(通過選取適當的檢驗統計量來構造小概率事件)按P(拒絕H0IH0成立)=a確定拒絕域;計算統計量的值;作出判斷:若樣本值落在拒絕域內,小概率事件發(fā)生,拒絕H0;若樣本值不落在拒絕域內,小概率事件沒有發(fā)生,接受H0。、總體均值的假設檢驗:已知條件H0H1檢驗統計量及其分布拒絕域X?N(u,02)。已知u=u0或大樣本uNuIZlNz0X^丑0為真a/2u>uZ==°虬N(0,1)Z3z0b/5au<uZW-z0a
X?N(u,02)。未知,小樣本u=u0u#u0u>u0u<ut=又-%燮t(n-1)S/m|t2ta/2(n-1)t3t(n-1)tW-t(n-1):、總體比例的假設檢驗:已知條件__Ho___H1檢驗統計量及其分布拒絕域p#p0p>p0Z=-P—PH0為真0一七N(0,1)1―_X|Z2z/2a/2Z3z大樣本p=p00p(1—p)Q―00—P<P07nZW-zQ四、兩個總體均值之差的假設檢驗:比例-已知條件_10__—H1__檢驗統計量及其分布拒絕域X?N(ui,o12)Y?N(u2,。22)。],。2已知u1=u2ujNu?u1>u2u<uZ=X—YH抄N(0,1)、嚴+哼mn|Z2z「a/2Z3zaZW-z或大樣本12QX?N(ui,oi2)Y?N(u2,。22)。]=。2未知,小樣本u1=u2ujNu?u1>u2u1<u2x—Yh為真/?t=~t(m+n—2)S、:+++合vmn|t2ta/2(m+n-2)t3t(m+n-2)tW-t(m+n-2)p1#p2rP—PH為真、i\Z=、L2IN(0,1)\P(1—P)住+4)■mn|Z2z「/2Z3zaZW-z大樣本p1=p2p1>p2pm第七章相關與回歸分析一、相關分析:?線性相關:變量的關系近似線性函數;1正線性相關:變量同向變化;2負線性相關:變量反向變化;?非線性相關:變量的關系近似非線性函數;?完全相關:變量的關系是函數關系;1完全線性相關:變量的關系是線性函數;2完全非線性相關:變量的關系是非線性函數;?不相關:變量之間沒有任何規(guī)律。?協方差:cov(X,Y)=E[(X-EX)(Y-EY)]=E(XY)-EXXEY?總體相關系數:r=cov£x皿XY■-DX??DY一"L一、記,?簡單相關系數:r=亍乙(巴1)(導一y)_=―^,(x1,y1),^,(xn,yn)是總體(X,Y)的n對觀察值?.乙(Xi-X)2.?.乙(yt-y)2■-lxxr反映兩個變量之間線性相關的密切程度。l=£x.y.-nx?y,l=£x.2-nx^,l=£y.2-nyxyWixyiyyi
、一元線性回歸:如果可以近似地用函數來描述變量之間的相關關系,則稱該函數為回歸函數;若回歸函數是線性(一次)函數,則稱為線性回歸函數;若兩個變量之間的回歸函數是線性函數,則稱為一元線性回歸函數(其圖形稱為回歸直線);4.回歸直線》=a+bx,其中b=lxy/lxx稱為斜率(或回歸系數),a=y-bx稱為截距。5.平方和分解公式Z(y—y)2=S(y—y)2iiiSST=SSE總變差平方和=剩余平方和+SSR(SST=lyy,SSR=b2lxx)+回歸平方和總變差平方和:反映y1,…,yn的分散程度;回歸平方和:反映由于x1,??:xn的分散性引起的y],???,yn的分散程度;剩余平方和:反映其他因素引起的y1,SST=SSE總變差平方和=剩余平方和6判定系數:r2=st(回歸平方和占總變差平方和的比例)=(相關系數r)27.判定系數的意義0WhW1SSE意義r2=0SSE=SSTx的變化與y無關,x,y沒有線性相關關系、八一一-r2-1SSE—0,y,Tyj觀察點接近回歸直線,x,y高度線性相關r2=1r2=1sse=o,y,=y,觀察點落在回歸直線上,x,y完全線性相關.....一......最小二乘法:使因變量的觀察值y與估計值y,之差的平方和SSE(剩余平方和)達到最小來求得a和b的方法,即SSE=£(y.-y)2=S(y.-a-bx.)2=min。估計標準誤差:s=W=產"Z、廣2皿y?n—2In—2y0的點估計與區(qū)間估計::給定x=x0y0的點估計:y0=a+bx0個別值y「的預測區(qū)間:y土t(n—2)-S?.「1+++(xo—x)2
』°0ayYnlTOC\o"1-5"\h\z2xx平均值Ey的置信區(qū)間:y土t(n—2)?S?:1+?!?ayvnix三、多元線性回歸和非線性回歸:2_.a?多元線性回歸:y=b°+b1x1+_+bkxk?表示在其它變量不變的條件下,%增加1個單位時,y平均變動Q個單位.平方和分解公式:SST=SSE+SSR多重判定系數R2=SSR/SST=(多重相關系數R)2意義:因變量的總變差中,有R2(%)可以由回歸方程來解釋。估計標準誤差:$=I’TAy,n—k—1意義:用x],...,xk來預測因變量y,平均預測誤差為sy個單位。
?可線性化的非線性回歸:名稱方程變量代換線性回歸雙曲函數y=a+b?+Xx’=十Xy=a+bx’對數函數y=a+blogxx’=logxy=a+bx’冪函數y=Axby’=logy,x’=logx,a=logAy’=a+bx多項式函數y=b0+b1x1+...+bkxkx]=x,x2=x2,…,xk=xky=b0+b1x1+...+bkxk第八章時間數列分析一、時間數列的分類?絕對數時間數列時期數列一觀察值反映現象在一段時期內的總量(可以直接相加)。時點數列一觀察值反映現象在某一時刻上的總量(通常不能相加)。?相對數時間數列:兩個同類的絕對數的比形成的時間數列(無單位,通常用百分數表示)。?平均數時間數列:兩個不同類絕對數的比形成的時間數列(有單位)。二、時間數列的序時平均數現象在各個時間上的觀察值稱為發(fā)展水平(反映現象的規(guī)模和發(fā)展的程度)。各個時期發(fā)展水平的平均數稱為平均發(fā)展水平(序時平均數)。序時平均數的計算方法:1)絕對數時期數列:算術平均法Y=頃++Yn絕對數時點數列:連續(xù)時點:同上間斷時點:加權平均法首末折半法Y=號.匕+號T2+...+蛆九.J1間斷時點:加權平均法首末折半法—T1+T2+...+T1(其中T1,T2,…,Tn-1是時間間隔長度)時2=...%「^=專+%+...+七1+飛
n-12)相對數,平均數時間數列:分開平均再相比Y=皆b三、時間數列的水平(絕對數)分析增長量=報告期水平一基期水平;逐期增長量=報告期水平一前期水平;累計增長量=報告期水平一固定基期水平四、時間數列的速度(相對數)分析、、報告期水平發(fā)展速度=基期水平增長速度=發(fā)展速度-1報告期水平環(huán)比發(fā)展速度=前期水平;環(huán)比增長速度=環(huán)比發(fā)展速度-1
定基發(fā)展速度=、、報告期水平發(fā)展速度=基期水平增長速度=發(fā)展速度-1報告期水平環(huán)比發(fā)展速度=前期水平;環(huán)比增長速度=環(huán)比發(fā)展速度-1定基發(fā)展速度=報告期水平
固定基期水平定基增長速度=定基發(fā)展速度-1累積增長量
觀察值個數-1平均發(fā)展速度=各環(huán)比發(fā)展速度的幾何平均數;I水平法:Y=請Y0累計法:Y+Y2+...+Yn=Y0+Y1;+匕(查表)Y0水平法、一」I1=平均增長速度=平均發(fā)展速度一1累計法’六、長期趨勢分析及預測:時間數列的構成要素:T一長期趨勢;S一季節(jié)變動;C一循環(huán)變動;I一不規(guī)則變動。時間數列的模型:乘法模型一Y=TXSXCXI;加法模型一Y=T+S+C+I;混合模型等。移動平均法:適當擴大時間間隔,逐期移動,算出移動平均趨勢,消除短期波動(偶數項要作兩次移動平均);數學模型法線性模型(直線趨勢)以時間t作自變量,發(fā)展水平Yt作因變量線性模型(直線趨勢)以時間t作自變量,發(fā)展水平Yt作因變量,用最小二乘法得趨勢直線方程。a=Y—bttY=a+bt,
t非線性模型(曲線趨勢)指數曲線Y=a?bt,
tb=l/1tY,tt(其中t用時間編碼)Gompertz曲線二次曲線Y=a+bt+ct2,
t=修正指數曲線Y=K+a?bt,tY=Kabt,
tLogistic曲線人Y=^—tK+a-bt七、季節(jié)變動分析:?季節(jié)變動的測定:1.按季(月)平均法;同季(月)平均數(消除隨機影響)一總季(月)平均數J全體數據的和)數據個數一季節(jié)指數C同季(月)平均數(%))總季(月)平均數’四季季節(jié)指數之和=400%七、季節(jié)變動分析:?季節(jié)變動的測定:1.按季(月)平均法;趨勢剔除法:先消除趨勢變動,再計算季節(jié)指數。四季(或全年)的移動平均趨勢T一y=觀察值(%),消除趨勢變動;一將Y/T按季(月)重新排列,計算同季(月)平均數。?季節(jié)變動的調整:算出Y/S(消除季節(jié)變動)
一根據Y的數據,配合趨勢直線Y=a+bt,a=-bt,b=l_/lxx(其中t為時間編碼)一由趨勢直線方程,算出調整后的趨勢值。季節(jié)變動和不規(guī)則變動。八、循環(huán)變動的測定:剩余法一從時間數列中消除趨勢變動、消除季節(jié)變動,計算二一根據Y的數據,配合趨勢直線Yf=a+bt,算出
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 勞務中包合同范本
- 課題立項申報書查重率
- 代理英文合同范本
- 加快老舊農機更新換代的實施方案
- 代寫招標文件合同范例
- 合同范本買賣協議書
- 雙方合作店鋪合同范本
- 咨詢顧問合同范本 英文縮寫
- 保安兼職合同范本
- 倉庫代發(fā)服務合同范本
- 雪鐵龍DS6保養(yǎng)手冊
- 廣東省廣州市海珠區(qū)南武小學2023-2024學年三年級下學期3月期中語文試題
- 金融糾紛調解培訓課件模板
- 化工有限公司年產1970噸農用化學品項目環(huán)評可研資料環(huán)境影響
- 兒童康復作業(yè)治療
- 預防流感和諾如病毒課件
- 部編版初中語文文言文對比閱讀 九年級下冊(下)(解析版)
- 刑事案件及分析報告
- 《奧運歷史》課件
- 變電運維講安全
- 《感染性休克的治療》課件
評論
0/150
提交評論