




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、應(yīng)用統(tǒng)計分析部分第一章:抽樣分布與設(shè)計一、抽樣分布1、抽樣的特點抽樣的目的是用被抽取部分個體所求得的數(shù)值推斷總體的數(shù)量特征。其中,抽取部分個體稱為總體的一個樣本 。特不樣本個數(shù)確實是樣本容量;樣本取值確實是樣本觀看值。抽樣是對所研究的總體,按照隨機原則抽取部分個體進行的調(diào)查。抽樣的特點:隨機原則:每個元素(或個體)有同等抽中的機會(具有代表性) 推斷總體特征:樣本的數(shù)值特征推斷總體數(shù)量特征。 推斷的精確性:把推斷的誤差操縱在一定的精確度內(nèi)(可靠性要求)2、樣本平均數(shù)的分布正態(tài)總體分布:假如從正態(tài)分布總體N(,)中隨機抽取樣本,則樣本平均數(shù)的分布具有如下性質(zhì):a:樣本的平均數(shù)的分布也是正態(tài)分布。
2、b:樣本的平均數(shù)的平均數(shù)等于總體的平均數(shù)c: 當(dāng)從無限總體抽樣(或從有限總體采納放回抽樣)時,樣本平均數(shù)分布的方差等于總體的方差除以樣本容量。即特不:當(dāng)從有限總體不放回抽樣時,樣本平均數(shù)分布方差為:();簡記(1-)總結(jié):樣本平均數(shù)服從正態(tài)分布:N(,)非正態(tài)總體分布:假如總體不服從正態(tài)分布時,樣本平均數(shù)分布性質(zhì)則由中心極限定理來解釋如下:a:只要數(shù)學(xué)期望和方差存在,從總體中隨機相互獨立抽取n個樣本,則樣本平均數(shù)是隨機變量;b:當(dāng)n夠大 (一般n30) 時,則N(,)c:特不總體服從二點分布p(x=i)=p,p(x=0)=1-p時,則期望p方差p(1-p) 故放回抽樣時,);不放回抽樣時,(1
3、-)。樣本平均數(shù)之差的分布:假如總體1:X,抽n1個樣本,假如總體2:Y,抽n2個樣本,則二、抽樣設(shè)計簡單隨機抽樣: 事前編好隨機數(shù)據(jù)表總體(全部編號) 標(biāo)簽(混合) 用手隨機模取 抽樣 搖號機類型抽樣(分層抽樣或分類抽樣):總體(按特征標(biāo)志分組) 組1 隨機抽樣 組k 隨機抽樣分配原則:等數(shù);等比例;最優(yōu)設(shè):總體為N(總體樣本為n) ;分成k 組,第i組包含Ni個單位,樣本為ni 等數(shù):n1=n2=.= nk=等比例:;樣本數(shù)最優(yōu):標(biāo)志變動程度為,樣本數(shù)樣本平均數(shù)i組:; 總體:樣本平均數(shù)總體方差:全樣本平均數(shù)的方差是各類型方差的加權(quán)綜合樣本平均數(shù)i組方差:是第i組內(nèi)資料的方差,取各類型樣本
4、方差的加權(quán)數(shù)綜合整群抽樣:總體(按標(biāo)志分成若干群)隨機抽取r個群樣本總體分為R個群,每群含為M個單位。設(shè)為第i個群中的第j個單位的標(biāo)志值。i群平均數(shù): i=1,2,r總體平均數(shù):總體方差: 樣本平均數(shù)的群間方差其中,為總體各群的平均數(shù);為總體的總平均數(shù)樣本方差: 樣本的群間方差其中,為抽樣各群的樣本平均數(shù);為抽樣各群全體樣本的平均數(shù)整群不放回抽樣樣本平均數(shù)的方差:注:等距抽樣;多時期抽樣;雙相抽樣;穿插抽樣(略)。第二章:參數(shù)可能與假設(shè)檢驗一、參數(shù)可能問題隨機變量特征(概率分布;均值;方差) 如何? 解決方式:依照樣本來可能所要的信息;具體思路:用樣本統(tǒng)計量可能總體參數(shù)。1、參數(shù)點可能量優(yōu)劣的
5、判不準(zhǔn)則和常用的可能量點可能:用樣本統(tǒng)計量可能總體參數(shù)一個明確的可能值準(zhǔn)則:無偏性-令為被可能參數(shù);為的無偏可能量;則 一致性:樣本容量越大,可能量的值越接近于被可能總體參數(shù) 有效性:,假如的方差比的方差小,則比有效常用可能量:用樣本的平均數(shù)可能總體平均數(shù),即用樣本方差和標(biāo)準(zhǔn)差s可能總體方差和標(biāo)準(zhǔn)差即;用樣本中具有某特征單位的比例可能總體比率p,即2、參數(shù)區(qū)間可能問題 區(qū)間可能:用樣本可能總體參數(shù)可能取值的區(qū)間(給出了點可能可靠性的一種描述,是點可能的補充)選擇兩個統(tǒng)計量1和2可能P(11-(事先給定的正數(shù)),且12,1,2 稱為置信水平為1的置信區(qū)間;1置信概率(置信水平或置信系數(shù));實有意
6、義:有100(1-)%把握斷定在1,2內(nèi)。總體平均數(shù)的區(qū)間可能假設(shè):總體服從正態(tài)分布N() ; 隨機變量X的概率密度函數(shù):f(x)= ;記作:xN()假如令:Z(統(tǒng)計量)則E(Z)E()0D(Z)EE()E(=1因此:ZN(0,1)標(biāo)準(zhǔn)正態(tài)分布 密度函數(shù)f(x)= 分布函數(shù)(x)=(-x)=1-(x), P(azb)=P(Zb)-P(Za)第一種情況:樣本取自總體方差已知(即已知)的正態(tài)分布,對總體期望值的區(qū)間可能已知:總體隨機變量XN(, 2),則N(, 2/n) ,其中;2/n(放回)令:Z,則ZN(0,1)查正態(tài)分布表:PZr=P(rZr)=2(r)-1假如令P(Zr)0.955 則(r
7、)0.9775(標(biāo)準(zhǔn)正態(tài)表得:r 2)即P(22)=0.955也確實是:P(22)0.955(值落在總體平均數(shù)正負(fù)兩個標(biāo)準(zhǔn)差之內(nèi)的概率為95.5%)可得P(22)0.955對的一個區(qū)間可能(總體平均數(shù)有95.5%的可能性位于樣本平均數(shù)的正負(fù)兩個標(biāo)準(zhǔn)差之內(nèi))一般令:P(Z),(01則P1,(01,一般=0.05或0.01稱為概率密度置信水平可能量的標(biāo)準(zhǔn)差與概率度的乘積故的區(qū)間可能一般記為:或 (放回)稱為置信區(qū)間(有100(1)%的把握講明總體平均值在那個區(qū)間內(nèi)例:P0.99P0.9952.58 152.5815+2.5812.4217.58第二種情況:樣本取自總體方差已知(已知)的非正態(tài)分布(
8、中心極限定理n30)例:P0.95P0.9751.96第三種情況:(未知)用樣本標(biāo)準(zhǔn)差S可能總體標(biāo)準(zhǔn)差(即:的可能值為)令:Z為變量引進新變量t= (討論t值的概率度;t的自由度為n-1)的區(qū)間可能一般計為:(總體分布對正態(tài)總體偏離不大時)例:P175(例8.3)已知:S0.08;n=16; =1 求解95%的置信區(qū)間(=0.05;/2=0.025) 求解:查自由度n-1=15的t分布(n個樣本明白僅有n-1是獨立的)得:(n-1)=2.13(2)正態(tài)總體方差的區(qū)間可能 方差 構(gòu)造統(tǒng)計量=(n-1)S2/2 證明 (衡量變量偏離總體平均數(shù)的尺度) 在正態(tài)分布的條件下,(n-1) (n-1為自由
9、度) 分布的形狀由自度確定,它是非對稱的。當(dāng)自由度為n 時,概率度為 時 P=給定置信水平1-:計算,查找出;使得:;的100(1-)%的置信區(qū)間為(n-1)S2/2即:P(n-1)S2/2)=1- P=1-因此:標(biāo)準(zhǔn)差的100(1-)% 的置信區(qū)間為:例P181(例8.7) :求95%的置信區(qū)間:=0.05 ,n=14查,n=14得:;故二、假設(shè)檢驗問題總體參數(shù)的假設(shè) 原假設(shè)(零假設(shè))記作H0 替代假設(shè)(備擇假設(shè))記作H1要求原假設(shè)和替代假設(shè)相互獨立性。即H0真實H1不真實;或:H1真實H0不真實;也確實是講:否定H0同意H1;或否定H1同意H0假設(shè)的類型: 1):H0:=0;H1 :0 雙
10、邊檢驗 2):H0:0;H1 :0 單邊檢驗假設(shè)檢驗:以樣本為依據(jù)構(gòu)造合適的檢驗統(tǒng)計量分析樣本統(tǒng)計值與參數(shù)假設(shè)值的差距確實是原假設(shè)的顯著性檢驗 檢驗統(tǒng)計量= 樣本統(tǒng)計量-被假設(shè)的參數(shù) 統(tǒng)計量的標(biāo)準(zhǔn)差 結(jié)論:差距大 假設(shè)值的真實性小 差距小 假設(shè)值的真實性大例:Z=(標(biāo)準(zhǔn)正態(tài)分布統(tǒng)計量)t= (t分布的統(tǒng)計量)假設(shè)檢驗的步驟:依照題意提出原假設(shè)H0和備擇假設(shè)H1選擇顯著性水平(0.05和0.01)選擇檢驗統(tǒng)計量及其分布依照顯著性水平確定統(tǒng)計量的否定域或臨界值(注意是雙邊依舊單邊檢驗)依照樣本數(shù)據(jù)計算統(tǒng)計量的數(shù)值并作出推斷:假如統(tǒng)計量的值落在否定域內(nèi)否定原假設(shè)假如統(tǒng)計量的值落在同意域內(nèi)差異不顯著(
11、同意原假設(shè))1、總體平均數(shù)的假設(shè)檢驗:假設(shè):H0:=0;H1:0 雙邊檢驗例:已知方差:50,n=25,=70 , =0.05 , 0=90檢驗:Z2 構(gòu)造統(tǒng)計量P(Z)= , =1.96 ; =-1.96Z(-1.96, 1.96) 否定原假設(shè)假設(shè):H0:0;H1:0 單邊檢驗例P190(例8.11)總體方差的假設(shè)檢驗例198(例8.17)第三章:回歸相關(guān)分析為了研究分析各種經(jīng)濟現(xiàn)象,就需要查找能講明這些經(jīng)濟現(xiàn)象的各種經(jīng)濟變量,并確定這些變量之間的因果關(guān)系,探究這些變量之間的數(shù)量變化規(guī)律。這確實是回歸相關(guān)分析一、建立回歸分析模型的步驟:1、理論模型設(shè)計選擇模型中將包含的變量(選擇某變量作為經(jīng)
12、濟系統(tǒng)的“果” ,正確地選擇作為“因”的變量)。按照經(jīng)濟行為理論和樣本數(shù)據(jù)顯示出變量之間關(guān)系構(gòu)造描述變量之間關(guān)系的數(shù)學(xué)表述式。擬定模型中待估參數(shù)的符號及其大小的理論期望值范圍。2、樣本數(shù)據(jù)的收集常用的樣本數(shù)據(jù):時刻序列數(shù)據(jù),截面數(shù)據(jù),虛變量數(shù)據(jù)(政策變量取值:0和1)選擇樣本數(shù)據(jù)的動身點:可得性和可用性。樣本數(shù)據(jù)的質(zhì)量:實整性,準(zhǔn)確性,可比性(數(shù)據(jù)的口徑問題)和一致性(樣本和母體必須一致。3、模型參數(shù)的可能樣本數(shù)據(jù)可能整體參數(shù)的具體取值。4、模型檢驗經(jīng)濟意義檢驗?zāi)P蛥?shù)可能值的可靠性檢驗(R2擬合優(yōu)度檢驗,t變量顯著性檢驗;F-方程顯著性檢驗)應(yīng)用檢驗(樣本容量變化的靈敏度分析進行穩(wěn)定性檢驗,
13、精度檢驗,預(yù)測能力檢驗)二、多元回歸分析模型綜述:理論模型設(shè)定:Y12x2+3x3+kxk+其中,Y為被解釋變量(果);1,2. k待估的參數(shù)(未知參數(shù)) ;x1, x2, x3.xk為解釋變量(因);為隨機擾動項抽取樣本代入設(shè)定模型得:Yi12x2i+3x3i+kxki+ii1,2,,n 樣本容量 : n30(最低:n3k或nk)假如,令Y= Y1 = 1 = 1 X= 1 X 21 X31 Xk1Y2 2 2 1 X 22 X32 Xk2 . Yn k n 1 X 2n X 3n Xkn 則樣本模型:Y=X+2.差不多假設(shè)隨機性: 為隨機變量零均值: E()=0同方差: (總體方差)無序列
14、相關(guān)性:COV(i,j)=0 (解釋變量相互獨立) 協(xié)方差 :COV(X,Y)= pi 為(xi ,yi)出現(xiàn)的概率 相關(guān)系數(shù): CORR(x,y)=Xji與i不相關(guān):解釋變量Xj (j=2,k) 在反復(fù)隨機抽樣中是選定的變量,故矩陣X的階數(shù)不變.Xji 之間不相關(guān):即秩(X)=k4.87,講明該方程在99%的顯著水平下仍是顯著成立的。顯著性水平,查t分布表得臨界值t0.025(21)=2.080,顯然|t1|=82.080;|t2|=1.42.080;|t3|=1.91.721,講明解釋變量X3在90%的概率水平下顯著。顯著性水平,查t分布表得臨界值t0.10(21)=1.323,顯然|t2
15、|=1.41.323,講明解釋變量X2在80%的概率水平下顯著。由此可見,決定是否剔除某個解釋變量需持慎重態(tài)度,在該模型中,三個解釋變量都能夠保留。(4)顯著性水平,查DW分布表得:d1=1.12,dv=1.66而dl DW=1.41dv,依照檢驗,在95%的概率水平下,不能推斷模型的自相關(guān)狀態(tài)。第四章:模擬分析問題:線性規(guī)劃動態(tài)規(guī)劃都假設(shè)所有數(shù)據(jù)是事先確定的已知的,不包含概率因素網(wǎng)絡(luò)理論的。實際情況專門少有符合分析模型的假設(shè),環(huán)境不確定性離散決策和復(fù)雜性,使現(xiàn)實中這些現(xiàn)象極為少見。模擬:能夠解決問題( 不滿足分析建模的標(biāo)準(zhǔn)方法所規(guī)定的假設(shè))模擬的定義:是建立系統(tǒng)或決策問題的數(shù)學(xué)(或邏輯)模型
16、,并以該模型進行試檢,以獲得對系統(tǒng)行為的認(rèn)識或關(guān)心解決決策問題的過程。定義中的兩個要素:一是模型:它將問題或系統(tǒng)的任何適當(dāng)假設(shè)模型化(模型是對實際系統(tǒng)思想或客體的抽象描述);二是模擬:用模型進行試驗并分析結(jié)果。模型的不同分類:模型分類:規(guī)定型模型:它決定著最優(yōu)策略或最佳行動過程 描述型模型:直接描述關(guān)系和提供評價信息,它用于解釋系統(tǒng)行為,預(yù)測輸入規(guī)劃過程的以后事件,并關(guān)心決策者選擇中意方案和系統(tǒng)設(shè)計 確定性:(數(shù)據(jù)已知或假設(shè)已知)模型分類: 概率型:(數(shù)據(jù)由概率分布決定)模型分類:離散型:變量隨時刻跳躍的變動連續(xù)型:變量隨時刻連續(xù)的變動模擬模型的類型:蒙特卡洛模擬模型(Monte Carlo
17、simulation)系統(tǒng)模擬模型(System simulation)蒙特卡洛模擬模型:差不多上是抽樣試驗,其目的是可能以若干概率輸入變量而獲得結(jié)果變量的分布。它常被用于可能策略變動的預(yù)期阻礙和決策所涉風(fēng)險。例:Monte Carlo VAR模擬法Monte Carlo模擬法是基于歷史數(shù)據(jù)或既定分布的條件下的參數(shù)特征,借助隨機數(shù)產(chǎn)生的模擬方法模擬出大量的資產(chǎn)組合收益的數(shù)值,然后構(gòu)造資產(chǎn)組合收益的經(jīng)驗分布函數(shù),通過對經(jīng)驗分布函數(shù)的逆變換可求得VAR值。假定Y是絕對連續(xù)累積分布函數(shù)的隨機變量,關(guān)于0q1,令Yq表示唯一的值,使得:即確實是:Yq是Y的分位點。當(dāng)Fy連續(xù)時, 即Yq的統(tǒng)計量通過對隨
18、機變量Y的經(jīng)驗分布的逆變換求得。假定Y1,Y2,Yn是隨機變量Y的n個獨立同分布的觀看變量,則Y的經(jīng)驗分布為:其中:故標(biāo)準(zhǔn)的統(tǒng)計量: 結(jié)論:分位點Yq的可能有兩種方法構(gòu)造隨機變量Y的累積經(jīng)驗分布,然后通過對隨機變量Y的經(jīng)驗分布進行逆變換獲得。即 直接由樣本構(gòu)造分位數(shù)Yq. 即例:假定基金當(dāng)前價值為1000萬元,基金經(jīng)理的目標(biāo)是計算基金在95%置信水平上(即=0.05)的每日VAR值。Step1:通過計算機模擬,創(chuàng)建1001個觀看值組成的市場指數(shù)時刻序列,為了獲得一個參差不齊的序列,使其更接近現(xiàn)實的股票指數(shù)走勢形態(tài),所選模型為: It=+0.95It-1+0.05It-1et-1+et 其中,為漂移率(一般取值在80100) et為新息向量,et服從均值為0、方差為1的標(biāo)準(zhǔn)正態(tài)分布。 It=t1(初始值)=股票市場指數(shù)值Step2:把1001個市場指數(shù)數(shù)據(jù)利用市場指數(shù)收益率測算 公式: 轉(zhuǎn)化為1000個市場指數(shù)收益率序列。Step3:利用這1000個市場指數(shù)收益率序列,模擬計算基金收益率一天范圍內(nèi)的1000個可能值,然后把基金模擬變化值進行排序,就能夠看出頻率分布形狀。Step4:找出全部模擬變化值最“左側(cè)”的5%的絕對
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025西安核設(shè)備有限公司招聘(8人)筆試參考題庫附帶答案詳解
- 2025湖南高創(chuàng)科惟新材料股份有限公司招聘26人筆試參考題庫附帶答案詳解
- 2025河北石家莊建筑行業(yè)大型國有企業(yè)招聘43人筆試參考題庫附帶答案詳解
- 會計外賬知識培訓(xùn)班課件
- 教師禮儀(山東聯(lián)盟)知到智慧樹章節(jié)測試課后答案2024年秋山東師范大學(xué)
- 2025年甘肅天水星火青重公司招聘25人筆試參考題庫附帶答案詳解
- 常見機械元件及組裝技巧-教學(xué)設(shè)計
- 2025山西忻州匯豐長城文化園區(qū)發(fā)展有限公司招聘合同制講解員10人筆試參考題庫附帶答案詳解
- 錫焊基礎(chǔ)知識培訓(xùn)課件
- 2025四川九強通信科技有限公司招聘采購員等崗位56人筆試參考題庫附帶答案詳解
- 2025年東營科技職業(yè)學(xué)院高職單招數(shù)學(xué)歷年(2016-2024)頻考點試題含答案解析
- 2025-2030年中國民用通信天線行業(yè)發(fā)展趨勢規(guī)劃研究報告
- 2025年計算機二級考試題庫350題含答案(WPS)
- 浙江省金華市婺城區(qū)2024-2025學(xué)年九年級上學(xué)期期末數(shù)學(xué)試卷(含答案)
- 《中藥房使用課件》
- 養(yǎng)豬場飼料供應(yīng)合同
- 萬達廣場籌備期項目管理規(guī)范
- 品管圈PDCA改善案例-降低住院患者跌倒發(fā)生率
- 財務(wù)會計(對外經(jīng)濟貿(mào)易大學(xué))知到智慧樹章節(jié)測試課后答案2024年秋對外經(jīng)濟貿(mào)易大學(xué)
- 分布式計算平臺設(shè)計與實現(xiàn)
- 護理總帶教老師講課
評論
0/150
提交評論