復(fù)試經(jīng)驗(yàn)-2015年人大432統(tǒng)計(jì)學(xué)筆記by csc_第1頁(yè)
復(fù)試經(jīng)驗(yàn)-2015年人大432統(tǒng)計(jì)學(xué)筆記by csc_第2頁(yè)
復(fù)試經(jīng)驗(yàn)-2015年人大432統(tǒng)計(jì)學(xué)筆記by csc_第3頁(yè)
復(fù)試經(jīng)驗(yàn)-2015年人大432統(tǒng)計(jì)學(xué)筆記by csc_第4頁(yè)
復(fù)試經(jīng)驗(yàn)-2015年人大432統(tǒng)計(jì)學(xué)筆記by csc_第5頁(yè)
已閱讀5頁(yè),還剩27頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

2015 432統(tǒng)計(jì)學(xué)讀書筆——By第一 導(dǎo)第二 數(shù)據(jù)的搜集與抽樣設(shè)?抽樣理 數(shù)理統(tǒng)為????個(gè);欲求總體特征為總?,n=E(y)=E(y)=1?V(? 概率抽樣與非概率抽樣的比較:信區(qū)間;非概率抽樣則適合用于探索性的研究,及市場(chǎng)中的概念測(cè)試,或是作為概率抽樣的預(yù)調(diào)單作為抽樣框,N很大時(shí)不便;抽取的單元很分散,不便;沒有利用輔助信息提高估計(jì)精度。N(+n不夠大時(shí)更優(yōu)。 ??(1?),有的版本也 ,n相對(duì)N非常小時(shí)可忽略、抽樣組 第三 數(shù)據(jù)的圖表展比例:一個(gè)樣本(或總體)100%為百分比。比率:樣本(或總體)中不同類別數(shù)據(jù)之間的比值,可能大于1.組距:上限-下限 ::第四 數(shù)據(jù)的概括性度 平均數(shù)(數(shù)值型數(shù)據(jù):簡(jiǎn)單平均數(shù)????=???1+???2+?+?????平均數(shù)(分組數(shù)據(jù))????幾何平均數(shù)(多用于變量值為比例時(shí))??????√???1???2異眾比率(分類數(shù)據(jù))V=1????∑:Qd=Q-:變量值的計(jì)量單位相同、標(biāo)準(zhǔn)分?jǐn)?shù)(3異常值)

偏態(tài)系數(shù):SK=??∑[(??????????)/??]^3????分組SK= 峰態(tài)系數(shù):K

??(??+1)∑[(??????????)/??]^4

????K=∑(?????????)4????3

眾數(shù):??=??+?1??其中,L是眾數(shù)組的組下限,i是組距,??

=?? 平均數(shù):????=∑∑

標(biāo)準(zhǔn)差:??2=

第五 概率分???????何分布(非重復(fù)抽樣P(X=x)=??概率近似計(jì)算:二項(xiàng)分布(n<=0.25,n>20,np<=5)??????????????????≈

P-P圖:評(píng)估觀測(cè)數(shù)據(jù)的累計(jì)概率與理論分布(如正態(tài)分布)的累計(jì)概率的符合程度。Q-Q圖:評(píng)估觀測(cè)數(shù)據(jù)的實(shí)際分位數(shù)與理論分布(如正態(tài)分布)的分位數(shù)的符合程度。K-S檢驗(yàn)第六 統(tǒng)計(jì)量及其抽樣分由樣本構(gòu)造的函數(shù)布,即從N總體中抽取n樣本時(shí),所有可能的樣本統(tǒng)計(jì)值所形成的分布。漸進(jìn)統(tǒng)計(jì)量:n無(wú)限增大時(shí),統(tǒng)計(jì)量Tt分布:E=0D=n/(n-2);對(duì)稱性;通常比正態(tài)分布平坦;n>=30接近正態(tài)分布,對(duì)統(tǒng)計(jì)學(xué)中小樣本運(yùn)用有

=第七 參數(shù)估ZXnn

(0,)ntXnS

~t(n正態(tài)總體假定,未知,小樣本p(pnZ p p(pn2n1)S22~2(n正態(tài)總體假定2122 ZX1X212)~2122 SS 1SS 11 tX1X212)~t(nn21 S??2

(??1?1)??2+(??2? ??1+??2?SS 1 tX1X212)~tSS 1 ??22(??1+??2v= ??1? ??2?d Zd12)~Nd Sd p1(1p1)p2(1p2 Z p1p1(1p1)p2(1p2 (11)p(1p) Z (11)p(1p) 2S2/S2F

??1??1+p??1+22~F(n11,n22)兩個(gè)正態(tài)總體 z2nEEz n2 (1表示可靠性,E表示精度nE第八 假設(shè)檢::假設(shè)檢驗(yàn)的流程:提出原假設(shè)和備擇假設(shè)→確定檢驗(yàn)統(tǒng)計(jì)量,計(jì)算數(shù)值→確定域→進(jìn)行統(tǒng)計(jì)決策顯著性水平。P值是關(guān)于數(shù)據(jù)的概率,它與原假設(shè)的對(duì)錯(cuò)概率無(wú)關(guān)。與傳統(tǒng)的統(tǒng)計(jì)量決策相比,P值卡方統(tǒng)計(jì)量:??2=

第九 分類數(shù)據(jù)分計(jì)算卡方統(tǒng)計(jì)量的步驟四步。??判斷期望頻數(shù)與觀察頻數(shù)之間是否存在顯著差異。H0:觀察頻數(shù)與期望頻數(shù)一致。??2=.分類變量之間是獨(dú)立的(不存在依賴關(guān)系。??2=∑∑(?????????)2~??2(???1)(???1).V相關(guān)系數(shù):V=

?????????[(???1

??2,主要用于大于2x2的列聯(lián)表,獨(dú)立為0,最大值不大于1(取決于列√??√條件百分表的方向:當(dāng)XYX放在列的位置,百分比也按照列的方第十 方差分差的均方應(yīng)該很接近,比值趨近與1,否則就會(huì)大于1,大到某種程度時(shí),認(rèn)為有顯著性影響。x,i1,K,n;j1,K, ij~N(0,2各ij相互獨(dú)立H01Lk1Lk0H1jj1,Kk)

FF———————????表示自變量對(duì)因變量的影響效應(yīng)占總效應(yīng)的比例最小顯著差異方法(LSD:H0:μi=μj→計(jì)算檢驗(yàn)統(tǒng)計(jì)量????????????→LSD??(?? ??/2√??????(????+x,i1,K,s;j1,K,

:LL

假設(shè)為

01:1

1

s kij i1 j1SSR/(k SSC/(rFRSSEk1)(r1,FCSSEk1)(r1(k行r列x(),i1,K,s;j1,K,k;l1,K,

s~N(0,2),各

k

s() k()i1 j1 j H01:1Ls1L 假設(shè) L HH

:兩因素個(gè)水平間無(wú)交互作用(

L()skF SSR/(k SSE/[rk(m

,

SSC/(rSSE/[rk(m

,

SSRC/[(r1)(kSSE/[rk(m

(rkm重復(fù):種處理隨機(jī)指派給各個(gè)區(qū)組。實(shí)質(zhì):從MSE中消除分組變量的影響。第十一 一元線性回r=

相關(guān)系數(shù)的顯著性檢驗(yàn)(r服從正態(tài)分布)t=|??|???2~??(??√1???√一元線性回歸模型:y=β0β1x一元線性回歸方程:E(y|x)=β0=高斯-馬爾科夫條件:即上述假定的后三個(gè)(不包括正態(tài),數(shù)學(xué)表達(dá)式為E(????=0,cov(????????)??2(??=0(????),此時(shí),兩個(gè)估計(jì)量是最佳線性無(wú)偏估計(jì)(BLUE∑??????????1∑?????∑==

∑2??1 殘差具有性質(zhì):????=0,?????????=

????

:var(

var(???0)=(??+判定系數(shù):??2??????,實(shí)際意義:Yxy的線性關(guān)系解釋的變差比例。 =√??????=√??????,也是對(duì)誤差項(xiàng)ε標(biāo)準(zhǔn)差σ的估計(jì)。實(shí)際意義:反映了用估計(jì)的回方程預(yù)測(cè)y

~??(1??2)和回歸系數(shù)的檢驗(yàn)t=1~??(???????回歸結(jié)果的評(píng)價(jià):回歸系數(shù)的符號(hào)是否與預(yù)期一致;xy的關(guān)系是否與相關(guān)分析的結(jié)果吻合;判定系數(shù)置信區(qū)間:0± ??√1+(???0?????)2,這里也就是??0的方差。影響預(yù)精度的五個(gè)因素??/2?? 預(yù)測(cè)區(qū)間:0±

√1+1+

= √1??ii

第十二 多元線性回多元線性回歸模型:y=β0β1x1β2x2βkxkεy=Xβ多元回歸方程:??(yβ0β1x1β2x2估計(jì)的多元回歸方程:??=β0β1x1β2x2所有x方差相同;服從正態(tài)分布且相互獨(dú)立(一組xi對(duì)應(yīng)的ε與其他組對(duì)應(yīng)的ε不相關(guān))(BLUE普通最小二乘估計(jì):???=(X′X)?1??′??i.e.??=X(X′X)?1??′??HX(X′X)?1??′多重判定系數(shù):??2=??????,平方根稱為多重相關(guān)系數(shù)(負(fù)相關(guān)系數(shù)) R^2變大。為避免高估R^2,使用調(diào)整的R^2 估計(jì)的標(biāo)準(zhǔn)誤:????= =線性關(guān)系的檢驗(yàn):F

~??(??,??????回歸系數(shù)的檢驗(yàn):??=?????~t(nk?????進(jìn)行最小二乘估計(jì)。系數(shù)解釋:自變量1%的相對(duì)變化,引起因變量均值的相對(duì)變化百分?jǐn)?shù)。Seaan(WLS:Q權(quán)數(shù)確定:若σ2~???2,則w=1x

t驗(yàn)迭代法:???≈1?1 ? =(??????????)+???(x? )+(ε? 差分法:ρ1時(shí),y???y???1=???1(x???x???1)+(ε???判別:方差擴(kuò)大因子VIF=110;X’X0,條件數(shù)

=√????10100

觀判定法:模型中各自變量之間顯著相關(guān);F檢驗(yàn)顯著,t檢驗(yàn)卻幾乎都不顯著;回歸系數(shù)的正負(fù)號(hào)與嶺回歸:???(????′??????)?1X′yMSE較小。根據(jù)嶺跡圖、VIF范圍內(nèi)確定k值,剔除穩(wěn)定但絕對(duì)值小、很不穩(wěn)定的自變量。原為XF統(tǒng)計(jì)量:??=(?????????????(??))/1=??2t 進(jìn)行F檢驗(yàn),以確保方程中只包含顯著變量。要求α進(jìn)小于α出,否則死循環(huán)。Logit模型 或ln(????)=logit(??)=???+?????=1+???????(???+???

ProbitΦ?1(???????0+第十三 時(shí)間序列分寬平穩(wěn)序列:E(??2)<∞;E(????)=??;γ(t,s)=γ(k,k+s-t)白噪聲序列(純隨機(jī)序列):E(??)=??;( ??2,??=?? γt,s={0,??≠環(huán)比增長(zhǎng)率??????????1定基增長(zhǎng)率???????0,描述現(xiàn)象在整個(gè)觀察期內(nèi)總的增長(zhǎng)變化速平均增長(zhǎng)率???????增長(zhǎng)1%的絕對(duì)值=前期水平日ARE()0,Var()2,E()0(sE(xt)0(s s sMAxtt1t1Lqtq(p,qE()0,Var()2,E()0(sE(xt)0(s s sARMAxt01xt1Lpxtpt1t1Lqtq(p,qE()0,Var()2,E()0(sE(xt)0(s s s計(jì)、ML、LS)→模型檢驗(yàn)(LB統(tǒng)計(jì)量、T統(tǒng)計(jì)量)→模型優(yōu)化(AIC、BIC)→預(yù)測(cè)加法模型:????=????+????+????+????乘法模型:????=????????????趨勢(shì)擬合法:線性回歸法????????1??;指數(shù)曲線:??????0????1,對(duì)數(shù)化,用最小二乘法擬合;多階曲線:????=??0+??1??+??2??2:??+1( 移動(dòng))????+1=?????=

:????Holt兩參數(shù)指數(shù)平滑(線性趨勢(shì):????=???????(1??)(?????1+ =??(??? )+(1? ??=???????+(1? + ????=??(?????????????1)+(1? ??=????+(1? 季節(jié)性多元回歸:????=??0??1????2??1??3??2:(Y/CMA3)分離季節(jié)成分:??=??5)殘差檢驗(yàn):????=(5)-11過(guò)程:ARIMA(B)dx E(xt)0(s s s(B)dx (B)(B)Ddx(B)(B) S ????=????+????+????=??1?????1+?+???????????+

第十四 多元統(tǒng)計(jì)分分為Q型聚類(樣本)和R型聚類(變量。? ′ ? (??)????(??)) ::算每個(gè)樣品到K(常用歐氏距離K布函數(shù)或訓(xùn)練樣本X,判斷它來(lái)自哪個(gè)總體。線性判別函數(shù)W(X)是X的線性函數(shù),協(xié)方差陣相等時(shí)為線性,不相等時(shí)則為二次函數(shù),實(shí)質(zhì)是x到兩個(gè) j希爾判別法:kmup1Yu'Xuup1 11

u'u1(i1,L, Yu'XuX i基本理論:YUX 21 up2X subtoY,Y相互無(wú) Yu'XuX 1p

uppX主成分的性質(zhì):D(Y@diag(1,Lp),即Var(Yi)iCov(Yi,Yj)0(ij);原始 量的總方差被分解為互不相關(guān)的主成分的方差之和iii

,Xp2(Y,X);p2(Y,X)1

k 主成分求法:X1,X2,…,Xp(or)的非零特征值??1??2????>0對(duì)應(yīng)的標(biāo)準(zhǔn)化特征向量??1??2????分別作為系數(shù)向量,????????′X即為第i量標(biāo)準(zhǔn)化后的協(xié)方差矩陣。相關(guān)陣求主成分的特殊性質(zhì)如下:Y的協(xié)方差陣為對(duì)角陣;∑??????(????)=i∑??????(????)=∑????=??;累積貢獻(xiàn)率∑????;(Y,X) (??????=i (變量)和Q(樣品)X1a11F1 a1mFmXaF aFXAF

21

2m apmFm協(xié)方差陣為I;ε(特殊因子)與F相互獨(dú)立,協(xié)方差陣是對(duì)角陣。因子載荷COV(????????)=????????????(????)=??=????共同度(式中??????行和????(剩余方差)Xi ,BartletY1u11X1 up1X X1u11Y1 X1u11Y1 u1mYm X1a11F1 a1mFm YuX u XuY u XuY uY XaF aF 1p pp

p1

pp

p1

pm

p1

pm 相關(guān)陣對(duì)角線上的元素1,并以得到的調(diào)整相關(guān)陣來(lái)進(jìn)行求解。區(qū)別:因子分析將變量看成公共因子和特殊因子的線性組合,構(gòu)造因子模型,主成分則只是從空間角(標(biāo)準(zhǔn)化矩陣Z:R型因子分析和Q型因子分析都是一個(gè)總體的不同側(cè)面,Z矩陣將它們聯(lián)系第十五 指(1)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論