應(yīng)用技術(shù)統(tǒng)計(jì)分析復(fù)習(xí)筆記_第1頁
應(yīng)用技術(shù)統(tǒng)計(jì)分析復(fù)習(xí)筆記_第2頁
應(yīng)用技術(shù)統(tǒng)計(jì)分析復(fù)習(xí)筆記_第3頁
應(yīng)用技術(shù)統(tǒng)計(jì)分析復(fù)習(xí)筆記_第4頁
應(yīng)用技術(shù)統(tǒng)計(jì)分析復(fù)習(xí)筆記_第5頁
已閱讀5頁,還剩4頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、應(yīng)用統(tǒng)計(jì)分析復(fù)習(xí)筆記BY東海2009年12月1日星期二第一章導(dǎo)論1、統(tǒng)計(jì)學(xué)是收集、處理、分析、解釋數(shù)據(jù)并從數(shù)據(jù)中得出結(jié)論的科學(xué)。內(nèi)容:收集數(shù)據(jù)(取得數(shù)據(jù));處理數(shù)據(jù)(整理與圖表展示);分析數(shù)據(jù)(利用統(tǒng)計(jì)方法分析數(shù)據(jù));數(shù)據(jù)解釋(結(jié)果的說明);得到結(jié)論(從數(shù)據(jù)分析中得出客觀結(jié)論)。2、統(tǒng)計(jì)研究的循環(huán)過程:實(shí)際問題一收集數(shù)據(jù)一處理數(shù)據(jù)一分析數(shù)據(jù)一數(shù)據(jù)解釋一實(shí)際問題。4、描述統(tǒng)計(jì):研究數(shù)據(jù)收集、整理和描述的統(tǒng)計(jì)學(xué)分支。內(nèi)容:收集數(shù)據(jù);整理數(shù)據(jù);展示數(shù)據(jù);描述性分析。目的:描述數(shù)據(jù)特征;找出數(shù)據(jù)的基本規(guī)律。5、推斷統(tǒng)計(jì):研究如何利用樣本數(shù)據(jù)來推斷總體特征的統(tǒng)計(jì)學(xué)分支。內(nèi)容:參數(shù)估計(jì);假設(shè)檢驗(yàn)。目的:對

2、總體特征做出推斷。6、描述統(tǒng)計(jì)與推斷統(tǒng)計(jì)的關(guān)系:總體數(shù)據(jù)反映客觀現(xiàn)象的數(shù)據(jù)樣本數(shù)據(jù)7、統(tǒng)計(jì)數(shù)據(jù)的類型(1)按計(jì)量層次:分類數(shù)據(jù)、順序數(shù)據(jù)、數(shù)值型數(shù)據(jù)(2)按收集方法:觀測數(shù)據(jù)和實(shí)驗(yàn)數(shù)據(jù)(3)按時(shí)間狀況:截面數(shù)據(jù)和時(shí)間序列數(shù)據(jù)8總體:所研究的全部個(gè)體(數(shù)據(jù))的集合,其中的每一個(gè)個(gè)體也稱為元素。分為有限總體和無限總體。樣本:從總體中抽取的一部分元素的集合。構(gòu)成樣本的元素的數(shù)目稱為樣本容量或樣本量。9、參數(shù):描述總體特征的概括性數(shù)字度量,是研究者想要了解的總體的某種特征值。所關(guān)心的參數(shù)主要有總體均值(J)、標(biāo)準(zhǔn)差(刁、總體比例(二)等??傮w參數(shù)通常用希臘字母表示。10、統(tǒng)計(jì)量:用來描述樣本特征的概括

3、性數(shù)字度量,它是根據(jù)樣本數(shù)據(jù)計(jì)算出來的一些量,是樣本的函數(shù)。所關(guān)心的樣本統(tǒng)計(jì)量有樣本均值(X)、樣本標(biāo)準(zhǔn)差(s)、樣本比例(p)等。樣本統(tǒng)計(jì)量通常用小寫英文字母來表示。變量:說明現(xiàn)象某種特征的概念,如商品銷售額、受教育程度、產(chǎn)品的質(zhì)量等級等。變量的具體表現(xiàn)稱為變量值,即數(shù)據(jù)變量可以分為:(1)分類變量(說明事物類別的名稱)、順序變量(說明事物有序類別的名稱)和數(shù)值型變量(說明事物數(shù)字特征的名稱)。其中數(shù)值型變量又分離散變量(取有限個(gè)值)和連續(xù)變量(可以取無窮多個(gè)值)。(2)經(jīng)驗(yàn)變量(所描述的是我們周圍可以觀察到的事物)和理論變量(由統(tǒng)計(jì)學(xué)家用數(shù)學(xué)方法所構(gòu)造出來的一些變量,比如,z統(tǒng)計(jì)量、t統(tǒng)計(jì)

4、量、2統(tǒng)計(jì)量、F統(tǒng)計(jì)量等)。(3)隨機(jī)變量和非隨機(jī)變量。11、隨機(jī)現(xiàn)象的一個(gè)特點(diǎn)是:不確定性。隨機(jī)現(xiàn)象也存在其固有的量的規(guī)律性,人們把這一規(guī)律性稱為隨機(jī)現(xiàn)象的統(tǒng)計(jì)規(guī)律性。對隨機(jī)現(xiàn)象的觀察稱為隨機(jī)試驗(yàn),并簡稱試驗(yàn),用以研究隨機(jī)現(xiàn)象的統(tǒng)計(jì)規(guī)律性。隨機(jī)試驗(yàn)的特點(diǎn):可重復(fù)性、可觀察性和隨機(jī)性。統(tǒng)計(jì)中的抽樣過程其實(shí)就是一次隨機(jī)試驗(yàn)。因而可以利用概率論的技巧來分析推斷統(tǒng)計(jì)方法。而樣本其實(shí)就是隨機(jī)變量。12、常見分布:二項(xiàng)分布、幾何分布、指數(shù)分布、正態(tài)分布。13、統(tǒng)計(jì)學(xué)中泛稱統(tǒng)計(jì)量(或樞軸量)的分布為抽樣分布。討論抽樣分布的途經(jīng)有兩種:1)精確地求出抽樣分布,并稱相應(yīng)地統(tǒng)計(jì)推斷為小樣本統(tǒng)計(jì)推斷;2)讓樣本容

5、量趨于無窮,并求出抽樣分布的極限分布。以極限分布作為抽樣分布的近似分布,來對未知參數(shù)進(jìn)行統(tǒng)計(jì)推斷,稱相應(yīng)的推斷為大樣本統(tǒng)計(jì)推斷。14、典型的統(tǒng)計(jì)軟件:SPSS、MINITAB、STATISTICA、Excel和SAS。第二章參數(shù)估計(jì)1、估計(jì)量:用于估計(jì)總體參數(shù)的隨機(jī)變量。如樣本均值,樣本比例、樣本方差等。例如:樣本均值就是總體均值的一個(gè)估計(jì)量。參數(shù)用V表示,估計(jì)量用彳表示。估計(jì)值:估計(jì)參數(shù)時(shí)計(jì)算出來的統(tǒng)計(jì)量的具體值。如果樣本均值X=80,則80就是的估計(jì)值。2、估計(jì)方法:點(diǎn)估計(jì)和區(qū)間估計(jì)。其中點(diǎn)估計(jì)的方法包括矩估計(jì)法、順序統(tǒng)計(jì)量法、最大似然法、最小二乘法。3、點(diǎn)估計(jì):用樣本的估計(jì)量的某個(gè)取值直

6、接作為總體參數(shù)的估計(jì)值,例如:用樣本均值直接作為總體均值的估計(jì)。一個(gè)點(diǎn)估計(jì)量的可靠性是由它的抽樣標(biāo)準(zhǔn)誤差來衡量的,這表明一個(gè)具體的點(diǎn)估計(jì)值無法給出估計(jì)的可靠性的度量。4、評價(jià)估計(jì)量的標(biāo)準(zhǔn):無偏性(估計(jì)量抽樣分布的數(shù)學(xué)期望等于被估計(jì)的總體參數(shù))、有效性(對同一總體參數(shù)的兩個(gè)無偏點(diǎn)估計(jì)量,有更小標(biāo)準(zhǔn)差的估計(jì)量更有效)和一致性(隨著樣本容量的增大,估計(jì)量的值越來越接近被估計(jì)的總體參數(shù))。5、區(qū)間估計(jì):在點(diǎn)估計(jì)的基礎(chǔ)上,給出總體參數(shù)估計(jì)的一個(gè)區(qū)間范圍,該區(qū)間由樣本統(tǒng)計(jì)量加減估計(jì)誤差而得到。根據(jù)樣本統(tǒng)計(jì)量的抽樣分布能夠?qū)颖窘y(tǒng)計(jì)量與總體參數(shù)的接近程度給出一個(gè)概率度量。7、置信水平:將構(gòu)造置信區(qū)間的步驟重

7、復(fù)很多次,置信區(qū)間包含總體參數(shù)真值的次數(shù)所占的比例稱為置信水平。表示為(1-),:-為是總體參數(shù)未在區(qū)間內(nèi)的比例,常用的置信水平值有99%,95%,90%,相應(yīng)的為0.01,0.05,0.10。&置信區(qū)間:由樣本統(tǒng)計(jì)量所構(gòu)造的總體參數(shù)的估計(jì)區(qū)間稱為置信區(qū)間。用一個(gè)具體的樣本所構(gòu)造的區(qū)間是一個(gè)特定的區(qū)間,我們無法知道這個(gè)樣本所產(chǎn)生的區(qū)間是否包含總體參數(shù)的真值我們只能是希望這個(gè)區(qū)間是大量包含總體參數(shù)真值的區(qū)間中的一個(gè),但它也可能是少數(shù)幾個(gè)不包含參數(shù)真值的區(qū)間中的一個(gè)。9、影響區(qū)間寬度的因素:(1)總體數(shù)據(jù)的離散程度,用二來測度。(2)樣本容量n,二x:。(3)置信水平(1-),影響z的大小。10總

8、體均值的區(qū)間估計(jì)(大樣本)假定條件?總體服從正態(tài)分布,且方差(匚2)已知?如果不是正態(tài)分布,可由正態(tài)分布來近似(n30)使用正態(tài)分布統(tǒng)計(jì)量zCTJn總體均值丄在K置信水平下的置信區(qū)間為X丄Z.弋2或X二Z-.2(J未知)nIn總體均值的區(qū)間估計(jì)(正態(tài)總體、二2未知、小樣本)假定條件?總體服從正態(tài)分布,但方差(;-2)未知?小樣本(n”或”的假設(shè)檢驗(yàn),稱為單側(cè)檢驗(yàn)或單尾檢驗(yàn)(one-tailedtest)。備擇假設(shè)的方向?yàn)椤啊?,稱為右側(cè)檢驗(yàn)。7、假設(shè)檢驗(yàn)中的兩類錯(cuò)誤:第I類錯(cuò)誤(棄真錯(cuò)誤),原假設(shè)為正確時(shí)拒絕原假設(shè),第I類錯(cuò)誤的概率記為:;第n類錯(cuò)誤(取偽錯(cuò)誤),原假設(shè)為錯(cuò)誤時(shí)未拒絕原假設(shè),第n

9、類錯(cuò)誤的概率記為:和的關(guān)系就像翹翹板,:小就大,:大就小,要同時(shí)減少兩類錯(cuò)誤的惟一辦法是增加樣本容量。由于犯第I類錯(cuò)誤的概率是可以由研究者控制的,因此在假設(shè)檢驗(yàn)中,人們往往先控制第I類錯(cuò)誤的發(fā)生概率。8影響錯(cuò)誤的因素:總體參數(shù)的真值;顯著性水平二總體標(biāo)準(zhǔn)差G樣本容量n。9、檢驗(yàn)?zāi)芰Γ赫_拒絕一個(gè)錯(cuò)誤的原假設(shè)的能力。1是指沒有拒絕一個(gè)錯(cuò)誤的原假設(shè)的概率。這也就是說,1:則是指拒絕一個(gè)錯(cuò)誤的原假設(shè)的概率,這個(gè)概率被稱為檢驗(yàn)?zāi)芰?,也被稱為檢驗(yàn)的勢或檢驗(yàn)的功效。10、顯著性水平:表示總體中某一類數(shù)據(jù)出現(xiàn)的經(jīng)常程度。是一個(gè)概率值,原假設(shè)為真時(shí),拒絕原假設(shè)的概率,即抽樣分布的拒絕域。表示為:,常用的值有0

10、.01,0.05,0.10,由研究者事先確定。11、拒絕原假設(shè),表示這樣的樣本結(jié)果并不是偶然得到的;不拒絕原假設(shè)(拒絕原假設(shè)的證據(jù)不充分),則表示這樣的樣本結(jié)果只是偶然得到的。12、檢驗(yàn)統(tǒng)計(jì)量:根據(jù)樣本觀測結(jié)果計(jì)算得到的,并據(jù)以對原假設(shè)和備擇假設(shè)做出決策的某個(gè)樣本統(tǒng)計(jì)量。13、P值被稱為觀察到的(或?qū)崪y的)顯著性水平。決策規(guī)則:若p值:,拒絕H0。14、P值決策與統(tǒng)計(jì)量的比較:用P值進(jìn)行檢驗(yàn)比根據(jù)統(tǒng)計(jì)量檢驗(yàn)提供更多的信息;統(tǒng)計(jì)量檢驗(yàn)是我們事先給出的一個(gè)顯著性水平,以此為標(biāo)準(zhǔn)進(jìn)行決策,無法知道實(shí)際的顯著性水平究竟是多少。15、假設(shè)檢驗(yàn)步驟:陳述原假設(shè)和備擇假設(shè)從所研究的總體中抽出一個(gè)隨機(jī)樣本確定

11、一個(gè)適當(dāng)?shù)臋z驗(yàn)統(tǒng)計(jì)量,并利用樣本數(shù)據(jù)算出其具體數(shù)值確定一個(gè)適當(dāng)?shù)娘@著性水平,并計(jì)算出其臨界值,指定拒絕域?qū)⒔y(tǒng)計(jì)量的值與臨界值進(jìn)行比較,做出決策第四章非參數(shù)檢驗(yàn)1、無需假定總體分布的具體形式,僅僅依賴于數(shù)據(jù)觀測值的相對大小(秩)或零假設(shè)下等可能的概率等和數(shù)據(jù)本身的具體總體分布無關(guān)的性質(zhì)進(jìn)行的檢驗(yàn)都稱為非參數(shù)檢驗(yàn)。參數(shù)檢驗(yàn)與非參數(shù)檢驗(yàn)的比較:在總體分布形式已知時(shí),非參數(shù)檢驗(yàn)不如傳統(tǒng)方法效率高。這是因?yàn)榉菂?shù)方法利用的信息要少些。往往在傳統(tǒng)方法可以拒絕零假設(shè)的情況,非參數(shù)檢驗(yàn)無法拒絕。但非參數(shù)統(tǒng)計(jì)在總體未知時(shí)效率要比傳統(tǒng)方法要高,有時(shí)要高很多。是否用非參數(shù)統(tǒng)計(jì)方法,要根據(jù)對總體分布的了解程度來確定。

12、單樣本非參數(shù)檢驗(yàn)的方法卡方檢驗(yàn)卡方擬合優(yōu)度檢驗(yàn)的原理與計(jì)算步驟原理:判斷樣本觀察頻數(shù)(Observedfrequency)與理論(期望)頻數(shù)(Expectedfrequency)之差是否由抽樣誤差所引起。計(jì)算步驟:H:樣本的總體分布與該理論分布無區(qū)別H1:樣本與該理論分布有區(qū)別a二0.05(2)列出各組的實(shí)際頻數(shù)與理論頻數(shù)Pearson2統(tǒng)計(jì)量kZi=1(實(shí)際頻數(shù)理論頻數(shù)-理論頻數(shù))=_O22Ei_(O2-E2)2E21_Ei自由度v=k-1-(計(jì)算理論分布時(shí)所用參數(shù)的個(gè)數(shù)(Ok-Ek)2Ek(4)確定概率P并作出統(tǒng)計(jì)推論。擬合優(yōu)度卡方檢驗(yàn)的問題分組不同,擬合的結(jié)果可能不同。需要有足夠的樣本含

13、量。對于連續(xù)型變量的擬合優(yōu)度,卡方檢驗(yàn)并不是理想的方法。(2)二項(xiàng)分布檢驗(yàn)(3)K-S檢驗(yàn)尋找最大距離(Distance),所以常簡稱為D法。適用于大樣本。具體做法:D,根據(jù)D值來判斷實(shí)際頻數(shù)分布是否服從理比較實(shí)際頻數(shù)與理論頻數(shù)的累積概率間的差距,找出最大距離論頻數(shù)分布。2、單樣本非參檢驗(yàn)方法的比較:(1)卡方檢驗(yàn)一般要求待檢驗(yàn)樣本有較大的樣本容量,比較適合于分析實(shí)際頻數(shù)與某理論頻數(shù)是否相符。(2)二項(xiàng)分布檢驗(yàn)只能作二項(xiàng)分布檢驗(yàn)。(3)單樣本K-S檢驗(yàn)比較適合于連續(xù)型數(shù)據(jù)的分析,其檢驗(yàn)功效比較強(qiáng)。二、關(guān)于隨機(jī)性的游程檢驗(yàn)(runtest)游程檢驗(yàn)方法是檢驗(yàn)一個(gè)取兩個(gè)值的變量的這兩個(gè)值的出現(xiàn)是否

14、是隨機(jī)的。假定下面是由0和1組成的一個(gè)這種變量的樣本:其中相同的0(或相同的1)在一起稱為一個(gè)游程(單獨(dú)的0或1也算)。這個(gè)數(shù)據(jù)中有4個(gè)0組成的游程和3個(gè)1組成的游程。一共是R=7個(gè)游程。其中0的個(gè)數(shù)為m=15,而1的個(gè)數(shù)為n=10。3、兩個(gè)獨(dú)立樣本的非參數(shù)檢驗(yàn):在對總體分布不了解的情況下,通過分析樣本數(shù)據(jù),推斷樣本來自的兩個(gè)獨(dú)立總體的分布是否存在顯著差異,一般推斷兩個(gè)獨(dú)立總體的均值或中位數(shù)是否存在顯著差異。方法:(1)Wilcoxon-Mann-WhitneyU檢驗(yàn)(2)兩獨(dú)立樣本的KS檢驗(yàn)(3)兩獨(dú)立樣本的游程檢驗(yàn)(Wald-WolfwitzRuns)(4)兩獨(dú)立樣本的極端反應(yīng)檢驗(yàn)(Mos

15、esExtremeReactions)4、多個(gè)獨(dú)立樣本的非參數(shù)檢驗(yàn):在對總體分布不了解的情況下,通過分析樣本數(shù)據(jù),推斷樣本來自的多個(gè)獨(dú)立總體的分布是否存在顯著差異,一般推斷多個(gè)獨(dú)立總體的均值或中位數(shù)是否存在顯著差異。方法:(1)KW檢驗(yàn)(2)中位數(shù)檢驗(yàn)(3)Jonkheere-Terpstra檢驗(yàn)5、兩配對樣本的非參數(shù)檢驗(yàn):在對總體分布不了解的情況下,通過分析樣本數(shù)據(jù),推斷樣本來自的兩個(gè)相關(guān)配對總體的分布是否存在顯著差異。方法:McNcmar變化顯著性檢驗(yàn):將研究對象自身作為對照者,檢驗(yàn)其“前后”的變化是否顯著。要求樣本數(shù)據(jù)是二值。符號檢驗(yàn)Wilcoxon符號平均秩檢驗(yàn)列聯(lián)表6、相關(guān)系數(shù):2X

16、2列聯(lián)表中數(shù)據(jù)的相關(guān)程度,絕對值在01之間。列聯(lián)相關(guān)系數(shù):大于2X2列聯(lián)表中數(shù)據(jù)的相關(guān)程度,0C1。V相關(guān)系數(shù):V的取值范圍為0wV1,V=0表明列聯(lián)表的兩個(gè)變量獨(dú)立,V=1則表明兩個(gè)變量完全相關(guān)。第五章方差分析1、方差分析是通過對誤差的分析,檢驗(yàn)多個(gè)總體均值是否相等的一種統(tǒng)計(jì)方法。它分為單因素方差分析和雙因素方差分析。方差分析通過對數(shù)據(jù)誤差來源的分析判斷不同總體的均值是否相等。因此,進(jìn)行方差分析時(shí),需要考察數(shù)據(jù)誤差的來源。2、兩類誤差:隨機(jī)誤差和系統(tǒng)誤差。3、組內(nèi)平方和:因素的同一水平下數(shù)據(jù)誤差的平方和,只包含隨機(jī)誤差。組間平方和:因素的不同水平之間數(shù)據(jù)誤差的平方和,既包括隨機(jī)誤差,也包括系

17、統(tǒng)誤差。均方:平方和除以相應(yīng)的自由度。4、方差分析的基本假定:每個(gè)總體都應(yīng)服從正態(tài)分布各個(gè)總體的方差必須相同觀察值是獨(dú)立的5、單因素方差分析步驟:提出假設(shè)構(gòu)造檢驗(yàn)統(tǒng)計(jì)量統(tǒng)計(jì)決策6、構(gòu)造統(tǒng)計(jì)量需要計(jì)算:水平的均值;全部觀察值的總均值;誤差平方和;均方。7、變量間關(guān)系的強(qiáng)度用自變量平方和(SSA)占總平方和(SST)的比例大小來反映,記為R2。其平方根R就可以用來測量兩個(gè)變量之間的關(guān)系強(qiáng)度。8多重比較(通過對總體均值之間的配對比較來進(jìn)一步檢驗(yàn)到底哪些均值之間存在差異)的步驟:提出假設(shè)。計(jì)算檢驗(yàn)的統(tǒng)計(jì)量(區(qū)-區(qū))。計(jì)算LSD。做成決策決策。9、雙因素方差分析:按兩個(gè)因素對試驗(yàn)結(jié)果的影響是否相互獨(dú)立分

18、為無交互作用的雙因素方差分析或無重復(fù)雙因素方差分析和有交互作用的雙因素方差分析或可重復(fù)雙因素方差分析。第七章相關(guān)分析與回歸分析1、變量之間的兩類關(guān)系:確定性關(guān)系(函數(shù)關(guān)系)和非確定性關(guān)系(相關(guān)關(guān)系)。相關(guān)關(guān)系分為:線性相關(guān)和非線性相關(guān);完全相關(guān)和不相關(guān)。線性相關(guān)和完全相關(guān)又可分為正相關(guān)和負(fù)相關(guān)。2、在進(jìn)行相關(guān)分析時(shí),對總體有以下兩個(gè)主要假定:兩個(gè)變量之間是線性關(guān)系和兩個(gè)變量都是隨機(jī)變量。3、相關(guān)系數(shù)(correlationcoefficient):度量變量之間關(guān)系強(qiáng)度的一個(gè)統(tǒng)計(jì)量。對兩個(gè)變量之間線性相關(guān)強(qiáng)度的度量稱為簡單相關(guān)系數(shù)。若相關(guān)系數(shù)是根據(jù)總體全部數(shù)據(jù)計(jì)算的,稱為總體相關(guān)系數(shù),記為幾若相

19、關(guān)系數(shù)是根據(jù)樣本數(shù)據(jù)計(jì)算的,則稱為樣本相關(guān)系數(shù),簡稱為相關(guān)系數(shù),記為r,也稱為線性相關(guān)系數(shù)(linearcorrelationcoefficient)或稱為Pearson相關(guān)系數(shù)(Pearsonscorrelationcoefficient)。4、相關(guān)系數(shù)的性質(zhì)r的取值范圍是-1,1,|r|越趨于1表示關(guān)系越強(qiáng);|r|越趨于0表示關(guān)系越弱,r=0,不存在線性相關(guān)關(guān)系。r具有對稱性。即x與y之間的相關(guān)系數(shù)和y與x之間的相關(guān)系數(shù)相等,即6y=ryx。r數(shù)值大小與x和y原點(diǎn)及尺度無關(guān),即改變x和y的數(shù)據(jù)原點(diǎn)及計(jì)量尺度,并不改變r(jià)數(shù)值大小。僅僅是x與y之間線性關(guān)系的一個(gè)度量,它不能用于描述非線性關(guān)系。

20、這意味著,r=0只表示兩個(gè)變之間不存在線性相關(guān)關(guān)系,并不說明變量之間沒有任何關(guān)系。r雖然是兩個(gè)變量之間線性關(guān)系的一個(gè)度量,卻不一定意味著x與y定有因果關(guān)系。5、相關(guān)系數(shù)的經(jīng)驗(yàn)解釋:|r|_0.8時(shí),可視為兩個(gè)變量之間高度相關(guān);0.5即|0.8時(shí),可視為中度相關(guān);0.3即|0.5時(shí),1宀的檢驗(yàn),米用t檢驗(yàn)。1宀的檢驗(yàn),米用t檢驗(yàn)。視為低度相關(guān);|r|r:,拒絕H0;若t0,說明回歸方程擬合的越差。判定系數(shù)等于相關(guān)系數(shù)的平方,即R2=r2。15、線性關(guān)系的檢驗(yàn)的步驟:提出假設(shè)(H0:1=0,線性關(guān)系不顯著)。計(jì)算檢驗(yàn)統(tǒng)計(jì)量F。確定顯著性水平:,并根據(jù)分子自由度1和分母自由度n-2找出臨界值F:.作

21、出決策(若FF:,拒絕H0;若FF:,不拒絕H0)。第九、十章主成分分析和因子分析1、主成分分析是把各變量之間互相關(guān)聯(lián)的復(fù)雜關(guān)系進(jìn)行簡化分析的方法?;谙嚓P(guān)系數(shù)矩陣還是基于協(xié)方差矩陣做主成分分析。如果變量有不同的量綱,則必須基于相關(guān)系數(shù)矩陣進(jìn)行主成分分析。不同的是計(jì)算得分時(shí)應(yīng)采用標(biāo)準(zhǔn)化后的數(shù)據(jù)。主成分應(yīng)滿足如下的條件:每個(gè)主成分的系數(shù)平方和為1。主成分之間相互獨(dú)立,即無重疊的信息。主成分的方差依次遞減,重要性依次遞減。主成分的性質(zhì)一、均值E(Ux)二U二、方差為所有特征根之和P222Var(FJ=腎2亠一-p-二2亠亠pi4說明主成分分析把P個(gè)隨機(jī)變量的總方差分解成為P個(gè)不相關(guān)的隨機(jī)變量的方差之和。協(xié)方差矩陣邛勺對角線上的元素之和等于特征根之和。2、主成分個(gè)數(shù)的選取:累積貢獻(xiàn)率達(dá)到8

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論