應(yīng)用技術(shù)統(tǒng)計(jì)分析復(fù)習(xí)筆記

上傳人：t*** IP屬地：天津上傳時(shí)間：2022-07-21 格式：DOC 頁數(shù)：9 大?。?95.50KB 積分：18 舉報(bào) 版權(quán)申訴

應(yīng)用技術(shù)統(tǒng)計(jì)分析復(fù)習(xí)筆記_第2頁

應(yīng)用技術(shù)統(tǒng)計(jì)分析復(fù)習(xí)筆記_第3頁

應(yīng)用技術(shù)統(tǒng)計(jì)分析復(fù)習(xí)筆記_第4頁

應(yīng)用技術(shù)統(tǒng)計(jì)分析復(fù)習(xí)筆記_第5頁

已閱讀5頁，還剩4頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、應(yīng)用統(tǒng)計(jì)分析復(fù)習(xí)筆記BY東海2009年12月1日星期二第一章導(dǎo)論1、統(tǒng)計(jì)學(xué)是收集、處理、分析、解釋數(shù)據(jù)并從數(shù)據(jù)中得出結(jié)論的科學(xué)。內(nèi)容：收集數(shù)據(jù)（取得數(shù)據(jù)）；處理數(shù)據(jù)（整理與圖表展示）；分析數(shù)據(jù)（利用統(tǒng)計(jì)方法分析數(shù)據(jù)）；數(shù)據(jù)解釋（結(jié)果的說明）；得到結(jié)論（從數(shù)據(jù)分析中得出客觀結(jié)論）。2、統(tǒng)計(jì)研究的循環(huán)過程：實(shí)際問題一收集數(shù)據(jù)一處理數(shù)據(jù)一分析數(shù)據(jù)一數(shù)據(jù)解釋一實(shí)際問題。4、描述統(tǒng)計(jì)：研究數(shù)據(jù)收集、整理和描述的統(tǒng)計(jì)學(xué)分支。內(nèi)容：收集數(shù)據(jù)；整理數(shù)據(jù)；展示數(shù)據(jù)；描述性分析。目的:描述數(shù)據(jù)特征；找出數(shù)據(jù)的基本規(guī)律。5、推斷統(tǒng)計(jì)：研究如何利用樣本數(shù)據(jù)來推斷總體特征的統(tǒng)計(jì)學(xué)分支。內(nèi)容：參數(shù)估計(jì)；假設(shè)檢驗(yàn)。目的：對

2、總體特征做出推斷。6、描述統(tǒng)計(jì)與推斷統(tǒng)計(jì)的關(guān)系：總體數(shù)據(jù)反映客觀現(xiàn)象的數(shù)據(jù)樣本數(shù)據(jù)7、統(tǒng)計(jì)數(shù)據(jù)的類型（1）按計(jì)量層次：分類數(shù)據(jù)、順序數(shù)據(jù)、數(shù)值型數(shù)據(jù)（2）按收集方法：觀測數(shù)據(jù)和實(shí)驗(yàn)數(shù)據(jù)（3）按時(shí)間狀況：截面數(shù)據(jù)和時(shí)間序列數(shù)據(jù)8總體：所研究的全部個(gè)體（數(shù)據(jù)）的集合，其中的每一個(gè)個(gè)體也稱為元素。分為有限總體和無限總體。樣本：從總體中抽取的一部分元素的集合。構(gòu)成樣本的元素的數(shù)目稱為樣本容量或樣本量。9、參數(shù)：描述總體特征的概括性數(shù)字度量，是研究者想要了解的總體的某種特征值。所關(guān)心的參數(shù)主要有總體均值（J）、標(biāo)準(zhǔn)差（刁、總體比例（二）等?？傮w參數(shù)通常用希臘字母表示。10、統(tǒng)計(jì)量：用來描述樣本特征的概括

3、性數(shù)字度量，它是根據(jù)樣本數(shù)據(jù)計(jì)算出來的一些量，是樣本的函數(shù)。所關(guān)心的樣本統(tǒng)計(jì)量有樣本均值（X）、樣本標(biāo)準(zhǔn)差（s）、樣本比例（p）等。樣本統(tǒng)計(jì)量通常用小寫英文字母來表示。變量：說明現(xiàn)象某種特征的概念，如商品銷售額、受教育程度、產(chǎn)品的質(zhì)量等級等。變量的具體表現(xiàn)稱為變量值，即數(shù)據(jù)變量可以分為：（1）分類變量（說明事物類別的名稱）、順序變量（說明事物有序類別的名稱）和數(shù)值型變量（說明事物數(shù)字特征的名稱）。其中數(shù)值型變量又分離散變量（取有限個(gè)值）和連續(xù)變量（可以取無窮多個(gè)值）。（2）經(jīng)驗(yàn)變量（所描述的是我們周圍可以觀察到的事物）和理論變量（由統(tǒng)計(jì)學(xué)家用數(shù)學(xué)方法所構(gòu)造出來的一些變量，比如，z統(tǒng)計(jì)量、t統(tǒng)計(jì)

4、量、2統(tǒng)計(jì)量、F統(tǒng)計(jì)量等）。（3）隨機(jī)變量和非隨機(jī)變量。11、隨機(jī)現(xiàn)象的一個(gè)特點(diǎn)是：不確定性。隨機(jī)現(xiàn)象也存在其固有的量的規(guī)律性，人們把這一規(guī)律性稱為隨機(jī)現(xiàn)象的統(tǒng)計(jì)規(guī)律性。對隨機(jī)現(xiàn)象的觀察稱為隨機(jī)試驗(yàn)，并簡稱試驗(yàn)，用以研究隨機(jī)現(xiàn)象的統(tǒng)計(jì)規(guī)律性。隨機(jī)試驗(yàn)的特點(diǎn)：可重復(fù)性、可觀察性和隨機(jī)性。統(tǒng)計(jì)中的抽樣過程其實(shí)就是一次隨機(jī)試驗(yàn)。因而可以利用概率論的技巧來分析推斷統(tǒng)計(jì)方法。而樣本其實(shí)就是隨機(jī)變量。12、常見分布：二項(xiàng)分布、幾何分布、指數(shù)分布、正態(tài)分布。13、統(tǒng)計(jì)學(xué)中泛稱統(tǒng)計(jì)量（或樞軸量）的分布為抽樣分布。討論抽樣分布的途經(jīng)有兩種：1）精確地求出抽樣分布，并稱相應(yīng)地統(tǒng)計(jì)推斷為小樣本統(tǒng)計(jì)推斷；2）讓樣本容

5、量趨于無窮，并求出抽樣分布的極限分布。以極限分布作為抽樣分布的近似分布，來對未知參數(shù)進(jìn)行統(tǒng)計(jì)推斷，稱相應(yīng)的推斷為大樣本統(tǒng)計(jì)推斷。14、典型的統(tǒng)計(jì)軟件：SPSS、MINITAB、STATISTICA、Excel和SAS。第二章參數(shù)估計(jì)1、估計(jì)量：用于估計(jì)總體參數(shù)的隨機(jī)變量。如樣本均值，樣本比例、樣本方差等。例如：樣本均值就是總體均值的一個(gè)估計(jì)量。參數(shù)用V表示，估計(jì)量用彳表示。估計(jì)值：估計(jì)參數(shù)時(shí)計(jì)算出來的統(tǒng)計(jì)量的具體值。如果樣本均值X=80，則80就是的估計(jì)值。2、估計(jì)方法：點(diǎn)估計(jì)和區(qū)間估計(jì)。其中點(diǎn)估計(jì)的方法包括矩估計(jì)法、順序統(tǒng)計(jì)量法、最大似然法、最小二乘法。3、點(diǎn)估計(jì)：用樣本的估計(jì)量的某個(gè)取值直

6、接作為總體參數(shù)的估計(jì)值，例如：用樣本均值直接作為總體均值的估計(jì)。一個(gè)點(diǎn)估計(jì)量的可靠性是由它的抽樣標(biāo)準(zhǔn)誤差來衡量的，這表明一個(gè)具體的點(diǎn)估計(jì)值無法給出估計(jì)的可靠性的度量。4、評價(jià)估計(jì)量的標(biāo)準(zhǔn)：無偏性（估計(jì)量抽樣分布的數(shù)學(xué)期望等于被估計(jì)的總體參數(shù)）、有效性（對同一總體參數(shù)的兩個(gè)無偏點(diǎn)估計(jì)量，有更小標(biāo)準(zhǔn)差的估計(jì)量更有效）和一致性（隨著樣本容量的增大，估計(jì)量的值越來越接近被估計(jì)的總體參數(shù)）。5、區(qū)間估計(jì)：在點(diǎn)估計(jì)的基礎(chǔ)上，給出總體參數(shù)估計(jì)的一個(gè)區(qū)間范圍，該區(qū)間由樣本統(tǒng)計(jì)量加減估計(jì)誤差而得到。根據(jù)樣本統(tǒng)計(jì)量的抽樣分布能夠?qū)颖窘y(tǒng)計(jì)量與總體參數(shù)的接近程度給出一個(gè)概率度量。7、置信水平：將構(gòu)造置信區(qū)間的步驟重

7、復(fù)很多次，置信區(qū)間包含總體參數(shù)真值的次數(shù)所占的比例稱為置信水平。表示為（1-），:-為是總體參數(shù)未在區(qū)間內(nèi)的比例，常用的置信水平值有99%,95%,90%，相應(yīng)的為0.01，0.05,0.10。&置信區(qū)間：由樣本統(tǒng)計(jì)量所構(gòu)造的總體參數(shù)的估計(jì)區(qū)間稱為置信區(qū)間。用一個(gè)具體的樣本所構(gòu)造的區(qū)間是一個(gè)特定的區(qū)間，我們無法知道這個(gè)樣本所產(chǎn)生的區(qū)間是否包含總體參數(shù)的真值我們只能是希望這個(gè)區(qū)間是大量包含總體參數(shù)真值的區(qū)間中的一個(gè)，但它也可能是少數(shù)幾個(gè)不包含參數(shù)真值的區(qū)間中的一個(gè)。9、影響區(qū)間寬度的因素：（1）總體數(shù)據(jù)的離散程度，用二來測度。（2）樣本容量n,二x：。（3）置信水平（1-），影響z的大小。10總

8、體均值的區(qū)間估計(jì)（大樣本）假定條件?總體服從正態(tài)分布，且方差（匚2）已知?如果不是正態(tài)分布，可由正態(tài)分布來近似（n30）使用正態(tài)分布統(tǒng)計(jì)量zCTJn總體均值丄在K置信水平下的置信區(qū)間為X丄Z.弋2或X二Z-.2（J未知）nIn總體均值的區(qū)間估計(jì)（正態(tài)總體、二2未知、小樣本）假定條件?總體服從正態(tài)分布，但方差（；-2）未知?小樣本（n”或”的假設(shè)檢驗(yàn)，稱為單側(cè)檢驗(yàn)或單尾檢驗(yàn)(one-tailedtest)。備擇假設(shè)的方向?yàn)椤啊?，稱為右側(cè)檢驗(yàn)。7、假設(shè)檢驗(yàn)中的兩類錯(cuò)誤：第I類錯(cuò)誤(棄真錯(cuò)誤)，原假設(shè)為正確時(shí)拒絕原假設(shè)，第I類錯(cuò)誤的概率記為：；第n類錯(cuò)誤(取偽錯(cuò)誤),原假設(shè)為錯(cuò)誤時(shí)未拒絕原假設(shè)，第n

9、類錯(cuò)誤的概率記為：和的關(guān)系就像翹翹板，：小就大，:大就小，要同時(shí)減少兩類錯(cuò)誤的惟一辦法是增加樣本容量。由于犯第I類錯(cuò)誤的概率是可以由研究者控制的，因此在假設(shè)檢驗(yàn)中，人們往往先控制第I類錯(cuò)誤的發(fā)生概率。8影響錯(cuò)誤的因素：總體參數(shù)的真值；顯著性水平二總體標(biāo)準(zhǔn)差G樣本容量n。9、檢驗(yàn)?zāi)芰Γ赫_拒絕一個(gè)錯(cuò)誤的原假設(shè)的能力。1是指沒有拒絕一個(gè)錯(cuò)誤的原假設(shè)的概率。這也就是說，1：則是指拒絕一個(gè)錯(cuò)誤的原假設(shè)的概率，這個(gè)概率被稱為檢驗(yàn)?zāi)芰?，也被稱為檢驗(yàn)的勢或檢驗(yàn)的功效。10、顯著性水平：表示總體中某一類數(shù)據(jù)出現(xiàn)的經(jīng)常程度。是一個(gè)概率值，原假設(shè)為真時(shí)，拒絕原假設(shè)的概率，即抽樣分布的拒絕域。表示為：，常用的值有0

10、.01,0.05,0.10，由研究者事先確定。11、拒絕原假設(shè)，表示這樣的樣本結(jié)果并不是偶然得到的；不拒絕原假設(shè)(拒絕原假設(shè)的證據(jù)不充分)，則表示這樣的樣本結(jié)果只是偶然得到的。12、檢驗(yàn)統(tǒng)計(jì)量：根據(jù)樣本觀測結(jié)果計(jì)算得到的，并據(jù)以對原假設(shè)和備擇假設(shè)做出決策的某個(gè)樣本統(tǒng)計(jì)量。13、P值被稱為觀察到的(或?qū)崪y的)顯著性水平。決策規(guī)則：若p值:,拒絕H0。14、P值決策與統(tǒng)計(jì)量的比較：用P值進(jìn)行檢驗(yàn)比根據(jù)統(tǒng)計(jì)量檢驗(yàn)提供更多的信息；統(tǒng)計(jì)量檢驗(yàn)是我們事先給出的一個(gè)顯著性水平，以此為標(biāo)準(zhǔn)進(jìn)行決策，無法知道實(shí)際的顯著性水平究竟是多少。15、假設(shè)檢驗(yàn)步驟：陳述原假設(shè)和備擇假設(shè)從所研究的總體中抽出一個(gè)隨機(jī)樣本確定

11、一個(gè)適當(dāng)?shù)臋z驗(yàn)統(tǒng)計(jì)量，并利用樣本數(shù)據(jù)算出其具體數(shù)值確定一個(gè)適當(dāng)?shù)娘@著性水平，并計(jì)算出其臨界值，指定拒絕域?qū)⒔y(tǒng)計(jì)量的值與臨界值進(jìn)行比較，做出決策第四章非參數(shù)檢驗(yàn)1、無需假定總體分布的具體形式，僅僅依賴于數(shù)據(jù)觀測值的相對大小(秩)或零假設(shè)下等可能的概率等和數(shù)據(jù)本身的具體總體分布無關(guān)的性質(zhì)進(jìn)行的檢驗(yàn)都稱為非參數(shù)檢驗(yàn)。參數(shù)檢驗(yàn)與非參數(shù)檢驗(yàn)的比較：在總體分布形式已知時(shí)，非參數(shù)檢驗(yàn)不如傳統(tǒng)方法效率高。這是因?yàn)榉菂?shù)方法利用的信息要少些。往往在傳統(tǒng)方法可以拒絕零假設(shè)的情況，非參數(shù)檢驗(yàn)無法拒絕。但非參數(shù)統(tǒng)計(jì)在總體未知時(shí)效率要比傳統(tǒng)方法要高，有時(shí)要高很多。是否用非參數(shù)統(tǒng)計(jì)方法，要根據(jù)對總體分布的了解程度來確定。

12、單樣本非參數(shù)檢驗(yàn)的方法卡方檢驗(yàn)卡方擬合優(yōu)度檢驗(yàn)的原理與計(jì)算步驟原理：判斷樣本觀察頻數(shù)(Observedfrequency)與理論(期望)頻數(shù)(Expectedfrequency)之差是否由抽樣誤差所引起。計(jì)算步驟：H：樣本的總體分布與該理論分布無區(qū)別H1:樣本與該理論分布有區(qū)別a二0.05（2）列出各組的實(shí)際頻數(shù)與理論頻數(shù)Pearson2統(tǒng)計(jì)量kZi=1（實(shí)際頻數(shù)理論頻數(shù)-理論頻數(shù)）=_O22Ei_(O2-E2)2E21_Ei自由度v=k-1-（計(jì)算理論分布時(shí)所用參數(shù)的個(gè)數(shù)(Ok-Ek)2Ek（4）確定概率P并作出統(tǒng)計(jì)推論。擬合優(yōu)度卡方檢驗(yàn)的問題分組不同，擬合的結(jié)果可能不同。需要有足夠的樣本含

13、量。對于連續(xù)型變量的擬合優(yōu)度，卡方檢驗(yàn)并不是理想的方法。（2）二項(xiàng)分布檢驗(yàn)（3）K-S檢驗(yàn)尋找最大距離（Distance），所以常簡稱為D法。適用于大樣本。具體做法：D，根據(jù)D值來判斷實(shí)際頻數(shù)分布是否服從理比較實(shí)際頻數(shù)與理論頻數(shù)的累積概率間的差距，找出最大距離論頻數(shù)分布。2、單樣本非參檢驗(yàn)方法的比較：（1）卡方檢驗(yàn)一般要求待檢驗(yàn)樣本有較大的樣本容量，比較適合于分析實(shí)際頻數(shù)與某理論頻數(shù)是否相符。（2）二項(xiàng)分布檢驗(yàn)只能作二項(xiàng)分布檢驗(yàn)。（3）單樣本K-S檢驗(yàn)比較適合于連續(xù)型數(shù)據(jù)的分析，其檢驗(yàn)功效比較強(qiáng)。二、關(guān)于隨機(jī)性的游程檢驗(yàn)（runtest）游程檢驗(yàn)方法是檢驗(yàn)一個(gè)取兩個(gè)值的變量的這兩個(gè)值的出現(xiàn)是否

14、是隨機(jī)的。假定下面是由0和1組成的一個(gè)這種變量的樣本：其中相同的0（或相同的1）在一起稱為一個(gè)游程（單獨(dú)的0或1也算）。這個(gè)數(shù)據(jù)中有4個(gè)0組成的游程和3個(gè)1組成的游程。一共是R=7個(gè)游程。其中0的個(gè)數(shù)為m=15，而1的個(gè)數(shù)為n=10。3、兩個(gè)獨(dú)立樣本的非參數(shù)檢驗(yàn)：在對總體分布不了解的情況下，通過分析樣本數(shù)據(jù)，推斷樣本來自的兩個(gè)獨(dú)立總體的分布是否存在顯著差異，一般推斷兩個(gè)獨(dú)立總體的均值或中位數(shù)是否存在顯著差異。方法：（1）Wilcoxon-Mann-WhitneyU檢驗(yàn)（2）兩獨(dú)立樣本的KS檢驗(yàn)（3）兩獨(dú)立樣本的游程檢驗(yàn)（Wald-WolfwitzRuns）（4）兩獨(dú)立樣本的極端反應(yīng)檢驗(yàn)（Mos

15、esExtremeReactions）4、多個(gè)獨(dú)立樣本的非參數(shù)檢驗(yàn)：在對總體分布不了解的情況下，通過分析樣本數(shù)據(jù)，推斷樣本來自的多個(gè)獨(dú)立總體的分布是否存在顯著差異，一般推斷多個(gè)獨(dú)立總體的均值或中位數(shù)是否存在顯著差異。方法：（1）KW檢驗(yàn)（2）中位數(shù)檢驗(yàn)（3）Jonkheere-Terpstra檢驗(yàn)5、兩配對樣本的非參數(shù)檢驗(yàn)：在對總體分布不了解的情況下，通過分析樣本數(shù)據(jù)，推斷樣本來自的兩個(gè)相關(guān)配對總體的分布是否存在顯著差異。方法：McNcmar變化顯著性檢驗(yàn)：將研究對象自身作為對照者，檢驗(yàn)其“前后”的變化是否顯著。要求樣本數(shù)據(jù)是二值。符號檢驗(yàn)Wilcoxon符號平均秩檢驗(yàn)列聯(lián)表6、相關(guān)系數(shù):2X

16、2列聯(lián)表中數(shù)據(jù)的相關(guān)程度，絕對值在01之間。列聯(lián)相關(guān)系數(shù)：大于2X2列聯(lián)表中數(shù)據(jù)的相關(guān)程度，0C1。V相關(guān)系數(shù)：V的取值范圍為0wV1,V=0表明列聯(lián)表的兩個(gè)變量獨(dú)立，V=1則表明兩個(gè)變量完全相關(guān)。第五章方差分析1、方差分析是通過對誤差的分析，檢驗(yàn)多個(gè)總體均值是否相等的一種統(tǒng)計(jì)方法。它分為單因素方差分析和雙因素方差分析。方差分析通過對數(shù)據(jù)誤差來源的分析判斷不同總體的均值是否相等。因此，進(jìn)行方差分析時(shí)，需要考察數(shù)據(jù)誤差的來源。2、兩類誤差：隨機(jī)誤差和系統(tǒng)誤差。3、組內(nèi)平方和：因素的同一水平下數(shù)據(jù)誤差的平方和，只包含隨機(jī)誤差。組間平方和：因素的不同水平之間數(shù)據(jù)誤差的平方和，既包括隨機(jī)誤差，也包括系

17、統(tǒng)誤差。均方：平方和除以相應(yīng)的自由度。4、方差分析的基本假定：每個(gè)總體都應(yīng)服從正態(tài)分布各個(gè)總體的方差必須相同觀察值是獨(dú)立的5、單因素方差分析步驟：提出假設(shè)構(gòu)造檢驗(yàn)統(tǒng)計(jì)量統(tǒng)計(jì)決策6、構(gòu)造統(tǒng)計(jì)量需要計(jì)算：水平的均值；全部觀察值的總均值；誤差平方和；均方。7、變量間關(guān)系的強(qiáng)度用自變量平方和(SSA)占總平方和(SST)的比例大小來反映，記為R2。其平方根R就可以用來測量兩個(gè)變量之間的關(guān)系強(qiáng)度。8多重比較(通過對總體均值之間的配對比較來進(jìn)一步檢驗(yàn)到底哪些均值之間存在差異)的步驟：提出假設(shè)。計(jì)算檢驗(yàn)的統(tǒng)計(jì)量(區(qū)-區(qū))。計(jì)算LSD。做成決策決策。9、雙因素方差分析：按兩個(gè)因素對試驗(yàn)結(jié)果的影響是否相互獨(dú)立分

18、為無交互作用的雙因素方差分析或無重復(fù)雙因素方差分析和有交互作用的雙因素方差分析或可重復(fù)雙因素方差分析。第七章相關(guān)分析與回歸分析1、變量之間的兩類關(guān)系：確定性關(guān)系(函數(shù)關(guān)系)和非確定性關(guān)系(相關(guān)關(guān)系)。相關(guān)關(guān)系分為：線性相關(guān)和非線性相關(guān)；完全相關(guān)和不相關(guān)。線性相關(guān)和完全相關(guān)又可分為正相關(guān)和負(fù)相關(guān)。2、在進(jìn)行相關(guān)分析時(shí)，對總體有以下兩個(gè)主要假定：兩個(gè)變量之間是線性關(guān)系和兩個(gè)變量都是隨機(jī)變量。3、相關(guān)系數(shù)(correlationcoefficient):度量變量之間關(guān)系強(qiáng)度的一個(gè)統(tǒng)計(jì)量。對兩個(gè)變量之間線性相關(guān)強(qiáng)度的度量稱為簡單相關(guān)系數(shù)。若相關(guān)系數(shù)是根據(jù)總體全部數(shù)據(jù)計(jì)算的，稱為總體相關(guān)系數(shù)，記為幾若相

19、關(guān)系數(shù)是根據(jù)樣本數(shù)據(jù)計(jì)算的，則稱為樣本相關(guān)系數(shù)，簡稱為相關(guān)系數(shù)，記為r,也稱為線性相關(guān)系數(shù)(linearcorrelationcoefficient)或稱為Pearson相關(guān)系數(shù)(Pearsonscorrelationcoefficient)。4、相關(guān)系數(shù)的性質(zhì)r的取值范圍是-1,1,|r|越趨于1表示關(guān)系越強(qiáng)；|r|越趨于0表示關(guān)系越弱，r=0,不存在線性相關(guān)關(guān)系。r具有對稱性。即x與y之間的相關(guān)系數(shù)和y與x之間的相關(guān)系數(shù)相等，即6y=ryx。r數(shù)值大小與x和y原點(diǎn)及尺度無關(guān)，即改變x和y的數(shù)據(jù)原點(diǎn)及計(jì)量尺度，并不改變r(jià)數(shù)值大小。僅僅是x與y之間線性關(guān)系的一個(gè)度量，它不能用于描述非線性關(guān)系。

20、這意味著，r=0只表示兩個(gè)變之間不存在線性相關(guān)關(guān)系，并不說明變量之間沒有任何關(guān)系。r雖然是兩個(gè)變量之間線性關(guān)系的一個(gè)度量，卻不一定意味著x與y定有因果關(guān)系。5、相關(guān)系數(shù)的經(jīng)驗(yàn)解釋：|r|_0.8時(shí)，可視為兩個(gè)變量之間高度相關(guān)；0.5即|0.8時(shí)，可視為中度相關(guān)；0.3即|0.5時(shí),1宀的檢驗(yàn)，米用t檢驗(yàn)。1宀的檢驗(yàn)，米用t檢驗(yàn)。視為低度相關(guān)；|r|r:，拒絕H0；若t0,說明回歸方程擬合的越差。判定系數(shù)等于相關(guān)系數(shù)的平方，即R2=r2。15、線性關(guān)系的檢驗(yàn)的步驟：提出假設(shè)(H0:1=0，線性關(guān)系不顯著)。計(jì)算檢驗(yàn)統(tǒng)計(jì)量F。確定顯著性水平：，并根據(jù)分子自由度1和分母自由度n-2找出臨界值F:.作

21、出決策(若FF:，拒絕H0;若FF:，不拒絕H0)。第九、十章主成分分析和因子分析1、主成分分析是把各變量之間互相關(guān)聯(lián)的復(fù)雜關(guān)系進(jìn)行簡化分析的方法?；谙嚓P(guān)系數(shù)矩陣還是基于協(xié)方差矩陣做主成分分析。如果變量有不同的量綱，則必須基于相關(guān)系數(shù)矩陣進(jìn)行主成分分析。不同的是計(jì)算得分時(shí)應(yīng)采用標(biāo)準(zhǔn)化后的數(shù)據(jù)。主成分應(yīng)滿足如下的條件：每個(gè)主成分的系數(shù)平方和為1。主成分之間相互獨(dú)立，即無重疊的信息。主成分的方差依次遞減，重要性依次遞減。主成分的性質(zhì)一、均值E(Ux)二U二、方差為所有特征根之和P222Var(FJ=腎2亠一-p-二2亠亠pi4說明主成分分析把P個(gè)隨機(jī)變量的總方差分解成為P個(gè)不相關(guān)的隨機(jī)變量的方差之和。協(xié)方差矩陣邛勺對角線上的元素之和等于特征根之和。2、主成分個(gè)數(shù)的選取：累積貢獻(xiàn)率達(dá)到8

人人文庫> 全部分類> 行業(yè)資料 > 機(jī)電工程

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

應(yīng)用技術(shù)統(tǒng)計(jì)分析復(fù)習(xí)筆記

文檔簡介

溫馨提示

最新文檔

評論

應(yīng)用技術(shù)統(tǒng)計(jì)分析復(fù)習(xí)筆記

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔