統(tǒng)計(jì)學(xué)復(fù)習(xí)資料整理_第1頁(yè)
統(tǒng)計(jì)學(xué)復(fù)習(xí)資料整理_第2頁(yè)
免費(fèi)預(yù)覽已結(jié)束,剩余1頁(yè)可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、極差:一組數(shù)據(jù)的最大值與最小值之差稱為極差,也稱全距,用R表示。其計(jì)算公式為:R=max(xi)min(xi)離散系數(shù):也稱為變異系數(shù),它是一組數(shù)據(jù)的標(biāo)準(zhǔn)差與其相應(yīng)的平均數(shù)之比。其計(jì)算公式為:v=s/x。離散系數(shù)是測(cè)量數(shù)據(jù)離散程度的相對(duì)統(tǒng)計(jì)量,主要是用于比較不同樣本數(shù)據(jù)的離散程度。離散系數(shù)大,說明數(shù)據(jù)的離散程度也大;離散系數(shù)小,說明數(shù)據(jù)的離散程度也小。三大統(tǒng)計(jì)分布:卡方分布、T分布、F分布卡方分布(X2)定理:設(shè)n個(gè)相互獨(dú)立并且都服從正態(tài)N(0,1)分布的隨機(jī)變量XI、X2,Xn,記X*立X?則隨機(jī)變量X2服從自由度為n的X2分布。統(tǒng)計(jì)變量服從卡方分布,其含義是:在給定概率a的條件下,滿足HJ

2、TA/a”y川工心NaJxjmr=SXf>X?Cni或者說表達(dá)式E*的概率為a。T分布X定理:設(shè)隨機(jī)變量x,y相互獨(dú)立,XN(0,1),YX2(n)記VF/ri。則隨機(jī)變量T服從自由度為n的t分布。設(shè)Tt(n),0vav1,對(duì)于滿足下列等式PT>(n)弓/T(x)dx=a創(chuàng)的數(shù)ta(n),稱為t(n)分布的上側(cè)分位數(shù)。對(duì)于較大的n(>45)可以同標(biāo)準(zhǔn)正態(tài)分布的上側(cè)分位數(shù)ua作為t(n)分布的上側(cè)分位數(shù)F分布F三匹仙定理:設(shè)隨機(jī)變量x,y相互獨(dú)立,Xx2(n1),Yx2(n2)記,則隨機(jī)變量F服從第一自由度為n1,第二自由度為n2的F分布,記作:FF(n1,n2)Ft.(越*2

3、)貝y_1F.(如的)若FF(n1,n2),易知:,右統(tǒng)計(jì)量:描述樣本特征的概括性數(shù)字度量。完全由樣本決定的量,叫做統(tǒng)計(jì)量;或者說不含有其他未知量的樣本的函數(shù)稱為統(tǒng)計(jì)量。統(tǒng)計(jì)量可以看做是對(duì)樣本的一種加工,它吧樣本中所包含的關(guān)于總體的其一方面的信息集中起來(lái)。最常用的統(tǒng)計(jì)量是樣本均值和樣本方差S2。自由度:隨機(jī)變量所包含的獨(dú)立變量的個(gè)數(shù)。參數(shù)估計(jì):就是用樣本統(tǒng)計(jì)量去估計(jì)總體的參數(shù)。在參數(shù)估計(jì)中,用來(lái)估計(jì)總體參數(shù)的統(tǒng)計(jì)量的名稱稱為估計(jì)量,用符號(hào)B表示。樣本均值、樣本比例、樣本方差等都可以是一個(gè)估計(jì)量。而根據(jù)一個(gè)具體的樣本計(jì)算出來(lái)的估計(jì)量的數(shù)值稱為估計(jì)值。參數(shù)估計(jì)的方法有點(diǎn)估計(jì)和區(qū)間估計(jì)兩種。點(diǎn)估計(jì):

4、就是用樣本統(tǒng)計(jì)量B的某個(gè)取值直接作為總體參數(shù)B的估計(jì)值。區(qū)間估計(jì):是在點(diǎn)估計(jì)的基礎(chǔ)上,給出總體參數(shù)估計(jì)的一個(gè)區(qū)間范圍,該區(qū)間通常由樣本統(tǒng)計(jì)量加減估計(jì)誤差得到。與點(diǎn)估計(jì)不同,進(jìn)行區(qū)間估計(jì)時(shí),根據(jù)樣本統(tǒng)計(jì)量的抽樣分布可以對(duì)樣本統(tǒng)計(jì)量與總體參數(shù)的接近程度給出一個(gè)概率度量。樣本量:從總體中抽取的一部分元素的集合為樣本,構(gòu)成樣本的元素的數(shù)目為樣本量。樣本量的大小是選擇檢驗(yàn)統(tǒng)計(jì)量得一個(gè)要素。置信區(qū)間:在區(qū)間估計(jì)中,由樣本統(tǒng)計(jì)量所構(gòu)造的總體參數(shù)的估計(jì)區(qū)間稱為置信區(qū)間。置信水平:將構(gòu)造置信區(qū)間的步驟重復(fù)很多次,置信區(qū)間包含總體參數(shù)真值的次數(shù)所占的比例稱為置信水平。表示為(1a)%,a為是總體參數(shù)未在區(qū)間內(nèi)的比

5、例。也稱置信度或置信系數(shù)。假設(shè)檢驗(yàn):利用樣本信息,對(duì)提出的命題進(jìn)行檢驗(yàn)的一套程序和方法。事先對(duì)總體參數(shù)或分布形式作出某種假設(shè),然后利用樣本信息來(lái)判斷假設(shè)是否成立;有參數(shù)假設(shè)檢驗(yàn)和非參數(shù)假設(shè)檢驗(yàn)。采用邏輯上的反證法,依據(jù)統(tǒng)計(jì)上的小概率原理。單側(cè)檢驗(yàn):拒絕域在右側(cè)或者在左側(cè)的假設(shè)檢驗(yàn),左單側(cè)檢驗(yàn)右單側(cè)檢驗(yàn)雙側(cè)檢驗(yàn):拒絕域在兩側(cè)的假設(shè)檢驗(yàn)原假設(shè):提出一個(gè)或兩個(gè)參數(shù)是否等于或大于、小于某個(gè)特殊值的命題。H0:有待檢驗(yàn)的假設(shè),又稱0假設(shè),收集證據(jù)予以反對(duì)的假設(shè)(總是有等號(hào))備擇假設(shè):H1:又稱研究假設(shè),收集證據(jù)予以支持的假設(shè)。與原假設(shè)相對(duì)立的假設(shè)(總是有不等號(hào))方差分析:縮寫為ANOVA,就是通過檢驗(yàn)各

6、總體的均值是否相等來(lái)判斷分類型對(duì)數(shù)值型變量是否有顯著影響的統(tǒng)計(jì)方法。因子和處理:在方差分析中,所要檢驗(yàn)的對(duì)象稱為因素或因子,是所研究的分類型變量的另一個(gè)名稱。因素的不同表現(xiàn)稱為處理或水平。總平方和:記為SST。它是全部觀測(cè)值刈與總均值x的誤差平方和。組間平方和:記為SSA,它是各組均值xi與總均值x的誤差平方和,反應(yīng)各樣本之間的差異程度,因此又稱為因素平方和。組內(nèi)平方和:記為SSE,它是每個(gè)水平或組的各樣本數(shù)據(jù)與其組均值的誤差平方和,反應(yīng)了每個(gè)樣本觀測(cè)值的離散情況,因此稱為組內(nèi)平方和。該平方和反應(yīng)了隨機(jī)誤差的大小。SST、SSA、SSE之間的關(guān)系:k叫kk叫-=22_=22xijxniXjxX

7、jjxii1jj1i1ii1jj1組間方差:SSA的均方,也稱為組間均方,記為MSA,其計(jì)算公式為:MSA=組間平方和/自由度=SSA/k1組內(nèi)方差:SSE的均方,也稱為組內(nèi)均方,記為MSE,其計(jì)算公式為:MSE=組內(nèi)平方和/自由度=SSE/nk將上述MSA與MSE進(jìn)行對(duì)比,即得到所需要的檢驗(yàn)統(tǒng)計(jì)量F。當(dāng)Ho為真時(shí),二者的比值服從分子自由度為k1、分母自由度為nk的F分布。單因素方差分析:研究一個(gè)分類型自變量同數(shù)值型因變量之間關(guān)系的一種統(tǒng)計(jì)方法。雙因素方差分析:研究?jī)蓚€(gè)分類型自變量同數(shù)值型因變量之間關(guān)系的一種統(tǒng)計(jì)方法。當(dāng)方差分析中涉及兩個(gè)分類型自變量時(shí),稱為雙因素方差分析。無(wú)重復(fù)雙因素分析有重

8、復(fù)雙因素分析相關(guān)關(guān)系:變量之間存在的不確定的數(shù)量關(guān)系,稱為相關(guān)關(guān)系,一個(gè)變量的取值不能由另一個(gè)變量唯一確定。相關(guān)系數(shù):是根據(jù)樣本數(shù)據(jù)計(jì)算的度量?jī)蓚€(gè)變量之間線性關(guān)系強(qiáng)度的統(tǒng)計(jì)量。若相關(guān)系數(shù)是根據(jù)總體全部數(shù)據(jù)計(jì)算的,稱為總體相關(guān)系數(shù),記為p;若使根據(jù)眼根數(shù)據(jù)計(jì)算的,則稱為樣本相關(guān)系數(shù),記為r。樣本相關(guān)系數(shù)的計(jì)算公式為:nxyxyr!2:222nxx、nyyLSD:最小顯著差異法。存在一定的缺陷。在都與對(duì)照相比時(shí)可以使用該法。是對(duì)檢驗(yàn)兩個(gè)總計(jì)均值是否相等的t檢驗(yàn)方法的總體方差估計(jì)加以修正(用MSE來(lái)代替)而得到的。-方差分析中的多重比較(步驟)1提出假設(shè)叢=曲(笫個(gè)惡體的均值等干勒個(gè)總體的均值)式中

9、,ta/2為t分布的臨界值,通過查t分布表得到,其自由度為(nk),這里的k是因素中水平的個(gè)數(shù);MSE為組內(nèi)方差;ni和nj分別是第i個(gè)樣本和第j個(gè)樣本的樣本量。出匸山工4(第冷為體的均值不等于劉個(gè)息體的均值)2. 計(jì)算檢驗(yàn)的統(tǒng)計(jì)氓®-知3. 計(jì).LSD':邸二5MSE丄十丄4決無(wú)若匡-玉卜觀,拒絕弘;若札-兀LSD不拒絕簡(jiǎn)述評(píng)價(jià)估計(jì)量好壞的標(biāo)準(zhǔn)。1. 無(wú)偏性:估計(jì)量抽樣分布的數(shù)學(xué)期望等于被估計(jì)的總體參數(shù)。設(shè)總體參數(shù)為所選擇的估計(jì)量為B,如果E(0)=B,則稱B為B的無(wú)偏估計(jì)量。2. 有效性:對(duì)同一總體參數(shù)的兩個(gè)無(wú)偏點(diǎn)估計(jì)量有更小標(biāo)準(zhǔn)差的估計(jì)量更有效。在無(wú)偏估計(jì)的條件下,估計(jì)

10、量的方差越小,估計(jì)也就越有效。3. 一致性:隨著樣本容量的增大,估計(jì)量的值越來(lái)越接近被估計(jì)的總體參數(shù)。換而言之,一個(gè)大樣本給出的估計(jì)量要比一個(gè)小樣本給出的估計(jì)量更接近總體的參數(shù)。怎樣理解置信區(qū)間?在區(qū)間估計(jì)中,又樣本統(tǒng)計(jì)量所構(gòu)造的總體參數(shù)的估計(jì)區(qū)間稱為置信區(qū)間,其中區(qū)間的最小值稱為置信下線,最大值稱為置信上線。由于統(tǒng)計(jì)學(xué)家在某種程度是上確信這個(gè)區(qū)間會(huì)包含真正的樣本的總體參數(shù),所以給它取名為置信區(qū)間。什么是假設(shè)檢驗(yàn)中的兩類錯(cuò)誤??jī)深愬e(cuò)誤之間存在什么樣的數(shù)量關(guān)系?一類錯(cuò)誤是原假設(shè)H0為真卻被我們拒絕了,犯這種錯(cuò)誤的概率用a表示,所以也稱a錯(cuò)誤或棄真錯(cuò)誤;另一類錯(cuò)誤是原假設(shè)為偽我們卻沒有拒絕,犯這種

11、錯(cuò)誤的概率用B表示,所以也稱B錯(cuò)誤或者取偽錯(cuò)誤。a和B在數(shù)量上是此消彼長(zhǎng)的關(guān)系。簡(jiǎn)述假設(shè)檢驗(yàn)的基本步驟。1. 提出假設(shè)2. 確定適當(dāng)?shù)臋z驗(yàn)統(tǒng)計(jì)量3. 規(guī)定顯著性水平4. 計(jì)算檢驗(yàn)統(tǒng)計(jì)量的值5. 作出統(tǒng)計(jì)決策方差分析包括哪些類型?它們有何區(qū)別?1. 單因素方差分析:研究一個(gè)分類型自變量最一個(gè)數(shù)值型因變量的影響。2. 雙因素方差分析:究?jī)蓚€(gè)分類型自變量同數(shù)值型因變量之間關(guān)系的一種統(tǒng)計(jì)方法。當(dāng)方差分析中涉及兩個(gè)分類型自變量時(shí),稱為雙因素方差分析。無(wú)重復(fù)雙因素分析:兩個(gè)影響因素相互獨(dú)立;可重復(fù)雙因素分析:兩個(gè)因素有交互作用,結(jié)合后產(chǎn)生新的影響。簡(jiǎn)述方差分析的基本思想。方差分析的基本假定:1.每個(gè)總體都

12、應(yīng)服從正態(tài)分布2.各個(gè)總體的方差必須相同(同質(zhì)性)3.觀察值是獨(dú)立的方差分析的基本思想和原理:1.判斷均值之間是否有差異時(shí)需要借助于方差。2,。通過對(duì)數(shù)據(jù)誤差來(lái)源的分析判斷不同總體的均值是否相等。3.即:判斷均值之間是否有差異需要進(jìn)行方差分析。解釋R2的含義和作用。R2稱為多重判定系數(shù),在無(wú)重復(fù)雙因素方差分析中用于關(guān)系強(qiáng)度的測(cè)量。行因素所產(chǎn)生的誤差平方和記為SSR,列因素所產(chǎn)出的誤差平方和記為SSC,這兩個(gè)平方和加在一起則度量了兩個(gè)自變量對(duì)因變量的聯(lián)合效應(yīng),聯(lián)合效應(yīng)與總平方和的比值定義為R2,其平方根R則反映了這兩個(gè)自變量合起來(lái)與因變量之間的關(guān)系強(qiáng)度。即:R2=聯(lián)合效應(yīng)/總效應(yīng)=SSR+SSC

13、/SST簡(jiǎn)述相關(guān)系數(shù)的性質(zhì)。1. r的取值范圍為-1到1,r=1時(shí),完全正線性相關(guān)R=-1時(shí),完全負(fù)線性相關(guān)R=0時(shí),不存在線性相關(guān)關(guān)系0>r>=-1,負(fù)線性相關(guān)0<r<=1,正線性相關(guān)R越趨近于+1,線性相關(guān)關(guān)系越密切R越趨近于0,線性相關(guān)關(guān)系越不密切2. r具有對(duì)稱性。x與y之間的相關(guān)系數(shù)和y與x之間的相關(guān)系數(shù)相等。3. r數(shù)值大小與x和y的原點(diǎn)及尺度無(wú)關(guān)。4. r僅僅是x與y之間線性關(guān)系的一個(gè)度量,它不能用于描述非線性關(guān)系。5. r雖然是兩個(gè)變量之間線性關(guān)系的一個(gè)度量,卻不一定意味著x與y定有因果關(guān)系。簡(jiǎn)述相關(guān)系數(shù)顯著性檢驗(yàn)的步驟。1. 提出假設(shè):H0:p=0;H

14、1:P不等于02. 使用t檢驗(yàn)的方法,根據(jù)公式計(jì)算檢驗(yàn)的統(tǒng)計(jì)量得出tt(n-2)3. 根據(jù)置信度a,查表,確定接受區(qū)域和拒絕區(qū)域4. 檢驗(yàn)t在哪個(gè)區(qū)域:若t在拒絕域,則拒絕H0;若t在接受域,則不拒絕H05. 如果求出兩變量之間的線性相關(guān)系數(shù),并且證明了兩者有顯著相關(guān)性,則考慮用一簡(jiǎn)述參數(shù)最小二乘估計(jì)的基本原理。未知量的最可能值是使各項(xiàng)實(shí)際觀測(cè)值和計(jì)算值之間差的平方乘以其精確度的數(shù)值以后的和為最小。在回歸分析中,F(xiàn)檢驗(yàn)和t檢驗(yàn)各有什么作用?F檢驗(yàn)(線性關(guān)系檢驗(yàn))是檢驗(yàn)自變量x和因變量y之間的線性關(guān)系是否顯著,或者說,它們之間能否用一個(gè)線性模型y31+32x+&來(lái)表示。t檢驗(yàn)(回歸系數(shù)檢

15、驗(yàn))是要檢驗(yàn)自變量對(duì)因變量的影響是否顯著。參數(shù)估計(jì):1,樣本均值根據(jù)1-a%這樣的概率水平構(gòu)造了一個(gè)置信區(qū)間,而總體均值在這個(gè)區(qū)間里的概率為1-a%,即置信水平為1-a%,顯著性水平為a%。1,一個(gè)總體參數(shù)的估計(jì)的評(píng)估:首先看其是否是無(wú)偏性,即估計(jì)量的抽樣分布的數(shù)學(xué)期望與被估計(jì)的總體參數(shù)一樣;其次,對(duì)同一總體參數(shù)的兩個(gè)無(wú)偏點(diǎn),以其方差小的更有效;一致性,即隨著樣本容量逐漸增大,估計(jì)量應(yīng)該越來(lái)越接近被估計(jì)的總體參數(shù)。2,關(guān)鍵掌握幾個(gè)公式(1),總體均值的估計(jì)區(qū)間(2),總體方差的估計(jì)區(qū)間方差分析:1,就是比較組間方差和組內(nèi)方差,如果相等,則說明組間沒有顯著性差異,也就是說不同品種不造成影響。因?yàn)?/p>

16、組間方差既包含系統(tǒng)誤差也包含隨機(jī)誤差,組內(nèi)方差只包含隨機(jī)2,誤差來(lái)源也就是說是組間的還是組內(nèi)的,方差分析就是對(duì)誤差來(lái)源的分析,判斷均值是否相同。前提是三個(gè)假定:正態(tài)分布,每組的組內(nèi)方差相同,相互獨(dú)立個(gè)線性關(guān)系式表達(dá)兩者之間的線性關(guān)系單因素方差分析:(1),提出假設(shè):H0,H1(2),計(jì)算出每組的平均值X1,計(jì)算出總體的平均值X0,計(jì)算出總平方和SST,即所有數(shù)值的分散情況(3),計(jì)算出組間平方和SSA,即各組均值的分散情況(4),計(jì)算出組內(nèi)平方和SSE,即各個(gè)觀察值與該組的均值的平方和之和(所有組)SST(總誤差)=SSA(系統(tǒng)誤差和隨機(jī)誤差)+SSE(隨機(jī)誤差)所以,如果沒有顯著性差異,則應(yīng)

17、該是不存在系統(tǒng)誤差,那么就是說SSA/自由度=SSE/自由度SST自由度為n-1SSA自由度為k-1SSE自由度為n-k所以現(xiàn)在需要計(jì)算的是SSA/(k-1)與SSE/(n-k)的值,即MSA/MSE,得到的值遵循F分布,其實(shí)也就是得到一個(gè)F值,然后在給定的顯著性水平下,根據(jù)k-i和n-k的值在表中查到一個(gè)對(duì)應(yīng)的Fa值,比較兩者的大小,如果Fa>F,則不接受H0雙因素方差分析:(1),同單因素一樣,首先進(jìn)行假設(shè),H0,H1;H0,H1(因?yàn)槭莾蓚€(gè)因素,所以要分別的假設(shè),最后的結(jié)果也是分開的,分別的檢驗(yàn))(2),求出總誤差平方和SST,自由度為kr-1行誤差平方和SSR,自由度為k-1列誤

18、差平法和SSC,自由度為r-1隨機(jī)誤差項(xiàng)平方和SSE,自由度為(k-1)(r-1)SST=SSR+SSC+SSE(3) ,根據(jù)各誤差平方和和自由度,求出各均方,MST,MSE,MSR,MSC下面的步驟和單因素類似,根據(jù)行誤差均方和隨機(jī)誤差均方的比值MSR/MSE=Fr根據(jù)列誤差均方和隨機(jī)誤差均方的比之MSC/MSE=Fc分別就兩種因素中的一種檢驗(yàn),根據(jù)自由度,給定的置信度,查出Fa。分別查找行行和列的,分別比較回歸分析與相關(guān)分析的區(qū)別1. 相關(guān)分析中,變量x變量y處于平等的地位;2. 回歸分析中,變量y稱為因變量,處在被解釋的地位,x稱為自變量,用于預(yù)測(cè)因變量的變化.3. 相關(guān)分析主要是描述兩個(gè)變量之間線性關(guān)系的密切程度;4. 回歸分析不僅可以揭示變量x對(duì)變量y的影響大小,還可以由回歸方程進(jìn)行預(yù)測(cè)和控制?;貧w分析與相關(guān)分析的聯(lián)系相關(guān)分析反映的是一元回歸分析所揭示的兩個(gè)變量之間線性關(guān)系的密切程度;棄法法則:1. 四舍五入法2. 四舍六入五單雙法?(1)四舍六入?(2)若舍入的該位數(shù)是5,則分情況:a若該位數(shù)前為奇數(shù),或該位數(shù)后還有不為零的數(shù)字,則入;b.若該位數(shù)后數(shù)字全為0,且其前為偶數(shù),則舍去。計(jì)算法則:(1)進(jìn)行加減法運(yùn)算結(jié)果的有效位數(shù),自左起不超過參加運(yùn)算中的數(shù)值第一個(gè)出現(xiàn)的可疑數(shù)字位數(shù),如:1.48+1.23+21.40

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論