統(tǒng)計學復習資料整理_第1頁
統(tǒng)計學復習資料整理_第2頁
免費預覽已結束,剩余1頁可下載查看

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、極差:一組數(shù)據(jù)的最大值與最小值之差稱為極差,也稱全距,用R表示。其計算公式為:R=max(xi)min(xi)離散系數(shù):也稱為變異系數(shù),它是一組數(shù)據(jù)的標準差與其相應的平均數(shù)之比。其計算公式為:v=s/x。離散系數(shù)是測量數(shù)據(jù)離散程度的相對統(tǒng)計量,主要是用于比較不同樣本數(shù)據(jù)的離散程度。離散系數(shù)大,說明數(shù)據(jù)的離散程度也大;離散系數(shù)小,說明數(shù)據(jù)的離散程度也小。三大統(tǒng)計分布:卡方分布、T分布、F分布卡方分布(X2)定理:設n個相互獨立并且都服從正態(tài)N(0,1)分布的隨機變量XI、X2,Xn,記X*立X?則隨機變量X2服從自由度為n的X2分布。統(tǒng)計變量服從卡方分布,其含義是:在給定概率a的條件下,滿足HJ

2、TA/a”y川工心NaJxjmr=SXf>X?Cni或者說表達式E*的概率為a。T分布X定理:設隨機變量x,y相互獨立,XN(0,1),YX2(n)記VF/ri。則隨機變量T服從自由度為n的t分布。設Tt(n),0vav1,對于滿足下列等式PT>(n)弓/T(x)dx=a創(chuàng)的數(shù)ta(n),稱為t(n)分布的上側分位數(shù)。對于較大的n(>45)可以同標準正態(tài)分布的上側分位數(shù)ua作為t(n)分布的上側分位數(shù)F分布F三匹仙定理:設隨機變量x,y相互獨立,Xx2(n1),Yx2(n2)記,則隨機變量F服從第一自由度為n1,第二自由度為n2的F分布,記作:FF(n1,n2)Ft.(越*2

3、)貝y_1F.(如的)若FF(n1,n2),易知:,右統(tǒng)計量:描述樣本特征的概括性數(shù)字度量。完全由樣本決定的量,叫做統(tǒng)計量;或者說不含有其他未知量的樣本的函數(shù)稱為統(tǒng)計量。統(tǒng)計量可以看做是對樣本的一種加工,它吧樣本中所包含的關于總體的其一方面的信息集中起來。最常用的統(tǒng)計量是樣本均值和樣本方差S2。自由度:隨機變量所包含的獨立變量的個數(shù)。參數(shù)估計:就是用樣本統(tǒng)計量去估計總體的參數(shù)。在參數(shù)估計中,用來估計總體參數(shù)的統(tǒng)計量的名稱稱為估計量,用符號B表示。樣本均值、樣本比例、樣本方差等都可以是一個估計量。而根據(jù)一個具體的樣本計算出來的估計量的數(shù)值稱為估計值。參數(shù)估計的方法有點估計和區(qū)間估計兩種。點估計:

4、就是用樣本統(tǒng)計量B的某個取值直接作為總體參數(shù)B的估計值。區(qū)間估計:是在點估計的基礎上,給出總體參數(shù)估計的一個區(qū)間范圍,該區(qū)間通常由樣本統(tǒng)計量加減估計誤差得到。與點估計不同,進行區(qū)間估計時,根據(jù)樣本統(tǒng)計量的抽樣分布可以對樣本統(tǒng)計量與總體參數(shù)的接近程度給出一個概率度量。樣本量:從總體中抽取的一部分元素的集合為樣本,構成樣本的元素的數(shù)目為樣本量。樣本量的大小是選擇檢驗統(tǒng)計量得一個要素。置信區(qū)間:在區(qū)間估計中,由樣本統(tǒng)計量所構造的總體參數(shù)的估計區(qū)間稱為置信區(qū)間。置信水平:將構造置信區(qū)間的步驟重復很多次,置信區(qū)間包含總體參數(shù)真值的次數(shù)所占的比例稱為置信水平。表示為(1a)%,a為是總體參數(shù)未在區(qū)間內的比

5、例。也稱置信度或置信系數(shù)。假設檢驗:利用樣本信息,對提出的命題進行檢驗的一套程序和方法。事先對總體參數(shù)或分布形式作出某種假設,然后利用樣本信息來判斷假設是否成立;有參數(shù)假設檢驗和非參數(shù)假設檢驗。采用邏輯上的反證法,依據(jù)統(tǒng)計上的小概率原理。單側檢驗:拒絕域在右側或者在左側的假設檢驗,左單側檢驗右單側檢驗雙側檢驗:拒絕域在兩側的假設檢驗原假設:提出一個或兩個參數(shù)是否等于或大于、小于某個特殊值的命題。H0:有待檢驗的假設,又稱0假設,收集證據(jù)予以反對的假設(總是有等號)備擇假設:H1:又稱研究假設,收集證據(jù)予以支持的假設。與原假設相對立的假設(總是有不等號)方差分析:縮寫為ANOVA,就是通過檢驗各

6、總體的均值是否相等來判斷分類型對數(shù)值型變量是否有顯著影響的統(tǒng)計方法。因子和處理:在方差分析中,所要檢驗的對象稱為因素或因子,是所研究的分類型變量的另一個名稱。因素的不同表現(xiàn)稱為處理或水平??偲椒胶停河洖镾ST。它是全部觀測值刈與總均值x的誤差平方和。組間平方和:記為SSA,它是各組均值xi與總均值x的誤差平方和,反應各樣本之間的差異程度,因此又稱為因素平方和。組內平方和:記為SSE,它是每個水平或組的各樣本數(shù)據(jù)與其組均值的誤差平方和,反應了每個樣本觀測值的離散情況,因此稱為組內平方和。該平方和反應了隨機誤差的大小。SST、SSA、SSE之間的關系:k叫kk叫-=22_=22xijxniXjxX

7、jjxii1jj1i1ii1jj1組間方差:SSA的均方,也稱為組間均方,記為MSA,其計算公式為:MSA=組間平方和/自由度=SSA/k1組內方差:SSE的均方,也稱為組內均方,記為MSE,其計算公式為:MSE=組內平方和/自由度=SSE/nk將上述MSA與MSE進行對比,即得到所需要的檢驗統(tǒng)計量F。當Ho為真時,二者的比值服從分子自由度為k1、分母自由度為nk的F分布。單因素方差分析:研究一個分類型自變量同數(shù)值型因變量之間關系的一種統(tǒng)計方法。雙因素方差分析:研究兩個分類型自變量同數(shù)值型因變量之間關系的一種統(tǒng)計方法。當方差分析中涉及兩個分類型自變量時,稱為雙因素方差分析。無重復雙因素分析有重

8、復雙因素分析相關關系:變量之間存在的不確定的數(shù)量關系,稱為相關關系,一個變量的取值不能由另一個變量唯一確定。相關系數(shù):是根據(jù)樣本數(shù)據(jù)計算的度量兩個變量之間線性關系強度的統(tǒng)計量。若相關系數(shù)是根據(jù)總體全部數(shù)據(jù)計算的,稱為總體相關系數(shù),記為p;若使根據(jù)眼根數(shù)據(jù)計算的,則稱為樣本相關系數(shù),記為r。樣本相關系數(shù)的計算公式為:nxyxyr!2:222nxx、nyyLSD:最小顯著差異法。存在一定的缺陷。在都與對照相比時可以使用該法。是對檢驗兩個總計均值是否相等的t檢驗方法的總體方差估計加以修正(用MSE來代替)而得到的。-方差分析中的多重比較(步驟)1提出假設叢=曲(笫個惡體的均值等干勒個總體的均值)式中

9、,ta/2為t分布的臨界值,通過查t分布表得到,其自由度為(nk),這里的k是因素中水平的個數(shù);MSE為組內方差;ni和nj分別是第i個樣本和第j個樣本的樣本量。出匸山工4(第冷為體的均值不等于劉個息體的均值)2. 計算檢驗的統(tǒng)計氓®-知3. 計.LSD':邸二5MSE丄十丄4決無若匡-玉卜觀,拒絕弘;若札-兀LSD不拒絕簡述評價估計量好壞的標準。1. 無偏性:估計量抽樣分布的數(shù)學期望等于被估計的總體參數(shù)。設總體參數(shù)為所選擇的估計量為B,如果E(0)=B,則稱B為B的無偏估計量。2. 有效性:對同一總體參數(shù)的兩個無偏點估計量有更小標準差的估計量更有效。在無偏估計的條件下,估計

10、量的方差越小,估計也就越有效。3. 一致性:隨著樣本容量的增大,估計量的值越來越接近被估計的總體參數(shù)。換而言之,一個大樣本給出的估計量要比一個小樣本給出的估計量更接近總體的參數(shù)。怎樣理解置信區(qū)間?在區(qū)間估計中,又樣本統(tǒng)計量所構造的總體參數(shù)的估計區(qū)間稱為置信區(qū)間,其中區(qū)間的最小值稱為置信下線,最大值稱為置信上線。由于統(tǒng)計學家在某種程度是上確信這個區(qū)間會包含真正的樣本的總體參數(shù),所以給它取名為置信區(qū)間。什么是假設檢驗中的兩類錯誤?兩類錯誤之間存在什么樣的數(shù)量關系?一類錯誤是原假設H0為真卻被我們拒絕了,犯這種錯誤的概率用a表示,所以也稱a錯誤或棄真錯誤;另一類錯誤是原假設為偽我們卻沒有拒絕,犯這種

11、錯誤的概率用B表示,所以也稱B錯誤或者取偽錯誤。a和B在數(shù)量上是此消彼長的關系。簡述假設檢驗的基本步驟。1. 提出假設2. 確定適當?shù)臋z驗統(tǒng)計量3. 規(guī)定顯著性水平4. 計算檢驗統(tǒng)計量的值5. 作出統(tǒng)計決策方差分析包括哪些類型?它們有何區(qū)別?1. 單因素方差分析:研究一個分類型自變量最一個數(shù)值型因變量的影響。2. 雙因素方差分析:究兩個分類型自變量同數(shù)值型因變量之間關系的一種統(tǒng)計方法。當方差分析中涉及兩個分類型自變量時,稱為雙因素方差分析。無重復雙因素分析:兩個影響因素相互獨立;可重復雙因素分析:兩個因素有交互作用,結合后產生新的影響。簡述方差分析的基本思想。方差分析的基本假定:1.每個總體都

12、應服從正態(tài)分布2.各個總體的方差必須相同(同質性)3.觀察值是獨立的方差分析的基本思想和原理:1.判斷均值之間是否有差異時需要借助于方差。2,。通過對數(shù)據(jù)誤差來源的分析判斷不同總體的均值是否相等。3.即:判斷均值之間是否有差異需要進行方差分析。解釋R2的含義和作用。R2稱為多重判定系數(shù),在無重復雙因素方差分析中用于關系強度的測量。行因素所產生的誤差平方和記為SSR,列因素所產出的誤差平方和記為SSC,這兩個平方和加在一起則度量了兩個自變量對因變量的聯(lián)合效應,聯(lián)合效應與總平方和的比值定義為R2,其平方根R則反映了這兩個自變量合起來與因變量之間的關系強度。即:R2=聯(lián)合效應/總效應=SSR+SSC

13、/SST簡述相關系數(shù)的性質。1. r的取值范圍為-1到1,r=1時,完全正線性相關R=-1時,完全負線性相關R=0時,不存在線性相關關系0>r>=-1,負線性相關0<r<=1,正線性相關R越趨近于+1,線性相關關系越密切R越趨近于0,線性相關關系越不密切2. r具有對稱性。x與y之間的相關系數(shù)和y與x之間的相關系數(shù)相等。3. r數(shù)值大小與x和y的原點及尺度無關。4. r僅僅是x與y之間線性關系的一個度量,它不能用于描述非線性關系。5. r雖然是兩個變量之間線性關系的一個度量,卻不一定意味著x與y定有因果關系。簡述相關系數(shù)顯著性檢驗的步驟。1. 提出假設:H0:p=0;H

14、1:P不等于02. 使用t檢驗的方法,根據(jù)公式計算檢驗的統(tǒng)計量得出tt(n-2)3. 根據(jù)置信度a,查表,確定接受區(qū)域和拒絕區(qū)域4. 檢驗t在哪個區(qū)域:若t在拒絕域,則拒絕H0;若t在接受域,則不拒絕H05. 如果求出兩變量之間的線性相關系數(shù),并且證明了兩者有顯著相關性,則考慮用一簡述參數(shù)最小二乘估計的基本原理。未知量的最可能值是使各項實際觀測值和計算值之間差的平方乘以其精確度的數(shù)值以后的和為最小。在回歸分析中,F(xiàn)檢驗和t檢驗各有什么作用?F檢驗(線性關系檢驗)是檢驗自變量x和因變量y之間的線性關系是否顯著,或者說,它們之間能否用一個線性模型y31+32x+&來表示。t檢驗(回歸系數(shù)檢

15、驗)是要檢驗自變量對因變量的影響是否顯著。參數(shù)估計:1,樣本均值根據(jù)1-a%這樣的概率水平構造了一個置信區(qū)間,而總體均值在這個區(qū)間里的概率為1-a%,即置信水平為1-a%,顯著性水平為a%。1,一個總體參數(shù)的估計的評估:首先看其是否是無偏性,即估計量的抽樣分布的數(shù)學期望與被估計的總體參數(shù)一樣;其次,對同一總體參數(shù)的兩個無偏點,以其方差小的更有效;一致性,即隨著樣本容量逐漸增大,估計量應該越來越接近被估計的總體參數(shù)。2,關鍵掌握幾個公式(1),總體均值的估計區(qū)間(2),總體方差的估計區(qū)間方差分析:1,就是比較組間方差和組內方差,如果相等,則說明組間沒有顯著性差異,也就是說不同品種不造成影響。因為

16、組間方差既包含系統(tǒng)誤差也包含隨機誤差,組內方差只包含隨機2,誤差來源也就是說是組間的還是組內的,方差分析就是對誤差來源的分析,判斷均值是否相同。前提是三個假定:正態(tài)分布,每組的組內方差相同,相互獨立個線性關系式表達兩者之間的線性關系單因素方差分析:(1),提出假設:H0,H1(2),計算出每組的平均值X1,計算出總體的平均值X0,計算出總平方和SST,即所有數(shù)值的分散情況(3),計算出組間平方和SSA,即各組均值的分散情況(4),計算出組內平方和SSE,即各個觀察值與該組的均值的平方和之和(所有組)SST(總誤差)=SSA(系統(tǒng)誤差和隨機誤差)+SSE(隨機誤差)所以,如果沒有顯著性差異,則應

17、該是不存在系統(tǒng)誤差,那么就是說SSA/自由度=SSE/自由度SST自由度為n-1SSA自由度為k-1SSE自由度為n-k所以現(xiàn)在需要計算的是SSA/(k-1)與SSE/(n-k)的值,即MSA/MSE,得到的值遵循F分布,其實也就是得到一個F值,然后在給定的顯著性水平下,根據(jù)k-i和n-k的值在表中查到一個對應的Fa值,比較兩者的大小,如果Fa>F,則不接受H0雙因素方差分析:(1),同單因素一樣,首先進行假設,H0,H1;H0,H1(因為是兩個因素,所以要分別的假設,最后的結果也是分開的,分別的檢驗)(2),求出總誤差平方和SST,自由度為kr-1行誤差平方和SSR,自由度為k-1列誤

18、差平法和SSC,自由度為r-1隨機誤差項平方和SSE,自由度為(k-1)(r-1)SST=SSR+SSC+SSE(3) ,根據(jù)各誤差平方和和自由度,求出各均方,MST,MSE,MSR,MSC下面的步驟和單因素類似,根據(jù)行誤差均方和隨機誤差均方的比值MSR/MSE=Fr根據(jù)列誤差均方和隨機誤差均方的比之MSC/MSE=Fc分別就兩種因素中的一種檢驗,根據(jù)自由度,給定的置信度,查出Fa。分別查找行行和列的,分別比較回歸分析與相關分析的區(qū)別1. 相關分析中,變量x變量y處于平等的地位;2. 回歸分析中,變量y稱為因變量,處在被解釋的地位,x稱為自變量,用于預測因變量的變化.3. 相關分析主要是描述兩個變量之間線性關系的密切程度;4. 回歸分析不僅可以揭示變量x對變量y的影響大小,還可以由回歸方程進行預測和控制?;貧w分析與相關分析的聯(lián)系相關分析反映的是一元回歸分析所揭示的兩個變量之間線性關系的密切程度;棄法法則:1. 四舍五入法2. 四舍六入五單雙法?(1)四舍六入?(2)若舍入的該位數(shù)是5,則分情況:a若該位數(shù)前為奇數(shù),或該位數(shù)后還有不為零的數(shù)字,則入;b.若該位數(shù)后數(shù)字全為0,且其前為偶數(shù),則舍去。計算法則:(1)進行加減法運算結果的有效位數(shù),自左起不超過參加運算中的數(shù)值第一個出現(xiàn)的可疑數(shù)字位數(shù),如:1.48+1.23+21.40

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論