統(tǒng)計(jì)學(xué)復(fù)習(xí)資料整理_第1頁(yè)
統(tǒng)計(jì)學(xué)復(fù)習(xí)資料整理_第2頁(yè)
統(tǒng)計(jì)學(xué)復(fù)習(xí)資料整理_第3頁(yè)
統(tǒng)計(jì)學(xué)復(fù)習(xí)資料整理_第4頁(yè)
統(tǒng)計(jì)學(xué)復(fù)習(xí)資料整理_第5頁(yè)
已閱讀5頁(yè),還剩2頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、極差:數(shù)據(jù)集的最大值和最小值之間的差值稱為極差或總距離,用r表示。計(jì)算方式為R=max (Xi)-min (Xi)方差系數(shù):也稱為變異系數(shù),是資料集相對(duì)于其平均值的標(biāo)準(zhǔn)差比率。方程式為V=S/X。離散系數(shù)是測(cè)量測(cè)量數(shù)據(jù)離散度的相對(duì)統(tǒng)計(jì),主要用于比較徐璐不同樣本數(shù)據(jù)的離散度。離散系數(shù)大表示數(shù)據(jù)的方差也很大。表示離散系數(shù)小,數(shù)據(jù)的離散度也小。三大統(tǒng)計(jì)分布:金鐘仁平方分布、t分布、f分布卡方分布(2)清理:N個(gè)徐璐獨(dú)立且全部遵循正態(tài)N(0,1)分布的隨機(jī)變量X1,X2,Xn,記住隨機(jī)變量2遵循自由度為n的2分布。統(tǒng)計(jì)變量遵循卡方分布,其含義是在給定概率的條件下滿足或者說(shuō)表達(dá)的概率是。t分布清理:使隨

2、機(jī)變量X,Y獨(dú)立于徐璐XN(0,1),Y2(n)機(jī)。隨機(jī)變量t遵循具有n個(gè)自由度的t分布。對(duì)于設(shè)置Tt(n),0 45),可以使用標(biāo)準(zhǔn)正態(tài)分布的上分位數(shù)ua作為t(n)分布的上分位數(shù)f分布定理:如果隨機(jī)變量X,Y是徐璐獨(dú)立的,并且記錄了X2(n1),Y2(n2),那么隨機(jī)變量F的第一個(gè)自由度為n1,第二個(gè)自由度遵循n2的F分布,并記錄為FF(n1,N2)FF(n1,N2),如果很容易知道郵報(bào)統(tǒng)計(jì):描述范例性質(zhì)的一般數(shù)值測(cè)量。完全由樣品決定的量稱為統(tǒng)計(jì)。或沒(méi)有其他未知樣本量的函數(shù)稱為統(tǒng)計(jì)。統(tǒng)計(jì)可以看作是樣品加工之一,集中了樣品所包含的整體方面的信息。最常用的統(tǒng)計(jì)信息是樣本平均值和樣本方差S2。自

3、由度:隨機(jī)變量中包含的獨(dú)立變量數(shù)。參數(shù)估計(jì):使用樣本統(tǒng)計(jì)信息估計(jì)整體參數(shù)。在參數(shù)估計(jì)中,用于估計(jì)整體參數(shù)的統(tǒng)計(jì)信息的名稱稱為估計(jì),并顯示為符號(hào)??梢怨烙?jì)樣品平均值、樣品率、樣品方差等。根據(jù)特定樣本計(jì)算的估計(jì)值稱為估計(jì)值。參數(shù)估計(jì)方法有若干估計(jì)和區(qū)間估計(jì)兩種。點(diǎn)估計(jì):直接使用樣例統(tǒng)計(jì)信息的值作為整個(gè)參數(shù)的估計(jì)值。區(qū)間估計(jì):根據(jù)點(diǎn)估計(jì)(通常由樣本統(tǒng)計(jì)中的加法和減法估計(jì)誤差得出),給出了整個(gè)參數(shù)估計(jì)的區(qū)間范圍。與點(diǎn)估計(jì)不同,間隔估計(jì)可以根據(jù)采樣統(tǒng)計(jì)信息的樣本分布提供采樣統(tǒng)計(jì)信息與總體參數(shù)的接近程度的概率測(cè)量。樣品數(shù)量:全局抽取的部分因素由樣品組成,構(gòu)成樣品的因素?cái)?shù)量為樣品數(shù)量。樣本金額的大小是選擇檢

4、驗(yàn)統(tǒng)計(jì)數(shù)據(jù)的一個(gè)因素。置信區(qū)間:在區(qū)間估計(jì)中,由樣本統(tǒng)計(jì)組成的整個(gè)參數(shù)的估計(jì)區(qū)間稱為置信區(qū)間。信任級(jí)別:配置信任級(jí)別的步驟重復(fù)多次,信任級(jí)別包含整個(gè)參數(shù)true值的次數(shù)稱為信任級(jí)別。用(1-)% %表示,是總參數(shù)不在區(qū)間內(nèi)的比例。也稱為可信度或信任系數(shù)。假設(shè)檢驗(yàn):利用樣本信息驗(yàn)證所提出命題的一系列程序和方法。事先假定整個(gè)參數(shù)或分布形式,利用樣本信息判斷假設(shè)是否成立。有參數(shù)假設(shè)檢驗(yàn)和非參數(shù)假設(shè)檢驗(yàn)。采用邏輯反證法,根據(jù)統(tǒng)計(jì)上的小概率原則。單側(cè)檢查:拒絕右側(cè)域或左側(cè)的假設(shè)檢查,而左側(cè)的單側(cè)檢查拒絕右側(cè)的單側(cè)檢查雙方檢驗(yàn):雙方拒絕域的假設(shè)檢驗(yàn)原始假設(shè):創(chuàng)建一個(gè)或兩個(gè)參數(shù)是否大于或小于特定值的命題。H

5、0:收集反對(duì)證據(jù)的假設(shè)(總是有等號(hào))選擇假設(shè):H1:也稱為研究假設(shè),是收集和支持證據(jù)的假設(shè)。與原始假設(shè)相反的假設(shè)(不總是相同)方差分析:作為縮寫(xiě),ANOVA是一種統(tǒng)計(jì)方法,它檢查每個(gè)總體平均值是否相等,以確定子類(lèi)型對(duì)數(shù)值變量是否有顯著影響。因子和處理:在方差分析中檢查的對(duì)象稱為因子或因子,是正在研究的子類(lèi)型變量的另一個(gè)名稱。因素的其他成果稱為處理或水平??偲椒胶停阂許ST形式記錄。所有觀測(cè)xij和總平均x的誤差平方和。組之間的平方和:SSA,它是每個(gè)組的平均Xi和總平均x的誤差平方,反映每個(gè)值的差異程度,因此也稱為元素平方和。組內(nèi)平方和:以每個(gè)水平或組的不同本數(shù)據(jù)和該組平均值的誤差平方和SSE

6、記錄,反映了每個(gè)采樣觀測(cè)的方差,因此稱為組內(nèi)平方和。平方和反映了隨機(jī)誤差的大小。SST、SSA和SSE之間的關(guān)系:組之間的方差:SSA的平均值,也稱為組之間的平均值,以MSA記錄,計(jì)算方法如下:MSA=組之間的平方和/自由度=SSA/k-1組內(nèi)方差:SSE的平均值,也稱為組內(nèi)平均值,記錄為MSE,計(jì)算方法如下:MSE=群組中的平方和/自由度=SSE/n-k通過(guò)比較MSA和MSE,可以獲得所需的檢查統(tǒng)計(jì)信息f。如果H0為真,則兩者的比例遵循分子自由度為k-1、分母自由度為n-k的f分布。單因素方差分析:研究子類(lèi)型參數(shù)和數(shù)值因素變量之間關(guān)系的統(tǒng)計(jì)方法。雙因素方差分析:研究?jī)蓚€(gè)子類(lèi)型參數(shù)和相同數(shù)值因

7、素變量之間關(guān)系的統(tǒng)計(jì)方法。如果分布分析包含兩個(gè)子類(lèi)型自變量,則這稱為雙元素分布分析。無(wú)重復(fù)雙因素分析重復(fù)雙因素分析相關(guān)性:變量之間存在的不確定數(shù)量關(guān)系,稱為相關(guān)性,一個(gè)變量的值不能由另一個(gè)變量唯一確定。相關(guān)系數(shù):基于樣本數(shù)據(jù)計(jì)算的度量中兩個(gè)變量之間線性關(guān)系強(qiáng)度的統(tǒng)計(jì)信息。如果相關(guān)系數(shù)是根據(jù)整體數(shù)據(jù)計(jì)算的,則稱為整體相關(guān)系數(shù),并記錄為?;谘鄹鶖?shù)據(jù)進(jìn)行計(jì)算時(shí),稱為采樣相關(guān)系數(shù),以r記錄。樣例相關(guān)系數(shù)計(jì)算如下:LSD:最小顯著差異法。有一定的缺陷。與比較相比,可以使用此方法。修正了測(cè)試兩個(gè)求和平均值是否相等的t測(cè)試方法的總體方差估計(jì)(替換為MSE)。其中t/2是t分布的極限值,通過(guò)調(diào)查t分布表獲得

8、。自由度是(n-k),其中k是因子的水平數(shù)目。MSE是組內(nèi)的超差。Ni和NJ分別是第I個(gè)和第j個(gè)采樣的采樣數(shù)。簡(jiǎn)述評(píng)價(jià)估計(jì)量好壞的標(biāo)準(zhǔn)。1.偏轉(zhuǎn):估計(jì)樣本分布的數(shù)學(xué)期望值等于估計(jì)的整體參數(shù)。如果將整個(gè)參數(shù)設(shè)置為,選定的估計(jì)值為,e ()=,則稱為的無(wú)偏估計(jì)值。2.有效性:對(duì)同一整體參數(shù)的兩個(gè)偏轉(zhuǎn)點(diǎn)估計(jì),具有較小標(biāo)準(zhǔn)差的估計(jì)更有效。在沒(méi)有偏轉(zhuǎn)估計(jì)的條件下,估計(jì)量的方差越小,估計(jì)量也越有效。3.一致性:隨著樣本容量的增加,估計(jì)值越來(lái)越接近估計(jì)的整體參數(shù)。也就是說(shuō),較大的樣本提供比較小的樣本更接近整體參數(shù)的估計(jì)值。如何理解信任區(qū)間?在區(qū)間估計(jì)中,由樣本統(tǒng)計(jì)組成的整個(gè)參數(shù)的估計(jì)區(qū)間稱為置信區(qū)間。其中,

9、間隔的最小值是信任下限,最大值是信任區(qū)間。統(tǒng)計(jì)學(xué)家在一定程度上確信這一區(qū)間將包含實(shí)際樣品的全部參數(shù),因此將其命名為置信區(qū)間。假設(shè)檢驗(yàn)的兩種錯(cuò)誤是什么??jī)煞N類(lèi)型的錯(cuò)誤之間有什么類(lèi)型的數(shù)量關(guān)系?一個(gè)錯(cuò)誤是假定H0原來(lái)是真的,被我們拒絕了,因?yàn)榉高@種錯(cuò)誤的概率用表示,所以也稱為阿爾法錯(cuò)誤或拋棄錯(cuò)誤。另一個(gè)錯(cuò)誤假定原來(lái)是假的,但沒(méi)有拒絕,犯這種錯(cuò)誤的概率叫貝塔,也叫貝塔類(lèi)或假錯(cuò)誤。和在數(shù)量上是這種去除長(zhǎng)度關(guān)系。簡(jiǎn)述假設(shè)檢驗(yàn)的基本步驟。1.提出假說(shuō)2.確定適當(dāng)?shù)臋z查統(tǒng)計(jì)信息設(shè)定重要性層次4.計(jì)算檢驗(yàn)統(tǒng)計(jì)信息的值5.統(tǒng)計(jì)決策方差分析包括哪些類(lèi)型?區(qū)別是什么?1.單因素方差分析:研究子類(lèi)型參數(shù)最大數(shù)值因素變

10、量的影響。2.雙因素方差分析:研究?jī)蓚€(gè)子類(lèi)型參數(shù)和相同數(shù)值因素變量之間關(guān)系的統(tǒng)計(jì)方法。如果分布分析包含兩個(gè)子類(lèi)型自變量,則這稱為雙元素分布分析。沒(méi)有重復(fù)的雙因素分析:兩個(gè)影響因素是徐璐無(wú)關(guān)的。可重復(fù)雙因素分析:兩個(gè)因素相互作用,結(jié)合后產(chǎn)生新的影響。簡(jiǎn)述方差分析的基本思想。方差分析的基本假設(shè):1 .每個(gè)整體都必須遵循正態(tài)分布。2.每個(gè)整體的方差必須相同(同質(zhì)性)。3.觀測(cè)是獨(dú)立的方差分析的基本思路和原理:1 .判斷平均值是否有差異時(shí),需要方差的幫助。2.通過(guò)對(duì)數(shù)據(jù)錯(cuò)誤來(lái)源的分析,確定徐璐其他總體平均值是否相同。也就是說(shuō),需要判斷平均值之間是否存在差異的方差分析。說(shuō)明R2的意義和作用。R2(稱為多

11、晶系數(shù))用于非迭代雙因素方差分析中關(guān)系強(qiáng)度的測(cè)量。行元素產(chǎn)生的誤差平方和記錄SSR,列元素產(chǎn)生的誤差平方和記錄SSC測(cè)量?jī)蓚€(gè)參數(shù)對(duì)兩個(gè)平方和的結(jié)果變量的合并效果,聯(lián)合效果和總平方和的比率定義為R2,平方根r反映兩個(gè)參數(shù)之和與變量之間的關(guān)系強(qiáng)度。也就是說(shuō),R2=并集效果/總效果=SSR SSC/SST簡(jiǎn)述相關(guān)系數(shù)的特性。1.r的范圍在-1到1之間,r=1時(shí)具有完全正線性相關(guān)性R=-1時(shí)完全負(fù)線性相關(guān)R=0時(shí),線性無(wú)關(guān)0r=-1,負(fù)線性相關(guān)性如果為0F,則不接受H0雙因素方差分析:(1),像單個(gè)元素一樣,第一個(gè)假設(shè),h0,h1;H0,H1(因?yàn)槭莾蓚€(gè)因素,所以單獨(dú)假設(shè),最終結(jié)果也單獨(dú)檢查)(2),

12、求總誤差平方和SST,自由度為kr-1線誤差平方和SSR,自由度為k-1熱誤差平準(zhǔn)法和SSC,自由度為r-1隨機(jī)誤差項(xiàng)目平方和SSE,自由度為(k-1)(r-1)SST=SSR SSC SSE(3),根據(jù)每個(gè)誤差平方和和自由度查找每個(gè)區(qū)域、MST、MSE、MSR、MSC以下步驟類(lèi)似于單個(gè)元素,根據(jù)行誤差平均值和隨機(jī)誤差平均值的比率MSR/MSE=Fr,根據(jù)列誤差平均值和隨機(jī)誤差平均值的比率MSC/MSE=Fc,對(duì)兩個(gè)元素之一的檢查根據(jù)自由度根據(jù)給定置信度查找Fa。分別查找和比較行和列回歸分析和相關(guān)分析之間的差異1.在相關(guān)分析中,變量x變量y處于等效位置。2.在回歸分析中,變量y稱為原因變量,位于解析的位置,x稱為參數(shù),用于預(yù)測(cè)原因變量的變化。3.相關(guān)分析主要說(shuō)明兩個(gè)變量之間的線性關(guān)系有多密切;4.回歸分析不僅揭示了變量x對(duì)變量y的影響大小,還可以由回歸方程預(yù)測(cè)和調(diào)整。回歸分析與相關(guān)分析的關(guān)系

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論