統(tǒng)計學(xué)復(fù)習(xí)資料_第1頁
統(tǒng)計學(xué)復(fù)習(xí)資料_第2頁
統(tǒng)計學(xué)復(fù)習(xí)資料_第3頁
統(tǒng)計學(xué)復(fù)習(xí)資料_第4頁
統(tǒng)計學(xué)復(fù)習(xí)資料_第5頁
免費預(yù)覽已結(jié)束,剩余1頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、名詞解釋、知識點和簡答(E;K;A)Chapterl(E)總體:需要研究的同質(zhì)對象的全體/根據(jù)研究的目的而確定的同質(zhì)對象的全體。樣本:從總體中抽出用以推測總體的部分對象。統(tǒng)計量:描述樣本特征的統(tǒng)計指標。描述統(tǒng)計:研究的是數(shù)據(jù)收集、處理、匯總、圖表統(tǒng)計、概括與分析等統(tǒng)計方法。推斷統(tǒng)計:是研究如何利用樣本數(shù)據(jù)來推斷總體特征的統(tǒng)計方法。(K)總體分類、數(shù)據(jù)類型、變量分類;Chapter2(E)隨機抽樣:指在總體中抽取樣本時,總體中的每一個個體被抽中的機會是均等的。分層抽樣:先按照與研究目的有關(guān)的某種特征將總體分成幾個類型組,然后再各類型組中按簡單隨機抽樣或機械隨機的方法抽取個體組成樣本。整群抽樣:在

2、總體中先劃分若干個群體,然后以群體為抽樣的單位,按簡單隨機抽樣取出若干群組成樣本。概率抽樣:也稱隨機抽樣,是指遵循隨機原則進行的抽樣,總體中每個單位都有一定的機會被選入樣本。非概率抽樣:根據(jù)方便原則或以主觀判斷選擇樣本單位(是相對于概率抽樣而言的,只抽取樣本時不是依據(jù)隨機原則, 而是根據(jù)研究目的對數(shù)據(jù)的要求,采用某種方式從總體中抽出部分單位對其實施調(diào)查。)簡單隨機抽樣: 按隨機原則直接從總體抽取樣本單位。方法有:直接抽樣、抓閹、隨機數(shù)表法。系統(tǒng)抽樣:將總體中的所有單位(抽樣單位)按一定順序排列,在規(guī)定的范圍內(nèi)隨機地抽取一個單位作為初始單位,然后按事先規(guī)定好的規(guī)則確定其他樣本單位。抽樣誤差:由抽

3、樣的隨機性引起的樣本結(jié)果與總體真值之間的差異。(K)非概率抽樣的總類及判斷、非抽樣誤差種類;(A)抽樣與概率抽樣比較概率抽樣的特點:1、抽樣時是按一定的概率以隨機原則抽取樣本。2 、每個單位被抽中的概率是已知的3 、當用樣本對總體目標量進行估計時,要考慮到每個樣本單位被抽中的概率Chapters(E)頻率:如果事件A在n次重復(fù)試驗中發(fā)生了 m次,則比值稱為隨機事件A的頻率。頻數(shù):落在某一特定類別或組中的數(shù)據(jù)個數(shù)。分組數(shù)據(jù):數(shù)據(jù)分組是根據(jù)統(tǒng)計研究的需要,將原始數(shù)據(jù)按照某種標準分成不同的組別,分組后的數(shù)據(jù)被稱為分組數(shù)據(jù)。(K)組距、組中值、上組限不計入原則、統(tǒng)計表的組成部分;Chapter4(E)

4、眾數(shù):眾數(shù)是總體中出現(xiàn)次數(shù)最多的標志值。中位數(shù):將總體單位的某一數(shù)量標志的各個數(shù)值按照大小順序排列,居于中間位置的那個數(shù)值就是中位數(shù)。幾何平均數(shù):幾何平均數(shù)是n個變量連乘積的n次根。用G表示,分為簡單幾何平均數(shù)和加權(quán)幾何平均數(shù)。算術(shù)平均數(shù):總體各單位標志值的總和除以總體單位總數(shù)得到的平均數(shù)值。標準差:是總體各單位標志值對其算術(shù)平均數(shù)離差平方的算術(shù)平均數(shù)的平方根。變異度系數(shù):稱離散系數(shù)或標志變動度,是各變異度指標與其算術(shù)平均數(shù)對比得到的相對數(shù)。通常用V表示。平均數(shù):(K)如何根據(jù)峰度和偏度判斷變量分布;(A) 1、為什幺要用變異度系數(shù)? 各種變異度指標,包括全距、四分位差、平均差、標準差等,都是

5、用絕對數(shù)表示的名數(shù)指標。它們都有與平均數(shù)相同的計量單位。它們的大小,不僅受各單位標志值變異程度的影響,還受各單位標志值平均水平影響。因此,在研究中,分析不同現(xiàn)象間總體的差異程度,或分析同類現(xiàn)象但水平不同的總體的變異度時,就不能直接采用以上變異度指標中的某一種來作對比分析,而應(yīng)采用變異度指標的相對指標,即變異系數(shù)做比較分析。變異度系數(shù)用于對比分析不同數(shù)列變異度大 小。2、眾數(shù)、中位數(shù)、平均數(shù)的比較:眾數(shù)是一組數(shù)據(jù)分布的峰值, 不受極端值的影響。眾數(shù)主要適合作為分類數(shù)據(jù)的集中趨勢測度值; 中位數(shù)是一組數(shù)據(jù)中間位置上的代表值,不受數(shù)據(jù)極端值的影響。中位數(shù)主要是和作為順序數(shù)據(jù)的集中趨勢測度值;平均數(shù)是

6、針對數(shù)值型數(shù)據(jù)計算的,而且利用了全部數(shù)據(jù)信息,它是實際中應(yīng)用最廣泛的集中趨勢測度值。當數(shù)據(jù)為偏態(tài)分布,特別是偏斜程度較大時,可以考慮選擇中位數(shù)或眾數(shù),這是它們的代表性要比平均數(shù)好。Chapter7(E)參數(shù)估計:就是用樣本統(tǒng)計量去估計總體的參數(shù)。在參數(shù)估計中,用來估計總體參數(shù)的統(tǒng)計量的名稱稱為估計量,用符號 e表示。樣本均值、樣本比例、樣本方差等都可以是一個估計量。而根 據(jù)一個具體的樣本計算出來的估計量的數(shù)值稱為估計值。參數(shù)估計的方法有點估計和區(qū)間估計兩種。點估計:就是用樣本統(tǒng)計量 e的某個取值直接作為總體參數(shù)e的估計值。區(qū)間估計:是在點估計的基礎(chǔ)上,給出總體參數(shù)估計的一個區(qū)間范圍,該區(qū)間通常

7、由樣本統(tǒng)計量加減估計誤差得到。與點估計不同,進行區(qū)間估計時,根據(jù)樣本統(tǒng)計量的抽樣分布可以對樣本統(tǒng) 計量與總體參數(shù)的接近程度給出一個概率度量。置信水平:將構(gòu)造置信區(qū)間的步驟重復(fù)很多次,置信區(qū)間包含總體參數(shù)真值的次數(shù)所占的比例稱為置信水平。表示為(1 - a ) % a為是總體參數(shù)未在區(qū)間內(nèi)的比例。也稱置信度或置信系數(shù)。(A)評價估計量的標準:1、無偏性:是指估計量抽樣分布的數(shù)學(xué)期望等于被估計的總體參數(shù),設(shè)總體參數(shù)為e ,所選擇的估計量為e人,如果e( 8人)=e ,則稱8 A為e的無偏估計量。2、有效性:是指對同一總體參數(shù)的兩個無偏估計量,有更小標準差的估計量更有效。3、一致性:是指隨著樣本量的

8、增大,估計量的值越來越接近被估總體的參數(shù)。影響樣本容量決定的因素:Chapters(E)原假設(shè):(或稱無效假設(shè))記為Ho,該假設(shè)是肯定性假設(shè),即假定所比較的樣本統(tǒng)計量的總體參數(shù)相等。假設(shè)檢驗:在實際檢驗過程中,主要的問題是要判定被檢驗的統(tǒng)計量之間的偏差時由抽樣誤差造成的,還是由于總體參數(shù)不同所造成的,要作出判斷就需要對總體先建立某種假設(shè),然后通過統(tǒng)計量的計算及概率判斷,對所建立的假設(shè)是否成立進行檢驗。這類方法稱為假設(shè)檢驗。單側(cè)假設(shè)檢驗:拒絕域僅存在于分布曲線一側(cè)的檢驗(老書P89)雙側(cè)假設(shè)檢驗:拒絕域?qū)ΨQ分布于曲線兩側(cè)的檢驗(老書P89)備擇假設(shè):H1 :又稱研究假設(shè),收集證據(jù)予以支持的假設(shè)。

9、與原假設(shè)相對立的假設(shè)(總是有不守3)(A)假設(shè)檢驗步驟:1.提出假設(shè)(提出原假設(shè)和備擇假設(shè))2 .確定適當?shù)臋z驗統(tǒng)計量3 .規(guī)定顯著性水平4 .計算檢驗統(tǒng)計量的值5 .做出統(tǒng)計決策(拒絕或不拒絕原假設(shè)的結(jié)論)(K)兩類錯誤及其關(guān)系Chapter11(E)相關(guān)系數(shù):是表示兩個變量(X與Y)之間線性關(guān)系的密切程度和相關(guān)方向的統(tǒng)計指標,簡言之,相關(guān)系數(shù)就是兩個變量之間的相互關(guān)系的定量化描述,用符號 r表示。最小二乘法:使因變量的觀察值 yi與估計值yAi之間的利差平均和達到最小來估計01和02 的方法,也稱最小平方法。判定系數(shù):回歸平方和占總平方和的比例,用RA2表示,它是對估計的回歸方程擬合優(yōu)度的

10、度量。估計標準誤差: 度量各實際觀測點在直線周圍的的散布狀況的一個統(tǒng)計量,是均方殘差(MSE的平方根,用 Se表示?;貧w模型:描述因變量y如何依賴于自變量 x和誤差項的方程。只涉及一個自變量的一元線性回 歸模型可表示為 y= 3 0 + 3 1X + e回歸方程:描述因變量y的期望值如何依賴于自變量x的方程。一元線性回歸方程的形式為E(x)= p 0 + 0 1X(A)相關(guān)關(guān)系的主要內(nèi)容:1、散點圖 2、相關(guān)系數(shù)顯著性檢驗:1.r的抽樣分布 2.r的顯著性檢驗:提出假設(shè);計算檢驗的統(tǒng)計量;進行決策Chapter12(E)多重判定系數(shù):回歸平方和占總平方和的比例,反映因變量y取值的變差中,能被估計的多元回歸方程所解釋的比例。調(diào)整的多重判定系數(shù):多重共線性:回歸模型中兩個或兩個以上的自變量彼此相關(guān)。逐步回歸:(A)多重共線性的表現(xiàn):Chapter13(E)時間序列:是指將社會經(jīng)濟現(xiàn)象在不同時間上發(fā)展變化的某種統(tǒng)計指標數(shù)值,按時間

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論