統(tǒng)計學簡答題答案修訂.doc_第1頁
統(tǒng)計學簡答題答案修訂.doc_第2頁
統(tǒng)計學簡答題答案修訂.doc_第3頁
統(tǒng)計學簡答題答案修訂.doc_第4頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

精品文檔統(tǒng)計學簡答答案 1. 一組數據的分布特征可以從哪幾個方面進行描述? 數據分布的特征可以從三個方面進行測度和描述:(1)分布的集中趨勢,反映各數據向其中心值靠攏或聚集的程度;(2)分布的離散程度,反映各數據遠離其中心值的趨勢;(3)分布的形狀,反映數據分布的偏態(tài)和峰態(tài)。2. 影響樣本量大小的因素有哪些?簡述這些因素與樣本量的關系。(1)影響樣本量大小的因素有:所要求的置信水平、總體方差和估計時所希望的估計誤差。(2) 關系:其他條件不變的情況下:1)樣本量的大小與置信水平成正比。置信水平越大,所需樣本量也就越大;2)樣本量與總體方差成正比??傮w的差異越大,所要求的樣本量也越大;3)樣本量與估計誤差的平方成反比,即允許的估計誤差的平方越大,所需的樣本量就越小。3. 簡述統(tǒng)計數據的類型和特點。類型:(1)按計量尺度:分類數據、順序數據和數值型數據; (2)按收集方法:觀測數據和實驗數據; (3)按被描述的現象與時間的關系:截面數據和時間序列數據。特點:(1)按計量尺度分時:分類數據中各類別間是平等的并列關系,各類別間的順序是可任意改變的;順序數據的類別間是可以比較順序的;數值型數據其結果表現為具體的數值。(2)按收集方法分時:觀測數據是在沒有對事物進行人為控制的條件下等到的;實驗數據的在實驗中控制實驗對象而收集到的數據。(3)按被描述的對象與時間關系分時:截面數據所描述的是現象在某一時刻的變化情況;時間序列數據所描述的是現象隨時間而變化的情況。4. 在假設檢驗中,當不拒絕原假設時,為什么不采取“接受原假設”的表示方式? (1)在假設檢驗時,當拒絕原假設時,表明樣本提供的證據證明它是錯誤的;當沒有拒絕原假設時,也沒法證明它是正確的。 (2)采用“接受”原假設的說法,意味著樣本提供的證據證明了原假設是正確的。但由于原假設的真實值是什么并不知道,沒有足夠的證據拒絕原假設并不等于能夠證明原假設是真的,它僅僅意味著目前我們還沒有足夠的證據拒絕原假設,只表示手頭上這個樣本提供的證據還不足以拒絕原假設。5. 什么是判定系數?它在回歸分析中的主要作用是什么?(1) 判定系數:回歸平方和占總平方和的比例。記為R2,公式為:R2,=SSR/SST.(2) 在回歸分析中,R2,主要是用于測度回歸直線對觀測數據的擬合程度。取值范圍是0,1。R2,越接近于1,回歸直線的擬合程度就越好;R2,越接近于0,回歸直線的擬合程度就越差。若所有觀測點都落在直線上,R2,=1,擬合是完全的;如果R2,=0,回歸直線對數據完全沒有擬合。6. 解釋95%的置信區(qū)間 如果用某種方法構造的所有區(qū)間中有95%的區(qū)間包含總體參數的真值,5%的區(qū)間不包含總體參數的真值,那么,用該方法構造的區(qū)間稱為置信水平為95%的置信區(qū)間。7.說明區(qū)間估計的基本原理 區(qū)間估計是在點估計的基礎上給出總體參數估計的一個估計區(qū)間,該區(qū)間通常是由樣本統(tǒng)計量加減估計誤差得到的。與點估計不同,進行區(qū)間估計時,根據樣本統(tǒng)計量的抽樣分布,可以對統(tǒng)計量與總體參數的接近程度給出一個概率度量。8. 測度兩個分類變量相關性的統(tǒng)計量有哪些?他們有什么不同?測度兩個分類變量相關性的統(tǒng)計量有以下幾個:相關系數、列聯(lián)相關系數(c系數)、v相關系數(1) 相關系數:描述22列聯(lián)表數據相關程度最常用的一種相關系數且系數沒有上限。(2) 列聯(lián)相關系數(c系數):主要用于大于22列聯(lián)表的情況且c系數小于1.(3) v相關系數:取值在0-1之間,當兩個變量相互獨立時,v=0;當兩個變量完全相關時,v=1.若列聯(lián)表中有一維為2,v相關系數=相關系數。9.什么是方差分析?它研究的是什么?(1)方差分析:就是通過檢驗各總體的均值是否相等來判斷分類型自變量對數值型因變量是否有顯著影響。(2)本質上來說它所研究的是分類型自變量對數值型因變量的影響。10. 方差分析中有哪些基本假定? 方差分析有三個基本假定:(1) 每個總體都應服從正態(tài)分布。也就是說,對于因素的每一個水平,其觀測值是來自正態(tài)分布總體的簡單隨機樣本。(2) 各個總體的方差2必須相同。也就是說,各組觀察數據是從具有相同方差的正態(tài)總體中抽取的。(3)觀測值是獨立的。也就是說,每個樣本數據是來自因子各水平的獨立樣本11.相關分析主要解決哪些問題?相關分析就是對兩個變量之間線性關系的描述與變量,它要解決的問題包括:(1)變量之間是否存在關系?(2)如果存在關系,它們之間是什么樣的關系?(3)變量之間的關系強度如何?(4)樣本所反映的變量之間的關系能否代表總體變量之間的關系?為解決這些問題,在進行相關分析時,對總體主要有以下兩個假定:(1)兩個變量之間是線性關系。(2)兩個變量都是隨機變量12.在回歸分析中,F檢驗和t檢驗各有什么作用? (1)t檢驗常能用作檢驗回歸方程中各個參數的顯著性,而F檢驗則能用作檢驗整個回歸關系的顯著性。 (2)各解釋變量聯(lián)合起來對被解釋變量有顯著的線性關系,并不意味著每一個解釋變量分別對被解釋變量有顯著的線性關系。 (3)在一般情形下,t檢驗與F檢驗的結果沒有必然聯(lián)系;但當解釋變量之間兩兩不相關時,若所有解釋變量的系數均通過t檢驗,那么回歸方程也能通過F檢驗。13. 解釋回歸模型和估計的回歸方程的含義(1)回歸模型:描述因變量y如何依賴于自變量x和誤差項的方程。只涉及一個自變量的一元線性回歸模型可表示為:y=0+1 X+(2) 估計的回歸方程:回歸模型中的參數0和1是未知數,必須利用樣本數據去估計他們。用樣本統(tǒng)計量0和1代替回歸方程中的未知數0和1,就得到了估計的回歸方程。它是根據樣本數據求出的回歸方程的估計。對于一元線性回歸,估計的回歸方程形式是:y=0+1x14.解釋多重判定系數和調整的多重判定系數的含義和作用 (1)多重判定系數:是多元回歸中的回歸平方和占總平方和的比例,它是度量多元回歸方程擬合程度的一個統(tǒng)計量,反應了在因變量y的變差中被估計的回 歸方程所解釋的比例。(2)調 整 的 多 重 判 定 系 數:用樣本容量n和自變量的個數k去調整R2 得到,這使得 Ra 2 的值永遠小于 R2 且 Ra 2 的值不會由于模型中自變量個數的增加而越來越接近1,避免增加自變量而高估多重判定系數。 15. 解釋多重共線性的含義當回歸模型中兩個或兩個以上的自變量彼此相關時,稱回歸模型中存在多重共線性。16多重共線性的判別方法主要有哪些?(1)模型中各對自變量之間顯著相關。(2)當模型的線性關系檢驗(F檢驗)顯著時,幾乎所有回歸系數i的t檢驗卻不顯著。(3)回歸系數的正負號與預期的相反。(4)容忍度與方差擴大因子(VIF)。容忍度越小,多重共線性越嚴重,當小于0.1時,存在嚴重多重共線性。VIF越大,多重共線性越嚴重,一般認為VIF大于10時,存在嚴重多重共線性。17.時間序列由哪幾個要素組成? 時間序列由4要素組成,即趨勢(T)、季節(jié)性或季節(jié)波動(S)、周期性或循環(huán)波動(C)、隨機性或不規(guī)則波動(I)。趨勢是時間序列在長時期內呈現出來的某種持續(xù)向上或持續(xù)下降的變動,也稱長期趨勢。季節(jié)性也稱季節(jié)變動,它是時間序列在一年內重復出現的周期性波動。周期性也稱循環(huán)波動,它是時間序列中呈現出來的圍繞長期趨勢的一種波浪形或振蕩變動。時間序列除去趨勢、周期性和季節(jié)性之后的偶然性波動,稱為隨機性,也稱不規(guī)則波動。18. 解釋時間序列的預測程序。 在對時間序列進行預測時,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論