應(yīng)用統(tǒng)計分析復(fù)習(xí)_第1頁
應(yīng)用統(tǒng)計分析復(fù)習(xí)_第2頁
應(yīng)用統(tǒng)計分析復(fù)習(xí)_第3頁
應(yīng)用統(tǒng)計分析復(fù)習(xí)_第4頁
應(yīng)用統(tǒng)計分析復(fù)習(xí)_第5頁
已閱讀5頁,還剩7頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、應(yīng)用統(tǒng)計學(xué)復(fù)習(xí)要點(diǎn)(要求:每人攜帶具有開方功能的計算器)一、名詞解釋1.統(tǒng)計學(xué)收集、處理、分析、解釋數(shù)據(jù)并從數(shù)據(jù)中得出結(jié)論的科學(xué)。2.方差分析 方差分析是通過分析數(shù)據(jù)的誤差判斷各總體均值是否相等,研究分類型自變量對數(shù)值型因變量的影響,分為單因素方差分析和雙因素方差分析。3.假設(shè)檢驗(yàn)假設(shè)檢驗(yàn)是事先對總體參數(shù)或分布形式作出某種假設(shè),然后利用樣本信息來判斷原假設(shè)是否成立。分為參數(shù)假設(shè)檢驗(yàn)和非參數(shù)假設(shè)檢驗(yàn)。一般采用邏輯上的反證法,依據(jù)統(tǒng)計上的小概率原理。4.置信區(qū)間置信區(qū)間是指由樣本統(tǒng)計量所構(gòu)造的總體參數(shù)的估計區(qū)間。在統(tǒng)計學(xué)中,一個概率樣本的置信區(qū)間(Confidence interval)是對這個樣

2、本的某個總體參數(shù)的區(qū)間估計。置信區(qū)間展現(xiàn)的是這個參數(shù)的真實(shí)值有一定概率落在測量結(jié)果的周圍的程度。5.置信水平置信水平是指總體參數(shù)值落在樣本統(tǒng)計值某一區(qū)內(nèi)的概率。6.抽樣分布抽樣分布:從已知的總體中以一定的樣本容量進(jìn)行隨機(jī)抽樣,由樣本的統(tǒng)計數(shù)所對應(yīng)的概率分布稱為抽樣分布。抽樣分布是統(tǒng)計推斷的理論基礎(chǔ)。7.方差分析方差分析是通過分析數(shù)據(jù)的誤差判斷各總體均值是否相等,研究分類型自變量對數(shù)值型因變量的影響,分為單因素方差分析和雙因素方差分析。8.相關(guān)分析相關(guān)分析(correlation analysis),相關(guān)分析是研究現(xiàn)象之間是否存在某種依存關(guān)系,并對具體有依存關(guān)系的現(xiàn)象探討其相關(guān)方向以及相關(guān)程度,

3、是研究隨機(jī)變量之間的相關(guān)關(guān)系的一種統(tǒng)計方法。9.推斷統(tǒng)計推斷統(tǒng)計是研究如何利用樣本數(shù)據(jù)來推斷總體特征的統(tǒng)計方法。包含兩個內(nèi)容:參數(shù)估計,即利用樣本信息推斷總體特征;假設(shè)檢驗(yàn),即利用樣本信息判斷對總體的假設(shè)是否成立。二、計算題1.在某地區(qū)隨機(jī)抽取120家企業(yè),按照利潤額進(jìn)行分組后結(jié)果如下:按利潤額分組(萬元)企業(yè)數(shù)(個)300以下19300400304005004250060018600以上11合計120 計算120家企業(yè)利潤額的平均數(shù)和標(biāo)準(zhǔn)差(注:第一組和最后一組的組距按相鄰組計算)。解答: 2.某銀行為縮短顧客到銀行辦理業(yè)務(wù)等待的時間,準(zhǔn)備了兩種排隊方式進(jìn)行試驗(yàn)。為比較哪種排隊方式使顧客等待

4、的時間更短,兩種排隊方式各隨機(jī)抽取9名顧客,得到第一種排隊方式的平均等待時間為7.2分鐘,標(biāo)準(zhǔn)差為1.97分鐘,第二種排隊方式的等待時間(單位:分鐘)如下:5.56.66.76.87.17.37.47.87.8(1) 計算第二種排隊時間的平均數(shù)和標(biāo)準(zhǔn)差。(2) 比較兩種排隊方式等待時間的離散程度。(3) 如果讓你選擇一種排隊方式,你會選擇哪一種?試說明理由。3. 某大學(xué)為了解學(xué)生每天上網(wǎng)的時間,在全校學(xué)生中隨機(jī)抽取36人,調(diào)查他們每天上網(wǎng)的時間(單位:小時),得到的數(shù)據(jù)如下: 3.33.16.25.82.34.14.42.05.42.66.41.82.11.91.25.14.34.24.71.

5、41.22.93.52.45.43.64.50.83.21.53.50.55.73.62.32.5求該校大學(xué)生平均上網(wǎng)時間的置信區(qū)間,置信水平分別為90%,95%和99%。(注:z(0.1)、z(0.05)和z(0.01)統(tǒng)計量值分別為1.65、1.96和2.58)4. 利用下面的信息,構(gòu)建總體均值的置信區(qū)間。(1)總體服從正態(tài)分布,且已知=500,n=15,=8900,置信水平為95%。(注:z統(tǒng)計量值為1.96)(2)總體不服從正態(tài)分布,且已知=500,n=35,=8900,置信水平為95%。(注:z統(tǒng)計量值為1.96)(4) 總體不服從正態(tài)分布,未知,n=35,=8900,s=500,置

6、信水平為90%。(注:z統(tǒng)計量值為1.65)(5) 總體不服從正態(tài)分布,未知,n=35,=8900,s=500,置信水平為99%。(注:z統(tǒng)計量值為2.58)5.對消費(fèi)者的一項(xiàng)調(diào)查表明,17%的人早餐飲料是牛奶。某城市的牛奶生產(chǎn)商認(rèn)為,該城市的人早餐飲用牛奶的比例更高。為驗(yàn)證這一說法,生產(chǎn)商隨機(jī)抽取550人的一個隨機(jī)樣本,其中115人早餐 飲用牛奶。在=0.05的顯著性水平下,檢驗(yàn)該生產(chǎn)商的說法是否屬實(shí)?(注:z統(tǒng)計量值為1.96)6.一項(xiàng)包括了200個家庭的調(diào)查顯示,每個家庭每天看電視的平均時間為7.25小時,標(biāo)準(zhǔn)差為2.5小時。據(jù)報道,10年前每天每個家庭看電視的平均時間是6.7小時。取顯

7、著性水平=0.01,這個調(diào)查能否證明“如今每個家庭每天收看電視的平均時間增加了”?(注:z統(tǒng)計量值為1.96)7.下面是7個地區(qū)2000年的人均國內(nèi)生產(chǎn)總值GDP(Y)和人均消費(fèi)水平(X)的統(tǒng)計數(shù)據(jù)(注:此題對應(yīng)的t統(tǒng)計量值為2.57):地區(qū)人均GDP(千元)Y人均消費(fèi)水平(千元)XY-E(Y)X-E(X)(Y-E(Y)×(X-E(X)(X-E(X)2(Y-E(Y)2北京22.4607.32610.2122.81028.6997.899104.276 遼寧11.2264.490-1.022-0.0260.0260.0011.045 上海34.54711.54622.2997.0301

8、56.76949.427497.226 江西4.8512.396-7.397-2.12015.6794.49354.722 河南5.4442.208-6.804-2.30815.7025.32546.300 貴州2.6621.608-9.586-2.90827.8738.45491.900 陜西4.5492.035-7.699-2.48119.0996.15359.281 合計85.739 31.609 263.84781.751854.751 (1) 計算相關(guān)系數(shù),說明二者之間的關(guān)系。(2) 人均GDP作自變量,人均消費(fèi)水平作因變量,利用最小二乘法求出估計的回歸方程,并解釋回歸系數(shù)的實(shí)際意義

9、。(3) 計算判定系數(shù)和估計標(biāo)準(zhǔn)誤差,并解釋其意義。(4) 檢驗(yàn)回歸方程線性關(guān)系的顯著性。(=0.05)(5) 如果某地區(qū)的人均GDP為5千元,預(yù)測其人均消費(fèi)水平。某地區(qū)的人均GDP為5 000元,預(yù)測其人均消費(fèi)水平為2278.10657元(6) 求人均GDP為5千元時,人均消費(fèi)水平95%的置信區(qū)間和預(yù)測區(qū)間。 人均GDP為5 000元時,人均消費(fèi)水平95的置信區(qū)間為1990.74915,2565.46399,預(yù)測區(qū)間為1580.46315,2975.74999。8.隨機(jī)抽取7家超市,得到其廣告費(fèi)支出(X)和銷售額(Y)數(shù)據(jù)如下:(注:此題對應(yīng)的t統(tǒng)計量值為2.57) 超市銷售額(萬元)Y廣告

10、費(fèi)支出(萬元)XY-E(Y)X-E(X)(Y-E(Y)×(X-E(X)(X-E(X)2(Y-E(Y)2A191-23-7.143164.28651.020529B322-10-6.14361.42937.735100C4442-4.143-8.28617.1634D406-2-2.1434.2864.5924E5210101.85718.5713.449100F5314115.85764.42934.306121G54201211.857142.286140.592144合計29457447288.85710021 計算相關(guān)系數(shù),說明二者之間的關(guān)系。r = 63.86/(6.424*

11、11.964)=0.831廣告費(fèi)用支出作自變量,銷售額作因變量,利用最小二乘法求出估計的回歸方程,并解釋回歸系數(shù)的實(shí)際意義。3 計算判定系數(shù)和估計標(biāo)準(zhǔn)誤差,并解釋其意義。4 檢驗(yàn)回歸方程線性關(guān)系的顯著性。(=0.05)5 如果某超市的廣告費(fèi)用支出為5萬元,預(yù)測其銷售額。 據(jù)此進(jìn)行計算(x為廣告費(fèi))=37.13646 求廣告費(fèi)用支出為5萬元時,超市銷售額95%的置信區(qū)間和預(yù)測區(qū)間。三、論述題1.簡述樣本量與置信水平、總體方差、估計誤差的關(guān)系。1. 估計總體均值時樣本量n為其中:2. 樣本量n與置信水平1-、總體方差、估計誤差E之間的關(guān)系為§ 與置信水平成正比,在其他條件不變的情況下,置

12、信水平越大,所需要的樣本量越大;§ 與總體方差成正比,總體的差異越大,所要求的樣本量也越大;§ 與與總體方差成正比,樣本量與估計誤差的平方成反比,即可以接受的估計誤差的平方越大,所需的樣本量越小。2.簡述評價估計量的三個標(biāo)準(zhǔn)。(15分)1、無偏性:估計量抽樣分布的數(shù)學(xué)期望等于被估計的總體參數(shù) 2、有效性:對同一總體參數(shù)的兩個無偏點(diǎn)估計量,有更小標(biāo)準(zhǔn)差的估計量更有效 3、一致性:隨著樣本量的增大時,點(diǎn)估計量的值越來越接近被估總體的參數(shù)。3.簡要說明殘差分析在回歸分析中的作用。(15分)殘差是因變量的觀測值y與根據(jù)估計的回歸方程求出的預(yù)測值之差,它反映了用估計的回歸方程去預(yù)測y而引起的誤差。 4.簡要誤差分解的概念和基本原理。(15分)1.誤差概念 :精確值與近似值之差稱為誤差,也叫絕對誤差。 2.產(chǎn)生誤差的主要原因 模型誤差:在解決實(shí)際問題時,在一定條件下抓住主要因素將現(xiàn)實(shí)系統(tǒng)理想化的數(shù)學(xué)描述稱為實(shí)際問題的數(shù)學(xué)模型,這種數(shù)學(xué)描述常常是近似的,數(shù)學(xué)模型與實(shí)際系統(tǒng)之間存在誤差,這種誤差稱為模型誤差。 觀測誤差:數(shù)學(xué)模型中往往含有一些由觀測得到的物理量(如溫度、電阻、長度)或由物理量估算出的模型參數(shù),這些觀測物理量或模型參數(shù)常常與實(shí)際數(shù)據(jù)存在誤差。這種由觀察產(chǎn)生的誤差稱為觀測誤差。 截斷誤差:數(shù)值計

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論