應(yīng)用統(tǒng)計分析復(fù)習(xí)要點

上傳人：a*** IP屬地：湖北上傳時間：2022-01-16 格式：DOCX 頁數(shù)：12 大小：981.94KB 積分：28 舉報 版權(quán)申訴

已閱讀5頁，還剩7頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認領(lǐng)

文檔簡介

1、應(yīng)用統(tǒng)計學(xué)復(fù)習(xí)要點（要求：每人攜帶具有開方功能的計算器）一、名詞解釋1.統(tǒng)計學(xué)收集、處理、分析、解釋數(shù)據(jù)并從數(shù)據(jù)中得出結(jié)論的科學(xué)。2.方差分析方差分析是通過分析數(shù)據(jù)的誤差判斷各總體均值是否相等，研究分類型自變量對數(shù)值型因變量的影響，分為單因素方差分析和雙因素方差分析。3.假設(shè)檢驗假設(shè)檢驗是事先對總體參數(shù)或分布形式作出某種假設(shè)，然后利用樣本信息來判斷原假設(shè)是否成立。分為參數(shù)假設(shè)檢驗和非參數(shù)假設(shè)檢驗。一般采用邏輯上的反證法，依據(jù)統(tǒng)計上的小概率原理。4.置信區(qū)間置信區(qū)間是指由樣本統(tǒng)計量所構(gòu)造的總體參數(shù)的估計區(qū)間。在統(tǒng)計學(xué)中，一個概率樣本的置信區(qū)間（Confidence interval）是對這個樣

2、本的某個總體參數(shù)的區(qū)間估計。置信區(qū)間展現(xiàn)的是這個參數(shù)的真實值有一定概率落在測量結(jié)果的周圍的程度。5.置信水平置信水平是指總體參數(shù)值落在樣本統(tǒng)計值某一區(qū)內(nèi)的概率。6.抽樣分布抽樣分布：從已知的總體中以一定的樣本容量進行隨機抽樣，由樣本的統(tǒng)計數(shù)所對應(yīng)的概率分布稱為抽樣分布。抽樣分布是統(tǒng)計推斷的理論基礎(chǔ)。7.方差分析方差分析是通過分析數(shù)據(jù)的誤差判斷各總體均值是否相等，研究分類型自變量對數(shù)值型因變量的影響，分為單因素方差分析和雙因素方差分析。8.相關(guān)分析相關(guān)分析（correlation analysis），相關(guān)分析是研究現(xiàn)象之間是否存在某種依存關(guān)系，并對具體有依存關(guān)系的現(xiàn)象探討其相關(guān)方向以及相關(guān)程度，

3、是研究隨機變量之間的相關(guān)關(guān)系的一種統(tǒng)計方法。9.推斷統(tǒng)計推斷統(tǒng)計是研究如何利用樣本數(shù)據(jù)來推斷總體特征的統(tǒng)計方法。包含兩個內(nèi)容：參數(shù)估計，即利用樣本信息推斷總體特征；假設(shè)檢驗，即利用樣本信息判斷對總體的假設(shè)是否成立。二、計算題1.在某地區(qū)隨機抽取120家企業(yè)，按照利潤額進行分組后結(jié)果如下：按利潤額分組（萬元）企業(yè)數(shù)（個）300以下19300400304005004250060018600以上11合計120 計算120家企業(yè)利潤額的平均數(shù)和標(biāo)準差（注：第一組和最后一組的組距按相鄰組計算）。解答： 2.某銀行為縮短顧客到銀行辦理業(yè)務(wù)等待的時間，準備了兩種排隊方式進行試驗。為比較哪種排隊方式使顧客等待

4、的時間更短，兩種排隊方式各隨機抽取9名顧客，得到第一種排隊方式的平均等待時間為7.2分鐘，標(biāo)準差為1.97分鐘，第二種排隊方式的等待時間（單位：分鐘）如下：5.56.66.76.87.17.37.47.87.8(1) 計算第二種排隊時間的平均數(shù)和標(biāo)準差。(2) 比較兩種排隊方式等待時間的離散程度。(3) 如果讓你選擇一種排隊方式，你會選擇哪一種？試說明理由。3. 某大學(xué)為了解學(xué)生每天上網(wǎng)的時間，在全校學(xué)生中隨機抽取36人，調(diào)查他們每天上網(wǎng)的時間（單位：小時），得到的數(shù)據(jù)如下： 3.33.16.25.82.34.14.42.05.42.66.41.82.11.91.25.14.34.24.71.

5、41.22.93.52.45.43.64.50.83.21.53.50.55.73.62.32.5求該校大學(xué)生平均上網(wǎng)時間的置信區(qū)間，置信水平分別為90%，95%和99%。（注：z(0.1)、z(0.05)和z(0.01)統(tǒng)計量值分別為1.65、1.96和2.58）4. 利用下面的信息，構(gòu)建總體均值的置信區(qū)間。(1)總體服從正態(tài)分布，且已知=500，n=15，=8900，置信水平為95%。（注：z統(tǒng)計量值為1.96）(2)總體不服從正態(tài)分布，且已知=500，n=35，=8900，置信水平為95%。（注：z統(tǒng)計量值為1.96）(4) 總體不服從正態(tài)分布，未知，n=35，=8900，s=500，置

6、信水平為90%。（注：z統(tǒng)計量值為1.65）(5) 總體不服從正態(tài)分布，未知，n=35，=8900，s=500，置信水平為99%。（注：z統(tǒng)計量值為2.58）5.對消費者的一項調(diào)查表明，17%的人早餐飲料是牛奶。某城市的牛奶生產(chǎn)商認為，該城市的人早餐飲用牛奶的比例更高。為驗證這一說法，生產(chǎn)商隨機抽取550人的一個隨機樣本，其中115人早餐飲用牛奶。在=0.05的顯著性水平下，檢驗該生產(chǎn)商的說法是否屬實？（注：z統(tǒng)計量值為1.96）6.一項包括了200個家庭的調(diào)查顯示，每個家庭每天看電視的平均時間為7.25小時，標(biāo)準差為2.5小時。據(jù)報道，10年前每天每個家庭看電視的平均時間是6.7小時。取顯

7、著性水平=0.01，這個調(diào)查能否證明“如今每個家庭每天收看電視的平均時間增加了”？（注：z統(tǒng)計量值為1.96）7.下面是7個地區(qū)2000年的人均國內(nèi)生產(chǎn)總值GDP（Y）和人均消費水平（X）的統(tǒng)計數(shù)據(jù)（注：此題對應(yīng)的t統(tǒng)計量值為2.57）：地區(qū)人均GDP（千元）Y人均消費水平（千元）XY-E(Y)X-E(X)(Y-E(Y)(X-E(X)(X-E(X)2(Y-E(Y)2北京22.4607.32610.2122.81028.6997.899104.276 遼寧11.2264.490-1.022-0.0260.0260.0011.045 上海34.54711.54622.2997.030156.769

8、49.427497.226 江西4.8512.396-7.397-2.12015.6794.49354.722 河南5.4442.208-6.804-2.30815.7025.32546.300 貴州2.6621.608-9.586-2.90827.8738.45491.900 陜西4.5492.035-7.699-2.48119.0996.15359.281 合計85.739 31.609 263.84781.751854.751 (1) 計算相關(guān)系數(shù)，說明二者之間的關(guān)系。(2) 人均GDP作自變量，人均消費水平作因變量，利用最小二乘法求出估計的回歸方程，并解釋回歸系數(shù)的實際意義。(3) 計

9、算判定系數(shù)和估計標(biāo)準誤差，并解釋其意義。(4) 檢驗回歸方程線性關(guān)系的顯著性。（=0.05）(5) 如果某地區(qū)的人均GDP為5千元，預(yù)測其人均消費水平。某地區(qū)的人均GDP為5 000元，預(yù)測其人均消費水平為2278.10657元(6) 求人均GDP為5千元時，人均消費水平95%的置信區(qū)間和預(yù)測區(qū)間。人均GDP為5 000元時，人均消費水平95的置信區(qū)間為1990.74915，2565.46399，預(yù)測區(qū)間為1580.46315，2975.74999。8.隨機抽取7家超市，得到其廣告費支出（X）和銷售額（Y）數(shù)據(jù)如下：（注：此題對應(yīng)的t統(tǒng)計量值為2.57）超市銷售額（萬元）Y廣告費支出（萬元

10、）XY-E(Y)X-E(X)(Y-E(Y)(X-E(X)(X-E(X)2(Y-E(Y)2A191-23-7.143164.28651.020529B322-10-6.14361.42937.735100C4442-4.143-8.28617.1634D406-2-2.1434.2864.5924E5210101.85718.5713.449100F5314115.85764.42934.306121G54201211.857142.286140.592144合計29457447288.85710021 計算相關(guān)系數(shù)，說明二者之間的關(guān)系。r = 63.86/(6.424*11.964)=0.83

11、1廣告費用支出作自變量，銷售額作因變量，利用最小二乘法求出估計的回歸方程，并解釋回歸系數(shù)的實際意義。3 計算判定系數(shù)和估計標(biāo)準誤差，并解釋其意義。4 檢驗回歸方程線性關(guān)系的顯著性。（=0.05）5 如果某超市的廣告費用支出為5萬元，預(yù)測其銷售額。據(jù)此進行計算（x為廣告費）=37.13646 求廣告費用支出為5萬元時，超市銷售額95%的置信區(qū)間和預(yù)測區(qū)間。三、論述題1.簡述樣本量與置信水平、總體方差、估計誤差的關(guān)系。1. 估計總體均值時樣本量n為其中：2. 樣本量n與置信水平1-、總體方差、估計誤差E之間的關(guān)系為與置信水平成正比，在其他條件不變的情況下，置信水平越大，所需要的樣本量越大；與

12、總體方差成正比，總體的差異越大，所要求的樣本量也越大；與與總體方差成正比，樣本量與估計誤差的平方成反比，即可以接受的估計誤差的平方越大，所需的樣本量越小。2.簡述評價估計量的三個標(biāo)準。（15分）1、無偏性：估計量抽樣分布的數(shù)學(xué)期望等于被估計的總體參數(shù) 2、有效性：對同一總體參數(shù)的兩個無偏點估計量，有更小標(biāo)準差的估計量更有效 3、一致性：隨著樣本量的增大時，點估計量的值越來越接近被估總體的參數(shù)。3.簡要說明殘差分析在回歸分析中的作用。（15分）殘差是因變量的觀測值y與根據(jù)估計的回歸方程求出的預(yù)測值之差，它反映了用估計的回歸方程去預(yù)測y而引起的誤差。 4.簡要誤差分解的概念和基本原理。（15分）1.誤差概念：精確值與近似值之差稱為誤差，也叫絕對誤差。 2.產(chǎn)生誤差的主要原因模型誤差：在解決實際問題時，在一定條件下抓住主要因素將現(xiàn)實系統(tǒng)理想化的數(shù)學(xué)描述稱為實際問題的數(shù)學(xué)模型，這種數(shù)學(xué)描述常常是近似的，數(shù)學(xué)模型與實際系統(tǒng)之間存在誤差，這種誤差稱為模型誤差。觀測誤差：數(shù)學(xué)模型中往往含有一些由觀測得到的物理量（如溫度、電阻、長度）或由物理量估算出的模型參數(shù)，這些觀測物理量或模型參數(shù)常常與實際數(shù)據(jù)存在誤差。這種由觀察產(chǎn)生的誤差稱為觀測誤差。截斷誤差：數(shù)值計算中

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

應(yīng)用統(tǒng)計分析復(fù)習(xí)要點

文檔簡介

溫馨提示

最新文檔

評論

應(yīng)用統(tǒng)計分析復(fù)習(xí)要點

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔