統(tǒng)計學(xué)課后答案_第1頁
統(tǒng)計學(xué)課后答案_第2頁
統(tǒng)計學(xué)課后答案_第3頁
統(tǒng)計學(xué)課后答案_第4頁
統(tǒng)計學(xué)課后答案_第5頁
已閱讀5頁,還剩13頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、統(tǒng)計學(xué)第一章1. 什么是統(tǒng)計學(xué)?怎樣理解統(tǒng)計學(xué)與統(tǒng)計數(shù)據(jù)的關(guān)系?答:統(tǒng)計學(xué)是一門收集、整理、顯示和分析統(tǒng)計數(shù)據(jù)的科學(xué)。統(tǒng)計學(xué)與統(tǒng)計數(shù)據(jù)存在密切關(guān)系,統(tǒng)計學(xué)闡述的統(tǒng)計方法來源于對統(tǒng)計數(shù)據(jù)的研究,目的也在于對統(tǒng)計數(shù)據(jù)的研究,離開了統(tǒng)計數(shù)據(jù),統(tǒng)計方法以致于統(tǒng)計學(xué)就失去了其存在意義。2簡要說明統(tǒng)計數(shù)據(jù)的來源答:統(tǒng)計數(shù)據(jù)來源于兩個方面:直接的數(shù)據(jù):源于直接組織的調(diào)查、觀察和科學(xué)實驗,在社會經(jīng)濟(jì)管理領(lǐng)域,主要通過統(tǒng)計調(diào)查方式來獲得,如普查和抽樣調(diào)查。間接的數(shù)據(jù):從報紙、圖書雜志、統(tǒng)計年鑒、網(wǎng)絡(luò)等渠道獲得。3.簡要說明抽樣誤差和非抽樣誤差答:統(tǒng)計調(diào)查誤差可分為非抽樣誤差和抽樣誤差。非抽樣誤差是由于調(diào)查過程中

2、各環(huán)節(jié)工作失誤造成的,從理論上看,這類誤差是可以避免的。抽樣誤差是利用樣本推斷總體時所產(chǎn)生的誤差,它是不可避免的,但可以控制的。4.答:(1)有兩個總體:A品牌所有產(chǎn)品、B品牌所有產(chǎn)品 (2)變量:口味(如可用10分制表示) (3)匹配樣本:從兩品牌產(chǎn)品中各抽取1000瓶,由1000名消費者分別打分,形成匹配樣本。 (4)從匹配樣本的觀察值中推斷兩品牌口味的相對好壞。第二章、統(tǒng)計數(shù)據(jù)的描述思考題1描述次數(shù)分配表的編制過程答:分二個步驟:(1) 按照統(tǒng)計研究的目的,將數(shù)據(jù)按分組標(biāo)志進(jìn)行分組。按品質(zhì)標(biāo)志進(jìn)行分組時,可將其每個具體的表現(xiàn)作為一個組,或者幾個表現(xiàn)合并成一個組,這取決于分組的粗細(xì)。按數(shù)量

3、標(biāo)志進(jìn)行分組,可分為單項式分組與組距式分組單項式分組將每個變量值作為一個組;組距式分組將變量的取值范圍(區(qū)間)作為一個組。統(tǒng)計分組應(yīng)遵循“不重不漏”原則(2) 將數(shù)據(jù)分配到各個組,統(tǒng)計各組的次數(shù),編制次數(shù)分配表。2解釋洛倫茲曲線及其用途答:洛倫茲曲線是20世紀(jì)初美國經(jīng)濟(jì)學(xué)家、統(tǒng)計學(xué)家洛倫茲根據(jù)意大利經(jīng)濟(jì)學(xué)家帕累托提出的收入分配公式繪制成的描述收入和財富分配性質(zhì)的曲線。洛倫茲曲線可以觀察、分析國家和地區(qū)收入分配的平均程度。3. 一組數(shù)據(jù)的分布特征可以從哪幾個方面進(jìn)行測度?答:數(shù)據(jù)分布特征一般可從集中趨勢、離散程度、偏態(tài)和峰度幾方面來測度。常用的指標(biāo)有均值、中位數(shù)、眾數(shù)、極差、方差、標(biāo)準(zhǔn)差、離散系

4、數(shù)、偏態(tài)系數(shù)和峰度系數(shù)。4 怎樣理解均值在統(tǒng)計中的地位?答:均值是對所有數(shù)據(jù)平均后計算的一般水平的代表值,數(shù)據(jù)信息提取得最充分,具有良好的數(shù)學(xué)性質(zhì),是數(shù)據(jù)誤差相互抵消后的客觀事物必然性數(shù)量特征的一種反映,在統(tǒng)計推斷中顯示出優(yōu)良特性,由此均值在統(tǒng)計中起到非常重要的基礎(chǔ)地位。受極端數(shù)值的影響是其使用時存在的問題。5 對比率數(shù)據(jù)的平均,為什么采用幾何平均?答:比率數(shù)據(jù)往往表現(xiàn)出連乘積為總比率的特征,不同于一般數(shù)據(jù)的和為總量的性質(zhì),由此需采用幾何平均。6. 簡述眾數(shù)、中位數(shù)和均值的特點和應(yīng)用場合。答:眾數(shù)、中位數(shù)和均值是分布集中趨勢的三個主要測度,眾數(shù)和中位數(shù)是從數(shù)據(jù)分布形狀及位置角度來考慮的,而均值

5、是對所有數(shù)據(jù)計算后得到的。眾數(shù)容易計算,但不是總是存在,應(yīng)用場合較少;中位數(shù)直觀,不受極端數(shù)據(jù)的影響,但數(shù)據(jù)信息利用不夠充分;均值數(shù)據(jù)提取的信息最充分,但受極端數(shù)據(jù)的影響。7 為什么要計算離散系數(shù)?答:在比較二組數(shù)據(jù)的差異程度時,由于方差和標(biāo)準(zhǔn)差受變量值水平和計量單位的影響不能直接比較,由此需計算離散系數(shù)作為比較的指標(biāo)。練習(xí)題:1. 頻數(shù)分布表如下:服務(wù)質(zhì)量等級評價的頻數(shù)分布服務(wù)質(zhì)量等級家庭數(shù)(頻率)頻率%A1414B2121C3232D1818E1515合計100100 條形圖(略)2 (1)采用等距分組:n=40 全距=152-88=64 取組距為10組數(shù)為 64/10=6.4 取6組 頻

6、數(shù)分布表如下:40個企業(yè)按產(chǎn)品銷售收入分組表按銷售收入分組(萬元)企業(yè)數(shù)(個)頻率(%)向上累積向下累積企業(yè)數(shù)頻率企業(yè)數(shù)頻率100以下100110110120120130130140140以上591274312.522.530.017.510.07.55142633374012.535.065.082.592.5100.04035261473100.087.565.035.017.57.5合計40100.0 (2) 某管理局下屬40個企分組表按銷售收入分組(萬元)企業(yè)數(shù)(個)頻率(%)先進(jìn)企業(yè)良好企業(yè)一般企業(yè)落后企業(yè)11119927.527.522.522.5合計40100.03 采用等距分組

7、全距=49-25=24n=40 取組距為5,則組數(shù)為 24/5=4.8 取5組頻數(shù)分布表:按銷售額分組(萬元)頻數(shù)(天數(shù)) 25-30 30-35 35-40 40-45 45-50461596 合計 404. (1)排序略。(2)頻數(shù)分布表如下: 100只燈泡使用壽命非頻數(shù)分布按使用壽命分組(小時)燈泡個數(shù)(只)頻率(%)650660226606705567068066680690141469070026267007101818710720131372073010107307403374075033合計100100 直方圖(略)。 (3)莖葉圖如下:651866145686713467968

8、1123334555889969001111222334455666778888997000112234566677888971002233567788972012256789973356741475 等距分組n=65 全距=9-(-25)=34 取組距為5,組數(shù)=34/5=6.8, 取 7組頻數(shù)分布表:按氣溫分組天數(shù)-25 - -20-20 - -15-15 - -10-10 - -5-5 - 00 - 55 - 108810141447合計657 (1)莖葉圖如下:A班樹莖B班數(shù)據(jù)個數(shù)樹 葉樹葉數(shù)據(jù)個數(shù)03592144044842975122456677789121197665332110

9、601123468892398877766555554443332100700113449876655200812334566632220901145660100003(3) A班考試成績的分布比較集中,且平均分?jǐn)?shù)較高;B班考試成績的分布比A班分散,且平均成績較A班低8. 箱線圖如下:(特征請讀者自己分析)9(1)=274.1(萬元);Me =272.5 ;QL=260.25;QU =291.25。(2)(萬元)。10甲企業(yè)平均成本19.41(元),乙企業(yè)平均成本18.29(元);原因:盡管兩個企業(yè)的單位成本相同,但單位成本較低的產(chǎn)品在乙企業(yè)的產(chǎn)量中所占比重較大,因此拉低了總平均成本。11=4

10、26.67(萬元);116.48(萬元)13(1)離散系數(shù),因為它消除了不同組數(shù)據(jù)水平高低的影響。 (2)成年組身高的離散系數(shù):; 幼兒組身高的離散系數(shù):; 由于幼兒組身高的離散系數(shù)大于成年組身高的離散系數(shù),說明幼兒組身高的離散程度相對較大。14 表給出了一些主要描述統(tǒng)計量方法A方法B方法C平均165.6平均128.73平均125.53中位數(shù)165中位數(shù)129中位數(shù)126眾數(shù)164眾數(shù)128眾數(shù)126標(biāo)準(zhǔn)偏差2.13標(biāo)準(zhǔn)偏差1.75標(biāo)準(zhǔn)偏差2.77極差8極差7極差12最小值162最小值125最小值116最大值170最大值132最大值128先考慮平均指標(biāo),在平均指標(biāo)相近時考慮離散程度指標(biāo)。應(yīng)選擇

11、方法A,其均值遠(yuǎn)高于其他兩種方法,同時離散程度與其他兩組相近。15(1)風(fēng)險的度量是一個不斷發(fā)展的問題,在古典金融理論中,主要采用標(biāo)準(zhǔn)差這個統(tǒng)計測度來反映,現(xiàn)代金融中,采用在險值(value at risk)。(2)無論采用何種風(fēng)險度量,商業(yè)類股票較?。?)個人對股票的選擇,與其風(fēng)險偏好等因素有關(guān)。第三章1.總體分布指某個變量在總體中各個個體上的取值所形成的分布,它是未知的,是統(tǒng)計推斷的對象。從總體中隨機抽取容量為n的樣本,它的分布稱為樣本分布。由樣本的某個函數(shù)所形成的統(tǒng)計量,它的分布稱為抽樣分布(如樣本均值、樣本方差的分布)2.重復(fù)抽樣和不重復(fù)抽樣下,樣本均值的標(biāo)準(zhǔn)差分別為: 因此不重復(fù)抽樣

12、下的標(biāo)準(zhǔn)差小于重復(fù)抽樣下的標(biāo)準(zhǔn)差,兩者相差一個調(diào)整系數(shù)3.解釋中心極限定理的含義答:在抽樣推斷中,中心極限定理指出,不論總體服從何種分布,只要其數(shù)學(xué)期望和方差存在,對總體進(jìn)行重復(fù)抽樣時,當(dāng)樣本容量充分大,樣本均值趨近于正態(tài)分布。中心極限定理為均值的抽樣推斷奠定了理論基礎(chǔ)。第四章、參數(shù)估計1 簡述評價估計量好壞的標(biāo)準(zhǔn)答:評價估計量好壞的標(biāo)準(zhǔn)主要有:無偏性、有效性和相合性。設(shè)總體參數(shù)的估計量有和,如果,稱是無偏估計量;如果和是無偏估計量,且小于,則比更有效;如果當(dāng)樣本容量,則是相合估計量。2.說明區(qū)間估計的基本原理答:總體參數(shù)的區(qū)間估計是在一定的置信水平下,根據(jù)樣本統(tǒng)計量的抽樣分布計算出用樣本統(tǒng)計

13、量加減抽樣誤差表示的估計區(qū)間,使該區(qū)間包含總體參數(shù)的概率為置信水平。置信水平反映估計的可信度,而區(qū)間的長度反映估計的精確度。3解釋置信水平為95的置信區(qū)間的含義答:總體參數(shù)是固定的,未知的,置信區(qū)間是一個隨機區(qū)間。置信水平為95的置信區(qū)間的含義是指,在相同條件下多次抽樣下,在所有構(gòu)造的置信區(qū)間里大約有95包含總體參數(shù)的真值。4簡述樣本容量與置信水平、總體方差、允許誤差的關(guān)系答:以估計總體均值時樣本容量的確定公式為例:樣本容量與置信水平成正比、與總體方差成正比、與允許誤差成反比。練習(xí)題:2. 解:由題意:樣本容量為(1) 若(2)(3) 若3.解:由題可得:盡管采用不重復(fù)抽樣,但因為樣本比例很小

14、(不到0.5%),其抽樣誤差與重復(fù)抽樣下近似相同,采用重復(fù)抽樣的抽樣誤差公式來計算。為大樣本,則在的顯著性水平下的置信區(qū)間為: 當(dāng),置信區(qū)間為(2.88,3.76)當(dāng),置信區(qū)間為(2.80,3.84)當(dāng),置信區(qū)間為(2.63,4.01)5解:假設(shè)距離服從正態(tài)分布,平均距離的95的置信區(qū)間為(7.18,11.57)7解:由題意:。因為均超過5,大樣本(1)總體中贊成比率的顯著性水平為的置信區(qū)間為當(dāng)時,置信區(qū)間為(50.7%,77.3%)(2)如果要求允許誤差不超過10,置信水平為95,則應(yīng)抽取的戶數(shù): 8.此題需先檢驗兩總體的方差是否相等: 在5%的顯著性水平下,,不拒絕原假設(shè)認(rèn)為兩總體方差是相

15、同的。(1)即(1.93,17.669)(2)即(0.27,19.32)11.大樣本的情況 (1)90%置信度下(3.021%,16.979)(2)95%置信度下(1.684%,18.316%)12解:由題可計算:兩個總體方差比在95的置信區(qū)間為:14解:由題意:則必須抽取的顧客數(shù)為:第五章、假設(shè)檢驗思考題11理解原假設(shè)與備擇假設(shè)的含義,并歸納常見的幾種建立原假設(shè)與備擇假設(shè)的原則.答:原假設(shè)通常是研究者想收集證據(jù)予以反對的假設(shè);而備擇假設(shè)通常是研究者想收集證據(jù)予以支持的假設(shè)。建立兩個假設(shè)的原則有:(1)原假設(shè)和備擇假設(shè)是一個完備事件組。(2)一般先確定備擇假設(shè)。再確定原假設(shè)。(3)等號“”總是

16、放在原假設(shè)上。(4)假設(shè)的確定帶有一定的主觀色彩。(5)假設(shè)檢驗的目的主要是收集證據(jù)來拒絕原假設(shè)。2第一類錯誤和第二類錯誤分別是指什么?它們發(fā)生的概率大小之間存在怎樣的關(guān)系?答:第I類錯誤指,當(dāng)原假設(shè)為真時,作出拒絕原假設(shè)所犯的錯誤,其概率為。第II類錯誤指當(dāng)原假設(shè)為假時,作出接受原假設(shè)所犯的錯誤,其概率為。在其他條件不變時,增大,減小;增大,減小。3什么是顯著性水平?它對于假設(shè)檢驗決策的意義是什么?答:假設(shè)檢驗中犯第一類錯誤的概率被稱為顯著性水平。顯著性水平通常是人們事先給出的一個值,用于檢驗結(jié)果的可靠性度量,但確定了顯著性水平等于控制了犯第一錯誤的概率,但犯第二類錯誤的概率卻是不確定的,因

17、此作出“拒絕原假設(shè)”的結(jié)論,其可靠性是確定的,但作出“不拒絕原假設(shè)”的結(jié)論,其可靠性是難以控制的。4什么是p值?p值檢驗和統(tǒng)計量檢驗有什么不同?答:p值是當(dāng)原假設(shè)為真時,檢驗統(tǒng)計量小于或等于根據(jù)實際觀測樣本數(shù)據(jù)計算得到的檢驗統(tǒng)計量值的概率。P值常常作為觀察到的數(shù)據(jù)與原假設(shè)不一致程度的度量。統(tǒng)計量檢驗采用事先確定顯著性水平,來控制犯第一類錯誤的上限,p值可以有效地補充提供地關(guān)于檢驗可靠性的有限信息。值檢驗的優(yōu)點在于,它提供了更多的信息,讓人們可以選擇一定的水平來評估結(jié)果是否具有統(tǒng)計上的顯著性。5什么是統(tǒng)計上的顯著性?答:一項檢驗在統(tǒng)計上是顯著的(拒絕原假設(shè)),是指這樣的(樣本)結(jié)果不是偶然得到的

18、,或者說,不是靠機遇能夠得到的。顯著性的意義在于“非偶然的練習(xí)題3解(1)第一類錯誤是,供應(yīng)商提供的炸土豆片的平均重量不低于60克,但店方拒收并投訴。 (2)第二類錯誤是,供應(yīng)商提供的炸土豆片的平均重量低于60克,但店方?jīng)]有拒收。 (3)顧客會認(rèn)為第二類錯誤很嚴(yán)重,而供應(yīng)商會將第一類錯誤看得較嚴(yán)重。4解:提出假設(shè) 已知 (1) 檢驗統(tǒng)計量為(2) 拒絕規(guī)則是:若,拒絕;否則,不拒絕(3) 由得:,拒絕,認(rèn)為改進(jìn)工藝能提高其平均強度。5解: 設(shè)為如今每個家庭每天收看電視的平均時間(小時)需檢驗的假設(shè)為:調(diào)查的樣本為:大樣本下檢驗統(tǒng)計量為:在0.01的顯著性水平下,右側(cè)檢驗的臨界值為因為,拒絕,可

19、認(rèn)為如今每個家庭每天收看電視的平均時間增加了6. 解:提出假設(shè) 已知:檢驗統(tǒng)計量 拒絕,可判定電視使用壽命的方差顯著大于VCR7. 解:提出假設(shè): ,獨立大樣本,則檢驗統(tǒng)計量為: 而2.33 因為,拒絕,平均裝配時間之差不等于5分鐘8. 解:匹配小樣本 提出假設(shè): 由計算得:,檢驗統(tǒng)計量為,不拒絕,不能認(rèn)為廣告提高了潛在購買力的平均得分。9. 解:提出假設(shè): 已知: 大樣本,則檢驗統(tǒng)計量為: 而,因為,拒絕,可認(rèn)為信息追求者消極度假的比率顯著小于非信息追求者。10. 解:提出假設(shè): 由題計算得: 檢驗統(tǒng)計量為:,而 ,所以拒絕,認(rèn)為兩種機器的方差存在顯著差異。第七章 相關(guān)與回歸分析思考題1 相

20、關(guān)分析與回歸分析的區(qū)別與聯(lián)系是什么?答:相關(guān)與回歸分析是研究變量之間不確定性統(tǒng)計關(guān)系的重要方法,相關(guān)分析主要是判斷兩個或兩個以上變量之間是否存在相關(guān)關(guān)系,并分析變量間相關(guān)關(guān)系的形態(tài)和程度?;貧w分析主要是對存在相關(guān)關(guān)系的現(xiàn)象間數(shù)量變化的規(guī)律性作出測度。但它們在研究目的和對變量的處理上有明顯區(qū)別。它們均是統(tǒng)計方法,不能揭示現(xiàn)象之間的本質(zhì)關(guān)系。3.什么是總體回歸函數(shù)和樣本回歸函數(shù)?它們之間的區(qū)別是什么?答:以簡單線性回歸模型為例,總體回歸函數(shù)是總體因變量的條件期望表現(xiàn)為自變量的函數(shù):,或??傮w回歸函數(shù)是確定的和未知的,是回歸分析所估計的對象。樣本回歸函數(shù)是根據(jù)樣本數(shù)據(jù)所估計出的因變量與自變量之間的函

21、數(shù)關(guān)系:或?;貧w分析的目的是用樣本回歸函數(shù)來估計總體回歸函數(shù)。它們的區(qū)別在于,總體回歸函數(shù)是未知但是確定的,而樣本回歸函數(shù)是隨樣本波動而變化;總體回歸函數(shù)的參數(shù)是確定的,而樣本回歸函數(shù)的系數(shù)是隨機變量;總體回歸函數(shù)中的誤差項不可觀察的,而樣本回歸函數(shù)中的殘差項是可以觀察的。4. 什么是隨機誤差項和殘差?它們之間的區(qū)別是什么?答:隨機誤差項表示自變量之外其他變量的對因變量產(chǎn)生的影響,是不可觀察的,通常要對其給出一定的假設(shè)。殘差項指因變量實際觀察值與樣本回歸函數(shù)計算的估計值之間的偏差,是可以觀測的。它們的區(qū)別在于,反映的含義是不同且可觀察性也不同,它們的聯(lián)系可有下式:5.為什么在對參數(shù)進(jìn)行最小二乘

22、估計時,要對模型提出一些基本的假定?答:最小二乘法只是尋找估計量的一種方法,其尋找到的估計量是否具有良好的性質(zhì)則依賴模型的一些基本的假定。只有在一系列的經(jīng)典假定下,最小二乘估計量才是BLUE。15. 為什么在多元回歸中要對可決系數(shù)進(jìn)行修正?答:在樣本容量一定下,隨著模型中自變量個數(shù)的增加,可決系數(shù)會隨之增加,模型的擬合程度上升,但自由度會損失,從而降低推斷的精度,因此需要用自由度來修正可決系數(shù),用修正的可決系數(shù)來判斷增加自變量的合適性。16在多元線性回歸中,對參數(shù)作了t檢驗后為什么還要作方差分析和F檢驗?答:t檢驗僅是對單個系數(shù)的顯著性進(jìn)行檢驗,由于自變量之間存在著較為復(fù)雜的關(guān)系,因此有必要對回歸系數(shù)進(jìn)行整體檢驗,方差分析和F檢驗就是對回歸方程的整體統(tǒng)計顯著性進(jìn)行的檢驗方法。練習(xí)題1. 解:設(shè)簡單

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論