統(tǒng)計學(第五版)賈俊平-課后思考題和練習題答案(完整版)_第1頁
統(tǒng)計學(第五版)賈俊平-課后思考題和練習題答案(完整版)_第2頁
統(tǒng)計學(第五版)賈俊平-課后思考題和練習題答案(完整版)_第3頁
統(tǒng)計學(第五版)賈俊平-課后思考題和練習題答案(完整版)_第4頁
統(tǒng)計學(第五版)賈俊平-課后思考題和練習題答案(完整版)_第5頁
已閱讀5頁,還剩92頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、統(tǒng)計學(第五版)賈俊平 課后思考題和練習題答案(最終完整版)第一部分 思考題第一章思考題1.1什么是統(tǒng)計學統(tǒng)計學是關(guān)于數(shù)據(jù)的一門學科,它收集,處理,分析,解釋來自各個領(lǐng)域的數(shù)據(jù)并從中得出結(jié)論。1.2解釋描述統(tǒng)計和推斷統(tǒng)計描述統(tǒng)計;它研究的是數(shù)據(jù)收集,處理,匯總,圖表描述,概括與分析等統(tǒng)計方法。推斷統(tǒng)計;它是研究如何利用樣本數(shù)據(jù)來推斷總體特征的統(tǒng)計方法。1.3統(tǒng)計學的類型和不同類型的特點統(tǒng)計數(shù)據(jù);按所采用的計量尺度不同分;(定性數(shù)據(jù))分類數(shù)據(jù):只能歸于某一類別的非數(shù)字型數(shù)據(jù),它是對事物進行分類的結(jié)果,數(shù)據(jù)表現(xiàn)為類別,用文字來表述;(定性數(shù)據(jù))順序數(shù)據(jù):只能歸于某一有序類別的非數(shù)字型數(shù)據(jù)。它也是有

2、類別的,但這些類別是有序的。(定量數(shù)據(jù))數(shù)值型數(shù)據(jù):按數(shù)字尺度測量的觀察值,其結(jié)果表現(xiàn)為具體的數(shù)值。 統(tǒng)計數(shù)據(jù);按統(tǒng)計數(shù)據(jù)都收集方法分;觀測數(shù)據(jù):是通過調(diào)查或觀測而收集到的數(shù)據(jù),這類數(shù)據(jù)是在沒有對事物人為控制的條件下得到的。實驗數(shù)據(jù):在實驗中控制實驗對象而收集到的數(shù)據(jù)。統(tǒng)計數(shù)據(jù);按被描述的現(xiàn)象與實踐的關(guān)系分;截面數(shù)據(jù):在相同或相似的時間點收集到的數(shù)據(jù),也叫靜態(tài)數(shù)據(jù)。時間序列數(shù)據(jù):按時間順序收集到的,用于描述現(xiàn)象隨時間變化的情況,也叫動態(tài)數(shù)據(jù)。1.4解釋分類數(shù)據(jù),順序數(shù)據(jù)和數(shù)值型數(shù)據(jù)答案同1.31.5舉例說明總體,樣本,參數(shù),統(tǒng)計量,變量這幾個概念對一千燈泡進行壽命測試,那么這千個燈泡就是總體,

3、從中抽取一百個進行檢測,這一百個燈泡的集合就是樣本,這一千個燈泡的壽命的平均值和標準差還有合格率等描述特征的數(shù)值就是參數(shù),這一百個燈泡的壽命的平均值和標準差還有合格率等描述特征的數(shù)值就是統(tǒng)計量,變量就是說明現(xiàn)象某種特征的概念,比如說燈泡的壽命。1.6變量的分類變量可以分為分類變量,順序變量,數(shù)值型變量。變量也可以分為隨機變量和非隨機變量。經(jīng)驗變量和理論變量。1.7舉例說明離散型變量和連續(xù)性變量離散型變量,只能取有限個值,取值以整數(shù)位斷開,比如“企業(yè)數(shù)”連續(xù)型變量,取之連續(xù)不斷,不能一一列舉,比如“溫度”。1.8統(tǒng)計應(yīng)用實例人口普查,商場的名意調(diào)查等。1.9統(tǒng)計應(yīng)用的領(lǐng)域經(jīng)濟分析和政府分析還有物

4、理,生物等等各個領(lǐng)域。第二章思考題2.1什么是二手資料?使用二手資料應(yīng)注意什么問題與研究內(nèi)容有關(guān),由別人調(diào)查和試驗而來已經(jīng)存在,并會被我們利用的資料為“二手資料”。使用時要進行評估,要考慮到資料的原始收集人,收集目的,收集途徑,收集時間使用時要注明數(shù)據(jù)來源。2.2比較概率抽樣和非概率抽樣的特點,指出各自適用情況概率抽樣:抽樣時按一定的概率以隨機原則抽取樣本。每個單位別抽中的概率已知或可以計算,當用樣本對總體目標量進行估計時,要考慮到每個單位樣本被抽到的概率。技術(shù)含量和成本都比較高。如果調(diào)查目的在于掌握和研究對象總體的數(shù)量特征,得到總體參數(shù)的置信區(qū)間,就使用概率抽樣。非概率抽樣:操作簡單,時效快

5、,成本低,而且對于抽樣中的統(tǒng)計學專業(yè)技術(shù)要求不是很高。它適合探索性的研究,調(diào)查結(jié)果用于發(fā)現(xiàn)問題,為更深入的數(shù)量分析提供準備。它同樣使用市場調(diào)查中的概念測試(不需要調(diào)查結(jié)果投影到總體的情況)。2.3除了自填式,面訪式和電話式還有什么搜集數(shù)據(jù)的辦法試驗式和觀察式等2.4自填式,面訪式和電話式各自的長處和弱點自填式;優(yōu)點:1調(diào)查組織者管理容易2成本低,可進行大規(guī)模調(diào)查3對被調(diào)查者,可選擇方便時間答卷,減少回答敏感問題壓力。缺點:1返回率低2不適合結(jié)構(gòu)復雜的問卷,調(diào)查內(nèi)容有限3調(diào)查周期長4在數(shù)據(jù)搜集過程中遇見問題不能及時調(diào)整。面訪式;優(yōu)點:1回答率高2數(shù)據(jù)質(zhì)量高3在調(diào)查過程中遇見問題可以及時調(diào)整。缺點

6、:1成本比較高2搜集數(shù)據(jù)的方式對調(diào)查過程的質(zhì)量控制有一定難度3對于敏感問題,被訪者會有壓力。電話式;優(yōu)點:1速度快2對調(diào)查員比較安全3對訪問過程的控制比較容易。缺點:1實施地區(qū)有限2調(diào)查時間不能過長3使用的問卷要簡單4被訪者不愿回答時,不易勸服。2.5老師說這個內(nèi)容不講,應(yīng)該不會考實驗數(shù)據(jù)的2.6如何控制調(diào)查中的回答誤差對于理解誤差,我會去學習一定的心理學知識,對于記憶誤差,我會盡量去縮短所涉及的時間范圍,對于有意識的誤差,我要做好被調(diào)查者的心理工作,要遵守職業(yè)道德,為被調(diào)查者保密,盡量在問卷中不涉及敏感問題。2.7怎么減少無回答對于隨機誤差,要提高樣本容量,對于系統(tǒng)誤差,只有做好準備工作并做

7、好補救措施。比如說要一百份的問卷回復,就要做好一百二十到一百三十的問卷準備,進行面訪式的時候要盡量的勸服不愿意回答的被訪者,以小物品的饋贈提高回復率。第三章思考題3.1數(shù)據(jù)預(yù)處理內(nèi)容數(shù)據(jù)審核(完整性和準確性;適用性和實效性),數(shù)據(jù)篩選和數(shù)據(jù)排序。3.2分類數(shù)據(jù)和順序數(shù)據(jù)的整理和圖示方法各有哪些分類數(shù)據(jù):制作頻數(shù)分布表,用比例,百分比,比率等進行描述性分析??捎脳l形圖,帕累托圖和餅圖進行圖示分析。順序數(shù)據(jù):制作頻數(shù)分布表,用比例,百分比,比率。累計頻數(shù)和累計頻率等進行描述性分析??捎脳l形圖,帕累托圖和餅圖,累計頻數(shù)分布圖和環(huán)形圖進行圖示分析。3.3數(shù)據(jù)型數(shù)據(jù)的分組方法和步驟分組方法:單變量值分組

8、和組距分組,組距分組又分為等距分組和異距分組。分組步驟:1確定組數(shù)2確定各組組距3根據(jù)分組整理成頻數(shù)分布表3.4直方圖和條形圖的區(qū)別1條形圖使用圖形的長度表示各類別頻數(shù)的多少,其寬度固定,直方圖用面積表示各組頻數(shù),矩形的高度表示每一組的頻數(shù)或頻率,寬度表示組距,2直方圖各矩形連續(xù)排列,條形圖分開排列,3條形圖主要展示分類數(shù)據(jù),直方圖主要展示數(shù)值型數(shù)據(jù)。3.5繪制線圖應(yīng)注意問題時間在橫軸,觀測值繪在縱軸。一般是長寬比例10:7的長方形,縱軸下端一般從0開始,數(shù)據(jù)與0距離過大的話用折斷符號折斷。3.6餅圖和環(huán)形圖的不同餅圖只能顯示一個樣本或總體各部分所占比例,環(huán)形圖可以同時繪制多個樣本或總體的數(shù)據(jù)

9、系列,其圖形中間有個“空洞”,每個樣本或總體的數(shù)據(jù)系類為一個環(huán)。3.7莖葉圖比直方圖的優(yōu)勢,他們各自的應(yīng)用場合莖葉圖既能給出數(shù)據(jù)的分布情況,又能給出每一個原始數(shù)據(jù),即保留了原始數(shù)據(jù)的信息。在應(yīng)用方面,直方圖通常適用于大批量數(shù)據(jù),莖葉圖適用于小批量數(shù)據(jù)。3.8鑒別圖標優(yōu)劣的準則P75明確有答案,我就不寫了。3.9制作統(tǒng)計表應(yīng)注意的問題1,合理安排統(tǒng)計表結(jié)構(gòu)2表頭一般包括表號,總標題和表中數(shù)據(jù)的單位等內(nèi)容3表中的上下兩條橫線一般用粗線,中間的其他用細線4在使用統(tǒng)計表時,必要時可在下方加注釋,注明數(shù)據(jù)來源。公式:組中值=(上限+下限)/2第4章 數(shù)據(jù)的概括性度量4.1一組數(shù)據(jù)的分布特征可以從哪幾個方

10、面進行測度?數(shù)據(jù)分布特征可以從三個方面進行測度和描述:一是分布的集中趨勢,反映各數(shù)據(jù)向其中心值靠攏或集中的程度;二是分布的離散程度,反映各數(shù)據(jù)遠離其中心值的趨勢;三是分布的形狀,反映數(shù)據(jù)分布的偏態(tài)和峰態(tài)。4.2怎樣理解平均數(shù)在統(tǒng)計學中的地位? 平均數(shù)在統(tǒng)計學中具有重要的地位,是集中趨勢的最主要的測度,主要適用于數(shù)值型數(shù)據(jù),而不適用于分類數(shù)據(jù)和順序數(shù)據(jù)。4.3簡述四分位數(shù)的計算方法。 四分位數(shù)是一組數(shù)據(jù)排序后處于25%和75%位置上的值。根據(jù)未分組數(shù)據(jù)計算四分位數(shù)時,首先對數(shù)據(jù)進行排序,然后確定四分位數(shù)所在的位置,該位置上的數(shù)值就是四分位數(shù)。4.4對于比率數(shù)據(jù)的平均為什么采用幾何平均? 在實際應(yīng)

11、用中,對于比率數(shù)據(jù)的平均采用幾何平均要比算數(shù)平均更合理。從公式中也可看出,G就是平均增長率。4.5簡述眾數(shù)、中位數(shù)和平均數(shù)的特點和應(yīng)用場合。 眾數(shù)是一組數(shù)據(jù)分布的峰值,不受極端值的影響,缺點是具有不唯一性。眾數(shù)只有在數(shù)據(jù)量較多時才有意義,數(shù)據(jù)量較少時不宜使用。主要適合作為分類數(shù)據(jù)的集中趨勢測度值。中位數(shù)是一組數(shù)據(jù)中間位置上的代表值,不受極端值的影響。當數(shù)據(jù)的分布偏斜較大時,使用中位數(shù)也許不錯。主要適合作為順序數(shù)據(jù)的集中趨勢測度值。平均數(shù)對數(shù)值型數(shù)據(jù)計算的,而且利用了全部數(shù)據(jù)信息,在實際應(yīng)用中最廣泛。當數(shù)據(jù)呈對稱分布或近似對稱分布時,三個代表值相等或相近,此時應(yīng)選擇平均數(shù)。但平均數(shù)易受極端值的影

12、響,對于偏態(tài)分布的數(shù)據(jù),平均數(shù)的代表性較差,此時應(yīng)考慮中位數(shù)或眾數(shù)。4.6簡述異眾比率、四分位差、方差或標準差的適用場合 對于分類數(shù)據(jù),主要用異眾比率來測量其離散程度;對于順序數(shù)據(jù),雖然也可以計算異眾比率,但主要使用四分位差來測量其離散程度;對于數(shù)值型數(shù)據(jù),雖然可以計算異眾比率和四分位差,但主要使用方差或標準差來測量其離散程度。4.7標準分數(shù)有哪些用途? 標準分數(shù)給出了一組數(shù)據(jù)中各數(shù)值的相對位置。在對多個具有不同量綱的變量進行處理時,常需要對各變量進行標準化處理。它還可以用來判斷一組數(shù)據(jù)是否有離群數(shù)據(jù)。4.8為什么要計算離散系數(shù)? 方差和標準差是反映數(shù)據(jù)分散程度的絕對值,一方面其數(shù)值大小受原變

13、量值本身水平高低的影響,也就是與變量的平均數(shù)大小有關(guān);另一方面,它們與原變量的計量單位相同,采用不同計量單位的變量值,其離散程度的測度值也就不同。因此,為消除變量值水平高低和計量單位不同對離散程度測度值的影響,需要計算離散系數(shù)。4.9測度數(shù)據(jù)分布形狀的統(tǒng)計量有哪些?對分布形狀的測度有偏態(tài)和峰態(tài),測度偏態(tài)的統(tǒng)計量是偏態(tài)系數(shù),測度峰態(tài)的統(tǒng)計量是峰態(tài)系數(shù)。第5章 概率與概率分布5.1頻率與概率有什么關(guān)系? 在相同條件下隨機試驗n次,某事件A出現(xiàn)m次,則比值m/n稱為事件A發(fā)生的頻率。隨著n的增大,該頻率圍繞某一常數(shù)p波動,且波動幅度逐漸減小,趨于穩(wěn)定,這個頻率的穩(wěn)定值即為該事件的概率。5.2獨立性與

14、互斥性有什么關(guān)系?互斥事件一定是相互依賴(不獨立)的,但相互依賴的事件不一定是互斥的。不互斥事件可能是獨立的,也可能是不獨立的,但獨立事件不可能是互斥的。5.3根據(jù)自己的經(jīng)驗體會舉幾個服從泊松分布的隨機變量的實例。 如某種儀器每月出現(xiàn)故障的次數(shù)、一本書一頁中的印刷錯誤、某一醫(yī)院在某一天內(nèi)的急診病人數(shù)等5.4根據(jù)自己的經(jīng)驗體會舉幾個服從正態(tài)分布的隨機變量的實例。 如某班某次的考試成績、某地區(qū)成年男性的身高、某公司年銷售量、同一車間產(chǎn)品的質(zhì)量等第六章思考題6.1 統(tǒng)計量:設(shè)X1,X2,Xn是從總體X中抽取的容量為n的一個樣本,如果由此樣本構(gòu)造一個函數(shù)T(X1,X2,Xn),不依賴于任何未知參數(shù),則

15、稱函數(shù)T(X1,X2,Xn)是一個統(tǒng)計量。原因:為了使統(tǒng)計推斷成為可能。6.2 T1和T2是6.3 P1596.4 統(tǒng)計量加工過程中一點信息都不損失的統(tǒng)計量為充分統(tǒng)計量6.5 自由度:獨立變量的個數(shù)6.6 c2分布:設(shè) ,則 F分布:設(shè)若U為服從自由度為n1的c2分布,即Uc2(n1),V為服從自由度為n2的c2分布,即Vc2(n2),且U和V相互獨立,則 稱F為服從自由度n1和n2的F分布,記為6.7 抽樣分布:樣本統(tǒng)計量的概率分布是一種理論概率分布隨機變量是 樣本統(tǒng)計量 6.8 中心極限定理:設(shè)從均值為m,方差為s 2的一個任意總體中抽取容量為n的樣本,當n充分大時,樣本均值的抽樣分布近似

16、服從均值為、方差為2/n的正態(tài)分布第七章思考題7.1 估計量:用于估計總體參數(shù)的隨機變量 估計值:估計參數(shù)時計算出來的統(tǒng)計量的具體值7.2 評價估計量的標準: 無偏性:估計量抽樣分布的數(shù)學期望等于被估計的總體參數(shù) 有效性:對同一總體參數(shù)的兩個無偏點估計量 ,有更小標準差的估計量更有效 一致性:隨著樣本容量的增大,估計量的 值越來越接近被估計的總體參數(shù)7.3 置信區(qū)間:由樣本統(tǒng)計量所構(gòu)造的總體參數(shù)的估計區(qū)間7.4 95%的置信區(qū)間指用某種方法構(gòu)造的所有區(qū)間中有95%的區(qū)間包含總體參數(shù)的真值。7.5 含義:Za/2是標準正態(tài)分布上側(cè)面積為a/2的z值,公式是統(tǒng)計總體均值時的邊際誤差。7.6 獨立樣

17、本:如果兩個樣本是從兩個總體中獨立抽取的,即一個樣本中的元素與另一個樣本中的元素相互獨立。 匹配樣本:一個樣本中的數(shù)據(jù)與另一個樣本中的數(shù)據(jù)相對應(yīng)。7.7 (1)、兩個總體都服從正態(tài)分布 (2)、兩個隨即樣本獨立地分別抽自兩個總體 7.8 樣本量越大置信水平越高,總體方差和邊際誤差越小第8章思考題8.1假設(shè)檢驗和參數(shù)估計有什么相同點和不同點?答:參數(shù)估計和假設(shè)檢驗是統(tǒng)計推斷的兩個組成部分,它們都是利用樣本對總體進行某種推斷,然而推斷的角度不同。參數(shù)估計討論的是用樣本統(tǒng)計量估計總體參數(shù)的方法,總體參數(shù)在估計前是未知的。而在參數(shù)假設(shè)檢驗中,則是先對的值提出一個假設(shè),然后利用樣本信息去檢驗這個假設(shè)是否

18、成立。8.2什么是假設(shè)檢驗中的顯著性水平?統(tǒng)計顯著是什么意思?答:顯著性水平是一個統(tǒng)計專有名詞,在假設(shè)檢驗中,它的含義是當原假設(shè)正確時卻被拒絕的概率和風險。統(tǒng)計顯著等價拒絕H0,指求出的值落在小概率的區(qū)間上,一般是落在0.05或比0.05更小的顯著水平上。8.3什么是假設(shè)檢驗中的兩類錯誤?答:假設(shè)檢驗的結(jié)果可能是錯誤的,所犯的錯誤有兩種類型,一類錯誤是原假設(shè)H0為真卻被我們拒絕了,犯這種錯誤的概率用表示,所以也稱錯誤或棄真錯誤;另一類錯誤是原假設(shè)為偽我們卻沒有拒絕,犯這種錯誤的概論用表示,所以也稱錯誤或取偽錯誤。8.4兩類錯誤之間存在什么樣的數(shù)量關(guān)系?答:在假設(shè)檢驗中,與是此消彼長的關(guān)系。如果

19、減小錯誤,就會增大犯錯誤的機會,若減小錯誤,也會增大犯錯誤的機會。8.5解釋假設(shè)檢驗中的P值答:P值就是當原假設(shè)為真時所得到的樣本觀察結(jié)果或更極端結(jié)果出現(xiàn)的概率。(它的大小取決于三個因素,一個是樣本數(shù)據(jù)與原假設(shè)之間的差異,一個是樣本量,再一個是被假設(shè)參數(shù)的總體分布。)8.6顯著性水平與P值有何區(qū)別答:顯著性水平是原假設(shè)為真時,拒絕原假設(shè)的概率,是一個概率值,被稱為抽樣分布的拒絕域,大小由研究者事先確定,一般為0.05。而P只是原假設(shè)為真時所得到的樣本觀察結(jié)果或更極端結(jié)果出現(xiàn)的概率,被稱為觀察到的(或?qū)崪y的)顯著性水平8.7假設(shè)檢驗依據(jù)的基本原理是什么?答:假設(shè)檢驗依據(jù)的基本原理是“小概率原理”

20、,即發(fā)生概率很小的隨機事件在一次試驗中是幾乎不可能發(fā)生的。根據(jù)這一原理,可以作出是否拒絕原假設(shè)的決定。8.8你認為單側(cè)檢驗中原假設(shè)與備擇假設(shè)的方向如何確定?答:將研究者想收集證據(jù)予以支持的假設(shè)作為備擇假設(shè)H1,將研究者想收集證據(jù)證明其不正確的假設(shè)作為原假設(shè)H0,先確立備擇假設(shè)H1,備擇假設(shè)的方向與想要證明其正確性的方向一致,原假設(shè)與備擇假設(shè)是互斥的,等號總在原假設(shè)上。(舉例說明,如下:“一項研究表明,采用新技術(shù)生產(chǎn)后,將會使產(chǎn)品的使用壽命明顯延長到1500小時以上。檢驗這一結(jié)論是否成立”,則備擇假設(shè)的方向為“>”(壽命延長),建立的原假設(shè)與備擇假設(shè)應(yīng)為H0:1500,H1:1500.又例

21、,“一項研究表明,改進生產(chǎn)工藝后,會使產(chǎn)品的廢品率降低到2%以下。檢驗這一結(jié)論是否成立”,則備擇假設(shè)的方向為“<”(廢品率降低),建立的原假設(shè)與備擇假設(shè)應(yīng)為H0: 2% ,H1: < 2%.)第10章思考題10.1什么是方差分析?它研究的是什么?答:方差分析就是通過檢驗各總體的均值是否相等來判斷分類型自變量對數(shù)值型因變量是否有顯著影響。它所研究的是非類型自變量對數(shù)值型因變量的影響。10.2要檢驗多個總體均值是否相等時,為什么不作兩兩比較,而用方差分析方法?答:作兩兩比較十分繁瑣,進行檢驗的次數(shù)較多,隨著增加個體顯著性檢驗的次數(shù),偶然因素導致差別的可能性也會增加。而方差分析方法則是同

22、時考慮所有的樣本,因此排除了錯誤累積的概率,從而避免拒絕一個真實的原假設(shè)。10.3方差分析包括哪些類型?它們有何區(qū)別?答:方差分析可分為單因素方差分析和雙因素方差分析。區(qū)別:單因素方差分析研究的是一個分類型自變量對一個數(shù)值型因變量的影響,而雙因素涉及兩個分類型自變量。10.4方差分析中有哪些基本假定?答:方差分析中有三個基本假定:(1) 每個總體都應(yīng)服從正態(tài)分布(2) 各個總體的方差2必須相同(3) 觀測值是獨立的10.5簡述方差分析的基本思想。答: 它是通過對數(shù)據(jù)誤差來源的分析來判斷不同總體的均值是否相等,進而分析自變量對因變量是否有顯著影響。10.6解釋因子與處理的含義。答:在方差分析中,

23、所要檢驗的對象稱為因素或因子,因素的不同表現(xiàn)稱為水平或處理。10.7解釋組內(nèi)誤差和組間誤差的含義。答:組內(nèi)誤差(SSE)是指每個水平或組的個樣本數(shù)據(jù)與其組平均值誤差的平方和,反映了每個樣本各觀測值的離散狀況;組間誤差(SSA)是指各組平均值i與總平均值的誤差平方和,反映各樣本均值之間的差異程度。10.8解釋組內(nèi)方差和組間方差的含義。答:組內(nèi)方差指因素的同一水平(同一個總體)下樣本數(shù)據(jù)的方差,組間方差指因素的不同水平(不同總體)下各樣本之間的方差。10.9簡述方差分析的基本步驟。答:(1)提出假設(shè)(一般提法形式如下:H0:1=2=3=i=.k,自變量對因變量沒有顯著影響, H1:i (i=1,2

24、,3.,k)不全相等,自變量對因變量有顯著影響)(2)構(gòu)造檢驗統(tǒng)計量(包括:計算各樣本的均值,計算全部觀測值的總均值,計算各誤差平方和,計算統(tǒng)計量)(3)統(tǒng)計決策。(將統(tǒng)計量的值F與給定的顯著性水平a的臨界值Fa進行比較,作出對原假設(shè)H0的決策)10.10方差分析中多重比較的作用是什么?答:通過對總體均值之間的配對比較來進一步檢驗到底哪些均值之間存在差異。10.11什么是交互作用?答:交互作用是指幾個因素搭配在一起會對因變量產(chǎn)生一種新的效應(yīng)的作用。10.12解釋無交互作用和有交互作用的雙因素方差分析。答:在雙因素方差分析中,如果兩個因素對試驗結(jié)果的影響是相互獨立的,分別判斷行因素和列因素對試驗

25、數(shù)據(jù)的影響,這時的雙因素方差分析稱為無交互作用的雙因素方差分析或無重復雙因素方差分析;如果除了行因素和列因素對試驗數(shù)據(jù)的單獨影響外,兩個因素的搭配還會對結(jié)果產(chǎn)生一種新的影響,這時的雙因素方差分析稱為有交互作用的雙因素方差分析或可重復雙因素方差分析。10.13解釋R2的含義和作用。答:自變量平方和占總平方和的比例記為R2 ,即作用:其平方根R就可以用來測量兩個變量之間的關(guān)系強度。10.14解釋試驗、試驗設(shè)計、試驗單元的含義。答:試驗是指收集樣本數(shù)據(jù)的過程。試驗設(shè)計是指收集樣本數(shù)據(jù)的計劃。試驗單元是指接受“處理”的對象或?qū)嶓w(“處理”指可控制的因素的各個水平)10.15簡述完全隨機化設(shè)計、隨機化區(qū)

26、組設(shè)計、因子設(shè)計的含義和區(qū)別。答:完全隨機化設(shè)計是將k種“處理”隨機地指派給試驗單元的設(shè)計。隨機化區(qū)組設(shè)計是先按一定規(guī)則將試驗單元劃分為若干同質(zhì)組,稱為“區(qū)組”,然后再將各種處理隨機地指派給各個區(qū)組。因子設(shè)計指考慮兩個因素(可推廣到多個因素)的搭配試驗設(shè)計。第13章思考題13.1簡述時間序列的構(gòu)成要素。時間序列的構(gòu)成要素:趨勢,季節(jié)性,周期性,隨機性13.2利用增長率分析時間序列時應(yīng)注意哪些問題。(1)當時間序列中的觀察值出現(xiàn)0或負數(shù)時,不宜計算增長率;(2)不能單純就增長率論增長率,要注意增長率與絕對水平的綜合分析;大的增長率背后,其隱含的絕對值可能很小,小的增長率背后其隱含的絕對值可能很大

27、。13.3簡述平穩(wěn)序列和非平穩(wěn)序列的含義。1.平穩(wěn)序列(stationary series)基本上不存在趨勢的序列,各觀察值基本上在某個固定的水平上波動或雖有波動,但并不存在某種規(guī)律,而其波動可以看成是隨機的 2.非平穩(wěn)序列 (non-stationary series)是包含趨勢、季節(jié)性或周期性的序列,它可能只含有其中的一種成分,也可能是幾種成分的組合。因此,非平穩(wěn)序列又可以分為有趨勢的序列、有趨勢和季節(jié)性的序列、幾種成分混合而成的復合型序列。13.4簡述時間序列的預(yù)測程序。第一步:確定時間序列所包含的成分,也就是確定時間序列的類型。第二步:找出適合此類時間序列的預(yù)測方法。第三步:對可能的預(yù)

28、測方法進行評估,以確定最佳預(yù)測方案。第四步:利用最佳預(yù)測方案進行預(yù)測。13.5簡述指數(shù)平滑法的含義。1.是加權(quán)平均的一種特殊形式2.對過去的觀察值加權(quán)平均進行預(yù)測的一種方法3.觀察值時間越遠,其權(quán)數(shù)也跟著呈現(xiàn)指數(shù)的下降,因而稱為指數(shù)平滑4.有一次指數(shù)平滑、二次指數(shù)平滑、三次指數(shù)平滑等 5.該方法使用第T+1期的預(yù)測值等于T期的實際觀測值與第T期預(yù)測值的加權(quán)平均值6.一次指數(shù)平滑法也可用于對時間序列進行修勻,以消除隨機波動,找出序列的變化趨勢 13.6簡述復合型序列預(yù)測的步驟第一步:確定并分離季節(jié)成分,計算季節(jié)指數(shù),以確定時間序列中的季節(jié)成分。然后將季節(jié)性因素從時間序列中分離出去,以便觀察和分析

29、時間序列的其他特征。第二步:對消除了季節(jié)成分的時間序列建立適當預(yù)測模型,并進行預(yù)測。第三步:計算出最后的預(yù)測值。用預(yù)測值乘以相應(yīng)的季節(jié)指數(shù),得到最終的預(yù)測值13.7簡述季節(jié)指數(shù)的計算步驟1.計算移動平均值(季度數(shù)據(jù)采用4項移動平均,月份數(shù)據(jù)采用12項移動平均),并將其結(jié)果進行“中心化”處理(將移動平均的結(jié)果再進行一次二項的移動平均,即得出“中心化移動平均值”(CMA)2.計算移動平均的比值,也成為季節(jié)比率(即將序列的各觀察值除以相應(yīng)的中心化移動平均值,然后再計算出各比值的季度(或月份)平均值,即季節(jié)指數(shù))3.季節(jié)指數(shù)調(diào)整(各季節(jié)指數(shù)的平均數(shù)應(yīng)等于1或100%,若根據(jù)第二步計算的季節(jié)比率的平均值

30、不等于1時,則需要進行調(diào)整。具體方法是:將第二步計算的每個季節(jié)比率的平均值除以它們的總平均值) 第14章思考題14.1解釋指數(shù)的含義。答:指數(shù)最早起源于測量物價的變動。廣義上,是指任何兩個數(shù)值對比形成的相對數(shù);狹義上,是指用于測定多個項目在不同場合下綜合變動的一種特殊相對數(shù)。實際應(yīng)用中使用的主要是狹義的指數(shù)。 14.2加權(quán)綜合指數(shù)和加權(quán)平均指數(shù)有何區(qū)別與聯(lián)系?加權(quán)綜合指數(shù):通過加權(quán)來測定一組項目的綜合變動,有加權(quán)數(shù)量指數(shù)和加權(quán)質(zhì)量指數(shù)。使用條件:必須掌握全面數(shù)據(jù)(數(shù)量指數(shù),測定一組項目的數(shù)量變動,如產(chǎn)品產(chǎn)量指數(shù),商品銷售量指數(shù)等)(質(zhì)量指數(shù),測定一組項目的質(zhì)量變動,如價格指數(shù)、產(chǎn)品成本指數(shù)等)

31、拉式公式:將權(quán)數(shù)的各變量值固定在基期。帕式公式:把作為權(quán)數(shù)的變量值固定在報告期。 加權(quán)平均指數(shù):以某一時期的總量為權(quán)數(shù)對個體指數(shù)加權(quán)平均。使用條件:可以是全面數(shù)據(jù)、不完全數(shù)據(jù)。因權(quán)數(shù)所屬時期的不同,有不同的計算形式。有:算術(shù)平均形式、調(diào)和平均形14.3解釋零售價格指數(shù)、消費價格指數(shù)、生產(chǎn)價格指數(shù)、股票價格指數(shù)。答:零售價格指數(shù):反映城鄉(xiāng)商品零售價格變動趨勢的一種經(jīng)濟指數(shù)。 消費價格指數(shù):反映一定時期內(nèi)消費者所購買的生活消費品價格和服務(wù)項目價格的變動趨勢和程度的一種相對數(shù)。生產(chǎn)價格指數(shù): 測量在初級市場上出售的貨物(即在非零售市場上首次購買某種商品時) 的價格變動的一種價格指數(shù)。股票價格指數(shù):反

32、映某一股票市場上多種股票價格變動趨勢的一種相對數(shù),簡稱股價指數(shù)。其單位一般用“點”(point)表示,即將基期指數(shù)作為100,每上升或下降一個單位稱為“1點”。14.4消費價格指數(shù)有哪些作用?答:消費價格指數(shù)除了能反映城鄉(xiāng)居民所購買的生活消費品價格和服務(wù)項目價格的變動趨勢和程度外,還具有以下幾個方面的作用:(1)用于反映通貨膨脹狀況 (2)用于反映貨幣購買力變動 (3)用于反映對職工實際工資的影響 (4)用于縮減經(jīng)濟序列 14.5在構(gòu)建多指標綜合評價指數(shù)時,指標的轉(zhuǎn)換方法有哪幾種形式?答:有以下3種形式:(1)統(tǒng)計標準化。(2)極值標準化。(3)定基與環(huán)比轉(zhuǎn)換。具體公式見書上P440.補充:1

33、.什么是指數(shù)體系?答:指數(shù)體系是指由總量指數(shù)及其若干個因素指數(shù)構(gòu)成的數(shù)量關(guān)系式。總量指數(shù)等于各因素指數(shù)的乘積總量的變動差額等于各因素指數(shù)變動差額之和兩個因素指數(shù)中通常一個為數(shù)量指數(shù),另一個為質(zhì)量指數(shù)各因素指數(shù)的權(quán)數(shù)必須是不同時期的2.什么是加權(quán)綜合指數(shù)體系?答:由加權(quán)綜合指數(shù)及其各因素指數(shù)構(gòu)成的等式。比較常用的是基期權(quán)數(shù)加權(quán)的數(shù)量指數(shù)和報告期權(quán)數(shù)加權(quán)的質(zhì)量指數(shù)形成的指數(shù)體系。第二部分:練習題31 為評價家電行業(yè)售后服務(wù)的質(zhì)量,隨機抽取了由100個家庭構(gòu)成的一個樣本。服務(wù)質(zhì)量的等級分別表示為:A好;B較好;C一般;D較差;E.差。調(diào)查結(jié)果如下:BECCADCBAEDACBCDECEEADBCCA

34、EDCBBACDEABDDCCBCEDBCCBCDACBCDECEBBECCADCBAEBACEEABDDCADBCCAEDCBCBCEDBCCBC 要求:(1)指出上面的數(shù)據(jù)屬于什么類型。 順序數(shù)據(jù)(2)用Excel制作一張頻數(shù)分布表。 用數(shù)據(jù)分析直方圖制作:接收頻率E16D17C32B21A14 (3)繪制一張條形圖,反映評價等級的分布。 用數(shù)據(jù)分析直方圖制作:(4)繪制評價等級的帕累托圖。逆序排序后,制作累計頻數(shù)分布表:接收頻數(shù)頻率(%)累計頻率(%)C323232B212153D171770E161686A141410032 某行業(yè)管理局所屬40個企業(yè)2002年的產(chǎn)品銷售收入數(shù)據(jù)如下:

35、1521241291161001039295127104105119114115871031181421351251171081051101071371201361171089788123115119138112146113126要求:(1)根據(jù)上面的數(shù)據(jù)進行適當?shù)姆纸M,編制頻數(shù)分布表,并計算出累積頻數(shù)和累積頻率。1、確定組數(shù): ,取k=62、確定組距: 組距( 最大值 - 最小值)÷ 組數(shù)=(152-87)÷6=10.83,取103、分組頻數(shù)表銷售收入頻數(shù)頻率%累計頻數(shù)累計頻率%80.00 - 89.0025.025.090.00 - 99.0037.5512.5100.

36、00 - 109.00922.51435.0110.00 - 119.001230.02665.0120.00 - 129.00717.53382.5130.00 - 139.00410.03792.5140.00 - 149.0025.03997.5150.00+12.540100.0總和40100.0(2)按規(guī)定,銷售收入在125萬元以上為先進企業(yè),115125萬元為良好企業(yè),105115 萬元為一般企業(yè),105萬元以下為落后企業(yè),按先進企業(yè)、良好企業(yè)、一般企業(yè)、落后企業(yè)進行分組。頻數(shù)頻率%累計頻數(shù)累計頻率%先進企業(yè)1025.01025.0良好企業(yè)1230.02255.0一般企業(yè)922.5

37、3177.5落后企業(yè)922.540100.0總和40100.033 某百貨公司連續(xù)40天的商品銷售額如下: 單位:萬元41252947383430384340463645373736454333443528463430374426384442363737493942323635 要求:根據(jù)上面的數(shù)據(jù)進行適當?shù)姆纸M,編制頻數(shù)分布表,并繪制直方圖。1、確定組數(shù): ,取k=62、確定組距: 組距( 最大值 - 最小值)÷ 組數(shù)=(49-25)÷6=4,取53、分組頻數(shù)表銷售收入(萬元)頻數(shù)頻率%累計頻數(shù)累計頻率%<= 2512.512.526 - 30512.5615.03

38、1 - 35615.01230.036 - 401435.02665.041 - 451025.03690.046+410.040100.0總和40100.034 利用下面的數(shù)據(jù)構(gòu)建莖葉圖和箱線圖。572929363123472328283551391846182650293321464152282143194220data Stem-and-Leaf Plot Frequency Stem & Leaf 3.00 1 . 889 5.00 2 . 01133 7.00 2 . 6888999 2.00 3 . 13 3.00 3 . 569 3.00 4 . 123 3.00 4 .

39、 667 3.00 5 . 012 1.00 5 . 7 Stem width: 10 Each leaf: 1 case(s)36一種袋裝食品用生產(chǎn)線自動裝填,每袋重量大約為50g,但由于某些原因,每袋重量不會恰好是50g。下面是隨機抽取的100袋食品,測得的重量數(shù)據(jù)如下: 單位:g5746495455584961514951605254515560564747535148535052404557535251464847534753444750525347454854524846495259535043534657494944575242494347464851594545465255474

40、9505447484457475358524855535749565657534148要求:(1)構(gòu)建這些數(shù)據(jù)的頻數(shù)分布表。(2)繪制頻數(shù)分布的直方圖。(3)說明數(shù)據(jù)分布的特征。解:(1)根據(jù)上面的數(shù)據(jù)進行適當?shù)姆纸M,編制頻數(shù)分布表,并計算出累積頻數(shù)和累積頻率。1、確定組數(shù): ,取k=6或72、確定組距: 組距( 最大值 - 最小值)÷ 組數(shù)=(61-40)÷6=3.5,取3或者4、5 組距( 最大值 - 最小值)÷ 組數(shù)=(61-40)÷7=3,3、分組頻數(shù)表組距3,上限為小于 頻數(shù)百分比累計頻數(shù)累積百分比有效40.00 - 42.0033.033.0

41、43.00 - 45.0099.01212.046.00 - 48.002424.03636.049.00 - 51.001919.05555.052.00 - 54.002424.07979.055.00 - 57.001414.09393.058.00+77.0100100.0合計100100.0直方圖:組距4,上限為小于等于 頻數(shù)百分比累計頻數(shù)累積百分比有效<= 40.0011.011.041.00 - 44.0077.088.045.00 - 48.002828.03636.049.00 - 52.002828.06464.053.00 - 56.002222.08686.057

42、.00 - 60.001313.09999.061.00+11.0100100.0合計100100.0直方圖:組距5,上限為小于等于 頻數(shù)百分比累計頻數(shù)累積百分比有效<= 45.001212.012.012.046.00 - 50.003737.049.049.051.00 - 55.003434.083.083.056.00 - 60.001616.099.099.061.00+11.0100.0100.0合計100100.0直方圖:分布特征:左偏鐘型。3.8 下面是北方某城市12月份各天氣溫的記錄數(shù)據(jù):-32-4-7-11-1789-614-18-15-9-6-105-4-96-8-

43、12-16-19-15-22-25-24-19-8-6-15-11-12-19-25-24-18-17-14-22-13-9-60-15-4-9-32-4-4-16-175-6-5要求: (1)指出上面的數(shù)據(jù)屬于什么類型。 數(shù)值型數(shù)據(jù) (2)對上面的數(shù)據(jù)進行適當?shù)姆纸M。 1、確定組數(shù): ,取k=72、確定組距: 組距( 最大值 - 最小值)÷ 組數(shù)=(14-(-25))÷7=5.57,取53、分組頻數(shù)表溫度頻數(shù)頻率%累計頻數(shù)累計頻率%-25 - -21610.0610.0-20 - -16813.31423.3-15 - -11915.02338.3-10 - -61220

44、.03558.3-5 - -11220.04778.30 - 446.75185.05 - 9813.35998.310+11.760100.0合計60100.0 (3)繪制直方圖,說明該城市氣溫分布的特點。3.11 對于下面的數(shù)據(jù)繪制散點圖。x234187y252520301618解:312 甲乙兩個班各有40名學生,期末統(tǒng)計學考試成績的分布如下:考試成績?nèi)藬?shù)甲班乙班優(yōu)良中及格不及格361894615982要求:(1)根據(jù)上面的數(shù)據(jù),畫出兩個班考試成績的對比條形圖和環(huán)形圖。(2)比較兩個班考試成績分布的特點。甲班成績中的人數(shù)較多,高分和低分人數(shù)比乙班多,乙班學習成績較甲班好,高分較多,而低分

45、較少。(3)畫出雷達圖,比較兩個班考試成績的分布是否相似。分布不相似。3.14 已知19952004年我國的國內(nèi)生產(chǎn)總值數(shù)據(jù)如下(按當年價格計算): 單位:億元年份國內(nèi)生產(chǎn)總值第一產(chǎn)業(yè)第二產(chǎn)業(yè)第三產(chǎn)業(yè)199519961997199819992000200120022003200458478.1678846744626783452820675894681973148105172.3117390213687591199313844.214211214552414471961462821541181611731692812076807285383361337223386194055844935487

46、5052980612747238717947204282302925174270382990533153360753918843721要求:(1)用Excel繪制國內(nèi)生產(chǎn)總值的線圖。(2)繪制第一、二、三產(chǎn)業(yè)國內(nèi)生產(chǎn)總值的線圖。(3)根據(jù)2004年的國內(nèi)生產(chǎn)總值及其構(gòu)成數(shù)據(jù)繪制餅圖。第四章 統(tǒng)計數(shù)據(jù)的概括性描述41 一家汽車零售店的10名銷售人員5月份銷售的汽車數(shù)量(單位:臺)排序后如下:2 4 7 10 10 10 12 12 14 15要求:(1)計算汽車銷售量的眾數(shù)、中位數(shù)和平均數(shù)。 (2)根據(jù)定義公式計算四分位數(shù)。 (3)計算銷售量的標準差。 (4)說明汽車銷售量分布的特征。解: St

47、atistics汽車銷售數(shù)量 NValid10Missing0Mean9.60Median10.00Mode10Std. Deviation4.169Percentiles256.255010.007512.5042 隨機抽取25個網(wǎng)絡(luò)用戶,得到他們的年齡數(shù)據(jù)如下: 單位:周歲19152925242321382218302019191623272234244120311723要求;(1)計算眾數(shù)、中位數(shù):1、排序形成單變量分值的頻數(shù)分布和累計頻數(shù)分布:網(wǎng)絡(luò)用戶的年齡 FrequencyPercentCumulative FrequencyCumulative PercentValid1514.

48、014.01614.028.01714.0312.01814.0416.019312.0728.02028.0936.02114.01040.02228.01248.023312.01560.02428.01768.02514.01872.02714.01976.02914.02080.03014.02184.03114.02288.03414.02392.03814.02496.04114.025100.0Total25100.0從頻數(shù)看出,眾數(shù)Mo有兩個:19、23;從累計頻數(shù)看,中位數(shù)Me=23。(2)根據(jù)定義公式計算四分位數(shù)。Q1位置=25/4=6.25,因此Q1=19,Q3位置=3×25/4=18.75,因此Q3=27,或者,由于25和27都只有一個,因此Q3也可等于25+0.75×2=26.5。(3)計算平均數(shù)和標準差;Mean=24.00;Std. Deviation=6.652(4)計算偏態(tài)系數(shù)和峰態(tài)系數(shù):Skewness=1.080;Kurtosis=0.773(5)對網(wǎng)民年齡的分布特征進行綜合分析:分布,均值=24、標準差=6.652、呈右偏分布。如需看清楚分布形態(tài),需要進行分組。為分組情況下的直方圖:為分組情況下的概率密度曲線:分組:1、確定組數(shù): ,取k=62、確定組距:

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論