西交大考研統(tǒng)計(jì)學(xué)課后問(wèn)答整理

上傳人：朱*** IP屬地：江西上傳時(shí)間：2022-06-30 格式：DOC 頁(yè)數(shù)：31 大?。?86KB 積分：12 舉報(bào) 版權(quán)申訴

西交大考研統(tǒng)計(jì)學(xué)課后問(wèn)答整理_第2頁(yè)

西交大考研統(tǒng)計(jì)學(xué)課后問(wèn)答整理_第3頁(yè)

西交大考研統(tǒng)計(jì)學(xué)課后問(wèn)答整理_第4頁(yè)

西交大考研統(tǒng)計(jì)學(xué)課后問(wèn)答整理_第5頁(yè)

已閱讀5頁(yè)，還剩26頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、統(tǒng)計(jì)學(xué)問(wèn)答題整理行管蓋小靜第一章導(dǎo)論1. 什么是統(tǒng)計(jì)學(xué)？怎樣理解統(tǒng)計(jì)學(xué)與統(tǒng)計(jì)數(shù)據(jù)的關(guān)系？1) 統(tǒng)計(jì)學(xué)是指收集、處理、分析、解釋數(shù)據(jù)并從數(shù)據(jù)中得出結(jié)論的科學(xué)。2) 關(guān)系：它是一門關(guān)于數(shù)據(jù)的科學(xué)，它提供的是一套關(guān)于數(shù)據(jù)收集、處理、分析、解釋并得出結(jié)論的方法，它研究的是來(lái)自各個(gè)領(lǐng)域的數(shù)據(jù)。而其中數(shù)據(jù)收集就是取得統(tǒng)計(jì)數(shù)據(jù)，處理是將數(shù)據(jù)用圖表等形式展示出來(lái)，分析是通過(guò)統(tǒng)計(jì)方法研究數(shù)據(jù)、并從數(shù)據(jù)中取得有用信息以幫助決策。3) 數(shù)據(jù)分析的方法有描述統(tǒng)計(jì)和推斷統(tǒng)計(jì)。描述統(tǒng)計(jì)是指研究數(shù)據(jù)收集、處理和描述的分支，推斷是指研究如何用樣本數(shù)據(jù)來(lái)推斷總體特征的分支。2. 統(tǒng)計(jì)數(shù)據(jù)可以分為哪幾類？不同類型的數(shù)據(jù)各有什么

2、特點(diǎn)？不同的數(shù)據(jù)要采用不同的統(tǒng)計(jì)方法來(lái)處理和分析1) 按計(jì)量尺度分：分類數(shù)據(jù)：只能歸于某一類別的非數(shù)字型數(shù)據(jù)，由分類尺度計(jì)量形成；順序數(shù)據(jù)：只能歸于某一有序類別的非數(shù)字型數(shù)據(jù)，由順序尺度計(jì)量形成。分類和順序數(shù)據(jù)說(shuō)明的是事物的品質(zhì)特征，常用文字來(lái)表述，其結(jié)果表現(xiàn)為類別，故也可稱定性數(shù)據(jù)或品質(zhì)數(shù)據(jù)。數(shù)值型數(shù)據(jù)：按數(shù)字尺度測(cè)量的觀測(cè)值。其說(shuō)明的是現(xiàn)象的數(shù)量特征，通常用數(shù)值表述，也可稱定量或數(shù)量數(shù)據(jù)。2) 按收集方法分：觀測(cè)數(shù)據(jù)：通過(guò)調(diào)查或觀測(cè)收集到得數(shù)據(jù)。在沒(méi)有對(duì)事物人為控制的條件下得到，一般有關(guān)社會(huì)經(jīng)濟(jì)現(xiàn)象的數(shù)據(jù)都是；實(shí)驗(yàn)數(shù)據(jù)：在實(shí)驗(yàn)中控制實(shí)驗(yàn)對(duì)象而收集到的。一般為自然科學(xué)領(lǐng)域收集到得數(shù)據(jù)。3)

3、按被描述的現(xiàn)象與時(shí)間的關(guān)系分：截面數(shù)據(jù)：在相同或近似相同的時(shí)間點(diǎn)上收集的數(shù)據(jù)。它所描述的是現(xiàn)象在某一時(shí)刻的變化情況，通常是在不同空間上獲得的數(shù)據(jù)；時(shí)間序列數(shù)據(jù)：在不同時(shí)間上收集到的數(shù)據(jù)。它是按著時(shí)間順序收集到的，用于描述現(xiàn)象隨時(shí)間變化的情況。3. 舉例說(shuō)明總體、樣本、參數(shù)、統(tǒng)計(jì)量和變量的概念。總體：包含所研究的全部個(gè)體（數(shù)據(jù)）的集合。樣本：從總體中抽取的一部分元素的集合。樣本容量：構(gòu)成樣本的元素?cái)?shù)目，又稱樣本量。參數(shù)：用來(lái)描述總體特征的概括性數(shù)字度量。統(tǒng)計(jì)量：用來(lái)描述樣本特征的概括性數(shù)字度量。變量：說(shuō)明事物某種特征的概念。特點(diǎn)是從一次觀察到下一次觀察會(huì)呈現(xiàn)差別或變化。4. 舉例說(shuō)明什么是有限

4、總體和無(wú)限總體?？傮w根據(jù)包含的數(shù)目是否可數(shù)而劃分的：1) 有限總體：總體的范圍能夠明確確定，元素的數(shù)目有限可數(shù)，在每次抽取樣本時(shí)是不獨(dú)立的。2) 無(wú)限總體：總體所包含元素是無(wú)限不可數(shù)的。其每次抽取樣本是獨(dú)立的，即本次抽取不影響下一次的抽樣結(jié)果。在推斷統(tǒng)計(jì)中通常是針對(duì)無(wú)限總體的，因而通常把總體看作隨機(jī)變量。5. 變量可以分為哪幾類？1) 分類變量：說(shuō)明事物類別的一個(gè)名稱。其取值即分類數(shù)據(jù)。2) 順序變量：說(shuō)明事物有序類別的一個(gè)名稱。其取值即順序數(shù)據(jù)。3) 數(shù)值型變量：說(shuō)明事物數(shù)字特征的一個(gè)名稱。其取值即數(shù)值型數(shù)據(jù)。根據(jù)其取值不同可以分為連續(xù)和離散變量。連續(xù)變量是指可以在一個(gè)或多個(gè)區(qū)間中取任意值的

5、變量，其取值連續(xù)不斷，不可一一列舉；離散變量是指只能取可數(shù)值的變量，其取值只能取有限個(gè)值，且取值都以整數(shù)位斷開，可一一列舉。在社會(huì)和經(jīng)濟(jì)問(wèn)題的研究中離散變量很多時(shí)也可以當(dāng)作連續(xù)變量處理。此外，還可以將變量劃分為隨機(jī)和非隨機(jī)變量，經(jīng)驗(yàn)變量和理論變量等。經(jīng)驗(yàn)變量是在周圍環(huán)境中可以觀察到的事物，理論變量是統(tǒng)計(jì)學(xué)家用數(shù)學(xué)方法構(gòu)造出來(lái)的變量。6. 統(tǒng)計(jì)學(xué)應(yīng)用的領(lǐng)域有什么。統(tǒng)計(jì)學(xué)可以應(yīng)用于所有有數(shù)據(jù)的領(lǐng)域，如政府部門、學(xué)術(shù)研究領(lǐng)域、日常生活、公司企業(yè)的生產(chǎn)經(jīng)營(yíng)管理等。如在工商管理中有：企業(yè)發(fā)展戰(zhàn)略、產(chǎn)品質(zhì)量管理、市場(chǎng)研究、財(cái)務(wù)分析、經(jīng)濟(jì)預(yù)測(cè)和HR等。統(tǒng)計(jì)有助于數(shù)據(jù)分，數(shù)據(jù)分析的真正目的是找到規(guī)律、獲得啟發(fā)

6、，而不是尋找支持，真正的分析事先是沒(méi)有結(jié)論的，通過(guò)數(shù)據(jù)的分析才能得出結(jié)論。當(dāng)然，統(tǒng)計(jì)也不是萬(wàn)能的。第二章數(shù)據(jù)收集1. 簡(jiǎn)述普查和抽樣調(diào)查的特點(diǎn)。它們都是實(shí)際中常用的統(tǒng)計(jì)調(diào)查方式。此外還有統(tǒng)計(jì)報(bào)表：按照國(guó)家有關(guān)法律規(guī)定，自上而下的提供基本數(shù)據(jù)。1) 抽樣調(diào)查：從總體中隨機(jī)抽取一部分單位作為樣本進(jìn)行調(diào)查，并根據(jù)樣本調(diào)查結(jié)果來(lái)推斷總體特征的數(shù)據(jù)收集方法。它具有四大特點(diǎn)：經(jīng)濟(jì)性（人、財(cái)、物、時(shí)、費(fèi)較低）、時(shí)效性強(qiáng)、適應(yīng)面廣、準(zhǔn)確性高。2) 普查：為特定目的而專門組織的全面調(diào)查。它適合于特定目的特定對(duì)象的一種調(diào)查方式，主要用于收集某一時(shí)間點(diǎn)上的社會(huì)經(jīng)濟(jì)現(xiàn)象的數(shù)量，目的是掌握特定社會(huì)經(jīng)濟(jì)現(xiàn)象的基本全貌，

7、為國(guó)家制定政策措施提供依據(jù)。我國(guó)進(jìn)行的主要有人口(末尾0)、工業(yè)、農(nóng)業(yè)(6)、經(jīng)濟(jì)普查（3和8）。普查需要耗費(fèi)大量的人力、物力、財(cái)力和時(shí)間，通常隔較長(zhǎng)時(shí)間進(jìn)行一次，具有周期性。2. 統(tǒng)計(jì)數(shù)據(jù)的具體收集方法有哪些。數(shù)據(jù)來(lái)源間接來(lái)源直接來(lái)源出版物、網(wǎng)絡(luò)調(diào)查實(shí)驗(yàn)抽樣調(diào)查普查數(shù)據(jù)收集方法詢問(wèn)調(diào)查觀察實(shí)驗(yàn)訪問(wèn)調(diào)查郵寄調(diào)查電話調(diào)查電腦輔助座談會(huì)個(gè)別深訪觀察實(shí)驗(yàn)工業(yè)普查農(nóng)業(yè)普查經(jīng)濟(jì)普查概率抽樣非概率抽樣隨機(jī)抽樣分層抽樣機(jī)械抽樣整群抽樣3. 簡(jiǎn)述調(diào)查方案的4個(gè)基本結(jié)構(gòu)。1) 調(diào)查目的：調(diào)查要達(dá)到的具體目標(biāo)回答“為什么調(diào)查？”調(diào)查之前必須明確2) 調(diào)查對(duì)象和調(diào)查單位：調(diào)查對(duì)象：調(diào)查研究的總體或調(diào)查范圍；調(diào)查單位

8、：需要對(duì)之進(jìn)行調(diào)查的單位?？梢允钦{(diào)查對(duì)象的全部單位(全面調(diào)查)，也可以是調(diào)查對(duì)象中的一部分單位(非全面調(diào)查)；回答“向誰(shuí)調(diào)查？3) 調(diào)查項(xiàng)目和調(diào)查表：即調(diào)查的具體內(nèi)容；通常表現(xiàn)為表格或問(wèn)卷；回答“調(diào)查什么？”。4) 其它問(wèn)題：明確調(diào)查所采用的方法；確定調(diào)查資料的所屬時(shí)間和調(diào)查工作的期限；調(diào)查的組織與實(shí)施細(xì)則。4. 什么是問(wèn)卷？它由哪幾部分組成？問(wèn)卷是用來(lái)收集調(diào)查數(shù)據(jù)的一種工具，調(diào)查者根據(jù)調(diào)查目的和要求所設(shè)計(jì)的，由一系列問(wèn)題、備選答案、說(shuō)明以及碼表組成的一種調(diào)查形式。不同的調(diào)查問(wèn)卷在具體結(jié)構(gòu)、題型、措詞、版式等設(shè)計(jì)上會(huì)有所不同，但在結(jié)構(gòu)上一般都由開頭部分（問(wèn)候語(yǔ)、填寫說(shuō)明、問(wèn)卷編號(hào)）、甄別部分、

9、（篩選調(diào)查者）主體部分（核心）和背景部分（放在最后）四方面組成。5. 設(shè)計(jì)問(wèn)卷的提問(wèn)項(xiàng)目應(yīng)該注意哪些問(wèn)題。1) 提問(wèn)的內(nèi)容盡可能短 2) 用詞要確切、通俗可按6W準(zhǔn)則加以推敲。Who、Where、When、Why、What、How。3) 一項(xiàng)提問(wèn)只包含一項(xiàng)內(nèi)容 4) 避免誘導(dǎo)性提問(wèn) 5) 避免否定形式的提問(wèn) 6) 避免敏感性問(wèn)題 6. 封閉型問(wèn)題答案的設(shè)計(jì)有哪些主要方法。封閉性問(wèn)題主要是選擇回答型，主要包括五種方法：1) 兩項(xiàng)選擇法：Y/N2) 多項(xiàng)選擇法：?jiǎn)雾?xiàng)、多項(xiàng)以及限制項(xiàng)選擇三種。3) 順序選擇法：對(duì)選項(xiàng)按重要程度進(jìn)行排列。4) 評(píng)定尺度法：即非常好、一般好、不好等。5) 雙向列聯(lián)法。

10、7. 問(wèn)卷中問(wèn)題順序的設(shè)計(jì)應(yīng)該注意哪些問(wèn)題。1) 問(wèn)題的安排應(yīng)具有邏輯性。2) 問(wèn)題的順序應(yīng)先易后難。3) 能引起被調(diào)查者興趣的問(wèn)題放在前面。4) 開放性問(wèn)題放在后面。5) 版面格式的設(shè)計(jì)。包括：?jiǎn)柧淼慕Y(jié)構(gòu)安排要合理，問(wèn)卷的主體部分要突出、醒目；不要編排過(guò)密，各問(wèn)題之間要留出一定的空間；外表及內(nèi)容的印刷要美觀8. 數(shù)據(jù)誤差的產(chǎn)生及消除。1) 抽樣誤差：由于抽樣的隨機(jī)性所帶來(lái)的誤差，所有樣本可能的結(jié)果與總體真值之間的平均性差異，無(wú)法消除但可以事先計(jì)算和控制。產(chǎn)生原因：未遵循隨機(jī)原則；樣本結(jié)構(gòu)與總體結(jié)構(gòu)有差異；樣本量不足等2) 非抽樣誤差：相對(duì)抽樣誤差而言，是除抽樣誤差之外的，由于其他原因造成的

11、樣本觀察結(jié)果與總體真值之間的差異，存在于所有的調(diào)查之中。（概率抽樣、非概率抽樣、全面性調(diào)查）理論上可以消除。產(chǎn)生有：抽樣框誤差、回答誤差和無(wú)回答誤差（被調(diào)查者）、調(diào)查員誤差、測(cè)量誤差。3) 誤差的控制：抽樣誤差可計(jì)算和控制。非抽樣誤差的控制：調(diào)查員的挑選；調(diào)查員的培訓(xùn)；督導(dǎo)員的調(diào)查專業(yè)水平；調(diào)查過(guò)程控制（調(diào)查結(jié)果進(jìn)行檢驗(yàn)、評(píng)估；現(xiàn)場(chǎng)調(diào)查人員進(jìn)行獎(jiǎng)懲的制度）。9、以及數(shù)據(jù)質(zhì)量的要求？1. 精度：最低的抽樣誤差或隨機(jī)誤差2. 準(zhǔn)確性：最小的非抽樣誤差或偏差3. 關(guān)聯(lián)性：滿足用戶決策、管理和研究的需要4. 及時(shí)性：在最短的時(shí)間里取得并公布數(shù)據(jù)5. 一致性：保持時(shí)間序列的可比性6. 最低成本：以

12、最經(jīng)濟(jì)的方式取得數(shù)據(jù)第三章數(shù)據(jù)的圖表展示1. 數(shù)據(jù)的預(yù)處理包括哪些內(nèi)容？1) 數(shù)據(jù)審核：檢查數(shù)據(jù)中的錯(cuò)誤2) 數(shù)據(jù)篩選：找出符合條件的數(shù)據(jù)3) 數(shù)據(jù)排序：升序和降序；尋找數(shù)據(jù)的基本特征。排序后的稱為順序統(tǒng)計(jì)量。4) 數(shù)據(jù)透視表：按需要匯總。自己附加：一、數(shù)據(jù)審核的具體方法是？1. 原始數(shù)據(jù)：1) 完整性審核n 應(yīng)調(diào)查的單位或個(gè)體是否有遺漏n 所有的調(diào)查項(xiàng)目或變量是否填寫齊全2）準(zhǔn)確性審核n 數(shù)據(jù)是否真實(shí)反映實(shí)際情況，內(nèi)容是否符合實(shí)際n 數(shù)據(jù)是否有錯(cuò)誤，計(jì)算是否正確等2. 二手?jǐn)?shù)據(jù)：1) 適用性審核n 弄清楚數(shù)據(jù)的來(lái)源、數(shù)據(jù)的口徑以及有關(guān)的背景材料n 確定數(shù)據(jù)是否符合自己分析研究的需要2）時(shí)

13、效性審核n 盡可能使用最新的數(shù)據(jù)3）確認(rèn)是否有必要做進(jìn)一步的加工整理二數(shù)據(jù)篩選的內(nèi)容是什么？1. 當(dāng)數(shù)據(jù)中的錯(cuò)誤不能予以糾正，或者有些數(shù)據(jù)不符合調(diào)查的要求而又無(wú)法彌補(bǔ)時(shí)，需要對(duì)數(shù)據(jù)進(jìn)行篩選。2. 數(shù)據(jù)篩選的內(nèi)容將某些不符合要求的數(shù)據(jù)或有明顯錯(cuò)誤的數(shù)據(jù)予以剔除將符合某種特定條件的數(shù)據(jù)篩選出來(lái)，而不符合特定條件的數(shù)據(jù)予以剔除三、數(shù)據(jù)排序的方法？1. 分類數(shù)據(jù)的排序字母型數(shù)據(jù)，排序有升序降序之分，但習(xí)慣上用升序漢字型數(shù)據(jù)，可按漢字的首位拼音字母排列，也可按筆畫排序，其中也有筆畫多少的升序降序之分2. 數(shù)值型數(shù)據(jù)的排序n 遞增排序：設(shè)一組數(shù)據(jù)為x1，x2，xn，遞增排序后可表示為：x(1)x(

14、2)x(2)x(n)三、數(shù)據(jù)排序的目的？1. 按一定順序?qū)?shù)據(jù)排列，以發(fā)現(xiàn)一些明顯的特征或趨勢(shì)，找到解決問(wèn)題的線索2. 排序有助于對(duì)數(shù)據(jù)檢查糾錯(cuò)，以及為重新歸類或分組等提供依據(jù)3. 在某些場(chǎng)合，排序本身就是分析的目的之一4. 排序可借助于計(jì)算機(jī)完成。2. 數(shù)據(jù)整理與圖示的基本問(wèn)題是什么？（附件）1) 要弄清所面對(duì)的數(shù)據(jù)類型，不同類型的數(shù)據(jù)，采取不同的處理方式和方法：n 對(duì)分類數(shù)據(jù)和順序數(shù)據(jù)主要是作分類整理。n 對(duì)數(shù)值型數(shù)據(jù)則主要是作分組整理2）適合于低層次數(shù)據(jù)的整理和顯示方法也適合于高層次的數(shù)據(jù)；但適合于高層次數(shù)據(jù)的整理和顯示方法并不適合于低層次的數(shù)據(jù)。3. 分類數(shù)據(jù)和順序數(shù)據(jù)的整理和圖示方法

15、各有哪些？A. 都是品質(zhì)型數(shù)據(jù)，可計(jì)算的統(tǒng)計(jì)量有：（后兩個(gè)僅為順序數(shù)據(jù)的）1) 頻數(shù)：落在各類別中的數(shù)據(jù)個(gè)數(shù)2) 比例：某一類別數(shù)據(jù)占全部數(shù)據(jù)的比值3) 百分比：將對(duì)比的基數(shù)作為100而計(jì)算的比值4) 比率：不同類別數(shù)值的比值5) 累積頻數(shù)：各類別頻數(shù)的逐級(jí)累加。向上向下兩種。6) 累積頻率：各類別頻率(百分比)的逐級(jí)累加B圖示方法有：（后兩個(gè)僅為順序數(shù)據(jù)的）1) 條形圖。寬度相同的條形的高度或長(zhǎng)短來(lái)表示各類別數(shù)據(jù)的圖形，單式條形圖、復(fù)式條形圖等形式。主要用于反映分類數(shù)據(jù)的頻數(shù)分布，繪制時(shí)，各類別可以放在縱軸，稱為條形圖，也可以放在橫軸，稱為柱形圖。2) 帕累托圖。按各類別數(shù)據(jù)出現(xiàn)的頻數(shù)多少排

16、序后繪制的柱形圖 3) 對(duì)比條形圖。用以對(duì)比分類變量的取值在不同時(shí)間或不同空間上的差異或變化趨勢(shì)。4) 餅圖。也是圓形圖，是用圓形及圓內(nèi)扇形的角度來(lái)表示數(shù)值大小的圖形，主要用于表示樣本或總體中各組成部分所占的比例，用于研究結(jié)構(gòu)性問(wèn)題。5) 累計(jì)頻率或頻數(shù)分布圖6) 環(huán)形圖。類似餅圖，中間有一個(gè)“洞”，可用于顯示多個(gè)樣本或總體的各個(gè)部分所占比例，有利于比較。用于結(jié)構(gòu)比較研究，用于展示分類和順序數(shù)據(jù)。4. 數(shù)值型數(shù)據(jù)的分組方法有哪些？簡(jiǎn)述組距分組的步驟。數(shù)據(jù)分組是指根據(jù)數(shù)據(jù)研究需要，將原始數(shù)據(jù)按照某種標(biāo)準(zhǔn)劃分成不同組別。包括：1) 單變量值分組：一個(gè)變量值作為一組，適合于離散變量和變量值較少的情

17、況。2) 組距分組：將變量值的一個(gè)區(qū)間作為一組，適合于連續(xù)變量和變量值較多的情況，需要遵循“不重不漏”的原則，可采用等距分組，也可采用不等距分組。組距分組的步驟：1. 確定組數(shù)：組數(shù)的確定應(yīng)以能夠顯示數(shù)據(jù)的分布特征和規(guī)律為目的。在實(shí)際分組時(shí)，組數(shù)一般為5K 15,可以按 Sturges 提出的經(jīng)驗(yàn)公式確定組數(shù)K- 。2. 確定組距：一個(gè)組的上限與下限之差，可根據(jù)全部數(shù)據(jù)的最大值和最小值及所分的組數(shù)來(lái)確定，即組距( 最大值 - 最小值) 組數(shù) 3. 統(tǒng)計(jì)出各組的頻數(shù)并整理成頻數(shù)分布表。遵循補(bǔ)充不漏可使用：上下組限重疊時(shí)，上組限不在內(nèi)；上下組限斷開；使用開口組。5. 直方圖與條形圖有何區(qū)別。1)

18、條形圖是用條形的長(zhǎng)度(橫置時(shí))表示各類別頻數(shù)的多少，其寬度(表示類別)則是固定的。2) 直方圖是用面積表示各組頻數(shù)的多少，矩形的高度表示每一組的頻數(shù)或百分比，寬度則表示各組的組距，其高度與寬度均有意義。3) 直方圖的各矩形通常是連續(xù)排列，條形圖則是分開排列。4) 條形圖主要用于展示分類數(shù)據(jù)，直方圖則主要用于展示數(shù)值型數(shù)據(jù)。6. 繪制線圖應(yīng)該注意哪些問(wèn)題？它是用來(lái)表示時(shí)間序列數(shù)據(jù)趨勢(shì)的圖形，注意三點(diǎn)：1) 時(shí)間一般繪在橫軸，數(shù)據(jù)繪在縱軸2) 圖形的長(zhǎng)寬比例大致為10 : 7。3) 一般情況下，縱軸數(shù)據(jù)下端應(yīng)從“0”開始，以便于比較。數(shù)據(jù)與“0”之間的間距過(guò)大時(shí)，可以采取折斷的符號(hào)將縱軸折斷7.

19、餅圖和環(huán)形圖有什么不同？與餅圖類似，但又有區(qū)別：1) 餅圖只能顯示一個(gè)總體各部分所占的比例2) 環(huán)形圖則可以同時(shí)繪制多個(gè)樣本或總體的數(shù)據(jù)系列，每一個(gè)樣本或總體的數(shù)據(jù)系列為一個(gè)環(huán)。8. 莖葉圖和直方圖相比有什么優(yōu)點(diǎn)？他們的應(yīng)用場(chǎng)合分別是什么？1) 莖葉圖是用于顯示未分組的原始數(shù)據(jù)的分布，由“莖”和“葉”兩部分構(gòu)成，其圖形是由數(shù)字組成的，以該組數(shù)據(jù)的高位數(shù)值作樹莖，低位數(shù)字作樹葉，樹葉上只保留最后一位數(shù)字。對(duì)于n(20 n 300)個(gè)數(shù)據(jù)，莖葉圖最大行數(shù)不超過(guò) L = 10 lg n 2) 直方圖是用矩形長(zhǎng)和高即面積來(lái)表示頻數(shù)分布的圖形。3) 莖葉圖類似于橫置的直方圖，但又有區(qū)別：直方圖可觀察

20、一組數(shù)據(jù)的分布狀況，但沒(méi)有給出具體的數(shù)值。莖葉圖既能給出數(shù)據(jù)的分布狀況，又能給出每一個(gè)原始數(shù)值，保留了原始數(shù)據(jù)的信息。直方圖適用于大批量數(shù)據(jù)，莖葉圖適用于小批量數(shù)據(jù)。9. 鑒別圖表優(yōu)劣的準(zhǔn)則有哪些。好的圖表應(yīng)包括以下基本特征：（附加）1) 顯示數(shù)據(jù)2) 讓讀者把注意力集中在圖表的內(nèi)容上，而不是制作圖表的程序上3) 避免歪曲4) 強(qiáng)調(diào)數(shù)據(jù)之間的比較5) 服務(wù)于一個(gè)明確的目的6) 有對(duì)圖表的統(tǒng)計(jì)描述和文字說(shuō)明好的圖表的鑒別準(zhǔn)則是：1) 精心設(shè)計(jì)、有助于洞察問(wèn)題的實(shí)質(zhì)2) 使復(fù)雜的觀點(diǎn)得到簡(jiǎn)明、確切、高效的闡述3) 能在最短的時(shí)間內(nèi)以最少的筆墨給讀者提供最大量的信息4) 是多維的5) 表述數(shù)據(jù)的

21、真實(shí)情況10. 統(tǒng)計(jì)表由那幾個(gè)部分組成？五個(gè)部分：表頭、行標(biāo)題（類別名稱）、列標(biāo)題（變量名稱）、數(shù)字資料、表外附加（數(shù)據(jù)來(lái)源、變量的注釋何必要說(shuō)明等）11. 制作統(tǒng)計(jì)表應(yīng)該注意哪些問(wèn)題？1) 合理安排統(tǒng)計(jì)表的結(jié)構(gòu)2) 總標(biāo)題內(nèi)容應(yīng)滿足3W 要求3) 數(shù)據(jù)計(jì)量單位相同時(shí)，可放在表的右上角標(biāo)明，不同時(shí)應(yīng)放在每個(gè)變量后或單列出一列標(biāo)明4) 表中的上下兩條橫線一般用粗線，其他線用細(xì)線5) 通常情況下，統(tǒng)計(jì)表的左右兩邊不封口6) 表中的數(shù)據(jù)一般是右對(duì)齊，有小數(shù)點(diǎn)時(shí)應(yīng)以小數(shù)點(diǎn)對(duì)齊，而且小數(shù)點(diǎn)的位數(shù)應(yīng)統(tǒng)一7) 對(duì)于沒(méi)有數(shù)字的表格單元，一般用“”表示8) 必要時(shí)可在表的下方加上注釋小結(jié)表：數(shù)據(jù)類型品質(zhì)數(shù)據(jù)數(shù)值

22、型數(shù)據(jù)匯總表原始數(shù)據(jù)分組數(shù)據(jù)時(shí)序數(shù)據(jù)多元數(shù)據(jù)條形圖餅圖莖葉圖箱線圖直方圖折線圖線圖散點(diǎn)圖氣泡圖雷達(dá)圖環(huán)形圖第四章數(shù)據(jù)的概括性度量1. 一組數(shù)據(jù)的分布特征可以從哪幾個(gè)方面進(jìn)行測(cè)度？1) 集中趨勢(shì)（位置）：一組數(shù)據(jù)向其中心值靠攏的傾向和程度，測(cè)度集中趨勢(shì)就是尋找數(shù)據(jù)水平的代表值或中心值。且不同類型的數(shù)據(jù)用不同的集中趨勢(shì)測(cè)度值，低層次數(shù)據(jù)的測(cè)度值適用于高層次的測(cè)量數(shù)據(jù)，但高層次數(shù)據(jù)的測(cè)度值并不適用于低層次的測(cè)量數(shù)據(jù)：分類數(shù)據(jù)-眾數(shù)；順序數(shù)據(jù)-中位數(shù)和分位數(shù)；數(shù)值型數(shù)據(jù)-平均數(shù)。2) 離散趨勢(shì)（分散程度）：數(shù)據(jù)分布的另一個(gè)重要特征，映各變量值遠(yuǎn)離其中心值的程度，從另一個(gè)側(cè)面說(shuō)明了集中趨勢(shì)測(cè)度值的代表

23、程度。不同類型的數(shù)據(jù)有不同的離散程度測(cè)度值：分類數(shù)據(jù)-異眾比率；順序數(shù)據(jù)-四分位差；數(shù)值型數(shù)據(jù)-方差、標(biāo)準(zhǔn)差，此外還有極差和平均差，標(biāo)準(zhǔn)分?jǐn)?shù)（判斷一值在一組數(shù)據(jù)中的相對(duì)位置）和離散系數(shù)（測(cè)度不同組別數(shù)據(jù)的相對(duì)離散程度）3) 偏態(tài)和峰態(tài)（形狀）：數(shù)據(jù)分布偏斜程度的測(cè)度和扁平程度的測(cè)度。2. 怎樣理解均值在統(tǒng)計(jì)學(xué)中的地位？1) 均值是集中趨勢(shì)的最常用測(cè)度值，主要適用于數(shù)值型數(shù)據(jù)，有簡(jiǎn)單平均數(shù)和加權(quán)平均數(shù)之分，此外還有幾何平均數(shù)。2) 它是進(jìn)行統(tǒng)計(jì)分析和統(tǒng)計(jì)推斷的基礎(chǔ)。從統(tǒng)計(jì)思想上看，它是一組數(shù)據(jù)的重心所在，是數(shù)據(jù)誤差相互抵消后的必然性結(jié)果。具有使各變量值與平均數(shù)離差平方和最小的數(shù)學(xué)性質(zhì)。3)

24、但其易受極端值的影響。3. 簡(jiǎn)述四分位數(shù)的計(jì)算方法。是指排序后處于25%和75%位置上的值，不受極端值的影響，主要用于順序數(shù)據(jù)，也可用于數(shù)值型數(shù)據(jù)。1) 定義計(jì)算： 2) 較準(zhǔn)確計(jì)算： 3) 中位數(shù)法： 4) Excel計(jì)算： 4. 對(duì)于比率數(shù)據(jù)的平均為什么采用幾何平均？是指n 個(gè)變量值乘積的 n 次方根。適用于對(duì)比率數(shù)據(jù)的平均，主要用于計(jì)算平均增長(zhǎng)率，因?yàn)樗莆盏淖兞恐当旧砭褪潜嚷实男问?，如果各比率?shù)值相差不大還可以用算術(shù)平均，相差大只能用幾何平均。用Gm表示。5. 簡(jiǎn)述眾數(shù)、中位數(shù)和均值的特點(diǎn)以及應(yīng)用場(chǎng)合。1) 眾數(shù)n 不受極端值影響n 具有不惟一性n 數(shù)據(jù)分布偏斜程度較大且有明顯峰值時(shí)

25、應(yīng)用，主要用于數(shù)量較多的分類數(shù)據(jù)。2) 中位數(shù)n 不受極端值影響n 數(shù)據(jù)分布偏斜程度較大時(shí)應(yīng)用，主要適于順序數(shù)據(jù)。3) 平均數(shù)n 易受極端值影響n 數(shù)學(xué)性質(zhì)優(yōu)良n 數(shù)據(jù)對(duì)稱分布或接近對(duì)稱分布時(shí)應(yīng)用，主要適于數(shù)值型數(shù)據(jù)。6. 簡(jiǎn)述異眾比率、四分位差、方差或標(biāo)準(zhǔn)差的適用場(chǎng)合？1) 異眾比率：非眾數(shù)組的頻數(shù)占總頻數(shù)的比例，用以衡量眾數(shù)的代表性。主要適于分類數(shù)據(jù)。2) 四分位差：稱為內(nèi)距或四分間距，是上四分位數(shù)與下四分位數(shù)之差，即Qd = QU QL。反映了中間50%數(shù)據(jù)的離散程度，不受極端值的影響，用于衡量中位數(shù)的代表性，適于順序型數(shù)據(jù)。3) 方差或標(biāo)準(zhǔn)差：數(shù)據(jù)離散程度的最常用測(cè)度值，反映了各變量值

26、與均值的平均差異。主要適于數(shù)值型數(shù)據(jù)。7. 標(biāo)準(zhǔn)分?jǐn)?shù)有哪些用途？標(biāo)準(zhǔn)分?jǐn)?shù)也稱標(biāo)準(zhǔn)化值，是用公式對(duì)不同量綱的變量進(jìn)行標(biāo)準(zhǔn)化處理，用以測(cè)度每個(gè)值在一組數(shù)據(jù)中的相對(duì)位置，也可用于判斷一組數(shù)據(jù)是否有離群點(diǎn)，8. 為什么要計(jì)算離散系數(shù)？離散系數(shù)也稱為變異系數(shù)、標(biāo)準(zhǔn)差系數(shù)，是一組數(shù)據(jù)的標(biāo)準(zhǔn)差與其相應(yīng)的均值之比，是相對(duì)離散程度的測(cè)度。其公式是它用于對(duì)不同組別數(shù)據(jù)離散程度的比較，消除了數(shù)據(jù)水平高低和計(jì)量單位的影響，離散系數(shù)大的離散程度也就大。9. 測(cè)度數(shù)據(jù)分布形狀的統(tǒng)計(jì)量有哪些？1) 偏態(tài)系數(shù)：對(duì)數(shù)據(jù)分布不對(duì)稱性的度量值。其公式為：分組數(shù)據(jù)：未分組數(shù)據(jù)：判斷：偏態(tài)系數(shù)=0為對(duì)稱分布;偏態(tài)系數(shù) 0為右偏

27、分布或正偏；偏態(tài)系數(shù)0為尖峰分布；峰態(tài)系數(shù)0為扁平分布。數(shù)據(jù)分布特征集中趨勢(shì)離散程度分布形狀中位數(shù)平均數(shù)異眾比率四分位差極差偏態(tài)系數(shù)平均差方差或標(biāo)準(zhǔn)差峰態(tài)系數(shù)眾數(shù)離散系數(shù)第五章概率與概率分布1. 含義解釋：試驗(yàn)與事件、樣本空間1) 試驗(yàn)：對(duì)一個(gè)或多個(gè)實(shí)驗(yàn)對(duì)象進(jìn)行一次觀察或測(cè)量的過(guò)程。2) 事件：試驗(yàn)的每一個(gè)可能結(jié)果(任何樣本點(diǎn)集合)。其中隨機(jī)事件是每次試驗(yàn)可能出現(xiàn)也可能不出現(xiàn)的事件3) 樣本空間：一個(gè)試驗(yàn)中所有結(jié)果的集合，用W表示4) 樣本點(diǎn)：樣本空間中每一個(gè)特定的試驗(yàn)結(jié)果，用符號(hào)w表示2. 簡(jiǎn)述概率與頻率的關(guān)系。1) 事件A的概率是一個(gè)介于0和1之間的一個(gè)值，用以度量試驗(yàn)完成時(shí)事件A發(fā)生

28、的可能性大小，記為P(A)。2) 當(dāng)試驗(yàn)的次數(shù)很多時(shí)，概率P(A)可以由所觀察到的事件A發(fā)生次數(shù)(頻數(shù))的比例來(lái)逼近n 在相同條件下，重復(fù)進(jìn)行n次試驗(yàn)，事件A發(fā)生了m次，則事件A發(fā)生的概率可以寫為 3. 什么是互斥事件，其加法規(guī)則是什么？在試驗(yàn)中，兩個(gè)事件有一個(gè)發(fā)生時(shí)，另一個(gè)就不能發(fā)生，則稱事件A與事件B是互斥事件(沒(méi)有公共樣本點(diǎn)。若兩個(gè)事件A與B互斥，則事件A發(fā)生或事件B發(fā)生的概率等于這兩個(gè)事件各自的概率之和，即 P(AB) =P(A)+P(B)4. 概率的基本性質(zhì)。1) 非負(fù)性n 對(duì)任意事件A，有 P 02) 規(guī)范性n 一個(gè)事件的概率是一個(gè)介于0與1之間的值，即對(duì)于任意事件 A，有0 P

29、 13) 必然事件的概率為1；不可能事件的概率為0。即P (W )=1； P(F )=04) 可加性n 若A與B互斥，則P(AB) =P(A)+P(B)n 推廣到多個(gè)兩兩互斥事件A1，A2，An，有 P( A1A2 An) = P(A1)+P(A2)+P(An)5. 什么是條件概率。在事件B已經(jīng)發(fā)生的條件下事件A發(fā)生的概率，稱為已知事件B時(shí)事件A的條件概率，記為P(A|B)= 6. 兩個(gè)事件獨(dú)立意味著什么？1) 若P(A|B)=P(A)或P(B|A)=P(B) ，則稱事件A與B事件獨(dú)立，或稱獨(dú)立事件 2) 若兩個(gè)事件相互獨(dú)立，則這兩個(gè)事件同時(shí)發(fā)生的概率等于它們各自發(fā)生的概率之積，即 P(AB)

30、= P(A) P(B)；若事件A1,A2,An相互獨(dú)立，則P(A1, A2, , An)= P(A1) P(A2) P(An) 。7. 什么是隨機(jī)變量，它的類型是什么？隨機(jī)變量是一次試驗(yàn)的結(jié)果的數(shù)值性描述（事先未知）一般用 X，Y，Z 來(lái)表示。根據(jù)取值情況的不同分為離散型隨機(jī)變量和連續(xù)型隨機(jī)變量：1) 離散型：只能取有限個(gè)或可數(shù)個(gè)值得隨機(jī)變量，這些值可以逐個(gè)列舉，且以確定的概率取這些不同的值。2) 連續(xù)型：可以取一個(gè)或多個(gè)區(qū)間中任何值的隨機(jī)變量。不可以一一列舉8. 什么是離散隨機(jī)變量的概率分布？列出離散型隨機(jī)變量X的所有可能取值和隨機(jī)變量取這些值的確定概率，以表格的形式表現(xiàn)出來(lái)。則P(X =x

31、i)=pi稱為離散型隨機(jī)變量的概率函數(shù)。且pi0 ；pi=19. 兩點(diǎn)分布與二項(xiàng)分布有何不同？一個(gè)離散型隨機(jī)變量X只取0和1兩個(gè)可能的值稱為兩點(diǎn)分布，重復(fù)進(jìn)行 n 次試驗(yàn)，出現(xiàn)“成功”的次數(shù)的概率分布稱為二項(xiàng)分布，記為XB(n，p)，其概率密度函數(shù)分別為：兩點(diǎn)分布用于伯努利試驗(yàn)，而二項(xiàng)分布用于n次伯努利試驗(yàn)，前者是后者基礎(chǔ)。10. 簡(jiǎn)述N重伯努利試驗(yàn)的條件。（與二項(xiàng)分布有關(guān)）將伯努利試驗(yàn)重復(fù)進(jìn)行n次：1) 一次試驗(yàn)只有兩個(gè)可能結(jié)果，即“成功”和“失敗”2) 一次試驗(yàn)“成功”的概率為p ，失敗的概率為q =1- p，且概率p對(duì)每次試驗(yàn)都是相同的。3) 試驗(yàn)是相互獨(dú)立的，并可以重復(fù)進(jìn)行n次。

32、4) 在n次試驗(yàn)中，“成功”的次數(shù)對(duì)應(yīng)一個(gè)離散型隨機(jī)變量X 11. 超幾何分布的適用場(chǎng)合是什么？適用于采用不重復(fù)抽樣，各次試驗(yàn)并不獨(dú)立，成功的概率也互不相等，總體元素的數(shù)目N很小，或樣本容量n相對(duì)于N來(lái)說(shuō)較大時(shí)，樣本中“成功”的次數(shù)則服從超幾何概率分布。概率分布函數(shù)為:12. 簡(jiǎn)述概率密度函數(shù)和分布函數(shù)的含義。1) 密度函數(shù)：設(shè)X為一連續(xù)型隨機(jī)變量，x 為某一區(qū)間或多個(gè)區(qū)間的任意數(shù)值，X的概率密度函數(shù)記為f(x)。連續(xù)型隨機(jī)變量的給定區(qū)間取值的概率對(duì)應(yīng)的是f(x)曲線或直線在該區(qū)間圍成的面積。它在某一點(diǎn)的概率值為0，密度函數(shù)曲線下的面積等于1。密度函數(shù) f(x)表示X 的所有取值 x 及其頻數(shù)

33、f(x)2) 分布函數(shù)：對(duì)于隨機(jī)變量x,設(shè)其為任意實(shí)數(shù)，則函數(shù)F(x)=P(Xx)稱為隨機(jī)變量的分布函數(shù)。分布函數(shù)在X處的取值，即X的取值落在區(qū)間（，x）上的概率。分布函數(shù)是曲線下小于 x 的面積.13. 判斷數(shù)據(jù)正態(tài)性的方法有哪些？1) 對(duì)數(shù)據(jù)畫出頻數(shù)分布的直方圖或莖葉圖。若數(shù)據(jù)近似服從正態(tài)分布，則圖形的形狀與上面給出的正態(tài)曲線應(yīng)該相似2) 求出樣本數(shù)據(jù)的四分位差Qd和標(biāo)準(zhǔn)差s，然后計(jì)算比值Qd/s 。若數(shù)據(jù)近似服從正態(tài)分布，則有Qd/s1.3則為正態(tài)分布。3) 繪制正態(tài)概率圖。若由（xi,zi）形成的點(diǎn)緊密圍繞在一條直線周圍即是。14. 簡(jiǎn)述標(biāo)準(zhǔn)正態(tài)概率圖的繪制步驟。第1步：將樣本觀察值從

34、小到大排列：第2步：求出樣本觀察值的標(biāo)準(zhǔn)正態(tài)分?jǐn)?shù)zi 。標(biāo)準(zhǔn)正態(tài)分?jǐn)?shù)滿足：第3步：將zi作為縱軸，xi作為橫軸，繪制圖形，即為標(biāo)準(zhǔn)正態(tài)概率圖。15. 在什么條件下用正態(tài)分布近似計(jì)算二項(xiàng)分布的概率效果比較好？對(duì)于小樣本，p=0.5時(shí)則近似，此時(shí)u=np是對(duì)稱中心。此外當(dāng)n 很大時(shí)，大到使np、n（1p）5時(shí)即可近似服從正態(tài)分布Nnp , np(1-p)16. 均勻分布和指數(shù)分布描述的現(xiàn)象各有什么特點(diǎn)均勻分布：隨機(jī)變量在某一特定區(qū)間內(nèi)取值，其在區(qū)間內(nèi)取任何一個(gè)值的概率相等，因?yàn)樗锌赡苋≈档姆秶鷥?nèi)分布是均勻的。指數(shù)分布：描述等待某一特定事件發(fā)生所需事件的一種連續(xù)性概率分布。17. 正態(tài)分布函數(shù)的

35、性質(zhì)是什么。1) 圖形是關(guān)于x=m對(duì)稱的鐘形曲線，且峰值在x=m 處2) 均值m和標(biāo)準(zhǔn)差s一旦確定，分布的具體形式也惟一確定，不同參數(shù)正態(tài)分布構(gòu)成一個(gè)完整的“正態(tài)分布族” 3) 均值m可取實(shí)數(shù)軸上的任意數(shù)值，決定正態(tài)曲線的具體水平位置；4) 標(biāo)準(zhǔn)差決定曲線的“陡峭”或“扁平”程度。s越大，正態(tài)曲線扁平；s越小，正態(tài)曲線越陡峭5) 當(dāng)X的取值向橫軸左右兩個(gè)方向無(wú)限延伸時(shí)，曲線的兩個(gè)尾端也無(wú)限漸近橫軸，理論上永遠(yuǎn)不會(huì)與之相交6) 正態(tài)隨機(jī)變量在特定區(qū)間上的取值概率由正態(tài)曲線下的面積給出，而且其曲線下的總面積等于1 第六章抽樣與抽樣分布1. 概率抽樣：根據(jù)一個(gè)已知的概率來(lái)抽取樣本單位，也稱隨機(jī)抽樣

36、特點(diǎn)n 按一定的概率以隨機(jī)原則抽取樣本，抽取樣本時(shí)使每個(gè)單位都有一定的機(jī)會(huì)被抽中n 每個(gè)單位被抽中的概率是已知的，或是可以計(jì)算出來(lái)的 n 當(dāng)用樣本對(duì)總體目標(biāo)量進(jìn)行估計(jì)時(shí)，要考慮到每個(gè)樣本單位被抽中的概率2. 簡(jiǎn)單隨機(jī)抽樣：從總體N個(gè)單位(元素)中隨機(jī)地抽取n個(gè)單位作為樣本，使得總體中每一個(gè)元素都有相同的機(jī)會(huì)(概率)被抽中。抽取元素的具體方法有重復(fù)抽樣和不重復(fù)抽樣。參數(shù)估計(jì)和假設(shè)檢驗(yàn)所依據(jù)的主要是簡(jiǎn)單隨機(jī)樣本特點(diǎn)：n 簡(jiǎn)單、直觀，在抽樣框完整時(shí)，可直接從中抽取樣本n 用樣本統(tǒng)計(jì)量對(duì)目標(biāo)量進(jìn)行估計(jì)比較方便局限性：n 當(dāng)N很大時(shí)，不易構(gòu)造抽樣框n 抽出的單位很分散，給實(shí)施調(diào)查增加了困難n 沒(méi)有利用

37、其他輔助信息以提高估計(jì)的效率3.分層抽樣：將總體單位按某種特征或某種規(guī)則劃分為不同的層，然后從不同的層中獨(dú)立、隨機(jī)地抽取樣本。優(yōu)點(diǎn)：n 保證樣本的結(jié)構(gòu)與總體的結(jié)構(gòu)比較相近，從而提高估計(jì)的精度n 組織實(shí)施調(diào)查方便n 既可以對(duì)總體參數(shù)進(jìn)行估計(jì)，也可以對(duì)各層的目標(biāo)量進(jìn)行估計(jì)4.系統(tǒng)抽樣：將總體中的所有單位(抽樣單位)按一定順序排列，在規(guī)定的范圍內(nèi)隨機(jī)地抽取一個(gè)單位作為初始單位，然后按事先規(guī)定好的規(guī)則確定其他樣本單位。如先從數(shù)字1到k之間隨機(jī)抽取一個(gè)數(shù)字r作為初始單位，以后依次取r+k，r+2k等單位。優(yōu)點(diǎn)：操作簡(jiǎn)便，可提高估計(jì)的精度缺點(diǎn)：對(duì)估計(jì)量方差的估計(jì)比較困難5、整群抽樣：將總體中若干個(gè)單位合并

38、為組(群)，抽樣時(shí)直接抽取群，然后對(duì)中選群中的所有單位全部實(shí)施調(diào)查。特點(diǎn)：n 抽樣時(shí)只需群的抽樣框，可簡(jiǎn)化工作量n 調(diào)查的地點(diǎn)相對(duì)集中，節(jié)省調(diào)查費(fèi)用，方便調(diào)查的實(shí)施n 缺點(diǎn)是估計(jì)的精度較差6、多階段抽樣：先抽取群，但并不是調(diào)查群內(nèi)的所有單位，而是再進(jìn)行一步抽樣，從選中的群中抽取出若干個(gè)單位進(jìn)行調(diào)查。群是初級(jí)抽樣單位，第二階段抽取的是最終抽樣單位。將該方法推廣，使抽樣的段數(shù)增多，就稱為多階段抽樣n 具有整群抽樣的優(yōu)點(diǎn)，保證樣本相對(duì)集中，節(jié)約調(diào)查費(fèi)用n 需要包含所有低階段抽樣單位的抽樣框；同時(shí)由于實(shí)行了再抽樣，使調(diào)查單位在更廣泛的范圍內(nèi)展開n 在大規(guī)模的抽樣調(diào)查中，經(jīng)常被采用的方法 1. 解釋總體

39、分布、樣本分布和抽樣分布的含義1) 總體分布：素的觀察值所形成的相對(duì)頻數(shù)分布。分布通常是未知的，以假定它服從某種分布。2) 樣本分布：從總體中抽取容量為n的樣本，這n個(gè)樣本觀測(cè)值形成的相對(duì)頻數(shù)分布，也稱經(jīng)驗(yàn)分布。樣本容量n逐漸增大時(shí)，樣本分布逐漸接近總體的分布 3) 抽樣分布：是樣本統(tǒng)計(jì)量的概率分布，是一種理論分布，即重復(fù)選取容量為n的樣本時(shí)，由該統(tǒng)計(jì)量的所有可能取值形成的相對(duì)頻數(shù)分布。隨機(jī)變量是樣本統(tǒng)計(jì)量；結(jié)果來(lái)自容量相同的所有可能樣本；提供了樣本統(tǒng)計(jì)量長(zhǎng)遠(yuǎn)而穩(wěn)定的信息，是進(jìn)行推斷的理論基礎(chǔ)，也是抽樣推斷科學(xué)性的重要依據(jù) 2. 解釋中心極限定理。從均值為m ，方差為s 的一個(gè)任意總體中

40、抽取容量為n的隨機(jī)樣本，當(dāng)n充分大時(shí)（n30）,樣本均值的抽樣分布近似服從均值為，方差為2/n的正態(tài)分布。3. 重復(fù)抽樣和不重復(fù)抽樣相比，抽樣均值分布的標(biāo)準(zhǔn)差有何不同？1) 重復(fù)抽樣條件下，(同時(shí)包括不重復(fù)抽樣中的大樣本：在對(duì)無(wú)限總體進(jìn)行不重復(fù)抽樣，以及有限總體N很大，n/N很小時(shí)，則修正系數(shù)（Nn/N-1）趨于1，都可以按重復(fù)抽樣條件下處理。)方差為： 2) 在不重復(fù)抽樣條件下，抽樣均值方差則需要修正系數(shù)，方差為： 4. 樣本均值分布與總體分布的關(guān)系是什么？1) 原總體為正態(tài)分布時(shí)，無(wú)論樣本容量大小，樣本均值抽樣分布均服從正態(tài)分布。2) 原總體為非正態(tài)分布時(shí)，有兩種情況：n 樣本容量n30

41、時(shí)，其不服從正態(tài)分布。n 樣本容量n30時(shí)，使用中心極限定理：從均值為m ，方差為s 的一個(gè)任意總體中抽取容量為n的隨機(jī)樣本，當(dāng)n充分大時(shí)（n30）,樣本均值的抽樣分布近似服從均值為，方差為2/n的正態(tài)分布。5. 樣本方差與兩個(gè)樣本方差的比各自服從什么分布？且其圖形各有什么特點(diǎn)？1) 樣本方差服從X2分布其特征有四：n 分布的變量值始終為正 n 分布的形狀取決于其自由度n的大小，通常為不對(duì)稱的正偏分布，但隨著自由度的增大逐漸趨于對(duì)稱 n 期望為E(c2)=n，方差為D(c2)=2n(n為自由度) n 可加性：若U和V為兩個(gè)獨(dú)立的服從c2分布的隨機(jī)變量，Uc2(n1)，Vc2(n2),則U+V這

42、一隨機(jī)變量服從自由度為n1+n2的c2分布 2) 兩個(gè)樣本方差的比服從F分布：其特征為：圖形右偏。第七章參數(shù)估計(jì)1. 解釋估計(jì)量和估計(jì)值估計(jì)量：用于估計(jì)總體參數(shù)的統(tǒng)計(jì)量的名稱。如樣本均值，樣本比例、樣本方差等。參數(shù)用q 表示，估計(jì)量用q 表示估計(jì)值：估計(jì)參數(shù)時(shí)計(jì)算出來(lái)的統(tǒng)計(jì)量的具體值。2. 簡(jiǎn)述估計(jì)量好壞的評(píng)價(jià)標(biāo)準(zhǔn)1) 無(wú)偏性：估計(jì)量抽樣分布的數(shù)學(xué)期望等于被估計(jì)的總體參數(shù)2) 有效性：對(duì)同一總體參數(shù)的兩個(gè)無(wú)偏點(diǎn)估計(jì)量，有更小標(biāo)準(zhǔn)差的估計(jì)量更有效 3) 一致性：隨著樣本容量的增大，估計(jì)量的值越來(lái)越接近被估計(jì)的總體參數(shù)。3. 解釋置信水平的含義將構(gòu)造置信區(qū)間的步驟重復(fù)很多次，置信區(qū)間包含總體參數(shù)

43、真值的次數(shù)所占的比例稱為置信水平，表示為 (1 - a )。a 為是總體參數(shù)未在區(qū)間內(nèi)的比例。也叫置信系數(shù)。4. 怎樣理解置信區(qū)間1) 由樣本統(tǒng)計(jì)量所構(gòu)造的總體參數(shù)的估計(jì)區(qū)間稱為置信區(qū)間2) 統(tǒng)計(jì)學(xué)家在某種程度上確信這個(gè)區(qū)間會(huì)包含真正的總體參數(shù)，所以給它取名為置信區(qū)間 3) 用一個(gè)具體的樣本所構(gòu)造的區(qū)間是一個(gè)特定的區(qū)間，我們無(wú)法知道這個(gè)樣本所產(chǎn)生的區(qū)間是否包含總體參數(shù)的真值a) 我們只能是希望這個(gè)區(qū)間是大量包含總體參數(shù)真值的區(qū)間中的一個(gè)，但它也可能是少數(shù)幾個(gè)不包含參數(shù)真值的區(qū)間中的一個(gè)b) 總體參數(shù)以一定的概率落在這一區(qū)間的表述是錯(cuò)誤的5. 解釋95%的置信區(qū)間N個(gè)隨機(jī)區(qū)間中，有95%個(gè)區(qū)間

44、可能包含真值.6. 估計(jì)誤差或邊際誤差的式子含義是什么。它是估計(jì)總體均值時(shí)的邊際誤差，也稱為估計(jì)誤差或者估計(jì)范圍。其中a是預(yù)先所確定的概率值，也稱為風(fēng)險(xiǎn)值，它是總體均值不包含在置信區(qū)間的概率，Za/2是標(biāo)準(zhǔn)正態(tài)分布上側(cè)面積為a/2時(shí)的Z值。7. 均值的置信區(qū)間估計(jì)與新觀測(cè)值的預(yù)測(cè)區(qū)間估計(jì)有什么不同。1) 研究一個(gè)總體時(shí)，總體均值的置信區(qū)間估計(jì)關(guān)心的是總體均值，而與它不同的是有時(shí)關(guān)心的是預(yù)測(cè)隨機(jī)變量未來(lái)的觀察值，并希望求出各某個(gè)未來(lái)觀察值的取值范圍，這個(gè)范圍就是對(duì)某個(gè)未來(lái)觀察值的預(yù)測(cè)區(qū)間估計(jì)。2) 未來(lái)觀測(cè)值Xn+1的預(yù)測(cè)區(qū)間總是比均值的置信區(qū)間要長(zhǎng)。因?yàn)閄n+1的預(yù)測(cè)誤差比u的估計(jì)誤差要大。

45、n 直觀的看，預(yù)測(cè)誤差是兩個(gè)隨機(jī)變量的差（），而用于置信區(qū)間的估計(jì)誤差是一個(gè)隨機(jī)變量和常數(shù)的差（），隨著n的增大，估計(jì)誤差越來(lái)越接近0，置信區(qū)間的長(zhǎng)度也就趨于0，變?yōu)閡的真實(shí)值，而未來(lái)觀測(cè)值的預(yù)測(cè)誤差總是存在，其區(qū)間長(zhǎng)度接近于 3) 總體均值的置信區(qū)間估計(jì)對(duì)正態(tài)性的假設(shè)不是很敏感，而未來(lái)觀測(cè)值的預(yù)測(cè)區(qū)間則對(duì)正態(tài)性假設(shè)很敏感，因?yàn)樗c從整態(tài)總體中隨機(jī)抽取的單個(gè)觀測(cè)值有關(guān)。8. 解釋獨(dú)立樣本和匹配樣本的含義。1) 獨(dú)立樣本：是指兩個(gè)樣本是從總體中獨(dú)立地抽取的，即一個(gè)樣本中的元素與另一個(gè)樣本中的元素相互獨(dú)立。2) 匹配樣本：使用獨(dú)立樣本來(lái)估計(jì)兩個(gè)總體均值之差存在潛在的弊端，可能因?yàn)椴还降臉颖局?/p>

46、定掩蓋樣本的真正差異。因?yàn)闉榱私鉀Q這一問(wèn)題，采用匹配樣本，即一個(gè)樣本中的數(shù)據(jù)與另一樣本中的數(shù)據(jù)相對(duì)應(yīng)。9. 在對(duì)兩個(gè)總體均值之差的小樣本估計(jì)中，對(duì)兩個(gè)總體和樣本都有哪些假定？兩個(gè)總體都服從正態(tài)分布兩個(gè)獨(dú)立的小樣本(n130和n230) 此外還有分別的假定，如總體方差相等、樣本容量相等等，計(jì)算方法也不一樣。10. 簡(jiǎn)述樣本容量與置信水平、總體方差、邊際誤差的關(guān)系。在估計(jì)時(shí)，總希望提高估計(jì)的可靠程度或者說(shuō)是置信水平，就應(yīng)擴(kuò)大置信區(qū)間，但過(guò)于寬的置信區(qū)間在實(shí)際中是沒(méi)有意義的，如果要縮小置信區(qū)間又不降低置信程度，就要增大樣本容量，但樣本容量的增加也存在諸多限制，如增加調(diào)查費(fèi)用和工作量等，通常它們之

47、間存在一定的關(guān)系：公式為則說(shuō)明樣本容量與a) 與總體方差成正比。b) 與邊際誤差的平方成反比。c) 與可靠性系數(shù)成正比。11. 參數(shù)估計(jì)中結(jié)果的四舍五入法則。（附加）1) 當(dāng)用原始數(shù)據(jù)構(gòu)建置信區(qū)間時(shí)，置信區(qū)間的計(jì)算結(jié)果應(yīng)保留的小數(shù)點(diǎn)位數(shù)要比原始數(shù)據(jù)中使用的小數(shù)點(diǎn)多一位，如原始數(shù)據(jù)有一位小數(shù)，置信區(qū)間的結(jié)果應(yīng)保留兩位小數(shù)。2) 當(dāng)不知道原始數(shù)據(jù)，只使用匯總統(tǒng)計(jì)量(n,s)時(shí)，置信區(qū)間的計(jì)算結(jié)果應(yīng)保留的小數(shù)點(diǎn)位數(shù)應(yīng)與樣本方差或標(biāo)準(zhǔn)差使用的小數(shù)點(diǎn)位數(shù)相同。第八章假設(shè)檢驗(yàn)（18個(gè) ）統(tǒng)計(jì)方法包括描述統(tǒng)計(jì)和推斷統(tǒng)計(jì)（推斷統(tǒng)計(jì)又包括參數(shù)估計(jì)和假設(shè)檢驗(yàn)）1. 解釋原假設(shè)和備擇假設(shè)1) 通常將研究者想收

48、集證據(jù)予以支持的假設(shè)稱為備擇假設(shè)，或研究假設(shè)，用H1或者Ha表示。2) 研究者想收集證據(jù)予以反對(duì)的假設(shè)，稱為原假設(shè)，或者零假設(shè)。表示為 H02. 什么是標(biāo)準(zhǔn)化檢驗(yàn)統(tǒng)計(jì)量？為什么要對(duì)統(tǒng)計(jì)量進(jìn)行標(biāo)準(zhǔn)化？檢驗(yàn)統(tǒng)計(jì)量是根據(jù)樣本觀測(cè)結(jié)果計(jì)算得到的，并據(jù)以對(duì)原假設(shè)和備擇假設(shè)作出決策的某個(gè)樣本統(tǒng)計(jì)量。對(duì)于總體均值和總體比例的檢驗(yàn)，標(biāo)準(zhǔn)化的檢驗(yàn)統(tǒng)計(jì)量可以表示為：原因：n 因?yàn)闄z驗(yàn)統(tǒng)計(jì)量實(shí)際上是總體參數(shù)的點(diǎn)估計(jì)量，但是點(diǎn)估計(jì)量并不能直接作為檢驗(yàn)的統(tǒng)計(jì)量，只有將其標(biāo)準(zhǔn)化后才能用于度量它與原假設(shè)的參數(shù)真值之間的差異程度。n 點(diǎn)估計(jì)量標(biāo)準(zhǔn)化的依據(jù)是：原假設(shè)為真和點(diǎn)估計(jì)量的抽樣分布。n 實(shí)際上假設(shè)檢驗(yàn)中用的都是標(biāo)準(zhǔn)化

49、檢驗(yàn)統(tǒng)計(jì)量，它反映了點(diǎn)估計(jì)量與總體參數(shù)相比相差多少個(gè)標(biāo)準(zhǔn)差。3. 怎樣理解顯著性水平？它是一個(gè)概率值，原假設(shè)為真時(shí)，拒絕原假設(shè)的概率，抽樣分布的拒絕域表示為 a ，由研究者事先確定。1. 我們可以在事先確定用于拒絕原假設(shè)H0的證據(jù)必須強(qiáng)到何種程度。這等于說(shuō)我們要求多小的P值。而這個(gè)P值就叫顯著性水平，用a表示n 顯著性水平表示總體中某一類數(shù)據(jù)出現(xiàn)的經(jīng)常程度。n 假如我們選擇a=0.05，樣本數(shù)據(jù)能拒絕原假設(shè)的證據(jù)要強(qiáng)到：當(dāng)H0正確時(shí)，這種樣本結(jié)果發(fā)生的頻率不超過(guò)5%；如果我們選擇a=0.01，就是要求拒絕H0的證據(jù)要更強(qiáng)，這種樣本結(jié)果發(fā)生的頻率只有1%。2. 如果P值小于或等于a ，我們稱該組數(shù)據(jù)不利于原假設(shè)的證據(jù)有a的顯著性水平4. 怎樣理解統(tǒng)計(jì)顯著性與實(shí)際顯著性？統(tǒng)計(jì)上顯著不一定有實(shí)際意義：1. 當(dāng)原假設(shè)被拒絕時(shí)，我們稱樣本結(jié)果在統(tǒng)計(jì)上是顯著的，當(dāng)不拒絕原假設(shè)時(shí)，我們稱樣本結(jié)果在統(tǒng)計(jì)上是不顯著的。n P值越小，表明結(jié)果越顯著。但檢驗(yàn)結(jié)果究竟是“顯著的”、“中度顯著的”還是“高

人人文庫(kù)> 全部分類> 教育資料 > 課設(shè)設(shè)計(jì)

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

西交大考研統(tǒng)計(jì)學(xué)課后問(wèn)答整理

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

西交大考研統(tǒng)計(jì)學(xué)課后問(wèn)答整理

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔